Suche

Apple's ml-sharp im Browser: Gaussian Splats via ONNX Runtime Web

Ein neues GitHub-Projekt präsentiert ein Web-Playground, das Apples ml-sharp Modell im Browser zum Laufen bringt. Ziel ist die Erstellung von Gaussian Splats direkt im Browser, realisiert mithilfe von ONNX Runtime Web. Damit wird eine spezifische 3D-Rekonstruktions-Technologie von Apple clientseitig zugänglich gemacht.

2026-05-03·DeepSeek V4: Chinas neue Waffe ist fast so gut wie GPT-4 Turbo, Apples ML-Power im Browser: Sharp läuft jetzt dank ONNX Runtime Web! — AI Digest 03.05.2026

DeepSeek-V4 Day-0: SGLang & Miles für schnelle Inferenz & Verified RL

Das SGLang- und Miles-Team liefert Day-0-Unterstützung für DeepSeek-V4, inklusive Inferenz und RL-Training. Ihr Open-Source-Stack ist der erste, der DeepSeek-V4s hybride Sparse-Attention-Architektur am Launch-Tag bedient und trainiert, mit Performance-Optimierungen wie ShadowRadix und HiSparse. Der Stack unterstützt zudem Verified RL, wobei Miles als Backend-Support für das Reinforcement Learning dient.

2026-04-26·KI-Kollabo: Biologe und ChatGPT lösen 60-Jahre altes Mathe-Rätsel, KI reanimiert deine Projektleichen: Schluss mit schlechtem Gewissen! — AI Digest 26.04.2026

Alignment-Whack-a-Mole: Finetuning lässt LLMs Copyright-Bücher spucken

Ein neues Paper zeigt auf: Wenn Large Language Models (LLMs) mit urheberrechtlich geschützten Büchern trainiert werden, können spätere Finetuning-Schritte diese Inhalte reaktivieren. Selbst wenn das Modell zuvor darauf getrimmt wurde, diese Daten zu "vergessen", holt das Finetuning unerwartet die geschützten Texte wieder hervor. Das ist ein echtes "Alignment Whack-a-Mole" – ein Problem gelöst, zwei neue aufgetaucht, und es wirft ernste Fragen bezüglich IP und Datenmanagement auf.

2026-04-30·Alignment-Whack-a-Mole: Finetuning lässt LLMs Copyright-Bücher spucken, Mike: Open-Source-KI macht Jura wieder bezahlbar und anpassbar — AI Digest 30.04.2026

SDL untersagt KI-Commits mit 'LLM Policy?'

Im SDL-Projekt auf GitHub wird unter Issue #15350 eine 'LLM Policy?' diskutiert. Laut Artikelbeschreibung resultiert dies in einem Verbot für von KI generierte Code-Commits. Der bereitgestellte Quellauszug enthält jedoch keine weiteren Details zu den Beweggründen oder Inhalten dieser Policy.

2026-04-16·Claude Opus 4.7: Anthropic zündet die nächste KI-Evolutionsstufe, Qwen3.6-35B: Alibaba's Open-Source-Code-Agent schlägt GPT-4 — AI Digest 16.04.2026

Konvergente Evolution: Wie diverse Modelle Zahlen ähnlich repräsentieren

Entgegen der Black-Box-Annahme lernen unterschiedliche Sprachmodelle – darunter Transformer, RNNs und LSTMs – ähnliche periodische Zahlenrepräsentationen. Diese Konvergenz ist jedoch zweistufig: Während alle Modelle Fourier-Peaks zeigen, entwickeln nur manche geometrisch separierbare Features für die Modulo-Klassifikation. Die genaue Ausprägung der Zahlenrepräsentation hängt stark von Daten, Architektur und Trainingsdetails ab.

2026-04-24·Arstechnica zieht klare KI-Grenzen: Mensch bleibt Boss im Newsroom, Deine KI-Agenten und API-Keys: Agent Vault schließt die Sicherheitslücke — AI Digest 24.04.2026

Die LLM-Blackbox entschlüsselt: Ein visueller Karpathy-Guide

Dieser interaktive, visuelle Guide, basierend auf Andrej Karpathys technischem Deep Dive, erklärt verständlich, wie große Sprachmodelle wie ChatGPT tatsächlich gebaut werden. Er führt von der Datensammlung und -filterung über die Tokenisierung bis hin zur gesamten Trainings-Pipeline. Eine klare und detaillierte Ressource für alle, die das Innenleben von LLMs von Grund auf verstehen wollen.

2026-04-24·GPT-5.5: Wird KI-assistiertes Hacking für alle zur Realität?, Die LLM-Blackbox entschlüsselt: Ein visueller Karpathy-Guide — AI Digest 24.04.2026

LLM selber trainieren: Die Blackbox wird transparent.

Vergiss die Blackbox! Dieses GitHub-Projekt liefert einen praxistauglichen Blueprint, um ein LLM von Grund auf zu trainieren. Es ist kein Shortcut zu einem fertigen Modell, sondern ein tiefgreifender Guide für alle, die wirklich verstehen wollen, wie generative KI unter der Haube tickt, statt nur APIs zu konsumieren.

2026-05-05·OpenAI entschlüsselt: So wird Sprach-KI jetzt blitzschnell & skaliert, YC und OpenAI: 0,6% Anteil – ein kleiner Happen vom KI-Kuchen? — AI Digest 05.05.2026

GLM-5V-Turbo: Ein Schritt zum nativen Fundament für Multimodal-KI

GLM-5V-Turbo wird als ein Schritt hin zu nativen Fundamentmodellen für multimodale Agenten vorgestellt. Das Modell zielt darauf ab, eine grundlegende Basis für KI-Systeme zu schaffen, die von Natur aus für die Verarbeitung und Nutzung verschiedener Modalitäten konzipiert ist.

2026-05-06·Gemma 4 rast: Google verdoppelt KI-Inferenz mit Multi-Token-Trick, Zuckerberg: Chef-Pirat bei Metas AI-Trainingsdaten? — AI Digest 06.05.2026

Hae-OLS: LLM-Gedächtnis-Booster für schlanken Cache, mehr Kontext

LLMs kämpfen mit langen Kontexten, weil ihr KV-Cache massiv RAM frisst. 'Hae-OLS' bietet eine Lösung: Es fasst den Cache mit hoher Präzision zusammen, indem es wichtige Tokens via Entropie erkennt und den Rest effizient mittels Low-Rank-Rekonstruktion verarbeitet. Das Ergebnis? Längere Kontexte mit weniger Speicherbedarf, ohne Leistungseinbußen – ein smarter Move für jeden LLM-Einsatz.

2026-04-21·Lokale KI: Warum MS-DOS die wichtigste Lektion für OpenClaw ist., Die Mär von unzensierter KI: Auch 'freie' Modelle haben Grenzen — AI Digest 21.04.2026

Neue KI-Rollen: Wer die Lügen der Maschinen domestiziert und verantwortet.

Dieser Blogpost beleuchtet analytisch die neuen Arbeitsfelder, die an der Schnittstelle von Mensch und ML-Systemen entstehen, um die Eigenheiten von KI-Outputs zu managen. Er beschreibt Rollen wie 'Incanters' für fortgeschrittenes Prompting, 'Process Engineers' zur Qualitätskontrolle unvorhersehbarer LLM-Outputs und 'Meat Shields', die für KI-Fehlfunktionen zur Rechenschaft gezogen werden. Die Analyse zeigt auf, wie diese Jobs die realen operativen Herausforderungen bei der Integration von KI-Systemen widerspiegeln.

2026-04-15·Googles FLoC: Ein Tracking-Experiment, das zum Rohrkrepierer wurde., Claude lernt Routinen: Weniger Halluzination, mehr verlässlicher Code? — AI Digest 15.04.2026

Nie mehr ruckelige 3D-Maps: LingBot-Map bringt den KI-Turbo

Vergesst die ruckeligen 3D-Karten, die ihr kennt: LingBot-Map bringt den KI-Turbo für die Echtzeit-Rekonstruktion. Dieses neue System nutzt einen "Geometric Context Transformer", um aus Kameradaten flüssige und kontextreiche 3D-Modelle zu zaubern. Damit wird die Umgebung nicht nur abgebildet, sondern wirklich verstanden – ein Quantensprung für Robotik und AR/VR.

2026-04-28·KI: Dein Co-Pilot für schärferes Denken statt kognitiver Faulheit, Dezentral und privat: Chrome integriert KI-Power direkt im Browser. — AI Digest 28.04.2026

KI klärt Himmelsrätsel: ML verifiziert alte Phänomene in Archivbildern

Historische Himmelsbilder zeigen flüchtige, sternähnliche Objekte, deren Natur lange umstritten war – echte Phänomene oder bloße Defekte? Jetzt setzen Forschende Machine Learning ein, um die Identifikation dieser Transienten zu präzisieren und ihre Existenz als echte astronomische Ereignisse zu validieren. Das von Experten trainierte ML-Modell liefert somit belastbare Beweise und stärkt die ursprünglichen Beobachtungen.

2026-04-24·Arstechnica zieht klare KI-Grenzen: Mensch bleibt Boss im Newsroom, Deine KI-Agenten und API-Keys: Agent Vault schließt die Sicherheitslücke — AI Digest 24.04.2026

Softmax: Überall im ML. Doch was tut es wirklich – und der Jacobian?

Softmax ist aus modernen ML-Anwendungen nicht wegzudenken und erscheint täuschend simpel. Es wandelt beliebige Zahlen in Werte zwischen 0 und 1, die sich zu 1 addieren, und projiziert Vektoren auf den Wahrscheinlichkeits-Simplex. Der Artikel beleuchtet diese Funktion genau und hinterfragt die Notwendigkeit, ihren komplexen Jacobian zu verstehen, der die Interaktionen zwischen Dimensionen aufzeigt.

2026-05-01·Dein Rivian sammelt immer: Volle Datenkontrolle ist eine Illusion., Vorsicht, Shai-Hulud! Maliziöse Dependency in PyTorch Lightning entdeckt — AI Digest 01.05.2026

KI täuscht Qualität vor: Das Ende der Proxy-Bewertung

Die Wissensarbeit beruht traditionell auf „Proxy-Maßen“ wie oberflächlicher Schreibqualität, um die Güte von Ergebnissen zu beurteilen, da echte Qualitätsprüfung aufwendig ist. Doch Large Language Models (LLMs) untergraben dieses System. Sie simulieren mühelos hochwertigen Output, der perfekt aussieht – sei es ein Beratungsbericht oder Code –, ohne dass die tatsächliche zugrundeliegende Qualität der Arbeit vorhanden sein muss.

2026-04-26·KI-Kollabo: Biologe und ChatGPT lösen 60-Jahre altes Mathe-Rätsel, KI reanimiert deine Projektleichen: Schluss mit schlechtem Gewissen! — AI Digest 26.04.2026

PCA-Erweiterung: Polynom-Autoencoder verbessert Transformer-Embeddings

Ein Blogpost stellt eine Methode vor, die PCA für die Kompression von Transformer-Embeddings verbessert: Ein polynomialer Autoencoder (PAE). Dabei bleibt der Encoder eine einfache PCA, während ein quadratischer Decoder nicht-lineare Anteile der Embeddings erfasst. Diese seit 2017 bekannte, geschlossene Lösung reduziert den Informationsverlust im Vergleich zu reinem PCA und erreicht auf Benchmarks wie BEIR/FiQA eine deutlich höhere Retrieval-Qualität.

2026-05-08·AI-Halluzinationen im Amt: Südafrika suspendiert Beamte nach KI-Pannen, Agenten-CLIs: Warum KI-Systeme eigene Befehlszeilen brauchen — AI Digest 08.05.2026

M4 & lokale KI: Der Kampf um unabhängige Inference – ein Erfahrungsbericht

Lokale KI-Modelle auf einem M4-Chip mit 24GB Speicher zum Laufen zu bringen, ist kein Kinderspiel, aber machbar. Der Autor hat nach intensiven Tests eine stabile Konfiguration gefunden: Qwen 3.5-9B (4b quant) läuft über LM Studio mit respektablen 40 Tokens/Sekunde und 128K Kontextfenster. Damit ist eine spannende Unabhängigkeit von großen Cloud-Anbietern für grundlegende Aufgaben möglich, wenn auch nicht auf SOTA-Niveau.

2026-05-11·Local AI: Mehr Kontrolle, mehr Privatsphäre. Warum die Cloud ausgedient hat, Apple M4: Lokale KI überrascht – Dein iPad wird zum Superhirn. — AI Digest 11.05.2026

KI als Bullshit-Generator: Aphyrs schonungslose Analyse

Kyle Kingsbury (Aphyr) rechnet in seiner Präsentation schonungslos mit Large Language Models ab. Er nennt sie 'Bullshit-Maschinen', die nicht nach Wahrheit suchen, sondern lediglich überzeugend klingende statistische Muster erzeugen. Wer KIs wie diese blind vertraut, wird am Ende mit schönen Lügen da stehen – eine wichtige Mahnung, gerade in unserer KI-Euphorie.

2026-04-21·Anthropic gibt grünes Licht: Claude CLI-Tools wie OpenClaw wieder erlaubt, Vercel-Ausfall: KI und ein Roblox-Cheat bringen Riesenplattform ins Wanken — AI Digest 21.04.2026

KI-Inferenz: 10% schneller dank cleverem GPU-Cache in SGLang

Multimodale KI-Modelle sind vielversprechend, aber ihre Inferenz-Engines noch nicht optimiert. Modal.com demonstriert, wie SGLang’s Performance um über 10% gesteigert wurde, indem aufwendige Buchhaltung für geteilten GPU-Speicher durch einen einfachen Cache-Lookup im Scheduler ersetzt wurde. Dieser sogenannte 'Handle Cache' führte zu signifikanten Verbesserungen bei Durchsatz und Latenz auf multimodalen Workloads.

2026-05-09·Firefox wird sicherer: Mozilla jagt Bugs jetzt mit KI-Power, AI-Chatbots: Das neue Carousel? Ein Entwickler sieht die Geschichte wiederholen. — AI Digest 09.05.2026

LLMs auf Diät: Intels AutoRound macht KI-Modelle schlanker

Intels neues 'AutoRound'-Verfahren ist ein Quantisierungsalgorithmus, der Large Language Models (LLMs) drastisch verkleinern soll, bei gleichzeitigem Erhalt ihrer Genauigkeit. Das ist entscheidend, denn effizientere, schlankere Modelle lassen sich auf weniger leistungsstarker Hardware betreiben und senken so die Betriebskosten. Ein echter Boost für alle, die KI-Anwendungen skalieren wollen, ohne dafür ein Rechenzentrum bauen zu müssen.

2026-05-01·Apple & Claude? Ein unbeabsichtigter Blick hinter die AI-Kulissen., OpenAI: Erst auf Anthropic geschimpft, jetzt selbst den Cyber-Hahn zugedreht. — AI Digest 01.05.2026

3D-Körper aus 8 Fragen: Ohne Foto, ohne GPU zum präzisen Avatar

Ein neues Verfahren generiert mit nur acht Fragen einen präzisen 3D-Körper, ganz ohne Fotos oder leistungsstarke GPUs. Ein kleines MLP verarbeitet die Eingaben in Millisekunden auf einer CPU und gibt 58 Anny-Body-Parameter aus. Dies übertrifft die Genauigkeit von Foto-Pipelines bei Umfängen und löst Datenschutz- sowie Kostenprobleme.

2026-04-25·DeepSeek v4: Open-Source-Anwärter fordert OpenAI heraus, OpenAI lanciert GPT-5.5: Ist der halbe Versionssprung ein Volltreffer? — AI Digest 25.04.2026