Suche
GLM-5V-Turbo: Ein Schritt zum nativen Fundament für Multimodal-KI
GLM-5V-Turbo wird als ein Schritt hin zu nativen Fundamentmodellen für multimodale Agenten vorgestellt. Das Modell zielt darauf ab, eine grundlegende Basis für KI-Systeme zu schaffen, die von Natur aus für die Verarbeitung und Nutzung verschiedener Modalitäten konzipiert ist.
Amateur (23) löst 60-Jahre-Mathe-Rätsel – GPT-5.4 mit neuem Weg
Liam Price, ein 23-jähriger Amateur ohne Mathematik-Ausbildung, hat ein 60 Jahre altes Erdős-Problem gelöst. Er nutzte dafür eine ChatGPT Pro-Subskription (GPT-5.4 Pro), welche auf einen einzigen Prompt hin eine Lösung mit einer völlig neuartigen Methode lieferte. Das zeigt, wie generative KI selbst komplexe mathematische Herausforderungen meistern kann, wo menschliche Intuition bisher an Grenzen stieß.
DeepSeek-V4 Day-0: SGLang & Miles für schnelle Inferenz & Verified RL
Das SGLang- und Miles-Team liefert Day-0-Unterstützung für DeepSeek-V4, inklusive Inferenz und RL-Training. Ihr Open-Source-Stack ist der erste, der DeepSeek-V4s hybride Sparse-Attention-Architektur am Launch-Tag bedient und trainiert, mit Performance-Optimierungen wie ShadowRadix und HiSparse. Der Stack unterstützt zudem Verified RL, wobei Miles als Backend-Support für das Reinforcement Learning dient.
Google pusht Gemma 4: Schnelle Inferenz dank Multi-Token-Drafter
Google arbeitet aktiv daran, die Inferenzgeschwindigkeit von Gemma 4 zu erhöhen. Dabei kommt die Technologie der Multi-Token-Prediction zum Einsatz, unterstützt durch sogenannte 'Drafters'. Dies zielt auf eine Leistungssteigerung des KI-Modells ab.
ChatGPT 5.5 Pro: Mathematische PhD-Forschung in Stunden – ist das Originalität?
Mathematiker Timothy Gowers berichtet, wie ChatGPT 5.5 Pro in nur einer Stunde eine mathematische PhD-Forschung ohne wesentliche menschliche Hilfe generierte. Obwohl LLMs Forschungsprobleme lösen und Argumente finden, die Menschen übersehen haben, zeigen nähere Betrachtungen oft, dass diese cleveren Lösungen auf bekannten Präzedenzfällen basieren. Es stellt sich die grundlegende Frage, ob dies echtes, originelles Denken ist oder nur eine beeindruckende Rekombination bestehenden Wissens.
Lokal-LLMs im Flieger: MacBook M5 Max stemmt 10 Stunden offline
Ein Autor hat auf einem 10-Stunden-Flug getestet, wie leistungsfähig lokale LLMs wie Gemma 4 31B und Qwen 4.6 36B auf einem MacBook Pro M5 Max mit 128GB sind. Über LM Studio generierte er ein komplexes Billing-Tool und verarbeitete Millionen von Tokens, wobei die Qualität für spezifische Aufgaben mit Frontier-Modellen mithalten konnte. Grenzen zeigten sich bei Akkulaufzeit (1% pro Minute), Hitze und Context-Länge (Abbau nach 100k Tokens), was aber die beeindruckende Offline-Performance nicht schmälert.
Apple's ml-sharp im Browser: Gaussian Splats via ONNX Runtime Web
Ein neues GitHub-Projekt präsentiert ein Web-Playground, das Apples ml-sharp Modell im Browser zum Laufen bringt. Ziel ist die Erstellung von Gaussian Splats direkt im Browser, realisiert mithilfe von ONNX Runtime Web. Damit wird eine spezifische 3D-Rekonstruktions-Technologie von Apple clientseitig zugänglich gemacht.
Liquid AI: Neues MoE-Modell skaliert LFM2 auf 24 Mrd. Parameter
Liquid AI präsentiert mit LFM2-24B-A2B den bisher größten Vertreter seiner LFM2-Modellreihe. Dieses Sparse Mixture of Experts (MoE) Modell erreicht 24 Milliarden Gesamtparameter, wovon 2 Milliarden pro Token aktiv sind. Die Veröffentlichung zeigt eindrucksvoll, dass die LFM2-Architektur effektiv auf größere Dimensionen skaliert werden kann.
GPT-5.5: OpenAI überrascht mit Power-Update – fast schon GPT-5?
OpenAI hat überraschend GPT-5.5 vorgestellt, ein „Zwischen-Upgrade“, das die Erwartungen an GPT-5 massiv in die Höhe treibt. Dieses Modell ist weit mehr als nur ein inkrementeller Schritt: Es deutet auf signifikante Fortschritte in Bereichen wie Logik, Kontextverständnis und möglicherweise Multimodalität hin. Damit setzt OpenAI nicht nur die Konkurrenz unter Druck, sondern zeigt auch, dass die wahre Power von GPT-5 unmittelbar bevorstehen könnte.
Softmax: Überall im ML. Doch was tut es wirklich – und der Jacobian?
Softmax ist aus modernen ML-Anwendungen nicht wegzudenken und erscheint täuschend simpel. Es wandelt beliebige Zahlen in Werte zwischen 0 und 1, die sich zu 1 addieren, und projiziert Vektoren auf den Wahrscheinlichkeits-Simplex. Der Artikel beleuchtet diese Funktion genau und hinterfragt die Notwendigkeit, ihren komplexen Jacobian zu verstehen, der die Interaktionen zwischen Dimensionen aufzeigt.
Googles Gemma 4: KI-Power direkt und offline auf dem iPhone
Der Google-KI-Spross Gemma 4 landet überraschend nativ und komplett offline auf dem iPhone – dank des MLX-Frameworks von Apple wird die Smartphone-KI zur Realität. Das ist kein Trick: Volle Inferenz auf dem Gerät bedeutet weg von der Cloud, mehr Privatsphäre und rasend schnelle Reaktionen, die neue App-Erlebnisse ermöglichen könnten. Zwar noch in den Kinderschuhen, zeigt diese Entwicklung, dass das 'iPhone mit Hirn' schneller kommt als gedacht und die Grenzen zwischen lokaler und Cloud-AI verschwimmen.
Nie mehr ruckelige 3D-Maps: LingBot-Map bringt den KI-Turbo
Vergesst die ruckeligen 3D-Karten, die ihr kennt: LingBot-Map bringt den KI-Turbo für die Echtzeit-Rekonstruktion. Dieses neue System nutzt einen "Geometric Context Transformer", um aus Kameradaten flüssige und kontextreiche 3D-Modelle zu zaubern. Damit wird die Umgebung nicht nur abgebildet, sondern wirklich verstanden – ein Quantensprung für Robotik und AR/VR.
Können LLMs reale Systeme in TLA+ modellieren?
Das Specula-Team untersuchte, ob LLMs reale Systeme präzise in TLA+ modellieren können. Ein Versuch mit Claude zeigte: Die erzeugte TLA+-Spezifikation für Etcd war syntaktisch korrekt und bestand den Model-Check, rekapitulierte aber die Spezifikation des Raft-Papers, statt Etcd-spezifische Details abzubilden. Dies wirft die kritische Frage auf, wie man feststellt, ob eine KI ein System tatsächlich modelliert oder nur Trainingsdaten wiedergibt.
Grok 4.3: xAI veröffentlicht Doku-Seite – Details fehlen noch
xAI hat eine Entwickler-Dokumentationsseite für 'Grok 4.3' online gestellt. Die Seite bestätigt die Existenz des Modells, ist aber primär eine Navigationsübersicht und liefert keinerlei konkrete Angaben zu neuen Features, Verbesserungen oder Benchmarks. Die Spannung bleibt, welche Informationen xAI in Kürze nachliefern wird.
LLM selber trainieren: Die Blackbox wird transparent.
Vergiss die Blackbox! Dieses GitHub-Projekt liefert einen praxistauglichen Blueprint, um ein LLM von Grund auf zu trainieren. Es ist kein Shortcut zu einem fertigen Modell, sondern ein tiefgreifender Guide für alle, die wirklich verstehen wollen, wie generative KI unter der Haube tickt, statt nur APIs zu konsumieren.
Google Gemma 4: Native Offline-KI jetzt auf dem iPhone
Google Gemma 4 läuft jetzt nativ und mit voller Offline-KI-Inferenz auf dem iPhone. Dies markiert einen wichtigen Schritt für mobile KI, der die Cloud-Abhängigkeit reduziert und neue Anwendungsfelder für datenschutzsensible oder latenzkritische Aufgaben eröffnet.
SDL untersagt KI-Commits mit 'LLM Policy?'
Im SDL-Projekt auf GitHub wird unter Issue #15350 eine 'LLM Policy?' diskutiert. Laut Artikelbeschreibung resultiert dies in einem Verbot für von KI generierte Code-Commits. Der bereitgestellte Quellauszug enthält jedoch keine weiteren Details zu den Beweggründen oder Inhalten dieser Policy.
Deep Learning: Eine wissenschaftliche Theorie formiert sich
Das Paper argumentiert, dass eine wissenschaftliche Theorie des Deep Learning im Entstehen begriffen ist. Sie soll wichtige Eigenschaften und Statistiken von Trainingsprozessen, Repräsentationen, Gewichten und der Performance neuronaler Netze charakterisieren. Die Autoren fassen dazu bestehende Forschungsstränge zusammen und identifizieren fünf wachsende Arbeitsbereiche, die auf diese Theorie hindeuten.
GPT-5.5: KI definiert professionelle Schwachstellenerkennung neu
Laut dem Cybersicherheitsunternehmen XBOW erreicht GPT-5.5 ein "Mythos-ähnliches" Niveau in der Schwachstellenerkennung. Sie haben das Modell in ihren professionellen Pentesting-Workflows getestet und sehen einen entscheidenden Sprung nach vorn für offensive Sicherheitskapazitäten.
GoModel: Das Open-Source AI-Gateway, das 44x leichter ist als LiteLLM
GoModel tritt als neues Open-Source AI-Gateway aus Go an und fordert etablierte Lösungen wie LiteLLM heraus – mit einem Paukenschlag: Es soll ganze 44x leichter sein. Das bedeutet für Entwickler nicht nur deutlich weniger Ressourcenverbrauch und somit niedrigere Betriebskosten beim Orchestrieren ihrer AI-Modelle, sondern auch eine schlankere, agilere Infrastruktur. Ein klarer Weckruf und potenzieller Game-Changer für alle, die Effizienz lieben.