Suche
Swift: Von GFLOP/s zu TFLOP/s für LLM-Training auf Apple Silicon
Ein Entwickler zeigt, wie er die handgeschriebene Matrix-Multiplikation für LLM-Training in Swift auf Apple Silicon von GFLOP/s zu TFLOP/s katapultiert. Dies geschieht explizit ohne Frameworks oder Bibliotheken, um die CPU, SIMD, AMX und GPU direkt zu nutzen. Das Ziel: Swift schneller als die C-Referenzimplementierung llm.c zu optimieren.
Apple's ml-sharp im Browser: Gaussian Splats via ONNX Runtime Web
Ein neues GitHub-Projekt präsentiert ein Web-Playground, das Apples ml-sharp Modell im Browser zum Laufen bringt. Ziel ist die Erstellung von Gaussian Splats direkt im Browser, realisiert mithilfe von ONNX Runtime Web. Damit wird eine spezifische 3D-Rekonstruktions-Technologie von Apple clientseitig zugänglich gemacht.
Broccoli: KI-Coding-Agent für fertige PRs aus Linear-Tickets
Broccoli präsentiert sich als 'one-shot' KI-Coding-Agent, der nahtlos Linear-Tickets in fertige Pull Requests verwandelt. Betrieben durch Claude und Codex, läuft dieser Helfer auf der eigenen Google Cloud und verspricht, den Entwickler-Workflow massiv zu beschleunigen. Eine echte Abkürzung für alle, die schneller vom Ticket zum Code wollen, statt sich im Klein-Klein zu verlieren.
Wasm & Apple Silicon: KI-Turboboost dank Zero-Copy-GPU-Power
Ein cleverer Trick macht KI-Inferenzen auf Apple Silicon blitzschnell: Statt Daten zwischen CPU und GPU zu kopieren, nutzen Entwickler jetzt Apples Unified Memory Architektur direkt aus WebAssembly. Das bedeutet Zero-Copy-Power, die Performance-Engpässe bei ML-Modellen radikal eliminiert und eine neue Ära für effiziente KI-Anwendungen einläutet.
Vergiss die Cloud: Google Gemma bringt Offline-AI aufs iPhone
Google Gemma, die AI von Google, läuft jetzt nativ und komplett offline auf dem iPhone. Das ist ein echtes Statement: Statt auf teure Cloud-Server zu warten, arbeitet AI-Power nun direkt in deiner Hosentasche – und das blitzschnell und datenschutzfreundlich. Für Unternehmen und Entwickler bedeutet dies eine massive Verschiebung hin zu mehr Autonomie und neuen Möglichkeiten für lokale, personalisierte AI-Anwendungen.
LLM-KVCache: Cross-Datacenter-Serving wird greifbar, aber komplex
Prefill-decode (PD) Disaggregation ist zwar Standard für LLM-Serving, doch die flexible Verteilung über Datacenter hinweg scheitert bislang am massiven KVCache-Transfer. Obwohl neue Hybrid-Attention-Architekturen den KVCache signifikant verkleinern und Cross-Datacenter-Transport nun denkbar machen, stoßen solche Ansätze auf Herausforderungen wie schwankende Bandbreiten und ungleich verteilte Präfix-Caches. Eine simple Externalisierung des Prefill-Schritts über Datacenter-Grenzen würde ohne weitere Optimierung zu Engpässen und Ineffizienz führen.
Flipbook.page: Live-Stream direkt aus einem Modell
Die Website flipbook.page bewirbt sich mit dem Titel 'Website streamed live directly from a model'. Der einzige verfügbare Quellinhalt ist das Wort 'Flipbook', was unklar lässt, welche Art von 'Modell' hier Inhalte live streamt. Diese extrem knappen Informationen erschweren eine Einschätzung der dahinterliegenden Technologie oder des genauen Anwendungsfalls erheblich.
Apple & Claude? Ein unbeabsichtigter Blick hinter die AI-Kulissen.
Apple hat in einer Beta-Version seiner Support-App versehentlich Dateien hinterlassen, die auf eine Integration oder zumindest Evaluation von Anthropic's KI-Modell Claude hindeuten. Das ist ein pikantes Detail, da Apple eigentlich auf seine eigene „Apple Intelligence“ setzt und diesen Vorfall wohl lieber unter Verschluss gehalten hätte. Es zeigt, wie tief Tech-Riesen im Wettlauf um KI auch auf Dritthersteller schielen, selbst wenn sie eigene Lösungen entwickeln.
Lokale 3D-Power für deinen Mac: TRELLIS.2 läuft nativ auf Apple Silicon
Die Bild-zu-3D-Generierung TRELLIS.2, die bisher oft Cloud-GPU-Farmen brauchte, läuft jetzt blitzschnell und nativ auf Apple Silicon Macs. Das ist eine kleine Revolution für Entwickler und Kreative, die ihre 3D-Modelle direkt auf dem Schreibtisch erzeugen wollen, ohne hohe Cloud-Kosten oder lästige Latenzen. Endlich wird High-End-KI lokal und zugänglich – und das auf einem Device, das viele von uns sowieso schon haben.
DeepMind DiLoCo: KI-Training endlich robust & dezentral skalierbar
Aktuelle KI-Modelle zu trainieren ist eine Sisyphusarbeit: Es dauert oft Wochen oder Monate, und ein einziger Serverausfall kann alles zunichtemachen. DeepMind zeigt mit „DiLoCo“ jetzt, wie man verteiltes KI-Training robuster macht: Indem Berechnungen entkoppelt werden, laufen die Modelle auch bei Ausfällen weiter und sind effizienter. Das ist kein triviales Detail, sondern ein Game Changer für alle, die wirklich große Modelle zuverlässig und schnell entwickeln wollen – ein echter Schritt nach vorn in der Infrastruktur von morgen.
Googles Gemma 4: KI-Power direkt und offline auf dem iPhone
Der Google-KI-Spross Gemma 4 landet überraschend nativ und komplett offline auf dem iPhone – dank des MLX-Frameworks von Apple wird die Smartphone-KI zur Realität. Das ist kein Trick: Volle Inferenz auf dem Gerät bedeutet weg von der Cloud, mehr Privatsphäre und rasend schnelle Reaktionen, die neue App-Erlebnisse ermöglichen könnten. Zwar noch in den Kinderschuhen, zeigt diese Entwicklung, dass das 'iPhone mit Hirn' schneller kommt als gedacht und die Grenzen zwischen lokaler und Cloud-AI verschwimmen.
KI-Apokalypse? Wer vom Weltuntergangs-Hype wirklich profitiert
Der Hype um existenzielle KI-Risiken und die Apokalypse? Laut BBC kommt er oft von den Big Playern selbst – und das ist kein Zufall. Statt echte Probleme wie Bias oder Jobverlust anzugehen, lenkt man mit Zukunftsangst ab und positioniert sich als Retter, der Regulierung mitgestalten darf. Ein cleverer Schachzug, um Dominanz zu festigen und Wettbewerb auszubremsen.
WaveFunctionCollapse: KI-Trick erschafft Welten aus einem Pixel-Schnipsel
WaveFunctionCollapse (WFC) ist ein faszinierendes Verfahren, das aus einem einzigen Beispielbild kohärente, unendliche Welten generieren kann – und das ganz ohne schwerfällige KI-Modelle. Es analysiert die Nachbarschaftsbeziehungen der Pixel im Input und setzt sie dann klug zu neuen Mustern zusammen, die überraschend vielseitig und ästhetisch ansprechend sein können. Ein geniales Konzept für alle, die prozedurale Generierung lieben, denn es zeigt, dass auch simple Algorithmen verblüffende Komplexität erzeugen können.
X.com-Hürde: Keine Einsicht in KI-CLI-Prinzipien
Ein spannender Titel verspricht unter 'Principles for agent-native CLIs' wichtige Einblicke in die Gestaltung von Schnittstellen für KI-Agenten. Leider bleibt der Inhalt dieses X.com-Threads jedoch unerreichbar, da die Plattform das Laden aufgrund von JavaScript-Problemen oder Browser-Einstellungen blockiert. So verpassen Tech-Entscheider potenziell relevante Diskussionsansätze zu diesem fundamentalen Thema.
Google Gemma 4: Native Offline-KI jetzt auf dem iPhone
Google Gemma 4 läuft jetzt nativ und mit voller Offline-KI-Inferenz auf dem iPhone. Dies markiert einen wichtigen Schritt für mobile KI, der die Cloud-Abhängigkeit reduziert und neue Anwendungsfelder für datenschutzsensible oder latenzkritische Aufgaben eröffnet.
MacMind: Transformer-KI läuft auf einem Mac von 1989
Vergessen Sie Nvidia-Cluster: SeanFDZ hat 'MacMind' gebaut, ein Transformer Neural Network – und zwar auf einem Macintosh von 1989 mit HyperCard. Ja, Sie haben richtig gehört. Dieses irre Projekt zeigt nicht nur, was mit Genialität auch auf uralter Hardware möglich ist, sondern entlarvt auch die oft überzogene Hardware-Hysterie im modernen KI-Zeitalter. Es ist ein faszinierendes Experiment, das die fundamentalen Prinzipien der KI jenseits von purem Rechenwahn beleuchtet.
Hallucinopedia: Ein neuer Show HN-Eintrag
Ein Projekt namens 'Hallucinopedia' wurde als 'Show HN' auf Hacker News vorgestellt. Über den konkreten Inhalt dieses vielsagenden Titels liefert die Quelle jedoch keine Details. Manchmal ist ein Name alles, was man braucht, um Neugier zu wecken.
Kimi K2.6: Chinesisches Open-Weights-Modell siegt im AI-Wort-Puzzle
Kimi K2.6, ein Open-Weights-Modell des chinesischen Startups Moonshot AI, hat Top-Modelle wie Claude und GPT-5.5 in einer 'Word Gem Puzzle'-Challenge übertroffen. Im Rahmen eines AI Coding Contests deklassierte Kimi K2.6 in diesem anspruchsvollen Wort-Schiebe-Rätsel die westliche AI-Elite. Dies ist ein klares Signal, dass die Innovationskraft nicht mehr exklusiv bei den westlichen Big Techs liegt und offene Modelle aus China ernsthafte Konkurrenz darstellen.
Dein nächster AI-Dev-Assistent? Dirac dominiert den TerminalBench!
Der Open-Source AI-Agent Dirac hat den renommierten TerminalBench-Benchmark auf Basis von Gemini-3-flash-preview haushoch gewonnen. Das ist kein akademischer Sieg, sondern ein klares Signal: KI-Agenten werden immer effektiver darin, über das Terminal zu interagieren und könnten schon bald unsere Entwicklungsworkflows massiv optimieren. Ein klares Zeichen, dass der "AI-Co-Worker" vom Buzzword zur Realität wird.
Microsoft VibeVoice: Open Source mischt Sprach-KI-Markt auf
Microsoft mischt den heiß umkämpften Sprach-KI-Markt kräftig auf: Mit 'VibeVoice' haben die Redmonder jetzt eine hochmoderne Voice AI quelloffen gemacht. Das ist keine kleine Geste, sondern ein strategischer Schachzug, um Entwickler weltweit an Bord zu holen und die Innovation im Bereich der künstlichen Stimmen zu beschleunigen. Der Fokus auf Open Source könnte Microsoft einen entscheidenden Vorteil im Rennen um die besten KI-Talente und Anwendungen verschaffen.