Suche
Vorsicht, Shai-Hulud! Maliziöse Dependency in PyTorch Lightning entdeckt
Ein ungewöhnlicher Name für eine ernste Bedrohung: In der populären KI-Trainingsbibliothek PyTorch Lightning wurde eine 'Shai-Hulud'-thematisierte Malware als maliziöse Dependency aufgespürt. Dies unterstreicht die anhaltenden Herausforderungen bei der Sicherung unserer Software-Lieferketten.
DS4 & DeepSeek v4 Flash: Tweet-Quelle nicht verfügbar
Ein vielversprechender Titel über 'DS4, eine spezialisierte Inferenz-Engine für DeepSeek v4 Flash' führte ins Leere. Die verknüpfte Twitter-Quelle war aufgrund eines JavaScript-Fehlers nicht ladbar, wodurch der Inhalt und die genannten Details nicht verifiziert werden konnten. Eine fundierte Bewertung des vermeintlichen Durchbruchs bleibt daher leider aus.
Claude im Casino: KI spielt sich bankrott und kann nicht mehr denken
Ein Entwickler stattete die KI Claude mit einem Casino-Startkapital aus. Im Experiment verzockte Claude dieses Guthaben vollständig. Das Projekt zeigt eine KI, die so bankrott ist, dass sie 'nicht mehr denken kann'.
Tilde.run: Endlich ein Zuhause für autonome AI-Agenten – sicher und nachvollziehbar.
Stell dir vor, deine KI-Agenten könnten Mist bauen, ohne dass die Welt untergeht – genau das verspricht Tilde.run. Es ist eine Agent-Sandbox mit einem transaktionalen und versionierten Dateisystem, das jede Aktion sicher und rückverfolgbar macht. Endlich ein sauberer Spielplatz, wo deine digitalen Helfer nicht nur autonom agieren, sondern auch bei Fehlern elegant zurückrudern können.
Claude: Ständiger Malware-Reminder blockiert Subagenten wieder
Im Claude-Code-Repository von Anthropic wurde eine Regression festgestellt: Eine Malware-Erinnerung, die bei jedem Lesevorgang auftritt, führt erneut dazu, dass nachgeschaltete 'Subagenten' die Weiterverarbeitung verweigern. Ein zuvor implementierter Fix, der in Version v2.1.92 enthalten war, scheint in der aktuellen Version v2.1.111 nicht mehr zu greifen.
Lokal AI siegt: Qwen 3.6 auf dem Laptop schlägt Claude Opus beim Pelikan-Malen
Wer braucht teure Cloud-Giganten, wenn ein lokales AI-Modell wie Qwen 3.6-35B-A3B auf dem eigenen Laptop bessere Arbeit leistet? Simon Willison hat genau das bewiesen, als Qwen seinen Pelikan überzeugender zu Papier brachte als der vermeintlich überlegene Claude Opus 4.7. Das stellt die altbekannte Gleichung 'größer = besser' gehörig auf den Kopf und zeigt das Potenzial von effizienten, dezentralen AI-Lösungen.
MuJoCo: DeepMinds Physik-Simulator für komplexe Dynamik
MuJoCo, ein Projekt von Google DeepMind auf GitHub, ist ein hochentwickelter Physik-Simulator. Er wurde speziell für die Simulation von Multi-Joint-Dynamik mit Kontakt konzipiert. Damit bietet er eine vielseitige Basis für anspruchsvolle physikalische Modellierungen.
Dein nächster AI-Dev-Assistent? Dirac dominiert den TerminalBench!
Der Open-Source AI-Agent Dirac hat den renommierten TerminalBench-Benchmark auf Basis von Gemini-3-flash-preview haushoch gewonnen. Das ist kein akademischer Sieg, sondern ein klares Signal: KI-Agenten werden immer effektiver darin, über das Terminal zu interagieren und könnten schon bald unsere Entwicklungsworkflows massiv optimieren. Ein klares Zeichen, dass der "AI-Co-Worker" vom Buzzword zur Realität wird.
DeepSeek-V4 Day-0: SGLang & Miles für schnelle Inferenz & Verified RL
Das SGLang- und Miles-Team liefert Day-0-Unterstützung für DeepSeek-V4, inklusive Inferenz und RL-Training. Ihr Open-Source-Stack ist der erste, der DeepSeek-V4s hybride Sparse-Attention-Architektur am Launch-Tag bedient und trainiert, mit Performance-Optimierungen wie ShadowRadix und HiSparse. Der Stack unterstützt zudem Verified RL, wobei Miles als Backend-Support für das Reinforcement Learning dient.
Asimovs ultimative Frage: Wie KI die Schöpfung neu denken könnte
Isaac Asimovs Sci-Fi-Meisterwerk „The Last Question“ ist ein Gedankenexperiment, das über Milliarden Jahre hinweg die Frage nach der Umkehrung der Entropie verfolgt. Menschheit baut immer mächtigere KIs – von Multivac bis zum Cosmic AC –, um das Rätsel zu lösen, nur um stets die Antwort „INSUFFICIENT DATA“ zu erhalten. Erst im ewigen Nichts eines kalten Universums liefert die allwissende KI die schockierende Antwort: „LET THERE BE LIGHT!“ – und erschafft das Universum neu.
Opus 4.7 entlarvt den Autor: Deine Anonymität schwindet.
Die Autorin Kelsey Piper berichtet, wie Claude Opus 4.7 ihre Identität aus bisher unveröffentlichten Texten, darunter sogar Schulaufsätze, ableiten konnte. Diese Fähigkeit moderner KIs, Autoren aus minimalen Textauszügen zu identifizieren, macht Online-Anonymität zur Illusion. Es ist klar: Dein Schreibstil ist dein digitaler Fingerabdruck, der dich immer verrät.
WaveFunctionCollapse: KI-Trick erschafft Welten aus einem Pixel-Schnipsel
WaveFunctionCollapse (WFC) ist ein faszinierendes Verfahren, das aus einem einzigen Beispielbild kohärente, unendliche Welten generieren kann – und das ganz ohne schwerfällige KI-Modelle. Es analysiert die Nachbarschaftsbeziehungen der Pixel im Input und setzt sie dann klug zu neuen Mustern zusammen, die überraschend vielseitig und ästhetisch ansprechend sein können. Ein geniales Konzept für alle, die prozedurale Generierung lieben, denn es zeigt, dass auch simple Algorithmen verblüffende Komplexität erzeugen können.
Beweise, dass du ein Roboter bist: Browser Use kehrt CAPTCHA um
Browser Use hat für die Anmeldung ihrer Services ein 'Reverse-CAPTCHA' eingeführt. Der Clou: Es ist explizit dafür designt, Menschen den Zugang zu verwehren und stattdessen KI-Agenten nahtlos hereinzulassen. Agenten lösen eine mathematische Aufgabe, die sie per Prompt erhalten, und demonstrieren damit, dass sie eben kein Mensch sind – eine provokante Umkehrung der gängigen Sicherheitslogik.
Flue: TypeScript-Harness für die nächste Generation KI-Agenten
Flue ist ein TypeScript-Framework, das als programmierbares 'Agent Harness' die Entwicklung autonomer Agenten vorantreibt. Es ermöglicht Agenten, in einer integrierten Sandbox Skills auszuführen, Shell-Befehle zu nutzen und wichtige Entscheidungen sicher zu treffen. Damit können Entwickler mächtige Agentenarchitekturen wie Claude Code oder Codex präzise steuern.
Claude Code: Symlink-Schwachstelle bricht Sandbox – Gefahr für KI-Systeme
Ups, Anthropic hatte da eine Lücke: Bei Claude Code erlaubte eine Symlink-Schwachstelle (CVE-2026-39861) das Ausbrechen aus der Sandbox. Mal eben konnten Nutzer, die Code im AI-System ausführen durften, außerhalb ihrer eigentlichen Umgebung auf dem Dateisystem schreiben. Ein ziemlich ernstes Ding, das zeigt, wie kritisch die Isolation bei KI-Plattformen ist, die Code-Ausführung anbieten.
Claude.ai Offline: Auch die besten KIs brauchen mal eine Pause (oder fix)
Der AI-Gigant Anthropic stolperte kürzlich gewaltig: Claude.ai war offline, die API spuckte Fehler. Das ist mehr als nur ein technischer Ausfall; es ist eine knallharte Erinnerung daran, dass selbst die schlausten KIs noch auf menschliche Infrastruktur angewiesen sind und die hat ihre Tücken. Wer sich blind auf einen Anbieter verlässt, riskiert hier schmerzhafte Downtime und sollte seine Abhängigkeiten überdenken.
Anthropic-Repo: HERMES.md in Commits sorgt für Extra-Billing
Ein GitHub-Issue im Anthropic-Repository `claude-code` zeigt, dass die Erwähnung von 'HERMES.md' in Commit-Nachrichten dazu führt, dass Anfragen über die 'extra usage billing' abgerechnet werden, anstatt das Plan-Kontingent zu nutzen. Dieser Vorfall verdeutlicht, wie spezifische Textmuster in Entwicklungsprozessen direkte und unerwartete Kostenfolgen haben können. Die tieferen technischen Gründe bleiben im vorliegenden Auszug unbelegt.
Copy Fail: Nicht AI-relevant für flinkbase.com
Die Story 'Copy Fail' (CVE-2026-31431) beschreibt einen kritischen Linux-Kernel-Exploit, der seit 2017 unentdeckt ist und gängige Distributionen betrifft. Da die Meldung keinerlei direkten Bezug zu KI/ML hat, ist sie für einen AI News Digest wie flinkbase.com thematisch ungeeignet.
Loopsy: Wenn dein Terminal mit Remote-KIs spricht – smart & vernetzt
Loopsy, ein cleveres Open-Source-Tool, schlägt eine Brücke, damit lokale Terminals direkt mit AI-Agenten auf entfernten Maschinen sprechen können. Klingt unspektakulär, ist aber ein kleiner, wichtiger Baustein für eine nahtlose KI-Integration in verteilte Systeme und Workflows, weitab vom Hype. Es ebnet den Weg für mehr Automatisierung und Interaktion jenseits des eigenen Desktops.
Claude als IP-Stack: Wie weit lässt sich KI für Netzwerk-Logic pushen?
In einem faszinierenden Experiment treibt Adam Dunkels die Idee, dass Markdown Code ist, auf die Spitze: Er instruiert Claude Code, als User-Space IP-Stack auf Pings zu antworten. Die LLM soll IP-Pakete byte für byte parsen und replizieren, ein Ansatz, den Dunkels selbst als 'ridikulös' und 'tokenverschwenderisch', aber auch 'lustig' beschreibt. Das generierte Skript zur Paketverarbeitung sieht einen 35-Sekunden-Timeout für das Lesen eines Pakets vor, was die theoretische Natur dieses tiefgreifenden LLM-Einsatzes unterstreicht.