Suche
DeepSeek V4: Fast Frontier-KI, Open-Weights-Riese – unschlagbar günstig
Die neuen DeepSeek V4 Modelle Pro und Flash betreten die Bühne. Mit 1.6T Parametern ist DeepSeek-V4-Pro das größte Open-Weights-Modell. Das Beeindruckende ist der Preis: Das Flash-Modell unterbietet in den Input-Kosten sogar GPT-5.4 Nano und macht High-End-KI so unschlagbar günstig.
Amateur (23) löst 60-Jahre-Mathe-Rätsel – GPT-5.4 mit neuem Weg
Liam Price, ein 23-jähriger Amateur ohne Mathematik-Ausbildung, hat ein 60 Jahre altes Erdős-Problem gelöst. Er nutzte dafür eine ChatGPT Pro-Subskription (GPT-5.4 Pro), welche auf einen einzigen Prompt hin eine Lösung mit einer völlig neuartigen Methode lieferte. Das zeigt, wie generative KI selbst komplexe mathematische Herausforderungen meistern kann, wo menschliche Intuition bisher an Grenzen stieß.
Google pusht Gemma 4: Schnelle Inferenz dank Multi-Token-Drafter
Google arbeitet aktiv daran, die Inferenzgeschwindigkeit von Gemma 4 zu erhöhen. Dabei kommt die Technologie der Multi-Token-Prediction zum Einsatz, unterstützt durch sogenannte 'Drafters'. Dies zielt auf eine Leistungssteigerung des KI-Modells ab.
Google Gemma 4: Native Offline-KI jetzt auf dem iPhone
Google Gemma 4 läuft jetzt nativ und mit voller Offline-KI-Inferenz auf dem iPhone. Dies markiert einen wichtigen Schritt für mobile KI, der die Cloud-Abhängigkeit reduziert und neue Anwendungsfelder für datenschutzsensible oder latenzkritische Aufgaben eröffnet.
KI goes Bio: OpenAI bringt GPT-Rosalind ins Labor
Schluss mit ewiger Literaturrecherche und mühsamer Hypothesenbildung! OpenAI schickt jetzt GPT-Rosalind ins Rennen, eine spezialisierte KI für die Biowissenschaften. Dieses Biologie-GPT soll Forschenden von Genetik bis Proteomik mit smarten Vorschlägen und blitzschneller Datenanalyse den Rücken freihalten – ein echter Game Changer, wenn es hält, was es verspricht.
GPT-5.5: OpenAI überrascht mit Power-Update – fast schon GPT-5?
OpenAI hat überraschend GPT-5.5 vorgestellt, ein „Zwischen-Upgrade“, das die Erwartungen an GPT-5 massiv in die Höhe treibt. Dieses Modell ist weit mehr als nur ein inkrementeller Schritt: Es deutet auf signifikante Fortschritte in Bereichen wie Logik, Kontextverständnis und möglicherweise Multimodalität hin. Damit setzt OpenAI nicht nur die Konkurrenz unter Druck, sondern zeigt auch, dass die wahre Power von GPT-5 unmittelbar bevorstehen könnte.
GPT-5.5: KI definiert professionelle Schwachstellenerkennung neu
Laut dem Cybersicherheitsunternehmen XBOW erreicht GPT-5.5 ein "Mythos-ähnliches" Niveau in der Schwachstellenerkennung. Sie haben das Modell in ihren professionellen Pentesting-Workflows getestet und sehen einen entscheidenden Sprung nach vorn für offensive Sicherheitskapazitäten.
KI-Chips: Warum FP4 das nächste Präzisions-Opfer ist
Während traditionelle Programmierung nach Präzision strebte, kehrt die KI-Branche diesen Trend um: Neurale Netze verlangen nach immer weniger Bits, um riesige Modelle in den Speicher zu bekommen. FP4 ist hier ein 4-Bit-Gleitkommaformat, das das erste Bit zur Repräsentation des Vorzeichens nutzt. Diese drastischen Kompromisse bei der Präzision sind notwendig, um den dynamischen Bereich zu erhalten, den reine Integer-Formate nicht bieten können.
GPT-5.5 Preisanstieg: Dein AI-Budget unter Druck?
OpenRouter.ai hat die Kosten für GPT-5.5 unter die Lupe genommen und warnt: Die Preise steigen, was direkt euer AI-Budget trifft. Wer dachte, AI-Nutzung wird nur billiger, sieht sich getäuscht – ein Realitätscheck für alle Entwickler und Unternehmen, die auf diese Modelle setzen.
Vera: Die Programmiersprache, von KI-Modellen geschrieben
Vera ist eine Programmiersprache, die explizit dafür entwickelt wurde, von KI-Modellen geschrieben zu werden. Dieser Ansatz dreht die traditionelle Softwareentwicklung um und macht maschinelle Code-Erzeugung zum primären Designziel.
Mistral Medium 3.5: Dein Open-Weight-Powerhouse für Coding & AI-Agenten
Mistral präsentiert Medium 3.5, ein 128B Open-Weight-Modell, das Instruction-Following, Reasoning und Coding vereint. Es treibt Mistral Vibe Remote Agents für asynchrones Cloud-Coding und den neuen Work-Modus in Le Chat für komplexe, mehrstufige Aufgaben an. Das Modell ist selbst auf vier GPUs hostbar und für lange Coding- und Produktivitätsaufgaben optimiert.
WebGPU-Power: Gemma 4 E2B zeichnet Excalidraw direkt im Browser
Diese neue Demo zeigt, wie Googles Gemma 4 E2B KI direkt im Browser – powered by WebGPU – Text-Prompts in Excalidraw-Zeichnungen verwandelt. Das 3.1 GB große Modell läuft komplett lokal auf dem Desktop (Chrome 134+). Es erzeugt kompakten Code anstelle von umfangreichen JSON-Daten für effiziente Diagramme.
DS4 & DeepSeek v4 Flash: Tweet-Quelle nicht verfügbar
Ein vielversprechender Titel über 'DS4, eine spezialisierte Inferenz-Engine für DeepSeek v4 Flash' führte ins Leere. Die verknüpfte Twitter-Quelle war aufgrund eines JavaScript-Fehlers nicht ladbar, wodurch der Inhalt und die genannten Details nicht verifiziert werden konnten. Eine fundierte Bewertung des vermeintlichen Durchbruchs bleibt daher leider aus.
DeepSeek v4: OpenAI-kompatible API für neue AI-Modelle verfügbar
DeepSeek hat eine API für seine Modelle deepseek-v4-flash und deepseek-v4-pro vorgestellt. Diese API ist bemerkenswerterweise mit den Formaten von OpenAI und Anthropic kompatibel, was eine nahtlose Integration in bestehende Entwicklungs-Workflows erlaubt. Die detaillierte Dokumentation bietet Code-Beispiele und erleichtert den schnellen Einstieg in die Nutzung.
Googles Gemma 4: KI-Power direkt und offline auf dem iPhone
Der Google-KI-Spross Gemma 4 landet überraschend nativ und komplett offline auf dem iPhone – dank des MLX-Frameworks von Apple wird die Smartphone-KI zur Realität. Das ist kein Trick: Volle Inferenz auf dem Gerät bedeutet weg von der Cloud, mehr Privatsphäre und rasend schnelle Reaktionen, die neue App-Erlebnisse ermöglichen könnten. Zwar noch in den Kinderschuhen, zeigt diese Entwicklung, dass das 'iPhone mit Hirn' schneller kommt als gedacht und die Grenzen zwischen lokaler und Cloud-AI verschwimmen.
LLMs: Milliarden-Token-Kontext – Das Ende der Denk-Lücken?
Der Milliarden-Token-Kontext ist das nächste Schlachtfeld der LLM-Entwicklung, denn nur so können KIs wirklich komplexe Inhalte über ganze Bücher oder Codebasen hinweg erfassen. Bisher bremste das quadratische Skalierungsproblem der Attention-Mechanismen, aber neue Architekturen wie Mamba und Tricks wie FlashAttention weisen den Weg. Das Ziel? Eine Ära, in der LLMs zu echten kognitiven Partnern werden, die nicht nur Fragen beantworten, sondern den gesamten Kontext verstehen.
OpenAI entschlüsselt: So wird Sprach-KI jetzt blitzschnell & skaliert
Endlich Schluss mit den peinlichen Pausen in KI-Gesprächen: OpenAI hat verraten, wie sie ihre Sprach-KI für ChatGPT in Echtzeit performen lassen. Durch raffinierte Parallelisierung, Streaming und vor allem "speculative decoding" werden die Modelle nahtlos verzahnt, um die Latenz auf ein Minimum zu drücken. Das ist ein Geniestreich, der Sprach-Interaktionen mit KI nicht nur schneller, sondern endlich auch natürlich und flüssig macht.
OpenAI jagt Bio-Bugs in GPT 5.5: KI als Biowaffe verhindern?
OpenAI legt ein Biosicherheits-Kopfgeldprogramm auf, um Schwachstellen in ihren fortschrittlichsten Modellen – insbesondere den kommenden Frontier-Modellen wie GPT 5.5 – zu finden, die für biologische Bedrohungen missbraucht werden könnten. Mit bis zu 25.000 Dollar pro Fund sollen Forscher Wege identifizieren, wie KIs zur Entwicklung von Biowaffen oder Pandemien genutzt werden könnten. Das ist kein Spaß: Es zeigt die wachsende Besorgnis über die Dual-Use-Potenziale von KI und wie dringend deren Kontrolle ist, bevor es zu spät ist.
Anthropic feilt an Claude Opus 4.7: Mehr Tools, mehr Kinderschutz
Simon Willison analysiert die aktualisierten System-Prompts von Claude Opus 4.7 und entdeckt signifikante Änderungen. Auffällig sind die massive Erweiterung der Kinderschutzanweisungen, die nun in einem speziellen Tag gekapselt sind, sowie die Erwähnung neuer Tools wie "Claude in PowerPoint". Diese Anpassungen zeigen, dass Anthropic seine Modelle nicht nur trainiert, sondern auch deren Kernverhalten über detaillierte Prompt-Instruktionen präzise steuert.
GovernGPT (YC W24): Kommt die KI zum Denken nach Montreal?
Das frische YC-Startup GovernGPT (W24-Batch) sucht Backend Engineers in Montreal, um 'Thinking Systems' zu bauen. Das klingt nicht nach smarter Software, sondern nach der Infrastruktur für KI, die tatsächlich planen, überlegen und zielgerichtet handeln kann. Ein ambitioniertes Vorhaben, das die Grenzen dessen, was wir von AI erwarten, neu definieren könnte.