Quelle: Google

Google macht Gemma 4 bis zu dreimal schneller

Google veröffentlicht neue Hilfsmodelle für Gemma 4. Die Open-Source-KI-Familie soll damit Antworten bis zu dreimal schneller ausgeben, ohne an Qualität einzubüssen.

6. Mai 2026

Gemma 4 soll künftig schneller reagieren, wenn Entwickler die offenen KI-Modelle von Google in Anwendungen einsetzen. Wie Google mitteilt, veröffentlicht das Unternehmen dafür Multi-Token-Prediction-Drafter, kurz MTP-Drafter.

Der Ansatz soll ein typisches Problem grosser Sprachmodelle lösen. Diese erzeugen Antworten normalerweise Schritt für Schritt und berechnen jeden nächsten Textteil einzeln. Die neuen Drafter bereiten dagegen mehrere mögliche nächste Textteile vor. Das eigentliche Gemma-4-Modell prüft diese Vorschläge anschliessend und übernimmt nur jene, die passen.

Laut Google lässt sich die Antwortausgabe dadurch um bis zu den Faktor drei beschleunigen. Die Qualität und die Argumentationslogik sollen dabei erhalten bleiben, weil weiterhin das Hauptmodell die abschliessende Prüfung übernimmt.

Profitieren sollen vor allem Anwendungen, bei denen kurze Reaktionszeiten wichtig sind. Der Konzern nennt unter anderem Chatbots, Programmierassistenten, KI-Agenten sowie lokale Anwendungen auf PCs und Mobilgeräten.

Die neuen MTP-Drafter sind ab sofort für Gemma 4 verfügbar. Sie stehen wie die Modellfamilie selbst unter der Apache-2.0-Lizenz und können unter anderem über Hugging Face und Kaggle heruntergeladen werden. Unterstützt werden zudem Transformers, MLX, vLLM, SGLang und Ollama. (dow)

(Quelle: Google)

Google bringt Offline-Diktierapp Edge Eloquent für iOS

7. April 2026 - Die Diktierapp Google AI Edge Eloquent verarbeitet gesprochenen Text direkt auf dem iPhone in gut formulierten geschriebenen Text und glättet dabei Ungereimtheiten aus. Derzeit iOS-only, basiert die App auf lokal gespeicherten Gemma-Modellen.

TranslateGemma ist Googles neues KI-Tool fürs Übersetzen

18. Januar 2026 - Google hat TranslateGemma vorgestellt, eine neue Reihe offener KI-Modelle fürs Übersetzen. Die Modelle sollen 55 Sprachen abdecken und in drei Versionen für unterschiedliche Geräte verfügbar sein.

Artikel kommentieren

Advertorial

Google macht Gemma 4 bis zu dreimal schneller

Google bringt Offline-Diktierapp Edge Eloquent für iOS

TranslateGemma ist Googles neues KI-Tool fürs Übersetzen

IBM FlashSystem 2026: Der schnelle Speicher mit KI-Immunsystem

Vom Dokument zur Entscheidungsplattform

CRA umsetzen, ohne Entwicklung auszubremsen

Meetingräume: Die Erfolgsfaktoren

Smarte Analyseplattform statt MDM

Meetings, die einfach funktionieren