Die aktualisierte Gemini Live API von
Google DeepMind soll Sprachassistenten verlässlicher machen und Gespräche natürlicher führen. Nach Angaben von Google DeepMind verdoppelte sich in internen Tests die Erfolgsrate bei einzelnen Funktionsaufrufen. Bei Szenarien mit 5 bis 10 Aufrufen stieg sie um 50 Prozent. Die höhere Trefferquote soll besonders in Echtzeit-Situationen helfen, in denen Assistenten keine Wiederholungsversuche haben.
Auch die Gesprächsführung wird laut Google präziser. Das System erkenne Pausen und Unterbrechungen besser, filtert Nebengespräche und pausiere automatisch, wenn etwa jemand im Raum eine Frage stellt – um dann an der gleichen Stelle fortzufahren. Zu den Neuerungen stellt Google
Demo-Beispiele bereit.
In der kommenden Woche will Google DeepMind mit einer "Thinking"-Funktion ergänzen, ähnlich wie bei Gemini 2.5 Flash und Pro. Entwickler sollen festlegen können, wie viel Zeit sich das Modell für komplexe Anfragen nimmt. Zusätzlich soll das System eine textliche Zusammenfassung seiner "Überlegungen" liefern.
Die überarbeitete
Live API ist als Preview verfügbar. Entwickler können die neuen Funktionen ab sofort im Google AI Studio ausprobieren.
(dow)