Gemini 3 Flash kommt als neues Modell für schnelle, skalierbare Anwendungen in den Entwickler-Alltag. In einem Blogbeitrag erklärt
Google, 3 Flash baue auf den multimodalen, Coding- und agentenbasierten Funktionen von Gemini 3 Pro auf, koste aber weniger als ein Viertel und komme mit höheren Ratenbegrenzungen.
Neben normalem Text kann das Modell auch mit Bildern arbeiten und soll dabei stärker geworden sein. Google nennt Verbesserungen beim logischen Denken und Wissen und führt dafür Tests wie GPQA Diamond mit 90,4 Prozent und Humanity’s Last Exam mit 33,7 Prozent ohne Hilfsmittel an, ausserdem soll 3 Flash in vielen Benchmarks besser als Gemini 2.5 Pro sein und dabei dreimal schneller arbeiten. Für Bildaufgaben beschreibt der Konzern zusätzlich visuelles und räumliches Denken und eine Codeausführung, die beim Zoomen, Zählen und Bearbeiten visueller Eingaben helfen soll.
Für Entwickler nennt Google Preise in der Gemini API und in Vertex AI von 0,50 Dollar pro 1 Mio. Eingabe-Tokens und 3 Dollar pro 1 Mio. Ausgabe-Tokens, Audioeingaben liegen bei 1 Dollar pro 1 Mio. Eingabe-Tokens. Laut dem Beitrag ist Kontext-Caching standardmässig enthalten und kann bei wiederholter Nutzung die Kosten um bis zu 90 Prozent senken, zudem sei 3 Flash über die Batch API verfügbar, die 50 Prozent Kostenersparnis für asynchrone Verarbeitung bringen soll.
Verfügbar ist das Modell nach Angaben des Unternehmens über Google AI Studio und die Gemini API, über Google Antigravity, Gemini CLI und Android Studio sowie für Unternehmen über Vertex AI.
(dow)