Google hat mit Nano Banana 2 das neueste Modell für die KI-basierte Bildgenerierung veröffentlicht. Wie der Konzern in einem
Blog-Beitrag erklärt, kombiniert das neue Modell die Stärken seiner Vorgänger mit einer deutlich höheren Geschwindigkeit. Nano Banana 2 basiert auf Gamini 3.1 Flash Image und macht ehemals der zahlenden Pro-Klientel vorbehaltene Funktionen einem breiteren Publikum zugänglich.
Das Modell macht sich die Wissensdatenbank von Gemini zunutze und greift auf die Echtzeitinformationen und die Bilder aus der Google-Suche zu, um Motive genauer darzustellen. Die Nutzer sollen damit Infografiken erstellen, Notizen in Diagramme verwandeln und Datenvisualisierungen generieren, wie
Google erklärt. Auch sollen sich mit Nano Banana 2 korrekte, gut lesbare Texte für Marketing-Mockups oder Grusskarten generieren lassen.
Im Vergleich zur Vorgängerversion bietet das neue Modell zudem Motivkonsistenz von bis zu fünf Charakteren und Detailtreue von bis zu 14 Objekten in einem Workflow. Weiter soll sich das neue Modell präziser an die Anweisungen halten und auch Nuancen erfassen. Dazu werden Auflösungen von 512px bis 4K unterstützt und auch die visuelle Detailtreue soll durch lebendige Beleuchtung und sattere Texturen deutlich verbessert worden sein.
Nano Banana 2 wird Nano Banana Pro in den Gemini-Modellen Fast, Thinking und Pro ersetzen. Dazu findet sich das neue Modell als Preview in AI Studio, in der Gemini API wie auch im Filmproduktionstool Flow oder in der Anzeigenplattform Ads.
(rd)