Google hat seinen Musikgenerator Lyria 3 in die Gemini-App integriert. Aktuell in der Betaphase, lassen sich in Gemini auf Basis von Text-, Bild- oder Videoprompts 30 Sekunden lange Musiktracks generieren: Man beschreibt das gewünschte Ergebnis mit Worten, zum Beispiel "ein komischer R&B Slow Jam über eine Socke, die ihr Gegenstück findet", oder man lädt ein Bild oder Video hoch und lässt Gemini ein passendes Musikstück erzeugen. Es ist ebenfalls möglich, einen bestehenden Track hochzuladen und diesen als Inspiration für das neu erzeugte Stück zu nutzen. Das neue Gemini-Feature steht allen Nutzern über 18 Jahre in den Sprachen Englisch, Deutsch, Spanisch, Französisch, Hindi, Japanisch, Koreanisch und Portugiesisch zur Verfügung. Weitere Sprachen sollen folgen.
In Lyria 3 will Google gegenüber früheren Lyria-Modellen drei Verbesserungen untergebracht haben. Erstens muss man keine Liedtexte mehr mitliefern, Lyria 3 generiert die Lyrics auf Basis des Prompts selbst. Zweitens verschafft das neue Modell mehr Kontrolle über Aspekte wie Musikstil, Gesang und Tempo. Als Drittes verspricht
Google, dass mit Lyria 3 realistischere und musikalisch komplexere Tracks entstehen. Neben der Musik erzeugt Gemini mithilfe von Nano Banana zusätzlich die passende Cover Art. Das Ganze lässt sich zum Schluss herunterladen und speichern und mit der Sharing-Funktion von Gemini mit Freunden teilen.
Mit der Gemini App erzeugte Tracks werden automatisch mit einem SynthID-Wasserzeichen versehen, das KI-generierten Content markiert. Die Gemini-App wurde ausserdem mit zusätzlichen Tools ausgestattet, um KI-Content zu identifizieren – Bilder, Videos und neu auch Musik. Google betont, Lyria 3 sei zum Erstellen von neuer Originalmusik gedacht und nicht zum Imitieren existierender Künstler. Gibt man im Prompt Den Namen eines Künstlers an, nimmt das KI Modell dies als grobe kreative Inspiration und generiert einen Track in einem ähnlichen Stil. Zusätzlich gibt es einen Filter, der den Output auf die Imitation bestehender Tracks kontrolliert und allenfalls verwirft.
Das neue Gemini-Feature steht allen Nutzern über 18 Jahre in den Sprachen Englisch, Deutsch, Spanisch, Französisch, Hindi, Japanisch, Koreanisch und Portugiesisch zur Verfügung. Weitere Sprachen sollen folgen. Zuerst hält es ab sofort in der Desktop-App Einzug, in den kommenden Tagen sollen die Mobile Apps folgen.
(ubi)