Google hat eine neue KI-Engine vorgestellt, die nicht einfach Bilder oder Videos generiert, sondern interaktive Welten – und das in Echtzeit. Das neue Produkt hört auf den Namen Genie 3 und wird vom Suchriesen als "General Purpose World Model" beschrieben.
Mit einem initialen Textprompt kann mit Genie 3 eine Welt erstellt werden, die in 24 Frames in einer Auflösung von 720p dargestellt wird und im Anschluss erkundet werden kann. Der Clou ist dabei, dass die generierte Welt – ja nachdem, wie man sich in ihr bewegt – laufend in Echtzeit weiter generiert werden soll.
Wenn man an einen Ort zurückkehrt, sollen dort alle Handlungen und Veränderungen, die man beim letzten Besuch vorgenommen hat, wieder auffindbar sein. Im Teaser-Video (siehe unten) streicht der Nutzer etwa eine Wand teilweise, dreht sich weg und findet das gemalte Muster bei seiner Rückkehr vor, wie er es verlassen hat. Dieses visuelle Gedächtnis soll bei Genie 3 bis zu einer Minute zurückreichen.
World Simulation ist laut dem Entwickler
Google Deepmind ein zentraler Schritt zu einer selbst handelnden und entscheidungsfähigen AGI (Artificial General Intelligence). Im Gegensatz zum Vorgänger Genie 2, der im Dezember 2024 gezeigt wurde, soll Genie 3 vor allem damit punkten, dass mit der generierten Welt interagiert werden kann. Auch soll es möglich sein, das aktuelle Szenario mit einer weiteren Texteingabe zu verändern, etwa um das Wetter zu ändern oder ein Objekt oder eine Person in der Welt auftauchen zu lassen.
Neben dem naheliegenden Einsatz für die Unterhaltungs- und speziell die Gaming-Industrie sollen Produkte wie Genie 3 auch für Simulationen und Trainings zum Einsatz kommen können, wie Google überzeugt ist. Aufgrund der oben genannten, aktuell noch überschaubaren Kapazität des visuellen Gedächtnisses der KI sind die praktischen Anwendungsfälle aktuell wohl noch sehr eingeschränkt. Beeindruckend sind die Ergebnisse aber allemal. Wie es ein Nutzer unter dem eingebetteten Youtube-Video beschreibt: "Google zeigt einfach so an einem zufälligen Dienstag die Matrix."
Öffentlich zugänglich ist Genie 3 nicht. Google schreibt, dass man derzeit prüfe, wie man die Engine in Zukunft weiteren Testern zur Verfügung stellen könnte. Mehr Video- und Bildmaterial ist
im zugehörigen Blogbeitrag zu finden.
(win)