cnt
Genie 3 von Google baut interaktive 3D-Welten in Echtzeit
Quelle: Google

Genie 3 von Google baut interaktive 3D-Welten in Echtzeit

Mit der neuen KI-Engine Genie 3 von Google Deepmind soll es möglich sein, interaktive 3D-Welten zu erstellen. Während man sich in diesen bewegt, werden sie in Echtzeit weiter generiert.
7. August 2025

     

Google hat eine neue KI-Engine vorgestellt, die nicht einfach Bilder oder Videos generiert, sondern interaktive Welten – und das in Echtzeit. Das neue Produkt hört auf den Namen Genie 3 und wird vom Suchriesen als "General Purpose World Model" beschrieben.

Mit einem initialen Textprompt kann mit Genie 3 eine Welt erstellt werden, die in 24 Frames in einer Auflösung von 720p dargestellt wird und im Anschluss erkundet werden kann. Der Clou ist dabei, dass die generierte Welt – ja nachdem, wie man sich in ihr bewegt – laufend in Echtzeit weiter generiert werden soll.


Wenn man an einen Ort zurückkehrt, sollen dort alle Handlungen und Veränderungen, die man beim letzten Besuch vorgenommen hat, wieder auffindbar sein. Im Teaser-Video (siehe unten) streicht der Nutzer etwa eine Wand teilweise, dreht sich weg und findet das gemalte Muster bei seiner Rückkehr vor, wie er es verlassen hat. Dieses visuelle Gedächtnis soll bei Genie 3 bis zu einer Minute zurückreichen.
World Simulation ist laut dem Entwickler Google Deepmind ein zentraler Schritt zu einer selbst handelnden und entscheidungsfähigen AGI (Artificial General Intelligence). Im Gegensatz zum Vorgänger Genie 2, der im Dezember 2024 gezeigt wurde, soll Genie 3 vor allem damit punkten, dass mit der generierten Welt interagiert werden kann. Auch soll es möglich sein, das aktuelle Szenario mit einer weiteren Texteingabe zu verändern, etwa um das Wetter zu ändern oder ein Objekt oder eine Person in der Welt auftauchen zu lassen.

Neben dem naheliegenden Einsatz für die Unterhaltungs- und speziell die Gaming-Industrie sollen Produkte wie Genie 3 auch für Simulationen und Trainings zum Einsatz kommen können, wie Google überzeugt ist. Aufgrund der oben genannten, aktuell noch überschaubaren Kapazität des visuellen Gedächtnisses der KI sind die praktischen Anwendungsfälle aktuell wohl noch sehr eingeschränkt. Beeindruckend sind die Ergebnisse aber allemal. Wie es ein Nutzer unter dem eingebetteten Youtube-Video beschreibt: "Google zeigt einfach so an einem zufälligen Dienstag die Matrix."


Öffentlich zugänglich ist Genie 3 nicht. Google schreibt, dass man derzeit prüfe, wie man die Engine in Zukunft weiteren Testern zur Verfügung stellen könnte. Mehr Video- und Bildmaterial ist im zugehörigen Blogbeitrag zu finden. (win)



Weitere Artikel zum Thema

Forscher entwickeln universellen Video‑Fälschungsdetektor

30. Juli 2025 - UC Riverside-Wissenschaftler haben mit Universal Network for Identifying Tampered and Synthetic Videos (Unite) ein KI-System entwickelt, das manipulierte Videos an ihrem gesamten Bildinhalt erkennt.

Googles KI-Videogenerator Veo 3 in der Schweiz verfügbar

3. Juli 2025 - Veo 3, die nächste Generation von Googles Video-KI-Tool, ist per sofort in der Schweiz verfügbar. Mit der neuen Gemini-App lassen sich achtsekündige Clips per Textprompt erstellen – neu auch mit Ton, Stimmen und Dialog.

Deepmind Genie 2 generiert ganze Spielwelten

5. Dezember 2024 - Mit der KI Genie 2 demonstriert Deepmind, wie anhand eines Bildes und eines Textprompts ganze spielbare 3D-Welten erschaffen werden. Allerdings kommt die KI beim längeren Spielen an ihren Grenzen und technische Details zum Output sind ebenfalls noch spärlich.


Artikel kommentieren
Kommentare werden vor der Freischaltung durch die Redaktion geprüft.

Anti-Spam-Frage: Welche Farbe hatte Rotkäppchens Kappe?
GOLD SPONSOREN
SPONSOREN & PARTNER