Google DeepMind hat sein Weltmodell Project Genie um die Integration von Street View erweitert. Die Ankündigung erfolgte auf der Google I/O Entwicklerkonferenz.
Kern der Entwicklung
Die Integration nutzt Googles umfangreichen Street-View-Datensatz. Nutzer können reale Orte auswählen und diese mittels generativer KI in unterschiedlichen Stilen, Wetterbedingungen oder historischen Szenarien visualisieren. Die Simulationen zeigen realistische Physik und reagieren auf Benutzerinteraktionen.
Technische Grundlage
Project Genie wird von Genie 3 angetrieben, einem autoregressiven Transformer-Modell mit 11 Milliarden Parametern. Es generiert Echtzeit-Welten in 720p-Auflösung bei 24 Bildern pro Sekunde. Das Modell lernt aus unbeschrifteten Internetvideos.
Die Erkundung jeder generierten Welt ist auf 60 Sekunden begrenzt. „World Memory“ sorgt für Konsistenz von Umgebung und Aktionen, „Promptable Events“ ermöglicht das Hinzufügen neuer Ereignisse während der Nutzung.
Verfügbarkeit und Zugang
Project Genie steht Google AI Ultra-Abonnenten zur Verfügung. Das Abonnement kostet 249,99 US-Dollar pro Monat. Die Street-View-Funktion ist zunächst nur für US-Standorte verfügbar, eine internationale Erweiterung ist geplant.
Anwendungsfelder
Genie 3 wurde primär für das Training verkörperter KI-Agenten und Roboter entwickelt. Es generiert vielfältige Trainingsszenarien, einschließlich seltener Ereignisse. Googles Tochterunternehmen Waymo setzt das Modell ein, um autonome Fahrzeuge auf extrem seltene Verkehrssituationen vorzubereiten.
Weitere Einsatzbereiche liegen in immersiven Simulationen für Gaming, Reisevisualisierung und der KI-Forschung auf dem Weg zur AGI.
Quelle: TechCrunch AI
FAQ
Welche Auflösung und Bildrate erreicht Genie 3? Genie 3 generiert Welten in 720p bei 24 Bildern pro Sekunde.
Gibt es eine zeitliche Begrenzung pro simulierter Welt? Ja, die Erkundung ist auf 60 Sekunden pro Welt beschränkt.
Für wen ist Project Genie mit Street-View-Integration verfügbar? Für berechtigte Google AI Ultra-Abonnenten ab 18 Jahren, zunächst mit Fokus auf US-Standorte.