L'équipe Deepmind de Google a dévoilé Project Genie, une application web, reposant sur les modèles Gemini, Genie 3 et Nano Banana Pro, qui donne la capacité aux utilisateurs de créer des environnements 3D dynamiques et interactifs. « Genie 3 génère le chemin à suivre en temps réel pendant que vous vous déplacez et interagissez avec le monde », explique le fournisseur. « Il simule la physique et les interactions pour des mondes dynamiques, tandis que sa cohérence permet la simulation de n'importe quel scénario réel, de la robotique et la modélisation d'animations et de fictions à l'exploration de lieux et de décors historiques. » Pour l'instant l'initiative est réservée aux abonnés AI Ultra aux États-Unis mais doit être lancé dans d'autres pays prochainement.
Google met en avant trois fonctionnalités principales du projet:
- Création du monde. Via des prompts et des images générées ou insérées, l'utilisateur créé un environnement vivant en constante évolution. « Créez votre personnage, votre monde, et définissez comment vous souhaitez l'explorer : à pied, à cheval, en volant, en conduisant, ou de toute autre manière », indique l'éditeur ;
- Exploration du monde. Le monde créé peut être exploré en temps réel : au fur et à mesure le chemin à suivre est géné éen temps réel en fonction des actions de l'utilisateur et l'angle de caméra peut être ajusté dynamiquement ;
- Remixage de monde. Google indique qu'il est possible de télécharger des vidéos des mondes créés et de les réutiliser pour en créer d'autres.
A ce stade, Genie se présente comme un prototype de recherche expérimental et, s'il semble ludique au premier abord, trouver un véritable intérêt à la création de ces mondes reste encore à démontrer. « Comme pour tous nos travaux sur les systèmes IA, notre mission consiste à développer l'IA de manière responsable afin qu'elle profite à l'humanité », indique modestement Google. Et d'admettre : « Les mondes générés peuvent ne pas sembler tout à fait réalistes ou ne pas toujours correspondre exactement aux instructions ou aux images, ni à la physique du monde réel ; les personnages peuvent parfois être moins contrôlables ou présenter une latence plus importante dans leur contrôle ; la durée des générations est limitée à 60 secondes. »

Commentaire