Google forme une nouvelle équipe pour créer une IA capable de simuler le monde physique

Google vient de former une nouvelle équipe pour travailler sur des modèles d’IA capables de simuler le monde physique.

Une équipe qui va collaborer avec celle de Gemini

Tim Brooks, l’un des co-responsables du générateur vidéo d’OpenAI, Sora, qui a rejoint le laboratoire de recherche en IA de Google , «Google DeepMind», en octobre, dirigera la nouvelle équipe, a-t-il annoncé dans un post sur X. Elle fera partie de Google DeepMind.

« DeepMind a des projets ambitieux pour créer des modèles génératifs massifs qui simulent le monde. Je recrute une nouvelle équipe avec cette mission » a écrit Brooks.

Cette nouvelle équipe de modélisation collaborera avec celles de Gemini , Veo et Genie de Google et s’appuiera sur leurs travaux pour s’attaquer à de « nouveaux problèmes critiques » et faire évoluer les modèles « jusqu’aux plus hauts niveaux de calcul ». Gemini est la série phare de modèles d’IA de Google pour des tâches telles que l’analyse d’images et la génération de texte, tandis que Veo est le modèle de génération vidéo de Google.

Le futur de l’intelligence artificielle

Quant à Genie, il s’agit de la version de Google d’un modèle mondial : une IA capable de simuler des jeux et des environnements 3D en temps réel. Le dernier modèle Genie de Google , présenté en avant-première en décembre, peut même générer une grande variété de mondes 3D jouables.

« Nous pensons que la mise à l’échelle sur des données vidéo et multimodales est sur la voie critique vers l’intelligence artificielle générale », peut-on lire dans l’une des descriptions de poste.

L’intelligence artificielle générale, ou AGI, fait généralement référence à l’IA capable d’accomplir n’importe quelle tâche qu’un humain peut accomplir. « Les modèles du monde alimenteront de nombreux domaines, tels que le raisonnement visuel et la simulation, la planification d’agents et le divertissement interactif en temps réel ».

En outre, la nouvelle équipe de Brooks cherchera à développer des outils de « génération interactive en temps réel » sur la base des modèles qu’ils construisent et étudiera comment intégrer leurs modèles aux modèles multimodaux existants tels que Gemini.

De nombreuses startups et grandes entreprises technologiques se lancent à la poursuite de modèles similaires. Ces derniers seraient à terme, capables de créer des médias interactifs, comme des jeux vidéo, des films, et exécuter des simulations réalistes comme des environnements de formation pour les robots.

Néanmoins, certaines startups du secteur naissant de la modélisation, comme Odyssey, se sont engagées à collaborer avec des professionnels créatifs, et non à les remplacer. Il faudra voir si Google suit le mouvement.

 

Articles récents

Les plus lus

A lire également