D'une table de déjeuner à un univers infini : Fei-Fei Li parie sur la prochaine dimension de l'IA
500 000 ans, c’est l’âge du langage humain dans l’histoire de l’évolution. 540 millions d’années, c’est l’origine de l’explosion cambrienne, déclenchée par la perception visuelle et spatiale. Alors que les meilleurs labos de la Silicon Valley se concentraient sur les modèles linguistiques en 2025-2026, Fei-Fei Li, professeure à Stanford et fondatrice de World Labs, a souligné à plusieurs reprises une question cruciale : une IA qui ne sait que parler et regarder des images ne « comprendra » jamais vraiment le monde.
Dans trois entretiens clés, elle a systématiquement défendu l’idée que l’intelligence spatiale (Spatial Intelligence) est la nouvelle frontière de l’IA. Le langage, récent à l’échelle de l’évolution, est un encodage du monde avec perte d’information. Les modèles linguistiques actuels, bien que puissants, échouent à des tâches spatiales simples comme compter des chaises dans une vidéo ou déduire des lois physiques à partir de données.
Pour matérialiser cette vision, World Labs a développé Marble, son premier modèle générant des mondes 3D navigables et interactifs à partir de texte, d’images ou de vidéos. Contrairement aux générateurs de vidéo comme Sora, Marble produit des environnements avec une structure géométrique cohérente. Bien que son échelle de calcul soit bien inférieure à celle des grands modèles linguistiques comme le GPT-5, Marble a déjà trouvé des applications pratiques : développement de jeux, production cinématographique (réduisant les délais par 40), entraînement de robots, design d’intérieur, et même création d’environnements thérapeutiques personnalisés pour des troubles comme les TOC ou l’acrophobie.
Fei-Fei Li évoque le potentiel de cette technologie à créer des « univers infinis » – pour la créativité, la socialisation, le voyage ou la narration – permettant à l’humanité de vivre dans un multivers numérique. Cependant, elle appelle à une vision responsable, rejetant à la fois l’utopisme technologique et les discours apocalyptiques. Pour elle, le succès de l’IA, comme celui de l’électricité en son temps, doit se mesurer à sa capacité à améliorer la civilisation et à préserver la dignité et l’autonomie de chaque individu.
Son raisonnement s’appuie sur l’évolution : la perception précède le langage, l’espace précède le symbole. Le développement de l’intelligence spatiale n’est pas une simple itération technologique, mais une reprise accélérée de cette trajectoire évolutive, condensant en quelques années des centaines de millions d’années d’évolution naturelle.
marsbit05/27 00:19