Nouvelle percée en intelligence incarnée : AutoNavi ouvre en source intégrale son modèle de base universel pour robots ABot-M0

marsbitPublié le 2026-04-01Dernière mise à jour le 2026-04-01

Résumé

Le domaine de l'intelligence incarnée atteint un jalon majeur. Gaode a annoncé aujourd'hui la mise en open source complète d'ABot-M0, le premier modèle de base unifié pour robots dotés d'un corps. Ce modèle vise à créer « un cerveau universel adaptable à divers types de robots », dans le but de briser les barrières entre les matériels hétérogènes et d'accélérer le déploiement de l'intelligence incarnée des laboratoires vers les scénarios industriels et domestiques. ABot-M0 a démontré des performances exceptionnelles lors de tests de référence, atteignant un taux de réussite de 80,5% sur le benchmark Libero-Plus, soit une amélioration de près de 30% par rapport au modèle précédent Pi0. Il a également établi de nouveaux records sur Libero et RoboCasa. L'open source complet couvre trois dimensions clés : les données, les algorithmes et les modèles. Gaode libère UniACT, le plus grand ensemble de données pour robots, contenant plus de 6 millions de trajectoires d'opération réelles. Les algorithmes innovants, tels que l'apprentissage de variété d'actions (AML) et l'architecture de perception à double flux, sont également divulgués. Enfin, des modèles pré-entraînés et des outils complets sont fournis pour permettre une utilisation immédiate. Cette initiative vise à résoudre les problèmes de « silos de données » et de « difficultés de déploiement », servant de pont entre la recherche académique et les applications industrielles, afin que chaque robot puisse posséder un « cerveau »...

Le domaine de l'intelligence incarnée connaît une avancée majeure. AutoNavi a officiellement annoncé aujourd'hui l'ouverture en source intégrale du premier modèle de base opérationnel pour robots incarnés au monde basé sur une architecture unifiée, ABot-M0. Ce modèle a pour objectif principal de réaliser "un cerveau universel adaptable à diverses morphologies de robots", visant à briser les barrières entre les matériels hétérogènes et à accélérer le passage de l'intelligence incarnée du laboratoire aux scénarios industriels et domestiques.

Technologie clé et performances

ABot-M0 a démontré des performances exceptionnelles dans plusieurs tests de référence de l'industrie. Les données montrent que le modèle atteint un taux de réussite de 80,5 % sur le benchmark Libero-Plus, soit une amélioration de près de 30 % par rapport à la solution de référence précédente, Pi0. De plus, il a établi de nouveaux records SOTA (state-of-the-art) dans des tests comme Libero et RoboCasa.

Ouverture en source intégrale sur trois dimensions

Pour résoudre les problèmes de longue date de "silos de données" et de "difficultés de déploiement" dans le domaine de l'intelligence incarnée, l'ouverture d'AutoNavi couvre trois dimensions : les données sous-jacentes, les algorithmes clés et les modèles pré-entraînés :

  • Niveau des données : Ouverture du plus grand ensemble de données universel pour robots, UniACT. Cet ensemble intègre plus de 6 millions de trajectoires opérationnelles réelles et fournit un pipeline complet de traitement des données hétérogènes aux données d'entraînement standardisées.

  • Niveau des algorithmes : Publication simultanée de l'architecture du modèle et du cadre d'entraînement. Les points forts incluent l'algorithme innovant d'apprentissage de variété d'actions (AML - Action Manifold Learning) et l'architecture de perception à double flux d'AutoNavi, dotant les robots de capacités exceptionnelles de compréhension spatiale et d'exécution d'actions.

  • Niveau des modèles : Fourniture de modèles pré-entraînés de bout en bout et d'une chaîne d'outils complète. Les développeurs peuvent les utiliser "prêts à l'emploi", sans avoir à construire un framework à partir de zéro, réduisant ainsi considérablement le seuil d'adaptation aux robots collaborateurs industriels ou aux robots domestiques.

Impact sur l'industrie

Le responsable technique d'ABot-M0 chez AutoNavi a déclaré qu'une véritable intelligence incarnée universelle nécessite la collaboration des développeurs du monde entier. L'ouverture d'ABot-M0 n'est pas seulement un partage technologique, mais vise également à construire un pont reliant la recherche académique et les applications industrielles, afin que chaque robot, quelle que soit sa morphologie, puisse posséder un "cerveau" intelligent, fiable et universel.

Questions liées

QQuel est le nom du nouveau modèle de base de robotique open-source annoncé par AutoNavi et quel est son objectif principal ?

ALe modèle s'appelle ABot-M0. Son objectif principal est de réaliser 'un cerveau universel adapté à de multiples formes de robots', visant à briser les barrières entre les matériels hétérogènes.

QQuelle performance le modèle ABot-M0 a-t-il atteinte sur le benchmark Libero-Plus, et comment se compare-t-il au modèle Pi0 ?

ALe modèle ABot-M0 a atteint un taux de réussite de 80,5% sur le benchmark Libero-Plus, ce qui représente une amélioration de près de 30% par rapport au modèle Pi0.

QQuels sont les trois volets de l'open-source complet fourni par AutoNavi pour le projet ABot-M0 ?

ALes trois volets sont : 1) La couche de données (avec le jeu de données UniACT), 2) La couche algorithmique (incluant l'architecture et le cadre d'entraînement), et 3) La couche modèle (modèles pré-entraînés et chaîne d'outils complète).

QQuel est le nom de l'ensemble de données ouvertes et quelle est sa taille ?

AL'ensemble de données ouvert s'appelle UniACT. Il intègre plus de 6 millions de trajectoires d'opération réelles.

QQuels sont les deux éléments algorithmiques clés mis en avant qui confèrent au robot ses capacités ?

ALes deux éléments algorithmiques clés sont l'algorithm d'apprentissage de variété d'actions (Action Manifold Learning - AML) et l'architecture de perception à double flux (Dual-stream Perception Architecture).

Lectures associées

Wall Street connaît sa pire chute depuis 2025, la réévaluation des valorisations des actions technologiques déclenchée par trois catalyseurs

Le marché boursier américain a subi son pire effondrement depuis 2025 le 5 juin, avec le Nasdaq chutant de 4,18 %. Trois facteurs principaux ont déclenché cette vente massive, en particulier dans les actions technologiques. Premièrement, les perspectives trimestrielles de Broadcom concernant ses revenus liés aux puces IA, bien qu'en forte croissance, ont été inférieures aux attentes les plus optimistes. Cela a semé le doute sur le rythme de croissance exponentielle de l'IA, conduisant à une forte correction dans tout le secteur des semi-conducteurs. Deuxièmement, des données sur l'emploi américain bien plus solides que prévu ont renforcé les craintes que la Réserve fédérale (Fed) ne se contente pas de reporter les baisses de taux, mais pourrait même envisager de les augmenter. Cette hausse des taux d'intérêt pèse sur la valorisation des actions de croissance. Troisièmement, l'ombre persistante de l'inflation, alimentée par la guerre en Iran et des prix du pétrole élevés, limite la marge de manœuvre de la Fed. Ces trois éléments combinés ont ébranlé simultanément les récits de "croissance illimitée de l'IA", de "politique monétaire accommodante" et d'"inflation maîtrisée". Il s'agit davantage d'une réévaluation sévère des valorisations que d'un effondrement du récit de l'IA. Les prochaines décisions de la Fed, les résultats des entreprises technologiques et l'évolution de la situation géopolitique seront déterminants pour la suite du marché.

marsbitIl y a 3 h

Wall Street connaît sa pire chute depuis 2025, la réévaluation des valorisations des actions technologiques déclenchée par trois catalyseurs

marsbitIl y a 3 h

Du Madison Square Garden à Kalshi : les marchés prédictifs font irruption dans les Finales NBA

**De Madison Square Garden à Kalshi : Les marchés de prédiction font irruption dans les finales NBA** Les Knicks de New York, menant 2-0 en finale NBA contre les Spurs, ont déclenché une ferveur historique. Cette série, l'une des plus chères à voir en direct, voit également l'émergence des marchés de prédiction comme acteurs majeurs. Des plateformes comme Kalshi (partenaire officiel du Madison Square Garden) et Polymarket ont enregistré des volumes de transactions énormes sur l'issue des finales. Leur influence dépasse le monde en ligne. Un bar new-yorkais, The Jeffrey, a utilisé un contrat Kalshi pour couvrir le risque d'une promotion "consommation gratuite si les Knicks gagnent", montrant l'utilité de ces marchés comme outils de gestion de risque pour les entreprises. Cette approche rappelle celle de "Mattress Mack", qui utilisait les paris sportifs traditionnels pour couvrir des promotions similaires. Cependant, les marchés de prédiction étendent les possibilités en proposant des contrats sur des événements très variés (présence de célébrités, données précises...), accessibles dans plus d'États américains et à des utilisateurs plus jeunes que les paris sportifs classiques, ce qui soulève des questions réglementaires. La NBA adopte une position prudente. Si elle discute de cadres de régulation avec les autorités, elle permet à des joueurs comme Giannis Antetokounmpo d'investir symboliquement dans Kalshi. Cependant, de nombreux fans expriment, notamment sur Reddit, des craintes concernant l'intégrité du jeu et les conflits d'intérêts potentiels. Les finales NBA servent ainsi de test crucial pour l'avenir des marchés de prédiction dans le sport professionnel.

marsbitIl y a 5 h

Du Madison Square Garden à Kalshi : les marchés prédictifs font irruption dans les Finales NBA

marsbitIl y a 5 h

Anthropic met en garde le monde, OpenAI a franchi le "seuil de fiabilité" : l'auto-accélération de l'IA est lancée

Anthropic émet un avertissement mondial sur les risques de l'IA, tandis qu'OpenAI affirme avoir franchi un seuil critique de fiabilité, déclenchant une auto-accélération du développement de l'IA. Selon Anthropic, les progrès vers une auto-amélioration récursive de l'IA sont plus rapides que prévu, conduisant à un appel à un ralentissement des recherches. De son côté, Yann Dubois d'OpenAI révèle que la croissance des capacités de l'IA est linéaire, mais que son utilité perçue fait un bond discret une fois le "seuil de fiabilité" franchi, ce qu'OpenAI aurait atteint vers décembre dernier. Dès lors, l'IA devient un outil de travail fiable et commence à s'auto-accélérer en aidant notamment à la recherche et au développement. Dubois compare la construction de l'IA à un "artisanat" ou une "alchimie" plus qu'à une science pure. Il souligne également le potentiel des systèmes de "Harness" (systèmes d'orchestration) dans des domaines verticaux, affirmant qu'ils pourraient déjà donner un avant-goût d'AGI (Intelligence Générale Artificielle) en comblant le dernier kilomètre : l'intégration, l'accès aux données et la connexion aux workflows métier. Le vrai défi réside désormais dans l'apprentissage continu pour que l'IA puisse s'améliorer avec l'expérience, au lieu de stagner après son déploiement initial.

marsbitIl y a 5 h

Anthropic met en garde le monde, OpenAI a franchi le "seuil de fiabilité" : l'auto-accélération de l'IA est lancée

marsbitIl y a 5 h

Trading

Spot
Futures
活动图片