Nouvelle percée en intelligence incarnée : AutoNavi ouvre en source intégrale son modèle de base universel pour robots ABot-M0

marsbitPublié le 2026-04-01Dernière mise à jour le 2026-04-01

Résumé

Le domaine de l'intelligence incarnée atteint un jalon majeur. Gaode a annoncé aujourd'hui la mise en open source complète d'ABot-M0, le premier modèle de base unifié pour robots dotés d'un corps. Ce modèle vise à créer « un cerveau universel adaptable à divers types de robots », dans le but de briser les barrières entre les matériels hétérogènes et d'accélérer le déploiement de l'intelligence incarnée des laboratoires vers les scénarios industriels et domestiques. ABot-M0 a démontré des performances exceptionnelles lors de tests de référence, atteignant un taux de réussite de 80,5% sur le benchmark Libero-Plus, soit une amélioration de près de 30% par rapport au modèle précédent Pi0. Il a également établi de nouveaux records sur Libero et RoboCasa. L'open source complet couvre trois dimensions clés : les données, les algorithmes et les modèles. Gaode libère UniACT, le plus grand ensemble de données pour robots, contenant plus de 6 millions de trajectoires d'opération réelles. Les algorithmes innovants, tels que l'apprentissage de variété d'actions (AML) et l'architecture de perception à double flux, sont également divulgués. Enfin, des modèles pré-entraînés et des outils complets sont fournis pour permettre une utilisation immédiate. Cette initiative vise à résoudre les problèmes de « silos de données » et de « difficultés de déploiement », servant de pont entre la recherche académique et les applications industrielles, afin que chaque robot puisse posséder un « cerveau »...

Le domaine de l'intelligence incarnée connaît une avancée majeure. AutoNavi a officiellement annoncé aujourd'hui l'ouverture en source intégrale du premier modèle de base opérationnel pour robots incarnés au monde basé sur une architecture unifiée, ABot-M0. Ce modèle a pour objectif principal de réaliser "un cerveau universel adaptable à diverses morphologies de robots", visant à briser les barrières entre les matériels hétérogènes et à accélérer le passage de l'intelligence incarnée du laboratoire aux scénarios industriels et domestiques.

Technologie clé et performances

ABot-M0 a démontré des performances exceptionnelles dans plusieurs tests de référence de l'industrie. Les données montrent que le modèle atteint un taux de réussite de 80,5 % sur le benchmark Libero-Plus, soit une amélioration de près de 30 % par rapport à la solution de référence précédente, Pi0. De plus, il a établi de nouveaux records SOTA (state-of-the-art) dans des tests comme Libero et RoboCasa.

Ouverture en source intégrale sur trois dimensions

Pour résoudre les problèmes de longue date de "silos de données" et de "difficultés de déploiement" dans le domaine de l'intelligence incarnée, l'ouverture d'AutoNavi couvre trois dimensions : les données sous-jacentes, les algorithmes clés et les modèles pré-entraînés :

  • Niveau des données : Ouverture du plus grand ensemble de données universel pour robots, UniACT. Cet ensemble intègre plus de 6 millions de trajectoires opérationnelles réelles et fournit un pipeline complet de traitement des données hétérogènes aux données d'entraînement standardisées.

  • Niveau des algorithmes : Publication simultanée de l'architecture du modèle et du cadre d'entraînement. Les points forts incluent l'algorithme innovant d'apprentissage de variété d'actions (AML - Action Manifold Learning) et l'architecture de perception à double flux d'AutoNavi, dotant les robots de capacités exceptionnelles de compréhension spatiale et d'exécution d'actions.

  • Niveau des modèles : Fourniture de modèles pré-entraînés de bout en bout et d'une chaîne d'outils complète. Les développeurs peuvent les utiliser "prêts à l'emploi", sans avoir à construire un framework à partir de zéro, réduisant ainsi considérablement le seuil d'adaptation aux robots collaborateurs industriels ou aux robots domestiques.

Impact sur l'industrie

Le responsable technique d'ABot-M0 chez AutoNavi a déclaré qu'une véritable intelligence incarnée universelle nécessite la collaboration des développeurs du monde entier. L'ouverture d'ABot-M0 n'est pas seulement un partage technologique, mais vise également à construire un pont reliant la recherche académique et les applications industrielles, afin que chaque robot, quelle que soit sa morphologie, puisse posséder un "cerveau" intelligent, fiable et universel.

Questions liées

QQuel est le nom du nouveau modèle de base de robotique open-source annoncé par AutoNavi et quel est son objectif principal ?

ALe modèle s'appelle ABot-M0. Son objectif principal est de réaliser 'un cerveau universel adapté à de multiples formes de robots', visant à briser les barrières entre les matériels hétérogènes.

QQuelle performance le modèle ABot-M0 a-t-il atteinte sur le benchmark Libero-Plus, et comment se compare-t-il au modèle Pi0 ?

ALe modèle ABot-M0 a atteint un taux de réussite de 80,5% sur le benchmark Libero-Plus, ce qui représente une amélioration de près de 30% par rapport au modèle Pi0.

QQuels sont les trois volets de l'open-source complet fourni par AutoNavi pour le projet ABot-M0 ?

ALes trois volets sont : 1) La couche de données (avec le jeu de données UniACT), 2) La couche algorithmique (incluant l'architecture et le cadre d'entraînement), et 3) La couche modèle (modèles pré-entraînés et chaîne d'outils complète).

QQuel est le nom de l'ensemble de données ouvertes et quelle est sa taille ?

AL'ensemble de données ouvert s'appelle UniACT. Il intègre plus de 6 millions de trajectoires d'opération réelles.

QQuels sont les deux éléments algorithmiques clés mis en avant qui confèrent au robot ses capacités ?

ALes deux éléments algorithmiques clés sont l'algorithm d'apprentissage de variété d'actions (Action Manifold Learning - AML) et l'architecture de perception à double flux (Dual-stream Perception Architecture).

Lectures associées

Analyse détaillée de 10 000 mots : De 10 $ à 290 $, MRVL a gagné toute l'ère de l'IA en « ne faisant pas de GPU »

**Marvell Technology : de 10 à 290 dollars grâce à la « connectivité » de l'IA** Le parcours de Marvell (MRVL), dont le cours a été multiplié par 30 depuis 2016, repose sur une stratégie unique : se concentrer sur la **connectivité des données** dans l'infrastructure IA, plutôt que sur les GPU. L'entreprise s'est transformée sous la direction du PDG Matt Murphy en abandonnant les activités périphériques pour se recentrer sur le datacenter via des acquisitions clés (Inphi, Cavium, Celestial AI). Son activité principale est divisée en trois piliers : 1. **L'interconnexion optique** : Avec 70% de parts de marché dans les DSP pour modules optiques haut débit (>400G), c'est son principal avantage concurrentiel. La demande explose avec l'expansion des grappes d'IA. 2. **Les puces IA sur mesure** : Marvell conçoit et produit des accélérateurs (XPU) pour les hyperscalers comme Amazon (Trainium), Microsoft et Google. Malgré des marges plus faibles, ce segment affiche une forte croissance (750 milliards de dollars de pipeline). 3. **Les commutateurs Ethernet et le stockage** : Des activités traditionnelles qui génèrent des flux de trésorerie stables. L'analyse souligne que Marvell n'est pas un « petit Broadcom ». Sa valeur réside dans son positionnement unique dans l'écosystème de l'IA. L'investissement stratégique de 20 milliards de dollars de NVIDIA en 2026 valide ce rôle : Marvell connecte à la fois les puces personnalisées des géants du cloud et l'infrastructure réseau de NVIDIA (via NVLink Fusion), profitant des deux côtés. Les risques existent : perte partielle de contrats (Trainium3), concentration clientèle, marges structurellement inférieures à Broadcom, et ventes d'actions par les dirigeants. Cependant, le potentiel semble solide. Le ratio PEG d'environ 0,6 (basé sur une croissance des revenus attendue à ~40%) offre une marge de sécurité, et le monopole de fait dans les DSP optiques, renforcé par les technologies d'interconnexion photonique (Celestial AI), constitue un fossé concurrentiel durable. En définitive, la réussite de Marvell illustre un principe fondamental : à l'ère de l'IA, la **valeur des « connexions »** qui permettent aux données de circuler à la vitesse de la lumière finit par surpasser celle des « nœuds » de calcul eux-mêmes.

marsbitIl y a 21 mins

Analyse détaillée de 10 000 mots : De 10 $ à 290 $, MRVL a gagné toute l'ère de l'IA en « ne faisant pas de GPU »

marsbitIl y a 21 mins

La station relais IA déclenche un vif débat sur Zhihu : derrière les tokens bon marché, quelles sont les vraies inquiétudes des utilisateurs ?

Une question sur Zhihu concernant les stations relais d'IA a mis en lumière le thème des "jetons (Tokens) bon marché", suscitant un vif débat au-delà de la simple dichotomie "légal ou illégal". Les discussions ont porté sur des préoccupations concrètes : la provenance de ces jetons, l'authenticité des modèles utilisés, la confidentialité des données (prompts, codes, clés API) et l'évaluation réelle du risque pour les utilisateurs occasionnels. L'inquiétude principale ne porte pas uniquement sur le prix, mais sur la fiabilité. Les utilisateurs redoutent que les modèles annoncés ne soient pas ceux réellement utilisés ("détournement de modèle"), une fraude difficile à détecter en raison de la variabilité naturelle des réponses des grands modèles de langage (LLM). Cela transforme l'avantage tarifaire en une transaction à l'information asymétrique. Les discussions ont également nuancé l'idée de "bon marché", soulignant que la comparaison doit se faire avec les abonnements officiels, les modèles nationaux chinois ou les quotas gratuits, et non seulement avec l'API officielle au paiement à l'usage. Le prix bas peut provenir de sources variées, allant d'optimisations techniques légitimes (achats groupés, cache) à des pratiques grises (partage de comptes, exploitation de différences tarifaires régionales). Le débat a rapidement évolué vers la sécurité des données, un enjeu critique pour les usages professionnels (code propriétaire, documents commerciaux, données clients). Transmettre ces informations sensibles via un relais opaque pose des risques de fuite et des problèmes de conformité, notamment dans les scénarios d'agents IA pouvant exécuter des actions. Le consensus qui se dégage est que ces services peuvent être utilisés avec prudence pour des tâches non sensibles (résumés, traduction simple, tests). Cependant, ils ne doivent pas être l'entrée par défaut, surtout pour les données sensibles ou les flux de production. Les recommandations incluent : ne pas faire de gros dépôts, diversifier ses fournisseurs, tester régulièrement la qualité des modèles, anonymiser les données lorsque c'est possible et éviter d'intégrer ces relais dans les systèmes critiques d'entreprise. En somme, cette discussion révèle que le coût réel de l'utilisation de l'IA ne se résume pas au prix du jeton. Il inclut la confiance, l'authenticité du modèle, la stabilité du service et les risques pour la sécurité des données. Alors que l'accès à l'IA se démocratise, la transparence sur la provenance des modèles et le traitement des données devient primordiale.

marsbitIl y a 56 mins

La station relais IA déclenche un vif débat sur Zhihu : derrière les tokens bon marché, quelles sont les vraies inquiétudes des utilisateurs ?

marsbitIl y a 56 mins

La Blockchain Association Exhorte le Sénat à Adopter la Loi CLARITY avec une Lettre Soutenue par 160 Anciens Responsables

L'Association Blockchain, un groupe de pression majeur de l'industrie, a exhorté le Sénat américain à adopter la loi CLARITY dans une lettre signée par 160 anciens responsables de la sécurité nationale, des renseignements et des forces de l'ordre. Ils soutiennent qu'en l'absence d'un cadre fédéral clair, les activités liées aux crypto-monnaies pourraient continuer à migrer vers des marchés opaques, rendant plus difficile la lutte contre la criminalité financière pour les autorités américaines. La lettre souligne que la loi CLARITY renforcerait les capacités des forces de l'ordre en étendant les obligations de lutte contre le financement illicite (notamment via le *Bank Secrecy Act*), en améliorant le partage d'informations entre le Trésor, le ministère de la Justice, le FBI et le secteur privé, et en instaurant des garanties pour les kiosques d'actifs numériques (surveillance des transactions, limites, lutte contre la fraude). L'association insiste sur le fait qu'il s'agit de mesures d'amélioration de l'application de la loi, et non de dérégulation. Un vote complet au Sénat est attendu cet été, après l'avancée du texte en commission. Cependant, même en cas d'approbation par le Sénat, le projet de loi devra encore être réconcilié avec une version différente adoptée par la Chambre des représentants à l'automne dernier.

bitcoinistIl y a 1 h

La Blockchain Association Exhorte le Sénat à Adopter la Loi CLARITY avec une Lettre Soutenue par 160 Anciens Responsables

bitcoinistIl y a 1 h

Bloqué par sa propre plateforme, l'IA de WeChat entre en scène

En juin, une forte hausse boursière de Tencent a été déclenchée par des rumeurs concernant le test final d'un agent IA natif intégré à WeChat, qui serait accessible par un simple glissement vers la droite sur l'interface principale. Ce développement intervient après plus d'un an de débats internes sur la stratégie IA, accélérés par le blocage en février 2026 par WeChat de sa propre application "Yuanbao" pour violation des règles de partage, révélant un manque de consensus initial. L'agent IA de WeChat se distingue des produits existants comme Yuanbao. Il vise non pas le dialogue, mais l'exécution de tâches en appelant directement les mini-programmes et WeChat Pay, permettant ainsi des actions comme réserver, commander ou payer par commande vocale. Son atout majeur est d'activer les 1,4 milliard d'utilisateurs existants de WeChat sans téléchargement, en s'appuyant sur l'écosystème mature des mini-programmes (interfaces standardisées) et du système d'identité/paiement. Cette initiative est une réponse stratégique à la concurrence. Des rivaux comme Doubao (ByteDance) et Qianwen (Alibaba) progressent dans la connexion des services et l'exécution, tandis que la croissance de WeChat ralentit. L'agent IA vise à retenir l'intention des utilisateurs au sein de WeChat, transformant la plateforme d'un outil de communication en un assistant capable d'accomplir des tâches. Cependant, des défis subsistent : la performance du modèle maison Hunyuan, les coûts de calcul élevés pour 1,4 milliard d'utilisateurs, et surtout, la nécessaire redéfinition des incitations pour les millions de développeurs de mini-programmes dont le modèle économique pourrait être perturbé par un accès direct via l'IA. Le succès dépendra de la capacité de Tencent à naviguer dans cette complexité écologique tout en maintenant la confiance des partenaires.

marsbitIl y a 1 h

Bloqué par sa propre plateforme, l'IA de WeChat entre en scène

marsbitIl y a 1 h

Trading

Spot
Futures
活动图片