Un vieux rival de Unitree, Zhiyuan, a de nouveau fait éclater une entreprise.
Alors que MeeBee Technology annonce avoir complété un financement stratégique de centaines de millions de yuans en série angel+, cette société de données initiée par Zhiyuan refait surface. Après la société de mains agiles Critical Point, Zhiyuan a de nouveau séparé une compétence clé pour en faire une entreprise indépendante, s'engageant sur la voie du financement et de l'exploitation autonomes.
Lorsqu'on évoque Zhiyuan, beaucoup pensent instinctivement à son principal rival, Unitree.
Après tout, rien qu'en 2025, Unitree a réalisé des ventes réelles de plus de 5500 robots humanoïdes purs, se proclamant numéro un mondial en volume de ventes ; en mars de cette année, Zhiyuan a annoncé la production de son 10 000ème robot généraliste à incarnation physique.
Des volumes de production à la commercialisation, les deux parties sont toujours comparées.
Et cette fois, en tant que l'un des concurrents les plus directs de Unitree, Zhiyuan étend ses atouts compétitifs au-delà du robot lui-même.
Parce que MeeBee Technology, séparée de Zhiyuan, s'occupe justement de l'une des activités les plus en vogue dans l'intelligence incarnée : la collecte, la gouvernance et la circulation des données. Son objectif est également ambitieux : atteindre une capacité de production de données de l'ordre de dix millions d'heures d'ici 2026.
Les modèles de base, la puissance de calcul, le matériel, ces termes liés à l'intelligence incarnée, nous les entendons souvent. Mais beaucoup ne réalisent peut-être pas que l'importance des "données" dans l'industrie de l'intelligence incarnée augmente rapidement.
Même Peng Zhihui, co-fondateur, président et CTO de Zhiyuan, a précédemment déclaré sans détour que Zhiyuan ne manquait pas d'argent, mais manquait actuellement davantage de données.
Derrière le manque de données de Zhiyuan, c'est toute l'industrie de l'intelligence incarnée qui traverse une "famine de données" pas encore perçue par la plupart des gens, mais pourtant très urgente.
Quelque chose de plus important que la puissance de calcul commence à émerger
À l'ère de l'intelligence incarnée, l'importance des données se rapproche de celle de la puissance de calcul à l'ère des grands modèles.
Les grands modèles apprennent principalement du monde Internet, les robots doivent apprendre du monde physique. Les premiers peuvent obtenir des données d'entraînement à partir de pages web, de livres et d'articles, les seconds doivent saisir une tasse, pousser une porte, plier des vêtements pour comprendre les actions et les retours dans l'environnement réel.
Ce dont les robots ont besoin, outre les informations visuelles, inclut des informations multimodales comme le toucher, la force, les trajectoires de mouvement, etc. Pour les données de haute qualité issues de robots physiques, chaque donnée correspond souvent à une interaction physique réelle.
Selon les estimations de MeeBee lors de la conférence de presse, les corpus nécessaires pour entraîner un système de niveau GPT-5 atteignent l'ordre de dizaines de milliards d'heures, tandis que les données efficaces de haute qualité disponibles globalement pour l'entraînement de l'intelligence incarnée ne sont qu'environ 500 000 heures.
D'autre part, le rapport "AI Index 2026" publié par Stanford HAI cite deux résultats très disparates : le taux de réussite maximum des robots sur le benchmark de manipulation en simulation RLBench atteint 89,4% ; sur le benchmark de simulation BEHAVIOR-1K, plus complexe et orienté vers les besoins réels des foyers, le taux de réussite complet des tâches n'est que de 12,4% au maximum.
Ces résultats proviennent de benchmarks différents, mais ils montrent au moins que les robots progressent rapidement dans des tâches courtes et contrôlées, mais que leurs capacités restent nettement insuffisantes face aux tâches domestiques complexes.
Le manque de données d'entraînement de haute qualité et diversifiées est l'une des raisons importantes.
En d'autres termes, les lacunes des robots d'aujourd'hui proviennent en grande partie du fait qu'ils ont encore vu trop peu du monde réel.
C'est pourquoi l'industrie émergente de la collecte de données pour l'intelligence incarnée commence à se développer rapidement.
La méthode la plus courante actuellement est la téléopération par robot physique, où un opérateur humain contrôle à distance le robot pour accomplir une tâche, puis enregistre les informations visuelles, les actions et l'état pendant l'exécution. La qualité des données est relativement élevée, mais le coût n'est pas faible.
Yao Maoqing, CEO de MeeBee, a précédemment indiqué que le prix d'une heure de données de robot physique en Chine se situe généralement entre 500 et 1000 yuans, nécessitant en plus la coordination du robot, de l'opérateur et du scénario, ce qui limite la vitesse d'expansion.
Une autre voie est celle des données de simulation. Les entreprises utilisent le jumeau numérique et les moteurs physiques pour faire accomplir au robot de nombreuses tâches d'entraînement dans un environnement virtuel, ce qui peut réduire les coûts de collecte. Mais les compétences apprises par le robot dans le monde virtuel peuvent ne pas se transférer complètement au monde réel, c'est le "fossé Sim-to-Real" auquel l'industrie est confrontée depuis longtemps.
Après la collecte des données, des problèmes plus fondamentaux subsistent.
Différentes entreprises utilisent différentes plateformes robotiques, capteurs et formats de données ; la même action de saisie peut être enregistrée sous des structures de données complètement différentes. Une grande quantité de données brutes doit encore subir un nettoyage, une annotation et un traitement structuré avant de pouvoir être utilisées pour l'entraînement des modèles.
C'est pourquoi de nombreuses entreprises en sont encore au stade "collecte autonome, usage interne, entraînement interne", les données étant dispersées entre différentes sociétés et plateformes.
Avec la montée en importance des données, la concurrence commence à s'étendre du robot lui-même aux infrastructures comme la collecte, la gouvernance et la circulation.
Mais l'industrie manque de combien de données exactement, il n'y a pas encore de consensus. Ce qui est certain, c'est qu'une seule entreprise collectant et utilisant ses propres données aura du mal à couvrir les scénarios complexes auxquels un robot généraliste doit faire face.
Celui qui pourra établir en premier un réseau d'approvisionnement en données standardisé et à grande échelle aura plus de chances de devenir le "vendeur de pelles" de cette phase d'expansion industrielle.
C'est précisément cette opportunité que vise MeeBee Technology.
Faire des données une plateforme
Bien sûr, la collecte de données est importante, mais MeeBee Technology vise plus que cela.
Actuellement, la collecte de données de haute qualité dans l'industrie dépend encore largement du robot lui-même. Les entreprises doivent acheter des robots, déployer des scénarios, organiser des opérateurs, puis effectuer la collecte par téléopération, le robot étant l'un des postes de coût les plus élevés.
MeeBee conserve la solution de données par robot physique, tout en lançant la série de produits de collecte sans robot MEgo, comprenant l'appareil de collecte portable MEgo View et la pince de collecte MEgo Gripper.
Après avoir porté ou tenu l'appareil, l'opérateur peut enregistrer le processus opérationnel dans des scénarios réels comme les supermarchés, les usines, les foyers, sans nécessiter la participation du robot pendant toute la collecte.
Comparée à la téléopération par robot, la collecte sans robot facilite la réduction des coûts et l'augmentation de l'échelle. Selon le plan dévoilé par MeeBee, 60% à 70% de sa capacité de production de données en 2026 proviendront de la collecte sans robot.
Mais collecter les données n'est que la première étape ; la possibilité de les traiter pour les utiliser en entraînement détermine en grande partie leur valeur finale.
Les données brutes contiennent souvent du bruit et des contenus non pertinents, et doivent subir des processus d'alignement temporel, de reconstruction de trajectoire, d'annotation, de filtrage de qualité, etc. Même avec de nombreuses données brutes, une entreprise ne peut pas forcément les transformer directement en ensemble d'entraînement efficace.
C'est pourquoi MeeBee consacre beaucoup d'efforts à l'étape de gouvernance des données.
Son moteur de gouvernance des données MEgo Engine couvre les processus de nettoyage des données, reconstruction de trajectoires 6D, reconstruction de perception spatiale, vérification de la qualité, notation intelligente et annotation automatique. Selon MeeBee, son efficacité d'annotation automatique peut être multipliée par plus de 10 par rapport aux méthodes traditionnelles, avec pour objectif de permettre aux données collectées d'être utilisées plus rapidement pour l'entraînement.
En plus de vendre des données, MeeBee souhaite également fournir la capacité de transformer les données brutes en ensembles d'entraînement.
À un niveau supérieur, MeeBee a également mis en place une place de marché des données, visant à standardiser et à encapsuler les ressources de données dispersées, et à les ouvrir à toute l'industrie.
Cette vision ressemble quelque peu à celle du cloud computing des débuts : les fournisseurs de cloud ont fait de la puissance de calcul un service à la demande, MeeBee espère faire de même avec les données, en tant que ressource fondamentale échangeable et réutilisable.
Selon le plan de l'entreprise, MeeBee atteindra une capacité de production de données de l'ordre de dix millions d'heures en 2026, et, grâce à l'initiative "Beehive Data Co-creation Action" en collaboration avec des fournisseurs de cloud, des partenaires de scénarios et des institutions industrielles, visera une échelle de données de l'ordre de dizaines de milliards d'heures avant 2030.
Ce ne sont pour l'instant que des objectifs de capacité ; leur réalisation dans les délais dépendra de la production matérielle, du réseau de collecte et des commandes réelles.
Mais malgré cela, le capital est déjà prêt à soutenir cette vision.
En février de cette année, MeeBee Technology a complété un financement de centaines de millions de yuans en série seed et angel, mené par Sequoia Capital China ;
En juin, elle a complété un financement stratégique de centaines de millions de yuans en série angel+, mené par Guofang Venture Capital, avec la participation de plusieurs capitaux industriels et institutions publiques ;
Alibaba Cloud, Baidu Cloud, JD Cloud et d'autres entreprises ont également établi des partenariats stratégiques avec MeeBee, couvrant l'écosystème des données, la synergie des scénarios et le soutien en puissance de calcul.
Ainsi, Critical Point et MeeBee, les deux sociétés issues de la scission de Zhiyuan, ont chacune leur orientation commerciale :
Critical Point cible le composant matériel des mains agiles, tandis que MeeBee vise l'aspect données de l'intelligence incarnée.
Seulement, le financement et l'exploitation indépendants laissent à MeeBee un espace pour des services externes, mais ne résolvent pas automatiquement le problème de confiance des concurrents.
Les concurrents de Zhiyuan, oseront-ils utiliser MeeBee ?
Le premier défi de MeeBee est la neutralité.
Son initiative "Beehive Data Co-creation Action" tente d'établir un réseau de données à l'échelle de l'industrie. Mais pour que davantage de sociétés de robotique y participent, MeeBee doit prouver que les données exclusives des clients ne seront pas transférées à Zhiyuan, ni utilisées de manière non autorisée par d'autres concurrents.
Yao Maoqing a publiquement répondu à cette question. Il a déclaré que les transactions de données de MeeBee étaient divisées en deux modes : "droit d'usage" et "propriété" ; pour les clients achetant la propriété, la société effectuera le transfert d'actif et détruira localement les données concernées.
Même Zhiyuan n'a qu'une seule voie pour obtenir des données de MeeBee : passer une commande sur le marché, il n'y a pas d'accès gratuit. Ces dispositions clarifient au moins le principe d'isolation des données.
Mais pour que les concurrents de Zhiyuan achètent à long terme, MeeBee devra prouver continuellement sa neutralité à travers des accords, l'isolation des droits, les processus de livraison et des audits tiers.
Après tout, pour les concurrents de Zhiyuan, MeeBee n'est pas "indispensable", et ce n'est pas la seule entreprise à convoiter le marché des données.
JD a déjà lancé le terminal de collecte JoyEgoCam, l'infrastructure de données incarnées et une plateforme d'échange de données, avec l'objectif d'accumuler plus de 10 millions d'heures de données vidéo de scénarios réels dans les deux prochaines années.
Luming Robot s'oriente également vers la collecte sans robot, Lingchu Intelligence se spécialise dans les données d'opération humaine réelle, et Guanglun Intelligence se concentre sur les données synthétiques et l'infrastructure de simulation.
Elles sont toutes en concurrence pour la même chose : transformer les scénarios et données brutes dispersés en ensembles de données pouvant être utilisés continuellement pour l'entraînement.
MeeBee doit également faire face simultanément aux défis de l'échelle et de la qualité.
Les dix millions d'heures ne sont pour l'instant qu'un objectif de capacité, pas une livraison de données déjà réalisée ; que ce soit la collecte par robot ou sans robot, augmenter l'échelle signifie des investissements continus en équipements, personnel et scénarios. Sans résoudre les problèmes de qualité et de généralisation des données, même un très grand ensemble de données peut n'être qu'un empilement répétitif.
Ce qui déterminera finalement si MeeBee peut créer un effet de réseau, c'est la confiance que lui accordent ses pairs.
Cependant, le fait que Zhiyuan ait laissé MeeBee devenir indépendante et lever des fonds a au moins donné à cette activité un espace pour des services externes.
Si les données étaient restées à l'intérieur de Zhiyuan, elles n'auraient amélioré que les capacités du modèle d'une seule entreprise ; après standardisation, marchandisation et reconnaissance par d'autres fabricants de robots, elles ont une chance de devenir une infrastructure industrielle.
En fin de compte, pour MeeBee, une capacité de dix millions d'heures n'est qu'un seuil.
Ce n'est que lorsque les concurrents de Zhiyuan seront également prêts à acheter à long terme chez elle, et même à lui confier leurs données essentielles pour traitement, que cette activité sera vraiment établie.
Cet article provient du compte WeChat public : Lanzi Jihua , auteur : Chester







