Qianxun Intelligence a une fois de plus accéléré son rythme de financement.
Le 7 avril 2026, Qianxun Intelligence a annoncé avoir achevé un nouveau tour de financement de 1 milliard de RMB. Ce tour a été co-dirigé par Shunwei Capital et Yunfeng Capital, avec la participation renforcée de Dachen Caizhi, un fonds RMB majeur, Galaxy Yuanhui, Turing Fund, Xinding Capital, Gengxin Capital et d'autres.
C'est déjà son deuxième financement important en 30 jours. Peu de temps auparavant, en février, la société venait de finaliser un financement de près de 2 milliards de RMB. Cumulés, les deux tours portent le montant total des financements à 3 milliards de RMB.
Ce qui est encore plus intéressant, c'est l'apparition dans ce tour d'une combinaison extrêmement médiatique : Lei Jun (Shunwei) + Jack Ma (Yunfeng), investissant ensemble pour la première fois dans le domaine de l'intelligence incarnée (embodied AI).
Par le passé, ils ont chacun misé sur des cycles clés tels que l'Internet mobile, le e-commerce, le matériel intelligent, le cloud computing, etc. Cette fois, leur investissement conjoint dans la robotique, en particulier dans le domaine encore naissant de l'intelligence incarnée, indique que cette direction passe de l'imagination technologique à un consensus capitalistique, entrant dans une phase de compétition éliminatoire soutenue par les géants et hautement concentrée en capitaux.
Qianxun Intelligence a été fondée en janvier 2024 par Han Fengtao, entrepreneur en série dans le domaine de la robotique, le scientifique de l'IA de haut niveau Gao Yang, et Zheng Lingyin, pionnier de l'exportation de robots industriels.
Le fondateur et PDG, Han Fengtao, était auparavant co-fondateur et CTO de珞石机器人 (Luo Shi Robot), ayant supervisé la livraison de près d'une centaine de modèles de robots, possédant une solide expertise en ingénierie et production de masse. Le co-fondateur Gao Yang est diplômé de l'Université de Californie à Berkeley, ayant étudié sous la direction du maître de la vision par ordinateur Trevor Darrell, et est actuellement professeur assistant à l'Institut d'information interdisciplinaire de l'Université Tsinghua. Son équipe a open-sourcé le modèle Spirit v1.5 qui a dépassé le modèle américain leader Pi0.5 sur le classement RoboChallenge, devenant le premier modèle open-source chinois d'intelligence incarnée à atteindre la première place. La co-fondatrice Zheng Lingyin est une pionnière de l'exportation de robots industriels, ayant construit de zéro le département des affaires internationales, menant son équipe pour approfondir plusieurs marchés étrangers et réalisant rapidement une transformation commerciale.
Les trois fondateurs couvrent respectivement les compétences clés de l'IA, de la robotique et de la commercialisation, formant ensemble une équipe rare de « guerriers hexagonaux », ce qui constitue le fondement de la confiance ayant permis de lever 3 milliards de RMB en 30 jours et d'obtenir l'investissement lourd de Shunwei Capital et Yunfeng Capital. Une telle combinaison permet à Qianxun Intelligence, dès sa création, d'allier une prospective technologique de classe mondiale et des gènes de mise sur le marché commerciale.
Han Fengtao a souligné qu'en 2026, l'enjeu serait l'échelle des données et les performances des modèles. La chose la plus importante cette année n'est pas l'expansion des scénarios, mais de faire du modèle incarné un Top 3 mondial. Pour y parvenir, il faut avoir suffisamment d'argent en caisse.
Ainsi, des financements continus éclair visent essentiellement à échanger la densité capitalistique contre un avantage temporel, en accumulant rapidement des ressources, en élargissant l'écart de performance et en verrouillant à l'avance une place de leader. Parallèlement, la ré-injection des anciens actionnaires dans ce tour signifie que les investisseurs sont passés de l'observation et la validation à la mise accélérée.
Alors, comment Qianxun Intelligence a-t-elle obtenu ce billet d'entrée accéléré ? Jusqu'où ses douves protectrices sont-elles déjà creusées ?
La logique sous-jacente des paris capitalistiques, une voie plus proche des grands modèles validée
Pourquoi le capital est-il prêt à investir continuellement ? Réponse : le modèle a déjà fourni une réponse préliminaire.
En janvier de cette année, Qianxun Intelligence a open-sourcé le modèle incarné Spirit v1.5. Lors des évaluations publiques, ce modèle a directement dépassé le modèle open-source le plus puissant de l'époque, Pi0.5.
Mais ce qui a le plus convaincu les investisseurs, c'est le point d'inflexion de la courbe des capacités.
Spirit v1.5 a déjà démontré une capacité de généralisation zero-shot relativement stable – sans entraînement supplémentaire, il peut accomplir une série d'opérations complexes comme essuyer, ouvrir/fermer des charnières, manipuler des objets flexibles, etc.
En d'autres termes, le robot commence non seulement à apprendre une tâche, mais acquiert la capacité de transfert inter-tâches, laissant entrevoir la possibilité que l'intelligence incarnée libère la productivité humaine.
Derrière cela se trouve une voie technologique très similaire à celle des grands modèles de langage (LLM) : agrandir le modèle, le nourrir de données, itérer continuellement, et croire en « l'émergence » des capacités.
Concrètement, Spirit v1.5 est un modèle unifié de bout en bout VLA (Vision-Language-Action). Il ne cherche pas à restituer tous les détails du monde, ni n'insiste sur une couche intermédiaire explicite de simulation du monde, mais apprend directement la relation de la perception à l'action.
La méthode d'entraînement est également très LLM. Sauf que les données textuelles sont remplacées par des données robotiques. D'abord, un pré-entraînement avec une énorme quantité de vidéos Internet pour établir une compréhension basique du monde, puis un alignement avec des données d'interaction réelle – obtenir d'abord la capacité de généralisation, puis se rapprocher des tâches spécifiques.
Résultat : avec une puissance de calcul et une taille de paramètres plus faibles, il obtient une meilleure généralisation.
Il y a quelques jours, cette voie a également trouvé un « écho » de la part de pairs de la Silicon Valley.
Le 3 avril, la société d'intelligence incarnée de la Silicon Valley, Generallist AI, a publié son modèle de base GEN-1, utilisant 500 000 heures de données d'interaction physique réelle pour valider la Loi d'échelle (Scaling Law) dans le domaine de l'intelligence incarnée. L'effet est-il spectaculaire ?
Ces robots ont augmenté le taux de réussite moyen de multiples tâches physiques de 64% à 99% ; leur vitesse d'exécution est presque aussi rapide que celle des humains, environ 3 fois plus rapide que les systèmes les plus avancés existants, et ils peuvent même improviser sur place. Plus impressionnant encore, l'acquisition de chaque capacité ne nécessite qu'environ 1 heure de données robotiques.
Le PDG, Pete Florence, a souligné que ce qui se passe actuellement dans le domaine de la robotique est très similaire à lorsque les gens ont ouvert GPT-3 et lui ont demandé d'écrire un tout nouveau limerick.
Des observations similaires ont également été vérifiées par l'équipe Qianxun. « Notre équipe a également découvert la Loi d'échelle dans le domaine de l'intelligence incarnée ; chaque fois que les données augmentent d'un facteur 10, un 9 de plus apparaît dans les résultats. » a déclaré Gao Yang pour décrire la pente raide de cette courbe. Nous sommes à un moment Scaling Law de l'intelligence incarnée, mais comme les données robotiques sont plus difficiles à obtenir, je pense que le GPT-4 de la robotique prendra plus de temps, peut-être 4-5 ans.
On peut dire que le capital investit dans une voie technologique qui a été initialement validée, tout en offrant un meilleur rapport qualité-prix et un plus grand potentiel d'expansion.
Le moteur de données, clé de la validation de la voie
Dans le domaine de l'intelligence incarnée, presque tout le monde s'accorde sur un point : l'acquisition de données est un goulot d'étranglement fondamental.
Les grands modèles peuvent ingérer l'énorme quantité de textes disponibles sur Internet, mais pas les robots – dans le monde du travail manuel, il n'y a pas de Wikipédia. En surface, tout le monde se bat sur les modèles, mais la compétition sous-jacente est en réalité le moteur de données. « Pour réaliser l'expansion, nous ferons tout ce qui est nécessaire. » a déclaré sans ambages Pete Florence.
Puisqu'on croit à la Loi d'échelle, quel système de données peut être acquis à faible coût, tout en pouvant s'étendre continuellement et avoir suffisamment de diversité ?
Auparavant, les modèles généraux de robotique avec un taux de réussite supérieur à 90% dépendaient de jeux de données de téléopération à grande échelle extrêmement coûteux et difficiles à étendre (comme Physical Intelligence). Mais Generallist AI a développé en interne des « data hands » (mains de données) – un dispositif portable à deux doigts porté au poignet, transformant les mains humaines en pinces similaires à celles des robots, collectant ainsi des données visuelles et sensorielles.
Résultat, les progrès de GEN-0 et GEN-1 ont validé que ce moteur de données pouvait également atteindre un haut niveau de maîtrise – ils n'ont pas utilisé de données robotiques, mais seulement des données générées par des millions d'activités humaines utilisant des dispositifs portables low-cost.
Qianxun Intelligence poursuit également une voie de Scaling axée sur la diversité.
En termes de solution matérielle, Qianxun a également opté pour une solution portable, mais va plus loin. Pour permettre au modèle d'apprendre des manipulations fines de niveau humain, ils ont adopté une conception à trois doigts – la machine intelligente est équipée de 26 degrés de liberté, chaque articulation intègre un capteur de force, et est dotée d'une main habile à trois doigts. Mais les défis techniques augmentent également significativement. La structure à trois doigts dans la collecte de données portable fait face à des degrés de liberté plus élevés, des exigences de contrôle de force plus fines et un mappage d'actions plus complexe.
Actuellement, les dispositifs portables de Qianxun en sont à leur cinquième génération, la disponibilité des données est passée de 30% à 95%, tandis que le coût a été réduit à environ un dixième de celui de la téléopération.
Il est important de noter que, contrairement à Generallist AI qui s'appuie entièrement sur les données portables, Qianxun construit un moteur de données à fusion multi-sources.
Lors de la phase de pré-entraînement, en plus des nombreuses données portables, Qianxun Intelligence intègre activement des vidéos Internet pour le pré-entraînement, afin d'acquérir des connaissances générales et des capacités de base. Ensuite, des données de téléopération de robots réels sont introduites pour un SFT (Supervised Fine-Tuning) fin, améliorant les performances du modèle dans des tâches réelles. Enfin, l'optimisation se poursuit par apprentissage par renforcement : le modèle continue de se déployer (roll-out) dans un environnement réel, générant constamment de nouvelles données qui nourrissent à leur tour le modèle.
Jusqu'à présent, Qianxun a acquis plus de 200 000 heures de données d'interaction réelle, provenant de sources multiples telles que des vidéos Internet, la téléopération, la collecte portable, etc., et ce nombre croît rapidement, devant dépasser le million d'heures en 2026. D'ici avril 2026, l'équipe de collecte de données de Qianxun Intelligence atteindra également un effectif de mille personnes.
Il convient de mentionner que la compréhension des données par Qianxun a également subi un changement fondamental.
Ils ne s'accrochent plus à la collecte de données scriptées et méticuleusement élaborées, courante dans l'industrie, mais se tournent vers un paradigme de collecte plus ouvert et diversifié : au lieu de strictement prescrire le cheminement des actions, ils se concentrent sur l'objectif de la tâche, laissant le processus d'exécution se dérouler naturellement : les échecs, les renversements, les interruptions sont autorisés, puis la tâche est reprise jusqu'à son achèvement.
Le changement qui en résulte est fondamental : le modèle n'apprend plus comment faire cette chose spécifique, mais comment réagir face à des situations similaires. À taille de données égale, cette distribution de données améliore significativement l'efficacité de transfert du modèle tout en réduisant la dépendance à la puissance de calcul.
« Pondre des œufs en chemin », les données des scénarios réels nourrissent le modèle
Dans le moteur de données de Qianxun, ce qui détermine réellement si la roue volante (flywheel) peut tourner, ce n'est pas seulement la source des données, mais la capacité à se déployer continuellement (roll-out) dans des environnements réels.
Han Fengtao a résumé en disant que se diriger vers des scénarios réels, c'est pour obtenir le carburant (données) de l'évolution du modèle. La commercialisation rend ce processus d'acquisition durable et scalable.
Derrière cela se cache également une divergence claire des voies sino-américaines. Aux États-Unis, certaines entreprises peuvent investir à long terme autour du modèle de base lui-même, échangeant du temps contre un plafond de capacité ; mais en Chine, sans démo, sans signal de mise en œuvre, il est difficile d'obtenir un financement continu. La plupart des entreprises qui survivent, voire prospèrent, optent pour une voie plus compromise.
Atteindre une IA générale est une route longue et ardue, on ne peut pas attendre que le modèle soit mature pour trouver des applications. Ce n'est qu'en faisant entrer d'abord les robots dans des environnements de production réels, en les faisant participer à de vraies opérations commerciales, que l'on peut utiliser les masses de données générées par ces opérations réelles pour nourrir le modèle et l'améliorer continuellement.
En tant que première entreprise chinoise d'intelligence incarnée à avoir poussé la voie de la collecte de données diversifiée de la théorie à l'ingénierie et à la scalabilité, et à avoir réalisé une double validation dans des scénarios commerciaux réels, les robots Qianxun insistent sur le fait de « pondre des œufs en chemin ». Ils commencent par des scénarios contrôlés, entrant prioritairement dans les domaines industriel et des services, structures relativement stables, aux limites de tâches claires, rentables et disposées à payer, validant ainsi les capacités du modèle tout en soutenant les opérations de l'entreprise.
Par exemple, dans le scénario de la vente au détail, la collaboration entre Qianxun et JD.com (également investisseur) se renforce. « Xiao Mo » est entré dans le JD MALL, occupant le poste de barista. Tout en accomplissant ses tâches de service, le robot collecte simultanément des données perceptives multimodales, des trajectoires de mouvement des articulations et des informations de feedback de force fine.
Ces « données expert » provenant d'environnements de vente au détail réels seront directement utilisées pour l'entraînement et le微调 (fine-tuning) du modèle incarné, formant une boucle positive « collecte de données – itération du modèle – amélioration des capacités ».
Le robot intelligent Qianxun est officiellement en service au JD MALL, occupant le poste de barista.
Les deux parties prévoient également d'étendre l'intelligence incarnée à davantage de domaines de détail, y compris le guidage pour les produits numériques et électroménagers, l'inspection et la visite guidée automatisées, le nettoyage, etc. Parallèlement, la pharmacie JD est considérée comme une percée centrale, les robots participeront à des tâches de haute précision comme le tri automatique, la préparation précise de médicaments, explorant des solutions de pharmacie intelligente sans personnel.
Avant d'entrer dans le JD Mall, Qianxun avait déjà effectué une validation dans des environnements industriels. « Xiao Mo » est monté sur la ligne de production de batteries pour véhicules électriques de CATL (Contemporary Amperex Technology Co. Limited), assumant les tests de fonction finaux avant la sortie de ligne. Jusqu'à présent, il a terminé le branchement de plus de 1000 batteries, avec un taux de réussite stable supérieur à 99%, et son rythme de travail se rapproche de celui des ouvriers expérimentés.
« Xiao Mo » est déjà monté sur la ligne de production de batteries
L'intelligence incarnée n'atteindra pas à court terme un moment où la mise en œuvre signifiera la victoire ou la défaite. Mais une tendance plus claire est déjà apparue – la compétition ne porte plus seulement sur qui a le plus de données, mais se tourne vers qui peut acquérir plus efficacement des données de scénarios réels, et qui peut construire une boucle fermée données-modèle à rotation plus fréquente.
Après avoir achevé sa transition d'évaluation阶段性 (de phase), Qianxun Intelligence misera d'une part sur la capacité de généralisation du modèle, tout en continuant à amplifier l'avantage de l'échelle des données, utilisant les retours fréquents du monde réel pour accélérer l'itération du modèle.
Si l'on regarde en arrière, le GPT-2 de 2019 pourrait sembler insignifiant, mais à mesure que l'échelle s'est agrandie, les retours de la capacité de généralisation se sont rapidement amplifiés. Maintenant, le même point d'inflexion se reproduit dans le domaine de la robotique.
Cet article provient du compte WeChat officiel « Machine Heart » (ID:almosthuman2014), auteur : Sia











