Un docteur né après 1995 se consacre au modèle mondial, FaceMind lève des dizaines de millions de yuans

marsbitPublié le 2026-06-26Dernière mise à jour le 2026-06-26

Résumé

La société d'IA FaceMind, dirigée par Lu Hongyuan, un docteur né après 1995, a levé des dizaines de millions de yuans en financement Pre-A auprès de Xinglian Capital, avec un suivi important de l'actionnaire existant 360. Fondée en 2023, FaceMind s'est d'abord concentrée sur les modèles multimodaux côté client avant de se tourner vers la recherche fondamentale sur les modèles du monde. Les travaux de l'équipe, notamment sur les problèmes des mots basse fréquence (SLoW) et la loi d'Adam, ont attiré l'attention, cette dernière étant même reprise par Anthropic. Le modèle du monde de FaceMind vise à prédire les changements dans un environnement, comme les interfaces graphiques ou pour la robotique incarnée. Leur produit "叠叠社" sert de banc d'essai précoce. Leur approche privilégie l'efficacité des paramètres et l'architecture itérative plutôt que la simple augmentation de l'échelle des modèles. Les investisseurs saluent les compétences de recherche fondamentale et d'exécution technique de l'équipe. FaceMind teste actuellement ses capacités dans divers scénarios (environnements de simulation, agents d'interface, bras robotiques) et prévoit de fournir des services complets aux fabricants de robots, plateformes de contenu et sociétés de puces/cloud. Avec ce financement, la jeune entreprise entend intensifier ses efforts de R&D sur les modèles du monde et leur validation dans de multiples applications, visant à devenir un acteur des futures infrastructures d'IA.

Selon Investment Community, l'entreprise de modèles mondiaux FaceMind a récemment achevé un financement de série Pre-A de plusieurs dizaines de millions de yuans, avec Xinglian Capital comme investisseur et l'ancien actionnaire 360 Capital qui a surenchéri.

Il est rapporté que le prochain tour de financement de FaceMind est déjà en cours, avec des conseillers financiers comme Shendu Capital agissant en tant que FA, et des intentions d'investissement ont déjà été exprimées par certaines institutions.

C'est une jeune entreprise d'IA. Son PDG, Lu Hongyuan, né après 1995, a fondé FaceMind pendant ses études. Ces deux dernières années, l'entreprise est passée d'un modèle multimodal sur appareil à des modèles mondiaux plus fondamentaux.

Alors que l'IA pénètre les écrans, les logiciels et les robots, comprendre le monde devient la prochaine étape.

Dirigé par un docteur né après 1995

Une équipe de modélisation mondiale émerge

L'histoire de FaceMind commence avec Lu Hongyuan.

Fondateur né après 1995, Lu Hongyuan a effectué son bachelor et son master à l'Imperial College de Londres et obtenu son doctorat au laboratoire de traitement du langage naturel de l'Université chinoise de Hong Kong, sous la direction du professeur Lin Wei, se spécialisant dans la recherche sur le traitement du langage naturel et les mécanismes fondamentaux des grands modèles. Pendant son doctorat, il a publié 14 articles principaux ou correspondants dans des conférences de haut niveau, plusieurs devenant des références dans le domaine.

FaceMind a été fondée en 2023, se concentrant initialement sur la recherche et l'application de modèles multimodaux sur appareil.

Ce qui a vraiment attiré l'attention sur eux, c'est la discussion précédente sur "Ma Jiaqi qui a fait échouer un grand modèle". À l'époque, un grand modèle pouvait décrire avec précision le parcours de Ma Jiaqi, mais ne pouvait pas produire de manière stable les trois caractères "Ma Jiaqi". Un nom ordinaire a révélé un problème fondamental dans le traitement du langage par les grands modèles : avant qu'un texte n'entre dans le modèle, il doit d'abord être découpé en tokens ; lorsque le modèle rencontre des mots peu fréquents, des noms rares ou des mots de langues minoritaires, la compréhension et la génération peuvent devenir instables.

L'équipe de Lu Hongyuan a identifié ce problème plus tôt. En 2025, ils ont publié un article sur SLoW, discutant de l'impact des mots peu fréquents sur les performances de traduction des grands modèles ; en 2026, leur article Adam’s Law a poussé le problème au niveau de la phrase – pour une même signification, plus l'expression est fréquente et courante, plus elle est facilement traitée et apprise par le modèle.

Plus surprenant encore, cette technologie liée à l'article a été adoptée par Anthropic et a été partagée et appréciée sur X par un investisseur d'Anthropic. Le jugement d'un jeune chercheur chinois né après 1995 sur les lois fondamentales des grands modèles a ainsi été remarqué par davantage de personnes.

En poursuivant dans cette direction, FaceMind a commencé à recentrer ses efforts sur les modèles mondiaux.

Pour faire simple, les grands modèles de langage sont doués pour prédire le prochain segment de texte, tandis que les modèles mondiaux doivent prédire ce qui va se passer ensuite dans un environnement. Sur un écran, cela se traduit par un GUI Agent (agent d'interface graphique utilisateur) comprenant les pages web, les documents, les boutons et les intentions de l'utilisateur ; dans le domaine de la robotique, il s'agit de comprendre l'espace, les actions et les résultats des tâches.

Le système de modèle mondial développé en interne par FaceMind s'inscrit dans cette direction. L'entreprise tente d'améliorer la stabilité des modèles dans la prédiction de séquences longues, la compréhension d'écrans et les tâches incarnées, via une architecture de modèle itérative et efficace en paramètres.

Diédiéshe est l'un des premiers terrains de validation de cette capacité. Apparemment, il s'agit d'un produit de commentaires en direct alimenté par l'IA, capable de générer des commentaires interactifs en temps réel en fonction du contenu que l'utilisateur est en train de consulter (page web, document, vidéo ou jeu). En profondeur, pour accomplir une tâche, un GUI Agent doit voir l'écran, comprendre la structure de la page, identifier la position des boutons et prédire le résultat d'un clic. Chaque changement de page, retour d'entrée et accomplissement de tâche constitue une forme de données denses pour un modèle mondial.

C'est aussi l'opportunité que FaceMind cherche à saisir : les modèles mondiaux sont en train de devenir la nouvelle porte d'entrée fondamentale de l'IA.

Intervention de Xinglian Capital et 360

Le champ de bataille le plus en vogue de l'incarnation

Le dernier financement émerge.

Récemment, FaceMind a annoncé avoir achevé un financement de série Pre-A de plusieurs dizaines de millions de yuans. Ce tour a non seulement introduit un nouvel investisseur, Xinglian Capital, mais a également reçu un investissement supplémentaire substantiel de l'ancien actionnaire 360 Capital.

Xiang Qiqi, responsable des investissements préalables du groupe 360, a déclaré : "Le Dr Lu est l'un des jeunes chercheurs en IA les plus éminents que j'aie jamais rencontrés."

À ses yeux, Lu Hongyuan ne se concentre pas sur des optimisations locales, mais sur les principes fondamentaux des modèles et l'innovation architecturale. Alors que l'industrie discutait encore du concept de modèle mondial, FaceMind entraînait déjà un modèle mondial à partir de zéro et obtenait des résultats de niveau SOTA dans l'industrie sur plusieurs benchmarks. Ensuite, Adam's Law a attiré l'attention et la validation d'Anthropic, un important fabricant de modèles étranger, et l'architecture en boucle Loop proposée récemment par l'équipe explore davantage les problèmes d'entraînement de séquences longues pour les modèles mondiaux.

"La vitesse d'itération est impressionnante. Avant chaque discussion, je consulte d'abord leurs derniers articles et rapports techniques publiés." Xiang Qiqi s'émerveille, disant avoir vraiment compris ce que signifie "un investissement pour une vie d'apprentissage".

Li Wenjue, partenaire de Xinglian Capital, a déclaré que la caractéristique la plus marquante de l'équipe de FaceMind était sa combinaison de solides capacités de recherche et d'ingénierie complexe pour la mise en œuvre. Les membres clés de l'équipe sont depuis longtemps profondément engagés dans les technologies fondamentales de l'intelligence artificielle, capables à la fois de former des jugements indépendants sur les orientations de pointe et de valider rapidement les résultats de la recherche dans des scénarios réels.

"Nous croyons en une équipe avec une densité de talents élevée, un jugement technique prospectif et une forte capacité d'exécution." À son avis, Lu Hongyuan combine l'esprit d'exploration d'un jeune chercheur et l'esprit d'action d'un entrepreneur, capable de mener l'équipe à relever continuellement des problèmes difficiles et de transformer le jugement technique en orientations de recherche claires. Ces caractéristiques du fondateur et cette cohésion d'équipe sont des raisons importantes pour lesquelles Xinglian Capital a décidé d'investir.

L'année dernière, les modèles mondiaux sont devenus un nouveau mot-clé dans l'industrie de l'IA. Derrière l'effervescence, des divergences apparaissent également : la prochaine étape de la compétition reposera-t-elle sur davantage de données et de paramètres, ou sur une nouvelle architecture pour améliorer l'efficacité d'utilisation des données limitées par les modèles ?

FaceMind a choisi la deuxième option.

Selon les informations, les caractéristiques essentielles de leur modèle développé en interne sont l'itération en boucle et l'efficacité des paramètres. En termes simples, il vise à permettre au modèle, à taille de paramètres égale, d'acquérir une plus grande capacité de prédiction de séquences longues et de déduction environnementale. L'entreprise a révélé que les performances de son modèle d'échelle 1B étaient déjà comparables à celles de modèles puissants internationaux similaires, avec une amélioration de l'efficacité des paramètres.

Actuellement, FaceMind a déjà commencé à valider cette capacité de modèle dans plusieurs scénarios. Selon les informations, sa capacité de modèle mondial a été validée dans des environnements de simulation incarnés, d'agent GUI et de bras robotisés réels. En aval, l'entreprise prévoit de fournir aux partenaires tels que les fabricants de robots, les plateformes de contenu, les fabricants de puces et de services cloud, un ensemble complet de capacités allant de la validation de scénarios, l'entraînement de modèles, le déploiement d'architecture aux services d'inférence et l'optimisation continue.

Pour Lu Hongyuan, l'opportunité des modèles mondiaux se développera avec les agents GUI et l'intelligence incarnée. À ce moment-là, la compétition entre modèles se fera sur leur capacité à comprendre les tâches, prédire les changements et accomplir les actions de manière stable. Après le financement, FaceMind continuera à investir dans la recherche et le développement de modèles mondiaux et leur validation dans de multiples scénarios.

Une jeune entreprise s'installe à la table des infrastructures de nouvelle génération de l'IA.

Cet article provient du compte WeChat "Investment Community AI", auteur : Wang Lu

Questions liées

QQui est le fondateur de FaceMind et quelle est sa formation académique ?

ALe fondateur de FaceMind est Lu Hongyuan, un entrepreneur né après 1995. Il a obtenu sa licence et son master à l'Imperial College London, puis un doctorat du laboratoire de traitement du langage naturel de l'Université chinoise de Hong Kong, sous la direction du professeur Lin Wei.

QSur quel domaine de recherche l'entreprise FaceMind s'est-elle initialement concentrée, et vers quoi a-t-elle évolué ?

AInitialement, FaceMind s'est concentrée sur le développement et l'application de modèles multimodaux de périphérie. Par la suite, l'entreprise a progressivement orienté ses efforts vers des modèles mondiaux plus fondamentaux.

QQuels investisseurs ont participé au dernier tour de financement de FaceMind et quel était le montant approximatif ?

ADans le dernier tour de financement de type Pre-A, FaceMind a levé plusieurs dizaines de millions de yuans. Les investisseurs incluent Xinglian Capital, et l'ancien actionnaire 360 a effectué un suivi avec un investissement supplémentaire.

QQu'est-ce que le modèle mondial de FaceMind tente d'accomplir, et quels sont ses principaux domaines d'application ?

ALe modèle mondial de FaceMind vise à prédire les changements dans un environnement. Ses principaux domaines d'application incluent les agents d'interface graphique (GUI Agent) pour comprendre les écrans, les documents et les intentions des utilisateurs, ainsi que l'intelligence incarnée pour les robots, comprenant l'espace, les actions et les résultats des tâches.

QQuelle est la principale caractéristique technique du modèle autonome développé par FaceMind ?

ALa principale caractéristique technique du modèle autonome de FaceMind est son architecture itérative en boucle et son efficacité paramétrique, visant à offrir une capacité de prédiction à long terme et de déduction environnementale plus forte avec la même échelle de paramètres.

Lectures associées

Première certification antidéflagrante nationale, première solution mondiale de "cerveau de pompe à essence" : comment ont-ils obtenu ces deux "premières"

Cette année, le secteur de l'intelligence incarnée en Chine a attiré plus de 37 milliards de yuans de financement, marquant une année cruciale pour sa commercialisation. La question centrale est de savoir comment déployer cette technologie dans des environnements réels difficiles. Le premier défi majeur pour les robots dans des lieux comme les stations-service ou les usines pétrochimiques est l'obtention de la certification anti-déflagrante, exigeant une conception matérielle intrinsèquement sûre pour éviter tout risque d'étincelle. L'article examine deux scénarios d'application critiques. Dans les stations-service, le robot doit réaliser une longue séquence d'actions précises (ouvrir le bouchon, saisir et insérer le pistolet, etc.) avec une tolérance de quelques millimètres, tout en s'adaptant à différents modèles de véhicules. Pour la patrouille d'infrastructures, les défis sont l'autonomie prolongée, la détection d'anomalies et la réponse immédiate. Face à ces tâches complexes et séquentielles, l'architecture traditionnelle en pipeline montre ses limites. L'article présente une nouvelle approche fondée sur des modèles du monde, comme H-GAR (Hierarchical Goal-Aware Reasoning), qui permet au robot de prédire l'état final souhaité et de planifier rétroactivement les étapes intermédiaires. Ce mécanisme, combinant un module de synthèse d'observations conditionné par l'objectif et un module d'affinage d'actions, confère au robot une capacité de raisonnement prospectif ("voir trois pas à l'avance") pour aligner ses actions sur le but final, réduisant ainsi les erreurs cumulatives. L'entrée dans ces secteurs exige une approche à long terme et un couplage profond entre le "cerveau" (l'intelligence) et le "corps" (la plateforme robotique) dès la conception. Les acteurs maîtrisant cette boucle fermée "cerveau-corps-données" seront probablement les mieux placés pour réussir la commercialisation dans des environnements industriels exigeants.

marsbitIl y a 30 mins

Première certification antidéflagrante nationale, première solution mondiale de "cerveau de pompe à essence" : comment ont-ils obtenu ces deux "premières"

marsbitIl y a 30 mins

Le marché baissier du Bitcoin provoque des licenciements dans le crypto, mais déclenche la vague d'acquisitions la plus agressive de l'histoire du secteur

La baisse prolongée du Bitcoin force les entreprises du secteur cryptographique à réduire leurs effectifs et à automatiser davantage, tout en déclenchant une vague d'acquisitions sans précédent. Au premier semestre 2026, le volume des transactions de fusions et acquisitions a atteint 93,7 milliards de dollars, soit 26 fois celui de la même période l'année précédente. Cette accélération des acquisitions, portée par les institutions financières traditionnelles comme Mastercard et Franklin Templeton, contraste avec la contraction du marché de l'emploi dans la crypto. Les entreprises ciblent des infrastructures clés (licences, garde, rails de paiement) pour accéder rapidement à des capacités réglementées, évitant ainsi un développement interne long. Parallèlement, les suppressions d'emplois se poursuivent, les entreprises recentrant leurs embauches sur les rôles techniques et de conformité, avec une demande croissante pour les compétences en IA. Les entreprises en difficulté financière deviennent des cibles de rachat à moindre coût, tandis que le capital-risque devient plus sélectif, privilégiant les ponts entre la crypto et la finance traditionnelle plutôt que les projets purement spéculatifs. Le marché baissier consolide ainsi l'industrie, récompensant les infrastructures solides et régulées.

marsbitIl y a 30 mins

Le marché baissier du Bitcoin provoque des licenciements dans le crypto, mais déclenche la vague d'acquisitions la plus agressive de l'histoire du secteur

marsbitIl y a 30 mins

Une entrée potentielle de milliers de milliards pour les fonds de pension ? L'ETF de réinvestissement des dividendes en Bitcoin de Franklin Templeton intègre un plafond de vente

Le géant de l'investissement Franklin Templeton a déposé une demande pour lancer deux ETF innovants qui intègrent discrètement le Bitcoin dans des portefeuilles actions traditionnels, ciblant principalement les conseillers financiers. Le mécanisme central de ces fonds, basé sur le principe de l'investissement par défaut et de l'inertie comportementale, utilise les dividendes des actions (95% du portefeuille initial) pour acheter automatiquement du Bitcoin, avec une allocation cible de 5%. Cependant, leur conception impose des règles de rééquilibrage trimestrielles qui obligent à vendre une partie du Bitcoin si son poids dépasse 5% (pour le ramener à 4,5%), et plafonne l'exposition maximale à 20%. Cela signifie qu'en période de hausse du Bitcoin, ces fonds deviendraient des vendeurs nets, créant potentiellement une pression à la vente programmée et un « plafond » de prix. L'analyse montre que les flux d'achats annuels générés par les dividendes seraient minimes (environ 1% ou 0,5% de l'actif par an) par rapport au marché quotidien du Bitcoin. Les fonds utilisent également une structure offshore aux îles Caïmans pour des raisons de conformité et permettent aux conseillers de contourner les restrictions internes sur les crypto-actifs. Pour que ce modèle débloque des capitaux retraite significatifs, ces ETF devraient devenir une option par défaut dans les plans 401(k), un processus qui dépend de la clarification réglementaire par le Département du Travail américain. L'essence de la stratégie est de s'appuyer sur l'inaction des investisseurs plutôt que de les convaincre d'acheter du Bitcoin volontairement.

marsbitIl y a 1 h

Une entrée potentielle de milliers de milliards pour les fonds de pension ? L'ETF de réinvestissement des dividendes en Bitcoin de Franklin Templeton intègre un plafond de vente

marsbitIl y a 1 h

Trading

Spot
Futures
活动图片