Un docteur né après 1995 se consacre au modèle mondial, FaceMind lève des dizaines de millions de yuans

marsbitPublié le 2026-06-26Dernière mise à jour le 2026-06-26

Résumé

La société d'IA FaceMind, dirigée par Lu Hongyuan, un docteur né après 1995, a levé des dizaines de millions de yuans en financement Pre-A auprès de Xinglian Capital, avec un suivi important de l'actionnaire existant 360. Fondée en 2023, FaceMind s'est d'abord concentrée sur les modèles multimodaux côté client avant de se tourner vers la recherche fondamentale sur les modèles du monde. Les travaux de l'équipe, notamment sur les problèmes des mots basse fréquence (SLoW) et la loi d'Adam, ont attiré l'attention, cette dernière étant même reprise par Anthropic. Le modèle du monde de FaceMind vise à prédire les changements dans un environnement, comme les interfaces graphiques ou pour la robotique incarnée. Leur produit "叠叠社" sert de banc d'essai précoce. Leur approche privilégie l'efficacité des paramètres et l'architecture itérative plutôt que la simple augmentation de l'échelle des modèles. Les investisseurs saluent les compétences de recherche fondamentale et d'exécution technique de l'équipe. FaceMind teste actuellement ses capacités dans divers scénarios (environnements de simulation, agents d'interface, bras robotiques) et prévoit de fournir des services complets aux fabricants de robots, plateformes de contenu et sociétés de puces/cloud. Avec ce financement, la jeune entreprise entend intensifier ses efforts de R&D sur les modèles du monde et leur validation dans de multiples applications, visant à devenir un acteur des futures infrastructures d'IA.

Selon Investment Community, l'entreprise de modèles mondiaux FaceMind a récemment achevé un financement de série Pre-A de plusieurs dizaines de millions de yuans, avec Xinglian Capital comme investisseur et l'ancien actionnaire 360 Capital qui a surenchéri.

Il est rapporté que le prochain tour de financement de FaceMind est déjà en cours, avec des conseillers financiers comme Shendu Capital agissant en tant que FA, et des intentions d'investissement ont déjà été exprimées par certaines institutions.

C'est une jeune entreprise d'IA. Son PDG, Lu Hongyuan, né après 1995, a fondé FaceMind pendant ses études. Ces deux dernières années, l'entreprise est passée d'un modèle multimodal sur appareil à des modèles mondiaux plus fondamentaux.

Alors que l'IA pénètre les écrans, les logiciels et les robots, comprendre le monde devient la prochaine étape.

Dirigé par un docteur né après 1995

Une équipe de modélisation mondiale émerge

L'histoire de FaceMind commence avec Lu Hongyuan.

Fondateur né après 1995, Lu Hongyuan a effectué son bachelor et son master à l'Imperial College de Londres et obtenu son doctorat au laboratoire de traitement du langage naturel de l'Université chinoise de Hong Kong, sous la direction du professeur Lin Wei, se spécialisant dans la recherche sur le traitement du langage naturel et les mécanismes fondamentaux des grands modèles. Pendant son doctorat, il a publié 14 articles principaux ou correspondants dans des conférences de haut niveau, plusieurs devenant des références dans le domaine.

FaceMind a été fondée en 2023, se concentrant initialement sur la recherche et l'application de modèles multimodaux sur appareil.

Ce qui a vraiment attiré l'attention sur eux, c'est la discussion précédente sur "Ma Jiaqi qui a fait échouer un grand modèle". À l'époque, un grand modèle pouvait décrire avec précision le parcours de Ma Jiaqi, mais ne pouvait pas produire de manière stable les trois caractères "Ma Jiaqi". Un nom ordinaire a révélé un problème fondamental dans le traitement du langage par les grands modèles : avant qu'un texte n'entre dans le modèle, il doit d'abord être découpé en tokens ; lorsque le modèle rencontre des mots peu fréquents, des noms rares ou des mots de langues minoritaires, la compréhension et la génération peuvent devenir instables.

L'équipe de Lu Hongyuan a identifié ce problème plus tôt. En 2025, ils ont publié un article sur SLoW, discutant de l'impact des mots peu fréquents sur les performances de traduction des grands modèles ; en 2026, leur article Adam’s Law a poussé le problème au niveau de la phrase – pour une même signification, plus l'expression est fréquente et courante, plus elle est facilement traitée et apprise par le modèle.

Plus surprenant encore, cette technologie liée à l'article a été adoptée par Anthropic et a été partagée et appréciée sur X par un investisseur d'Anthropic. Le jugement d'un jeune chercheur chinois né après 1995 sur les lois fondamentales des grands modèles a ainsi été remarqué par davantage de personnes.

En poursuivant dans cette direction, FaceMind a commencé à recentrer ses efforts sur les modèles mondiaux.

Pour faire simple, les grands modèles de langage sont doués pour prédire le prochain segment de texte, tandis que les modèles mondiaux doivent prédire ce qui va se passer ensuite dans un environnement. Sur un écran, cela se traduit par un GUI Agent (agent d'interface graphique utilisateur) comprenant les pages web, les documents, les boutons et les intentions de l'utilisateur ; dans le domaine de la robotique, il s'agit de comprendre l'espace, les actions et les résultats des tâches.

Le système de modèle mondial développé en interne par FaceMind s'inscrit dans cette direction. L'entreprise tente d'améliorer la stabilité des modèles dans la prédiction de séquences longues, la compréhension d'écrans et les tâches incarnées, via une architecture de modèle itérative et efficace en paramètres.

Diédiéshe est l'un des premiers terrains de validation de cette capacité. Apparemment, il s'agit d'un produit de commentaires en direct alimenté par l'IA, capable de générer des commentaires interactifs en temps réel en fonction du contenu que l'utilisateur est en train de consulter (page web, document, vidéo ou jeu). En profondeur, pour accomplir une tâche, un GUI Agent doit voir l'écran, comprendre la structure de la page, identifier la position des boutons et prédire le résultat d'un clic. Chaque changement de page, retour d'entrée et accomplissement de tâche constitue une forme de données denses pour un modèle mondial.

C'est aussi l'opportunité que FaceMind cherche à saisir : les modèles mondiaux sont en train de devenir la nouvelle porte d'entrée fondamentale de l'IA.

Intervention de Xinglian Capital et 360

Le champ de bataille le plus en vogue de l'incarnation

Le dernier financement émerge.

Récemment, FaceMind a annoncé avoir achevé un financement de série Pre-A de plusieurs dizaines de millions de yuans. Ce tour a non seulement introduit un nouvel investisseur, Xinglian Capital, mais a également reçu un investissement supplémentaire substantiel de l'ancien actionnaire 360 Capital.

Xiang Qiqi, responsable des investissements préalables du groupe 360, a déclaré : "Le Dr Lu est l'un des jeunes chercheurs en IA les plus éminents que j'aie jamais rencontrés."

À ses yeux, Lu Hongyuan ne se concentre pas sur des optimisations locales, mais sur les principes fondamentaux des modèles et l'innovation architecturale. Alors que l'industrie discutait encore du concept de modèle mondial, FaceMind entraînait déjà un modèle mondial à partir de zéro et obtenait des résultats de niveau SOTA dans l'industrie sur plusieurs benchmarks. Ensuite, Adam's Law a attiré l'attention et la validation d'Anthropic, un important fabricant de modèles étranger, et l'architecture en boucle Loop proposée récemment par l'équipe explore davantage les problèmes d'entraînement de séquences longues pour les modèles mondiaux.

"La vitesse d'itération est impressionnante. Avant chaque discussion, je consulte d'abord leurs derniers articles et rapports techniques publiés." Xiang Qiqi s'émerveille, disant avoir vraiment compris ce que signifie "un investissement pour une vie d'apprentissage".

Li Wenjue, partenaire de Xinglian Capital, a déclaré que la caractéristique la plus marquante de l'équipe de FaceMind était sa combinaison de solides capacités de recherche et d'ingénierie complexe pour la mise en œuvre. Les membres clés de l'équipe sont depuis longtemps profondément engagés dans les technologies fondamentales de l'intelligence artificielle, capables à la fois de former des jugements indépendants sur les orientations de pointe et de valider rapidement les résultats de la recherche dans des scénarios réels.

"Nous croyons en une équipe avec une densité de talents élevée, un jugement technique prospectif et une forte capacité d'exécution." À son avis, Lu Hongyuan combine l'esprit d'exploration d'un jeune chercheur et l'esprit d'action d'un entrepreneur, capable de mener l'équipe à relever continuellement des problèmes difficiles et de transformer le jugement technique en orientations de recherche claires. Ces caractéristiques du fondateur et cette cohésion d'équipe sont des raisons importantes pour lesquelles Xinglian Capital a décidé d'investir.

L'année dernière, les modèles mondiaux sont devenus un nouveau mot-clé dans l'industrie de l'IA. Derrière l'effervescence, des divergences apparaissent également : la prochaine étape de la compétition reposera-t-elle sur davantage de données et de paramètres, ou sur une nouvelle architecture pour améliorer l'efficacité d'utilisation des données limitées par les modèles ?

FaceMind a choisi la deuxième option.

Selon les informations, les caractéristiques essentielles de leur modèle développé en interne sont l'itération en boucle et l'efficacité des paramètres. En termes simples, il vise à permettre au modèle, à taille de paramètres égale, d'acquérir une plus grande capacité de prédiction de séquences longues et de déduction environnementale. L'entreprise a révélé que les performances de son modèle d'échelle 1B étaient déjà comparables à celles de modèles puissants internationaux similaires, avec une amélioration de l'efficacité des paramètres.

Actuellement, FaceMind a déjà commencé à valider cette capacité de modèle dans plusieurs scénarios. Selon les informations, sa capacité de modèle mondial a été validée dans des environnements de simulation incarnés, d'agent GUI et de bras robotisés réels. En aval, l'entreprise prévoit de fournir aux partenaires tels que les fabricants de robots, les plateformes de contenu, les fabricants de puces et de services cloud, un ensemble complet de capacités allant de la validation de scénarios, l'entraînement de modèles, le déploiement d'architecture aux services d'inférence et l'optimisation continue.

Pour Lu Hongyuan, l'opportunité des modèles mondiaux se développera avec les agents GUI et l'intelligence incarnée. À ce moment-là, la compétition entre modèles se fera sur leur capacité à comprendre les tâches, prédire les changements et accomplir les actions de manière stable. Après le financement, FaceMind continuera à investir dans la recherche et le développement de modèles mondiaux et leur validation dans de multiples scénarios.

Une jeune entreprise s'installe à la table des infrastructures de nouvelle génération de l'IA.

Cet article provient du compte WeChat "Investment Community AI", auteur : Wang Lu

Questions liées

QQui est le fondateur de FaceMind et quelle est sa formation académique ?

ALe fondateur de FaceMind est Lu Hongyuan, un entrepreneur né après 1995. Il a obtenu sa licence et son master à l'Imperial College London, puis un doctorat du laboratoire de traitement du langage naturel de l'Université chinoise de Hong Kong, sous la direction du professeur Lin Wei.

QSur quel domaine de recherche l'entreprise FaceMind s'est-elle initialement concentrée, et vers quoi a-t-elle évolué ?

AInitialement, FaceMind s'est concentrée sur le développement et l'application de modèles multimodaux de périphérie. Par la suite, l'entreprise a progressivement orienté ses efforts vers des modèles mondiaux plus fondamentaux.

QQuels investisseurs ont participé au dernier tour de financement de FaceMind et quel était le montant approximatif ?

ADans le dernier tour de financement de type Pre-A, FaceMind a levé plusieurs dizaines de millions de yuans. Les investisseurs incluent Xinglian Capital, et l'ancien actionnaire 360 a effectué un suivi avec un investissement supplémentaire.

QQu'est-ce que le modèle mondial de FaceMind tente d'accomplir, et quels sont ses principaux domaines d'application ?

ALe modèle mondial de FaceMind vise à prédire les changements dans un environnement. Ses principaux domaines d'application incluent les agents d'interface graphique (GUI Agent) pour comprendre les écrans, les documents et les intentions des utilisateurs, ainsi que l'intelligence incarnée pour les robots, comprenant l'espace, les actions et les résultats des tâches.

QQuelle est la principale caractéristique technique du modèle autonome développé par FaceMind ?

ALa principale caractéristique technique du modèle autonome de FaceMind est son architecture itérative en boucle et son efficacité paramétrique, visant à offrir une capacité de prédiction à long terme et de déduction environnementale plus forte avec la même échelle de paramètres.

Lectures associées

Le prix du Bitcoin atteint un plus bas de 20 mois, le plus grand bull ayant perdu 15 milliards de dollars

Le prix du Bitcoin est tombé en dessous de 60 000 dollars, atteignant son plus bas niveau en 20 mois. Les principaux crypto-actifs sont sous pression, avec plus d'un milliard de dollars de positions à effet de levier liquidées en 24 heures. Deux piliers clés de la précédente hausse sont fragilisés. Premièrement, le modèle de financement par émissions de titres de la société MicroStrategy (MSTR), plus grand détenteur institutionnel de Bitcoin, est menacé. Ses actions privilégiées STRC, émises pour financer l'achat de BTC, se négocient avec une décote importante, compromettant cette source majeure de demande. MSTR affiche actuellement une moins-value latente de plus de 14 milliards de dollars sur ses BTC. Deuxièmement, les ETF américains au comptoir ont connu des sorties nettes massives et soutenues en juin, représentant la pire période de retraits depuis leur lancement. Ce contexte s'ajoute à un resserrement macroéconomique, avec des anticipations de baisse des taux reportées, et à un déplacement des capitaux institutionnels vers le secteur de l'intelligence artificielle au détriment des crypto-actifs. Un événement à court terme, l'expiration d'options d'une valeur nominale d'environ 100 milliards de dollars, pourrait également accroître la volatilité.

Foresight NewsIl y a 5 mins

Le prix du Bitcoin atteint un plus bas de 20 mois, le plus grand bull ayant perdu 15 milliards de dollars

Foresight NewsIl y a 5 mins

Pourquoi les projets de crypto aiment-ils autant changer de nom ?

Dans le secteur traditionnel, la fidélité à la marque est un atout crucial, mais dans la cryptographie, plus de 16 % des projets changent de nom. Cette tendance s'explique par plusieurs raisons principales. Premièrement, la fidélité des utilisateurs est faible. La plupart des participants sont des investisseurs ou des chasseurs d'airdrop, motivés par les gains potentiels plutôt que par l'attachement à la marque. Un nom associé à des échecs, des piratages ou une baisse des prix devient un handicap. Deuxièmement, le changement de nom est une stratégie marketing. Il peut s'agir d'un réalignement stratégique (comme Matic devenant Polygon) ou d'une tentative de suivre les tendances (IA, RWA). Parfois, il sert à échapper à une mauvaise réputation après un incident. Troisièmement, le changement de nom s'accompagne souvent d'un échange de jetons, créant un espace gris. Cela peut réinitialiser les graphiques historiques et les prix, offrant aux équipes et aux market makers une opportunité de manipuler le marché. Une refonte de la tokenomics peut aussi diluer la valeur des jetons détenus par les utilisateurs. En conclusion, le vrai problème n'est pas le changement de nom en soi, mais la volonté d'effacer l'histoire. Lorsqu'un projet change de nom, il faut se demander : quelles sont ses nouvelles capacités réelles ? La tokenomics a-t-elle changé ? Que cherche-t-il à faire oublier ? Un changement justifié par des avancées concrètes peut être positif, mais s'il ne sert qu'à masquer des problèmes ou à relancer un schéma spéculatif, il représente un risque.

marsbitIl y a 24 mins

Pourquoi les projets de crypto aiment-ils autant changer de nom ?

marsbitIl y a 24 mins

Trillions de dollars en capitaux de retraite ? L'ETF Bitcoin de réinvestissement des dividendes de Franklin intègre un plafond de vente

Franklin Templeton a déposé une demande pour lancer deux ETF qui intègrent automatiquement le bitcoin dans des portefeuilles d'actions par le biais de leurs dividendes. Le mécanisme, conçu pour les conseillers financiers, repose sur l'inertie des investisseurs : les dividendes des actions (95% du portefeuille initial) sont automatiquement réinvestis en bitcoin. Le fonds maintient une allocation cible de 5% en bitcoin via des rééquilibrages trimestriels, avec un plafond strict de 20%. Cependant, l'impact acheteur est minime : les taux de dividende faibles (environ 1% ou 0,5% de l'actif total par an) génèrent des flux négligeables par rapport au marché quotidien du bitcoin. De plus, lors des hausses, le fonds devient un vendeur net pour respecter sa cible, créant potentiellement une pression vendeuse structurelle. Le produit contourne certaines restrictions réglementaires en classant le fonds comme produit actions et en détenant le bitcoin via une filiale offshore. Bien que conçu pour les régimes de retraite, son adoption à grande échelle dépendra de clarifications réglementaires. L'essence de la stratégie est de s'appuyer sur la procrastination des investisseurs plutôt que sur une conviction active envers la crypto-monnaie.

Foresight NewsIl y a 27 mins

Trillions de dollars en capitaux de retraite ? L'ETF Bitcoin de réinvestissement des dividendes de Franklin intègre un plafond de vente

Foresight NewsIl y a 27 mins

Pourquoi les projets de cryptographie aiment-ils changer de nom ?

Dans le monde traditionnel des affaires, les entreprises évitent généralement les changements de nom pour préserver leur capital marque. Cependant, dans l'industrie des crypto-monnaies, plus de 16% des projets ont changé de nom, un phénomène courant même parmi les projets de premier plan. La principale raison de cette tendance réside dans la nature même du secteur crypto. La fidélité des utilisateurs y est faible, car beaucoup sont motivés par des gains financiers potentiels plutôt que par la confiance dans une marque. Un nom associé à des baisses de prix, des piratages ou des échecs narratifs peut devenir un passif. Le changement de nom permet alors de se débarrasser de ce "bagage historique". Cette pratique peut aussi être une stratégie marketing. Elle permet de s'aligner sur de nouvelles tendances (comme l'IA ou le métavers) pour attirer l'attention, ou de recalibrer la marque après une évolution stratégique majeure, comme le fit Matic en devenant Polygon. Le vrai danger apparaît lorsque le changement de nom s'accompagne d'un échange de jetons ("token migration"). Cela peut permettre de réinitialiser les graphiques de prix, d'effacer l'historique des pertes et, parfois, de dissimuler une modification de la tokenomique entraînant une dilution de la valeur pour les détenteurs actuels. En résumé, si un changement de nom peut être légitime pour refléter une nouvelle vision, il sert souvent dans les cryptos à échapper au passé : aux mauvais souvenirs, aux investisseurs mécontents et aux récits épuisés. La question clé n'est pas le nouveau nom, mais ce que le projet cherche à faire oublier et si des changements substantiels (produit, économie de jeton) l'accompagnent vraiment.

链捕手Il y a 32 mins

Pourquoi les projets de cryptographie aiment-ils changer de nom ?

链捕手Il y a 32 mins

Entretien avec PPP : Comment la Coupe du monde déclenche le marché des prédictions et comment trouver "l'argent intelligent reproductible" ?

Alors que la Coupe du monde fait exploser le volume des marchés de prédiction, de nombreux utilisateurs se retrouvent perdus face à la volatilité des cotes et aux difficultés à identifier des opportunités de profit durables. Leur tendance à suivre manuellement les "smart money" (argent intelligent) sur les réseaux sociaux s'avère souvent inefficace, les signaux étant fugaces. Les outils de copytrading classiques, basés uniquement sur les profits totaux, peuvent aussi être des pièges, car tous les gains ne sont pas reproductibles. La plateforme PPP (Prediction Position Platform) propose une solution structurelle. Elle utilise une combinaison de modélisation IA et de vérification humaine pour analyser les adresses de trading selon de multiples critères : performance stable, taux de réussite, drawdown maximum, gestion de position, etc. L'objectif est de filtrer les stratégies "fortuites" pour ne conserver que celles dont la logique de profit est statistiquement reproductible sur le long terme. PPP organise ensuite ces stratégies en deux produits principaux : une "Place des Stratégies" pour des approches stables et vérifiées sur plus de six mois, et un "Classement des Transactions" mettant en avant les performants sur les 30 derniers jours, plus adapté aux opportunités de court terme. Chaque stratégie est décrite simplement (ex: "stratégie à haut taux de réussite implicite, forte volatilité") pour guider les utilisateurs. Accessible via un bot Telegram en subscription (actuellement à prix réduit), la plateforme permet de souscrire à ces stratégies, de configurer des paramètres de copie (montant, stop-loss...) et offre des outils comme un analyseur d'adresses par IA. Un test avec un petit capital a même généré un gain de plus de 60% en une journée, illustrant le potentiel mais aussi les risques inhérents à ce marché volatile. En résumé, PPP ne se veut pas un simple outil de copytrading, mais un système qui "compile" les signaux de trading chaotiques en stratégies structurées et vérifiées, offrant aux utilisateurs ordinaires un point d'entrée plus fiable pour naviguer dans l'incertitude des marchés de prédiction, sans toutefois garantir les résultats futurs.

Odaily星球日报Il y a 45 mins

Entretien avec PPP : Comment la Coupe du monde déclenche le marché des prédictions et comment trouver "l'argent intelligent reproductible" ?