Selon Investment Community, l'entreprise de modèles mondiaux FaceMind a récemment achevé un financement de série Pre-A de plusieurs dizaines de millions de yuans, avec Xinglian Capital comme investisseur et l'ancien actionnaire 360 Capital qui a surenchéri.
Il est rapporté que le prochain tour de financement de FaceMind est déjà en cours, avec des conseillers financiers comme Shendu Capital agissant en tant que FA, et des intentions d'investissement ont déjà été exprimées par certaines institutions.
C'est une jeune entreprise d'IA. Son PDG, Lu Hongyuan, né après 1995, a fondé FaceMind pendant ses études. Ces deux dernières années, l'entreprise est passée d'un modèle multimodal sur appareil à des modèles mondiaux plus fondamentaux.
Alors que l'IA pénètre les écrans, les logiciels et les robots, comprendre le monde devient la prochaine étape.
Dirigé par un docteur né après 1995
Une équipe de modélisation mondiale émerge
L'histoire de FaceMind commence avec Lu Hongyuan.
Fondateur né après 1995, Lu Hongyuan a effectué son bachelor et son master à l'Imperial College de Londres et obtenu son doctorat au laboratoire de traitement du langage naturel de l'Université chinoise de Hong Kong, sous la direction du professeur Lin Wei, se spécialisant dans la recherche sur le traitement du langage naturel et les mécanismes fondamentaux des grands modèles. Pendant son doctorat, il a publié 14 articles principaux ou correspondants dans des conférences de haut niveau, plusieurs devenant des références dans le domaine.
FaceMind a été fondée en 2023, se concentrant initialement sur la recherche et l'application de modèles multimodaux sur appareil.
Ce qui a vraiment attiré l'attention sur eux, c'est la discussion précédente sur "Ma Jiaqi qui a fait échouer un grand modèle". À l'époque, un grand modèle pouvait décrire avec précision le parcours de Ma Jiaqi, mais ne pouvait pas produire de manière stable les trois caractères "Ma Jiaqi". Un nom ordinaire a révélé un problème fondamental dans le traitement du langage par les grands modèles : avant qu'un texte n'entre dans le modèle, il doit d'abord être découpé en tokens ; lorsque le modèle rencontre des mots peu fréquents, des noms rares ou des mots de langues minoritaires, la compréhension et la génération peuvent devenir instables.
L'équipe de Lu Hongyuan a identifié ce problème plus tôt. En 2025, ils ont publié un article sur SLoW, discutant de l'impact des mots peu fréquents sur les performances de traduction des grands modèles ; en 2026, leur article Adam’s Law a poussé le problème au niveau de la phrase – pour une même signification, plus l'expression est fréquente et courante, plus elle est facilement traitée et apprise par le modèle.
Plus surprenant encore, cette technologie liée à l'article a été adoptée par Anthropic et a été partagée et appréciée sur X par un investisseur d'Anthropic. Le jugement d'un jeune chercheur chinois né après 1995 sur les lois fondamentales des grands modèles a ainsi été remarqué par davantage de personnes.
En poursuivant dans cette direction, FaceMind a commencé à recentrer ses efforts sur les modèles mondiaux.
Pour faire simple, les grands modèles de langage sont doués pour prédire le prochain segment de texte, tandis que les modèles mondiaux doivent prédire ce qui va se passer ensuite dans un environnement. Sur un écran, cela se traduit par un GUI Agent (agent d'interface graphique utilisateur) comprenant les pages web, les documents, les boutons et les intentions de l'utilisateur ; dans le domaine de la robotique, il s'agit de comprendre l'espace, les actions et les résultats des tâches.
Le système de modèle mondial développé en interne par FaceMind s'inscrit dans cette direction. L'entreprise tente d'améliorer la stabilité des modèles dans la prédiction de séquences longues, la compréhension d'écrans et les tâches incarnées, via une architecture de modèle itérative et efficace en paramètres.
Diédiéshe est l'un des premiers terrains de validation de cette capacité. Apparemment, il s'agit d'un produit de commentaires en direct alimenté par l'IA, capable de générer des commentaires interactifs en temps réel en fonction du contenu que l'utilisateur est en train de consulter (page web, document, vidéo ou jeu). En profondeur, pour accomplir une tâche, un GUI Agent doit voir l'écran, comprendre la structure de la page, identifier la position des boutons et prédire le résultat d'un clic. Chaque changement de page, retour d'entrée et accomplissement de tâche constitue une forme de données denses pour un modèle mondial.
C'est aussi l'opportunité que FaceMind cherche à saisir : les modèles mondiaux sont en train de devenir la nouvelle porte d'entrée fondamentale de l'IA.
Intervention de Xinglian Capital et 360
Le champ de bataille le plus en vogue de l'incarnation
Le dernier financement émerge.
Récemment, FaceMind a annoncé avoir achevé un financement de série Pre-A de plusieurs dizaines de millions de yuans. Ce tour a non seulement introduit un nouvel investisseur, Xinglian Capital, mais a également reçu un investissement supplémentaire substantiel de l'ancien actionnaire 360 Capital.
Xiang Qiqi, responsable des investissements préalables du groupe 360, a déclaré : "Le Dr Lu est l'un des jeunes chercheurs en IA les plus éminents que j'aie jamais rencontrés."
À ses yeux, Lu Hongyuan ne se concentre pas sur des optimisations locales, mais sur les principes fondamentaux des modèles et l'innovation architecturale. Alors que l'industrie discutait encore du concept de modèle mondial, FaceMind entraînait déjà un modèle mondial à partir de zéro et obtenait des résultats de niveau SOTA dans l'industrie sur plusieurs benchmarks. Ensuite, Adam's Law a attiré l'attention et la validation d'Anthropic, un important fabricant de modèles étranger, et l'architecture en boucle Loop proposée récemment par l'équipe explore davantage les problèmes d'entraînement de séquences longues pour les modèles mondiaux.
"La vitesse d'itération est impressionnante. Avant chaque discussion, je consulte d'abord leurs derniers articles et rapports techniques publiés." Xiang Qiqi s'émerveille, disant avoir vraiment compris ce que signifie "un investissement pour une vie d'apprentissage".
Li Wenjue, partenaire de Xinglian Capital, a déclaré que la caractéristique la plus marquante de l'équipe de FaceMind était sa combinaison de solides capacités de recherche et d'ingénierie complexe pour la mise en œuvre. Les membres clés de l'équipe sont depuis longtemps profondément engagés dans les technologies fondamentales de l'intelligence artificielle, capables à la fois de former des jugements indépendants sur les orientations de pointe et de valider rapidement les résultats de la recherche dans des scénarios réels.
"Nous croyons en une équipe avec une densité de talents élevée, un jugement technique prospectif et une forte capacité d'exécution." À son avis, Lu Hongyuan combine l'esprit d'exploration d'un jeune chercheur et l'esprit d'action d'un entrepreneur, capable de mener l'équipe à relever continuellement des problèmes difficiles et de transformer le jugement technique en orientations de recherche claires. Ces caractéristiques du fondateur et cette cohésion d'équipe sont des raisons importantes pour lesquelles Xinglian Capital a décidé d'investir.
L'année dernière, les modèles mondiaux sont devenus un nouveau mot-clé dans l'industrie de l'IA. Derrière l'effervescence, des divergences apparaissent également : la prochaine étape de la compétition reposera-t-elle sur davantage de données et de paramètres, ou sur une nouvelle architecture pour améliorer l'efficacité d'utilisation des données limitées par les modèles ?
FaceMind a choisi la deuxième option.
Selon les informations, les caractéristiques essentielles de leur modèle développé en interne sont l'itération en boucle et l'efficacité des paramètres. En termes simples, il vise à permettre au modèle, à taille de paramètres égale, d'acquérir une plus grande capacité de prédiction de séquences longues et de déduction environnementale. L'entreprise a révélé que les performances de son modèle d'échelle 1B étaient déjà comparables à celles de modèles puissants internationaux similaires, avec une amélioration de l'efficacité des paramètres.
Actuellement, FaceMind a déjà commencé à valider cette capacité de modèle dans plusieurs scénarios. Selon les informations, sa capacité de modèle mondial a été validée dans des environnements de simulation incarnés, d'agent GUI et de bras robotisés réels. En aval, l'entreprise prévoit de fournir aux partenaires tels que les fabricants de robots, les plateformes de contenu, les fabricants de puces et de services cloud, un ensemble complet de capacités allant de la validation de scénarios, l'entraînement de modèles, le déploiement d'architecture aux services d'inférence et l'optimisation continue.
Pour Lu Hongyuan, l'opportunité des modèles mondiaux se développera avec les agents GUI et l'intelligence incarnée. À ce moment-là, la compétition entre modèles se fera sur leur capacité à comprendre les tâches, prédire les changements et accomplir les actions de manière stable. Après le financement, FaceMind continuera à investir dans la recherche et le développement de modèles mondiaux et leur validation dans de multiples scénarios.
Une jeune entreprise s'installe à la table des infrastructures de nouvelle génération de l'IA.
Cet article provient du compte WeChat "Investment Community AI", auteur : Wang Lu





