El círculo inversor se ha enterado de que FaceMind, una empresa de modelos mundiales, completó recientemente una ronda de financiación Pre-A de decenas de millones de yuanes, con StarLink Capital como inversor y el antiguo accionista 360 superando su inversión.
Según se sabe, la nueva ronda de financiación de FaceMind ya está en marcha, con asesores financieros como Deep Capital actuando como FA, y actualmente varias instituciones de inversión han mostrado interés en invertir.
Se trata de una joven empresa de IA. Al timón está Lu Hongyuan, nacido después de 1995, quien fundó FaceMind durante sus estudios. En los últimos dos años, la empresa ha pasado de centrarse en modelos multimodales en el extremo a adentrarse en modelos mundiales más fundamentales.
A medida que la IA entra en pantallas, software y robots, comprender el mundo se está convirtiendo en el próximo gran desafío.
Dirigido por un doctorado pos-95
Aparece un equipo de modelo mundial
La historia de FaceMind comienza con Lu Hongyuan.
Este fundador nacido después de 1995 estudió su licenciatura y máster en el Imperial College de Londres y obtuvo su doctorado en el Laboratorio de Procesamiento del Lenguaje Natural de la Universidad China de Hong Kong, bajo la tutela del profesor Lin Wei, dedicándose a la investigación a largo plazo del procesamiento del lenguaje natural y los mecanismos subyacentes de los modelos de gran tamaño. Durante su doctorado, publicó 14 artículos como primer autor o autor de correspondencia en conferencias de primer nivel, muchos de los cuales se convirtieron en referencias altamente citadas en el campo.
En 2023, se fundó FaceMind, centrándose inicialmente en la investigación, desarrollo y aplicación de modelos multimodales en el extremo.
Lo que realmente llamó la atención del público fue la discusión sobre 'Ma Jiaqi hace que un modelo de gran tamaño falle'. En ese momento, un modelo de gran tamaño podía describir con precisión la trayectoria profesional de Ma Jiaqi, pero era incapaz de generar de manera estable los tres caracteres de 'Ma Jiaqi'. Un nombre común expuso inesperadamente un problema subyacente en el procesamiento del lenguaje por parte de los modelos de gran tamaño: antes de que el texto entre en el modelo, primero debe ser segmentado en tokens; cuando el modelo se encuentra con palabras de baja frecuencia, nombres poco comunes o términos de idiomas minoritarios, su comprensión y generación pueden volverse inestables.
El equipo de Lu Hongyuan detectó este problema antes. En 2025, publicaron un artículo relacionado con SLoW, discutiendo cómo las palabras de baja frecuencia afectan el rendimiento de la traducción en modelos de gran tamaño; para 2026, su artículo sobre la Ley de Adam llevó el problema al nivel de la oración: cuanto más frecuente y común sea la expresión para el mismo significado, más fácil será procesada y aprendida por el modelo.
Lo más sorprendente fue que la tecnología relacionada con este artículo fue adoptada por Anthropic y fue destacada y compartida en X por un inversor de Anthropic. La evaluación de un investigador chino nacido después de 1995 sobre las leyes subyacentes de los modelos de gran tamaño así ganó mayor visibilidad.
Siguiendo esta línea, FaceMind comenzó a centrarse en los modelos mundiales.
En pocas palabras, los modelos de lenguaje de gran tamaño son buenos para predecir el siguiente fragmento de texto, mientras que los modelos mundiales tienen que predecir lo que sucederá a continuación en un entorno. En la pantalla, esto se traduce en que los GUI Agents (agentes de interfaz gráfica de usuario) comprendan páginas web, documentos, botones e intenciones del usuario; en el campo de la robótica, implica comprender el espacio, las acciones y los resultados de las tareas.
El sistema de modelo mundial desarrollado internamente por FaceMind se centra en esta dirección. La empresa intenta mejorar la estabilidad del modelo en predicciones secuenciales largas, comprensión de pantallas y tareas corporales mediante una arquitectura de modelo iterativa cíclica y eficiente en parámetros.
DieDieShe (suponiendo que sea el nombre de un producto o plataforma) es el campo de pruebas inicial de estas capacidades. A primera vista, es un producto de subtítulos AI que puede generar subtítulos interactivos en tiempo real según el contenido de la página web, documento, video o juego que el usuario está viendo. En un nivel más profundo, para que un GUI Agent complete una tarea, debe poder ver la pantalla, comprender la estructura de la página, determinar la ubicación de los botones y predecir el resultado después de hacer clic. Cada salto de página, entrada de retroalimentación y finalización de tarea constituye un tipo de datos de modelo mundial de alta densidad.
Esta es también la oportunidad que FaceMind quiere aprovechar: los modelos mundiales se están convirtiendo en una nueva entrada subyacente para la IA.
StarLink Capital y 360 toman acción
El campo más candente de la inteligencia corpórea
La última ronda de financiación sale a la luz.
Recientemente, FaceMind anunció haber completado una ronda de financiación Pre-A de decenas de millones de yuanes. Esta ronda no solo introdujo a StarLink Capital como nuevo inversor, sino que también recibió una inversión adicional excedente del antiguo accionista 360.
Xiang Qiqi, director de inversiones del grupo 360, comentó: 'El Dr. Lu es uno de los investigadores jóvenes de IA más destacados que he conocido'.
En su opinión, la atención de Lu Hongyuan no está en optimizaciones parciales, sino en los principios subyacentes y la innovación arquitectónica de los modelos. Mientras la industria aún discutía el concepto de modelo mundial, FaceMind ya estaba entrenando modelos mundiales desde cero, logrando resultados de nivel SOTA en múltiples benchmarks. Posteriormente, la Ley de Adam llamó la atención y fue validada por el principal fabricante de modelos en el extranjero, Anthropic. La última propuesta del equipo, la arquitectura cíclica Loop, explora aún más los problemas de entrenamiento secuencial largo en modelos mundiales.
'La velocidad de iteración es asombrosa. Antes de cada comunicación, leo primero sus últimos artículos e informes técnicos publicados', comentó Xiang Qiqi, expresando que realmente experimentó lo que significa 'una inversión, aprendizaje de por vida'.
Li Wenjue, socia de StarLink Capital, señaló que la característica más destacada del equipo de FaceMind es su combinación de sólidas capacidades de investigación y de implementación de ingeniería compleja. Los miembros clave del equipo han profundizado durante mucho tiempo en tecnologías subyacentes de IA, pudiendo formar juicios independientes sobre direcciones de vanguardia y también validar rápidamente los resultados de la investigación en escenarios reales.
'Lo que vemos es un equipo con alta densidad de talento, juicio técnico prospectivo y una fuerte capacidad de ejecución'. En su opinión, Lu Hongyuan combina la curiosidad exploradora de un investigador joven con el espíritu de acción de un emprendedor, pudiendo guiar al equipo para desafiar continuamente problemas de alta dificultad y transformar el juicio técnico en direcciones claras de I+D. Este perfil del fundador y la cohesión del equipo fueron razones importantes para que StarLink Capital decidiera invertir.
En el último año, el modelo mundial se ha convertido en una nueva palabra clave en la industria de la IA. Entre el bullicio, también han surgido divergencias: ¿la competencia en la próxima etapa continuará dependiendo de datos y parámetros más grandes, o mejorará la eficiencia de uso de datos limitados por parte del modelo a través de nuevas arquitecturas?
FaceMind ha elegido lo segundo.
Según se informa, las características centrales de los modelos desarrollados internamente por la empresa son la iteración cíclica y la eficiencia de parámetros. En pocas palabras, intenta que el modelo, con la misma escala de parámetros, obtenga una mayor capacidad de predicción secuencial larga y deducción del entorno. La empresa revela que el rendimiento de su modelo de nivel 1B ya es comparable al de modelos fuertes internacionales similares, logrando una mejora en la eficiencia de parámetros.
Actualmente, FaceMind ya ha comenzado a validar esta capacidad del modelo en múltiples escenarios. Los datos muestran que su capacidad de modelo mundial ya ha sido verificada en entornos de simulación corpórea, entornos GUI Agent y entornos de brazos robóticos reales. Dirigiéndose a usuarios posteriores, la empresa planea ofrecer a socios como fabricantes de robots de cuerpo, plataformas de contenido, y fabricantes de chips y servicios en la nube, un conjunto completo de capacidades que abarca desde la verificación de escenarios y el entrenamiento de modelos hasta el despliegue arquitectónico, servicios de inferencia y la optimización continua.
En opinión de Lu Hongyuan, la oportunidad de los modelos mundiales se desplegará junto con los GUI Agents y la inteligencia corpórea. Para entonces, los modelos competirán por su capacidad para comprender tareas, predecir cambios y completar acciones de manera estable. Después de completar la financiación, FaceMind continuará invirtiendo en el desarrollo del modelo mundial y la validación multiescenario.
Una joven empresa está abriéndose paso en la mesa de juego de la próxima generación de infraestructura de IA.
Este artículo proviene del WeChat público '投资界AI', autor: Wang Lu





