Un doctorado pos-95 se dedica al modelo mundial, FaceMind recauda decenas de millones de yuanes

marsbitPublicado a 2026-06-26Actualizado a 2026-06-26

Resumen

FaceMind, una joven empresa de IA fundada por Lu Hongyuan, un doctor de 28 años, ha completado una ronda de financiación Pre-A de decenas de millones de yuanes. La inversión fue liderada por Star Connect Capital, con una participación adicional del antiguo accionista 360. La compañía, inicialmente centrada en modelos multimodales para dispositivos, ha girado su enfoque hacia el desarrollo de modelos mundiales (World Models). Estos modelos buscan predecir cambios en entornos, crucial para agentes de interfaz gráfica (GUI) e inteligencia embodada (robots). Lu Hongyuan, formado en Imperial College London y la Universidad China de Hong Kong, investigó problemas fundamentales de los LLM, como el manejo de palabras poco frecuentes. Su trabajo, incluido el "Adam's Law", llamó la atención de Anthropic. FaceMind desarrolla ahora un sistema de modelo mundial eficiente en parámetros, enfocado en predicciones de larga secuencia. Su producto "叠叠社" sirve como campo de prueba, generando comentarios en tiempo real basados en el contenido de la pantalla. Los inversores destacan la capacidad del equipo para la investigación fundamental y la ejecución técnica. FaceMind valida su tecnología en entornos de simulación, GUI y brazos robóticos reales, planeando ofrecer sus capacidades a fabricantes de robots, plataformas de contenido y proveedores de chips y cloud. Con esta financiación, la empresa intensificará la I+D y la validación en múltiples escenarios de su modelo mundial.

El círculo inversor se ha enterado de que FaceMind, una empresa de modelos mundiales, completó recientemente una ronda de financiación Pre-A de decenas de millones de yuanes, con StarLink Capital como inversor y el antiguo accionista 360 superando su inversión.

Según se sabe, la nueva ronda de financiación de FaceMind ya está en marcha, con asesores financieros como Deep Capital actuando como FA, y actualmente varias instituciones de inversión han mostrado interés en invertir.

Se trata de una joven empresa de IA. Al timón está Lu Hongyuan, nacido después de 1995, quien fundó FaceMind durante sus estudios. En los últimos dos años, la empresa ha pasado de centrarse en modelos multimodales en el extremo a adentrarse en modelos mundiales más fundamentales.

A medida que la IA entra en pantallas, software y robots, comprender el mundo se está convirtiendo en el próximo gran desafío.

Dirigido por un doctorado pos-95

Aparece un equipo de modelo mundial

La historia de FaceMind comienza con Lu Hongyuan.

Este fundador nacido después de 1995 estudió su licenciatura y máster en el Imperial College de Londres y obtuvo su doctorado en el Laboratorio de Procesamiento del Lenguaje Natural de la Universidad China de Hong Kong, bajo la tutela del profesor Lin Wei, dedicándose a la investigación a largo plazo del procesamiento del lenguaje natural y los mecanismos subyacentes de los modelos de gran tamaño. Durante su doctorado, publicó 14 artículos como primer autor o autor de correspondencia en conferencias de primer nivel, muchos de los cuales se convirtieron en referencias altamente citadas en el campo.

En 2023, se fundó FaceMind, centrándose inicialmente en la investigación, desarrollo y aplicación de modelos multimodales en el extremo.

Lo que realmente llamó la atención del público fue la discusión sobre 'Ma Jiaqi hace que un modelo de gran tamaño falle'. En ese momento, un modelo de gran tamaño podía describir con precisión la trayectoria profesional de Ma Jiaqi, pero era incapaz de generar de manera estable los tres caracteres de 'Ma Jiaqi'. Un nombre común expuso inesperadamente un problema subyacente en el procesamiento del lenguaje por parte de los modelos de gran tamaño: antes de que el texto entre en el modelo, primero debe ser segmentado en tokens; cuando el modelo se encuentra con palabras de baja frecuencia, nombres poco comunes o términos de idiomas minoritarios, su comprensión y generación pueden volverse inestables.

El equipo de Lu Hongyuan detectó este problema antes. En 2025, publicaron un artículo relacionado con SLoW, discutiendo cómo las palabras de baja frecuencia afectan el rendimiento de la traducción en modelos de gran tamaño; para 2026, su artículo sobre la Ley de Adam llevó el problema al nivel de la oración: cuanto más frecuente y común sea la expresión para el mismo significado, más fácil será procesada y aprendida por el modelo.

Lo más sorprendente fue que la tecnología relacionada con este artículo fue adoptada por Anthropic y fue destacada y compartida en X por un inversor de Anthropic. La evaluación de un investigador chino nacido después de 1995 sobre las leyes subyacentes de los modelos de gran tamaño así ganó mayor visibilidad.

Siguiendo esta línea, FaceMind comenzó a centrarse en los modelos mundiales.

En pocas palabras, los modelos de lenguaje de gran tamaño son buenos para predecir el siguiente fragmento de texto, mientras que los modelos mundiales tienen que predecir lo que sucederá a continuación en un entorno. En la pantalla, esto se traduce en que los GUI Agents (agentes de interfaz gráfica de usuario) comprendan páginas web, documentos, botones e intenciones del usuario; en el campo de la robótica, implica comprender el espacio, las acciones y los resultados de las tareas.

El sistema de modelo mundial desarrollado internamente por FaceMind se centra en esta dirección. La empresa intenta mejorar la estabilidad del modelo en predicciones secuenciales largas, comprensión de pantallas y tareas corporales mediante una arquitectura de modelo iterativa cíclica y eficiente en parámetros.

DieDieShe (suponiendo que sea el nombre de un producto o plataforma) es el campo de pruebas inicial de estas capacidades. A primera vista, es un producto de subtítulos AI que puede generar subtítulos interactivos en tiempo real según el contenido de la página web, documento, video o juego que el usuario está viendo. En un nivel más profundo, para que un GUI Agent complete una tarea, debe poder ver la pantalla, comprender la estructura de la página, determinar la ubicación de los botones y predecir el resultado después de hacer clic. Cada salto de página, entrada de retroalimentación y finalización de tarea constituye un tipo de datos de modelo mundial de alta densidad.

Esta es también la oportunidad que FaceMind quiere aprovechar: los modelos mundiales se están convirtiendo en una nueva entrada subyacente para la IA.

StarLink Capital y 360 toman acción

El campo más candente de la inteligencia corpórea

La última ronda de financiación sale a la luz.

Recientemente, FaceMind anunció haber completado una ronda de financiación Pre-A de decenas de millones de yuanes. Esta ronda no solo introdujo a StarLink Capital como nuevo inversor, sino que también recibió una inversión adicional excedente del antiguo accionista 360.

Xiang Qiqi, director de inversiones del grupo 360, comentó: 'El Dr. Lu es uno de los investigadores jóvenes de IA más destacados que he conocido'.

En su opinión, la atención de Lu Hongyuan no está en optimizaciones parciales, sino en los principios subyacentes y la innovación arquitectónica de los modelos. Mientras la industria aún discutía el concepto de modelo mundial, FaceMind ya estaba entrenando modelos mundiales desde cero, logrando resultados de nivel SOTA en múltiples benchmarks. Posteriormente, la Ley de Adam llamó la atención y fue validada por el principal fabricante de modelos en el extranjero, Anthropic. La última propuesta del equipo, la arquitectura cíclica Loop, explora aún más los problemas de entrenamiento secuencial largo en modelos mundiales.

'La velocidad de iteración es asombrosa. Antes de cada comunicación, leo primero sus últimos artículos e informes técnicos publicados', comentó Xiang Qiqi, expresando que realmente experimentó lo que significa 'una inversión, aprendizaje de por vida'.

Li Wenjue, socia de StarLink Capital, señaló que la característica más destacada del equipo de FaceMind es su combinación de sólidas capacidades de investigación y de implementación de ingeniería compleja. Los miembros clave del equipo han profundizado durante mucho tiempo en tecnologías subyacentes de IA, pudiendo formar juicios independientes sobre direcciones de vanguardia y también validar rápidamente los resultados de la investigación en escenarios reales.

'Lo que vemos es un equipo con alta densidad de talento, juicio técnico prospectivo y una fuerte capacidad de ejecución'. En su opinión, Lu Hongyuan combina la curiosidad exploradora de un investigador joven con el espíritu de acción de un emprendedor, pudiendo guiar al equipo para desafiar continuamente problemas de alta dificultad y transformar el juicio técnico en direcciones claras de I+D. Este perfil del fundador y la cohesión del equipo fueron razones importantes para que StarLink Capital decidiera invertir.

En el último año, el modelo mundial se ha convertido en una nueva palabra clave en la industria de la IA. Entre el bullicio, también han surgido divergencias: ¿la competencia en la próxima etapa continuará dependiendo de datos y parámetros más grandes, o mejorará la eficiencia de uso de datos limitados por parte del modelo a través de nuevas arquitecturas?

FaceMind ha elegido lo segundo.

Según se informa, las características centrales de los modelos desarrollados internamente por la empresa son la iteración cíclica y la eficiencia de parámetros. En pocas palabras, intenta que el modelo, con la misma escala de parámetros, obtenga una mayor capacidad de predicción secuencial larga y deducción del entorno. La empresa revela que el rendimiento de su modelo de nivel 1B ya es comparable al de modelos fuertes internacionales similares, logrando una mejora en la eficiencia de parámetros.

Actualmente, FaceMind ya ha comenzado a validar esta capacidad del modelo en múltiples escenarios. Los datos muestran que su capacidad de modelo mundial ya ha sido verificada en entornos de simulación corpórea, entornos GUI Agent y entornos de brazos robóticos reales. Dirigiéndose a usuarios posteriores, la empresa planea ofrecer a socios como fabricantes de robots de cuerpo, plataformas de contenido, y fabricantes de chips y servicios en la nube, un conjunto completo de capacidades que abarca desde la verificación de escenarios y el entrenamiento de modelos hasta el despliegue arquitectónico, servicios de inferencia y la optimización continua.

En opinión de Lu Hongyuan, la oportunidad de los modelos mundiales se desplegará junto con los GUI Agents y la inteligencia corpórea. Para entonces, los modelos competirán por su capacidad para comprender tareas, predecir cambios y completar acciones de manera estable. Después de completar la financiación, FaceMind continuará invirtiendo en el desarrollo del modelo mundial y la validación multiescenario.

Una joven empresa está abriéndose paso en la mesa de juego de la próxima generación de infraestructura de IA.

Este artículo proviene del WeChat público '投资界AI', autor: Wang Lu

Preguntas relacionadas

Q¿Qué es FaceMind y qué anunció recientemente en cuanto a financiación?

AFaceMind (脸谱心智) es una joven empresa de IA centrada en modelos de mundo. Recientemente completó una ronda de financiación Pre-A por decenas de millones de yuanes, liderada por Star Chain Capital (星连资本), con su accionista actual 360 realizando una inversión adicional.

Q¿Quién es el fundador de FaceMind y cuál es su formación?

AEl fundador y director de FaceMind es Lu Hongyuan (陆弘远), nacido después de 1995. Completó su licenciatura y maestría en Imperial College London y obtuvo su doctorado en el Laboratorio de Procesamiento del Lenguaje Natural de la Universidad China de Hong Kong, donde investigó procesamiento del lenguaje natural y mecanismos subyacentes de modelos grandes, publicando múltiples artículos de gran impacto.

Q¿En qué se centraba inicialmente FaceMind y hacia qué dirección ha evolucionado?

AFaceMind se fundó inicialmente enfocándose en el desarrollo y aplicación de modelos multimodales completos para dispositivos de borde. Posteriormente, la empresa cambió su enfoque hacia los modelos de mundo más fundamentales, que predicen lo que sucederá a continuación en un entorno, aplicable a agentes GUI y robótica.

Q¿Qué es un 'modelo de mundo' según se describe en el artículo y cómo lo está desarrollando FaceMind?

ASegún el artículo, un modelo de mundo predice lo que sucederá a continuación en un entorno, a diferencia de un modelo de lenguaje grande que predice el siguiente texto. FaceMind está desarrollando un sistema de modelo de mundo autónomo que se centra en la arquitectura iterativa cíclica y eficiente en parámetros para mejorar la estabilidad en predicciones de secuencias largas, comprensión de pantallas y tareas corporizadas.

Q¿Qué características del equipo de FaceMind destacaron los inversores como razones clave para financiarlos?

ALos inversores, Star Chain Capital y 360, destacaron la sólida capacidad investigadora y de ingeniería del equipo, su juicio técnico prospectivo y su fuerte capacidad de ejecución. Específicamente, elogiaron al fundador Lu Hongyuan por su espíritu explorador y su capacidad para transformar la visión técnica en una dirección de desarrollo clara, así como la alta densidad de talento y cohesión del equipo.

Lecturas Relacionadas

La primera certificación antiexplosiva nacional y el primer esquema mundial de 'Cerebro de Repostaje', ¿cómo lograron conquistar estos dos 'números uno'?

Según las estadísticas, la financiación en el campo de la inteligencia encarnada en China superó los 37.000 millones de yuanes este año. La tendencia clave actual es la implementación práctica. La exposición a entornos peligrosos, como estaciones de servicio y plantas químicas, requiere que los robots superen la primera barrera crítica: la certificación a prueba de explosiones. Esto implica requisitos de diseño estrictos a nivel de hardware para garantizar la seguridad intrínseca. La aplicación en estaciones de servicio enfrenta el desafío de la precisión en operaciones continuas de múltiples pasos, como abrir la tapa del depósito y manipular la manguera de combustible, con una tolerancia de solo unos pocos milímetros. Los escenarios de inspección en plantas requieren capacidades de patrulla autónoma, identificación de anomalías y respuesta inmediata durante largos períodos. Para abordar estos desafíos, se destaca un enfoque arquitectónico innovador impulsado por un modelo del mundo (H-GAR). En lugar de una arquitectura lineal tradicional, este sistema predice primero el estado visual objetivo final de la tarea. Luego, sintetiza fotogramas intermedios de transición guiados por ese objetivo y refina las acciones utilizando retroalimentación contextual visual y una memoria de acciones históricas. Este mecanismo permite al robot "imaginar" la trayectoria completa de la tarea y alinear sus acciones con el estado final deseado, reduciendo significativamente la desviación acumulativa en secuencias largas y complejas. La implementación en escenarios especiales requiere un acoplamiento profundo entre el "cerebro" de IA encarnada y el cuerpo robótico, junto con un espíritu de perseverancia a largo plazo. Los primeros en lograr este ciclo cerrado de cerebro-cuerpo-datos podrían obtener una ventaja competitiva crucial en la carrera por la comercialización de la inteligencia encarnada.

marsbitHace 30 min(s)

La primera certificación antiexplosiva nacional y el primer esquema mundial de 'Cerebro de Repostaje', ¿cómo lograron conquistar estos dos 'números uno'?

marsbitHace 30 min(s)

El mercado bajista de Bitcoin provoca despidos en el sector cripto, pero desata la ola de fusiones y adquisiciones más agresiva de la historia de la industria

La prolongada caída del Bitcoin está forzando a empresas de criptomonedas a recortar personal y abandonar planes de expansión, pero al mismo tiempo ha desatado la ola de fusiones y adquisiciones más agresiva en la historia del sector. En el primer semestre de 2026, el volumen de transacciones de M&A alcanzó los 93.700 millones de dólares, 26 veces más que el año anterior. Esta aceleración contrasta con un mercado laboral en contracción, donde solo hay unos 2.900 puestos vacantes activos a nivel global y se priorizan roles en ingeniería y cumplimiento normativo. El capital disponible se ha vuelto selectivo, fluyendo hacia infraestructura que conecta con las finanzas tradicionales. Las instituciones financieras tradicionales, como bancos y procesadores de pagos, están impulsando esta ola al adquirir empresas con licencias regulatorias, soluciones de custodia y sistemas de pagos ya establecidos, en lugar de construirlos internamente. Ejemplos incluyen la compra de BVNK por parte de Mastercard. Al mismo tiempo, redes blockchain como Polygon están adquiriendo aplicaciones de consumo para asegurar una experiencia de usuario integral. En resumen, el mercado bajista está consolidando el sector. Debilita a empresas con modelos más frágiles, que se convierten en objetivos de adquisición, mientras premia con capital e interés de compra a aquellos que proveen infraestructura regulada y puentes con el sistema financiero tradicional.

marsbitHace 30 min(s)

El mercado bajista de Bitcoin provoca despidos en el sector cripto, pero desata la ola de fusiones y adquisiciones más agresiva de la historia de la industria

marsbitHace 30 min(s)

Empleados de Anthropic renuncian para emprender, valorados en 10,000 millones de dólares, también desarrollan «mejora autorrecursiva»

Empleados de Anthropic fundan Mirendil, una startup valorada en 10.000 millones de dólares que busca desarrollar IA con "mejora recursiva" Dos antiguos investigadores de Anthropic, Behnam Neyshabur y Harsh Mehta, han fundado Mirendil, una startup con una financiación inicial de 200 millones de dólares y una valoración de 10.000 millones. Su objetivo es crear herramientas para que científicos de campos como la medicina o la ciencia de materiales puedan desarrollar y entrenar sus propios modelos de IA, en lugar de depender de modelos generales de grandes tecnológicas. La compañía, cuyo nombre proviene del élfico de "El Señor de los Anillos" y significa "amigo de las joyas", cuenta con un equipo de 20 personas procedentes de Anthropic, xAI, Google DeepMind y OpenAI. Su financiación procede de Andreessen Horowitz, Kleiner Perkins y Nvidia. La visión de Mirendil es facilitar la "IA para la IA para la ciencia": una plataforma que permita a los laboratorios de investigación construir modelos de IA especializados y propietarios. Su enfoque técnico central es la "mejora recursiva" (recursive self-improvement), donde la IA optimiza continuamente su propio código y capacidades bajo supervisión humana. Los fundadores creen que existe una oportunidad en el mercado, ya que las grandes compañías de IA, como la propia Anthropic, utilizan sus modelos principalmente para acelerar su investigación interna y restringen su uso para entrenar productos competidores. Mirendil planea lanzar sus primeros productos en los próximos meses.

marsbitHace 54 min(s)

Empleados de Anthropic renuncian para emprender, valorados en 10,000 millones de dólares, también desarrollan «mejora autorrecursiva»

marsbitHace 54 min(s)

Trading

Spot
Futuros
活动图片