Un doctorado pos-95 se dedica al modelo mundial, FaceMind recauda decenas de millones de yuanes

marsbitPublicado a 2026-06-26Actualizado a 2026-06-26

Resumen

FaceMind, una joven empresa de IA fundada por Lu Hongyuan, un doctor de 28 años, ha completado una ronda de financiación Pre-A de decenas de millones de yuanes. La inversión fue liderada por Star Connect Capital, con una participación adicional del antiguo accionista 360. La compañía, inicialmente centrada en modelos multimodales para dispositivos, ha girado su enfoque hacia el desarrollo de modelos mundiales (World Models). Estos modelos buscan predecir cambios en entornos, crucial para agentes de interfaz gráfica (GUI) e inteligencia embodada (robots). Lu Hongyuan, formado en Imperial College London y la Universidad China de Hong Kong, investigó problemas fundamentales de los LLM, como el manejo de palabras poco frecuentes. Su trabajo, incluido el "Adam's Law", llamó la atención de Anthropic. FaceMind desarrolla ahora un sistema de modelo mundial eficiente en parámetros, enfocado en predicciones de larga secuencia. Su producto "叠叠社" sirve como campo de prueba, generando comentarios en tiempo real basados en el contenido de la pantalla. Los inversores destacan la capacidad del equipo para la investigación fundamental y la ejecución técnica. FaceMind valida su tecnología en entornos de simulación, GUI y brazos robóticos reales, planeando ofrecer sus capacidades a fabricantes de robots, plataformas de contenido y proveedores de chips y cloud. Con esta financiación, la empresa intensificará la I+D y la validación en múltiples escenarios de su modelo mundial.

El círculo inversor se ha enterado de que FaceMind, una empresa de modelos mundiales, completó recientemente una ronda de financiación Pre-A de decenas de millones de yuanes, con StarLink Capital como inversor y el antiguo accionista 360 superando su inversión.

Según se sabe, la nueva ronda de financiación de FaceMind ya está en marcha, con asesores financieros como Deep Capital actuando como FA, y actualmente varias instituciones de inversión han mostrado interés en invertir.

Se trata de una joven empresa de IA. Al timón está Lu Hongyuan, nacido después de 1995, quien fundó FaceMind durante sus estudios. En los últimos dos años, la empresa ha pasado de centrarse en modelos multimodales en el extremo a adentrarse en modelos mundiales más fundamentales.

A medida que la IA entra en pantallas, software y robots, comprender el mundo se está convirtiendo en el próximo gran desafío.

Dirigido por un doctorado pos-95

Aparece un equipo de modelo mundial

La historia de FaceMind comienza con Lu Hongyuan.

Este fundador nacido después de 1995 estudió su licenciatura y máster en el Imperial College de Londres y obtuvo su doctorado en el Laboratorio de Procesamiento del Lenguaje Natural de la Universidad China de Hong Kong, bajo la tutela del profesor Lin Wei, dedicándose a la investigación a largo plazo del procesamiento del lenguaje natural y los mecanismos subyacentes de los modelos de gran tamaño. Durante su doctorado, publicó 14 artículos como primer autor o autor de correspondencia en conferencias de primer nivel, muchos de los cuales se convirtieron en referencias altamente citadas en el campo.

En 2023, se fundó FaceMind, centrándose inicialmente en la investigación, desarrollo y aplicación de modelos multimodales en el extremo.

Lo que realmente llamó la atención del público fue la discusión sobre 'Ma Jiaqi hace que un modelo de gran tamaño falle'. En ese momento, un modelo de gran tamaño podía describir con precisión la trayectoria profesional de Ma Jiaqi, pero era incapaz de generar de manera estable los tres caracteres de 'Ma Jiaqi'. Un nombre común expuso inesperadamente un problema subyacente en el procesamiento del lenguaje por parte de los modelos de gran tamaño: antes de que el texto entre en el modelo, primero debe ser segmentado en tokens; cuando el modelo se encuentra con palabras de baja frecuencia, nombres poco comunes o términos de idiomas minoritarios, su comprensión y generación pueden volverse inestables.

El equipo de Lu Hongyuan detectó este problema antes. En 2025, publicaron un artículo relacionado con SLoW, discutiendo cómo las palabras de baja frecuencia afectan el rendimiento de la traducción en modelos de gran tamaño; para 2026, su artículo sobre la Ley de Adam llevó el problema al nivel de la oración: cuanto más frecuente y común sea la expresión para el mismo significado, más fácil será procesada y aprendida por el modelo.

Lo más sorprendente fue que la tecnología relacionada con este artículo fue adoptada por Anthropic y fue destacada y compartida en X por un inversor de Anthropic. La evaluación de un investigador chino nacido después de 1995 sobre las leyes subyacentes de los modelos de gran tamaño así ganó mayor visibilidad.

Siguiendo esta línea, FaceMind comenzó a centrarse en los modelos mundiales.

En pocas palabras, los modelos de lenguaje de gran tamaño son buenos para predecir el siguiente fragmento de texto, mientras que los modelos mundiales tienen que predecir lo que sucederá a continuación en un entorno. En la pantalla, esto se traduce en que los GUI Agents (agentes de interfaz gráfica de usuario) comprendan páginas web, documentos, botones e intenciones del usuario; en el campo de la robótica, implica comprender el espacio, las acciones y los resultados de las tareas.

El sistema de modelo mundial desarrollado internamente por FaceMind se centra en esta dirección. La empresa intenta mejorar la estabilidad del modelo en predicciones secuenciales largas, comprensión de pantallas y tareas corporales mediante una arquitectura de modelo iterativa cíclica y eficiente en parámetros.

DieDieShe (suponiendo que sea el nombre de un producto o plataforma) es el campo de pruebas inicial de estas capacidades. A primera vista, es un producto de subtítulos AI que puede generar subtítulos interactivos en tiempo real según el contenido de la página web, documento, video o juego que el usuario está viendo. En un nivel más profundo, para que un GUI Agent complete una tarea, debe poder ver la pantalla, comprender la estructura de la página, determinar la ubicación de los botones y predecir el resultado después de hacer clic. Cada salto de página, entrada de retroalimentación y finalización de tarea constituye un tipo de datos de modelo mundial de alta densidad.

Esta es también la oportunidad que FaceMind quiere aprovechar: los modelos mundiales se están convirtiendo en una nueva entrada subyacente para la IA.

StarLink Capital y 360 toman acción

El campo más candente de la inteligencia corpórea

La última ronda de financiación sale a la luz.

Recientemente, FaceMind anunció haber completado una ronda de financiación Pre-A de decenas de millones de yuanes. Esta ronda no solo introdujo a StarLink Capital como nuevo inversor, sino que también recibió una inversión adicional excedente del antiguo accionista 360.

Xiang Qiqi, director de inversiones del grupo 360, comentó: 'El Dr. Lu es uno de los investigadores jóvenes de IA más destacados que he conocido'.

En su opinión, la atención de Lu Hongyuan no está en optimizaciones parciales, sino en los principios subyacentes y la innovación arquitectónica de los modelos. Mientras la industria aún discutía el concepto de modelo mundial, FaceMind ya estaba entrenando modelos mundiales desde cero, logrando resultados de nivel SOTA en múltiples benchmarks. Posteriormente, la Ley de Adam llamó la atención y fue validada por el principal fabricante de modelos en el extranjero, Anthropic. La última propuesta del equipo, la arquitectura cíclica Loop, explora aún más los problemas de entrenamiento secuencial largo en modelos mundiales.

'La velocidad de iteración es asombrosa. Antes de cada comunicación, leo primero sus últimos artículos e informes técnicos publicados', comentó Xiang Qiqi, expresando que realmente experimentó lo que significa 'una inversión, aprendizaje de por vida'.

Li Wenjue, socia de StarLink Capital, señaló que la característica más destacada del equipo de FaceMind es su combinación de sólidas capacidades de investigación y de implementación de ingeniería compleja. Los miembros clave del equipo han profundizado durante mucho tiempo en tecnologías subyacentes de IA, pudiendo formar juicios independientes sobre direcciones de vanguardia y también validar rápidamente los resultados de la investigación en escenarios reales.

'Lo que vemos es un equipo con alta densidad de talento, juicio técnico prospectivo y una fuerte capacidad de ejecución'. En su opinión, Lu Hongyuan combina la curiosidad exploradora de un investigador joven con el espíritu de acción de un emprendedor, pudiendo guiar al equipo para desafiar continuamente problemas de alta dificultad y transformar el juicio técnico en direcciones claras de I+D. Este perfil del fundador y la cohesión del equipo fueron razones importantes para que StarLink Capital decidiera invertir.

En el último año, el modelo mundial se ha convertido en una nueva palabra clave en la industria de la IA. Entre el bullicio, también han surgido divergencias: ¿la competencia en la próxima etapa continuará dependiendo de datos y parámetros más grandes, o mejorará la eficiencia de uso de datos limitados por parte del modelo a través de nuevas arquitecturas?

FaceMind ha elegido lo segundo.

Según se informa, las características centrales de los modelos desarrollados internamente por la empresa son la iteración cíclica y la eficiencia de parámetros. En pocas palabras, intenta que el modelo, con la misma escala de parámetros, obtenga una mayor capacidad de predicción secuencial larga y deducción del entorno. La empresa revela que el rendimiento de su modelo de nivel 1B ya es comparable al de modelos fuertes internacionales similares, logrando una mejora en la eficiencia de parámetros.

Actualmente, FaceMind ya ha comenzado a validar esta capacidad del modelo en múltiples escenarios. Los datos muestran que su capacidad de modelo mundial ya ha sido verificada en entornos de simulación corpórea, entornos GUI Agent y entornos de brazos robóticos reales. Dirigiéndose a usuarios posteriores, la empresa planea ofrecer a socios como fabricantes de robots de cuerpo, plataformas de contenido, y fabricantes de chips y servicios en la nube, un conjunto completo de capacidades que abarca desde la verificación de escenarios y el entrenamiento de modelos hasta el despliegue arquitectónico, servicios de inferencia y la optimización continua.

En opinión de Lu Hongyuan, la oportunidad de los modelos mundiales se desplegará junto con los GUI Agents y la inteligencia corpórea. Para entonces, los modelos competirán por su capacidad para comprender tareas, predecir cambios y completar acciones de manera estable. Después de completar la financiación, FaceMind continuará invirtiendo en el desarrollo del modelo mundial y la validación multiescenario.

Una joven empresa está abriéndose paso en la mesa de juego de la próxima generación de infraestructura de IA.

Este artículo proviene del WeChat público '投资界AI', autor: Wang Lu

Preguntas relacionadas

Q¿Qué es FaceMind y qué anunció recientemente en cuanto a financiación?

AFaceMind (脸谱心智) es una joven empresa de IA centrada en modelos de mundo. Recientemente completó una ronda de financiación Pre-A por decenas de millones de yuanes, liderada por Star Chain Capital (星连资本), con su accionista actual 360 realizando una inversión adicional.

Q¿Quién es el fundador de FaceMind y cuál es su formación?

AEl fundador y director de FaceMind es Lu Hongyuan (陆弘远), nacido después de 1995. Completó su licenciatura y maestría en Imperial College London y obtuvo su doctorado en el Laboratorio de Procesamiento del Lenguaje Natural de la Universidad China de Hong Kong, donde investigó procesamiento del lenguaje natural y mecanismos subyacentes de modelos grandes, publicando múltiples artículos de gran impacto.

Q¿En qué se centraba inicialmente FaceMind y hacia qué dirección ha evolucionado?

AFaceMind se fundó inicialmente enfocándose en el desarrollo y aplicación de modelos multimodales completos para dispositivos de borde. Posteriormente, la empresa cambió su enfoque hacia los modelos de mundo más fundamentales, que predicen lo que sucederá a continuación en un entorno, aplicable a agentes GUI y robótica.

Q¿Qué es un 'modelo de mundo' según se describe en el artículo y cómo lo está desarrollando FaceMind?

ASegún el artículo, un modelo de mundo predice lo que sucederá a continuación en un entorno, a diferencia de un modelo de lenguaje grande que predice el siguiente texto. FaceMind está desarrollando un sistema de modelo de mundo autónomo que se centra en la arquitectura iterativa cíclica y eficiente en parámetros para mejorar la estabilidad en predicciones de secuencias largas, comprensión de pantallas y tareas corporizadas.

Q¿Qué características del equipo de FaceMind destacaron los inversores como razones clave para financiarlos?

ALos inversores, Star Chain Capital y 360, destacaron la sólida capacidad investigadora y de ingeniería del equipo, su juicio técnico prospectivo y su fuerte capacidad de ejecución. Específicamente, elogiaron al fundador Lu Hongyuan por su espíritu explorador y su capacidad para transformar la visión técnica en una dirección de desarrollo clara, así como la alta densidad de talento y cohesión del equipo.

Lecturas Relacionadas

¿STRC cae por debajo de 80 dólares? ¿Los inversores conservadores aún pueden comprar en la caída?

STRC, la acción preferente perpetua de MicroStrategy (MSTR), cotiza con un fuerte descuento, por debajo de su valor nominal de 80 dólares, ofreciendo un rendimiento de dividendos aparente elevado (13-15%). El artículo analiza si esto representa una oportunidad de compra o un riesgo estructural. El núcleo del debate es si el modelo de financiación de MSTR (emitir valores como STRC para comprar más Bitcoin) puede sostenerse. El reciente descuento de STRC refleja la preocupación del mercado por: 1) la presión sobre el diferencial de precio de MSTR frente al valor de sus BTC (mNAV), 2) la interrupción de nuevas emisiones de STRC a valor nominal, 3) la competencia de productos similares como SATA, y 4) la venta simbólica de BTC por parte de MSTR para cubrir pagos de dividendos, lo que cuestiona el discurso de "solo comprar". STRC no es un esquema Ponzi, ya que está respaldado por las grandes reservas de BTC de MSTR. Sin embargo, su riesgo es la dependencia de un flujo continuo de financiación barata. Un "colapso" no sería una liquidación repentina, sino una erosión de la confianza: si BTC entra en un mercado bajista profundo, el mNAV de MSTR se contrae, STRC cotiza con un gran descuento permanente y los dividendos dependen cada vez más de la venta de BTC, la narrativa financiera se rompería. En resumen, STRC es una apuesta de alto rendimiento sobre la capacidad de MSTR para mantener su modelo de financiación basado en Bitcoin durante los ciclos bajistas. No es un activo de renta fija sin riesgo. Su atractivo depende de si el inversor apuesta a una recuperación técnica del precio hacia los 100 dólares o está dispuesto a asumir el riesgo de un rendimiento a largo plazo con posibles aplazamientos de dividendos y descuentos persistentes.

marsbitHace 19 min(s)

¿STRC cae por debajo de 80 dólares? ¿Los inversores conservadores aún pueden comprar en la caída?

marsbitHace 19 min(s)

¿Entrada para billones de fondos de pensiones? El ETF de reinversión de dividendos en Bitcoin de Franklin tiene un límite máximo de presión de venta

El gigante de inversiones Franklin Templeton ha solicitado autorización para lanzar dos ETFs que integran una exposición automática a Bitcoin. Estos fondos, llamados "ETF de reinversión de dividendos en Bitcoin", emplean la estrategia de "configuración por defecto" común en planes de pensiones 401(k). Inicialmente, asignarían un 95% a acciones y un 5% a Bitcoin, utilizando los dividendos de las acciones para comprar Bitcoin automáticamente. Sin embargo, el diseño incluye un mecanismo de rebalanceo trimestral que obliga a vender Bitcoin si su ponderación supera el 5%, reduciéndola al 4,5%. Además, establece un límite máximo del 20% para la exposición a Bitcoin. Según el análisis, el impacto de compra sería mínimo. Dadas las bajas tasas de dividendos de los índices subyacentes (aprox. 1% o 0,5% anual), la entrada anual de capital nuevo destinado a Bitcoin sería insignificante en comparación con el volumen diario del mercado. Paradójicamente, en un mercado alcista de Bitcoin, estos fondos se convertirían en vendedores netos programáticos debido al mecanismo de rebalanceo, creando potencialmente una presión de venta constante. El producto está dirigido principalmente a asesores financieros, permitiéndoles asignar Bitcoin de forma indirecta y "compatible" para sus clientes, ya que los fondos se presentan como productos de renta variable estándar. El artículo concluye que, aunque el modelo busca aprovechar la inercia y la configuración por defecto para atraer capital institucional (como se vio con los fondos de fecha objetivo), su diseño intrínseco limita severamente su capacidad para ser un comprador sostenido de Bitcoin y podría incluso actuar como un "techo" de presión vendedora durante rallies. Su éxito a gran escala dependería de que se incluyeran como opción por defecto en planes de pensiones, un proceso regulatorio que aún está en desarrollo.

Foresight NewsHace 28 min(s)

¿Entrada para billones de fondos de pensiones? El ETF de reinversión de dividendos en Bitcoin de Franklin tiene un límite máximo de presión de venta

Foresight NewsHace 28 min(s)

¿Por qué a los proyectos de criptomonedas les gusta tanto cambiar de nombre?

En el mundo empresarial tradicional, el activo de marca es fundamental, y cambiarla equivale a destruir esa ventaja competitiva. Sin embargo, en cripto, más del 16% de los proyectos han cambiado de nombre, según RootData. Esto ocurre porque, en esta industria, la atención, la narrativa, el precio del token y la liquidez suelen ser más valiosos que la marca en sí. La lealtad a las marcas en cripto es débil. Los usuarios son a menudo inversores o cazadores de *airdrops*, motivados por ganancias potenciales más que por la experiencia del producto. Un nombre asociado a caídas de precio, hacks o fracasos se convierte en una carga. Cambiar el nombre puede ser una estrategia de marketing. A veces es necesario por un cambio estratégico real (como Matic a Polygon). Otras veces, es para alinearse con narrativas de moda (como AI o RWA) o para distanciarse de un pasado problemático tras un hack o una controversia. El verdadero riesgo surge cuando el cambio de nombre incluye un cambio de token. Esto puede permitir un reinicio de la liquidez, borrar el historial de precios y facilitar bombos especulativos. Además, a menudo se aprovecha para modificar la tokenómica, diluyendo el valor para los holders anteriores. El problema no es el cambio de nombre en sí, sino lo que representa: a menudo, un intento de escapar de la historia, de los errores pasados y de las expectativas incumplidas. Al evaluar un *rebranding*, las preguntas clave son: ¿hay un producto, unos ingresos o una estrategia nuevos y genuinos detrás? ¿Ha cambiado la tokenómica? ¿Y qué es exactamente lo que el proyecto quiere que olvidemos?

链捕手Hace 33 min(s)

¿Por qué a los proyectos de criptomonedas les gusta tanto cambiar de nombre?

链捕手Hace 33 min(s)

Trading

Spot
Futuros
活动图片