Zhilei, el viejo rival de Unitree, ha escindido otra empresa.
Con el anuncio de Mi Feng Technology de haber completado una ronda estratégica de financiación ángel+ de varios miles de millones de yuanes, esta empresa de datos fundada por Zhilei vuelve a salir a la luz. Tras la empresa de manos diestras, Inflection Point, Zhilei ha vuelto a establecer como empresa independiente una capacidad clave, emprendiendo el camino de operar y financiarse de manera autónoma.
Al mencionar a Zhilei, muchas personas instintivamente lo consideran el principal rival de Unitree.
Después de todo, solo en 2025, las ventas reales de robots humanoides puros de Unitree superaron las 5500 unidades, afirmando ser el número uno mundial en ventas; en marzo de este año, Zhilei anunció la salida oficial de su robot de cuerpo generalizado número 10,000.
Desde la escala de producción hasta la comercialización, siempre se les compara.
Y esta vez, como uno de los rivales más directos de Unitree, Zhilei ha extendido sus fichas de competencia más allá del robot en sí.
Porque Mi Feng Technology, independizada de Zhilei, se dedica precisamente a uno de los negocios más candentes de la inteligencia corpórea actual: la recopilación, gobernanza y circulación de datos. Su objetivo propuesto también es ambicioso: lograr una capacidad de producción de datos a nivel de decenas de millones de horas para 2026.
Modelos base, potencia de cálculo, hardware, estos términos relacionados con la inteligencia corpórea los escuchamos mucho. Pero quizás más personas no se dan cuenta de que la importancia de los "datos" en la industria de la inteligencia corpórea está aumentando rápidamente.
Incluso Peng Zhihui, cofundador, presidente y CTO de Zhilei, declaró previamente que Zhilei no carece de dinero, sino que actualmente carece más de datos.
Detrás de la escasez de datos de Zhilei, está toda la industria de la inteligencia corpórea experimentando una "escasez de datos" aún no vista por la mayoría, pero extremadamente urgente.
Lo que empieza a asomar la cabeza es más importante que la potencia de cálculo
En la era de la inteligencia corpórea, la importancia de los datos se está acercando a la de la potencia de cálculo en la era de los grandes modelos.
Los grandes modelos aprenden principalmente del mundo de internet, mientras que los robots deben aprender del mundo físico. Los primeros pueden obtener material de entrenamiento de páginas web, libros y artículos académicos; los segundos deben agarrar una taza, abrir una puerta, doblar ropa para comprender las acciones y retroalimentación en entornos reales.
Lo que necesitan los robots, además de información visual, incluye información multimodal como táctil, de fuerza, trayectorias de movimiento, etc. Para los datos de alta calidad de máquinas reales, detrás de cada dato suele haber una interacción física real.
Según estimaciones presentadas por Mi Feng en su conferencia, el corpus necesario para entrenar un sistema de nivel GPT-5 alcanza el nivel de decenas de miles de millones de horas, mientras que los datos efectivos de alta calidad globalmente disponibles para entrenamiento de inteligencia corpórea son solo alrededor de 500,000 horas.
Por otro lado, el "Informe del Índice de IA 2026" publicado por HAI de la Universidad de Stanford enumera dos resultados dispares: la tasa de éxito más alta de los robots en el benchmark de operación en simulación RLBench alcanza el 89.4%; en el benchmark de simulación BEHAVIOR-1K, orientado a necesidades domésticas reales y con cadenas de tareas más complejas, la tasa de éxito de tareas completas más alta es solo del 12.4%.
Los dos resultados provienen de benchmarks diferentes, pero al menos indican que los robots progresan rápidamente en tareas cortas y controladas, mientras que sus capacidades siguen siendo claramente insuficientes frente a tareas domésticas complejas.
La insuficiencia de datos de entrenamiento de alta calidad y diversificados es una razón importante.
En otras palabras, la debilidad de capacidad de los robots actuales se debe en gran medida a que han visto muy poco del mundo real.
Por lo tanto, la incipiente industria de recopilación de datos para inteligencia corpórea está creciendo rápidamente.
Actualmente, el método más común es la teleoperación con máquinas reales, donde una persona controla remotamente el robot para completar tareas y registra la información visual, de movimiento y de estado durante la ejecución. La calidad de los datos es relativamente alta, pero el costo tampoco es bajo.
Yao Maoqing, CEO de Mi Feng, explicó previamente que el precio de una hora de datos de máquina real en China suele estar entre 500 y 1000 yuanes, y requiere la coordinación del robot, el operador y el escenario, limitando la velocidad de expansión.
Otra ruta son los datos de simulación. Las empresas utilizan gemelos digitales y motores físicos para que los robots completen numerosas tareas de entrenamiento en entornos virtuales, reduciendo los costos de recopilación. Pero las habilidades que los robots aprenden en el mundo virtual aún pueden no transferirse completamente al mundo real, lo que constituye la larga "brecha Sim-to-Real" que enfrenta la industria.
Después de recopilar los datos, hay problemas aún más fundamentales.
Diferentes empresas utilizan diferentes plataformas robóticas, sensores y formatos de datos; la misma acción de agarre puede registrarse como estructuras de datos completamente diferentes. Grandes cantidades de datos brutos deben someterse a procesos de limpieza, etiquetado y estructuración antes de poder utilizarse en el entrenamiento de modelos.
Por lo tanto, muchas empresas aún se encuentran en la etapa de "recopilación propia, uso propio, entrenamiento propio", con los datos dispersos en diferentes compañías y plataformas.
Con el aumento de la importancia de los datos, la competencia también comienza a extenderse desde el robot en sí hacia infraestructuras como la recopilación, gobernanza y circulación de datos.
Pero no hay una métrica unificada sobre cuántos datos le faltan a la industria. Lo que es seguro es que es difícil que una sola empresa, recopilando y usando sus propios datos, cubra los escenarios complejos que enfrentan los robots generalizados.
Quien logre establecer primero una red de suministro de datos estandarizada y a gran escala, tendrá más oportunidades de convertirse en el "proveedor de palas" en esta expansión industrial.
Mi Feng Technology apunta precisamente a esta oportunidad.
Convertir los datos en una plataforma
Por supuesto, la recopilación de datos es importante, pero Mi Feng Technology quiere más que eso.
Actualmente, la recopilación de datos de alta calidad en la industria aún depende en gran medida del robot en sí. Las empresas necesitan comprar robots, desplegar escenarios, organizar operadores y luego completar la recopilación mediante teleoperación, siendo el robot uno de los componentes de mayor costo.
Mi Feng mantiene la solución de datos de máquina real, mientras lanza la serie de productos de recopilación sin cuerpo MEgo, incluidos el dispositivo de recopilación portátil MEgo View y la pinza de recopilación MEgo Gripper.
Una vez que el operador porta o sostiene el dispositivo, puede registrar el proceso operativo en escenarios reales como supermercados, fábricas o hogares, sin necesidad de la participación continua del robot en la recopilación.
En comparación con la teleoperación con máquina real, la recopilación sin cuerpo facilita reducir costos y ampliar la escala. Según la planificación revelada por Mi Feng, del 60% al 70% de su capacidad de producción de datos para 2026 provendrá de la recopilación sin cuerpo.
Pero recopilar datos es solo el primer paso; si pueden ser procesados para entrar en la fase de entrenamiento determina en gran medida su valor final.
Los datos brutos suelen contener ruido y contenido no válido, y deben someterse a procesos como alineación temporal, reconstrucción de trayectorias, etiquetado, filtrado de calidad, etc. Incluso si una empresa posee grandes cantidades de datos brutos, no necesariamente puede convertirlos directamente en conjuntos de entrenamiento efectivos.
Por lo tanto, Mi Feng dedica grandes esfuerzos a la fase de gobernanza de datos.
Su motor de gobernanza de datos MEgo Engine, desarrollado internamente, cubre procesos como limpieza de datos, reconstrucción de trayectorias 6D, reconstrucción de percepción espacial, verificación de calidad, puntuación inteligente y etiquetado automático. Según Mi Feng, su eficiencia de etiquetado automático puede mejorar más de 10 veces en comparación con los métodos tradicionales, con el objetivo de que los datos recopilados entren más rápido en la fase de entrenamiento.
Además de vender datos, Mi Feng también espera ofrecer la capacidad de procesar datos brutos en conjuntos de entrenamiento.
En un nivel superior, Mi Feng también ha establecido un mercado de datos, con la esperanza de encapsular estandarizadamente los recursos de datos dispersos y abrir el suministro a toda la industria.
Esta visión se asemeja a la computación en nube inicial: los proveedores de nube convirtieron la potencia de cálculo en un servicio bajo demanda, mientras Mi Feng espera convertir los datos también en un recurso básico transable y reutilizable.
Según la planificación de la empresa, Mi Feng logrará una capacidad de producción de datos a nivel de decenas de millones de horas para 2026, y a través de la "Acción de Co-creación de Datos del Panal", en colaboración con proveedores de nube, propietarios de escenarios e instituciones del sector, aspira a alcanzar una escala de datos a nivel de decenas de miles de millones de horas antes de 2030.
Estos siguen siendo objetivos de capacidad por ahora; si se cumplirán según lo programado dependerá de la producción masiva de hardware, la red de recopilación y los pedidos reales.
Aun así, el capital ya está dispuesto a pagar por esta visión.
En febrero de este año, Mi Feng Technology completó rondas de financiación semilla y ángel por varios miles de millones de yuanes, lideradas por Sequoia China;
En junio, completó otra ronda estratégica de financiación ángel+ por varios miles de millones de yuanes, liderada por Guofang Chuangtou, con la participación de múltiples capitales industriales e instituciones estatales;
Empresas como Alibaba Cloud, Baidu Cloud y JD Cloud también han establecido colaboraciones estratégicas con Mi Feng, en áreas relacionadas con ecosistemas de datos, coordinación de escenarios y soporte de potencia de cálculo.
Así, las dos empresas independizadas de Zhilei, Inflection Point y Mi Feng, tienen ahora sus propias direcciones de negocio:
Inflection Point apunta al eslabón hardware de las manos diestras, mientras Mi Feng apunta al eslabón de datos de la inteligencia corpórea.
Sin embargo, la operación independiente con financiación autónoma le otorgó a Mi Feng espacio para servicios externos, pero no resolvió automáticamente el problema de confianza de sus competidores.
¿Los rivales de Zhilei se atreverán a usar Mi Feng?
Lo primero que Mi Feng debe resolver es la neutralidad.
Su propuesta de "Acción de Co-creación de Datos del Panal" es un intento de establecer una red de datos a nivel industrial. Pero para que participen más empresas de robótica, Mi Feng necesita demostrar que los datos exclusivos de los clientes no fluirán hacia Zhilei, ni serán utilizados indebidamente por otros competidores.
Yao Maoqing respondió públicamente a esta pregunta. Afirmó que las transacciones de datos de Mi Feng se dividen en dos modos: "derecho de uso" y "propiedad"; para los clientes que compran la propiedad, la empresa completará la transferencia del activo y destruirá localmente los datos relevantes.
Incluso la única forma en que Zhilei obtiene datos de Mi Feng es mediante pedidos en el mercado, sin acceso gratuito, disposiciones que al menos establecen el principio de aislamiento de datos.
Sin embargo, para que los competidores de Zhilei realicen compras a largo plazo, Mi Feng necesita demostrar continuamente su neutralidad a través de acuerdos, aislamiento de permisos, procesos de entrega y auditorías de terceros.
Después de todo, para los rivales de Zhilei, Mi Feng no es "obligatorio", ni es la única empresa que mira el negocio de los datos.
JD ya ha lanzado su terminal de recopilación JoyEgoCam, infraestructura de datos corpórea y plataforma de transacciones de datos, proponiendo el objetivo de acumular más de 10 millones de horas de datos de video en escenarios reales en los próximos dos años.
Luming Robot también está desplegando recopilación sin cuerpo, Lingchu Intelligence se centra en datos de operación humana real, y Guanglun Intelligent se enfoca en datos sintéticos e infraestructura de simulación.
Todas compiten por lo mismo: transformar escenarios y datos brutos dispersos en conjuntos de datos que puedan usarse continuamente para el entrenamiento.
Mi Feng también debe enfrentar simultáneamente los desafíos de escala y calidad.
Decenas de millones de horas son por ahora solo un plan de capacidad, no una entrega de datos ya completada; ya sea recopilación con máquina real o sin cuerpo, ampliar la escala significa inversión continua en equipos, personal y escenarios. Si no resuelve los problemas de calidad y generalización de los datos, incluso el conjunto de datos más grande puede ser solo una acumulación repetitiva.
Lo que finalmente determinará si Mi Feng puede formar un efecto de red sigue siendo la confianza de sus pares.
Sin embargo, al hacer que Mi Feng opere y se financie de manera independiente, Zhilei al menos le ha dado a este negocio espacio para servicios externos.
Si los datos permanecen siempre dentro de Zhilei, solo mejorarán las capacidades del modelo de una empresa; estandarizados, comercializados y reconocidos por otros fabricantes de robots, tendrán la oportunidad de convertirse en infraestructura industrial.
En última instancia, para Mi Feng, una capacidad de decenas de millones de horas es solo el umbral.
Cuando los rivales de Zhilei también estén dispuestos a comprarle a largo plazo, e incluso a confiarle el procesamiento de sus datos centrales, este negocio realmente se habrá afianzado.
Este artículo proviene del WeChat Official Account: Plan de Letras Azules , autor: Chester







