En marzo de 2026, AMI Labs, fundada por el ganador del Premio Turing y ex científico jefe de IA de Meta, Yann LeCun, anunció la finalización de una ronda de financiación inicial de 1030 millones de dólares.
Casi al mismo tiempo:
- World Labs, fundada por Fei-Fei Li, completó una nueva ronda de financiación de aproximadamente 1000 millones de dólares.
- Google DeepMind lanzó el modelo mundial Genie 3.
- Tesla continúa avanzando en el despliegue de su robot humanoide Optimus en las fábricas.
Estos eventos no ocurrieron de forma aislada, sino que apuntan conjuntamente a una tendencia más clara: la IA está pasando de "comprender el mundo digital" a "comprender y actuar en el mundo físico".
Si 2024 fue el período de expansión de los grandes modelos de lenguaje (LLM) y 2025 fue el período de exploración para la implementación de Agentes, entonces en 2026, la narrativa central de Silicon Valley se está orientando hacia un problema más fundamental: ¿Puede la IA comprender verdaderamente "cómo funciona el mundo" y completar tareas en la realidad?
Esto no es solo un cambio en la dirección tecnológica, sino que también significa que la cadena de valor industrial está siendo reescrita. En los últimos dos años, la competencia en IA se ha concentrado principalmente en unos pocos eslabones de alto umbral, como los modelos, la potencia de cálculo y los centros de datos; cuando la IA comienza a entrar realmente en el mundo físico, la competencia ya no ocurre solo en la capa del modelo, sino que se expande simultáneamente al hardware, la integración de sistemas, la recopilación de datos, los entornos de simulación, la colaboración en la cadena de suministro y la implementación en escenarios reales. En otras palabras, la IA Física no trae un avance puntual, sino una reestructuración de todo un sistema de infraestructura.
Precisamente por eso, este cambio puede representar no solo una nueva ola de entusiasmo tecnológico para el mundo de habla china, especialmente para emprendedores, ingenieros e inversores chinos, sino también una rara ventana de oportunidad estructural. A diferencia de la competencia anterior, impulsada principalmente por recursos de entrenamiento de grandes modelos y supercapitales, la IA Física depende naturalmente de capacidades compuestas: es necesario comprender los algoritmos y también la ingeniería; ser capaz de realizar una coordinación de sistemas y también adentrarse en la fabricación, la cadena de suministro y los escenarios industriales. Los equipos que combinan profundidad técnica, capacidad de colaboración en hardware y una visión industrial entre China y Estados Unidos tienen más oportunidades de ocupar posiciones clave en este nuevo ciclo.
En otras palabras, la IA Física no es solo una nueva historia que se cuenta en Silicon Valley, también podría ser el boleto de entrada más importante para los chinos en la próxima transformación de la infraestructura tecnológica global.
01 La disputa del siglo entre dos enfoques: Partidarios de los LLM vs. Partidarios del Modelo Mundial
En los últimos tres años, los grandes modelos de lenguaje (LLM) casi han dominado la trayectoria del desarrollo de la IA, cuyo paradigma central se basa en la predicción del siguiente token (next-token prediction) a partir de grandes cantidades de datos de texto. Pero los límites de este paradigma también se están haciendo evidentes: puede "describir" el mundo físico, pero carece de una comprensión ejecutable; le falta capacidad para modelar relaciones causales y restricciones físicas; y su rendimiento es limitado en la toma de decisiones continuas y tareas a largo plazo.
Por lo tanto, una facción representada por Yann LeCun comenzó a impulsar otro camino: el Modelo Mundial (World Model) — predecir "estados", no "texto". La diferencia central entre ambos radica en que los LLM toman el texto como objeto de aprendizaje y el lenguaje como forma de salida, permaneciendo esencialmente en el "cognición y expresión"; mientras que el Modelo Mundial toma el estado del mundo físico como objeto de modelado, apuntando directamente al ciclo cerrado de capacidades de "percepción-decisión-ejecución".
Esta no es solo la opinión de LeCun. En el primer trimestre de 2026, la dirección del Modelo Mundial experimentó varios avances clave casi al mismo tiempo: AMI Labs, con la arquitectura JEPA como núcleo, apostó claramente por una ruta a largo plazo de "investigación primero, producto después"; World Labs se adentró en la "inteligencia espacial", intentando que la IA comprenda verdaderamente las relaciones, oclusiones y restricciones físicas en un mundo tridimensional; Google DeepMind, a través de Genie 3, impulsó la generación de entornos dinámicos con interacción en tiempo real, utilizándolos para el entrenamiento de agentes inteligentes.
Tres empresas con caminos diferentes, pero que apuntan a la misma tendencia: el próximo salto de la IA no es solo generar mejor texto, sino modelar el mundo con mayor precisión y completar acciones en él.
class="image-wrapper">02 La guerra del hardware: ¿Quién está construyendo el "cuerpo"?
El Modelo Mundial resuelve el problema del "cerebro" — cómo la IA comprende el mundo físico. Pero la otra mitad del campo de batalla de la IA Física es igualmente intensa: ¿Quién construirá el "cuerpo"?
En 2026, el campo de los robots humanoides ha pasado completamente de "demostraciones de laboratorio" a la "fabricación en masa en fábricas". Algunas cifras clave:
Tesla Optimus Gen 3: Más de 1000 unidades desplegadas en las fábricas Gigafactory Texas y Fremont, realizando tareas de manejo y ensamblaje de piezas. Este es el despliegue más grande en una fábrica de robots humanoides en la historia humana. Tesla está construyendo una fábrica especializada en Giga Texas con una capacidad anual de 10 millones de unidades, con el objetivo de reducir el costo por unidad a 20,000 dólares — hace dos años, el precio promedio de la industria aún estaba entre 50,000 y 250,000 dólares.
Boston Dynamics Atlas: La versión producto de Atlas en el CES 2026, con una altura de 6.2 pies, 56 grados de libertad, capaz de levantar 110 libras de peso. Más importante aún es su "alma" — Boston Dynamics anunció una colaboración con Google DeepMind para integrar modelos base de vanguardia en Atlas. Toda la capacidad de producción de 2026 ha sido reservada por Hyundai y Google DeepMind, y se está planificando una fábrica de 30,000 unidades/año.
Figure 03: Figure AI recaudó 1000 millones de dólares con una valoración de 39,000 millones de dólares. Su Figure 02, durante 11 meses de prueba en la fábrica de BMW Spartanburg, participó en la producción de más de 30,000 BMW X3, movió más de 90,000 piezas y acumuló 1250 horas de funcionamiento. Figure 03 es una mejora integral sobre esto, equipado con 48+ grados de libertad y la plataforma de IA propietaria Helix.
Mind Robotics: Acaba de anunciar en marzo una financiación de 500 millones de dólares, centrada en el despliegue de robots de IA a escala industrial.
Pero en esta carrera de hardware, está surgiendo un eslabón subestimado: la mano diestra (Dexterous Hand).
Las piernas del robot humanoide resuelven el problema de la movilidad, el torso resuelve el problema de la carga, pero lo que realmente determina si un robot puede trabajar en entornos complejos son las manos. Tomando como ejemplo el Tesla Optimus, el costo de las manos representa el 17% de la máquina completa, unos 9500 dólares — es el componente individual más caro.
La mano diestra es difícil debido a una contradicción fundamental: el espacio en los dedos es demasiado pequeño para motores grandes; los motores pequeños no tienen suficiente par, por lo que se necesitan cajas de cambios de alta relación de reducción para amplificar la fuerza; y las cajas de cambios de alta relación de reducción traen distorsión por inercia, pérdida de retroalimentación de fuerza y desgaste mecánico — estos tres problemas "envenenan" físicamente el proceso de aprendizaje de la IA.
Un grupo de nuevas empresas está intentando superar este cuello de botella. Algunas utilizan una arquitectura de motor de flujo axial para comprimir la relación de reducción de 288:1 a 15:1, logrando una mano diestra completamente reversible; otras, mediante el diseño simultáneo de guantes de captura de datos, permiten que los datos de operación humana se transfieran a los robots sin pérdidas. Estas innovaciones de hardware, aparentemente pequeñas, podrían ser una de las infraestructuras más críticas de todo el ecosistema de IA Física.
03 NVIDIA: El "vendedor de palas" de la era de la IA Física
En cada ola tecnológica, aparece un "vendedor de palas".
En la era de los grandes modelos, NVIDIA, con sus GPU y el ecosistema CUDA, se convirtió en el mayor beneficiario; y en la era de la IA Física, su papel se está actualizando aún más — no solo proporcionando potencia de cálculo, sino intentando construir toda una infraestructura para la era de la robótica.
En la conferencia GTC de marzo de 2026, NVIDIA lanzó un conjunto completo de capacidades de plataforma en torno a la IA Física: incluyendo el modelo de visión-lenguaje-acción Isaac GR00T para robots humanoides, la serie Cosmos para generar datos sintéticos a gran escala, y una cadena de herramientas que cubre entrenamiento, evaluación e implementación (como Isaac Lab y OSMO). Estas capacidades no son herramientas puntuales, sino que gradualmente forman un sistema completo de desarrollo y ejecución.
Varias empresas de robótica, incluyendo Boston Dynamics, Caterpillar, Franka Robotics, LG, NEURA Robotics, entre otras, ya están construyendo sistemas de próxima generación en la plataforma de NVIDIA.
Su estrategia es también muy clara:
No participar directamente en productos terminales, sino convertirse en el estándar subyacente de toda la industria.
Si la IA Física es una ciudad en construcción, entonces NVIDIA está proporcionando simultáneamente el cemento, el acero y la red eléctrica.
04 Datos: El "petróleo" más escaso de la IA Física
En el mundo de los grandes modelos de lenguaje, Internet proporciona datos de texto casi ilimitados. Pero en la IA Física, surge un problema más fundamental:
Los datos de manipulación del mundo real son extremadamente escasos.
Esto convierte a los datos en uno de los recursos más críticos y escasos de toda la cadena industrial.
Actualmente, la industria explora principalmente tres caminos.
Ruta de datos reales. Representada por Physical Intelligence, su modelo π0 se entrena con más de 10,000 horas de datos reales de operación de robots, cubriendo múltiples morfologías de robots y tipos de tareas, capaz de completar operaciones complejas (como doblar ropa, ensamblar cajas de cartón, etc.). Su acción de código abierto esencialmente proporciona a la industria una "base de pre-entrenamiento para la manipulación".
Ruta de datos sintéticos. Genie 3 de Google DeepMind y Cosmos de NVIDIA intentan generar grandes entornos simulados a través de modelos mundiales, completando el entrenamiento en el mundo virtual y luego transferirlo al mundo real. El desafío central de esta ruta es la brecha sim-to-real (simulación a realidad), pero a medida que aumenta la precisión de la simulación, esta brecha se está reduciendo gradualmente.
Ruta de teleoperación humana. A través de dispositivos como guantes de captura de datos, se mapean directamente las operaciones humanas a los sistemas robóticos. Esta forma tiene la mayor calidad de datos, pero aún tiene limitaciones en cuanto a costos y capacidad de escalamiento.
Tesla está probando un camino híbrido: recopila continuamente comportamientos de operación humana a través de videos de fábrica y los utiliza para entrenar las capacidades de movimiento de Optimus.
A largo plazo, es probable que el panorama competitivo de la IA Física no dependa de qué modelo sea el mejor, sino de quién posea la mayor cantidad y la más alta calidad de datos de interacción con el mundo físico. Una vez que la rueda de los datos comience a girar, sus barreras se fortalecerán exponencialmente.
05┃ ¿Qué dice el dinero?: Un panorama completo de la financiación de IA Física en el Q1 de 2026
Los números no mienten. A continuación, los eventos clave de financiación en el campo de la IA Física en el primer trimestre de 2026:
【Capa de Modelo Mundial】
· AMI Labs (LeCun) — Ronda inicial de $1030 millones, valoración de $3500 millones
· World Labs (Fei-Fei Li) — Nueva ronda de $1000 millones, Autodesk invirtió $200 millones
【Capa de Modelos Base】
· Physical Intelligence — En negociaciones para una nueva ronda de $1000 millones, la valoración superará los $11,000 millones
· RLWRLD — Extensión de ronda inicial de $41 millones
【Robots Humanoides Completos】
· Figure AI — Anteriormente recaudó $1000 millones con una valoración de $39,000 millones (2025)
· Mind Robotics — $500 millones, despliegue a escala industrial
· Galaxea — $434 millones, Serie B, unicornio
· Humanoid — $290 millones ronda inicial, unicornio directo
· Generative Bionics — €70 millones ronda inicial
【Infraestructura y Herramientas】
· NVIDIA — Inversión continua en la plataforma Isaac GR00T / Cosmos
· RoboForce — $52 millones, plataforma de mano de obra de IA Física
Solo con los datos públicos anteriores, el Q1 supera los 6400 millones de dólares. Y esto no incluye las inversiones internas de grandes empresas como Tesla, Hyundai/Boston Dynamics, Google DeepMind, etc.
El flujo de capital indica una cosa: la IA Física ha superado la etapa de "prueba de concepto" y ha entrado en la etapa de "construcción de infraestructura". Los inversores ya no preguntan "si los robots se pueden usar", sino "qué infraestructura permitirá que los robots escalen más rápido".
06 Reflexión fría: ¿Burbuja o punto de inflexión?
Por supuesto, Silicon Valley nunca carece de burbujas. Frente al fervor por la IA Física, vale la pena considerar algunas preguntas frías:
Demo ≠ Despliegue. Como consenso en Davos 2026: la brecha entre una demo impresionante y un sistema que puede ejecutarse 10,000 veces consecutivas sin errores es mucho mayor de lo que sugiere la publicidad. El Figure 02 sí participó en la producción de 30,000 vehículos en la fábrica de BMW, pero ejecutó tareas de manejo de piezas relativamente estandarizadas, no un ensamblaje diestro.
Sim-to-real sigue siendo un hueso duro de roer. La fidelidad de los modelos mundiales está mejorando, pero la complejidad de la larga cola del mundo físico — cambios de iluminación, diferencias de materiales, colisiones no anticipadas — sigue siendo el mayor desafío para la ruta de datos sintéticos.
El modelo de negocio aún no está probado. El propio LeCun dice que AMI Labs solo investigará el primer año. World Labs está probando un modelo gratuito + de pago. Physical Intelligence ha liberado su modelo central como código abierto. Actualmente, los ingresos de estas empresas son casi cero, el capital apuesta a un monopolio de paradigma dentro de 3-5 años.
El rinoceronte gris de la seguridad y la regulación. Cuando miles de robots con capacidad de decisión autónoma entren en fábricas e incluso hogares, ¿quién será responsable de los accidentes? Actualmente, el marco regulatorio global para la IA Física es casi un vacío.
Pero precisamente estos problemas indican que estamos en las primeras etapas de un punto de inflexión tecnológico, no en la cima de una burbuja. Cada verdadera transformación de paradigma — Internet, smartphones, computación en la nube — en sus primeras etapas estuvo acompañada de una fase donde "la demo era mucho mejor que el producto". La diferencia clave es: si la tecnología subyacente está avanzando realmente, no solo las presentaciones de PowerPoint.
Desde la arquitectura JEPA de LeCun, hasta la generación de mundos en tiempo real de Genie 3, la capacidad de generalización de 68 tareas de π0, el despliegue a nivel de 1000 unidades de Optimus en fábricas — los avances del Q1 de 2026 son avances de ingeniería reales, no castillos en el aire.
07 La IA Física no es un campo independiente, es la forma final de la IA.
La IA Física no es un nuevo campo, es más bien una de las formas finales de la IA.
Cuando la IA pasa de "comprender el mundo" a "entrar en el mundo", lo que realmente se reescribe no son solo los límites de capacidad del modelo, sino también las formas de división industrial y distribución de valor. La competencia futura no ocurrirá solo en los parámetros del modelo y los clústeres de computación, sino también en el cuerpo del robot, las manos diestras, la captura de datos, los sistemas de simulación, los escenarios industriales y la capacidad de organización de la cadena de suministro.
Por eso, esta ronda es especialmente importante para los chinos.
Porque una de las acumulaciones más profundas de los chinos en las últimas dos décadas nunca ha sido una etiqueta tecnológica unidimensional, sino la capacidad de unir verdaderamente la tecnología de vanguardia, la ejecución de ingeniería, la fabricación de hardware y la colaboración industrial transregional. Ya sean emprendedores, ingenieros, inversores u organizadores de recursos industriales, aquellos que puedan capturar esta migración de la inteligencia digital a la física tendrán la oportunidad no solo de participar en la tendencia, sino de convertirse en parte de la tendencia misma en algunos niveles clave.
En 2026, la IA Física quizás aún esté lejos de madurar; pero precisamente porque está en una etapa temprana, la ventana recién se está abriendo. Para los chinos, este podría no ser otro ciclo de "participación de seguimiento", sino un nuevo punto de partida con más oportunidades para profundizar en las capas de infraestructura, plataforma y componentes clave.
Este artículo proviene del WeChat público "硅兔君" (ID:gh_1faae33d0655), autor: 硅兔君
















