El 1 de junio, el director ejecutivo de OpenAI, Sam Altman, anunció oficialmente la entrada de la compañía en la carrera de robots físicos a través de una publicación de contratación en una plataforma social. Altman señaló que la empresa está formando un nuevo equipo llamado "OpenAI Robotics" y está reclutando públicamente ingenieros full stack de hardware, operaciones, sistemas y aprendizaje automático, con el objetivo de "programar y fabricar juntos robots que sean realmente útiles para la sociedad".
Según Altman, la estrategia de robótica de OpenAI se divide en objetivos a corto y largo plazo. A corto plazo, OpenAI se centra en el desarrollo de robots capaces de ayudar a los trabajadores técnicos en la construcción de infraestructuras futuras; a largo plazo, la empresa imagina un futuro en el que cada persona pueda tener un robot personal que satisfaga diversas necesidades.
Altman reveló que la entrada en la robótica se basa en el rápido desarrollo de un proyecto de investigación interno de OpenAI llamado "Worldsim". Este proyecto ha evolucionado en el último año hacia OpenAI Robotics y está liderado por Aditya Ramesh, vicepresidente de investigación de la empresa y uno de los principales desarrolladores del modelo de generación de imágenes a partir de texto DALL·E y del modelo de generación de videos Sora. La base de este proyecto radica en la profunda integración y el diseño colaborativo entre la investigación en hardware robótico y la investigación en aprendizaje automático.
El regreso de OpenAI al campo de la robótica es, en realidad, un "retorno". Desde sus inicios, la tecnología robótica fue una dirección importante en su exploración de la inteligencia artificial general (AGI). Entre 2016 y 2019, OpenAI lanzó el entorno de referencia para aprendizaje por refuerzo OpenAI Gym, la plataforma de simulación robótica de código abierto Roboschool, y desarrolló con éxito la mano mecánica diestra llamada Dactyl.
En 2019, OpenAI, mediante técnicas de aprendizaje por refuerzo y "aleatorización automática de dominios" (ADR), entrenó un sistema de IA que permitió a una mano mecánica humanoide resolver un cubo de Rubik. Esta investigación demostró la viabilidad de una ruta tecnológica que consiste en entrenar en un entorno simulado y luego transferir la capacidad a un robot real. Sin embargo, debido a la escasez de datos para el entrenamiento de robots en ese momento y a la lenta iteración, mientras que los datos de texto e imagen en Internet eran masivos y de fácil acceso, OpenAI tomó una decisión estratégica alrededor de 2020: disolver el equipo de robótica y concentrar los recursos en el desarrollo de modelos de lenguaje grandes como la serie GPT. Esta decisión finalmente dio origen a ChatGPT.
En los años siguientes, OpenAI, gracias a su serie de productos ChatGPT, desató una fiebre global por los modelos grandes y se convirtió en el unicornio de IA con mayor valoración del mundo. Según informes de múltiples medios, OpenAI presentó en secreto un borrador de prospecto para una OPV el 22 de mayo, con planes de salir a bolsa a más tardar en septiembre de 2026. En la última ronda de financiación completada en marzo de este año, la valoración de OpenAI alcanzó los 852 mil millones de dólares. Instituciones como Deutsche Bank pronostican que su valoración en la salida a bolsa podría superar el billón de dólares, con una recaudación de aproximadamente 60 mil millones de dólares, lo que la convertiría potencialmente en una de las OPV tecnológicas más grandes de la historia del mercado público estadounidense.
Sin embargo, OpenAI también enfrenta una enorme presión por pérdidas. La compañía proyecta una pérdida anual de aproximadamente 140 mil millones de dólares en 2026, y el consumo de efectivo se ampliará aún más, por lo que no se espera que el flujo de caja positivo se alcance hasta 2030, en el mejor de los casos. Su margen bruto es de solo alrededor del 33%, y los altos costos de inferencia de los modelos de IA son la principal causa de la erosión de sus ganancias.
Durante los años en que disolvió su equipo de desarrollo propio de robótica, OpenAI no abandonó completamente el campo, sino que adoptó una estrategia de inversión de "múltiples apuestas" a través de su fondo de capital emprendedor, invirtiendo sucesivamente en varias startups de robótica como la empresa noruega de robots humanoides 1X Technologies, la destacada empresa estadounidense de robots humanoides Figure AI, y Physical Intelligence, entre otras.
La colaboración más destacada fue con Figure AI en febrero de 2024. En ese momento, OpenAI no solo participó en la ronda de financiación Serie B de Figure AI por un total de 675 millones de dólares, sino que también anunció el desarrollo de un modelo de IA multimodal exclusivo para los robots humanoides de Figure. Solo 13 días después de la colaboración, el robot humanoide Figure 01, equipado con el modelo de OpenAI, demostró capacidades fluidas de interacción en lenguaje natural, reconocimiento de objetos y operación autónoma.
Pero esta colaboración duró menos de un año. En febrero de 2025, el fundador de Figure AI, Brett Adcock, anunció oficialmente la terminación de la colaboración con OpenAI, optando por desarrollar de forma independiente un modelo de IA robótica de extremo a extremo. La ruptura de la colaboración se debió principalmente a divergencias en la ruta tecnológica. Figure considera que los modelos grandes generalistas no pueden adaptarse a las necesidades de hardware de los robots y que es necesario construir un modelo de extremo a extremo completamente integrado verticalmente. Esto también impulsó a OpenAI a, después de seis años, "resucitar" su equipo de robótica, entrar directamente en el juego y elevar la robótica de una "inversión" a un "negocio estratégico interno".
Al mismo tiempo, esto también representa la pintura de una nueva curva de crecimiento por parte de OpenAI para el mercado de capitales antes de su OPV. Le muestra a los inversores la gran visión de la empresa de expandirse desde el software puro hacia la integración de hardware y software, y desde el mundo virtual hacia el mundo físico, esperando utilizar la historia de la "inteligencia encarnada" (embodied AI) para contrarrestar las preocupaciones del mercado sobre la sostenibilidad de su modelo de negocio y sus enormes pérdidas.
La ventaja de OpenAI al incursionar en la robótica radica en su capacidad globalmente líder en modelos grandes de IA, especialmente en los "modelos del mundo" que comprenden y simulan el mundo físico. Su enfoque tecnológico puede diferenciarse de muchas empresas que comienzan desde el hardware físico, siguiendo en cambio una lógica de "primero construir el cerebro, luego desarrollar el cuerpo". Es decir, primero hacer que la IA comprenda las leyes físicas a través de potentes modelos del mundo, y luego infundir esa capacidad en robots físicos. Este enfoque de definir el hardware mediante software y algoritmos, si tiene éxito, podría remodelar el modo de desarrollo de la industria robótica.
Este artículo proviene de "Jiemian News", autor: Li Kefeng





