Los robots comienzan a 'devorar datos': La cadena de producción oculta desde las fábricas de datos en India hasta los robots humanoides de miles de millones de dólares
En una fábrica de ropa en la India, trabajadores llevan cámaras en la cabeza para grabar su trabajo desde una perspectiva en primera persona. Estos videos, convertidos en datos, se venden a empresas de inteligencia incorporada que necesitan grandes cantidades de información para entrenar robots.
La industria de la inteligencia incorporada enfrenta un cuello de botella crítico: la falta de datos de entrenamiento de alta calidad. A diferencia de los modelos de lenguaje, que se nutren de vastos recursos de internet, los robots operan en un "desierto de datos" del mundo físico. Investigaciones como EgoScale de NVIDIA han demostrado que el uso de datos humanos en primera persona (Ego Data) para preentrenamiento, combinado con una pequeña cantidad de datos del robot, puede mejorar significativamente las capacidades de los robots, estableciendo una ruta de escalabilidad.
Esto ha impulsado una nueva cadena de suministro de datos. Empresas en India y el sudeste asiático organizan "fábricas de datos" donde recolectores, siguiendo procedimientos estandarizados, generan miles de horas de videos Ego Data mostrando tareas como organizar una cocina o doblar ropa. Los datos se organizan en una "pirámide": en la base están los datos de internet (baratos pero de bajo valor para la acción), luego los Ego Data, seguidos por datos con guantes sensoriales para capturar movimientos finos de las manos, datos de simulación (abundantes pero con una brecha de realidad) y, en la cima, los costosos y escasos datos reales del robot, obtenidos mediante teleoperación.
La industria de datos emergente incluye varios actores: fábricas de datos de bajo costo, proveedores especializados en captura y alineación de movimientos, servicios de teleoperación para datos del robot, empresas de datos de simulación y plataformas que buscan estandarizar el formato de los datos.
Las compañías de robots adoptan un enfoque de "adquisición por capas": compran datos genéricos Ego Data a proveedores externos para el preentrenamiento, pero tienden a recolectar internamente los datos específicos para la adaptación de su hardware único y los datos de despliegue y fallos, que constituyen su ventaja competitiva central.
El sector evoluciona hacia dos modelos: "fábricas de datos" que venden horas de datos procesados, y "motores de datos" que ofrecen un ecosistema completo para la mejora continua de los modelos. Se prevé la aparición de una empresa similar a Scale AI, pero adaptada a la complejidad de los datos físicos y del movimiento. La competencia en robótica está pasando de la fabricación de hardware a la capacidad de alimentar a los modelos con datos masivos y de alta calidad, una cadena de producción que ya conecta fábricas en India con laboratorios de robótica de alto valor en todo el mundo.
marsbitHace 1 hora(s)