Artículos Relacionados con Robótica

El Centro de Noticias de HTX ofrece los artículos más recientes y un análisis profundo sobre "Robótica", cubriendo tendencias del mercado, actualizaciones de proyectos, desarrollos tecnológicos y políticas regulatorias en la industria de cripto.

El último artículo de Fei-Fei Li: Cuando la generación de vídeo, la robótica y NVIDIA se autodenominan modelos del mundo, necesitamos una taxonomía

El artículo de Fei-Fei Li clarifica el término "modelo del mundo", utilizado de manera confusa en IA, proponiendo una taxonomía basada en el ciclo POMDP (Proceso de Decisión de Markov Parcialmente Observable). Identifica tres categorías funcionales: 1) **Renderizador**: genera observaciones (píxeles) visualmente fieles para humanos, como los modelos de video Sora o Genie, pero sin comprensión física precisa. 2) **Simulador**: produce estados del mundo con precisión geométrica, física y dinámica, sirviendo tanto para visualización profesional como para entrenamiento de agentes (robots, vehículos autónomos). 3) **Planificador**: deduce acciones a partir de observaciones y objetivos, cerrando el ciclo percepción-acción, como los modelos de lenguaje-visión-acción (VLA). El artículo argumenta que el simulador es el componente clave y subestimado, pues proporciona la base estructural para la renderización y la planificación. Mientras los renderizadores tienen madurez comercial pero limitaciones físicas, y los planificadores son prometedores pero inmaduros para despliegues reales, los simuladores abarcan aplicaciones cruciales en robótica, diseño y digitalización. La tendencia actual es la fusión de estas categorías, impulsada por la idea de que comparten conocimiento subyacente. Modelos como Marble de World Labs ejemplifican esta convergencia, generando tanto representaciones visuales (splats gaussianos) como mallas para simulación física. La visión final es un **modelo del mundo unificado** capaz de alternar entre renderizar, simular y planificar según la necesidad, avanzando hacia una inteligencia espacial que permita a las máquinas entender e interactuar con el mundo físico.

marsbitHace 10 hora(s)

El último artículo de Fei-Fei Li: Cuando la generación de vídeo, la robótica y NVIDIA se autodenominan modelos del mundo, necesitamos una taxonomía

marsbitHace 10 hora(s)

El último artículo de Fei-Fei Li: Cuando la generación de vídeo, la robótica y NVIDIA afirman ser un modelo del mundo, necesitamos una taxonomía

En su último artículo, Fei-Fei Li aborda la confusión actual en torno al término "modelo del mundo" en IA. Propone una clasificación funcional basada en el ciclo clásico de POMDP (agente → acción → estado → observación → agente), distinguiendo tres tipos: 1. **Renderizador:** Genera observaciones (píxeles) visualmente fieles para humanos, como los modelos de generación de video (ej. Sora). Su métrica clave es la calidad visual, pero puede carecer de precisión física. 2. **Simulador:** Genera el *estado* subyacente del mundo: representaciones geométricas y físicamente precisas (geometría, dinámica). Sirve tanto para visualización profesional como para entrenar agentes de IA o robots en entornos virtuales. Li argumenta que es el componente crucial y más subestimado, pues es la base para los otros dos. 3. **Planificador:** Genera *acciones*. Dada una observación y un objetivo, decide qué debe hacer un agente (ej., un robot). Es esencial para cerrar el ciclo percepción-acción. Li señala que estos tres tipos comparten un conocimiento subyacente común sobre el mundo. El campo avanza hacia su fusión, como se ve en modelos que combinan renderizado y simulación (ej., Marble de World Labs). El objetivo final es un "modelo del mundo" unificado capaz de alternar entre estas funciones según sea necesario, lo que redefiniría la inteligencia espacial y la interacción de la máquina con el mundo físico.

链捕手Hace 11 hora(s)

El último artículo de Fei-Fei Li: Cuando la generación de vídeo, la robótica y NVIDIA afirman ser un modelo del mundo, necesitamos una taxonomía

链捕手Hace 11 hora(s)

En el primer semestre, la mitad del dinero de los fondos de capital riesgo se destinó a la IA, solo estas 30 empresas captaron más de 170 mil millones de yuanes

Resumen: En la primera mitad de 2026, la financiación en el sector de IA en China mostró un crecimiento explosivo. Según datos de IT桔子, el volumen total de financiación superó los 300.000 millones de yuanes, superando ya el total de 2025. Se registraron 1.203 operaciones. El mes de junio destacó con más de 100.000 millones, impulsado por la ronda de 51.000 millones de DeepSeek. Geográficamente, Beijing, Hangzhou, Shanghai y Shenzhen lideraron, concentrando el 86% de los fondos. En segmentos, los Grandes Modelos absorbieron más de la mitad de la inversión (1,598.53 mil millones), seguidos por IA + Agentes Corporales (906.44 mil millones) y Aplicaciones AIGC (596.05 mil millones). El capital se desplegó en tres fases: inversión temprana para innovación, crecimiento para empresas con productos validados (49.4% del total) y etapa madura para líderes consolidados. Los 30 proyectos principales recaudaron más de 170.000 millones. Los tres gigantes de Grandes Modelos (DeepSeek, Stepfun, Kimi) acapararon 93.006 mil millones. Siete empresas de robots humanoides reunieron 28.226 mil millones. Se prevé que la financiación anual supere los 600.000 millones, pero el sector de Grandes Modelos entrará en una fase de consolidación, cerrando la ventana para nuevos proyectos genéricos.

marsbitHace 2 días 09:06

En el primer semestre, la mitad del dinero de los fondos de capital riesgo se destinó a la IA, solo estas 30 empresas captaron más de 170 mil millones de yuanes

marsbitHace 2 días 09:06

La mujer más rica de China se dedica a la capital de riesgo

La multimillonaria china Zhou Qunfei, conocida como la "Reina del Cristal" por fundar la empresa de componentes electrónicos Lens Technology, está incursionando activamente en el ámbito del capital de riesgo (VC) para invertir en empresas tecnológicas pioneras. Recientemente, invirtió una cantidad significativa (varios cientos de millones de yuanes) en X-Dimension.ai, una startup de Shenzhen valorada en 10.000 millones de yuanes (unicornio) que desarrolla inteligencia artificial corporizada (AGI físico) y robots humanoides. Su enfoque de inversión es práctico: Lens Technology ya utilizaba los productos de X-Dimension.ai en sus líneas de producción antes de que Zhou decidiera invertir personalmente. Zhou opera a través de dos vías principales: inversiones personales discretas a través de su empresa "Changsha Qunxin Investment" y participaciones estratégicas más visibles a través del grupo Lens Technology. Su cartera personal incluye empresas de semiconductores como XinAi Technology y Chixin Semiconductor. Por su parte, Lens Technology ha invertido recientemente en destacadas empresas de IA como BrainCo, Star Mapping, Q-Truck y Pudu Technology. Este movimiento de Zhou refleja una tendencia más amplia entre los magnates industriales chinos. Empresarios que acumularon fortunas en sectores tradicionales como la manufactura (por ejemplo, Liu Yi de Andon Health, Zhu Xingming de Inovance, Wang Laichun de Luxshare) están redirigiendo ahora su capital y experiencia industrial hacia áreas tecnológicas de vanguardia como la IA, la inteligencia corporizada, las interfaces cerebro-computadora y la fusión nuclear. Parecen compartir la convicción de que el futuro crecimiento económico ya no reside en sectores como el inmobiliario, sino en el mundo de los datos y los algoritmos. La trayectoria de Zhou es notable: pasó de ser una trabajadora migrante en una línea de ensamblaje a construir Lens Technology, un proveedor clave para Apple, Tesla y otras grandes marcas, con una capitalización de mercado que supera los 300.000 millones de yuanes. Ahora, junto con sus pares, está utilizando su riqueza para apostar por el próximo futuro tecnológico de China.

marsbit07/02 09:53

La mujer más rica de China se dedica a la capital de riesgo

marsbit07/02 09:53

Shenzhen se prepara para otra "campanada" en robótica

La oleada de cotizaciones en Bolsa de los robots de Shenzhen está en marcha. Recientemente, la empresa de robótica Yuejiang Technology, con sede en el distrito de Nanshan, vio aceptada su solicitud de IPO en el ChiNext de la Bolsa de Shenzhen, entrando en fase de consultas. Fundada en 2015 por Liu Peichao y varios compañeros de la Universidad de Shandong, Yuejiang comenzó desarrollando brazos robóticos colaborativos de sobremesa para entornos industriales. Su éxito, que incluye una cotización en la Bolsa de Hong Kong en 2024 y una capitalización que supera los 100 mil millones de HKD, ejemplifica el camino típico de Shenzhen: aprovechar la densa cadena de suministro local y el ecosistema de fabricación para iterar rápidamente desde el prototipo hasta el producto. Este impulso forma parte de un auge más amplio. Compañías de robótica de Shenzhen, conocidas como los "Ocho Diamantes" —incluyendo a UB Tech, Zhi Ping Fang, Zi Bian Liang y otras— están atrayendo una intensa atención e inversión. La escena se concentra en zonas como el "Valle de los Robots" de Nanshan, un corredor industrial de 15 km que alberga desde gigantes cotizados hasta nuevas startups. Espacios como el "X-Day" del Lago Xili en Nanshan facilitan este ecosistema, conectando proyectos emergentes con capital y recursos industriales. La tendencia muestra una evolución: desde robots para automatización industrial y eficiencia hacia aplicaciones más cercanas a la vida diaria y la economía emocional. Shenzhen se consolida así como un centro neurálgico, donde la proximidad entre I+D, fabricación y demanda del cliente acelera la innovación, preparando el terreno para la próxima generación de empresas tecnológicas líderes.

marsbit06/30 05:15

Shenzhen se prepara para otra "campanada" en robótica

marsbit06/30 05:15

Concepto de Modelos del Mundo para Principiantes: Una Historia que va de la Psicología al Campo Principal de la IA

El concepto de "modelo mundial" (World Model) es actualmente una idea candente pero confusa en el campo de la IA. Su objetivo central es dotar a la máquina de un "simulador mental" o "tablero de arena interno" que le permita prever y ensayar posibles escenarios futuros antes de actuar en el mundo real. Esto es crucial para aplicaciones como la conducción autónoma (simular condiciones extremas), la robótica (entrenar en entornos virtuales) o la generación de contenidos. El concepto tiene raíces profundas. El psicólogo Kenneth Craik (1943) propuso que la mente humana construye "modelos a pequeña escala" de la realidad para predecir eventos. En IA, pioneros como Marvin Minsky y, más recientemente, investigadores como David Ha y Jürgen Schmidhuber (2018) con su trabajo "Recurrent World Models", sentaron las bases modernas. Los principales investigadores tienen visiones distintas pero complementarias: * **Yann LeCun** (Meta) critica los modelos de lenguaje grandes y aboga por un modelo mundial que comprenda la física subyacente, a través de arquitecturas como JEPA, que predicen en un espacio de representación abstracto, no en píxeles. * **Fei-Fei Li** (Stanford, World Labs) propone una clasificación basada en el ciclo de acción-observación: **Renderizadores** (generan píxeles, como Sora), **Simuladores** (generan estados 3D/físicos precisos) y **Planificadores** (generan acciones). * **El laboratorio FIB de la Universidad de Tsinghua** simplifica la división en modelos para **entender** el mundo (apoyo a la decisión) y para **predecir** el futuro (generación). Grandes empresas están impulsando el campo con diferentes enfoques: * **OpenAI** con **Sora** lo presenta como un "simulador del mundo" basado en generación de vídeo. * **Google DeepMind** con **Genie 3** crea mundos 3D interactivos en tiempo real a partir de texto. * **NVIDIA** con **Cosmos** ofrece una "plataforma de modelo base mundial" para IA física y simulación. Técnicamente, coexisten tres rutas principales: 1. **"Pintar"**: Modelos generativos de vídeo (Sora, Genie 3). Ventaja: realismo visual. Desventaja: coherencia física débil. 2. **"Calcular mentalmente"**: Predicción en espacio de representación abstracta (JEPA). Ventaja: eficiente, aprende estructura. Desventaja: menos interpretable. 3. **"Construir con bloques"**: Generación de entornos 3D con propiedades físicas explícitas (Omniverse). Ventaja: preciso y editable. Desventaja: costoso, menos generalizable. Un desarrollo reciente es el **World Action Model (WAM)**, que integra la predicción del estado futuro y la generación de acciones en un único sistema, acercándose a una capacidad "unificada de conocimiento y acción" para robots. A nivel industrial, se está formando una estructura en tres capas: **1) Soporte base** (datos, potencia de cálculo, sensores), **2) Plataformas tecnológicas** (genéricas o verticales) y **3) Aplicaciones** (conducción autónoma, robótica, juegos, etc.). La conducción autónoma es actualmente la aplicación más madura. La falta de una definición única no es necesariamente negativa. Refleja una fase temprana y dinámica donde diferentes enfoques (compresión del mundo en píxeles, geometría 3D, reglas de comportamiento) están explorando en paralelo. El objetivo final, sin embargo, es convergente: dotar a las máquinas de un modelo interno del mundo que sea **deducible, repasable y generalizable**, para actuar de forma más segura y eficiente. La unificación conceptual llegará, pero la confusión actual es señal de que el "modelo mundial" se ha convertido en un campo de batalla principal para el futuro de la IA.

marsbit06/29 05:14

Concepto de Modelos del Mundo para Principiantes: Una Historia que va de la Psicología al Campo Principal de la IA

marsbit06/29 05:14

Una guerra sin nombre unificado: El mapa de los Modelos de Mundo de los grandes fabricantes nacionales

**Resumen de las guerras por el modelo mundial: el panorama de las grandes tecnológicas chinas** El concepto de "modelo mundial" aún carece de una definición unificada, adoptando nombres como modelo base del mundo, IA física, o integrándose en sistemas de conducción autónoma o inteligencia corporeizada. Tras esta confusión nominal, la industria persigue un mismo objetivo: dotar a las máquinas de un entorno interno dinámico y simulable para predecir y ensayar acciones, reduciendo la dependencia de datos del mundo real y comprimiéndolo en un "motor de datos" generativo. Los gigantes tecnológicos y automotrices han convertido esto en una nueva arena de competición, relegando a startups con menos recursos de datos y cómputo. **1. Gigantes de Internet: Del mundo digital al físico** * **Alibaba** presenta una estrategia triple: **Qwen-AgentWorld** (entorno de simulación para agentes de IA basado en lenguaje), **HappyOyster** (generación de mundos virtuales interactivos) y **Qwen-RobotWorld** (cerebro de simulación para robótica e inteligencia corporeizada), cubriendo mundos lingüísticos, virtuales y físicos. * **Tencent** centra su **HY-World** en la generación y reconstrucción de entornos 3D editables, aprovechando sus fortalezas en videojuegos y escenarios sociales. * **ByteDance** desarrolla en secreto un modelo basado en la enorme base de datos de vídeos de TikTok/Douyin, con el objetivo de construir un gemelo digital que simule leyes físicas. * **Huawei** integra capacidades de modelo mundial en su **Pangu**, sirviendo como base de entrenamiento para su sistema de conducción autónoma ADS y robótica, sin comercializarlo como producto independiente. * **Baidu** embebe estas capacidades en su modelo de conducción autónoma **Apollo ADFM** y en el modelo multimodal **Ernie**, sin destacar el término "modelo mundial". **2. Fabricantes de automóviles: La escuela de conducción y el campo de pruebas** Para los automovilísticos, el modelo mundial es una herramienta práctica para entrenar y evaluar sistemas de conducción autónoma. * **NIO** fue pionero con su **NWM**, enfocado en la "reconstrucción imaginada" del espacio y la "deducción imaginada" del tiempo. Su versión 2.0 ya se implementa en flota. * **Li Auto** desarrolló **DrivingSphere**, un entorno de simulación 4D de alta fidelidad para generar escenarios complejos y probar el sistema en bucle cerrado. * **XPeng** presentó **X-World**, un "simulador del mundo real" para su VLA de segunda generación, expandiendo masivamente los escenarios de simulación. * **Geely** integra su **WAM (World Action Model)** en una arquitectura unificada para conducción, cabina y chasis. * **BYD** y **Great Wall** también avanzan en su desarrollo, siendo este último el primero en anunciar un sistema VLA+modelo mundial para producción en serie en 2026. **3. Proveedores de tecnología de conducción autónoma: El motor invisible** Firmas como **Momenta** (con su modelo **R7** ya en producción), **Horizon Robotics** (con **HorizonDrive** para generación de vídeo de larga duración y simulación), **Haomo.ai** (pionera con **DriveGPT**) y **DeepRoute** integran el modelo mundial como núcleo de sus plataformas de simulación y entrenamiento para sistemas de nivel L3/L4. **Conclusión: No es una moda, es una escalada** El modelo mundial representa la convergencia natural de los modelos de lenguaje, generación de vídeo y conducción autónoma en el mundo físico. Ha pasado de ser un experimento técnico a una infraestructura industrial crítica. La ventana de oportunidad para las startups se estrecha, ya que los gigantes, con sus vastos datos, capacidad de cómputo y canales de producción, están transformando rápidamente estos modelos en componentes operativos de sus productos y servicios. La cuestión clave ya no es quién tiene un modelo, sino **qué modelo entiende y simula verdaderamente el mundo para tomar decisiones útiles**.

marsbit06/25 06:58

Una guerra sin nombre unificado: El mapa de los Modelos de Mundo de los grandes fabricantes nacionales

marsbit06/25 06:58

活动图片