El equipo de investigación de la Universidad de Zhejiang propone una nueva ruta: enseñar a la IA la forma en que el cerebro humano comprende el mundo

marsbitPublicado a 2026-04-05Actualizado a 2026-04-05

Resumen

El equipo de investigación de la Universidad de Zhejiang propuso un nuevo enfoque para enseñar a la IA la forma en que el cerebro humano comprende el mundo, según un estudio publicado en *Nature Communications*. Contrario a la creencia predominante de que más parámetros mejoran el rendimiento, el equipo descubrió que, aunque los modelos grandes (como SimCLR, CLIP, DINOv2) mejoran en el reconocimiento de objetos concretos, su capacidad para entender conceptos abstractos disminuye al escalar. Por ejemplo, al aumentar los parámetros de 22.06 millones a 304.37 millones, el rendimiento en tareas concretas subió del 74.94% al 85.87%, pero en las abstractas bajó del 54.37% al 52.82%. La diferencia clave radica en cómo humanos y modelos organizan el conocimiento: los humanos clasifican jerárquicamente (p. ej., agrupando "ave" y "animal"), mientras que los modelos dependen de patrones en datos masivos y luchan con categorías abstractas. La solución del equipo no es agregar más parámetros, sino usar señales cerebrales humanas (registros de actividad cerebral al ver imágenes) para transferir estructuras conceptuales humanas a las redes neuronales. En experimentos con 150 categorías conocidas y 50 nuevas, los modelos entrenados así redujeron la brecha con las representaciones cerebrales y mostraron mejoras del ~20.5% en tareas abstractas con pocos ejemplos, superando incluso a modelos más grandes. Este enfoque cambia el paradigma de "más grande es mejor" a "más estructurado es más inte...

Los modelos grandes han seguido creciendo en tamaño, y la opinión predominante sostiene que cuantos más parámetros tenga el modelo, más se acercará a la forma de pensar humana. Sin embargo, un artículo publicado el 1 de abril en Nature Communications por un equipo de la Universidad de Zhejiang presenta una perspectiva diferente (enlace al artículo: https://www.nature.com/articles/s41467-026-71267-5). Descubrieron que cuando la escala del modelo (principalmente SimCLR, CLIP, DINOv2) aumenta, la capacidad de reconocer objetos concretos efectivamente continúa mejorando, pero la capacidad de comprender conceptos abstractos no solo no mejora, sino que incluso puede disminuir. Cuando los parámetros aumentaron de 22.06 millones a 304.37 millones, el rendimiento en tareas de conceptos concretos subió del 74.94% al 85.87%, mientras que en tareas de conceptos abstractos bajó del 54.37% al 52.82%.

La diferencia entre la forma de pensar humana y la de los modelos

Cuando el cerebro humano procesa conceptos, forma primero un conjunto de relaciones de categorización. Un cisne y un búho tienen un aspecto diferente, pero el humano los clasifica dentro de la categoría 'ave'. Subiendo de nivel, aves y caballos pueden seguir agrupándose en la categoría 'animal'. Al ver algo nuevo, los humanos a menudo piensan primero: ¿a qué cosa vista anteriormente se parece y a qué categoría pertenece大概? Los humanos aprenden continuamente nuevos conceptos, luego organizan esa experiencia y utilizan este marco de relaciones para reconocer nuevos objetos y adaptarse a nuevas situaciones.

Los modelos también categorizan, pero la forma en que lo hacen es diferente. Se basan principalmente en patrones que aparecen repetidamente en grandes volúmenes de datos. Cuanto más aparece un objeto concreto, más fácil le resulta al modelo reconocerlo. Sin embargo, cuando se trata de categorías más amplias, el modelo tiene más dificultades. Necesita captar los puntos en común entre múltiples objetos y luego agrupar esos puntos comunes en la misma categoría. Los modelos actuales tienen una debilidad evidente aquí. A medida que los parámetros siguen aumentando, el rendimiento en tareas de conceptos concretos mejora, mientras que el de conceptos abstractos a veces disminuye.

El punto en común entre el cerebro humano y los modelos es que ambos forman internamente un conjunto de relaciones de categorización. Pero sus énfasis son diferentes: las regiones visuales de alto orden del cerebro humano categorizan naturalmente clases amplias como 'seres vivos' y 'objetos inanimados'. Los modelos pueden distinguir objetos concretos, pero les cuesta mucho formar establemente estas categorías más amplias. Esta diferencia hace que al cerebro humano le resulte más fácil aplicar experiencias previas a nuevos objetos, por lo que podemos clasificar rápidamente cosas nunca vistas. Los modelos, en cambio, dependen más del conocimiento existente, por lo que al encontrarse con un nuevo objeto, tienden a quedarse en las características superficiales. El método propuesto en el artículo se desarrolla en torno a esta característica, utilizando señales cerebrales para restringir la estructura interna del modelo y acercarla más a la forma de categorizar del cerebro humano.

La solución del equipo de la Universidad de Zhejiang

La solución que propone el equipo también es singular: no se trata de seguir añadiendo parámetros, sino de utilizar una pequeña cantidad de señales cerebrales como supervisión. Estas señales cerebrales provienen de registros de la actividad cerebral de personas mientras miran imágenes. El artículo original dice: transferir las estructuras conceptuales humanas (human conceptual structures) a las DNNs. Es decir, intentar enseñar al modelo cómo categoriza, cómo generaliza y cómo agrupa conceptos similares el cerebro humano.

El equipo realizó experimentos con 150 categorías de entrenamiento conocidas y 50 categorías de prueba no vistas anteriormente. Los resultados mostraron que, a medida que avanzaba este entrenamiento, la distancia entre el modelo y la representación cerebral se reducía continuamente. Este cambio se produjo en ambas categorías, lo que indica que el modelo no está aprendiendo muestras individuales, sino que realmente comienza a aprender una forma de organizar los conceptos más cercana a la del cerebro humano.

Después de este entrenamiento, el modelo mostró una mayor capacidad de aprendizaje con muy pocas muestras y un mejor rendimiento ante nuevas situaciones. En una tarea donde se le daban muy pocos ejemplos pero se le pedía que distinguiera conceptos abstractos como 'ser vivo' y 'no vivo', el modelo mejoró una media del 20.5%, superando incluso a modelos de control mucho más grandes en número de parámetros. El equipo también realizó 31 pruebas específicas adicionales, donde varios tipos de modelos mostraron una mejora de casi un diez por ciento.

En los últimos años, el camino familiar para la industria de los modelos ha sido el de modelos más grandes. El equipo de la Universidad de Zhejiang ha elegido otra dirección: pasar de 'más grande es mejor' (bigger is better) a 'mejor estructurado es más inteligente' (structured is smarter). La expansión de escala es ciertamente útil, pero principalmente mejora el rendimiento en tareas conocidas. La capacidad de comprensión abstracta y transferencia humana es igualmente crucial para la IA, lo que requiere que en el futuro la estructura de pensamiento de la IA se acerque más a la del cerebro humano. El valor de esta dirección reside en que redirige la atención de la industria desde la mera expansión de escala de vuelta a la propia estructura cognitiva.

Neosoul y el futuro

Esto plantea una posibilidad mayor: la evolución de la IA podría no ocurrir solo en la fase de entrenamiento del modelo. El entrenamiento del modelo puede determinar cómo la IA organiza los conceptos, cómo forma estructuras de juicio de mayor calidad. Luego, una vez en el mundo real, comienza otra capa de evolución para la IA: cómo se registran y verifican las decisiones de los agentes de IA, cómo crecen y evolucionan continuamente en una competencia mutua real, aprendiendo y evolucionando por sí mismos como los humanos. Esto es precisamente lo que Neosoul está haciendo ahora. Neosoul no solo hace que los agentes de IA produzcan respuestas, sino que los coloca en un sistema de predicción continua, verificación, liquidación y selección, optimizándose constantemente en la predicción y los resultados, preservando las mejores estructuras y descartando las peores. Lo que el equipo de la Universidad de Zhejiang y Neosoul señalan conjuntamente es, en realidad, el mismo objetivo: que la IA no solo sepa resolver problemas, sino que tenga una capacidad de pensamiento integral y evolucione continuamente.

Preguntas relacionadas

Q¿Qué descubrió el equipo de investigación de la Universidad de Zhejiang en su estudio publicado en Nature Communications?

ADescubrieron que, al aumentar el tamaño de los modelos (como SimCLR, CLIP, DINOv2), la capacidad de reconocer objetos concretos mejoraba, pero la comprensión de conceptos abstractos no solo no mejoraba, sino que incluso disminuía. Por ejemplo, al aumentar los parámetros de 22.06 millones a 304.37 millones, las tareas de conceptos concretos subieron del 74.94% al 85.87%, mientras que las de conceptos abstractos bajaron del 54.37% al 52.82%.

Q¿Cuál es la principal diferencia entre cómo el cerebro humano y los modelos de IA procesan y clasifican conceptos?

AEl cerebro humano forma una jerarquía de relaciones categóricas, permitiendo clasificar objetos en categorías amplias (como 'aves' o 'animales') y aplicar experiencias previas a nuevos contextos. Los modelos de IA, en cambio, se basan en patrones de datos a gran escala y son buenos para reconocer objetos concretos, pero les cuesta formar categorías abstractas estables y dependen más del conocimiento existente, lo que limita su capacidad de generalización.

Q¿Cómo propone el equipo de la Universidad de Zhejiang mejorar la capacidad de los modelos para entender conceptos abstractos?

APropone utilizar señales cerebrales humanas como supervisión. Estas señales, registradas durante la visualización de imágenes, se utilizan para transferir la estructura conceptual humana a los modelos, enseñándoles a clasificar y organizar conceptos de manera más similar al cerebro humano, en lugar de simplemente aumentar el número de parámetros.

Q¿Qué resultados obtuvo el equipo en sus experimentos después de aplicar su método con señales cerebrales?

ALa distancia entre las representaciones del modelo y las cerebrales se redujo continuamente, y el modelo comenzó a aprender una organización conceptual más cercana a la humana. En tareas con muy pocos ejemplos, el modelo mejoró un 20.5% en promedio en la distinción de conceptos abstractos (como biótico vs. no biótico), superando incluso a modelos con muchos más parámetros.

Q¿Qué visión comparten el equipo de la Universidad de Zhejiang y Neosoul respecto al futuro de la IA?

AAmbos apuntan a que la IA desarrolle una capacidad de pensamiento más completa y evolutiva, similar a la humana. No se trata solo de que la IA resuelva tareas, sino de que pueda optimizarse continuamente en entornos reales a través de la predicción, verificación y competencia, permitiendo que las estructuras más efectivas se mantengan y las menos efectivas se descarten, fomentando así una evolución autónoma.

Lecturas Relacionadas

La CPU regresa a la mesa: comienza un 'ascenso' de 170.000 millones de dólares

El 1 de junio, NVIDIA presentó su primera CPU independiente, Vera, en el GTC Taipei 2026, marcando su entrada directa en este mercado. Simultáneamente, AMD ha duplicado su previsión del tamaño del mercado de CPUs para servidores a más de 1,2 billones de dólares, reflejando el crecimiento explosivo impulsado por la IA. Según UBS, se espera que el mercado de CPUs para servidores alcance unos 170.000 millones de dólares en 2030. El motivo principal de este resurgimiento es la transición de la IA hacia la fase de inferencia y los Agentes Inteligentes (Agentic AI). En este contexto, las CPUs asumen un papel crucial, gestionando hasta el 90% de la latencia en tareas complejas que involucran razonamiento múltiple, llamadas a herramientas externas y gestión de datos. A diferencia del entrenamiento, dominado por las GPUs, los Agentes generan grandes volúmenes de datos intermedios (KV Cache) que superan la capacidad de memoria de las GPUs, trasladándose a la memoria masiva de las CPUs. Esto ha alterado la proporción típica entre GPU y CPU, acercándose a 1:1 en escenarios de Agentes, frente a la proporción anterior de 1:8. Esta mayor demanda ha provocado un aumento de precios del 10%-15% en CPUs de servidor, la primera subida significativa en más de una década, y ha generado escasez de suministro. Se prevé que el mercado se divida en CPUs de alto rendimiento para clústeres de IA (~700.000 millones dólares) y CPUs desplegadas de forma independiente para Agentes (~700.000 millones dólares), un segmento nuevo desde 2026. NVIDIA, con su CPU Vera basada en ARM, apunta a un ratio 1:1 con sus GPUs Rubin. AMD superó a Intel en ingresos por centro de datos en el primer trimestre de 2026. En China, fabricantes como Hygon (arquitectura x86) y Huawei (ARM) se benefician de esta tendencia global y de las políticas de sustitución de importaciones, enfrentándose a una ventana de oportunidad crítica antes de 2027. En resumen, la era de los Agentes de IA ha reposicionado a la CPU como un cuello de botella crítico y un motor de crecimiento clave, donde la capacidad de colaboración entre CPU y GPU será más decisiva que el rendimiento individual de cada chip.

marsbitHace 7 hora(s)

La CPU regresa a la mesa: comienza un 'ascenso' de 170.000 millones de dólares

marsbitHace 7 hora(s)

TechFlow Inteligencia: Director de IA de AMD critica públicamente a Claude Code por "volverse más tonto y perezoso"; Trump anuncia alto al fuego en el estrecho de Ormuz, pero quedan 80 minas sin despejar

Resumen de TechFlow Intelligence: **IA y Tecnología:** - El Director de IA de AMD critica que Claude Code se ha vuelto "más torpe y perezoso". - SK Telecom, socio de Anthropic, bajo escrutinio de control de exportaciones de EE.UU. por posible transferencia de tecnología del modelo Mythos. - Z.AI lanza GLM-5.2, modelo chino que rivaliza con Claude Opus sin usar chips de Nvidia. - 0G Labs supera el hito de 1000 mil millones de tokens en inferencia de IA descentralizada. - DeepSeek genera gran debate en Zhihu por sus nuevas capacidades visuales. - Investigadores del MIT crean su propio sistema operativo para estudiar chips. **Cripto/Web3:** - Bithumb lista el par comercial de ReProtocol (RE) en won coreano. - Upbit elimina el par de KernelDAO (KERNEL). **Semiconductores/Hardware:** - Disputa entre EE.UU. y ASML sobre si máquinas litográficas EUV de última generación han llegado a China. - Amazon negocia la venta externa de sus chips de IA Trainium/Inferentia. - El A21 Pro de Apple usará exclusivamente el proceso N2P de TSMC. **Empresas Tecnológicas:** - Se descubren 10,000 repositorios en GitHub distribuyendo malware. - Apple parcha una vulnerabilidad crítica de escucha en Beats Studio Buds. - Ingenieros de Amazon investigados por criticar la expansión de centros de datos de IA. - Microsoft y Amazon Web Services, posibles objetivos de una estricta regulación antimonopolio de la UE. **Mercados/Macroeconomía:** - Trump afirma que se logró un "alto al fuego total" en el estrecho de Ormuz, pero la asociación de petroleros Intertanko advierte que aún hay unas 80 minas sin despejar en la ruta principal. - Cerca de 80 superpetroleros, cargados con 80 millones de barriles de petróleo, esperan una "señal de seguridad" para navegar. - Irán pospone viaje diplomático a Suiza, ensombreciendo las perspectivas de las conversaciones de paz. - Trump califica el acuerdo con Irán como "rendición incondicional" y afirma tener "poder ilimitado" como presidente. - Sector semiconductores en auge en bolsa: Intel sube un 10.6%, SpaceX cae un 3.5%. **Línea Subyacente:** Mientras la "paz" geopolítica en Ormuz es temporal y frágil (minas, viajes cancelados, petroleros a la espera), la guerra por los chips y la redefinición de las cadenas de suministro tecnológico (como los modelos chinos sin Nvidia o Amazon vendiendo sus chips) avanza de forma más permanente.

marsbitHace 7 hora(s)

TechFlow Inteligencia: Director de IA de AMD critica públicamente a Claude Code por "volverse más tonto y perezoso"; Trump anuncia alto al fuego en el estrecho de Ormuz, pero quedan 80 minas sin despejar

marsbitHace 7 hora(s)

Trading

Spot
Futuros
活动图片