Google Deep Think domina las olimpiadas en ocho idiomas, resuelve de forma autónoma 4 grandes problemas sin resolver y derriba las barreras de la investigación científica

marsbitPublicado a 2026-04-08Actualizado a 2026-04-08

Resumen

Deep Think de Google ha logrado un rendimiento excepcional en ocho idiomas, destacándose en competencias regionales de matemáticas, programación y ciencias. El sistema, impulsado por Gemini, obtuvo puntuaciones máximas en japonés y francés, y resultados sobresalientes en chino, coreano, hindi, vietnamita, ruso y portugués. Más allá de las competencias, Deep Think ha resuelto cuatro problemas matemáticos previamente sin solución y ha contribuido a avances en física, economía y ciencias de la computación. Su capacidad multilingüe busca democratizar el acceso a herramientas de investigación de IA, eliminando barreras lingüísticas para científicos no angloparlantes. Aunque los resultados son internos y falta verificación independiente, representan un paso significativo hacia un "multiplicador de inteligencia humana" global.

"¡Deep Think supera/iguala a todos los competidores en todas las competiciones"!

Hace un momento, Conglong Li, investigador senior de Google DeepMind, publicó 12 mensajes en la plataforma X, mostrando un boletín de calificaciones nunca antes visto.

Una IA, un mismo cerebro, ocho exámenes en diferentes idiomas, todos entregados con puntuaciones altas.

En cualquier modelo, un resultado así es realmente inusual.

Desde la medalla de oro de la IMO hasta la cobertura total de competiciones regionales

Que Deep Think obtenga altas puntuaciones en múltiples rankings no es una explosión puntual repentina, sino una curva de evolución de capacidades que se ha mantenido durante casi un año.

Primero, llegó a la cima del campo de razonamiento más exigente.

En julio de 2025, Gemini Deep Think alcanzó por primera vez el nivel de medalla de oro en la Olimpiada Internacional de Matemáticas (IMO), obteniendo 35 puntos de 42. En la final mundial de la ICPC también logró un rendimiento similar de alto nivel.

Estos dos resultados ya han sido publicados oficialmente en el blog de DeepMind.

Google DeepMind luego incluyó estos dos logros en su blog oficial, como un indicador de que Deep Think había superado el "umbral de competición mundial" en matemáticas y programación.

Luego, Deep Think comenzó a pasar de "avances individuales de nivel campeón mundial" a una "verificación sistemática跨语言 (translingüística),跨学科 (transdisciplinaria),跨场景 (transescénica)".

En febrero de 2026, Google publicó tres blogs consecutivos.

Uno presentaba el modelo principal Gemini 3.1 Pro, otro presentaba una importante actualización del modo de razonamiento dedicado Deep Think, y otro provenía del equipo de descubrimientos científicos de DeepMind, posicionando directamente a Deep Think como un "multiplicador de la inteligencia humana".

Deep Think, una vez actualizado, presentó una serie de indicadores duros:

Humanity's Last Exam obtuvo un 48.4% (sin herramientas de asistencia), ARC-AGI-2 alcanzó un 84.6% (verificado oficialmente por la fundación ARC Prize), Elo en programación competitiva Codeforces de 3455, y las partes escritas de las Olimpiadas Internacionales de Física y Química 2025 alcanzaron nivel de medalla de oro.

Esta ruta es muy clara: primero usar competiciones de clase mundial como la IMO e ICPC para demostrar su poderosa capacidad de razonamiento, y luego usar los resultados de olimpiadas multilingües, regionales y跨学科 (transdisciplinarias) para demostrar su capacidad de razonamiento profundo universal y transferencia estable跨语言 (translingüística) y跨领域 (transdisciplinaria).

Evolución de capacidades de Gemini Deep Think desde la medalla de oro de la IMO hasta la aceleración de investigación a nivel de PhD

Análisis detallado del boletín de calificaciones en 8 idiomas

Ahora, despleguemos realmente este boletín de calificaciones.

El japonés es el más destacado.

Olimpiada Japonesa de Matemáticas (JMO Finals) 2025, 35ª edición, puntuación perfecta.

Ronda preliminar asiática de la ICPC en Japón, puntuación perfecta.

Entre estos, el resultado de la JMO Finals incluso superó el nivel correspondiente al 80% de la puntuación más alta de esa edición, alcanzando el estándar denominado "equivalente a Medalla de Oro" por los organizadores.

El francés también obtuvo un 100%, puntuación perfecta.

El chino es interesante.

En la 41ª Olimpiada Matemática China (CMO), Deep Think obtuvo un 86.3%, bastante notable. Pero en la Olimpiada China de Informática (NOI) solo obtuvo un 63.3%.

La diferencia entre el 86.3% y el 63.3% delimita la frontera real de la capacidad de razonamiento de la IA.

En las competiciones de matemáticas, el modelo se enfrenta a derivaciones abstractas, construcciones de pruebas y deducciones de múltiples pasos, que es precisamente la zona de capacidad donde Deep Think es más fuerte.

Pero en las competiciones de informática, el problema no es solo "entenderlo", sino también traducir la lógica a código ejecutable, controlar las condiciones límite, considerar las restricciones de complejidad y evitar errores a nivel de implementación.

Lo primero se acerca más al razonamiento puro, lo segundo requiere superar simultáneamente "razonamiento + diseño de algoritmos + implementación ingenieril".

En los resultados de las competiciones correspondientes a otros idiomas: coreano, hindi, vietnamita, ruso y portugués, Deep Think también logró superar a los competidores o al menos igualarlos.

Si volvemos a juntar japonés, francés y chino, lo más inusual esta vez no es realmente obtener una puntuación perfecta en una sola materia, sino que el mismo modelo, el mismo sistema de razonamiento Deep Think, en exámenes de competición en múltiples idiomas, entregó resultados del primer nivel.

¿Es fiable este boletín de calificaciones?

Pero hay una carencia clave:

Conglong Li no enumeró datos de comparación específicos de los competidores: todos los resultados provienen de evaluaciones internas de Google. No hay una verificación independiente de terceros, no hay certificación oficial de las competiciones, el método de evaluación no se ha hecho público en absoluto.

¿Cada problema se hizo una vez o muchas veces tomando el mejor resultado? ¿Cuánto poder computacional se usó durante el razonamiento? ¿Hubo intervención de ingeniería de prompts humana?

Estos detalles, que afectan directamente el valor de los resultados, tampoco se mencionaron.

Otro punto que pasa fácilmente desapercibido: todos estos exámenes son competiciones de selección regionales de varios países, no son finales internacionales.

Entre la dificultad de los problemas de las competiciones regionales y las finales internacionales, hay una diferencia de un orden de magnitud.

El investigador dijo claramente que estos resultados "serán incorporados a la ficha del modelo (model card)". Al cierre de esta edición, la ficha del modelo aún no se ha actualizado oficialmente.

Por lo tanto, por ahora, esto todavía parece ser un boletín de calificaciones calificado por el propio examinado, publicado por él mismo, y aún no sellado por la oficina de registro.

Equidad en la investigación multilingüe, el verdadero campo de batalla ignorado

¿Por qué Google se dedicaría específicamente a hacer evaluaciones regionales en 8 idiomas?

La evaluación actual de la capacidad de razonamiento de la IA se basa casi en su totalidad en inglés.

MATH, GSM8K, HumanEval, ARC-AGI...... todos estos están en inglés.

Matemáticos, físicos, ingenieros de todo el mundo, si su lengua materna no es el inglés, deben superar primero una barrera lingüística al usar herramientas de investigación con IA.

Los 8 idiomas que Google eligió no son aleatorios.

Japonés, coreano y chino cubren los centros de investigación de Asia Oriental; hindi y vietnamita cubren mercados emergentes; francés, ruso y portugués cubren Europa y América del Sur.

Juntos, esto representa la mayor parte de la producción científica global.

DeepMind, en su blog oficial, posiciona a Deep Think como un "multiplicador de la inteligencia humana", diciendo que puede "procesar la recuperación de conocimiento y la verificación rigurosa, permitiendo a los científicos concentrarse en la profundidad conceptual y la dirección creativa".

Combinado con estos resultados multilingües, el mensaje implícito de esta frase no es difícil de entender: este multiplicador no es solo para científicos que hablan inglés.

Es aún más notable lo lejos que Deep Think ha llegado en la aplicación práctica de la investigación.

DeepMind anunció un agente de investigación matemática llamado Aletheia, impulsado por Deep Think, que puede generar, verificar y revisar de forma autónoma soluciones a problemas de investigación matemática de nivel avanzado.

Aletheia, impulsado por Deep Think, es capaz de realizar una generación iterativa, verificación y corrección de problemas de investigación matemática de alto nivel.

Aletheia ya ha participado en la producción de múltiples artículos de investigación, uno de ellos completado completamente de forma autónoma por la IA, calculando constantes estructurales específicas en geometría aritmética.

Además, en una evaluación semi-autónoma de 700 problemas matemáticos abiertos, resolvió de forma independiente 4 problemas que antes no tenían solución.

El modo Gemini Deep Think también ha mostrado un gran potencial en informática, física, economía y otros campos.

En el campo de la informática, Deep Think ayudó a refutar una conjetura pendiente durante una década; en física encontró una nueva solución analítica para la radiación gravitacional de cuerdas cósmicas; y en economía extendió un teorema de teoría de subastas.

Diagrama esquemático del flujo de razonamiento de la IA, mostrando cómo la exploración a gran escala del espacio de soluciones a nivel de red se agrega en un razonamiento estructurado, confirmado mediante verificación automatizada y humana.

Al colaborar con expertos para resolver 18 problemas de investigación, la versión avanzada de Gemini Deep Think ayudó a superar cuellos de botella de larga data en los campos de algoritmos, aprendizaje automático y optimización combinatoria, teoría de la información y economía.

Esto va mucho más allá del ámbito de "resolver problemas de competición".

Mientras los competidores todavía compiten en las listas de benchmarks en inglés, Google ya ha encontrado un nuevo campo de batalla en el área de "aceleradores de investigación con IA".

Lo más importante de esto no son realmente las puntuaciones, la señal real detrás es: la barrera lingüística de las herramientas de investigación con IA está siendo abordada como un problema de ingeniería.

Si este camino tiene éxito, los científicos de todo el mundo que investigan en japonés, coreano, chino, hindi, por primera vez estarán en la misma línea de salida que los hablantes nativos de inglés.

Esta vez, Google ya ha puesto sus cartas sobre la mesa.

En cuanto a qué competidores seguirán, creemos que pronto lo veremos también.

Referencias:

https://blog.google/intl/ja-jp/company-news/technology/gemini-31-pro-gemini-31-pro-deep-think/%20

https://deepmind.google/blog/accelerating-mathematical-and-scientific-discovery-with-gemini-deep-think/%20

https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/%20

https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-deep-think/

Este artículo proviene del WeChat público "新智元" (Nueva Era de la Inteligencia), autor: 新智元

Preguntas relacionadas

Q¿Qué logró Gemini Deep Think en la Olimpiada Internacional de Matemáticas (IMO) de 2025?

AGemini Deep Think alcanzó el nivel de medalla de oro en la IMO de 2025, obteniendo 35 puntos de un total de 42.

Q¿En qué lenguas obtuvo Deep Think puntuaciones perfectas en las competiciones regionales mencionadas?

ADeep Think obtuvo puntuaciones perfectas (100%) en los exámenes en japonés y francés.

Q¿Qué sistema impulsado por Deep Think se utiliza para la investigación matemática y qué puede hacer?

AEl sistema se llama Aletheia. Puede generar, verificar y revisar de forma autónoma soluciones para problemas de investigación matemática de alto nivel.

QSegún el artículo, ¿cuál es una implicación significativa del rendimiento multilingüe de Deep Think?

ASignifica que las barreras lingüísticas para las herramientas de investigación con IA se están abordando como un problema de ingeniería, potencialmente poniendo a científicos de todo el mundo en igualdad de condiciones, independientemente de su idioma nativo.

Q¿Cuántos problemas matemáticos previamente no resueltos resolvió de forma autónoma el sistema Aletheia en una evaluación?

AAletheia resolvió de forma autónoma 4 problemas matemáticos que antes no tenían solución en una evaluación de 700 problemas abiertos.

Lecturas Relacionadas

¡Publicada la lista de las altcoins más populares según las búsquedas de las últimas horas!

La plataforma de seguimiento de criptomonedas CoinGecko ha publicado una lista de las criptomonedas más buscadas por los usuarios en las últimas tres horas. La principal tendencia es Pudgy Penguins ($PENGU), seguida de Catecoin (CATE) y Bless ($BLESS) en el podio. Según los datos, $PENGU subió un 3,9% en 24 horas. CATE, en segundo lugar, registró un impresionante aumento del 126,2%, mientras que $BLESS subió un 86,1%. What IF (IF) también destaca con un alza del 41,9%. La lista completa de los activos más buscados y su capitalización de mercado actual es la siguiente: 1. Pudgy Penguins ($PENGU) – 389,13 millones de dólares. 2. Catecoin (CATE) – 19,62 millones. 3. Bless ($BLESS) – 32,72 millones. 4. Aerodrome Finance (AERO) – 385,03 millones. 5. Hyperliquid (HYPE) – 11,43 mil millones. 6. Ethereum (ETH) – 224,17 mil millones. 7. Chainlink (LINK) – 6,17 mil millones. 8. Aave (AAVE) – 1,42 mil millones. 9. What IF (IF) – 31,24 millones. 10. Polkadot (DOT) – 1,34 mil millones. 11. Bitcoin (BTC) – 1,27 billones. 12. Virtual Protocol (VIRTUAL) – 366,19 millones. 13. Algorand (ALGO) – 758,15 millones. 14. Cash Cat (CASHCAT) – 41,81 millones. 15. Solana (SOL) – 42,38 mil millones. *Esto no es una recomendación de inversión.

cryptonews.ruHace 1 hora(s)

¡Publicada la lista de las altcoins más populares según las búsquedas de las últimas horas!

cryptonews.ruHace 1 hora(s)

Por 100 000 $ al mes: Truth Social vende acceso a las publicaciones de Trump a empresas de inversión

Trump Media and Technology Group (TMTG) lanzó el 1 de agosto de 2026 el servicio Truth API, un canal de datos de pago que otorga a firmas de inversión institucionales acceso en tiempo real a las publicaciones de las cuentas más influyentes en Truth Social, incluyendo la de Donald Trump. Con una suscripción que puede costar hasta 100,000 dólares mensuales, el servicio se presenta como una fuente de ingresos estable para TMTG. El anuncio ha generado críticas de legisladores demócratas y republicanos, como Elizabeth Warren y Bill Cassidy, quienes cuestionan la venta de acceso privilegiado a las publicaciones del presidente y han pedido investigaciones regulatorias. TMTG defendió la iniciativa como parte de una estrategia comercial legítima. El análisis adjunto advierte que este modelo crea riesgos similares a incidentes pasados donde mensajes falsos en redes sociales provocaron volatilidad en los mercados, destacando la falta de mecanismos de verificación en tiempo real para los posts distribuidos por la API.

cryptonews.ruHace 1 hora(s)

Por 100 000 $ al mes: Truth Social vende acceso a las publicaciones de Trump a empresas de inversión

cryptonews.ruHace 1 hora(s)

La estrategia mantiene el dividendo preferente de STRC en 12% ya que el precio aún está por debajo del valor nominal

Aunque las acciones preferentes STRC de Strategy cerraron julio muy por debajo de su valor nominal de 100 dólares, el dividendo de agosto se mantendrá en el 12%, sin incrementos. Michael Saylor, presidente ejecutivo, anunció la noticia, promocionando STRC como una forma de "estirar los ingresos". Agosto será el segundo mes con pagos quincenales. Las acciones STRC cerraron a 89,46 dólares el viernes, con un aumento mensual del 5,42%, tras un mal desempeño en junio. El volumen negociado fue aproximadamente dos tercios del promedio diario. El CEO Phong Le reiteró que el objetivo corporativo es que STRC cotice entre 99 y 100 dólares con el tiempo. Saylor sugirió un posible anuncio sobre cambios en las tenencias de Bitcoin de la compañía. Strategy reportó una pérdida neta de 8.220 millones de dólares en el segundo trimestre, principalmente por una pérdida no realizada de 8.320 millones en Bitcoin. La compañía ha construido una reserva de efectivo de 3.750 millones de dólares para respaldar los pagos de acciones preferentes, suficiente para más de dos años de dividendos e intereses. Recientemente recompró 25 millones de dólares en acciones STRC con descuento y planea continuar comprando mientras cotizan por debajo de los 100 dólares.

cointelegraphHace 3 hora(s)

La estrategia mantiene el dividendo preferente de STRC en 12% ya que el precio aún está por debajo del valor nominal

cointelegraphHace 3 hora(s)

Los retiros de Bitcoin continúan: 8 años de almacenamiento en una cartera fría Coldcard terminaron en cero

Retirada de bitcoin continúa: 8 años en cartera fría Coldcard terminan en cero La cartera hardware Coldcard ha sido vulnerada, provocando una nueva oleada de retiradas de fondos de dispositivos afectados. Galaxy Research informa que el volumen total robado asciende a 1.367,05 BTC (unos 88,6 millones de dólares) desde 4.585 direcciones, superando ampliamente los 594,5 BTC reportados inicialmente el 30 de julio de 2026. La mayor parte de lo robado permanece inactiva en las direcciones de los atacantes. El problema no reside en el firmware, que ya fue actualizado por Coinkite, sino en las frases semilla (seed phrases) generadas desde marzo de 2021 debido a un error de programación. Estas frases son fácilmente descifrables, y actualizar el firmware no las cambia. Solo transferir los fondos a una nueva dirección con una nueva frase semilla elimina la vulnerabilidad. El fallo se originó al integrar la biblioteca libNgU, lo que hizo que los dispositivos dejaran de usar el generador de números aleatorios por hardware STM32 y pasaran a usar el generador software Yasmarang, inicializado con datos públicamente accesibles como el número de serie del chip. Afecta a frases semilla creadas en dispositivos Mk2/Mk3 (firmware 4.0.1–4.1.9 y hasta 5.0.3), Mk4/Mk5 (hasta v5.6.0) y Q (hasta v1.5.0Q). Se excluyen aquellas creadas con al menos 50 lanzamientos de dados independientes o una passphrase BIP-39 fuerte y única. Los usuarios deben generar una nueva frase semilla en firmware corregido y transferir sus activos. Un caso ilustrativo es el de un inversor de 39 años que perdió 2 BTC (unos 130.000 dólares) en minutos, ahorrados durante ocho años mediante trabajo físico como protección contra la hiperinflación en su país, con el objetivo de una jubilación anticipada a los 50 años. Su estrategia conservadora de "comprar y mantener en frío" se vio truncada, dejándolo devastado y decidido a abandonar las criptomonedas. Este incidente recuerda vulnerabilidades históricas por generadores de números aleatorios débiles, como la de la biblioteca BitcoinJS (2011-2015), que causó grandes pérdidas. Subraya que el almacenamiento offline no garantiza automáticamente seguridad criptográfica, especialmente cuando la entropía se ve comprometida dentro del propio dispositivo "cerrado".

cryptonews.ruHace 3 hora(s)

Los retiros de Bitcoin continúan: 8 años de almacenamiento en una cartera fría Coldcard terminaron en cero

cryptonews.ruHace 3 hora(s)

¡Se observa un crecimiento explosivo en los volúmenes de trading de 15 altcoins en Corea del Sur!

Las principales bolsas de criptomonedas de Corea del Sur, Upbit y Bithumb, registraron un fuerte aumento en el volumen de operaciones con varios altcoins. En las últimas 24 horas, el volumen total de los altcoins más populares alcanzó aproximadamente 347,7 millones de dólares. MetaDAO (META) lideró la clasificación con un volumen de 65,84 millones de dólares solo en Upbit, representando el 12,39% del volumen spot total de la bolsa. Le siguió Euler (EUL) con 47,65 millones de dólares combinados en ambas plataformas. XRP, tradicionalmente popular entre los inversores coreanos, registró 38,11 millones de dólares. A continuación, se presentan los volúmenes de operaciones de 24 horas para los 15 altcoins más negociados en Upbit y Bithumb: 1. MetaDAO (META) – 65,84M$ 2. Euler (EUL) – 47,65M$ 3. XRP – 38,11M$ 4. ThunderCore (TT) – 35,64M$ 5. Babylon (BABY) – 25,15M$ 6. Geodnet (GEOD) – 20,28M$ 7. Hyperlane (HYPER) – 19,72M$ 8. Momentum (MMT) – 17,67M$ 9. Ondo (ONDO) – 15,65M$ 10. Shiba Inu (SHIB) – 10,55M$ 11. DOME – 9,61M$ 12. Lorenzo Protocol (BANK) – 9,51M$ 13. Akash Network (AKT) – 7,36M$ 14. Dogecoin (DOGE) – 7,30M$ 15. Worldcoin (WLD) – 5,74M$ *Esto no es una recomendación de inversión.

cryptonews.ruHace 4 hora(s)

Trading

Spot

Google Deep Think domina las olimpiadas en ocho idiomas, resuelve de forma autónoma 4 grandes problemas sin resolver y derriba las barreras de la investigación científica

Resumen

Desde la medalla de oro de la IMO hasta la cobertura total de competiciones regionales

Análisis detallado del boletín de calificaciones en 8 idiomas

¿Es fiable este boletín de calificaciones?

Equidad en la investigación multilingüe, el verdadero campo de batalla ignorado

Preguntas relacionadas

Lecturas Relacionadas

¡Publicada la lista de las altcoins más populares según las búsquedas de las últimas horas!

Por 100 000 $ al mes: Truth Social vende acceso a las publicaciones de Trump a empresas de inversión

La estrategia mantiene el dividendo preferente de STRC en 12% ya que el precio aún está por debajo del valor nominal

Los retiros de Bitcoin continúan: 8 años de almacenamiento en una cartera fría Coldcard terminaron en cero

¡Se observa un crecimiento explosivo en los volúmenes de trading de 15 altcoins en Corea del Sur!

Trading

Categorías populares

Etiquetas Populares