En apenas unos días del Mundial, los modelos de predicción de IA ya tienen a unos ascendidos a dioses y a otros naufragando

marsbitPublicado a 2026-06-16Actualizado a 2026-06-16

Resumen

En el Mundial de Fútbol, las predicciones de IA están ganando popularidad como una herramienta más para los mercados de pronósticos, analizando resultados, goles, sorpresas y jugadas clave. En los primeros días, varios modelos han tenido aciertos y fallos notables. El modelo Qwen generó impacto al predecir correctamente el 2-0 de México sobre Sudáfrica en el partido inaugural, incluyendo el riesgo de tarjetas rojas, y también el 2-1 de Corea del Sur ante República Checa. Copilot, que predijo todo el calendario, acertó en resultados concretos como el 2-0 de México, el 2-1 de Corea y el empate 1-1 entre Brasil y Marruecos, pero falló en varias sorpresas, como el triunfo de Australia sobre Turquía. ChatGPT mostró un análisis detallado en el partido inaugural, aunque en predicciones más amplias tendió a favorecer a los equipos teóricamente más fuertes, perdiéndose algunas sorpresas. Pruebas en redes sociales con partidos como el inaugural mostraron variaciones: ChatGPT y Gemini acertaron el 2-0, mientras que Grok pronosticó 2-1 y Claude 3-1 para México. En resumen, aunque modelos como Qwen han tenido aciertos destacados en detalles del juego, y otros como Copilot y ChatGPT han mostr

En este Mundial, el lugar más animado no está solo en los campos de fútbol.

Con el aumento de la popularidad de los eventos de predicción relacionados con el Mundial, cada vez más usuarios comienzan a participar en transacciones con dinero real. Quién ganará, el marcador exacto, si habrá sorpresas, si habrá tarjetas rojas, qué jugador marcará, estos temas que antes eran solo para conversaciones entre aficionados antes del partido, ahora se desglosan en eventos de predicción transables.

Y cuando la predicción se convierte en una transacción, los usuarios necesitan algo más que emoción e intuición: los cambios en las cuotas, el estado del equipo, la información sobre lesiones, los enfrentamientos históricos y el sentimiento del mercado se convierten en referencias antes de operar. En este proceso, los modelos de IA se incorporan con frecuencia a los escenarios de predicción del Mundial.

Los grandes modelos como Qwen, ChatGPT, Gemini, Claude, DeepSeek, Qwen y Copilot no solo pueden responder "qué equipo es más probable que gane", sino que también pueden dar predicciones sobre el marcador, la posibilidad de sorpresas, el riesgo de tarjetas rojas, el rendimiento de jugadores clave y el desarrollo del partido. Para los participantes en el mercado de predicciones, la simulación previa al partido de la IA se está convirtiendo en otra capa de referencia, además de las cuotas, las noticias, los datos del equipo y el sentimiento del mercado.

Sin embargo, la predicción siempre debe volver al partido en sí.

A medida que el Mundial comienza oficialmente, los resultados de los primeros partidos ya se han publicado. Los análisis de IA que los usuarios utilizaron para ayudar en sus decisiones antes del partido finalmente tienen una respuesta para contrastar: si acertaron el marcador, si anticiparon la sorpresa, cuántos de los detalles como tarjetas rojas, remontadas o el desarrollo del partido fueron realmente captados por el modelo.

El que más llamó la atención, fue Qwen

Sin duda, el que tuvo el mayor efecto espectacular el primer día del Mundial fue Qwen.

Para el partido inaugural, México contra Sudáfrica, la predicción de Qwen antes del partido fue México 2:0 Sudáfrica. Al finalizar el partido, el marcador fue exactamente 2:0. Aún más interesante es que en el partido hubo tres tarjetas rojas, lo que coincide básicamente con la evaluación de riesgo de Qwen antes del partido sobre que "la defensa de Sudáfrica es muy agresiva y podría verse reducida a diez jugadores temprano".

Si solo hubiera predicho la victoria de México, no habría sido una gran sorpresa. Como uno de los anfitriones, México era el favorito. Pero lo que llamó la atención de Qwen fueron los detalles más específicos del partido: el marcador 2:0, el riesgo de tarjetas rojas para Sudáfrica y el ritmo que se abrió gradualmente en la segunda parte.

Inmediatamente después, en el partido de Corea del Sur contra la República Checa, Qwen predijo Corea del Sur 2:1.

Este partido no era fácil de predecir antes del inicio. La República Checa tenía ventaja física, amenaza en balón parado y la experiencia habitual de los equipos europeos en grandes torneos. El desarrollo del partido efectivamente no fue unilateral: la República Checa se adelantó primero, Corea del Sur empató después, y el partido se estancó en 1:1 durante mucho tiempo. Hasta la etapa final, Corea del Sur marcó el gol de la victoria y el marcador final fue 2:1.

Esto le dio un toque más "dramático" a la predicción de Qwen. La predicción del ganador puede basarse en la calidad del equipo en el papel, la predicción del marcador puede tener un componente de suerte, pero los detalles del proceso como las tarjetas rojas, las remontadas y los goles decisivos en la etapa final son lo que realmente hacen pensar que "esto tiene algo". Después de los dos primeros partidos, Qwen aumentó la atención sobre la predicción de la IA en el Mundial.

Copilot: Tiene destellos de genialidad, pero también fracasos evidentes

Antes del torneo, USA Today pidió a Copilot que predijera los 104 partidos de este Mundial. Viendo los partidos ya jugados, estas predicciones tienen momentos brillantes, pero también fallos evidentes.

Entre ellas, las predicciones de tres partidos fueron las más destacadas.

Para el partido inaugural, México contra Sudáfrica, la predicción de Copilot fue México 2:0, acertando el marcador exacto. Para Corea del Sur contra la República Checa, predijo Corea del Sur 2:1, coincidiendo nuevamente con el resultado. Y para Brasil contra Marruecos, Copilot predijo un 1:1, y Brasil efectivamente fue empatado por Marruecos.

Especialmente el partido Brasil 1:1 Marruecos tiene un gran mérito. Brasil es, después de todo, un gigante tradicional, con una plantilla y un nivel de atención en la primera línea.

Marruecos, aunque llegó a semifinales en el último Mundial, enfrentarse a Brasil y predecir directamente el empate antes del partido no era una opción especialmente segura. Al final, Brasil no pudo ganar su primer partido y Marruecos continuó mostrando su resistencia en los grandes torneos. La predicción de Copilot en este partido fue realmente un "destello de genialidad".

Pero los problemas de Copilot también se hicieron evidentes rápidamente.

Predijo que Canadá ganaría 2:1 a Bosnia y Herzegovina, pero el resultado fue un empate 1:1; predijo que Suiza ganaría 1:0 a Catar, pero Suiza también fue empatada; predijo que Estados Unidos ganaría 2:0 a Paraguay, la dirección fue correcta, pero el resultado real fue 4:1, subestimando claramente la intensidad ofensiva.

Fracasos más evidentes aparecieron en varios partidos con sorpresas o donde los favoritos tropezaron.

Para Turquía contra Australia, Copilot predijo que Turquía ganaría 2:1, pero Australia ganó sorprendentemente 2:0. Para Ecuador contra Costa de Marfil, predijo que Ecuador ganaría 2:1, pero Costa de Marfil ganó 1:0. Para Países Bajos contra Japón, predijo que Países Bajos ganaría 2:1, pero Japón empató dos veces y el resultado final fue 2:2. Para Suecia contra Túnez, predijo 1:1, pero Suecia ganó contundentemente 5:1.

Que Copilot haya acertado los marcadores específicos de México, Corea del Sur y Brasil demuestra que no solo sigue a los favoritos. Pero partidos como la victoria de Australia sobre Turquía, el empate de Catar con Suiza o el empate de Japón con Países Bajos también revelan que sus juicios sobre sorpresas y empates siguen siendo bastante conservadores.

ChatGPT: Análisis completo, pero no muy preciso con las sorpresas

En comparación con las predicciones completas de Copilot, ChatGPT se parece más a un "analista previo al partido".

En la predicción del partido inaugural, ChatGPT predijo México 2:0 Sudáfrica, acertando el marcador final. Las razones que dio también fueron bastante completas, incluyendo la ventaja local de México, su estado reciente, la falta de ataque de Sudáfrica, y factores como la altitud de la Ciudad de México y el ambiente local. En esta predicción, ChatGPT no solo dio un resultado, sino que la lógica detrás de su juicio también coincidió con el resultado del partido.

Pero en las predicciones para todo el torneo, la estabilidad de ChatGPT no es tan fuerte. Aunque acertó México 2:0 Sudáfrica y Brasil 1:1 Marruecos, y predijo correctamente la dirección del ganador en partidos como Escocia, Alemania y Suecia, en partidos como Corea del Sur 2:1 República Checa, Catar 1:1 Suiza, Australia 2:0 Turquía y Japón 2:2 Países Bajos, los juicios de ChatGPT predijeron al equipo teóricamente más fuerte. Por ejemplo, que Suiza debería ganar a Catar, que Turquía debería ganar a Australia, que Países Bajos debería ganar por poco a Japón.

ChatGPT no carece de capacidad predictiva; puede desglosar claramente la calidad del equipo, el entorno local, el estado reciente y puede acertar el marcador en algunos partidos. Pero según los resultados actuales, es más hábil explicando "por qué el favorito es más razonable" que identificando previamente qué partidos pueden desviarse del guion favorito.

Gemini, Grok, Claude: Un mismo partido, diferentes guiones escritos por diferentes modelos

Además de Qwen, Copilot y ChatGPT, algunos usuarios de redes sociales también han alimentado el mismo partido a múltiples modelos para obtener predicciones previas.

Tomando como ejemplo el partido inaugural, México contra Sudáfrica, un blogger probó simultáneamente cuatro modelos de IA: ChatGPT, Gemini, Grok y Claude, para obtener predicciones previas. Los resultados mostraron que tanto ChatGPT como Gemini predijeron México 2:0 Sudáfrica, acertando el marcador exacto; Grok predijo México 2:1, Claude predijo México 3:1; aunque ambos acertaron la victoria de México, no acertaron el marcador específico.

En la predicción de este partido inaugural, diferentes modelos dieron tres "guiones" distintos. ChatGPT Go y Gemini Pro se acercaron más al partido real: México dominó, Sudáfrica careció de ataque y finalmente no marcó. Grok pareció dar un marcador más abierto, pensando que Sudáfrica marcaría en el contraataque. Claude Sonnet elevó más las expectativas ofensivas de México, dando un resultado más abierto como 3:1.

Resumen

Dado que las muestras de predicciones de IA disponibles para análisis retrospectivo siguen siendo limitadas, en esta etapa no se puede juzgar directamente qué modelo "entiende más de fútbol".

Pero solo viendo los pocos partidos ya jugados, las diferencias comienzan a aparecer. Por ahora, Qwen es el más memorable: el primer día acertó consecutivamente México 2:0 Sudáfrica y Corea del Sur 2:1 República Checa, y además captó el riesgo de tarjetas rojas y el desarrollo del partido, lo que representa un rendimiento destacado en una muestra pequeña. Sin embargo, si podrá mantener esta precisión en partidos posteriores, requiere más partidos para verificarlo.

Copilot y ChatGPT, ambos tienen momentos brillantes al acertar marcadores específicos, pero también exponen un problema común: al enfrentarse a partidos que se desvían de la calidad teórica, como la victoria de Australia sobre Turquía, el empate de Catar con Suiza o el empate de Japón con Países Bajos, su juicio sigue sin ser lo suficientemente sensible.

En cuanto a modelos como Gemini, Grok, Claude, etc., las muestras públicas actuales se concentran más en partidos individuales o comparaciones en redes sociales, tienen valor de referencia, pero aún no son adecuadas para establecer un ranking directo.

La IA ya puede convertirse en una capa de referencia para los usuarios del mercado de predicciones del Mundial, pero aún está lejos de ser la respuesta estándar.

Preguntas relacionadas

Q¿Qué modelo de IA llamó la atención en la primera jornada del Mundial y por qué?

AEl modelo que llamó más la atención fue Qwen, ya que predijo con precisión el resultado 2-0 de México sobre Sudáfrica, incluyendo el riesgo de tarjetas rojas para Sudáfrica y el ritmo del partido, mostrando una notable capacidad para capturar detalles específicos del juego.

Q¿Qué aciertos y errores destacaron en las predicciones de Copilot según el artículo?

ACopilot acertó en el 2-0 de México sobre Sudáfrica, el 2-1 de Corea del Sur sobre República Checa y el empate 1-1 entre Brasil y Marruecos. Sin embargo, falló en pronosticar resultados como la victoria de Australia sobre Turquía o el empate de Catar con Suiza, mostrando dificultades para prever partidos con resultados inesperados o 'sorpresa'.

Q¿Cómo se describe el enfoque de ChatGPT en la predicción de partidos de la Copa del Mundo?

AChatGPT se describe como un 'analista previo al partido'. Ofrece razonamientos completos, considerando factores como la ventaja local, el estado reciente y el ambiente, pero tiende a favorecer a los equipos teóricamente más fuertes, mostrando menos precisión al anticipar partidos con resultados inesperados o empates.

QSegún el artículo, ¿qué modelos de IA predijeron correctamente el resultado del partido inaugural entre México y Sudáfrica?

AEn el partido inaugural entre México y Sudáfrica, los modelos Qwen, Copilot, ChatGPT y Gemini predijeron correctamente la victoria de México 2-0. Grok predijo 2-1 y Claude predijo 3-1, ambos acertando en el ganador pero no en el marcador exacto.

Q¿Qué conclusión general se presenta en el artículo sobre el uso de la IA para predecir resultados del Mundial?

AEl artículo concluye que, aunque los modelos de IA pueden ofrecer análisis útiles y convertirse en una referencia más para los participantes en los mercados de predicción, aún no son una 'respuesta estándar' definitiva. Su rendimiento varía, algunos tienen momentos destacados pero la consistencia general y la capacidad para prever sorpresas aún requieren más validación con una muestra más amplia de partidos.

Lecturas Relacionadas

Xpeng y Nio compiten por potencia de cálculo, Li Auto cambia de arquitectura

En un evento del 15 de junio, Li Auto presentó su chip de conducción autónoma autodesarrollado Mahe M100 para el nuevo L9 Livis, enfatizando la innovación en arquitectura por sobre la potencia bruta de cálculo (TOPS). Mientras que competidores como NIO, Xpeng y Huawei destacan sus cifras de TOPS, Li Auto apuesta por un cambio fundamental: una arquitectura de flujo de datos dinámico que optimiza el procesamiento de modelos de IA, reduciendo la latencia y mejorando la eficiencia. El chip Mahe M100, cuyo diseño fue presentado en la conferencia ISCA 2026, promete hasta tres veces más potencia efectiva que el Nvidia Thor U en cargas de trabajo específicas de Li Auto, gracias a su co-diseño con el modelo de IA VLA2.1. Sin embargo, esta ventaja está ligada a sus algoritmos propietarios, lo que implica un alto costo de cambio si se modifica la ruta tecnológica. Li Auto también introdujo su visión de "vehículo de inteligencia encarnada", definiendo el coche como un sistema integral que combina transporte, asistencia y capacidad de aprendizaje. La compañía se comprometió a equiparar su sistema de conducción autónoma, Mahe VLA, con el Tesla FSD V14 en el cuarto trimestre, con actualizaciones mensuales concretas que mejorarán capacidades como el estacionamiento autónomo y los tiempos de reacción. A pesar de los desafíos financieros, con un margen decreciente en 2025 y un objetivo de ventas de 550,000 unidades para 2026, Li Auto mantiene una fuerte inversión en I+D, enfocándose en la integración vertical de hardware y software. Los próximos lanzamientos de productos y actualizaciones de software en el tercer trimestre serán cruciales para validar su estrategia en el competitivo mercado de vehículos eléctricos.

marsbitHace 27 min(s)

Xpeng y Nio compiten por potencia de cálculo, Li Auto cambia de arquitectura

marsbitHace 27 min(s)

Año Uno de las Aplicaciones de IA: ¿Solo sabe decir "sí", ignorando los riesgos? El cuaderno de bitácora del desarrollo de software se abre por completo

El año de la IA aplicada: ¿Solo "sí" y sin considerar riesgos? El diario de navegación del desarrollo de software se abre por completo. El rápido aumento del uso de IA para generar código, con menos supervisión, introduce riesgos ocultos en código aparentemente correcto, lo que puede provocar pérdidas de datos o activos. El proyecto de código abierto **Narwhal AI Code Risks**, de Narwhal-Lab (Universidad de Pekín), recopila casos reales, señales tempranas y rutas de riesgo típicas para ayudar a los desarrolladores a identificar peligros. Un ejemplo claro es el incidente de configuración del oráculo cbETH de Moonwell, donde un error semántico en un precio (1.12 USD en lugar de ~2200 USD) pasó todas las revisiones y causó una pérdida de ~1.78 millones de dólares. El riesgo no siempre se muestra con errores; a menudo, el código funciona pero su semántica es errónea. La IA ya no solo completa código, sino que modifica configuraciones, gestiona dependencias y actúa mediante agentes, creando cadenas de acciones más largas y difíciles de rastrear. Los riesgos se clasifican en 7 categorías: cadena de suministro, vulnerabilidades a nivel de código, configuración de nube/infraestructura, riesgos de agentes, riesgos en dominios verticales, propiedad intelectual/cumplimiento y factores humanos. El proyecto organiza la información en tres niveles: `cases/` (eventos reales verificados), `inferred/` (señales tempranas por confirmar) y `scenarios/` (patrones de riesgo claros). Su objetivo es convertir casos de riesgo en conocimiento reutilizable para que desarrolladores, investigadores y fabricantes de herramientas puedan detectar y prevenir problemas similares, creando un registro de navegación abierto para la era del desarrollo con IA.

marsbitHace 27 min(s)

Año Uno de las Aplicaciones de IA: ¿Solo sabe decir "sí", ignorando los riesgos? El cuaderno de bitácora del desarrollo de software se abre por completo

marsbitHace 27 min(s)

La base de la valoración billonaria de SpaceX: ¿Quién se reparte los miles de millones de gastos de capital anuales de Musk?

SpaceX, valorado en un billón de dólares, genera una cadena de suministro emergente que distribuye sus enormes gastos anuales de capital. Su negocio se divide en Starlink (que genera ingresos), cohetes (que reducen costes de lanzamiento) y centros de datos de IA en órbata. Este ciclo supone cientos de miles de millones en órdenes de compra para proveedores. Los proveedores se clasifican en tres grupos. Primero, los insustituibles a corto plazo: NVIDIA (GPUs para superordenadores), Eutelsat (espectro de radiofrecuencia), Filtronic (amplificadores de señal), Materion (berilio) y STMicroelectronics (chips para antenas). Segundo, aquellos cuyo reemplazo sería muy costoso: Honeywell (control de vuelo), Carpenter Technology (aleaciones especiales), Hexcel (fibra de carbono) y Broadcom/Linde (conmutación de datos/gases industriales). Tercero, proveedores de fabricación en masa a bajo coste, como Wistron NeWeb (ensamblaje de terminales) y varias empresas chinas (por ejemplo, Sunway Communication, Paixin New Materials) que suministran componentes clave. La oportunidad surge ahora porque el volumen de compras está creciendo, la transparencia aumenta tras la OPV y la cadena de suministro está en una fase temprana, comparable a la de Tesla en 2018. En lugar de invertir directamente en SpaceX, el artículo sugiere analizar a sus proveedores, cuyos ingresos están vinculados a pedidos concretos, no a la volatilidad de la acción. Se advierte de riesgos como ciclos de materias primas, geopolítica o cambios tecnológicos.

marsbitHace 1 hora(s)

La base de la valoración billonaria de SpaceX: ¿Quién se reparte los miles de millones de gastos de capital anuales de Musk?

marsbitHace 1 hora(s)

La base de la valoración de un billón de dólares de SpaceX: ¿Quién se está repartiendo los gastos de capital anuales de 100.000 millones de Musk?

SpaceX acaba de cotizar en bolsa con una valoración de un billón de dólares, pero su base real reside en su cadena de suministro. El artículo argumenta que, al igual que ocurrió con las cadenas de suministro de Apple, Tesla y Nvidia, los verdaderos beneficiarios de la revolución de SpaceX serán sus proveedores, quienes se repartirán sus enormes gastos de capital anuales. SpaceX genera un ciclo de negocio donde Starlink (con 113 mil millones de USD en ingresos en 2023) financia el desarrollo de cohetes (como Starship) y la infraestructura de IA. Este ciclo genera cientos de miles de millones en pedidos de compra para proveedores, clasificados en tres categorías: 1. **Irreemplazables a corto plazo:** Incluyen a **NVIDIA** (GPU para el superordenador Colossus), **Eutelsat (SATS)** (espectro de radiofrecuencia crucial), **Filtronic (FTC)** (amplificadores de ondas milimétricas para satélites), **Materion (MTRN)** (único productor integrado de berilio) y **STMicroelectronics (STM)** (chips para antenas de fase). 2. **Reemplazables, pero con un coste muy alto:** Empresas con una certificación y una integración profundamente arraigadas, como **Honeywell (HON)** (sistemas de guiado), **Carpenter Technology (CRS)** (aleaciones para motores), **Hexcel (HXL)** (fibra de carbono) y **Broadcom (AVGO)** (interconexión de datos). 3. **Proveedores de fabricación a gran escala y bajo coste:** Esenciales para productos masivos como los terminales Starlink (objetivo: 3000 millones de unidades). Aquí destacan **Wistron NeWeb (6285)** como principal ensamblador, y empresas chinas como **Xinwei Communication (300136), Paide New Materials (605123), Western Metal Materials (002149)** y **Yingliu Co., Ltd. (603308)**, que suministran componentes críticos. La tesis principal es que el crecimiento de SpaceX acaba de comenzar (con planes de 100 lanzamientos en 2026), la transparencia aumenta tras la OPV y su etapa actual se asemeja a la de Tesla en 2018, marcando el inicio de una oportunidad de inversión en su cadena de suministro, independientemente de la volatilidad de su acción. El artículo concluye sugiriendo observar a estos "proveedores silenciosos" que recibirán los pedidos recurrentes de SpaceX.

链捕手Hace 1 hora(s)

La base de la valoración de un billón de dólares de SpaceX: ¿Quién se está repartiendo los gastos de capital anuales de 100.000 millones de Musk?

链捕手Hace 1 hora(s)

Trading

Spot
Futuros
活动图片