Original | Odaily Planet Daily(@OdailyChina)
Autor | Asher(@Asher_ 0210)

Antes de cada partido del Mundial, suelo pedirle a una IA que prediga el resultado. Casi todos los modelos exponen argumentos muy elaborados y detallados.
Algunos hablan del valor de mercado de los equipos, otros analizan los datos de la fase de grupos, otros evalúan lesiones y tácticas, e incluso hay quienes dan un guion completo con marcador, prórroga y penaltis. A primera vista, ChatGPT, Grok, Qianwen, DeepSeek, Gemini y Claude parecen entender mucho de fútbol.
Pero como usuario de mercados de predicción, lo que realmente me importa no es cuál modelo suena más completo, sino cuál es más fiable para consultar.
A medida que el Mundial entra en la fase de eliminación directa, Odaily Planet Daily, desde el primer partido, ha formulado preguntas lo más similares posible a diferentes modelos de IA antes de cada encuentro, y ha revisado los resultados reales después – para ver qué modelos solo parecían analizar bien y cuáles realmente anticiparon la tendencia del partido.
Hasta ahora, en los partidos de eliminación ya disputados, Canadá eliminó a Sudáfrica con un 1-0 en el último minuto, Brasil venció por la mínima 2-1 a Japón, Alemania fue eliminada por Paraguay tras ir a penaltis, y Holanda también cayó ante Marruecos desde los once metros. En el partido entre Bélgica y Senegal, el encuentro terminó 2-2 en el tiempo reglamentario y se decidió con una remontada en la prórroga, llenando de incertidumbre esta fase.
DeepSeek y Gemini, prediciendo a Marruecos se hicieron famosos
Lo más memorable hasta ahora fueron las predicciones de DeepSeek y Gemini para el partido Holanda vs Marruecos. Antes del encuentro era fácil apostar por el equipo equivocado – Holanda tenía un mejor equipo sobre el papel y una plantilla más completa. Muchos modelos sabían que Marruecos sería un hueso duro de roer, pero al final confiaron más en que Holanda pasaría.
Lo destacable de DeepSeek y Gemini es que no se quedaron en el "será un partido muy igualado", sino que también escribieron el guion posterior. Gemini predijo antes del partido un 1-1 en el tiempo reglamentario y victoria de Marruecos en los penaltis. El partido efectivamente terminó 1-1, y Marruecos eliminó a Holanda 3-2 en la tanda de penaltis. No solo acertaron la tendencia, sino que básicamente coincidieron en cómo se llegaría a los penaltis y quién terminaría riendo.

Predicción de Gemini para el partido Holanda vs Marruecos
DeepSeek también estuvo cerca. Determinó que lo más probable era un 1-1 o 0-0 en el tiempo reglamentario, que el partido podría alargarse hasta la prórroga o incluso penaltis, y se inclinó por la sorpresa de Marruecos clasificándose gracias a su defensa y contragolpes.

Predicción de Deepseek para el partido Holanda vs Marruecos
Después de este partido, la presencia de DeepSeek y Gemini se disparó. Especialmente Gemini, esta vez no parecía estar haciendo una predicción previa, sino más bien haber leído el guion del partido de antemano.
Grok y Qianwen acertaron marcadores concretos, más estables de lo imaginado
Además del gran acierto de DeepSeek y Gemini en el partido de Marruecos, Grok y Qianwen también tuvieron su momento. Su punto más brillante fue que, en partidos donde la dirección de la victoria era relativamente clara, no solo acertaron al equipo clasificado, sino que también predijeron marcadores muy cercanos al resultado final.
Sudáfrica vs Canadá es un ejemplo. La mayoría de modelos de IA favorecían a Canadá antes del partido, pero la divergencia estaba en si Canadá ganaría fácilmente. Grok predijo un 1-0 para Canadá, y Qianwen también pronosticó una victoria por un gol. Finalmente, Canadá pasó con solo un gol, no con la victoria abultada que algunos imaginaban.

Predicción de Qianwen para el partido Sudáfrica vs Canadá
Brasil vs Japón fue similar. La mayoría de modelos de IA consideraban a Brasil más fuerte, pero la clave era si Japón mantendría el partido igualado. Tanto Grok como Qianwen predijeron un 2-1, y el partido terminó con Brasil ganando 2-1 por los pelos. No acertaron simplemente en que "Brasil ganaría", sino en que Japón causaría suficientes problemas a Brasil.
En el partido Costa de Marfil vs Noruega, ambos también estuvieron muy acertados. Que Noruega, con Haaland, fuera favorita era comprensible, pero el juego físico y los contragolpes por las bandas de Costa de Marfil tampoco dejarían que el partido fuera desequilibrado. Tanto Grok como Qianwen predijeron una victoria de Noruega 2-1, y el marcador final cayó precisamente en ese "guion".

Predicción de Grok para el partido Costa de Marfil vs Noruega
La ventaja de Grok y Qianwen es que analizan los partidos de favoritos con más detalle. No predijeron guiones tan grandes como la eliminación de Holanda por Marruecos, pero en partidos como Canadá, Brasil, Noruega o Francia, dieron predicciones bastante acertadas tanto en la dirección del resultado como en el marcador concreto. En otras palabras, no son necesariamente los mejores para detectar sorpresas, pero son muy hábiles para juzgar si el equipo favorito pasará arrasando o con una victoria ajustada.
ChatGPT no tuvo muchos aciertos de marcador milagrosos, pero su análisis del desarrollo del partido fue bastante preciso
ChatGPT no predijo como Gemini que Marruecos eliminaría a Holanda en penaltis, ni acertó varios marcadores concretos como Grok y Qianwen. Pero su fortaleza radica en que, en partidos donde aparentemente el equipo fuerte tenía ventaja, ChatGPT advertía más claramente que el partido podría no ser tan fácil.
Brasil vs Japón es un ejemplo. ChatGPT predijo la clasificación de Brasil, pero no presentó el partido como una victoria fácil, sino que mencionó que la presión, el movimiento y la disciplina de Japón harían incómodo el juego a Brasil, e incluso que podrían marcar primero o empatar. Costa de Marfil vs Noruega fue similar; ChatGPT predijo la clasificación de Noruega, pero advirtió que no sería un partido fácil, ya que el juego físico, los contragolpes por bandas y la capacidad de transición de Costa de Marfil causarían problemas.
Además, en el partido de eliminación entre Inglaterra y la República Democrática del Congo, ChatGPT tampoco predijo simplemente una goleada de Inglaterra, sino que consideró que el partido podría ser aburrido, con la República Democrática del Congo frenando el ritmo con una defensa baja. Finalmente, Inglaterra clasificó, pero no lo hizo con facilidad.

Predicción de ChatGPT para el partido Inglaterra vs República Democrática del Congo
El punto fuerte de ChatGPT no es acertar siempre el marcador, sino que a menudo puede anticipar dónde estarán las dificultades en el partido. Es útil para entender el desarrollo del encuentro, pero menos adecuado si solo se busca un marcador final. Puede describir el proceso con bastante precisión, pero cuando se trata de predecir una gran sorpresa, le falta un poco de determinación.
La eliminación de Alemania, el lugar donde todos los modelos de IA fallaron juntos
Si en los partidos anteriores se podían ver los puntos fuertes de cada modelo, el partido Alemania vs Paraguay fue un fracaso colectivo.
Antes del partido, todos los modelos de IA estaban del lado de Alemania. ChatGPT, Grok, Qianwen, Gemini y Claude, todos apoyaban a Alemania, con predicciones de marcador concentradas mayormente en 2-0, 3-0 o 3-1. Las razones también eran consistentes: todos consideraban que Alemania era más fuerte sobre el papel, tenía mejor profundidad de plantilla y mayor potencia ofensiva.
Pero el resultado demostró que ahí estuvo el error. Los modelos de IA subestimaron la capacidad de Paraguay para convertir el partido en una lucha cerrada. Alemania no pudo resolver el partido en el tiempo reglamentario, ni romper el empate en la prórroga, y finalmente fue eliminada por Paraguay en la tanda de penaltis.
¿Quién es el más preciso hasta ahora?
A juzgar por los partidos de eliminación ya disputados, las características de los diferentes modelos comienzan a hacerse evidentes.
DeepSeek y Gemini tienen los momentos más brillantes. No solo pueden predecir la clasificación de favoritos como Brasil o Francia, sino que también dan respuestas muy valiosas en partidos más difíciles de pronosticar con sorpresas. En el partido Holanda vs Marruecos, su ventaja crucial fue atreverse a anticipar el guion de la sorpresa de Marruecos y la tanda de penaltis. Especialmente Gemini, que predijo directamente la clasificación de Marruecos en penaltis; ese partido fue realmente destacable.
Grok y Qianwen se parecen más a "especialistas en marcadores". Acertaron varios resultados concretos, especialmente en partidos como Canadá, Brasil, Noruega y Francia. Pero el problema es que, al enfrentarse a equipos tradicionalmente fuertes como Alemania u Holanda, finalmente se inclinaron por el favorito.
ChatGPT y Claude, por su parte, se asemejan más a "especialistas en análisis". Sus argumentos están bien elaborados, la dirección suele ser acertada en general, y también advierten sobre algunos riesgos de prórroga. Pero el problema es que, aunque a menudo ven que el partido será complicado, no se atreven a concluir que habrá sorpresa. Así fue en Holanda vs Marruecos: aunque vieron el riesgo de prórroga y penaltis, finalmente confiaron más en Holanda.
Por lo tanto, en lugar de preguntar apresuradamente qué modelo entiende más de fútbol, es mejor ver para qué escenario es adecuado cada uno.





