Original | Odaily Planet Daily(@OdailyChina)
Autor | Asher(@Asher_ 0210)
En este Mundial, el lugar más animado no está solo en el campo de juego.
Con el aumento de la popularidad de los eventos de predicción relacionados con el Mundial, cada vez más usuarios comienzan a participar en transacciones con dinero real. Quién ganará, cuál será el marcador, si habrá sorpresas, si habrá tarjetas rojas, qué jugador marcará... estos temas que antes eran solo conversaciones de aficionados antes del partido, ahora se han dividido en eventos de predicción que se pueden transaccionar.
Y cuando la predicción se convierte en transacción, los usuarios no solo necesitan emociones e intuición: los cambios en las cuotas, el estado del equipo, la información sobre lesiones, los enfrentamientos históricos, el sentimiento del mercado, todo se convierte en una referencia antes de la transacción. En este proceso, los modelos de IA comienzan a ser incorporados frecuentemente al escenario de predicciones del Mundial.
Modelos de gran tamaño como Qwen, ChatGPT, Gemini, Claude, DeepSeek, Qwen y Copilot no solo pueden responder "qué equipo tiene más probabilidades de ganar", sino que también pueden dar juicios sobre el marcador, la posibilidad de sorpresas, el riesgo de tarjetas rojas, el desempeño de jugadores clave y el análisis de la evolución del partido. Para los participantes en los mercados de predicción, las simulaciones previas al partido de la IA se están convirtiendo en otra capa de referencia, además de las cuotas, las noticias, los datos de los equipos y el sentimiento del mercado.
Sin embargo, las predicciones finalmente deben volver al propio partido.
A medida que el Mundial comienza oficialmente, los resultados de los primeros partidos ya han ido saliendo. Aquellos análisis de IA que los usuarios utilizaban antes para ayudar en sus juicios, finalmente tienen una respuesta contra la cual contrastarse: si el marcador fue acertado, si se anticipó la sorpresa, cuántos de estos detalles como las tarjetas rojas, los goles en el último minuto o la evolución del partido fueron realmente captados por los modelos.
El primero en destacar fue Qwen
Lo más llamativo del primer día del Mundial, sin duda, fue Qwen.
Para el partido inaugural entre México y Sudáfrica, Qwen predijo antes del partido México 2-0 Sudáfrica. Al finalizar el partido, el marcador realmente se detuvo en 2-0. Lo más interesante es que hubo un total de tres tarjetas rojas en el partido, lo que también coincidió básicamente con el juicio de riesgo previo de Qwen sobre "los excesos defensivos de Sudáfrica, que podrían quedar con un jugador menos temprano".
Si solo se hubiera limitado a predecir la victoria de México, no habría sido tan sorprendente. Como uno de los anfitriones, México era de por sí más favorito. Pero lo que Qwen acertó esta vez fueron detalles más específicos del partido: el marcador de 2-0, el riesgo de tarjeta roja para Sudáfrica y el ritmo que gradualmente se fue abriendo en la segunda parte del encuentro.
Inmediatamente después, en el partido entre Corea del Sur y la República Checa, Qwen volvió a dar la predicción de Corea del Sur 2-1.
Este partido no era fácil de predecir antes del inicio. La República Checa tenía juego físico, amenaza en balón parado y la experiencia habitual de los equipos europeos en grandes torneos. El desarrollo del partido tampoco fue unilateral; la República Checa se adelantó primero, Corea del Sur luego empató, y el partido permaneció largo tiempo en 1-1. Hasta la etapa final, cuando Corea del Sur anotó el gol de la victoria, el marcador finalmente se convirtió en 2-1.
En este punto, la predicción de Qwen adquirió un toque más "guionizado". El juicio sobre el ganador puede basarse en el potencial sobre el papel, la predicción del marcador puede tener un componente de suerte, pero son los detalles del proceso, como las tarjetas rojas, las remontadas y los goles decisivos en la etapa final, los que realmente hacen pensar que "tiene algo". Después de los dos primeros partidos del día, Qwen logró aumentar la atención sobre las predicciones del Mundial con IA.
Copilot: con momentos brillantes y errores evidentes
Antes del torneo, USA Today le pidió a Copilot que predijera los 104 partidos completos de este Mundial. Viendo los partidos que ya han concluido, estas predicciones tienen tanto aciertos destacados como errores evidentes.
Entre ellas, hay tres partidos cuyas predicciones fueron más brillantes.
Para el partido inaugural México vs Sudáfrica, Copilot predijo México 2-0, acertando exactamente el marcador final. Para Corea del Sur vs República Checa, predijo Corea del Sur 2-1, coincidiendo nuevamente con el resultado. Y para Brasil vs Marruecos, Copilot dio la predicción de 1-1, y Brasil realmente fue empatado por Marruecos.
Especialmente el partido Brasil 1-1 Marruecos tiene un mérito considerable. Brasil es, después de todo, un gigante tradicional, con una plantilla y una atención mediática de primer nivel. Aunque Marruecos llegó a las semifinales en el último Mundial, predecir directamente un empate contra Brasil antes del partido no era una opción particularmente segura. Al final del partido, Brasil no consiguió un inicio victorioso, y Marruecos continuó con su resistencia en grandes torneos; esta predicción de Copilot fue realmente "un golpe de genialidad".
Pero los problemas de Copilot también se hicieron evidentes rápidamente.
Predijo que Canadá ganaría 2-1 a Bosnia y Herzegovina, pero el resultado fue 1-1; predijo que Suiza ganaría 1-0 a Catar, pero Suiza también fue empatada; predijo que Estados Unidos ganaría 2-0 a Paraguay, aunque la dirección fue correcta, el marcador real fue 4-1, subestimando claramente la intensidad ofensiva.
Errores más evidentes aparecieron en varios partidos con sorpresas o donde los favoritos tropezaron.
Para Turquía vs Australia, Copilot predijo que Turquía ganaría 2-1, pero Australia ganó sorprendentemente 2-0. Para Ecuador vs Costa de Marfil, predijo Ecuador 2-1, pero Costa de Marfil ganó 1-0. Para Países Bajos vs Japón, predijo Países Bajos 2-1, pero Japón empató dos veces y finalmente el partido terminó 2-2. Para Suecia vs Túnez, predijo 1-1, pero Suecia directamente ganó 5-1.
Que Copilot pudo acertar los marcadores específicos de México, Corea del Sur y Brasil, demuestra que no se limita a dar respuestas favorables a los equipos más populares. Pero partidos como la victoria de Australia sobre Turquía, el empate de Catar con Suiza y el empate de Japón con Países Bajos, también revelan que su juicio sobre sorpresas y empates sigue siendo relativamente conservador.
ChatGPT: análisis completos, pero poca precisión con las sorpresas
En comparación con las predicciones completas del calendario de Copilot, ChatGPT se parece más a un "analista previo al partido".
En la predicción del partido inaugural, ChatGPT predijo México 2-0 Sudáfrica, acertando el marcador final. Sus razones fueron también bastante completas, incluyendo la ventaja local de México, su estado de forma reciente, la falta de puntería ofensiva de Sudáfrica, y factores como la altitud de la Ciudad de México y el ambiente local. En esta predicción, ChatGPT no solo dio un resultado, sino que la lógica detrás de su juicio también coincidió con el resultado del partido.
Pero en las predicciones del calendario completo del Mundial, la estabilidad de ChatGPT no fue tan fuerte. Aunque acertó México 2-0 Sudáfrica y Brasil 1-1 Marruecos, y también acertó la dirección del ganador en varios partidos como Escocia, Alemania y Suecia. En partidos como Corea del Sur 2-1 República Checa, Catar 1-1 Suiza, Australia 2-0 Turquía y Japón 2-2 Países Bajos, los juicios de ChatGPT predijeron al equipo más fuerte sobre el papel. Por ejemplo, que Suiza debía ganar a Catar, que Turquía debía ganar a Australia, que Países Bajos debía ganar por poco a Japón.
ChatGPT no carece de capacidad predictiva; puede desglosar claramente la fuerza del equipo, el entorno local, el estado de forma reciente, y puede acertar el marcador en algunos partidos. Pero según los resultados hasta ahora, es más hábil explicando "por qué el favorito es más razonable", que identificando de antemano qué partidos podrían desviarse del guion favorito.
Gemini, Grok, Claude: el mismo partido, diferentes guiones escritos por diferentes modelos
Además de Qwen, Copilot y ChatGPT, algunos usuarios de redes sociales alimentaron el mismo partido a múltiples modelos para hacer predicciones previas.
Tomando como ejemplo el partido inaugural México vs Sudáfrica, un blogger probó simultáneamente cuatro modelos de IA: ChatGPT, Gemini, Grok y Claude, para hacer predicciones previas al partido. Los resultados mostraron que tanto ChatGPT como Gemini dieron la predicción de México 2-0 Sudáfrica, acertando exactamente el marcador final; Grok predijo México 2-1, Claude predijo México 3-1; aunque ambos acertaron que México ganaría, no acertaron el marcador específico.
En estas predicciones del partido inaugural, diferentes modelos dieron tres "guiones" distintos. ChatGPT Go y Gemini Pro se acercaron más al partido real: México dominante, Sudáfrica con falta de gol, finalmente sin marcar. Grok pareció dar un marcador relativamente más abierto, considerando que Sudáfrica tendría éxito en el contraataque. Claude Sonnet elevó aún más las expectativas ofensivas de México, dando un resultado más abierto como 3-1.
Resumen
Dado que las muestras de predicciones de IA que se pueden revisar actualmente siguen siendo limitadas, en esta etapa aún no se puede juzgar directamente qué modelo "conoce más el fútbol".
Pero solo mirando los pocos partidos que ya han concluido, las diferencias han comenzado a aparecer. Qwen es actualmente el más memorable, acertando en el primer día consecutivamente México 2-0 Sudáfrica y Corea del Sur 2-1 República Checa, además de acertar en el riesgo de tarjetas rojas y la evolución del partido, lo que representa un desempeño destacado en una pequeña muestra. Sin embargo, si podrá mantener este acierto en el futuro, necesita ser verificado con más partidos.
Copilot y ChatGPT, ambos tienen aciertos destacados en marcas específicos, pero también han expuesto un problema común: su juicio sigue siendo insuficientemente sensible ante partidos que se desvían del potencial sobre el papel, como la victoria de Australia sobre Turquía, el empate de Catar con Suiza o el empate de Japón con Países Bajos.
En cuanto a modelos como Gemini, Grok, Claude, etc., las muestras públicas actuales se concentran más en partidos individuales o comparativas en redes sociales; tienen valor de referencia, pero aún no son adecuados para hacer un ranking directo.
La IA ya puede convertirse en una capa de referencia para los usuarios de los mercados de predicción del Mundial, pero está lejos de ser una respuesta estándar. A continuación, Odaily Planet Daily también continuará recopilando las predicciones previas de los partidos de cada modelo, y a medida que avance el torneo, revisaremos continuamente: qué modelos solo tuvieron suerte al inicio, y qué modelos realmente pueden resistir la prueba de los resultados en más partidos.








