Original | Odaily 星球日报(@OdailyChina)
Auteur | Asher(@Asher_ 0210)

Avant chaque match de la Coupe du Monde, je demande à l'IA de faire une prédiction. Presque tous les modèles semblent très convaincants et détaillés.
Certains parlent de la valeur marchande des équipes, d'autres analysent les données de la phase de groupes, d'autres évaluent les blessures et la tactique, et d'autres donnent directement le scénario du score, des prolongations et des tirs au but. À première vue, ChatGPT, Grok, Qwen, DeepSeek, Gemini et Claude semblent tous très connaisseurs du football.
Mais en tant qu'utilisateur du marché des prédictions, ce qui m'intéresse vraiment n'est pas quel modèle est le plus complet, mais lequel est le plus digne de confiance.
Alors que la Coupe du Monde entre dans la phase à élimination directe, Odaily星球日报, dès le premier match, a interrogé différents modèles d'IA avant les matchs avec des questions aussi similaires que possible, et a comparé les résultats réels après coup pour voir quels modèles semblaient simplement bien analyser et quels modèles avaient réellement anticipé le déroulement du match.
À ce jour, les matchs de la phase à élimination directe terminés sont : Canada 1-0 (victoire au finish) contre l'Afrique du Sud, Brésil 2-1 (victoire de justesse) contre le Japon, l'Allemagne éliminée par le Paraguay après une séance de tirs au but, et les Pays-Bas également éliminés aux tirs au but par le Maroc. Pour le match Belgique contre Sénégal, le score était de 2-2 avant un renversement de situation en prolongation, mettant clairement en lumière l'incertitude des matchs à élimination directe.
DeepSeek et Gemini, des prédictions légendaires sur le match Maroc
Le moment le plus marquant reste la prédiction de DeepSeek et Gemini pour le match Pays-Bas contre Maroc. Avant ce match, il était facile de se tromper de camp – les Pays-Bas étaient plus forts sur le papier, avec un effectif plus complet. Beaucoup de modèles savaient que le Maroc serait un adversaire coriace, mais au final, ils croyaient davantage au passage des Pays-Bas.
Là où DeepSeek et Gemini ont été brillants, c'est qu'ils ne se sont pas arrêtés à l'étape "ce sera un match serré", mais ont également écrit le scénario qui suivrait. Gemini a prédit avant le match un score de 1-1 au temps réglementaire, avec une victoire du Maroc aux tirs au but. Le match s'est effectivement terminé 1-1, et le Maroc a éliminé les Pays-Bas 3-2 aux tirs au but. Ils n'ont pas seulement deviné la tendance, mais ont également à peu près touché juste sur la façon dont le match serait reporté aux tirs au but et sur qui finirait par l'emporter.

Prédiction de Gemini pour le match Pays-Bas contre Maroc
DeepSeek était également très proche. Il a jugé que ce match se terminerait très probablement sur un score de 1-1 ou 0-0 au temps réglementaire, que le match pourrait se prolonger jusqu'en prolongation voire aux tirs au but, et a penché pour une qualification surprise du Maroc grâce à sa défense et ses contre-attaques.

Prédiction de Deepseek pour le match Pays-Bas contre Maroc
Après ce match, DeepSeek et Gemini sont devenus incontournables. Surtout Gemini, qui cette fois-ci n'a pas semblé faire une simple prédiction d'avant-match, mais plutôt avoir lu le scénario du match à l'avance.
Grok et Qwen ont touché juste sur les scores à plusieurs reprises, leur stabilité est plus forte que prévu
En dehors de la performance remarquable de DeepSeek et Gemini sur le match Maroc, Grok et Qwen n'ont pas été en reste. Leur point le plus brillant a été, dans des matchs où la tendance était relativement claire, non seulement de prédire correctement l'équipe qualifiée, mais aussi de donner des scores spécifiques assez proches du résultat final.
L'Afrique du Sud contre le Canada en est un exemple. Avant le match, la plupart des modèles d'IA favorisaient le Canada, mais les divergences portaient sur la facilité de la victoire. Grok a prédit une victoire 1-0 du Canada avant le match, Qwen a également prédit une victoire par un petit but. Finalement, le Canada a bien remporté la victoire avec un seul but, sans que cela ne devienne la victoire écrasante imaginée.

Prédiction de Qwen pour le match Afrique du Sud contre Canada
Le Brésil contre le Japon a été similaire. La plupart des modèles d'IA pensaient que le Brésil était plus fort, mais la question était de savoir si le Japon pourrait maintenir le match serré. Grok et Qwen ont tous deux prédit un score de 2-1, et le match s'est effectivement terminé par une victoire de justesse 2-1 du Brésil. Ils n'ont pas juste vu que "le Brésil gagnerait", mais aussi que le Japon causerait suffisamment de problèmes au Brésil.
Pour le match Côte d'Ivoire contre Norvège, les deux ont également été assez précis. La Norvège avec Haaland, la direction de la qualification n'est pas difficile à comprendre, mais le jeu physique et les attaques sur les côtés de la Côte d'Ivoire n'allaient pas non plus faire du match un match à sens unique. Grok et Qwen ont tous deux prédit une victoire 2-1 de la Norvège, et le score est effectivement tombé dans ce "scénario".

Prédiction de Grok pour le match Côte d'Ivoire contre Norvège
L'avantage de Grok et Qwen est de voir les matchs à fort enjeu de manière plus détaillée. Ils n'ont pas anticipé un grand scénario comme l'élimination des Pays-Bas par le Maroc, mais dans les matchs du Canada, du Brésil, de la Norvège, de la France, etc., ils ont donné des tendances de victoire et des scores assez proches. En d'autres termes, ils ne sont pas nécessairement les meilleurs pour détecter les surprises, mais ils sont très doués pour juger si une équipe favorite passera facilement ou avec peine.
ChatGPT n'a pas produit beaucoup de scores miracles, mais son analyse du déroulement du match est assez précise
ChatGPT n'a pas prédit à l'avance l'élimination des Pays-Bas par le Maroc aux tirs au but comme Gemini, ni enchaîné plusieurs scores exacts comme Grok et Qwen. Mais son avantage – pour de nombreux matchs qui semblent avantageux pour l'équipe favorite avant le match –, ChatGPT a tendance à rappeler plus clairement que ce match pourrait ne pas être aussi facile.
Le Brésil contre le Japon en est un exemple. ChatGPT a prédit la qualification du Brésil, mais n'a pas décrit le match comme une domination facile du Brésil. Il a mentionné que la pression, la mobilité et la discipline du Japon mettraient le Brésil mal à l'aise, et qu'il pourrait même avoir l'occasion de marquer le premier but ou d'égaliser. La Côte d'Ivoire contre la Norvège est similaire, ChatGPT a prédit la qualification de la Norvège, mais a indiqué à l'avance que ce ne serait pas un match facile, le jeu physique, les attaques sur les côtés et la capacité de transition de la Côte d'Ivoire causeraient des problèmes.
De plus, pour le match à élimination directe Angleterre contre République Démocratique du Congo, ChatGPT n'a pas simplement prédit une large victoire de l'Angleterre, mais a estimé que le match pourrait être assez terne, la RDC utilisant une défense basse pour ralentir le rythme. Finalement, l'Angleterre s'est qualifiée, mais pas facilement.

Prédiction de ChatGPT pour le match Angleterre contre République Démocratique du Congo
Le point fort de ChatGPT n'est pas de prédire un score exact à chaque fois, mais de pouvoir souvent indiquer à l'avance où se situera la difficulté du match. Il est très utile pour comprendre le match, mais moins pour ceux qui ne veulent qu'un score final. Il peut souvent décrire le déroulement avec précision, mais quand il s'agit de prédire une grosse surprise, il manque un peu de détermination.
L'élimination de l'Allemagne, un accident collectif pour les modèles d'IA
Si les matchs précédents montraient les points forts respectifs des différents modèles, le match Allemagne contre Paraguay a été un échec collectif.
Avant le match, tous les modèles d'IA penchaient pour l'Allemagne. ChatGPT, Grok, Qwen, Gemini, Claude, tous favorisaient l'Allemagne, avec des scores prédits principalement autour de 2-0, 3-0 ou 3-1. Les raisons étaient également unanimes : ils pensaient tous que l'Allemagne était plus forte sur le papier, avait une meilleure profondeur d'effectif et une attaque plus puissante.
Mais c'est sur ce match que les choses ont déraillé. Les modèles d'IA ont sous-estimé la capacité du Paraguay à transformer le match en bataille d'usure. L'Allemagne n'a pas réussi à régler l'affaire en temps réglementaire, ni à rompre l'impasse en prolongation, et a finalement été éliminée par le Paraguay après une séance de tirs au but.
Qui est le plus précis jusqu'à présent ?
D'après les matchs à élimination directe terminés à ce jour, les caractéristiques des différents modèles commencent à apparaître.
DeepSeek et Gemini ont eu les moments les plus brillants. Ils ne savent pas seulement prédire la qualification d'équipes favorites comme le Brésil ou la France, mais dans des matchs plus incertains avec des surprises potentielles, ils ont également donné des réponses très pertinentes. Pour le match Pays-Bas contre Maroc, leur avantage décisif a été d'oser écrire à l'avance le scénario de la surprise marocaine et des tirs au but. Surtout Gemini, qui a directement prédit la qualification du Maroc aux tirs au but, cette performance a été très remarquable.
Grok et Qwen sont plus des "prévisionnistes de scores". Ils ont touché plusieurs scores spécifiques, avec de bonnes performances notamment dans les matchs du Canada, du Brésil, de la Norvège, de la France. Mais le problème est que face à des équipes traditionnellement fortes comme l'Allemagne ou les Pays-Bas, ils ont finalement penché pour les favoris.
ChatGPT et Claude ressemblent plus à des "prévisionnistes analytiques". Leurs raisonnements sont complets, leurs tendances généralement pas trop éloignées de la réalité, et ils peuvent alerter sur certains risques de prolongations. Mais le problème est qu'ils peuvent souvent voir qu'un match sera difficile, mais n'osent pas vraiment conclure en faveur de l'équipe la moins favorite. C'est ce qui s'est passé pour les Pays-Bas contre le Maroc, alors qu'ils voyaient déjà le risque de prolongations et de tirs au but, ils ont finalement fait plus confiance aux Pays-Bas.
Donc, plutôt que de se demander rapidement quel modèle connaît le mieux le football, il vaut mieux voir à quels scénarios ils conviennent respectivement.





