Après seulement quelques jours de Coupe du Monde, certains modèles d'IA se couronnent, d'autres déraillent

Odaily星球日报Publié le 2026-06-15Dernière mise à jour le 2026-06-15

Résumé

La Coupe du monde 2026 a débuté, et l'utilisation de l'IA pour prédire les résultats des matchs est devenue un phénomène notable. Les modèles sont testés sur leur capacité à prévoir non seulement le vainqueur, mais aussi les scores exacts, les matchs nuls surprises, les cartons rouges et le déroulement des rencontres. Parmi les modèles, Qwen (千问) s'est rapidement distingué en prédisant avec succès le score de 2-0 du Mexique contre l'Afrique du Sud en match d'ouverture, ainsi que le risque de carton rouge pour l'Afrique du Sud. Il a également prédit la victoire 2-1 de la Corée du Sud contre la République tchèque, impressionnant par la précision des détails. Microsoft Copilot a eu des moments brillants, prédisant correctement les scores du Mexique (2-0), de la Corée du Sud (2-1) et le match nul 1-1 du Brésil contre le Maroc. Cependant, il a également connu des échecs notables, sous-estimant les performances de l'Australie, du Qatar et du Japon, révélant une difficulté à anticiper les surprises. ChatGPT a fourni des analyses détaillées, comme pour le match d'ouverture, en citant l'avantage du Mexique à domicile. Il a correctement prédit certains scores mais a eu tendance à privilégier les favoris sur le papier, manquant plusieurs matchs nuls ou victoires surprises. D'autres modèles comme Gemini, Grok et Claude ont été testés sur des matchs individuels, montrant des prévisions variées pour un même match, comme le démontre l'ouverture avec trois scores différents proposés. En...

Original | Odaily 星球日报(@OdailyChina)

Auteur | Asher(@Asher_ 0210)

À cette Coupe du Monde, l'endroit le plus animé n'est pas seulement sur le terrain.

Avec la montée en puissance des événements liés aux prédictions de la Coupe du Monde, de plus en plus d'utilisateurs commencent à participer aux transactions avec de l'argent réel. Qui va gagner, quel score, y aura-t-il une surprise, des cartons rouges, quel joueur marquera ? Ces sujets qui étaient autrefois des bavardages entre fans avant les matchs sont désormais décomposés en une série d'événements prédictifs négociables.

Et lorsque la prédiction devient une transaction, les utilisateurs n'ont pas seulement besoin d'émotions et d'intuition : les changements de cotes, la forme des équipes, les blessures, les confrontations historiques, la psychologie du marché deviennent tous des éléments à prendre en compte avant de trader. Dans ce processus, les modèles d'IA sont de plus en plus souvent convoqués dans le scénario des prédictions de la Coupe du Monde.

Les grands modèles comme Qwen, ChatGPT, Gemini, Claude, DeepSeek, Qwen et Copilot peuvent non seulement répondre à "quelle équipe a le plus de chances de gagner", mais aussi donner des pronostics de scores, la probabilité de surprises, le risque de cartons rouges, la performance des joueurs clés et l'analyse du déroulement du match. Pour les participants aux marchés prédictifs, la simulation pré-match de l'IA devient une référence supplémentaire, au-delà des cotes, des actualités, des données des équipes et de la psychologie du marché.

Cependant, les prédictions doivent finalement revenir au match lui-même.

Avec le démarrage officiel de la Coupe du Monde, les résultats des premiers matchs sont tombés les uns après les autres. Les analyses d'IA que les utilisateurs avaient utilisées pour éclairer leur jugement avant les matchs peuvent enfin être confrontées à la réalité : le score a-t-il été juste, la surprise a-t-elle été anticipée, et dans quelle mesure le modèle a-t-il réellement capté des détails comme les cartons rouges, les buts à la dernière minute ou la dynamique du match.

Le premier à faire le buzz ? Qwen

Le moment le plus spectaculaire du premier jour de la Coupe du Monde a sans doute été l'exploit de Qwen.

Pour le match d'ouverture Mexique contre Afrique du Sud, Qwen a prédit avant le match un score de 2-0 en faveur du Mexique. À la fin du match, le score était effectivement de 2-0. Plus intéressant encore, les trois cartons rouges distribués pendant le match correspondaient également au risque mentionné par Qwen avant le match : "Les défenseurs sud-africains sont parfois durs dans leurs tacles, et pourraient se retrouver rapidement en infériorité numérique."

Si Qwen s'était contenté de prévoir la victoire du Mexique, cela n'aurait pas été si surprenant. En tant que co-pays hôte, le Mexique était naturellement favori. Mais Qwen a cette fois-ci touché des détails plus concrets du match : le score de 2-0, le risque de carton rouge pour l'Afrique du Sud, et le rythme qui s'est accéléré en seconde période.

Ensuite, pour le match Corée du Sud contre République tchèque, Qwen a à nouveau prédit un 2-1 pour la Corée.

Ce match n'était pas facile à pronostiquer avant le coup d'envoi. La République tchèque avait une présence physique, une menace sur coups de pied arrêtés et l'expérience habituelle des équipes européennes en grands tournois. Le match n'a effectivement pas été à sens unique, les Tchèques ont ouvert le score, la Corée a égalisé, et le score est resté longtemps à 1-1. C'est seulement en fin de match que la Corée a marqué le but vainqueur, scellant le score à 2-1.

Dès lors, la prédiction de Qwen a pris une dimension encore plus "scénarisée". Prédire le vainqueur peut se faire sur le papier, le score peut être une question de chance, mais ce sont les détails du déroulement comme les cartons rouges, les renversements de situation, les buts victorieux en fin de match qui font vraiment penser "qu'il y a quelque chose". Après deux matchs dès le premier jour, Qwen a immédiatement fait monter la notoriété des prédictions d'IA pour la Coupe du Monde.

Copilot : Des coups de génie, mais aussi des échecs patents

Avant le tournoi, USA Today avait demandé à Copilot de prédire l'intégralité des 104 matchs de cette Coupe du Monde. En se basant sur les matchs déjà terminés, ces prédictions présentent à la fois des moments forts et des erreurs manifestes.

Parmi elles, trois prédictions sont particulièrement remarquables.

Pour le match d'ouverture Mexique contre Afrique du Sud, Copilot avait prédit un 2-0 pour le Mexique, correspondant exactement au score final. Pour la Corée du Sud contre République tchèque, il avait prédit un 2-1 pour la Corée, également confirmé par le résultat. Enfin, pour le Brésil contre Maroc, Copilot avait prédit un match nul 1-1, et le Brésil a effectivement été tenu en échec par le Maroc.

Surtout pour ce Brésil 1-1 Maroc, la performance est de qualité. Le Brésil reste une nation majeure, avec un effectif et une attention médiatique de premier plan. Si le Maroc a atteint les demi-finales lors de la dernière Coupe du Monde, prédire un match nul d'emblée contre le Brésil n'était pas un choix particulièrement évident. À l'issue du match, le Brésil n'a pas réussi à s'imposer d'entrée, et le Maroc a confirmé sa solidité dans les grands tournois. Cette prédiction de Copilot relève bien d'un "coup de génie".

Mais les limites de Copilot sont également rapidement apparues.

Il avait prédit une victoire 2-1 du Canada contre la Bosnie-Herzégovine, mais le match s'est terminé sur un nul 1-1 ; il avait prédit une victoire étriquée 1-0 de la Suisse contre le Qatar, mais la Suisse a également été tenue en échec ; il avait prédit une victoire 2-0 des États-Unis contre le Paraguay, la direction était bonne, mais le score réel était 4-1, sous-estimant clairement l'intensité offensive.

Des dérapages plus manifestes sont apparus lors de plusieurs matchs avec surprises ou où les favoris ont été mis en difficulté.

Pour la Turquie contre l'Australie, Copilot avait prédit une victoire 2-1 de la Turquie, mais l'Australie a créé la surprise en gagnant 2-0. Pour l'Équateur contre la Côte d'Ivoire, il avait prédit une victoire 2-1 de l'Équateur, mais la Côte d'Ivoire l'a emporté 1-0. Pour les Pays-Bas contre le Japon, il avait prédit une victoire 2-1 des Néerlandais, mais le Japon a égalisé deux fois, aboutissant à un match nul 2-2. Pour la Suède contre la Tunisie, il avait prédit un 1-1, mais la Suède a écrasé son adversaire 5-1.

Si Copilot a pu toucher les scores exacts des matchs du Mexique, de la Corée et du Brésil, cela montre qu'il ne se contente pas de suivre les favoris. Mais les matchs où l'Australie a battu la Turquie, où le Qatar a tenu en échec la Suisse, où le Japon a tenu les Pays-Bas, révèlent aussi que ses jugements sur les surprises et les matchs nuls restent relativement conservateurs.

ChatGPT : Une analyse complète, mais moins précis sur les surprises

Comparé aux prédictions complètes de Copilot, ChatGPT ressemble davantage à un "analyste pré-match".

Pour la prédiction du match d'ouverture, ChatGPT avait anticipé un Mexique 2-0 Afrique du Sud, score final correct. Les raisons avancées étaient également assez complètes, incluant l'avantage du terrain pour le Mexique, sa forme récente, l'offensive limitée de l'Afrique du Sud, ainsi que des facteurs comme l'altitude de Mexico City et l'ambiance du stade. Pour cette prédiction, ChatGPT n'a pas seulement donné un résultat, sa logique sous-jacente correspondait également au résultat du match.

Mais en ce qui concerne les prédictions pour l'ensemble du tournoi, la stabilité de ChatGPT est moins bonne. Bien qu'il ait touché les scores du Mexique 2-0 Afrique du Sud et du Brésil 1-1 Maroc, et qu'il ait correctement prédit le vainqueur dans plusieurs matchs comme ceux de l'Écosse, de l'Allemagne et de la Suède, il s'est trompé sur des matchs comme la Corée 2-1 République tchèque, le Qatar 1-1 Suisse, l'Australie 2-0 Turquie et le Japon 2-2 Pays-Bas, en prédisant à chaque fois la victoire de l'équipe favorite sur le papier. Par exemple, il prédisait une victoire de la Suisse contre le Qatar, de la Turquie contre l'Australie, et une victoire étriquée des Pays-Bas contre le Japon.

ChatGPT n'est pas dépourvu de capacités prédictives, il sait très bien décomposer la force des équipes, les conditions à domicile, la forme récente, et peut toucher le score dans certains matchs. Mais d'après les résultats actuels, il excelle davantage à expliquer "pourquoi l'équipe favorite est plus logique", plutôt qu'à identifier à l'avance quels matchs pourraient s'éloigner du scénario attendu.

Gemini, Grok, Claude : Pour un même match, différents modèles écrivent des scénarios différents

Outre Qwen, Copilot et ChatGPT, certains utilisateurs des réseaux sociaux ont soumis un même match à plusieurs modèles pour obtenir des prédictions avant le coup d'envoi.

Prenons l'exemple du match d'ouverture Mexique contre Afrique du Sud : un blogueur a testé simultanément quatre modèles d'IA – ChatGPT, Gemini, Grok et Claude – pour obtenir des prédictions pré-match. Les résultats montrent que ChatGPT et Gemini ont tous deux prédit un Mexique 2-0 Afrique du Sud, score final correct ; Grok a prédit un Mexique 2-1, Claude a prédit un Mexique 3-1. Bien que tous deux aient vu la victoire mexicaine, ils n'ont pas touché le score exact.

Pour cette prédiction du match d'ouverture, différents modèles ont proposé trois scénarios distincts. ChatGPT Go et Gemini Pro étaient plus proches du match réel : avantage mexicain, offensive sud-africaine limitée, victoire sans concéder de but. Grok semblait donner un score relativement ouvert, estimant que l'Afrique du Sud pourrait réagir et marquer. Claude Sonnet a quant à lui placé les attentes offensives du Mexique plus haut, prédisant un résultat plus spectaculaire comme 3-1.

Conclusion

Étant donné que l'échantillon de prédictions d'IA rétrospectivement analysables reste limité pour le moment, il n'est pas encore possible de déterminer directement quel modèle est le plus "calé en football".

Mais en ne considérant que les quelques matchs déjà terminés, des différences commencent à apparaître. Qwen est actuellement le plus mémorable, avec deux prédictions justes dès le premier jour (Mexique 2-0 Afrique du Sud, Corée 2-1 République tchèque), en touchant également le risque de carton rouge et la dynamique du match, ce qui constitue une performance remarquable sur un petit échantillon. Cependant, sa capacité à maintenir ce niveau sur d'autres matchs reste à vérifier.

Copilot et ChatGPT ont tous deux connu des moments forts en touchant des scores précis, mais ils révèlent aussi un problème commun : face à des matchs qui s'écartent des pronostics sur le papier, comme la victoire de l'Australie sur la Turquie, le match nul du Qatar contre la Suisse ou celui du Japon contre les Pays-Bas, leur jugement manque encore de sensibilité.

Quant aux modèles comme Gemini, Grok, Claude, les échantillons publics actuels se concentrent davantage sur des comparaisons isolées ou sur les réseaux sociaux. Leur valeur de référence existe, mais il est encore prématuré de les classer directement.

L'IA peut déjà constituer une référence pour les utilisateurs des marchés prédictifs de la Coupe du Monde, mais elle est loin d'être la réponse standard. Par la suite, Odaily星球日报 continuera à collecter les prédictions pré-match de différents modèles et à les confronter aux résultats au fur et à mesure de la compétition : quels modèles ont simplement eu de la chance au départ, et quels modèles résisteront vraiment à l'épreuve des résultats sur un plus grand nombre de matchs.

Questions liées

QQuel modèle d'IA a eu les prédictions les plus remarquables au début de la Coupe du Monde, et pourquoi ?

ALe modèle Qianwen (千问) a eu les prédictions les plus remarquables. Il a correctement prédit les scores exacts du match d'ouverture (Mexique 2-0 Afrique du Sud) et du match Corée du Sud 2-1 République Tchèque. Il a également identifié avec justesse des détails comme le risque de carton rouge pour l'Afrique du Sud et le déroulement de ces matchs.

QComment les performances de Copilot en matière de prédictions se comparent-elles à celles de ChatGPT selon l'article ?

ACopilot a eu des moments brillants en prédisant avec exactitude les scores de plusieurs matchs (ex: Mexique 2-0, Corée du Sud 2-1, Brésil 1-1). Cependant, il a aussi connu des échecs notables, notamment en sous-estimant les surprises et les matchs nuls. ChatGPT excelle dans l'analyse contextuelle détaillée (avantage à domicile, forme, etc.) et a également réussi certaines prédictions de score, mais il a tendance à favoriser les équipes favorites sur le papier et manque de sensibilité pour détecter les matchs à résultat inattendu.

QQuel point commun les modèles Copilot et ChatGPT partagent-ils dans leurs limites, d'après l'analyse des premiers matchs ?

ALe point commun est que les deux modèles semblent avoir du mal à anticiper avec précision les matchs où le résultat final s'écarte sensiblement de la supériorité théorique des équipes. Ils ont tous les deux échoué à prédire correctement des surprises comme la victoire de l'Australie sur la Turquie, le match nul du Qatar contre la Suisse ou celui du Japon contre les Pays-Bas.

QQu'ont montré les tests comparatifs de plusieurs modèles d'IA (ChatGPT, Gemini, Grok, Claude) sur le match d'ouverture ?

ALes tests comparatifs sur le match d'ouverture Mexique-Afrique du Sud ont montré que différents modèles peuvent produire des 'scénarios' variés pour un même match. ChatGPT et Gemini ont correctement prédit le score de 2-0. Grok a prédit une victoire 2-1 du Mexique, anticipant un but de l'Afrique du Sud. Claude a prédit une victoire plus large de 3-1. Cela illustre la variabilité des prédictions entre modèles.

QQuelle est la conclusion principale de l'article concernant l'utilisation de l'IA pour prédire les matchs de la Coupe du Monde ?

ALa conclusion principale est que l'IA peut désormais servir de référence supplémentaire pour les participants aux marchés de prédiction, en complément des cotes, des actualités et des données des équipes. Cependant, elle est loin d'être une réponse infaillible ou standard. Sa performance réelle et sa fiabilité nécessitent d'être évaluées sur un plus grand nombre de matchs au fur et à mesure que la compétition avance.

Lectures associées

La répartition de la valeur des stablecoins

L'article analyse la répartition de valeur dans l'écosystème des stablecoins, en le divisant en quatre couches : 1. **Couche d'émission** : (ex. : Tether, Circle) - Émettent les stablecoins, détiennent les actifs de réserve et capturent la marge d'intérêt. 2. **Couche d'infrastructure** : (ex. : Bridge, BVNK) - Relient les stablecoins au système financier traditionnel (connexions bancaires, conformité, gestion des entrées/sorties en fiat). C'est le travail le plus complexe et essentiel pour une adoption large. 3. **Couche d'acquisition/distribution** : (ex. : Stripe, Coinbase) - Intègrent les stablecoins dans les systèmes marchands et logiciels d'entreprise. 4. **Couche applicative** : Les utilisateurs finaux. Actuellement, la couche d'émission génère les profits les plus importants. L'auteur souligne que la **couche d'infrastructure**, bien que cruciale, est souvent sous-estimée. Son rôle de "trait d'union" entre la blockchain et le monde réel (règlement, conformité, intégration aux flux de trésorerie des entreprises) est difficile mais constitue un avantage concurrentiel durable. Des acquisitions comme celle de Bridge par Stripe ou de BVNK par Mastercard montrent l'importance stratégique de ce segment. Bien que cette couche nécessite d'importants investissements initiaux et fasse face à une pression de la part des autres couches, elle pourrait acquérir un fort pouvoir de négociation une fois que les stablecoins deviendront un canal de paiement par défaut pour les entreprises.

marsbitIl y a 1 h

La répartition de la valeur des stablecoins

marsbitIl y a 1 h

Pourquoi Nvidia emprunte-t-elle 200 milliards de dollars si elle n'a pas besoin d'argent ?

Résumé de l'article : Nvidia, qui dispose d'une trésorerie abondante (flux de trésorerie libre d'environ 48,6 milliards de dollars pour son dernier trimestre), prévoit d'émettre des obligations (notes senior) pour au moins 20 milliards de dollars. Contrairement à une lecture simpliste sur un besoin de liquidités, cette opération s'analyse plutôt comme une optimisation active de la structure financière. L'entreprise profite de sa solide notation de crédit (AA) et de conditions de marché favorables pour lever des fonds à long terme (jusqu'à 30 ans) à un coût faible. Cette dette servira à financer des investissements à long cycle comme les infrastructures de datacenters IA, la R&D, les paiements anticipés à la chaîne d'approvisionnement et les investissements stratégiques. Cette approche permet à Nvidia de poursuivre son expansion dans l'écosystème IA sans diluer les actionnaires (alternative à une augmentation de capital), tout en maintenant parallèlement un retour aux actionnaires via un important programme de rachats d'actions et une augmentation du dividende. Elle reflète une évolution vers une gestion du capital plus mature, typique des grandes plateformes technologiques, et s'inscrit dans une tendance où les géants de la tech utilisent la dette pour financer le cycle d'investissements lourds de l'IA. La réussite de cette stratégie dépendra de la capacité future de Nvidia à générer des rendements supérieurs au coût de sa dette et à maintenir sa forte génération de flux de trésorerie.

marsbitIl y a 2 h

Pourquoi Nvidia emprunte-t-elle 200 milliards de dollars si elle n'a pas besoin d'argent ?

marsbitIl y a 2 h

Liberland révoque son secrétaire à la technologie après une tentative présumée de prise de contrôle de la blockchain et du site web

Le congrès de Liberland a voté le renvoi du secrétaire à la Technologie, Dorian Stern Vukotić, selon une résolution officielle de ce projet de micronation. Il est accusé d'avoir supprimé les protections multisignatures sur le compte administrateur Sudo, tenté de détourner le domaine Liberland.org, bloqué le président Vít Jedlička du vote et lancé des jetons non autorisés. Cette affaire sert d'étude de cas sur les risques de gouvernance dans la blockchain, qui dépassent les simples contrats intelligents. Elle implique le contrôle des permissions, des noms de domaine, des droits de vote et des comptes administrateurs. Ceci rappelle que pour de nombreux projets crypto, la décentralisation réelle doit être vérifiée au-delà des déclarations, car un petit nombre d'acteurs peut contrôler des fonctions clés. L'article précise que Liberland est un projet de micronation et non un État souverain largement reconnu. Pour les observateurs, il est conseillé de suivre les enregistrements sur l'explorateur blockchain, les votes ultérieurs et les éventuelles mises à jour juridiques ou liées au registre des domaines. Dans le contexte plus large, cette histoire s'inscrit dans une tendance où l'infrastructure, la sécurité et la gouvernance deviennent aussi importantes que l'évolution des prix. Elle illustre la nécessité pour les traders de comprendre les systèmes et les risques sous-jacents. Le traitement éditorial doit se baser sur les sources vérifiées, expliquer les risques pratiques et éviter les conclusions prématurées, en présentant cela comme un signal d'information à suivre.

bitcoinistIl y a 2 h

Liberland révoque son secrétaire à la technologie après une tentative présumée de prise de contrôle de la blockchain et du site web

bitcoinistIl y a 2 h

Comment bien mener une recherche : cultiver les compétences qui peuvent être réellement « pratiquées délibérément »

Personne ne vous a jamais vraiment appris à faire de la recherche. On vous donne un bureau, un problème choisi par d'autres, et des instructions vagues pour "produire quelque chose de nouveau". Ainsi, la plupart des gens rétroconçoient le métier à partir de ce qu'ils voient (articles, posts), apprenant à *sembler* chercheurs plutôt qu'à en *devenir*. Les véritables compétences en recherche sont un empilement de micro-compétences, presque toutes cultivables par la pratique délibérée. **Choisir ses propres problèmes.** Nous absorbons souvent des problèmes (du superviseur, des tendances) sans en comprendre le raisonnement sous-jacent, nous plaçant en retard face à des concurrents nombreux. John Schulman recommande de choisir un résultat que l'on souhaite réellement atteindre et de raisonner à rebours pour concevoir les expériences. Cette approche mène à l'originalité. Le "bon goût" est un muscle : prédire les résultats d'expériences, deviner les conclusions d'articles à partir des méthodes, noter quelles avancées resteront pertinentes, puis vérifier. **Améliorer ses sources.** S'alimenter aux mêmes sources (arXiv, discussions) génère les mêmes idées que tout le monde. Les archives anciennes sont sous-estimées : les idées clés (MoE, LSTM) sont souvent des réinventions. Lire des textes fondateurs comme "The Bitter Lesson" de Sutton ou le discours de Shannon sur la pensée créative est crucial. La **largeur** (neurosciences, conception de mécanismes, statistiques, architecture matérielle) est aussi importante que la profondeur. Lisez les **articles eux-mêmes**, surtout les annexes et les sections sur les limites. **Tout noter.** L'écriture révèle les failles des idées qui semblaient matures. C'est le mécanisme de défense le moins cher contre l'auto-tromperie, un point souligné par Feynman. Darwin notait systématiquement les faits contredisant sa théorie, craignant que sa mémoire ne les efface. Tenez un journal : hypothèses, paramètres, attentes, résultats, connaissances révisées. Relire ses notes d'il y a un mois est une leçon d'humilité sans égale.

marsbitIl y a 4 h

Comment bien mener une recherche : cultiver les compétences qui peuvent être réellement « pratiquées délibérément »

marsbitIl y a 4 h

Trading

Spot
Futures
活动图片