预测世界杯淘汰赛，不同AI水平差这么多？

Odaily星球日报发布于2026-07-02更新于2026-07-02

文章摘要

文章对比了多个AI模型在预测世界杯淘汰赛时的表现。Gemini和DeepSeek因精准预测荷兰对摩洛哥的比赛（1:1平局、点球大战摩洛哥胜）而表现突出。Grok和千问则在胜负方向相对清晰的比赛中，如加拿大1:0胜南非、巴西2:1胜日本，成功预测了具体比分，展现了稳定性。ChatGPT和Claude擅长分析比赛过程，能指出潜在阻力，例如巴西对日本、科特迪瓦对挪威等比赛会较为胶着，但在判断冷门结果时较为保守。所有模型在德国对巴拉圭的比赛中集体判断失误，均看好德国晋级，但最终德国在点球大战中被淘汰。总体而言，不同AI模型各有特点：Gemini和DeepSeek敢于预测冷门；Grok和千问精于比分预测；ChatGPT和Claude强在过程分析。选择参考时需根据具体需求而定。

原创 | Odaily 星球日报(@OdailyChina)

作者 | Asher(@Asher_ 0210)

世界杯每场赛前,我都会让 AI 预测下,几乎每个模型都说得头头是道、细节满满。

有的讲球队身价,有的拆小组赛数据,有的分析伤病和战术,还有的直接给出比分、加时、点球剧本。乍一看,ChatGPT、Grok、千问、DeepSeek、Gemini、Claude 都好懂球噢。

但作为预测市场用户,我真正关心的不是哪个模型说得更完整,而是哪一个更值得参考。

随着世界杯进入淘汰赛阶段,Odaily星球日报从首场比赛开始,在赛前用尽量相同的问题询问不同 AI 模型,并在赛后对照真实结果回看——哪些模型只是分析得像那么回事,哪些模型真的提前捕捉到了比赛走向。

目前,已经结束的世界杯淘汰赛,加拿大 1:0 绝杀南非,巴西 2:1 险胜日本,德国被巴拉圭拖进点球大战后淘汰,荷兰也倒在了摩洛哥的点球下。到了比利时对塞内加尔,比赛更是踢成了 2:2 后加时逆转,直接把淘汰赛的不确定性拉满。

DeepSeek 和 Gemini,靠预判摩洛哥一战封神

目前最有记忆点的,还是 DeepSeek 和 Gemini 对荷兰 vs 摩洛哥这场的预测。这场赛前其实很容易站错队——荷兰纸面实力更强,阵容也更完整,很多模型都知道摩洛哥不好踢,但最后还是更相信荷兰能过关。

DeepSeek 和 Gemini 厉害的地方在于,它们没有停在“这场会很胶着”这一步,而是把后面的剧本也写出来了。Gemini 赛前直接给出常规时间 1:1,点球大战摩洛哥胜。结果比赛真的踢成 1:1,最后摩洛哥点球 3:2 淘汰荷兰。不是只猜对方向,而是连比赛会怎么被拖进点球、最后谁笑到最后,都基本对上了。

Gemini 预测荷兰对阵摩洛哥的比赛

DeepSeek 也很接近。它判断这场常规时间大概率会是 1:1 或 0:0,比赛可能一路拖到加时甚至点球,并倾向摩洛哥靠防守和反击爆冷晋级。

Deepseek 预测荷兰对阵摩洛哥的比赛

这一场之后,DeepSeek 和 Gemini 的存在感直接拉满。尤其是 Gemini,这次不像是在做赛前预测,更像是提前看过了比赛剧本。

Grok 和千问连续命中具体比分,稳定性比想象中更强

除了 DeepSeek 和 Gemini 在摩洛哥这场打出高光,Grok 和千问也不是没有存在感。它们最亮眼的地方,是在一些胜负方向相对清晰的比赛里,不只判断对了晋级球队,还把具体比分也预测得比较贴近最终结果。

南非对加拿大就是一个例子。赛前多数 AI 模型都看好加拿大,但分歧在于加拿大会不会轻松赢。Grok 给赛前给出加拿大 1:0 的预测,千问也给出过一球小胜。最后加拿大确实只靠 1 个进球过关,没有踢成想象中的大胜局。

千问预测南非对阵加拿大的比赛

巴西对日本也是类似。大部分 AI 模型都觉得巴西更强,但日本会不会把比赛咬住,才是这场的关键。Grok 和千问都预测比分会是 2:1,最后比赛也真的踢成巴西 2:1 险胜。它们看对的不是“巴西会赢”这么简单,而是日本能给巴西制造足够麻烦。

科特迪瓦对挪威这场,两者同样踩得比较准。挪威有哈兰德,晋级方向不难理解,但科特迪瓦的身体对抗和边路冲击也不会让比赛变成一边倒。Grok 和千问都预测挪威 2:1 获胜,最后比分也正好落在这个”剧本“里。

Gork 预测科特迪瓦对阵挪威的比赛

Grok 和千问的优势,是把热门局看得更细。它们没有提前写出摩洛哥淘汰荷兰这种大剧本,但在加拿大、巴西、挪威、法国这些比赛里,胜负方向和比分落点都给得比较贴。换句话说,它们不一定最会抓冷门,但很擅长判断热门队到底是碾压过关,还是艰难小胜。

ChatGPT 没有太多神比分,但比赛过程分析比较准

ChatGPT 没有像 Gemini 那样提前预测出摩洛哥点球淘汰荷兰,也没有像 Grok、千问那样连续踩中几个具体比分。但它的优势——很多比赛赛前看起来是强队占优,ChatGPT 会更明显地提醒一句,这场可能没有那么轻松。

巴西对日本就是例子。ChatGPT 预测巴西晋级,但没有把比赛写成巴西轻松碾压,而是提到日本的压迫、跑动和纪律性会让巴西踢得不舒服,甚至有机会先进球或追平。科特迪瓦对挪威也是类似,ChatGPT 预测挪威晋级,但提前说这不是一场轻松局,科特迪瓦的身体对抗、边路冲击和转换能力都会制造麻烦。

此外,英格兰对刚果民主共和国这场淘汰赛,ChatGPT 也没有简单写英格兰大胜,而是认为比赛可能会比较闷,刚果民主共和国会用低位防守把节奏拖住。最后英格兰虽然晋级,但赢得并不轻松。

ChatGPT 预测英格兰对阵刚果民主共和国的比赛

ChatGPT 的长处,不在于每次都把比分预测得很准,而是经常能提前说出比赛的阻力在哪里。它很适合拿来理解比赛,但适合只看一个最终比分的预测。它能把过程说得比较准,可真正要写出大冷门时,还是少了一点决断。

德国出局,成了 AI 模型的集体翻车现场

如果说前面几场还能看出不同模型各自的亮点,那么德国对巴拉圭这场,就是一次集体翻车。

赛前,所有 AI 模型都站在德国这边。ChatGPT、Grok、千问、Gemini、Claude 全部站在德国一边,比分预测大多集中在 2:0、3:0 或 3:1。理由也很一致:都认为德国纸面实力更强,阵容深度更好,进攻火力更足。

但结果就是这场出了问题。AI 模型们低估了巴拉圭把比赛拖进泥潭的能力,德国没能在常规时间解决战斗,也没能在加时赛打破僵局,最后被巴拉圭拖进点球大战并淘汰出局。

目前谁最准?

从目前已经结束的淘汰赛来看,不同模型的特点开始显现。

DeepSeek 和 Gemini 最有高光。它们不只是能预测巴西、法国这类热门队晋级,在更难判断的冷门场次里,也给出了很有含金量的答案。荷兰对摩洛哥这场,它们最关键的优势,是敢于提前写出摩洛哥爆冷和点球大战剧本。尤其是 Gemini,直接预测摩洛哥点球晋级,这一场确实很亮眼。

Grok 和千问更像“比分型选手”。它们命中了不少具体比分,尤其在加拿大、巴西、挪威、法国这些比赛里表现不错。但问题是遇到德国、荷兰这种传统强队时,最后还是偏向热门。

ChatGPT 和 Claude 则更像“分析型选手”。理由写得完整,方向大多数不离谱,也能提醒一些加时风险。但问题是,它们经常能看出比赛不好踢,却不太敢把结论写到冷门那边。荷兰对摩洛哥就是这样,明明已经看到加时和点球风险,最后还是更相信荷兰。

所以,与其急着问哪个模型最懂球,不如看它们分别适合什么场景。

你可能也喜欢

LAB加密货币暴跌34%，交易员为何紧盯这一支撑位？

LAB加密货币价格在24小时内暴跌34%，至9美元，市值缩水至38.8亿美元。暴跌主因是过度杠杆平仓以及市场对即将到来的代币解锁和代币所有权集中的担忧。尽管出现抛售，但日交易量增长121%，达到约5871万美元，表明市场参与度在下跌中反而增加。衍生品市场数据显示，未平仓合约（OI）大幅减少23.01%，至1.3039亿美元，表明交易者主要在平仓而非新建杠杆头寸。资金费率持续为负，约-0.1768%，显示空头依然主导市场，看跌情绪浓厚。技术分析上，LAB价格在从20美元阻力位急剧回落后，正接近7.65美元的关键支撑位。MACD指标保持看跌，柱状图深入负值区域，下行压力显著。若7.65美元支撑失守，价格可能进一步下探4.00美元支撑位；若能守住，则可能尝试反弹。总结来看，交易量激增伴随杠杆快速撤离，衍生品市场风险大幅降低。看跌的资金费率和技术结构的疲软，使得空头在关键支撑位附近仍占据主导。市场关注焦点在于LAB能否守住7.65美元的最终支撑区域。

ambcrypto3分钟前

ambcrypto3分钟前

观点：股市 AI 泡沫已至，我为什么转头押注比特币？

本文作者认为当前股市的AI热潮已形成明显泡沫。他引用霍华德·马克斯的《周期》理论，指出市场已表现出众多泡沫顶部特征，如投资者过度乐观、价格远超内在价值、贪婪驱动行为等。相比之下，比特币正呈现出周期底部的迹象，如价格低于内在价值、市场情绪低迷，因此当前提供了更具吸引力的安全边际和长期回报潜力。作者本人已清仓科技股ETF，并将大部分资金转为现金，正逐步在5万至6万美元区间定投比特币。他认为当前市场资金过度集中于AI单一叙事，估值与宏观经济基本面脱节，风险较高。而比特币作为稀缺资产，在未来可能的滞胀环境中可能表现突出。总结而言，作者基于周期定位，判断AI股票处于高风险区间，转而将比特币视为当前更具价值的长期配置选择。他建议投资者保持谨慎，并关注资产的内在价值与周期位置。

marsbit10分钟前

marsbit10分钟前

Bitwsie 首席投资官：STRC 大跌是底部信号，牛市将在秋季开启

比特币近期跌破6万美元，创年内新低，本轮下跌的核心导火索是Strategy公司发行的优先股STRC价格暴跌。STRC本是一款设计为维持100美元面值并提供高股息的产品，但随着比特币及MSTR股价走弱，市场担忧其支付股息能力，导致STRC价格一度跌至75美元。尽管Strategy公司资产负债表稳健，持有大量比特币和现金，但市场仍恐慌其可能暂停股息。对此，公司公布了新运营框架：将出售部分比特币用于支付股息，允许STRC价格自由浮动，并可能进行回购。此举意味着Strategy从过去单一的比特币大买家，转变为根据市场情况动态买卖的角色。文章指出，STRC的剧烈波动是市场周期尾部的典型特征，类似于以往牛市后期杠杆工具出清的过程。这种不匹配资金（追求稳定收益却投入高波动资产）的离场，是市场探明底部的必要环节。对于未来，作者认为比特币下一轮的主要买家将转向全球机构资金（如银行、养老金、主权基金等），并给出了几个市场见底的观察信号：MSTR股价相对资产净值出现折价、加密恐惧贪婪指数降至极端恐慌、比特币合约资金费率持续为负。当前市场正处于去杠杆和出清阶段，作者预计底部已经临近，新一轮牛市可能在今年秋季开启。

Foresight News22分钟前

Foresight News22分钟前

ENS 创始人想从 DAO 手里「夺权」

6月29日，ENS社区关于将ENS DAO安全委员会一票否决权续期两年的提案进入链上投票。创始人Nick Johnson动用大量持仓投出反对票，使反对票激增至355万票，远超最初支持票数。安全委员会成立于2024年7月，旨在通过4/8多签否决恶意提案，以保护DAO超3.5亿美元金库，其权限每两年需续期一次。Nick的反对源于对当前治理状况的担忧。自2025年11月起，他多次指出DAO内部存在政治斗争、有能力者流失、决策权落入经验不足或利益不一致者之手等问题。ENS DAO秘书Limes也曾提议关闭部分工作组，批评提案沦为互相支持的“游戏”。 6月19日，ENS COO Katherine Wu提出改革方案，计划将日常运营、金库管理等移交重组的ENS基金会，并设立董事会以增强执行力，同时承诺DAO保留核心协议治理权。此提案引发争议，批评者认为这削弱了代币持有者对金库的控制，违背了DAO初衷。 Nick投下反对票被视为其对DAO治理模式改革的明确表态。他解释反对是因担心现有委员会权力缺乏制衡，且否决权可能被用于政治目的。随后，Katherine提出了修正案，包括提高否决门槛至5/8、增加权力限制和成员移除机制等。近年来ENS协议收入持续下滑，从2023年的超1000万美元降至2025年的不足200万美元。在行业下行压力下，巨额金库的管理效率成为焦点。Nick凭借其持股份额有能力推动变革，但其推动的集权化改革也使其面临必须证明新基金会能比DAO做得更好的压力。ENS核心团队如何解决治理与效率的平衡问题，成为下一步关键。

Foresight News52分钟前