AI预测实录:想靠AI在预测市场赚钱?但它可能连题目都没看清

marsbit发布于2026-01-04更新于2026-01-04

文章摘要

作者南枳尝试用AI模型(Gemini 2.5 Pro和Grok 4 Fast)在预测市场进行预测实验,与人类预测者对比表现。实验排除了加密货币类题目,仅输入题目、描述和选项,要求AI基于新闻、报告等证据进行逻辑推理,并禁止使用预测市场数据。在已结算的21个题目中,Grok胜率达75%,人类为66.7%,Gemini仅52.4%。 AI主要出现以下问题:Gemini偶尔误判当前时间;思考深度不足,未能充分利用信息;依赖常识而非证据进行判断;误解题目结算条件。尽管Grok胜率较高,但其推理仍存在可改进之处,例如更精准地理解时间、题目要求和证据分析。整体上,AI在预测市场中展现一定潜力,但尚未完全可靠。

作者|南枳(@Assassin_Malvo)

多数赛道证伪后,预测市场成为 Crypto 圈内少数仍在正向增长的赛道之一。11 月 20 日,南枳开始尝试用去年寻找 Meme 聪明钱的思路寻找预测市场聪明钱,并在初期取得了较好的成果。

12 月初,正值 Gemini 3 Pro 上线,在测试相关模型的时候想到是否可以使用 AI 对预测市场进行分析和预测,并由人类对阵 AI 看哪方预测更为准确。

在对预测市场做介绍时,通常宣称其通过“让有见解的人使用真金白银下注”,从而推动市场向“真相”靠拢。但也有人认为 Crypto+预测市场让“内幕人士”可以安全地获取信息差所带来的利润,从而带动市场向“内幕结果”发展,这本质上是“群体智慧”与“真理掌握在少数人手中”两种观点的交锋,而 AI 预测更偏向于“群体智慧”,因此需要有大量的可用知识和见解。

所以在如何选择 AI 模型的问题上,初步选用了 Gemini 和 Grok,因为二者依靠着 Google 和 X 平台,可以最直接地获取大量的知识与见解,近期南枳又新增了“豆包+抖音知识”的组合,但由于预测题目尚不多在本篇暂不涉及。

基本规则

  • AI 版本:Gemini 2.5 pro(自带 Google 搜索)、Grok 4 Fast(通过 OpenRouter 调用,启用原生搜索功能)
  • 题目选择:由人类选择下注题目,AI 跟随预测,但排除了 Crypto 板块
  • 输入内容:官方题目(title)、官方描述(Description)、可选答案(其实只有 Yes 和 No)

注:Polymarket 的题目分为大类 Event 和子类 Market,大类 Event 为“谁是下一任美联储主席”、“Strategy 什么时候会卖出比特币”这种大范围的题目,Event 下面又包含了 N 个子类市场,例如“哈赛特是否会成为下一任美联储主席”、“Strategy 在 2026 年 3 月 31 日前会卖出比特币”这种具体的选择。为了与人类预测对齐,这里选择了 Market 作为 AI 判断的题目,不向其输入其他选项,例如只让他判断“哈赛特是否会成为下一任美联储主席”,而非让他从 N 个候选人中选出最有可能的那一个。

  • 提示词设计:
  • 要求 AI 搜索最新新闻、官方公告、专家分析报告
  • 要求剔除、禁止使用预测市场数据
  • 基于“证据”,运用逻辑推理进行判断
  • 只允许输出 Yes 和 No,并用一段话阐述推理逻辑

当前结果

预测题目中,已结算 21 个,Grok 胜率最高为 75%,人类为 66.7%,而 Gemini 最低为 52.4%。目前结果可在相关网站查看。

AI 犯了什么错?

Gemini 偶尔误判当前时间

在题目”Will Trump's approval rating hit 35% in 2025?“中,Gemini 表示目前是 2025 年上半年,所以一切皆有可能,胡乱给出了答案。

但作者使用程序直接要求 Gemini 输出当前时间时,Gemini 能够给出正确答案,尚不清楚为何会出现这样的错误时间认知。

AI 思考深度不足

在题目“Gemini 3.0 Flash released by December 16?”中,Grok 根据“官方最近只提及 Gemini 3 Pro 及 2.5 相关版本,极少提及 3 Flash,因此证据不足不能判断”,只考虑了当下信息。

而 Gemini 指出“Gemini 1.0 于 2023 年 12 月发布,而 Gemini 2.0 Flash 的实验版于 2024 年 12 月推出。延续这一模式,在 2025 年底推出 3.0 版本是合乎逻辑的”,并且发现了“最近(2025 年 12 月 14 日)在网络社区中流传的一个关于“Gemini 3.0 Flash”的泄露演示,进一步增强了其即将公开发布的可能性”。

虽然从结论上来看,Gemini 的答案反而是错误的,但在本题目中可以明显看出二者所依赖的资料广度存在明显差距。

AI 基于常识而非基于证据+逻辑进行推断

在题目“Trump approval Up or Down this week?”中,Gemini 表示“对一年多以后的单周民意调查支持率进行预测具有高度的不确定性”,首先再次出现了“时间误判”的情况。然后 Gemini 表示“在任何一个普通星期内,出现导致支持率轻微下降的事件的概率,可能略高于出现能显著提升支持率的正面事件的概率”,所以支持率下降的可能性更大,生成的结论仅依据主观常识假设。

而本题目中,Grok 基于“政府关门、经济担忧、移民政策争议以及对罗伯·莱纳去世评论引发的负面反弹影响”等新闻报道以及民调数据,符合设计预期。

结算条件判断有误

在题目“Will Trump release the Epstein files by December 20?”中,Gemini 和 Grok 均已知道“政府将于周五(12 月 19 日)公布‘数十万页’文件”,而结算条件中明确指出“政府公开发布任何与爱泼斯坦非法活动相关且在所列日期前未公开的文件,即判断为 Yes”。

然而在这一条件下,Gemini 表示“在 12 月 20 日之前完成‘所有’文件的公布是不可能的”,明显误判了结算所需要的条件,因此给出了错误答案。

小结

综上,Grok 的预测胜率已经超越了这些在预测市场上盈利数十万、百万美元的聪明钱,但深入探究其预测逻辑,仍有大量可以引导、改正的地方。

相关问答

Q文章中提到AI预测市场实验中,哪个AI模型的胜率最高?

AGrok的胜率最高,达到75%。

Q作者在AI预测实验中排除了哪个板块的题目?

A排除了Crypto板块的题目。

QGemini在预测中犯的一个错误是什么?

AGemini偶尔会误判当前时间,例如在预测特朗普支持率时错误地认为当时是2025年上半年。

QAI预测实验的输入内容主要包括哪些?

A输入内容包括官方题目(title)、官方描述(Description)以及可选答案(Yes和No)。

Q文章中提到预测市场的两种观点交锋是什么?

A是“群体智慧”与“真理掌握在少数人手中”两种观点的交锋。

你可能也喜欢

Zcash上涨1500%,其最大支持者解释原因

据Zcash主要支持者乔希·斯威哈特分析,ZEC价格约1500%的飙升并非偶然,而是2023至2024年间在治理、产品、叙事和组织结构上进行多年重置的成果。 他指出,三年前ZEC价格约30美元,仅不到11%的供应量被屏蔽(shielded),且社区陷于治理争议。如今ZEC价格约600美元,约31%的供应量被屏蔽,用户控制的屏蔽钱包持有价值超30亿美元,且屏蔽交易占比在三月中旬达到86.5%。 **治理重置成为核心**:2024年,Electric Coin Co.宣布不再接受直接资助,打破了原有核心机构长期获得固定区块奖励的格局。网络升级6取消了直接资助,将8%奖励导向社区赠款,12%放入协议控制的锁箱,供ZEC持有者追溯奖励为生态创造价值的贡献者。同时,商标协议的终止消除了ECC和Zcash基金会对协议的潜在否决权,使治理更加去中心化。 **产品重心回归用户与屏蔽使用**:ECC于2024年1月将重点转向用户增长。默认屏蔽的钱包Zodl(原Zashi)于2024年3月推出,带动屏蔽供应量从约11%升至2025年底的约30%。钱包自10月起处理了超6亿美元的ZEC互换,反映了真实用户对隐私和自托管的选择。 **叙事从“隐私币”转向“不可阻挡的私人货币”**:这一新定位使Zcash更易被机构理解,吸引了如Robinhood上线、Multicoin披露持仓、Grayscale提交ETF申请及Foundry推出矿池等进展。 **组织重组与融资**:2026年1月,ECC团队脱离后成立了Zcash开放开发实验室(ZODL),并获得了Paradigm、a16z crypto等机构2500万美元融资,旨在以初创公司的速度和资本推动大规模消费者产品开发。 近期重点包括提升用户体验、可扩展性(目标将区块时间从75秒降至25秒)及后量子安全准备。斯威哈特总结,Zcash将变得更快、更易用、功能更丰富、可扩展性更强并具备后量子安全性。 截至发稿时,ZEC交易价格为570.36美元。

bitcoinist30分钟前

Zcash上涨1500%,其最大支持者解释原因

bitcoinist30分钟前

比特币已实现市值回升至正值区域,市场重获力量

比特币价格在周日小幅反弹后重回8万美元关键点位上方,多个指标开始重新显现强势。其中,比特币已实现市值(Realized Cap)随着市场状况缓慢改善,近期已转为看涨信号。 比特币重新燃起的看涨势头正逐渐体现在多个关键链上指标中,反映出市场动态的转变。比特币已实现市值目前显示出强势,随着市场情绪改善,已回升至正值区域。该指标通过计算已实现利润与已实现亏损的差值得出,反映了比特币市场创造或摧毁的价值。 CryptoQuant平台分析师Darkfost指出,该指标目前正显示复苏信号,这意味着资金正流入比特币。截至周日,比特币已实现市值已转正,增长率约为+0.25%。虽然增幅尚不显著,但这是在今年2月经历超过-2.6%的急剧下跌之后发生的。Darkfost认为,当前阶段代表了资产从“弱手”向“强手”的转移。 与此同时,另一个关键指标比特币净已实现利润/亏损也已转为正值。这一变化表明,以盈利状态转移的代币数量超过了以亏损状态转移的数量,显示出市场信心和投资者情绪正在稳步改善。链上分析账户On-Chain Mind指出,该指标是五个多月以来首次转正。 总体而言,这些链上指标的改善标志着市场正在经历一个修复过程,投资者情绪好转,资金开始回流。然而,这并不等同于直接进入牛市,趋势能否持续仍有待观察。

bitcoinist4小时前

比特币已实现市值回升至正值区域,市场重获力量

bitcoinist4小时前

BTC市场脉搏:第20周

比特币在过去一周从77,000美元高位震荡上行至82,000美元低位,买盘持续吸纳回调,尽管价格在局部高点附近动能有所减弱。现货CVD(累计成交量Delta)大幅上升,反映了强烈的看涨情绪和对价格上涨的高度信心。同时,现货交易量增加,表明近期的价格走势得到了更强投资者参与的推动。然而,价格动能的放缓指向更均衡的买卖压力,暗示市场可能进入一个稳定阶段。 期货市场方面,风险偏好同样上升。期货未平仓合约增加,表明投机活动加剧和风险承担意愿增强;永续合约CVD飙升,显示持续的看涨动能。但多头资金费率下降,意味着空头兴趣抬头,看涨情绪可能正在减弱。 期权市场对下行保护的需求下降,未平仓合约上升,表明市场预期转向中性偏多。然而,波动率利差大幅扩大,显示期权定价蕴含的风险显著高于已实现波动,反映出参与者中存在较高的不确定性。 链上活动显著增强,每日活跃地址、实体调整后的转账量和总手续费收入均有所上升,指向用户参与度提高和网络活动增加。与此同时,流动性状况持续稳定,短期投机资本的减少降低了即时卖压,而已实现市值变化则显示适度的净资本流入。 盈利能力指标也有所改善,市场从未实现亏损重回盈利状态。然而,处于盈利状态的供应百分比仍低于通常与大规模获利了结相关的水平,表明市场乐观情绪依然克制而非狂热。 总结来说,比特币的市场结构继续改善,得到更强的链上活动、更健康的盈利能力和更稳定的持有者仓位的支持。虽然看涨基调正在形成,但较温和的资本流入和谨慎的市场情绪表明,市场对风险偏好的变化依然敏感。

insights.glassnode7小时前

BTC市场脉搏:第20周

insights.glassnode7小时前

交易

现货
合约

热门文章

加密市场宏观研报:原油飓风、AI巨浪与比特币的十字路口

全球金融市场正经历一场由地缘冲突引发的系统性重估:霍尔木兹海峡封锁导致原油一度暴涨30%,G7紧急释放储备后涨幅收窄,滞胀风险取代通胀成为核心担忧,美元成为“唯一避风港”并逼近100大关,亚太及美股遭遇“黑色星期一”全线重挫;AI领域则冰火两重天,国家发改委提出“十五五”末10万亿规模目标,OpenClaw项目火爆推动概念股狂飙;比特币在宏观风暴中跌破70000美元关键防线。

454人学过发布于 2026.03.12更新于 2026.03.12

加密市场宏观研报:原油飓风、AI巨浪与比特币的十字路口

相关讨论

欢迎来到HTX社区。在这里,您可以了解最新的平台发展动态并获得专业的市场意见。以下是用户对AI(AI)币价的意见。

活动图片