AI预测实录：想靠AI在预测市场赚钱？但它可能连题目都没看清

Q: 文章中提到AI预测市场实验中，哪个AI模型的胜率最高？

Grok的胜率最高，达到75%。

Q: 作者在AI预测实验中排除了哪个板块的题目？

排除了Crypto板块的题目。

marsbit发布于2026-01-04更新于2026-01-04

文章摘要

作者南枳尝试用AI模型（Gemini 2.5 Pro和Grok 4 Fast）在预测市场进行预测实验，与人类预测者对比表现。实验排除了加密货币类题目，仅输入题目、描述和选项，要求AI基于新闻、报告等证据进行逻辑推理，并禁止使用预测市场数据。在已结算的21个题目中，Grok胜率达75%，人类为66.7%，Gemini仅52.4%。 AI主要出现以下问题：Gemini偶尔误判当前时间；思考深度不足，未能充分利用信息；依赖常识而非证据进行判断；误解题目结算条件。尽管Grok胜率较高，但其推理仍存在可改进之处，例如更精准地理解时间、题目要求和证据分析。整体上，AI在预测市场中展现一定潜力，但尚未完全可靠。

作者|南枳(@Assassin_Malvo)

多数赛道证伪后,预测市场成为 Crypto 圈内少数仍在正向增长的赛道之一。11 月 20 日,南枳开始尝试用去年寻找 Meme 聪明钱的思路寻找预测市场聪明钱,并在初期取得了较好的成果。

12 月初,正值 Gemini 3 Pro 上线,在测试相关模型的时候想到是否可以使用 AI 对预测市场进行分析和预测,并由人类对阵 AI 看哪方预测更为准确。

在对预测市场做介绍时,通常宣称其通过“让有见解的人使用真金白银下注”,从而推动市场向“真相”靠拢。但也有人认为 Crypto+预测市场让“内幕人士”可以安全地获取信息差所带来的利润,从而带动市场向“内幕结果”发展,这本质上是“群体智慧”与“真理掌握在少数人手中”两种观点的交锋,而 AI 预测更偏向于“群体智慧”,因此需要有大量的可用知识和见解。

所以在如何选择 AI 模型的问题上,初步选用了 Gemini 和 Grok,因为二者依靠着 Google 和 X 平台,可以最直接地获取大量的知识与见解,近期南枳又新增了“豆包+抖音知识”的组合,但由于预测题目尚不多在本篇暂不涉及。

基本规则

AI 版本:Gemini 2.5 pro(自带 Google 搜索)、Grok 4 Fast(通过 OpenRouter 调用,启用原生搜索功能)
题目选择:由人类选择下注题目,AI 跟随预测,但排除了 Crypto 板块
输入内容:官方题目(title)、官方描述(Description)、可选答案(其实只有 Yes 和 No)

注:Polymarket 的题目分为大类 Event 和子类 Market,大类 Event 为“谁是下一任美联储主席”、“Strategy 什么时候会卖出比特币”这种大范围的题目,Event 下面又包含了 N 个子类市场,例如“哈赛特是否会成为下一任美联储主席”、“Strategy 在 2026 年 3 月 31 日前会卖出比特币”这种具体的选择。为了与人类预测对齐,这里选择了 Market 作为 AI 判断的题目,不向其输入其他选项,例如只让他判断“哈赛特是否会成为下一任美联储主席”,而非让他从 N 个候选人中选出最有可能的那一个。

提示词设计:
要求 AI 搜索最新新闻、官方公告、专家分析报告
要求剔除、禁止使用预测市场数据
基于“证据”,运用逻辑推理进行判断
只允许输出 Yes 和 No,并用一段话阐述推理逻辑

当前结果

预测题目中,已结算 21 个,Grok 胜率最高为 75%,人类为 66.7%,而 Gemini 最低为 52.4%。目前结果可在相关网站查看。

AI 犯了什么错?

Gemini 偶尔误判当前时间

在题目”Will Trump's approval rating hit 35% in 2025?“中,Gemini 表示目前是 2025 年上半年,所以一切皆有可能,胡乱给出了答案。

但作者使用程序直接要求 Gemini 输出当前时间时,Gemini 能够给出正确答案,尚不清楚为何会出现这样的错误时间认知。

AI 思考深度不足

在题目“Gemini 3.0 Flash released by December 16?”中,Grok 根据“官方最近只提及 Gemini 3 Pro 及 2.5 相关版本,极少提及 3 Flash,因此证据不足不能判断”,只考虑了当下信息。

而 Gemini 指出“Gemini 1.0 于 2023 年 12 月发布,而 Gemini 2.0 Flash 的实验版于 2024 年 12 月推出。延续这一模式,在 2025 年底推出 3.0 版本是合乎逻辑的”,并且发现了“最近(2025 年 12 月 14 日)在网络社区中流传的一个关于“Gemini 3.0 Flash”的泄露演示,进一步增强了其即将公开发布的可能性”。

虽然从结论上来看,Gemini 的答案反而是错误的,但在本题目中可以明显看出二者所依赖的资料广度存在明显差距。

AI 基于常识而非基于证据+逻辑进行推断

在题目“Trump approval Up or Down this week?”中,Gemini 表示“对一年多以后的单周民意调查支持率进行预测具有高度的不确定性”,首先再次出现了“时间误判”的情况。然后 Gemini 表示“在任何一个普通星期内,出现导致支持率轻微下降的事件的概率,可能略高于出现能显著提升支持率的正面事件的概率”,所以支持率下降的可能性更大,生成的结论仅依据主观常识假设。

而本题目中,Grok 基于“政府关门、经济担忧、移民政策争议以及对罗伯·莱纳去世评论引发的负面反弹影响”等新闻报道以及民调数据,符合设计预期。

结算条件判断有误

在题目“Will Trump release the Epstein files by December 20?”中,Gemini 和 Grok 均已知道“政府将于周五(12 月 19 日)公布‘数十万页’文件”,而结算条件中明确指出“政府公开发布任何与爱泼斯坦非法活动相关且在所列日期前未公开的文件,即判断为 Yes”。

然而在这一条件下,Gemini 表示“在 12 月 20 日之前完成‘所有’文件的公布是不可能的”,明显误判了结算所需要的条件,因此给出了错误答案。

小结

综上,Grok 的预测胜率已经超越了这些在预测市场上盈利数十万、百万美元的聪明钱,但深入探究其预测逻辑,仍有大量可以引导、改正的地方。

你可能也喜欢

韩国15种山寨币交易量呈现爆发式增长！

韩国主要加密货币交易所Upbit和Bithumb上部分山寨币交易量出现显著增长。过去24小时内，最受欢迎的山寨币总交易额达到约3.477亿美元。其中，MetaDAO（META）交易量居首，仅在Upbit上的单日交易额就达6584万美元，占该交易所现货总交易量的12.39%。Euler（EUL）以4765万美元的总交易额位居第二，XRP以3811万美元位列第三，持续受到韩国投资者关注。其他交易量靠前的山寨币包括ThunderCore（TT）、Babylon（BABY）、Geodnet（GEOD）、Hyperlane（HYPER）、Momentum（MMT）、Ondo（ONDO）、柴犬币（SHIB）等。本文提供的信息不构成投资建议。

cryptonews.ru19分钟前

cryptonews.ru19分钟前

唐纳德·特朗普的公司再度出售大批比特币！

据报道，与美国总统唐纳德·特朗普的媒体公司Trump Media & Technology Group相关的地址，疑似向加密货币交易所CryptoCom转移了约2628枚比特币，价值约1.65亿美元。此前有分析称，该公司总计购买了11542枚比特币，平均成本为每枚11.85万美元。据称，2026年至今，相关地址已转出约7281枚比特币，目前仍持有约4261枚。 Trump Media在比特币投资上的已实现和未实现损失总额估计约为5.55亿美元。不过，将比特币转移至交易所并不一定意味着出售资产，也可能是为了托管、流动性管理或其他财务操作。目前尚无法确定其具体意图，但从冷钱包向中心化交易所转移通常被视为潜在的出售行为。 *本文不构成投资建议。

cryptonews.ru2小时前

cryptonews.ru2小时前

帕克·刘易斯解释为何比特币仍是最佳货币

知名比特币分析师帕克·刘易斯在访谈中批评了某些上市公司以“数字信贷”形式销售永续优先股的营销策略，认为这从根本上扭曲了比特币的本质。他指出，比特币在算法层面不具备法币收益性，承诺定期分红主要依赖牛市吸引新投资者来维持，风险极高。刘易斯引用数据说明此类衍生品的巨大风险：全球信贷市场规模达300万亿美元，而永续优先股市场仅约1万亿美元，这表明机构有意规避这种无还款期限的资产，将风险转嫁给信息不足的散户。针对“比特币波动性太大”的常见观点，他认为波动性是这一供应量严格受限的新资产被大规模采用过程中的自然数学结果。新人入场需出更高价从早期持有者手中购买，导致价格剧烈波动。他建议投资者直接持有比特币，这比投资MicroStrategy等公司发行的衍生品更安全。投资者将焦点从直接持有加密货币转向公司衍生品，会忽视法币急速贬值的真正威胁。刘易斯以自创的“肋眼牛排指数”为例，指出其本地超市一款牛排价格从2020年的19.99美元涨至37.99美元，反映年化约12-13%的真实通胀，远超官方平滑后的CPI数据。在全球通胀环境下，最明智、保守且安全的策略仍是直接持有比特币并完全掌控私钥。追逐加密货币国库股等公司工具的收益只会叠加隐性系统风险，而理解去中心化货币的本质才能有效保护财富免受宏观经济动荡影响。

cryptonews.ru2小时前

cryptonews.ru2小时前

比特币为何在美联储强硬暂停后守住 64,000 美元关口

比特币在美联储暂停加息后维持在64,000美元附近，结束了7月的交易。市场对美联储维持利率不变的决定反应剧烈，但并未获得政策即将转向的明确信号。在此背景下，资金重新流入比特币现货ETF，加密货币总市值保持在2.29万亿美元左右，主要山寨币走势分化。投资者目前处于观望状态。一方面，高利率和美联储的强硬立场抑制了风险偏好；另一方面，市场未出现恐慌性抛售、比特币ETF恢复资金净流入以及关键价位的韧性表明，数字资产市场尚未准备好大幅下跌。 **关键信息：** - 美联储维持利率在3.50%-3.75%，投票结果为9:3，三位委员支持加息。 - 比特币现货ETF净流入3210万美元，结束了连续流出；以太坊ETF则净流出约1865万美元。 - 比特币在63,000-66,000美元区间内盘整，63,000-63,500美元构成支撑，66,000美元是近期阻力。 - 以太坊价格在1,900美元附近承压，但其网络基本面（如质押意愿）保持稳定。 - 资金在主要加密货币间轮动，比特币重获机构青睐，Solana相关产品也有资金流入。 - 美国CLARITY Act法案审议被推迟至秋季，降低了其在2026年内通过的可能性。技术层面，比特币能否在63,000美元上方保持稳固、以太坊能否守住1,860美元以及机构资金流入能否持续，被视为市场能否在2026年下半年构筑复苏基础的关键信号。

cryptonews.ru2小时前

cryptonews.ru2小时前

ARK Invest公司凯西·伍德以683万美元购入约109,129股Circle股票

凯西·伍德领导的ARK Invest公司通过旗下三只交易所交易基金，购入约109,129股Circle股票，价值近683万美元。此次买入前，Circle刚获得纽约州金融服务部门颁发的信托运营许可证，其信托实体将更名为Circle New York Trust。公司首席执行官杰里米·阿莱尔称此为公司的长期目标。尽管获得监管批准，7月31日Circle股价仍下跌2.54%，收于62.61美元，市场反应显示投资者可能未将该许可视为股价上涨动力。同期，ARK Invest还趁科技股抛售潮，购入了价值约4020万美元的特斯拉、SpaceX和英伟达股票，并减持了Shopify、Cloudflare、CrowdStrike等公司的股份。

cryptonews.ru2小时前

ARK Invest公司凯西·伍德以683万美元购入约109,129股Circle股票

cryptonews.ru2小时前

交易

现货

AI预测实录：想靠AI在预测市场赚钱？但它可能连题目都没看清

文章摘要

基本规则

当前结果

AI 犯了什么错?

Gemini 偶尔误判当前时间

AI 思考深度不足

AI 基于常识而非基于证据+逻辑进行推断

结算条件判断有误

小结

热门币种推荐

相关问答

你可能也喜欢

韩国15种山寨币交易量呈现爆发式增长！

唐纳德·特朗普的公司再度出售大批比特币！

帕克·刘易斯解释为何比特币仍是最佳货币

比特币为何在美联储强硬暂停后守住 64,000 美元关口

ARK Invest公司凯西·伍德以683万美元购入约109,129股Circle股票

交易

热门文章

火币成长学院：AI与Crypto深度研报：算法与账本的共生时代

从H2A到A2A：AI Agent经济体与Crypto新机遇

美股TradFi：传统金融在AI IPO浪潮下的稳健锚点

相关讨论

热门问答

热门分类

热门标签