小米和MiniMax同时放大招,Agent定价战正式开打

marsbit發佈於 2026-03-20更新於 2026-03-20

文章摘要

小米和MiniMax近日先后发布Agent方向大模型MiMo-V2-Pro和M2.7,在性能接近全球第一梯队的同时,以远低于国际主流模型的价格引发关注。MiniMax M2.7定价为每百万tokens 1.2美元,小米MiMo-V2-Pro为3美元,仅为Claude Opus 4.6的1/21和1/8。 两家公司技术路线截然不同:小米采用“大力出奇迹”策略,MiMo-V2-Pro拥有万亿参数和混合注意力机制,擅长长上下文和代码工程;MiniMax则侧重“自我进化”,M2.7通过自迭代优化实现性能提升,在办公自动化方面表现突出。 迭代节奏也形成对比:MiniMax五个月发布四个版本,追求快速迭代;小米版本间隔较长但每次突破显著。小米还采用匿名发布策略,以“Hunter Alpha”之名在OpenRouter平台盲测登顶,八天后揭晓身份,股价应声上涨。 这场发布标志着国产Agent模型正式加入全球竞争,并以极具竞争力的价格开启商业化进程。

3 月 18 日和 19 日,两家中国公司先后发布了各自的 Agent 方向大模型。国内 AI 初创公司 MiniMax 推出 M2.7,小米旗下大模型团队 MiMo 推出 V2-Pro。两款模型在 Agent benchmark 上均进入全球第一梯队,但它们的 API 输出定价分别是 Claude Opus 4.6 的 1/21 和 1/8。

两家同一周出牌,但手里的牌完全不同。它们代表了两条截然不同的技术路线,赌的是 Agent 时代的两种未来。

同一场考试,1/17 的学费

先看最直观的对比。

据 OpenRouter 和各公司官方定价页数据,以 API 输出价格(每百万 tokens)计,MiniMax M2.7 是 1.2 美元,MiMo-V2-Pro 是 3 美元。作为参照,Claude Opus 4.6 的输出价是 25 美元,GPT-5.2 是 14 美元,Claude Sonnet 4.6 是 15 美元。

价格差距是数量级的,但能力差距不是。在 SWE-bench Verified(当前衡量代码工程能力最主流的 benchmark)上,MiMo-V2-Pro 拿到 78%,Sonnet 4.6 是 79.6%,差距不到两个百分点。M2.7 的 SWE-Pro 成绩为 56.22%,与 GPT-5.3-Codex 持平。在 VIBE-Pro(端到端项目交付能力)上,M2.7 拿到 55.6%,接近 Opus 4.6 的水平。

这张图的重点不在于谁高谁低——各家的 benchmark 体系不完全对齐,直接比较要谨慎。重点在于那个「价格-性能剪刀差」:国产 Agent 模型已经挤进了同一个能力带,但站在完全不同的价格区间里。

万亿参数 vs 自我进化

价格只是表象。两家公司拿出了两套完全不同的底牌。

MiMo-V2-Pro 走的是「大力出奇迹」路线。据小米官方公告,V2-Pro 拥有超过 1 万亿总参数,激活参数 42B,支持 100 万 tokens 的超长上下文。它的核心创新是 Hybrid Attention 混合注意力机制,将滑动窗口注意力(SWA)与全局注意力(GA)的比例调至 7:1——前代 V2-Flash 是 5:1。这套架构让模型在处理长文档、多工具并行调用的 Agent 场景时更稳定。在 PinchBench(Agent 工具调用能力评测)上,MiMo-V2-Pro 拿到 84%。

M2.7 走了一条完全不同的路。据 MiniMax 3 月 18 日发布的官方技术博客,M2.7 的参数量未公开,但它展示了一种「自迭代进化」机制:模型自主运行 100 轮以上的优化循环,包括分析失败轨迹、规划修改、修改自身代码架构、跑评估、再循环,最终在内部评估集上实现了 30% 的性能提升。在 MLE Bench Lite(机器学习竞赛难度评测)的 22 道高难度题中,M2.7 拿下 9 金 5 银 1 铜,平均奖牌率 66.6%。

从五个维度看,两条路线的锋芒朝向完全不同:MiMo-V2-Pro 在上下文长度和代码工程维度上明显占优,M2.7 则在办公自动化和自迭代能力上拉开距离。据 MiniMax 同篇技术博客,M2.7 在 GDPval-AA(办公文档处理评测)上拿到 ELO 1495,居开源模型首位,在覆盖 40 多个复杂技能的 MM-Claw 测试中保持了 97% 的技能遵循率。

五个月四版本

两家公司不只技术路线不同,迭代节奏也完全不一样。

据公开发布记录,MiniMax 从 2025 年 10 月发布 M2 到 2026 年 3 月发布 M2.7,五个月内迭代了四个版本,平均每 49 天一个大版本。其中 M2.5 到 M2.7 的间隔只有约 30 天。

小米 MiMo 的节奏不同:2025 年 4 月发布 MiMo-7B(7B 参数的开源推理模型),同年 12 月发布 V2-Flash(309B 总参数),2026 年 3 月发布 V2-Pro(1T 总参数)。每一代之间的参数规模跨越更大,但版本间隔也更长。

MiniMax 选择了小步快跑,每次迭代幅度不大但频率极高,M2.7 的自迭代机制本身就是为「持续进化」设计的。小米选择了蓄力一击,每个版本都是参数规模和架构的大幅跃迁。

匿名 8 天,登顶 OpenRouter

除了技术路线,小米的发布策略也打破了行业惯例。

据 Reuters 报道,3 月 11 日,一个名为 Hunter Alpha 的匿名模型出现在全球最大 API 聚合平台 OpenRouter 上。没有品牌背书,没有发布会,没有技术博客。它的 API 定价极低,性能却出人意料地强。

社区开始猜测它的来历。据 Republic World 和多家科技媒体报道,最主流的猜测是 DeepSeek V4,因为 MiMo 团队负责人罗福莉此前曾在 DeepSeek 从事研究工作。调用量迅速攀升,匿名期内总调用量突破 1 万亿 tokens,登顶 OpenRouter 周榜第一。

3 月 19 日凌晨,小米揭榜:Hunter Alpha 就是 MiMo-V2-Pro。据 Reuters 同篇报道,揭榜后小米港股一度涨幅达 5.8%。

这是国产大模型第一次在全球平台上以纯盲测的方式证明自己。不靠品牌,不靠宣传,用 8 天时间让开发者用脚投票。

相關問答

QMiniMax M2.7 和 小米 MiMo-V2-Pro 的 API 输出定价分别是多少?

AMiniMax M2.7 的 API 输出定价为每百万 tokens 1.2 美元,小米 MiMo-V2-Pro 为每百万 tokens 3 美元。

Q在 SWE-bench Verified 基准测试中,MiMo-V2-Pro 和 Claude Sonnet 4.6 的成绩分别是多少?

AMiMo-V2-Pro 在 SWE-bench Verified 上拿到 78%,Claude Sonnet 4.6 是 79.6%,两者差距不到两个百分点。

QMiMo-V2-Pro 和 M2.7 分别采用了哪些不同的技术路线?

AMiMo-V2-Pro 采用“大力出奇迹”路线,拥有超过1万亿总参数,支持100万 tokens上下文,核心创新是 Hybrid Attention 混合注意力机制。M2.7 则采用“自迭代进化”机制,通过自主运行多轮优化循环提升性能,参数量未公开。

Q小米 MiMo-V2-Pro 在发布前采用了什么独特的市场策略?

A小米在发布 MiMo-V2-Pro 前,以匿名模型“Hunter Alpha”的身份在 OpenRouter 平台上架8天,以极低定价和强劲性能吸引开发者调用量登顶周榜第一,随后才揭晓真实身份。

QMiniMax 从 M2 到 M2.7 的迭代周期是怎样的?

AMiniMax 从2025年10月发布M2到2026年3月发布M2.7,五个月内迭代了四个版本,平均每49天一个大版本,其中M2.5到M2.7的间隔仅约30天。

你可能也喜歡

苹果终于承认,Siri 老了

苹果在WWDC 2026上正式承认Siri已落后于时代,并宣布其人工智能战略的重大转向。发布会核心是将Siri升级为“Siri AI”,并与谷歌达成深度合作,利用Gemini大模型的能力来训练苹果的新一代基础模型。苹果发布了五个不同规格的Apple基础模型,并首次将私有云计算(PCC)扩展至谷歌云和英伟达的GPU。 文章回顾了Siri自2011年诞生以来的发展历程,指出苹果虽早早布局个人助理概念,但因过度追求封闭与控制,限制了Siri向真正智能助手的发展。过去十年,苹果的AI能力以端侧、隐私保护的形式深度集成于系统中,但生成式AI的浪潮改变了竞争规则。 面对ChatGPT等产品的压力,苹果内部进行了人事与团队结构调整。2026年,苹果选择与谷歌合作,通过“蒸馏”方式,利用Gemini训练更小、更适合端侧运行的模型,这标志着苹果在核心AI技术上放弃了完全自研的路径。 对于用户,苹果描绘了AI深度融入系统体验的场景:智能整理通知、邮件摘要、跨应用理解上下文等。Siri也有了独立应用和记忆功能。然而,新功能有较高的硬件门槛,且在中国市场将面临本土化适配与监管挑战,实际体验可能与美国不同。 文章最后指出,苹果AI的未来关键在于如何作为“个人”智能,在提升效率与尊重用户隐私、理解人性复杂之间找到平衡。苹果借用了外部的模型与算力,但真正考验在于学会在理解用户生活的同时,“知道在哪里停下来”。

marsbit4 分鐘前

苹果终于承认,Siri 老了

marsbit4 分鐘前

做加密支付,第一件事是牌照,第二件事是什么?

最近两年,咨询加密支付业务的客户越来越多,涵盖跨境电商、稳定币结算、U卡、商户收单、Web3钱包内置支付等多个领域。大家普遍关心的第一个问题是如何获取相关牌照,例如美国的MSB、州MTL,香港的MSO,新加坡的MPI和DPT许可,以及欧洲MiCA下的CASP等。牌照是开展业务的入场券,但绝非万能。 许多项目方存在误区,认为拿到牌照就能解决所有问题。实际上,牌照只解决了“资格”问题,而真正决定项目能否成功运行的关键,是第二件事:设计一套能被银行、支付机构、交易所、链上风控服务商、监管机构及内部团队共同理解和执行业务闭环。 加密支付业务涉及复杂的客户、资金、币流、结算和责任链路。银行和合作方在尽调时,不会只看牌照,而会深入追问:客户是谁?钱和币从哪里来、到哪里去?平台扮演什么角色?交易目的和风险由谁承担?如果这些环节说不清楚,业务就很难开展。 因此,项目的真正挑战往往不是申请牌照,而是构建一个清晰、合规、可执行的业务闭环。这个闭环需要明确回答七大核心问题:谁是客户和商户?谁在收钱和收币?谁负责兑换和托管?谁承担反洗钱、制裁筛查、退款、冻结等责任?单独的技术、牌照或银行账户不足以支撑业务,必须将它们整合到一个逻辑自洽的体系中。 对于律师而言,其价值不仅在于协助申请牌照,更在于帮助项目方设计合理的主体架构、业务链路、合规风控规则和合同体系,确保对外宣传与实际业务一致,让项目在监管和市场中稳健运行。 总之,做加密支付,牌照是第一步,而构建一个完整、清晰、权责分明的业务闭环,才是项目能否跑起来、跑得远的关键。真正的竞争力在于将牌照、通道、风控和运营整合成一套可持续的合规系统。

marsbit49 分鐘前

做加密支付,第一件事是牌照,第二件事是什么?

marsbit49 分鐘前

交易

現貨
合約

熱門文章

如何購買WAR

歡迎來到HTX.com!在這裡,購買WAR (WAR)變得簡單而便捷。跟隨我們的逐步指南,放心開始您的加密貨幣之旅。第一步:創建您的HTX帳戶使用您的 Email、手機號碼在HTX註冊一個免費帳戶。體驗無憂的註冊過程並解鎖所有平台功能。立即註冊第二步:前往買幣頁面,選擇您的支付方式信用卡/金融卡購買:使用您的Visa或Mastercard即時購買WAR (WAR)。餘額購買:使用您HTX帳戶餘額中的資金進行無縫交易。第三方購買:探索諸如Google Pay或Apple Pay等流行支付方式以增加便利性。C2C購買:在HTX平台上直接與其他用戶交易。HTX 場外交易 (OTC) 購買:為大量交易者提供個性化服務和競爭性匯率。第三步:存儲您的WAR (WAR)購買WAR (WAR)後,將其存儲在您的HTX帳戶中。您也可以透過區塊鏈轉帳將其發送到其他地址或者用於交易其他加密貨幣。第四步:交易WAR (WAR)在HTX的現貨市場輕鬆交易WAR (WAR)。前往您的帳戶,選擇交易對,執行交易,並即時監控。HTX為初學者和經驗豐富的交易者提供了友好的用戶體驗。

482 人學過發佈於 2024.12.13更新於 2026.06.02

如何購買WAR

相關討論

歡迎來到 HTX 社群。在這裡,您可以了解最新的平台發展動態並獲得專業的市場意見。 以下是用戶對 WAR (WAR)幣價的意見。

活动图片