大模型清场前夜

marsbitPublished on 2026-05-10Last updated on 2026-05-10

Abstract

过去一周,中国大模型行业融资突然集中爆发:Kimi完成20亿美元融资,估值突破200亿美元;阶跃星辰接近完成近25亿美元融资,正加速港股IPO;DeepSeek首次接受外部融资,估值高达450亿-500亿美元。三天内超70亿美元涌向头部企业,标志着行业进入“清场前夜”。 资本不再分散投资,而是疯狂抢购最后几张独立生存的门票。大模型能力正快速“商品化”,各头部模型间的代差缩小,技术本身难以形成长期壁垒。行业叙事已从比拼模型能力,转向争夺终端入口、产业链绑定和国家战略价值。 与此同时,行业经济模型矛盾凸显:推理成本随用户增长持续攀升,而DeepSeek开源低价策略压低了整个API市场的利润空间。巨头凭借生态业务交叉补贴,可承受长期亏损,创业公司则面临生存压力。 当前,头部公司正全力冲刺身份确认与估值锁定:阶跃星辰绑定硬件产业链,寻求上市;Kimi加速证明收入增长;DeepSeek获国家队背书,定位国家级技术资产。它们的共同点是都不再只讲“做最好的模型”,而是强调“卡住生态位置”。 行业淘汰速度远超预期,百模大战仅三年就可能走向清场。融资逻辑已从风险投资转向基础设施投资,资本只相信存活率。对未上榜的公司而言,沉默或许已是答案。行业核心问题已从“谁能做出来”变为“谁能活下来”。

撰文|画画、版君

过去一周,中国大模型行业突然进入了一种近乎疯狂的融资状态。

Kimi完成20亿美元融资,估值突破200亿美元。

阶跃星辰被曝接近完成近25亿美元融资,同时加速拆除红筹架构,港股IPO进入冲刺阶段。

DeepSeek首次传出接受外部融资,国家大基金下场,估值区间被推高到450亿—500亿美元。

三家公司,三天时间,超过70亿美元资金同时涌入。这不再是锦上添花的投后加注,更像是一场对未来生存配额的集体抢购。

表面看,这是大模型行业最热的时候。

但真正危险的行业,往往也最热。

当资本不再雨露均沾,将筹码全数推向最后几个头部玩家时,行业看起来异常繁荣,实际上却已经进入清场前夜。

智谱、MiniMax上市后的暴涨,逐渐让所有人意识到:

留给独立大模型公司的时间,可能不多了。

一、模型开始商品化

过去两年,大模型行业最大的共识是模型能力存在巨大代差。

GPT-4曾经一度遥不可及。只要一家创业公司能在某个维度接近一点,长文本、推理、多模态、Agent,资本就愿意给出极高溢价。

所有人都相信,能力差距会形成长期壁垒。

但2026年的情况变了。

长文本不再稀缺。推理能力不再稀缺。多模态不再稀缺。

DeepSeek V4把开源能力拉到接近GPT-4甚至更新版本的水平之后,行业第一次真正意识到,模型能力本身,可能比所有人想象中更容易被追平。

Qwen、DeepSeek、Gemini、Claude、GPT-5.5之间的差距仍然存在,但已经很难再形成代际碾压。

模型正在商品化。

一旦商品化发生,资本市场就会重新追问一个问题:除了模型之外,还剩什么?

于是整个行业的叙事突然换了一套话术。

2023年,所有公司都在讲模型更强、参数更多、推理更好、上下文更长。今天开始讲卡住了终端、绑定了产业链、拥有用户入口、具备国家级战略价值。

这个转变标志着大模型正式从技术竞赛进入了阵地占领阶段。

资本市场的数据已经在反映这件事。

2023年百模大战期间,国内大模型公司数量指数级涌现。亿邦动力的数据显示,那一年六小虎合计融资超过60亿元人民币,占国产大模型早期融资总额的一半以上。2024年更疯狂,全球大模型产业链超亿元融资达到168起,总融资额超4000亿元人民币。

六小虎全年合计至少融了200亿元,单笔纪录不断刷新。

然后是2025年。急转直下。

根据投资界的报道,AI模型层公司全年仅完成22笔投资,合计披露金额94亿元,比2024年下降52.9%。大模型融资占AI总投资的比重,从2024年的51%急坠至14%。单轮融资超过20亿元的公司,只剩智谱、MiniMax和月之暗面三家。

100家变成能拿到钱的不到10家。两年时间,淘汰率超过90%。

所以当看到2026年5月这一周三笔70亿美元集中落地,它的含义就很清楚了,钱不是在流向行业,是在流向最后几个玩家。

这笔融资越大,说明集中度越高。集中度越高,说明留给后面的人的空间越小。

二、音乐还没停,但席位已经不够了

智谱和MiniMax上市后的疯涨,做了一件对整个行业影响深远的事,在二级市场确立了国产大模型值多少钱的参考。

这个参考标准一旦立住,所有未上市公司都面临一个生死时速。如果不趁着现在的窗口完成定价,一旦市场审美疲劳导致回调,你的一级市场估值将被瞬间击碎。

窗口不是你打开的,是先行者帮你撑开的。你不跳进去,它就关了。

阶跃星辰计划6月底前港股交表,年底完成上市。红筹架构已经拆完。股份制改造4月落地。所有前置步骤在几个月内压缩完成。

Kimi一个月内ARR从1亿美元涨到2亿美元,投资人主动向媒体披露这个数字,这在一级市场极其罕见。通常只有在准备下一轮融资或者冲刺上市时,公司才会允许核心财务指标外流。

这种急于“自证清白”的动作,说明一级市场已经不再相信单纯的想象力,它们要看流水,看退出的确定性。(延伸阅读:Kimi不缺钱,缺的是DeepSeek)

DeepSeek此前从未接受外部融资。现在国家队入场。

三家做的事看起来不一样,底层逻辑完全一致:锁定身份,锁定估值,锁定退出通道。趁窗口还在。

三、越来越贵,越来越不值钱

为什么偏偏是现在?为什么不能再等?

原因在于大模型行业的经济模型,正在暴露一个越来越致命的矛盾。

成本端,GPU集群、推理算力、长上下文、多模态、Agent,每一项新能力都在吞噬现金。

但真正可怕的其实不是训练。是推理。

训练是一笔一次性投入。推理成本则跟用户规模同步增长。每一个Token、每一次调用、每一次Agent任务,背后都对应真实GPU消耗。

移动互联网时代,用户越多,平台越赚钱。AI时代,用户越多,模型公司可能先变穷。

微信多一个用户,腾讯边际成本几乎不变。抖音多一个用户,字节多一个广告位。豆包多一个高频用户,背后对应的是持续增加的推理开支。(延伸阅读:用户越多,字节越穷)

大模型公司天然需要持续融资能力。而一级市场的钱,不可能无限供给。

之所以上市突然变得无比重要,它不只是退出,更关键的是,拿到一个可以长期输血的公开资本通道。

这是今天所有独立模型公司真正焦虑的地方。

收入端则更残酷。

DeepSeek把价格战真正带进了大模型行业。高能力、开源、极低价格,三件事第一次同时成立。

这对整个行业是一次毁灭性冲击。API市场的利润空间被直接压缩。

整个行业突然发现,模型能力也许不是最稀缺的东西。真正稀缺的,是持续烧钱的能力、长期亏损的能力、承受价格战的能力。

而这些能力,创业公司天然比不过巨头。

巨头可怕的地方,不在模型。在于它们拥有创业公司永远没有的交叉补贴能力。字节可以长期免费做豆包,因为广告业务源源不断输血,最近豆包计划收费,也是扛不住消耗,足见烧钱有多疯狂。

腾讯则可以低价推元宝,因为游戏和社交仍然赚钱。创业公司的模型,必须学会自己养活自己。

巨头拼的是生态。创业公司拼的是生存。

还有一个变化,很多人还没意识到。

2023年的时候,资本投大模型,本质上是在买“可能性”。

因为所有人都相信,只要做出下一个GPT-4,就可能重新定义互联网。所以那个阶段,融资看的还是创始人背景、技术团队、模型能力以及想象空间。

但今天,资本开始看另一套东西。

它开始问,你有没有现金流,有没有终端入口,有没有生态绑定,能不能活过下一轮价格战?

这意味着,大模型行业的融资逻辑已经从风险投资,开始变成基础设施投资。

风险投资相信未来。基础设施投资只相信存活率。

一旦行业进入基础设施阶段,资本会天然向头部集中。因为基础设施行业,从来不需要太多玩家。

四、四小龙的既视感

这个剧本不是第一次上演。

2018年前后,AI视觉赛道的"四小龙"商汤、旷视、云从、依图,经历过几乎一模一样的剧情:疯狂融资、估值狂飙、每一轮都创纪录。所有人都相信AI时代到了。

后来发生了什么?

腾讯、阿里、华为全面进场。AI视觉被做成云服务里的标准功能。独立公司的技术溢价瞬间蒸发,商业化跑不出规模,最后只能在上市后经历长期的破发与沉寂。

今天的大模型赛道正在进入同一个阶段。区别在于,这一轮赌注更大,烧钱速度更快,巨头碾压更直接。字节一年在AI上的投入,可能超过整个"六小虎"的融资总和。

全球的钱也在讲同一个故事。2025 年第三季度,全球 AI 初创公司整体融资规模达 970 亿美元,其中近 46%、约 446 亿美元资金,集中流向 Anthropic、xAI 等不超过五家头部基础模型企业。

进入 2026 年,头部模型公司融资进一步提速、量级再上台阶:

OpenAI 在 3 月完成一轮 1220 亿美元融资,投后估值 8520 亿美元;Anthropic 则在 2 月完成 300 亿美元 G 轮融资,估值 3800 亿美元,紧接着又启动新一轮约 500 亿美元的 IPO 前融资,目标估值直指 9000 亿美元。

资本正在以前所未有的力度向最头部集中,中间层公司正在经历最漫长的流动性寒冬。

这个趋势在中国同样成立。2025年全年,大模型融资占AI总投资比重从51%跌到14%,但头部三家拿走了其中绝大部分。钱没有消失,只是不再雨露均沾。

而且淘汰速度远比上一代更快。移动互联网从百团大战走到AT垄断,用了接近十年。大模型行业从百模大战走到清场,可能只需要三年。

一年前,百川智能还是最像中国OpenAI的公司之一。王小川几乎出现在每一场大模型讨论里。今天,它已经很少出现在融资新闻的中心。零一万物曾是明星创业团队,李开复高调宣布"All in AI"。但行业已经越来越少讨论它还能不能进入下一轮。

大模型行业淘汰公司,不需要它技术落后。只需要资本窗口先关闭。

五、三条路,三种赌注

今天的大模型创业公司,已经分化成三条完全不同的路线。

DeepSeek选择做国家级技术资产。

450亿美元估值,并不完全来自商业化,而来自技术壁垒的战略意义,算法效率上的领先让它成为一种国家级储备。国家大基金入场,说明它的定位已经超越商业竞争范畴。它的风险在别处,组织结构脆弱,核心研究员已有数人流失。

阶跃星辰选择绑定硬件产业链。华勤、龙旗、豪威、中兴,消费电子产业链核心玩家集体入股。

阶跃星辰董事长印奇的逻辑很清楚,基础模型能力最终会被拉平,真正的护城河在于谁能把模型嵌入终端供应链,让对手无法在不替换整条链的情况下替换你。截至2025年底,4200万台手机预装、覆盖60%头部品牌,这些数字重要的地方不在规模,在嵌入深度。

Kimi选择了用户规模和速度。ARR一个月从1亿美元涨到2亿美元,付费订阅和API同步增长。但它的问题也最尖锐,月活从峰值3600万降到833万,字节豆包3.5亿月活形成绝对压制,B端API价格又被DeepSeek打穿。

Kimi的产品依然优秀。但产品优秀这件事,已经不再够用。

三家路线完全不同,但有一个共同点:没有任何一家还在讲要做中国最好的模型。所有人都开始讲自己卡住了什么位置。

六、融资的终点,不是扩张

为什么三天之内,70亿美元同时涌入?

表面看是行业热。但真正行业最热的时候,融资反而应该从容,公司会慢慢挑投资人,拉长周期,等待更高估值。

现在的关键词只有一个:抢。

阶跃抢着上市。Kimi抢着做收入证明。DeepSeek抢着完成身份确认。

它们抢的不是钱。钱只是工具。它们真正抢的是独立生存的最后窗口。

大模型行业最终可能不会留下太多独立玩家。基础设施行业从来如此,云计算最后归属几家巨头,通信网络最终只剩三家运营商,电力系统高度集中。

当模型能力被商品化、API价格趋近于零、巨头用免费策略收割用户,独立模型公司要么上市获得持续融资能力,要么被整合进某个生态,要么消失。

上市是拿到一张身份证。国家队背书也是另一种身份证。身份证不保证你能赢。但没有身份证,你连下一轮都进不去。

而那些没出现在这周新闻里的名字,沉默本身已经是答案。

【版面之外】的话:

2023年,国产大模型赛道最常被问的问题是:谁能做出来?

2026年,这个问题变成了:谁能活下来?

从做出来到活下来,中间只隔了三年。但这三年,足够让一个行业从春天直接跳到秋天。

本文来自微信公众号“版面之外”,作者:画画

Related Questions

Q根据文章,2026年大模型行业的融资出现了什么新特点?

A融资高度集中,大量资金在短时间内涌向少数头部公司(如Kimi、阶跃星辰、DeepSeek),而非“雨露均沾”,这标志着行业进入“清场前夜”,资本正在“抢购未来生存配额”。

Q文章提到大模型行业正面临什么根本性的经济矛盾?

A面临“越来越贵,越来越不值钱”的矛盾。成本端,尤其是用户增长带来的推理成本持续吞噬现金;收入端,因DeepSeek等带来的价格战导致API利润空间被严重压缩。创业公司缺乏巨头那样的生态和交叉补贴能力,生存压力巨大。

Q目前头部的大模型公司(如DeepSeek、阶跃星辰、Kimi)的战略重心发生了怎样的转变?

A战略重心已从比拼“模型能力”转向抢占“生态位置”和“生存窗口”。它们不再只讲要做最好的模型,而是强调各自卡位:DeepSeek寻求成为国家级技术资产,阶跃星辰绑定硬件产业链,Kimi则追求用户规模和增长速度。

Q文章将当前大模型行业与过去的哪个行业阶段进行了类比?其核心相似点是什么?

A与2018年前后的AI视觉“四小龙”(商汤、旷视等)阶段进行了类比。核心相似点在于:都经历了疯狂融资和估值狂飙,但随后巨头(如腾讯、阿里、字节)全面进场,将技术做成基础设施或标配服务,导致独立创业公司的技术溢价消失,面临巨大的商业化与生存压力。

Q为什么文章认为“上市”对当前的大模型公司至关重要?

A上市不仅是投资人的退出通道,更是公司获得“持续输血”的公开资本通道。在模型商品化、价格战激烈、需要长期巨额投入的背景下,拥有上市公司的融资能力,是独立模型公司维持运营、参与竞争甚至生存下去的“身份证”。

Related Reads

Uncovering the Truth About Agent Commerce, Payments, and Infrastructure

Decoding Agent Commerce, Payments, and Infrastructure: The Reality Over the past year, I've been building infrastructure for the Agent economy, engaging with major players like Stripe, Visa, Coinbase, Google, and dozens of startups. A clear conclusion emerges: true, large-scale demand does not yet exist. Startups face structural challenges. Data points illustrate this gap. Stripe's Agent commerce platform has over 1,000 merchants but only single-digit transacting agents. Visa's Agent payment token requires 9-month KYC and a $250M revenue threshold, accessible only to giants like Amazon. On-chain analysis reveals actual daily Agent transaction volume is around $17k, half of which are test transactions. The article analyzes four potential markets: **1. Agent-to-Merchant (A2M):** Current AI shopping UX is often inferior to traditional e-commerce for visual, comparison-heavy purchases (clothing, electronics). Chat interfaces are a step back. Real merchant interest is defensive "Agent Engine Optimization," fearing future obsolescence, not current demand. Potential exists in high-frequency, low-decision purchases (e.g., food delivery) or simplifying terrible UX (complex checkouts, non-native shoppers), but these require massive consumer distribution channels dominated by giants like DoorDash and Amazon. **2. Agent-to-API (A2A):** Developers already have subscriptions and billing for core APIs (compute, data). The argument for micro-payments via crypto for sub-dollar API calls is addressed by pre-paid balances today. The deeper issue is supplier resistance; major SaaS firms rely on enterprise contracts, not fractional cent pricing. Opportunity lies in the long tail of niche services, but this is a smaller market catering to developers, a historically low-paying group. **3. Agent-to-Agent (A2A):** This remains a theoretical long-term vision with near-zero current transaction volume. It involves unique challenges: discovery, trust, negotiation, dispute resolution. When it materializes, it will require a fundamentally new settlement infrastructure for high-speed, variable-value, multi-party transactions. It's a real long-term bet, but not the current market. **4. Agent-to-Finance (A2F):** This is the only category with existing, paying demand. Integrating AI into financial workflows (trading, portfolio management) is a natural evolution and enables new capabilities like autonomous rebalancing. However, competition favors incumbents with regulatory licenses, compliance infrastructure, and existing client relationships. **The Real Issue:** Why is infrastructure still being built? Incumbents can afford long-term bets, and payment companies see every problem as a nail for their payment hammer. However, payment is just one piece. The core challenge is *coordination*—orchestrating work between Agents and humans, verifying outcomes, and settling results. Payment is part of settlement, which is part of coordination. Companies that solve the coordination problem will subsume payments, not the other way around. Startups lack the infinite runway of giants and must find today's real market, which, after a year of exploration, lies outside these four categories—in an area with real, growing, and underserved activity.

marsbit3h ago

Uncovering the Truth About Agent Commerce, Payments, and Infrastructure

marsbit3h ago

Trading

Spot
Futures

Hot Articles

Discussions

Welcome to the HTX Community. Here, you can stay informed about the latest platform developments and gain access to professional market insights. Users' opinions on the price of AI (AI) are presented below.

活动图片