AI 的下一场地震:为什么真正的危险不是 SaaS 杀手,而是算力革命?

marsbit发布于2026-02-11更新于2026-02-11

文章摘要

最近,科技圈和投资界普遍关注AI应用对传统SaaS的冲击,例如AnthropicAI的Claude Cowork展示了高效处理邮件、PPT和表格的能力,引发“软件已死”的讨论。但真正的地震并非在此,而是隐藏于AI算力基础的“寂静革命”,这可能动摇英伟达的GPU霸权。 这场革命由两条技术路线交汇推动:一是算法的瘦身革命,例如DeepSeek的MoE(混合专家模型)架构,仅激活部分参数(如DeepSeek-V2每次只动用9%的专家),就能达到与GPT-4媲美的效果,大幅降低算力需求,使AI能力与算力脱钩。二是硬件的换道革命,专用推理芯片(如Cerebras、Groq)将内存集成在芯片上,实现“零延迟”访问,提升推理速度。OpenAI已与Cerebras签署100亿美元订单,英伟达也以200亿美元收购Groq以应对竞争。 当算法瘦身与硬件优化结合时,将导致成本雪崩:训练成本因MoE下降90%,推理成本因专用硬件再降一个数量级,总成本可能仅为传统GPU方案的10%-15%。这不仅是改良,更是范式转移。 英伟达的市值建立在“AI依赖GPU”的故事上,但算力革命正动摇其根基。训练市场可能因效率提升而缩水,推理市场面临多方竞争,甚至最大客户OpenAI也在转向。一旦市场意识到英伟达并非唯一选择,其高估值可能面临重估。未来黑天鹅或来自MoE算法或专用芯片的进展,宣告算力战争新阶段,终结“卖铲人”的黄金时代。

撰文:Bruce

最近,整个科技圈和投资界都紧盯着同一件事:AI 应用正在如何「杀死」传统的 SaaS。自从 @AnthropicAI 的 Claude Cowork 展示了它能如何轻松地帮你写邮件、做 PPT、分析 Excel 表格后,一场关于「软件已死」的恐慌就开始蔓延。这确实很吓人,但如果你的目光只停留在这里,那你可能错过了真正的大地震。

这就像我们所有人都抬头看着天上的无人机空战,却没人注意到,我们脚下的整片大陆板块正在悄然移动。真正的风暴,藏在水面之下,一个大多数人看不见的角落:支撑整个 AI 世界的算力根基,正在发生一场「寂静的革命」。

而这场革命,可能让 AI 的卖铲人:英伟达 @nvidia,精心举办的这场盛大派对,比所有人想象的都更早结束。

两条正在交汇的革命之路

这场革命并非单一事件,而是由两条看似独立的技术路线交织而成。它们像两支正在合围的军队,对英伟达的 GPU 霸权形成了钳形攻势。

第一条路,是算法的瘦身革命。

你有没有想过,一个超级大脑在思考问题时,真的需要调动所有脑细胞吗?显然不需要。DeepSeek 就想明白了这件事,他们搞出 MoE(混合专家模型)的架构。

你可以把它想象成一个公司,里面养了几百个不同领域的专家。但每次开会解决问题时,你只需要请最相关的两三个人,而不是让所有人一起头脑风暴。这就是 MoE 的聪明之处:它让一个庞大的模型,在每次计算时只激活一小部分「专家」,从而极大地节省了算力。

结果会如何呢?DeepSeek-V2 模型,名义上有 2360 亿「专家」(参数),但每次干活,只需要激活其中的 210 亿,连总数的 9% 都不到。而它的表现,却能和那个需要 100% 全力运转的 GPT-4 相媲美。这意味着什么?AI 的能力,和它消耗的算力,脱钩了!

过去,我们都默认 AI 越强,烧的卡越多。现在,DeepSeek 告诉我们,通过聪明的算法,可以用十分之一的成本,达到同样的效果。这就等于直接把英伟达 GPU 的刚需属性,打上了一个巨大的问号。

第二条路,是硬件的「换道」革命。

AI 干活分为训练和推理两个阶段。训练就像上学,需要读万卷书,这时候 GPU 这种「大力出奇迹」的并行计算卡确实好用。但推理就像我们日常使用 AI,更看重反应速度。

GPU 在推理时有个天生缺陷:它的内存(HBM)是外挂的,数据一来一回有延迟。这就像一个厨师,食材都放在隔壁房间的冰箱里,每次炒菜都得跑过去拿,再快也快不到哪去。而 Cerebras、Groq 这些公司就另起炉灶,设计了专用的推理芯片,把内存(SRAM)直接焊在芯片上,食材就放在手边,实现了「零延迟」访问。

市场已经用真金白银投票了。OpenAI 一边抱怨英伟达的 GPU 推理不行,一边扭头就和 Cerebras 签了个 100 亿美元的大单,专门租用他们的推理服务。英伟达自己也慌了,反手就花了 200 亿美元把 Groq 给收了,为的就是不在这条新赛道上掉队。

当两条路交汇:成本雪崩

好了,现在我们把这两件事放在一起:用一个算法上「瘦过身」的 DeepSeek 模型,跑在一个硬件上「零延迟」的 Cerebras 芯片上。

会发生什么?

一场成本的雪崩。

首先,瘦身后的模型很小,可以一次性全部装进芯片自带的内存里。其次,没有了外部内存的瓶颈,AI 的反应速度会快得惊人。最终的结果是:训练成本因 MoE 架构下降了 90%,推理成本因专用硬件和稀疏计算再下降一个数量级。算下来,拥有和运行一个世界级 AI 的总成本,可能只有传统 GPU 方案的 10%-15%。

这不是改良,这是范式转移。

英伟达的王座,正在被悄悄抽掉地毯

现在你应该明白,为什么这比「Cowork 恐慌」更致命了。

英伟达今天几万亿的市值,建立在一个简单的故事上:AI 是未来,而 AI 的未来必须靠我的 GPU。但现在,这个故事的根基正在被动摇。

在训练市场,就算英伟达继续垄断,但如果客户用十分之一的卡就能干活,那这个市场的总体规模也可能大幅缩水。

在推理市场,这个比训练大十倍的蛋糕上,英伟达不仅没有绝对优势,还面临着 Google、Cerebras 等各路神仙的围剿。连它最大的客户 OpenAI 都在叛逃。

一旦华尔街意识到,英伟达的「铲子」不再是唯一的、甚至是最好的选择时,建立在「永久垄断」预期上的估值,会发生什么?我想大家都很清楚。

所以,未来半年最大的黑天鹅,可能不是哪个 AI 应用又干掉了谁,而是一则看似不起眼的技术新闻:比如一篇关于 MoE 算法效率的新论文,或者一份显示专用推理芯片市场份额大增的报告,悄悄宣告了算力战争进入新阶段。

当「卖铲人」的铲子不再是唯一选择时,属于他的黄金时代,可能也就结束了。

相关问答

Q文章认为AI领域真正的危险是什么?

A文章认为真正的危险不是SaaS应用取代传统软件,而是支撑AI世界的算力根基正在发生革命性变化,这将动摇英伟达等硬件巨头的垄断地位。

QDeepSeek的MoE架构如何实现算力节省?

AMoE架构将庞大模型分为多个专家模块,每次计算只激活最相关的少数专家(如DeepSeek-V2仅激活9%的参数),而非全部模型参与运算,从而大幅降低算力消耗。

Q专用推理芯片相比GPU的优势是什么?

A专用推理芯片(如Cerebras、Groq)将内存直接集成在芯片上,消除数据访问延迟,实现"零延迟"推理,而GPU的外挂内存结构会导致数据传输瓶颈。

Q算法瘦身和硬件换道结合会产生什么效果?

A结合MoE算法的稀疏计算和专用推理硬件的低延迟特性,可使AI训练成本下降90%,推理成本再降一个数量级,总成本仅为传统GPU方案的10%-15%。

Q为什么算力革命可能威胁英伟达的市场地位?

A英伟达的估值建立在AI依赖其GPU的预期上,但算法效率提升和专用硬件崛起可能导致GPU需求缩水,同时推理市场被多方分食,其垄断地位和估值基础将受冲击。

你可能也喜欢

揭秘“白毛股神”Serenity:焦虑散户的精神良药

近日,一位网名为“Serenity”的匿名投资者在国内外散户社区引发广泛关注,被称为“白毛股神”。他通过X平台分享投资观点,其提及的股票常出现股价剧烈波动。 Serenity的投资策略主要围绕“瓶颈点投资法”,聚焦AI产业链中具有垄断优势的中小型公司。他声称今年个人投资回报率超过3612%,并在国际散户社区积累了巨大影响力,X平台订阅人数甚至超过马斯克。 5月底,他首次提及关注中国股票。6月5日至9日期间,他先后点名A股公司绿的谐波、易事特和中际旭创。其中,绿的谐波和易事特在其发文后股价迅速涨停,短期内涨幅均超30%,显示其观点对A股市场产生了显著扰动。一次因AI翻译错误导致另一家公司“英诺激光”被误拉涨停,也侧面反映了部分散户盲目跟风的FOMO情绪。 面对“跨境吹票”、“割韭菜”的质疑,Serenity回应称分享A股观点是为了提供“不同视角”,并自称不持有相关股票,行为初衷是“为了好玩”。他强调自己不做付费推广,仅通过每月1美元的订阅服务获得收入。其粉丝与订阅数在近期大幅增长,影响力与商业收益也随之扩大。 关于其身份,社区根据其发帖时间、语言使用及透露的生活片段推测,他极有可能是一位居住在日本、精通英语、会一些中文的华人或国际人士。他自称曾拒绝英伟达的Offer,并保持匿名为避免现实骚扰。 文章指出,Serenity的现象是当前AI牛市情绪的一个投射。市场在狂热时乐于塑造“股神”以满足解释泡沫和寻求指引的心理,但其匿名性、收益不透明及对影响力的追求也引发争议。历史表明,神坛与断头台往往只有一步之遥,当市场转向时,今日的“偶像”也可能成为明日归咎的对象。

Odaily星球日报4分钟前

揭秘“白毛股神”Serenity:焦虑散户的精神良药

Odaily星球日报4分钟前

揭秘“白毛股神”Serenity:焦虑散户的精神良药

近期,一位名为“白毛股神”Serenity的匿名投资者在A股市场引发广泛关注。其通过海外社交平台X发表对个别A股公司的看法,竟能迅速带动股价大幅波动。 Serenity在国际散户社区已有很高知名度,自称采用“瓶颈点投资法”聚焦AI产业链上的小型垄断企业,声称其今年投资回报率超3600%。6月初,他先后提及A股公司绿的谐波、易事特和中际旭创,前两者股价应声涨停,短期涨幅显著。他甚至发帖表示,对易事特的暴涨感到意外,并澄清相关名单为粉丝众包成果,非其个人推荐。 Serenity的行为引发国内媒体和券商对其“跨境吹票”、可能误导散户的质疑。他回应称,分享目的是提供不同视角,并声称虽看好相关公司但并未持股,一切“只是为了好玩”。他强调自己不进行付费推广,仅通过低价订阅服务获取收入。其账号订阅数已超过马斯克,影响力巨大。 关于其身份,社区根据其发帖时间、透露的生活信息(如在日本居住、学习日语、会中文等)推测,他极有可能是一位居住在日本的华人。但其本人强调英语是母语,且早期经历多与海外社区关联。Serenity保持匿名,自称是为避免因发表观点而遭受骚扰。 文章指出,Serenity的现象或许是本轮AI牛市情绪的投射,其神秘、专业的形象满足了部分投资者寻找“股神”的心理。但市场历来“造神”亦“毁神”,当行情转向时,这样的焦点人物也可能成为众矢之的。

marsbit5分钟前

揭秘“白毛股神”Serenity:焦虑散户的精神良药

marsbit5分钟前

韩国年轻人,在史诗级牛市里“最后一搏”

2026年上半年,一场由芯片产业驱动的史诗级牛市席卷韩国,KOSPI指数半年内翻倍,三星电子和SK海力士成为行情核心,彻底改变了许多普通韩国人的生活。韩国总人口仅五千多万,证券账户却突破1.05亿个,全民炒股热潮空前高涨,借钱炒股规模屡创新高,风险加剧。 文章以在韩中国人李雨宁的视角,通过几位普通韩国股民的故事,揭示了牛市背后的社会焦虑。29岁的广告公司职员民智,因微薄工资和对未来的不安而入场,将股市视为突破阶层固化的“最后机会”。33岁的俊浩为筹备婚礼和购房资金所困,在牛市中感到靠工资攒钱的速度远落后于资产增值。家庭主妇恩珠则在妈妈群的比较中,感受到因股市收益拉开的子女教育资源差距。 一些早有经验的投资者,如秀久,在牛市中获得丰厚回报,甚至帮助家人管理资产,但其财富波动也映射出人际圈层与话语权的变化。牛市制造了财富幻觉,有人辞职专职炒股,但更多人的所谓“收益”早已被住房、教育、养老等现实开支所预支。牛市也并非人人平等,它放大了原有的阶层差异。当市场波动来临时,承受能力最弱的普通人可能面临沉重打击。 这场牛市如同一面镜子,照出了韩国年轻人深层的生存焦虑与阶层困境。在正常的上升通道日益狭窄的背景下,股市成为一扇危险却诱人的“窄门”。年轻人涌入其中,并非全然出于贪婪,更是害怕被时代抛下的恐惧。然而,热潮终会退去,市场安静后,年轻人仍需面对由房价、工作、债务等构成的现实压力表,以及一个财富分化日益严重的社会。

marsbit32分钟前

韩国年轻人,在史诗级牛市里“最后一搏”

marsbit32分钟前

交易

现货
合约

热门文章

加密市场宏观研报:原油飓风、AI巨浪与比特币的十字路口

全球金融市场正经历一场由地缘冲突引发的系统性重估:霍尔木兹海峡封锁导致原油一度暴涨30%,G7紧急释放储备后涨幅收窄,滞胀风险取代通胀成为核心担忧,美元成为“唯一避风港”并逼近100大关,亚太及美股遭遇“黑色星期一”全线重挫;AI领域则冰火两重天,国家发改委提出“十五五”末10万亿规模目标,OpenClaw项目火爆推动概念股狂飙;比特币在宏观风暴中跌破70000美元关键防线。

560人学过发布于 2026.03.12更新于 2026.03.12

加密市场宏观研报:原油飓风、AI巨浪与比特币的十字路口

相关讨论

欢迎来到HTX社区。在这里,您可以了解最新的平台发展动态并获得专业的市场意见。以下是用户对AI(AI)币价的意见。

活动图片