AI的成本困局:基础设施经济学将如何重塑市场下一阶段

marsbit發佈於 2026-03-26更新於 2026-03-26

文章摘要

AI的快速发展背后隐藏着基础设施经济模式的脆弱性。训练前沿大模型的成本高达数千万甚至近10亿美元,而持续的推理成本更是创业公司的沉重负担。目前,全球三分之二的算力由AWS、Azure和Google Cloud三家云巨头掌控,市场高度集中。头部公司通过战略合作以低价获取算力,而中小企业则面临高达600%的溢价,形成结构性不平等。 此外,AI的能源消耗占全球电力1-1.5%,且持续增长,算力成本也与能源地缘政治紧密相关。为应对中心化模式的高成本和供应刚性,去中心化算力网络(如Gonka)正在兴起,通过利用闲置GPU资源,显著降低推理成本(可达千倍差距),并提供弹性供应和数据主权保障。 未来AI竞争的关键不再是模型能力,而是基础设施的经济性。中心化与去中心化两种模式将长期并存、相互竞争,共同重塑AI产业的价值分配和可持续性。

来源:International Business Times UK

原文作者:Anastasia Matveeva |

编译整理:Gonka.ai

AI正在以惊人的速度扩张,但其底层经济逻辑远比表面看起来更加脆弱。当三家云巨头掌控全球三分之二的算力,当训练成本奔向10亿美元,当推理账单让创业公司猝不及防——这场算力军备竞赛的真正代价,正在悄然重塑整个AI产业的价值分配。

本文并非讨论谁将构建出最先进的模型。它探讨的是一个更根本的问题:当前AI基础设施的经济模式,在规模化之后是否真正可持续?算力分配机制的变革,又将如何重塑整个市场的价值分布?

一、幕后的智能成本

训练一个前沿大模型,动辄需要数千万乃至数亿美元。Anthropic曾公开表示,训练Claude 3.5 Sonnet的成本为「数千万美元」,而其CEO达里奥·阿莫迪(Dario Amodei)此前预计,下一代模型的训练成本或将逼近10亿美元。据行业媒体报道,GPT-4的训练成本可能已超过1亿美元。

然而,训练成本只是冰山一角。真正在结构层面持续施压的,是推理成本——也就是每一次模型被调用时产生的费用。按照OpenAI公开的API定价,推理按百万Token计费。对于高使用量的应用而言,这意味着即便在规模化之前,每日推理成本就可能已达数千美元。

AI常被描述为一种软件。但它的经济本质,越来越像一种资本密集型基础设施——既有高额的前期投入,又有持续不断的运营支出。

这种经济结构的转变,正在悄然改变整个AI产业的竞争格局。能够负担得起算力的,是那些已经建立起大规模基础设施的巨头;而那些试图在夹缝中生存的初创公司,正在被推理账单一点一点地蚕食。

二、资本强度与市场集中

根据Holori 2026年云市场分析,AWS目前占全球云市场约33%的份额,微软Azure约22%,谷歌云约11%。三家合计掌控全球云基础设施约三分之二的份额,而全球绝大多数AI工作负载,正是运行在这三家公司的基础设施之上。

这种集中度的现实意义是:当OpenAI的API出现宕机,数以千计的产品同时受影响;当某家主要云服务商遭遇故障,跨行业、跨地域的服务随之中断。

集中度并没有在收窄,基础设施支出反而在持续扩张。以英伟达为例,其数据中心业务年化营收已突破800亿美元,显示高性能GPU需求持续旺盛。

更值得关注的是一个隐性的结构性不平等。根据SEC文件和市场报告,OpenAI、Anthropic等头部实验室通过多十亿美元的「股权换算力」协议,以最低每小时1.30–1.90美元的近成本价锁定GPU资源。而那些缺乏与英伟达、微软、亚马逊战略合作关系的中小公司,则被迫以超过每小时14美元的零售价采购——溢价高达600%。

这个定价鸿沟,正是由英伟达近期向头部实验室合计400亿美元的战略投资所驱动的。AI基础设施的获取权,越来越多地由资本密集型采购协议决定,而非开放的市场竞争。

在早期采用阶段,这种集中可以看起来「有效率」。但在规模化之后,它带来的是定价风险、供应瓶颈与基础设施依赖——三重脆弱性叠加。

三、被忽视的能源维度

AI基础设施的成本问题,还有一个常被忽视的维度:能源。

根据国际能源署(IEA)的数据,数据中心目前约占全球电力消耗的1–1.5%,而AI驱动的需求增长可能在未来几年显著推高这一比例。

这意味着,算力经济学不仅是一个财务问题,更是一个基础设施与能源挑战。随着AI工作负载的持续扩张,电力供给的地缘政治意义将日益凸显——哪个国家能以最低能源成本提供最稳定的算力,将在AI时代的产业竞争中占据结构性优势。

当黄仁勋在GTC26宣布英伟达订单可见性突破1万亿美元时,他描述的不只是一家公司的商业成功,而是整个文明正在将电力、土地和稀缺矿产转化为智能算力的宏大进程。

四、重新思考基础设施机制

在中心化数据中心持续扩张的同时,另一类探索正在悄然兴起——试图从根本上重新定义算力资源的协调方式。

去中心化推理:一种结构性替代

Gonka协议是这一方向上的代表性实践。这是一个专为AI推理设计的去中心化网络,其核心设计目标是:将网络同步和共识开销压缩到最低,把尽可能多的计算资源导向真实的AI工作负载。

在治理层面,Gonka采用「一算力单元一票」的原则——治理权重由可验证的算力贡献决定,而非资本持股比例。在技术层面,协议采用短周期性能测量区间(称为Sprint),要求参与者通过基于Transformer的工作量证明(PoW)机制实时展示真实的GPU算力。

这一设计的意义在于:近100%的网络算力被导向AI推理工作负载本身,而不是消耗在维持共识、协调通信等基础设施开销上。

分布式算力的经济逻辑

从经济学角度看,去中心化算力网络的价值主张有三个层次。

第一是成本层。中心化云服务商的定价结构,本质上包含了巨额固定资产折旧、数据中心运营成本和股东利润预期。去中心化网络通过将闲置GPU资源货币化,可以将这部分成本显著压缩。以Gonka为例,当前通过其USD计费网关GonkaGate提供的推理服务,定价约为每百万Token 0.0009美元——而Together AI等中心化服务商对同类模型(如DeepSeek-R1)的定价约为1.50美元,差距达千倍以上。

第二是供应弹性层。中心化服务商的算力供给是刚性的,扩容周期以月乃至季度计算。去中心化网络的参与者可以随需求波动弹性加入或退出,理论上能更快速响应需求峰值——正如亚马逊云服务当年因节假日流量峰值需求而诞生一样,AI推理的峰谷波动同样需要弹性基础设施来承接。

第三是主权层。这一维度在主权国家的视角下尤为突出。当一国政府的公共服务深度依赖某家外部云服务商时,算力依赖即是战略脆弱性。去中心化网络提供了一种可能:本地数据中心可以作为节点接入全球分布式网络,在保障数据主权的同时,通过向全球市场提供算力来获得可持续的商业回报。

五、价值分配的重构时刻

回到文章开头的核心问题:当前AI基础设施的经济模式,在规模化之后是否可持续?

答案是:对于头部玩家,可持续;对于其余所有人,越来越不可持续。

AWS、Azure、Google Cloud通过数十年的资本积累建立起护城河,其规模优势在短期内几乎无法撼动。但这种结构性优势同时意味着:定价权、数据访问权和基础设施依赖,都高度集中于少数几个私人实体手中。

历史上,每一次重大技术基础设施的垄断,最终都催生出了替代性的分布式架构——互联网本身就是对电信垄断的反叛,BitTorrent是对内容分发中心化的颠覆,比特币是对货币发行集中化的挑战。

AI基础设施的去中心化,可能不是一种意识形态选择,而是一种经济必然——当集中化的成本高到足以驱动大规模用户迁移时,替代方案的需求就会真实爆发。黄仁勋用「每一次金融危机都将更多人推向比特币」来类比这一逻辑,同样适用于算力市场。

DeepSeek的横空出世已经证明了一件事:在开源模型的能力逼近闭源前沿的世界里,推理成本将成为决定AI应用规模化速度的核心变量。谁能提供最低成本、最高可用性的推理算力,谁就掌握了这场竞争的入场券。

结语:基础设施战争才刚刚开始

AI的下一阶段竞争,不会在模型能力的排行榜上分出胜负,而会在基础设施的经济博弈中见真章。

集中化的算力巨头手握资本和规模优势,但也背负着固定成本结构和定价压力。去中心化网络正在以极低的边际成本切入市场,但需要证明自己在稳定性、易用性和生态规模上能够达到真实的商业门槛。

两种路径将长期并存,并相互施压。中心化和去中心化之间的张力,将是未来五年AI产业最值得持续追踪的结构性主题之一。

这场基础设施战争,才刚刚开始。

相關問答

QAI基础设施的经济模式在规模化后是否可持续?为什么?

A对于头部玩家(如AWS、Azure、Google Cloud等云巨头)而言,由于其数十年的资本积累和规模优势,这种经济模式是可持续的;但对于中小公司和初创企业而言,由于高昂的推理成本、算力获取的不平等以及基础设施依赖,这种模式越来越不可持续。

Q当前AI算力市场的主要集中度如何?这带来了哪些风险?

A根据Holori 2026年云市场分析,AWS、Azure和谷歌云三家云巨头合计掌控全球云基础设施约三分之二的份额。这种集中度带来了三重风险:定价风险(如中小公司被迫支付高达600%的溢价)、供应瓶颈(如主要云服务商故障导致跨行业服务中断)以及基础设施依赖(如OpenAI API宕机影响数千产品)。

Q去中心化推理网络(如Gonka协议)的核心设计目标是什么?它有哪些经济优势?

AGonka协议的核心设计目标是将网络同步和共识开销压缩到最低,使尽可能多的计算资源导向真实的AI工作负载。其经济优势包括:成本层(通过闲置GPU资源货币化显著压缩成本,定价可低至中心化服务的千分之一)、供应弹性层(算力供给可随需求波动弹性调整)以及主权层(保障数据主权的同时通过全球市场获得商业回报)。

QAI推理成本与训练成本相比,为何对创业公司更具挑战性?

A训练成本是一次性高额投入(如数千万至数亿美元),而推理成本是持续不断的运营支出,按每次模型调用计费。对于高使用量的应用,每日推理成本可能达数千美元,这种持续支出会逐渐消耗创业公司的资金,使其在规模化之前就面临财务压力。

Q能源消耗在AI基础设施经济学中扮演什么角色?

A能源消耗是AI基础设施常被忽视但关键的成本维度。数据中心目前占全球电力消耗的1-1.5%,AI需求增长将推高这一比例。这意味着算力经济学不仅是财务问题,更是基础设施与能源挑战:能以最低能源成本提供稳定算力的国家将在AI产业竞争中占据结构性优势,能源供给的地缘政治意义日益凸显。

你可能也喜歡

交易

現貨
合約

熱門文章

什麼是 $S$

理解 SPERO:全面概述 SPERO 簡介 隨著創新領域的不斷演變,web3 技術和加密貨幣項目的出現在塑造數字未來中扮演著關鍵角色。在這個動態領域中,SPERO(標記為 SPERO,$$s$)是一個引起關注的項目。本文旨在收集並呈現有關 SPERO 的詳細信息,以幫助愛好者和投資者理解其基礎、目標和在 web3 和加密領域內的創新。 SPERO,$$s$ 是什麼? SPERO,$$s$ 是加密空間中的一個獨特項目,旨在利用去中心化和區塊鏈技術的原則,創建一個促進參與、實用性和金融包容性的生態系統。該項目旨在以新的方式促進點對點互動,為用戶提供創新的金融解決方案和服務。 SPERO,$$s$ 的核心目標是通過提供增強用戶體驗的工具和平台來賦能個人。這包括使交易方式更加靈活、促進社區驅動的倡議,以及通過去中心化應用程序(dApps)創造金融機會的途徑。SPERO,$$s$ 的基本願景圍繞包容性展開,旨在彌合傳統金融中的差距,同時利用區塊鏈技術的優勢。 誰是 SPERO,$$s$ 的創建者? SPERO,$$s$ 的創建者身份仍然有些模糊,因為公開可用的資源對其創始人提供的詳細背景信息有限。這種缺乏透明度可能源於該項目對去中心化的承諾——這是一種許多 web3 項目所共享的精神,優先考慮集體貢獻而非個人認可。 通過將討論重心放在社區及其共同目標上,SPERO,$$s$ 體現了賦能的本質,而不特別突出某些個體。因此,理解 SPERO 的精神和使命比識別單一創建者更為重要。 誰是 SPERO,$$s$ 的投資者? SPERO,$$s$ 得到了來自風險投資家到天使投資者的多樣化投資者的支持,他們致力於促進加密領域的創新。這些投資者的關注點通常與 SPERO 的使命一致——優先考慮那些承諾社會技術進步、金融包容性和去中心化治理的項目。 這些投資者通常對不僅提供創新產品,還對區塊鏈社區及其生態系統做出積極貢獻的項目感興趣。這些投資者的支持強化了 SPERO,$$s$ 作為快速發展的加密項目領域中的一個重要競爭者。 SPERO,$$s$ 如何運作? SPERO,$$s$ 採用多面向的框架,使其與傳統的加密貨幣項目區別開來。以下是一些突顯其獨特性和創新的關鍵特徵: 去中心化治理:SPERO,$$s$ 整合了去中心化治理模型,賦予用戶積極參與決策過程的權力,關於項目的未來。這種方法促進了社區成員之間的擁有感和責任感。 代幣實用性:SPERO,$$s$ 使用其自己的加密貨幣代幣,旨在在生態系統內部提供多種功能。這些代幣使交易、獎勵和平台上提供的服務得以促進,增強了整體參與度和實用性。 分層架構:SPERO,$$s$ 的技術架構支持模塊化和可擴展性,允許在項目發展過程中無縫整合額外的功能和應用。這種適應性對於在不斷變化的加密環境中保持相關性至關重要。 社區參與:該項目強調社區驅動的倡議,採用激勵合作和反饋的機制。通過培養強大的社區,SPERO,$$s$ 能夠更好地滿足用戶需求並適應市場趨勢。 專注於包容性:通過提供低交易費用和用戶友好的界面,SPERO,$$s$ 旨在吸引多樣化的用戶群體,包括那些以前可能未曾參與加密領域的個體。這種對包容性的承諾與其通過可及性賦能的總體使命相一致。 SPERO,$$s$ 的時間線 理解一個項目的歷史提供了對其發展軌跡和里程碑的關鍵見解。以下是建議的時間線,映射 SPERO,$$s$ 演變中的重要事件: 概念化和構思階段:形成 SPERO,$$s$ 基礎的初步想法被提出,與區塊鏈行業內的去中心化和社區聚焦原則密切相關。 項目白皮書的發布:在概念階段之後,發布了一份全面的白皮書,詳細說明了 SPERO,$$s$ 的願景、目標和技術基礎設施,以吸引社區的興趣和反饋。 社區建設和早期參與:積極進行外展工作,建立早期採用者和潛在投資者的社區,促進圍繞項目目標的討論並獲得支持。 代幣生成事件:SPERO,$$s$ 進行了一次代幣生成事件(TGE),向早期支持者分發其原生代幣,並在生態系統內建立初步流動性。 首次 dApp 上線:與 SPERO,$$s$ 相關的第一個去中心化應用程序(dApp)上線,允許用戶參與平台的核心功能。 持續發展和夥伴關係:對項目產品的持續更新和增強,包括與區塊鏈領域其他參與者的戰略夥伴關係,使 SPERO,$$s$ 成為加密市場中一個具有競爭力和不斷演變的參與者。 結論 SPERO,$$s$ 是 web3 和加密貨幣潛力的見證,能夠徹底改變金融系統並賦能個人。憑藉對去中心化治理、社區參與和創新設計功能的承諾,它為更具包容性的金融環境鋪平了道路。 與任何在快速發展的加密領域中的投資一樣,潛在的投資者和用戶都被鼓勵進行徹底研究,並對 SPERO,$$s$ 的持續發展進行深思熟慮的參與。該項目展示了加密行業的創新精神,邀請人們進一步探索其無數可能性。儘管 SPERO,$$s$ 的旅程仍在展開,但其基礎原則確實可能影響我們在互聯網數字生態系統中如何與技術、金融和彼此互動的未來。

85 人學過發佈於 2024.12.17更新於 2024.12.17

什麼是 $S$

什麼是 AGENT S

Agent S:Web3中自主互動的未來 介紹 在不斷演變的Web3和加密貨幣領域,創新不斷重新定義個人如何與數字平台互動。Agent S是一個開創性的項目,承諾通過其開放的代理框架徹底改變人機互動。Agent S旨在簡化複雜任務,為人工智能(AI)提供變革性的應用,鋪平自主互動的道路。本詳細探索將深入研究該項目的複雜性、其獨特特徵以及對加密貨幣領域的影響。 什麼是Agent S? Agent S是一個突破性的開放代理框架,專門設計用來解決計算機任務自動化中的三個基本挑戰: 獲取特定領域知識:該框架智能地從各種外部知識來源和內部經驗中學習。這種雙重方法使其能夠建立豐富的特定領域知識庫,提升其在任務執行中的表現。 長期任務規劃:Agent S採用經驗增強的分層規劃,這是一種戰略方法,可以有效地分解和執行複雜任務。此特徵顯著提升了其高效和有效地管理多個子任務的能力。 處理動態、不均勻的界面:該項目引入了代理-計算機界面(ACI),這是一種創新的解決方案,增強了代理和用戶之間的互動。利用多模態大型語言模型(MLLMs),Agent S能夠無縫導航和操作各種圖形用戶界面。 通過這些開創性特徵,Agent S提供了一個強大的框架,解決了自動化人機互動中涉及的複雜性,為AI及其他領域的無數應用奠定了基礎。 誰是Agent S的創建者? 儘管Agent S的概念根本上是創新的,但有關其創建者的具體信息仍然難以捉摸。創建者目前尚不清楚,這突顯了該項目的初期階段或戰略選擇將創始成員保密。無論是否匿名,重點仍然在於框架的能力和潛力。 誰是Agent S的投資者? 由於Agent S在加密生態系統中相對較新,關於其投資者和財務支持者的詳細信息並未明確記錄。缺乏對支持該項目的投資基礎或組織的公開見解,引發了對其資金結構和發展路線圖的質疑。了解其支持背景對於評估該項目的可持續性和潛在市場影響至關重要。 Agent S如何運作? Agent S的核心是尖端技術,使其能夠在多種環境中有效運作。其運營模型圍繞幾個關鍵特徵構建: 類人計算機互動:該框架提供先進的AI規劃,力求使與計算機的互動更加直觀。通過模仿人類在任務執行中的行為,承諾提升用戶體驗。 敘事記憶:用於利用高級經驗,Agent S利用敘事記憶來跟蹤任務歷史,從而增強其決策過程。 情節記憶:此特徵為用戶提供逐步指導,使框架能夠在任務展開時提供上下文支持。 支持OpenACI:Agent S能夠在本地運行,使用戶能夠控制其互動和工作流程,與Web3的去中心化理念相一致。 與外部API的輕鬆集成:其多功能性和與各種AI平台的兼容性確保了Agent S能夠無縫融入現有技術生態系統,成為開發者和組織的理想選擇。 這些功能共同促成了Agent S在加密領域的獨特地位,因為它以最小的人類干預自動化複雜的多步任務。隨著項目的發展,其在Web3中的潛在應用可能重新定義數字互動的展開方式。 Agent S的時間線 Agent S的發展和里程碑可以用一個時間線來概括,突顯其重要事件: 2024年9月27日:Agent S的概念在一篇名為《一個像人類一樣使用計算機的開放代理框架》的綜合研究論文中推出,展示了該項目的基礎工作。 2024年10月10日:該研究論文在arXiv上公開,提供了對框架及其基於OSWorld基準的性能評估的深入探索。 2024年10月12日:發布了一個視頻演示,提供了對Agent S能力和特徵的視覺洞察,進一步吸引潛在用戶和投資者。 這些時間線上的標記不僅展示了Agent S的進展,還表明了其對透明度和社區參與的承諾。 有關Agent S的要點 隨著Agent S框架的持續演變,幾個關鍵特徵脫穎而出,強調其創新性和潛力: 創新框架:旨在提供類似人類互動的直觀計算機使用,Agent S為任務自動化帶來了新穎的方法。 自主互動:通過GUI自主與計算機互動的能力標誌著向更智能和高效的計算解決方案邁進了一步。 複雜任務自動化:憑藉其強大的方法論,能夠自動化複雜的多步任務,使過程更快且更少出錯。 持續改進:學習機制使Agent S能夠從過去的經驗中改進,不斷提升其性能和效率。 多功能性:其在OSWorld和WindowsAgentArena等不同操作環境中的適應性確保了它能夠服務於廣泛的應用。 隨著Agent S在Web3和加密領域中的定位,其增強互動能力和自動化過程的潛力標誌著AI技術的一次重大進步。通過其創新框架,Agent S展現了數字互動的未來,為各行各業的用戶承諾提供更無縫和高效的體驗。 結論 Agent S代表了AI與Web3結合的一次大膽飛躍,具有重新定義我們與技術互動方式的能力。儘管仍處於早期階段,但其應用的可能性廣泛且引人入勝。通過其全面的框架解決關鍵挑戰,Agent S旨在將自主互動帶到數字體驗的最前沿。隨著我們深入加密貨幣和去中心化的領域,像Agent S這樣的項目無疑將在塑造技術和人機協作的未來中發揮關鍵作用。

674 人學過發佈於 2025.01.14更新於 2025.01.14

什麼是 AGENT S

如何購買S

歡迎來到HTX.com!在這裡,購買Sonic (S)變得簡單而便捷。跟隨我們的逐步指南,放心開始您的加密貨幣之旅。第一步:創建您的HTX帳戶使用您的 Email、手機號碼在HTX註冊一個免費帳戶。體驗無憂的註冊過程並解鎖所有平台功能。立即註冊第二步:前往買幣頁面,選擇您的支付方式信用卡/金融卡購買:使用您的Visa或Mastercard即時購買Sonic (S)。餘額購買:使用您HTX帳戶餘額中的資金進行無縫交易。第三方購買:探索諸如Google Pay或Apple Pay等流行支付方式以增加便利性。C2C購買:在HTX平台上直接與其他用戶交易。HTX 場外交易 (OTC) 購買:為大量交易者提供個性化服務和競爭性匯率。第三步:存儲您的Sonic (S)購買Sonic (S)後,將其存儲在您的HTX帳戶中。您也可以透過區塊鏈轉帳將其發送到其他地址或者用於交易其他加密貨幣。第四步:交易Sonic (S)在HTX的現貨市場輕鬆交易Sonic (S)。前往您的帳戶,選擇交易對,執行交易,並即時監控。HTX為初學者和經驗豐富的交易者提供了友好的用戶體驗。

1.4k 人學過發佈於 2025.01.15更新於 2025.03.21

如何購買S

相關討論

歡迎來到 HTX 社群。在這裡,您可以了解最新的平台發展動態並獲得專業的市場意見。 以下是用戶對 S (S)幣價的意見。

活动图片