Google开卖TPU，大厂想要靠AI芯片生产“低价token”

marsbit發佈於 2026-06-24更新於 2026-06-24

文章摘要

Google开始向第三方客户直接销售自研TPU芯片及配套AI算力硬件。TPU专为AI计算中的矩阵运算设计，能高效处理大模型所需的数学计算。此前TPU仅能通过Google云租用，此举被视作Google向AI基础设施市场扩张的关键一步。文章指出，Google此举并非单纯挑战英伟达的芯片性能，而是学习其模式，将芯片、数据中心、网络、软件等打包成完整的“生产力系统”进行销售。随着AI进入普及期，企业客户在追求算力速度的同时，也越来越关注算力的性价比和长期运行成本（尤其是推理阶段的token成本）。Google的TPU方案被认为在推理场景下更具成本优势。与此同时，云服务厂商如亚马逊、微软、华为云、阿里云等也都在构建自己的算力生态，将自研芯片（如华为昇腾、阿里平头哥）与云平台、工具链和行业解决方案整合。文章认为，AI算力正日益成为像水电一样的基础资源，未来市场竞争的关键不完全是“最强算力”，而是谁能以更低的成本和更高的效率，系统性提供“最优算力”。因此，AI基础设施的竞争已从“芯片大战”升级为“系统大战”。

前段时间,Google宣布正式开始向第三方数据中心及客户直接出售自研TPU芯片,以及配套的AI算力硬件。作为Google在AI领域的“秘密武器”,第三方以前只能通过云数据中心租用TPU,业界也一度以为Google不会对外出售这些芯片,却没想到在今年6月等来了这个好消息。

那么问题来了,什么是“TPU”?这玩意的全称是“Tensor Processing Unit(张量处理器)”,它与CPU、GPU不同,是专为AI计算中的“矩阵与张量数学运算”所设计的芯片,能够用极高的效率来处理相关计算。

听起来像是辅助芯片?然而事实并非如此,因为当下的AI大模型技术,其本质上就是对海量数据的复杂数学运算(主要是矩阵乘法)。所以Google做了一件事,那就是将数以千计的TPU组合成超算集群,然后通过用CPU主机来进行调配(拆解任务、转换数据),打造出拥有极高效率的AI算力中心。

图源:Google

这也是为什么Gemini能够以更低的订阅费用和更高的使用额度,疯狂抢占OpenAI等企业的用户群。即使单独看token价格,Gemini也是海外AI产品中旗舰模型定价较低、且主流模型定价与DeepSeek等国产模型厂商接近的代表之一。

而且,TPU也更擅长处理日常用户的海量计算请求,与未来的AI生态算得上是“专业对口”,以至于外界其实眼馋这套芯片已经很久了。在官宣销售计划后,Google同时也公布了一项50亿美元的协议,将与著名私募公司黑石共同建造一座大型算力中心,暂定容量为500兆瓦。

雷科技(ID:leitech)猜测,这个消息放出后,找Google询价或合作的企业估计不少,特别是那些想自建算力中心的企业。这时候可能有人觉得,亚马逊应该要急了,毕竟这是明抢云服务生意啊。其实不然,现在最头疼的估计是英伟达。

Google给英伟达来了一记“釜底抽薪”?

首先小雷想问一个问题:英伟达为什么能在AI时代成为最重要的公司之一?如果你的答案只是“GPU算力强”,那其实只说对了一半。

英伟达真正厉害的地方,是它早就不只是卖GPU。CUDA、NVLink、DGX、InfiniBand网络、AI软件库、开发者生态、服务器合作伙伴、云厂商适配,这些东西共同构成了英伟达的护城河。

所以,当你买来一张英伟达的算力卡并启动时,你买的并不只是一块卡,而是一整套已经被行业验证过的AI生态,那么对于大多数公司来说,英伟达的CUDA生态让他们无需“重复造轮子”,也就省下了许多精力和成本。

这也是为什么很多AI公司明知道英伟达GPU很贵,仍然不得不用。因为在AI大爆发的时期,“成本”是可以忽略的,唯一的指标是能不能领先对手或更快地追赶对手。但是,随着AI大模型进入普及期,大家想要的就不再只是“速度”了,面对庞大的用户基数,效率和性价比成为了新的重点。

Google显然也看到了这一点,所以他们押注TPU,并且将其打包成一套完整的方案,这套方案里的芯片并不是为了在算力性能上打败英伟达,而是要把Google过去多年在芯片、数据中心、网络、存储、调度和模型训练上的经验,包装成企业可以直接购买的云服务能力。

这才是Google真正“学英伟达”的地方,它学的不是卖芯片,而是卖系统和生态,把一系列硬件变成客户可以使用的“生产力”,这对于那些希望将算力中心掌握在自己手中的企业来说有着不小的吸引力。

那么,英伟达要慌了?倒也不至于,但是头疼也是真头疼,毕竟旗舰算力卡虽然赚钱,但是大家不可能一直处于“有多少买多少”的状态,而是会逐渐将目光投向其他更具性价比的芯片上,届时Google的TPU方案势必会对英伟达的这部分市场造成冲击。

不过对于整个AI行业来说,目前英伟达仍然是AI算力市场最认可的通用标准,CUDA生态的地位也不是一两代芯片就能轻易撼动的。尤其是在大模型训练环节,很多团队已经围绕英伟达的体系积累了大量经验,贸然切换平台风险并不低。

比如DeepSeek,前段时间上线的新模型就宣布可采用华为昇腾芯片训练,这还是在华为与DeepSeek深度合作后,经过几个版本的迭代后才做到的。

图源:昇腾

但是站在Google的角度来看,其实也不需要在所有场景里取代英伟达,只要它能抓住一部分企业客户,然后证明自己的效率高于其他算力生态,那么它就已经能从AI基础设施市场切走一块蛋糕。

尤其是推理阶段,Google的TPU算力服务器明显更占优势。大家都知道,token真要用起来,消耗速度不比开闸放水慢多少,前有Uber四个月烧光一年预算、神秘企业一个月花掉5亿美元的token费用,后有财大气粗的微软限制员工权限,勒令他们使用自家算力。

可以说,随着AI在各个领域的使用频率越来越高,肯定会有更多的案例证明,token的成本才是未来AI竞争的关键。因为谁的token成本更低,谁就能把AI普及到更多的业务线中,去抢占用户和市场。

算力变成基本资源,云厂商的机会来了

小雷觉得有个网友的比喻非常贴切:训练模型就像买车,而推理服务则像每天要烧的汽油,就算是大户人家,也不能天天让所有车都烧98;Google提供的算力就像是92,虽然动力有点不足,但是车一样跑,活一样干,而且更便宜。

前段时间,小雷就写过一篇文章,提到如今行业有个共识:AI算力正在变得越来越像电、水、宽带这样的基本资源。

而且对于用户来说,用户并不需要去知道“算力”是怎么生产出来的,但是会像关心水电费一样关心算力的价格,这个“用户”既可以是个人,也可以是企业、城市,乃至国家。

所以,在未来的AI市场中,英伟达仍然会很重要,因为没有高性能芯片,一切都无从谈起。但是当算力需求变成长期、稳定且规模化的基础资源后,话语权反而会逐渐转到云服务厂商手中。

这也是为什么Google、微软、亚马逊、阿里云、华为云这些云厂商不再满足于只做英伟达GPU算力的“转售商”,而是都在布局自己的算力生态。这当然不是说他们就不会继续采购英伟达GPU,因为市场需要,客户也需要,同样能卖出好价钱。

图源:雷科技

但与此同时,他们的真正发展重心必将转向自己的生态,这也是英伟达最需要警惕的事情,毕竟英伟达如今的市值,很大程度上都是以其作为“AI基础底座”为前提计算的,一旦英伟达失去对非顶级算力卡市场的掌控,那么就可能逐渐回到5年前在游戏显卡市场的位置:虽是顶尖,但并不是非你不可。

事实上,如果我们把视角拉回国内,类似的变化已经出现了。以前我们在聊国产AI算力卡的时候,往往会把焦点放在算力性能对比上,去讨论单卡性能距离顶尖算力卡还有多远。

这个问题固然重要,但如果只盯着芯片性能本身,就会忽略另一个关键:国内云厂商也在把芯片、集群、云平台、模型服务和行业解决方案变成一个完整的AI生产系统,而这才是国产AI最核心的竞争力。

这不是小雷说的,而是华为云、阿里云等核心云服务商都在做的事情。比如说华为的昇腾云服务,虽然屡次出圈的仍然是昇腾芯片,但是如今的华为已经围绕昇腾算力提供云化工具链、超节点集群、模型迁移、训练推理优化和行业落地能力。

图源:微博

而且,华为也在把这套算力生态推给更多的国产AI公司,除了前面提到的DeepSeek外,还有百度、科大讯飞、智谱、MiniMax等头部AI大厂。可以说,华为已经逐渐搭建好自己的算力生态,接下来要做的就是将更多伙伴拉上车,然后用更低的token价格去占领市场。

阿里云同样如此,他们在今年5月发布了真武M890训推一体AI芯片,而在此之前,真武810E也早就大规模部署到阿里云的灵骏智算平台中。在今年的阿里云峰会上,阿里云也直接宣布平头哥真武系列AI芯片累计出货量已达到56万片,年化营收规模跨入百亿级别。

可以说,在学习英伟达这件事上,国内云服务厂商不仅走得更快,而且也走得更早。

最强算力?不,全世界需要“最优算力”

当然,英伟达并不会因为Google开始卖TPU,就突然失去AI时代的核心位置。

至少在很长一段时间里,GPU、CUDA和开发者生态,依然会是整个AI产业绕不开的标准。尤其是在大模型训练、高性能计算和通用AI开发场景中,英伟达仍然是目前最成熟且最被行业认可的选择。

但问题在于,AI算力市场正在进入下一个阶段。

过去大家争的是“谁的芯片更强”,而现在企业真正关心的,正在变成“谁能把算力变得更便宜”。这时候,Google、华为云、阿里云这类云服务厂商的优势就开始显现了:它们拥有海量的个人和企业客户、数据、应用和场景,同时也更擅长把各种硬件包装成一套可以直接使用的生产力系统。

换句话说,AI时代真正稀缺的,已经不只是芯片本身,而是把芯片变成生产力的系统能力。

当算力越来越像水、电、宽带这样的基础资源,最终胜出的公司,未必只是那个单卡性能最强的厂商,而是那个能以更低成本、更高效率,把AI算力持续交付给客户的厂商。

所以,在雷科技看来,Google开卖TPU其实是一个信号,它在提醒整个行业:AI基础设施的竞争,已经不只是芯片大战,而是系统大战。

本文来自微信公众号“雷科技”,作者:雷科技

你可能也喜歡

空中云汇转向：从一年前鄙夷稳定币，到如今高调资本入局

跨境支付巨头空中云汇（Airwallex）近日领投了代币化金融结算网络Metal的种子轮融资，此举引发关注，因其创始人Jack Zhang一年前曾公开批评稳定币，质疑其降低汇款成本的效用，并认为加密货币缺乏实际用例。然而，此次投资标志着其态度发生显著转变。 Metal是一个面向代币化金融的全球结算网络与Layer-1区块链，旨在支持股票、债券、基金等各类金融资产的代币化结算，目标市场达十万亿美元级。空中云汇通过投资将为其支付网络引入代币化资产，结合自身在法币通道、全球支付场景方面的优势，形成战略协同。尽管Jack Zhang在投资后仍坚持认为稳定币与加密货币本质不同，强调稳定币是法币的代币化形式，但其行动已表明了对稳定币及代币化赛道价值的重新评估。这一转变并非孤例，近年来传统金融巨头如摩根大通、Visa、Stripe等均在积极布局稳定币支付和代币化网络，反映出主流金融体系对链上结算效率革命的接纳。空中云汇的投资逻辑并非全然认同加密货币，而是基于战略考量。面对稳定币在新兴市场、企业金融和链上结算等领域带来的结构性机会，以及可能重塑支付行业竞争格局的趋势，提前入场布局成为必要选择。这回答了其一年前的质疑：稳定币的价值至少已值得资本下注，而非置身事外。

marsbit18 分鐘前

marsbit18 分鐘前

Worldcoin的破位可能是更大下跌的开始——原因如下

Worldcoin（WLD）在过去24小时内下跌10.27%，交易价格接近0.4635美元，交易量同步下降14.05%至3.867亿美元。价格与交易量双双下跌表明市场参与度减弱，买家退缩，而卖家仍主导短期走势。WLD已跌破0.50美元心理关口，买方信心不足，若需求无法改善，可能面临进一步下行压力。现货交易数据持续显示卖方占优，市场卖单超过积极买单，表明交易者倾向于接受更低价格而非追高。尽管整体交易活动放缓，买卖失衡仍有利于空方，反映市场吸收卖盘的意愿有限。与此同时，现货成交量热度图显示市场仍处于过热状态，暗示投机活动活跃，可能引发价格剧烈波动。从技术面看，WLD已跌破上升通道，此前在0.67美元附近遭遇强阻力。价格正逼近0.40美元关键支撑位，MACD指标出现死叉且柱状图深入负值区域，确认卖压加剧。若0.40美元支撑失守，下一主要下行目标在0.23美元附近；若能守住，则可能反弹挑战0.50美元及0.67美元阻力。总结而言，WLD在通道破位后逼近关键支撑，持续现货卖压及看跌技术信号表明买方短期内仍难掌控局面，市场脆弱性较高。

ambcrypto25 分鐘前

ambcrypto25 分鐘前

空中云汇转向：从一年前的鄙夷稳定币，到如今高调资本入局

6月26日，跨境支付巨头Airwallex（空中云汇）领投了代币化金融结算网络Metal的种子轮融资。此举引人关注，因为其创始人Jack Zhang一年前曾是稳定币的尖锐批评者，曾公开质疑稳定币降低汇款成本的能力，并认为加密货币缺乏实际用例。如今，Airwallex的战略投资标志其态度转变。Metal是一个面向代币化金融资产的全球结算层区块链，旨在支持股票、债券等各类资产的链上结算。通过投资，Airwallex计划为其支付网络引入代币化资产，结合自身全球账户与合规能力，形成协同效应。 Jack Zhang在回应外界质疑时仍试图区分稳定币与加密货币，强调稳定币由法币1:1支持。但行动本身表明，传统金融巨头已无法忽视由稳定币和代币化带来的清算效率变革。类似地，Stripe、摩根大通等传统机构近一年也在积极布局稳定币支付领域。这一投资反映出，稳定币正被重新定义为连接企业支付、跨境结算与链上资产的关键接口。对Airwallex而言，这不再是理论争议，而是关乎未来竞争的战略占位——即使稳定币在主流货币走廊优势有限，其在新兴市场、链上结算等场景的结构性机会已不容忽视。

链捕手30 分鐘前

链捕手30 分鐘前

第一个用物理做计算原语的大规模生成模型Un-0来了，或将AI能耗降低1000倍？

在AI能耗问题日益成为行业瓶颈的背景下，前Databricks AI负责人Naveen Rao创立的Unconventional AI公司发布了其首个大规模生成模型Un-0。该模型的核心创新在于利用“模拟耦合振子系统”作为计算原语，通过物理系统的自然演化过程来完成图像生成任务，旨在将AI推理能耗降低至现有系统的千分之一。 Un-0的工作原理基于Kuramoto振子模型。成千上万个振子根据其固有频率和相互间的耦合关系，在时间维度上自然演化、同步或形成特定模式。模型的训练主要学习振子间的耦合矩阵和固有频率。生成图像时，系统首先随机初始化振子相位，然后通过条件振子输入类别标签（如“火山”）进行引导，接着让物理系统自由演化，最后在特定时刻读取振子相位状态，并通过一个轻量级解码器将其转换为图像像素。在ImageNet 64×64数据集上，拥有3.22亿参数的Un-0模型取得了FID 6.74的成绩，其生成质量已接近一些早期主流图像生成模型（如BigGAN、iDDPM）发布时的水平，但与当前最先进的传统模型（如EDM）相比仍有差距。Unconventional AI强调，Un-0并非旨在立即成为性能冠军，而是一个“概念验证”，证明了利用物理动力学系统执行现代AI大规模生成任务是可行的。该技术路线的长远目标是构建一种新型的非传统计算硬件，将计算与记忆合并于同一物理实体中，从而避免冯·诺依曼架构中数据搬运带来的巨大能耗。Un-0的出现，标志着AI计算范式向利用物理系统固有动力学特性转变迈出了重要一步，为未来实现能效数量级提升的AI硬件开辟了新路径。

marsbit37 分鐘前

第一个用物理做计算原语的大规模生成模型Un-0来了，或将AI能耗降低1000倍？

marsbit37 分鐘前

辣评｜「最有情绪价值」的帖子！STRC 会是下一个 LUNA 吗？

**《辣评》本周聚焦三件事：散户情绪、STRC脱锚风险与交易员川沐的“矛盾人设”。** **1. 本月“最有情绪价值”的帖子** 6月加密货币市场大跌，BTC跌破6万美元。Reddit上一条“去你的恐惧、不确定和怀疑！”的帖子引发散户共鸣，评论区成为情绪宣泄地，有人喊“钻石手加仓”，也有人调侃“不卖都是浮亏”，展现了熊市中的集体心理。 **2. STRC脱锚，会是下一个LUNA吗？** Strategy公司发行的永续优先股STRC价格跌至76.2美元，较面值脱锚约25%。投资者担忧其每年12亿美元的股息支付能力——Strategy当前美元储备约14亿美元，仅够支付一年。关键区别在于，CEO Saylor并无支付股息的强制性义务，因此STRC虽可能下跌，但不会像LUNA那样归零。不过，若市场对支付能力失去信心，其普通股MSTR也可能受牵连。Strategy CEO已购入100万美元STRC以示信心，但类似LUNA崩盘前的言论也引发了市场警觉。 **3. 川沐的1828条推文与“矛盾人设”** 交易员川沐因在ORDI行情和2025年做空山寨币中获利百万而闻名。分析其推文发现，其核心方法是追问系统瓶颈（如AI浪潮中的存储、光通信等环节），并据此迁移投资主线。然而，他也被质疑曾“喊单”部分币种后出现“收割”行情，且中途卖出股票未告知跟风者，呈现“盈利展示”与私下操作不一的矛盾形象，提醒投资者保持独立判断。 **总结**：本周市场情绪低迷，但社区互勉；STRC面临股息支付考验，虽与LUNA本质不同，风险犹存；川沐的案例则揭示了光鲜战绩背后的复杂性与跟单风险。

Foresight News53 分鐘前

Foresight News53 分鐘前

交易

現貨

Google开卖TPU，大厂想要靠AI芯片生产“低价token”

文章摘要

Google给英伟达来了一记“釜底抽薪”?

算力变成基本资源,云厂商的机会来了

最强算力?不,全世界需要“最优算力”

相關問答

你可能也喜歡

空中云汇转向：从一年前鄙夷稳定币，到如今高调资本入局

Worldcoin的破位可能是更大下跌的开始——原因如下

空中云汇转向：从一年前的鄙夷稳定币，到如今高调资本入局

第一个用物理做计算原语的大规模生成模型Un-0来了，或将AI能耗降低1000倍？

辣评｜「最有情绪价值」的帖子！STRC 会是下一个 LUNA 吗？

交易

熱門分類

熱門標籤