Google开卖TPU,大厂想要靠AI芯片生产“低价token”

marsbit发布于2026-06-24更新于2026-06-24

文章摘要

Google开始向第三方客户直接销售自研TPU芯片及配套AI算力硬件。TPU专为AI计算中的矩阵运算设计,能高效处理大模型所需的数学计算。此前TPU仅能通过Google云租用,此举被视作Google向AI基础设施市场扩张的关键一步。 文章指出,Google此举并非单纯挑战英伟达的芯片性能,而是学习其模式,将芯片、数据中心、网络、软件等打包成完整的“生产力系统”进行销售。随着AI进入普及期,企业客户在追求算力速度的同时,也越来越关注算力的性价比和长期运行成本(尤其是推理阶段的token成本)。Google的TPU方案被认为在推理场景下更具成本优势。 与此同时,云服务厂商如亚马逊、微软、华为云、阿里云等也都在构建自己的算力生态,将自研芯片(如华为昇腾、阿里平头哥)与云平台、工具链和行业解决方案整合。文章认为,AI算力正日益成为像水电一样的基础资源,未来市场竞争的关键不完全是“最强算力”,而是谁能以更低的成本和更高的效率,系统性提供“最优算力”。因此,AI基础设施的竞争已从“芯片大战”升级为“系统大战”。

前段时间,Google宣布正式开始向第三方数据中心及客户直接出售自研TPU芯片,以及配套的AI算力硬件。作为Google在AI领域的“秘密武器”,第三方以前只能通过云数据中心租用TPU,业界也一度以为Google不会对外出售这些芯片,却没想到在今年6月等来了这个好消息。

那么问题来了,什么是“TPU”?这玩意的全称是“Tensor Processing Unit(张量处理器)”,它与CPU、GPU不同,是专为AI计算中的“矩阵与张量数学运算”所设计的芯片,能够用极高的效率来处理相关计算。

听起来像是辅助芯片?然而事实并非如此,因为当下的AI大模型技术,其本质上就是对海量数据的复杂数学运算(主要是矩阵乘法)。所以Google做了一件事,那就是将数以千计的TPU组合成超算集群,然后通过用CPU主机来进行调配(拆解任务、转换数据),打造出拥有极高效率的AI算力中心。

图源:Google

这也是为什么Gemini能够以更低的订阅费用和更高的使用额度,疯狂抢占OpenAI等企业的用户群。即使单独看token价格,Gemini也是海外AI产品中旗舰模型定价较低、且主流模型定价与DeepSeek等国产模型厂商接近的代表之一。

而且,TPU也更擅长处理日常用户的海量计算请求,与未来的AI生态算得上是“专业对口”,以至于外界其实眼馋这套芯片已经很久了。在官宣销售计划后,Google同时也公布了一项50亿美元的协议,将与著名私募公司黑石共同建造一座大型算力中心,暂定容量为500兆瓦。

雷科技(ID:leitech)猜测,这个消息放出后,找Google询价或合作的企业估计不少,特别是那些想自建算力中心的企业。这时候可能有人觉得,亚马逊应该要急了,毕竟这是明抢云服务生意啊。其实不然,现在最头疼的估计是英伟达。

Google给英伟达来了一记“釜底抽薪”?

首先小雷想问一个问题:英伟达为什么能在AI时代成为最重要的公司之一?如果你的答案只是“GPU算力强”,那其实只说对了一半。

英伟达真正厉害的地方,是它早就不只是卖GPU。CUDA、NVLink、DGX、InfiniBand网络、AI软件库、开发者生态、服务器合作伙伴、云厂商适配,这些东西共同构成了英伟达的护城河。

所以,当你买来一张英伟达的算力卡并启动时,你买的并不只是一块卡,而是一整套已经被行业验证过的AI生态,那么对于大多数公司来说,英伟达的CUDA生态让他们无需“重复造轮子”,也就省下了许多精力和成本。

这也是为什么很多AI公司明知道英伟达GPU很贵,仍然不得不用。因为在AI大爆发的时期,“成本”是可以忽略的,唯一的指标是能不能领先对手或更快地追赶对手。但是,随着AI大模型进入普及期,大家想要的就不再只是“速度”了,面对庞大的用户基数,效率和性价比成为了新的重点。

Google显然也看到了这一点,所以他们押注TPU,并且将其打包成一套完整的方案,这套方案里的芯片并不是为了在算力性能上打败英伟达,而是要把Google过去多年在芯片、数据中心、网络、存储、调度和模型训练上的经验,包装成企业可以直接购买的云服务能力。

这才是Google真正“学英伟达”的地方,它学的不是卖芯片,而是卖系统和生态,把一系列硬件变成客户可以使用的“生产力”,这对于那些希望将算力中心掌握在自己手中的企业来说有着不小的吸引力。

那么,英伟达要慌了?倒也不至于,但是头疼也是真头疼,毕竟旗舰算力卡虽然赚钱,但是大家不可能一直处于“有多少买多少”的状态,而是会逐渐将目光投向其他更具性价比的芯片上,届时Google的TPU方案势必会对英伟达的这部分市场造成冲击。

不过对于整个AI行业来说,目前英伟达仍然是AI算力市场最认可的通用标准,CUDA生态的地位也不是一两代芯片就能轻易撼动的。尤其是在大模型训练环节,很多团队已经围绕英伟达的体系积累了大量经验,贸然切换平台风险并不低。

比如DeepSeek,前段时间上线的新模型就宣布可采用华为昇腾芯片训练,这还是在华为与DeepSeek深度合作后,经过几个版本的迭代后才做到的。

图源:昇腾

但是站在Google的角度来看,其实也不需要在所有场景里取代英伟达,只要它能抓住一部分企业客户,然后证明自己的效率高于其他算力生态,那么它就已经能从AI基础设施市场切走一块蛋糕。

尤其是推理阶段,Google的TPU算力服务器明显更占优势。大家都知道,token真要用起来,消耗速度不比开闸放水慢多少,前有Uber四个月烧光一年预算、神秘企业一个月花掉5亿美元的token费用,后有财大气粗的微软限制员工权限,勒令他们使用自家算力。

可以说,随着AI在各个领域的使用频率越来越高,肯定会有更多的案例证明,token的成本才是未来AI竞争的关键。因为谁的token成本更低,谁就能把AI普及到更多的业务线中,去抢占用户和市场。

算力变成基本资源,云厂商的机会来了

小雷觉得有个网友的比喻非常贴切:训练模型就像买车,而推理服务则像每天要烧的汽油,就算是大户人家,也不能天天让所有车都烧98;Google提供的算力就像是92,虽然动力有点不足,但是车一样跑,活一样干,而且更便宜。

前段时间,小雷就写过一篇文章,提到如今行业有个共识:AI算力正在变得越来越像电、水、宽带这样的基本资源。

而且对于用户来说,用户并不需要去知道“算力”是怎么生产出来的,但是会像关心水电费一样关心算力的价格,这个“用户”既可以是个人,也可以是企业、城市,乃至国家。

所以,在未来的AI市场中,英伟达仍然会很重要,因为没有高性能芯片,一切都无从谈起。但是当算力需求变成长期、稳定且规模化的基础资源后,话语权反而会逐渐转到云服务厂商手中。

这也是为什么Google、微软、亚马逊、阿里云、华为云这些云厂商不再满足于只做英伟达GPU算力的“转售商”,而是都在布局自己的算力生态。这当然不是说他们就不会继续采购英伟达GPU,因为市场需要,客户也需要,同样能卖出好价钱。

图源:雷科技

但与此同时,他们的真正发展重心必将转向自己的生态,这也是英伟达最需要警惕的事情,毕竟英伟达如今的市值,很大程度上都是以其作为“AI基础底座”为前提计算的,一旦英伟达失去对非顶级算力卡市场的掌控,那么就可能逐渐回到5年前在游戏显卡市场的位置:虽是顶尖,但并不是非你不可。

事实上,如果我们把视角拉回国内,类似的变化已经出现了。以前我们在聊国产AI算力卡的时候,往往会把焦点放在算力性能对比上,去讨论单卡性能距离顶尖算力卡还有多远。

这个问题固然重要,但如果只盯着芯片性能本身,就会忽略另一个关键:国内云厂商也在把芯片、集群、云平台、模型服务和行业解决方案变成一个完整的AI生产系统,而这才是国产AI最核心的竞争力。

这不是小雷说的,而是华为云、阿里云等核心云服务商都在做的事情。比如说华为的昇腾云服务,虽然屡次出圈的仍然是昇腾芯片,但是如今的华为已经围绕昇腾算力提供云化工具链、超节点集群、模型迁移、训练推理优化和行业落地能力。

图源:微博

而且,华为也在把这套算力生态推给更多的国产AI公司,除了前面提到的DeepSeek外,还有百度、科大讯飞、智谱、MiniMax等头部AI大厂。可以说,华为已经逐渐搭建好自己的算力生态,接下来要做的就是将更多伙伴拉上车,然后用更低的token价格去占领市场。

阿里云同样如此,他们在今年5月发布了真武M890训推一体AI芯片,而在此之前,真武810E也早就大规模部署到阿里云的灵骏智算平台中。在今年的阿里云峰会上,阿里云也直接宣布平头哥真武系列AI芯片累计出货量已达到56万片,年化营收规模跨入百亿级别。

可以说,在学习英伟达这件事上,国内云服务厂商不仅走得更快,而且也走得更早。

最强算力?不,全世界需要“最优算力”

当然,英伟达并不会因为Google开始卖TPU,就突然失去AI时代的核心位置。

至少在很长一段时间里,GPU、CUDA和开发者生态,依然会是整个AI产业绕不开的标准。尤其是在大模型训练、高性能计算和通用AI开发场景中,英伟达仍然是目前最成熟且最被行业认可的选择。

但问题在于,AI算力市场正在进入下一个阶段。

过去大家争的是“谁的芯片更强”,而现在企业真正关心的,正在变成“谁能把算力变得更便宜”。这时候,Google、华为云、阿里云这类云服务厂商的优势就开始显现了:它们拥有海量的个人和企业客户、数据、应用和场景,同时也更擅长把各种硬件包装成一套可以直接使用的生产力系统。

换句话说,AI时代真正稀缺的,已经不只是芯片本身,而是把芯片变成生产力的系统能力。

当算力越来越像水、电、宽带这样的基础资源,最终胜出的公司,未必只是那个单卡性能最强的厂商,而是那个能以更低成本、更高效率,把AI算力持续交付给客户的厂商。

所以,在雷科技看来,Google开卖TPU其实是一个信号,它在提醒整个行业:AI基础设施的竞争,已经不只是芯片大战,而是系统大战。

本文来自微信公众号“雷科技”,作者:雷科技

相关问答

QGoogle正式开始对外销售TPU的主要目的是什么?

AGoogle正式对外销售TPU的主要目的,是为了将其多年积累的芯片、数据中心、网络、存储、调度和模型训练经验,打包成企业可以直接购买和使用的完整AI算力解决方案。这不仅是为了提供更具性价比的算力选择(降低token成本),也是在学习英伟达的模式,通过出售系统和生态来抢占AI基础设施市场,尤其是推理服务和那些希望自建算力中心的企业客户市场。

Q文章认为英伟达在AI时代的核心竞争力是什么?为什么很多公司明知其贵仍要使用?

A文章认为,英伟达在AI时代的核心竞争力不仅仅是GPU算力强,更在于其构建了包括CUDA、NVLink、DGX、InfiniBand网络、AI软件库、开发者生态等在内的一整套已被行业广泛验证的完整AI生态体系。公司购买英伟达的产品,实际上是购买了这套可立即投入生产的成熟方案,避免了“重复造轮子”,从而节省了大量开发精力和时间成本。在AI爆发初期,市场更看重能否快速领先或追赶对手,因此成本可以暂时被忽略,这是许多公司即使觉得贵也必须使用的原因。

Q根据文章,未来的AI算力市场竞争焦点将发生什么变化?

A根据文章,未来的AI算力市场竞争焦点正从单纯的追求“最强算力”(即芯片的绝对性能),转向追求“最优算力”和“更低的成本”。具体来说,竞争将围绕谁能以更低的成本、更高的效率,将算力作为一种稳定、规模化、可负担的基础资源(类似水电)持续交付给客户。这不仅是芯片的竞争,更是系统能力和生态整合能力的竞争,即看谁能更好地将硬件、软件、平台和行业解决方案打包成可直接使用的生产力系统。

Q文章提到国内云厂商(如华为云、阿里云)在AI算力布局上的核心策略是什么?

A文章提到,国内云厂商如华为云和阿里云的核心策略,不是仅仅停留在提升单颗AI芯片的性能上,而是致力于打造一个完整的AI生产系统。他们将自研的芯片(如华为昇腾、阿里平头哥真武系列)、超算集群、云平台、模型服务工具链、训练推理优化方案以及行业落地能力整合在一起,形成一个闭环的算力生态。然后,他们通过将这些生态能力开放给更多的AI公司(如DeepSeek、百度等),旨在通过提供更具性价比的解决方案来降低整体token成本,从而扩大市场占有率。

QGoogle开卖TPU事件对整个AI行业发出了什么信号?

AGoogle开卖TPU事件向整个AI行业发出了一个明确的信号:AI基础设施的竞争已经进入了一个新阶段,即从单一的“芯片大战”升级为全面的“系统大战”。它表明,未来的赢家不仅需要强大的硬件,更需要具备将芯片、数据中心、软件、网络、调度等复杂技术整合成一套高效、可靠、低成本且易于客户使用的一体化解决方案的能力。这标志着行业正从追求峰值性能,转向追求规模化、商业化和普及化的综合效率。

你可能也喜欢

IOSG创始人:以太坊不需要再来一次技术信仰,它需要一次马斯克式的妥协

IOSG创始人Jocy撰文指出,以太坊当前的核心问题并非缺乏技术信仰或路线图,而是需要一个“马斯克式的妥协”——即创始人Vitalik需要更深入地理解商业现实,并亲自推动以太坊在现实世界中的杀手级应用落地。 文章认为,近期由前EF研究员和大型ETH持有方支持的ETHLabs等新机构的出现,是市场对以太坊基金会“无为而治”模式投下的不信任票。Vitalik与马斯克的根本区别在于,后者善于先吃透商业逻辑再驱动技术,而以太坊则习惯从技术和价值观出发,期待生态自行生长。在当下多链竞争、注意力向AI迁移的时代,这种模式的运气已不可持续。 作者指出,以太坊面临的真正威胁是注意力的流失,而不仅仅是其他区块链的竞争。解决方案在于构建一个清晰的、能吸引顶尖人才的现实世界应用叙事。尽管以太坊基金会正试图通过分散化治理(如多节点独立决策)来应对挑战,但这可能带来方向碎片化、凝聚力不足的新问题。真正的凝聚力不能仅靠共同持有ETH资产,更需要一个所有人都看得懂并愿意押注的共同目标。 文章最后强调,留给以太坊“俯身入局”、专注商业应用的时间窗口可能只有12到18个月,时间是其最无情的对手。创始人需要从仰望星空转向亲自下场,才能让理想之光真正照进现实。

marsbit59分钟前

IOSG创始人:以太坊不需要再来一次技术信仰,它需要一次马斯克式的妥协

marsbit59分钟前

交易

现货
合约
活动图片