前段时间,Google宣布正式开始向第三方数据中心及客户直接出售自研TPU芯片,以及配套的AI算力硬件。作为Google在AI领域的“秘密武器”,第三方以前只能通过云数据中心租用TPU,业界也一度以为Google不会对外出售这些芯片,却没想到在今年6月等来了这个好消息。
那么问题来了,什么是“TPU”?这玩意的全称是“Tensor Processing Unit(张量处理器)”,它与CPU、GPU不同,是专为AI计算中的“矩阵与张量数学运算”所设计的芯片,能够用极高的效率来处理相关计算。
听起来像是辅助芯片?然而事实并非如此,因为当下的AI大模型技术,其本质上就是对海量数据的复杂数学运算(主要是矩阵乘法)。所以Google做了一件事,那就是将数以千计的TPU组合成超算集群,然后通过用CPU主机来进行调配(拆解任务、转换数据),打造出拥有极高效率的AI算力中心。

图源:Google
这也是为什么Gemini能够以更低的订阅费用和更高的使用额度,疯狂抢占OpenAI等企业的用户群。即使单独看token价格,Gemini也是海外AI产品中旗舰模型定价较低、且主流模型定价与DeepSeek等国产模型厂商接近的代表之一。
而且,TPU也更擅长处理日常用户的海量计算请求,与未来的AI生态算得上是“专业对口”,以至于外界其实眼馋这套芯片已经很久了。在官宣销售计划后,Google同时也公布了一项50亿美元的协议,将与著名私募公司黑石共同建造一座大型算力中心,暂定容量为500兆瓦。
雷科技(ID:leitech)猜测,这个消息放出后,找Google询价或合作的企业估计不少,特别是那些想自建算力中心的企业。这时候可能有人觉得,亚马逊应该要急了,毕竟这是明抢云服务生意啊。其实不然,现在最头疼的估计是英伟达。
Google给英伟达来了一记“釜底抽薪”?
首先小雷想问一个问题:英伟达为什么能在AI时代成为最重要的公司之一?如果你的答案只是“GPU算力强”,那其实只说对了一半。
英伟达真正厉害的地方,是它早就不只是卖GPU。CUDA、NVLink、DGX、InfiniBand网络、AI软件库、开发者生态、服务器合作伙伴、云厂商适配,这些东西共同构成了英伟达的护城河。
所以,当你买来一张英伟达的算力卡并启动时,你买的并不只是一块卡,而是一整套已经被行业验证过的AI生态,那么对于大多数公司来说,英伟达的CUDA生态让他们无需“重复造轮子”,也就省下了许多精力和成本。
这也是为什么很多AI公司明知道英伟达GPU很贵,仍然不得不用。因为在AI大爆发的时期,“成本”是可以忽略的,唯一的指标是能不能领先对手或更快地追赶对手。但是,随着AI大模型进入普及期,大家想要的就不再只是“速度”了,面对庞大的用户基数,效率和性价比成为了新的重点。
Google显然也看到了这一点,所以他们押注TPU,并且将其打包成一套完整的方案,这套方案里的芯片并不是为了在算力性能上打败英伟达,而是要把Google过去多年在芯片、数据中心、网络、存储、调度和模型训练上的经验,包装成企业可以直接购买的云服务能力。
这才是Google真正“学英伟达”的地方,它学的不是卖芯片,而是卖系统和生态,把一系列硬件变成客户可以使用的“生产力”,这对于那些希望将算力中心掌握在自己手中的企业来说有着不小的吸引力。
那么,英伟达要慌了?倒也不至于,但是头疼也是真头疼,毕竟旗舰算力卡虽然赚钱,但是大家不可能一直处于“有多少买多少”的状态,而是会逐渐将目光投向其他更具性价比的芯片上,届时Google的TPU方案势必会对英伟达的这部分市场造成冲击。
不过对于整个AI行业来说,目前英伟达仍然是AI算力市场最认可的通用标准,CUDA生态的地位也不是一两代芯片就能轻易撼动的。尤其是在大模型训练环节,很多团队已经围绕英伟达的体系积累了大量经验,贸然切换平台风险并不低。
比如DeepSeek,前段时间上线的新模型就宣布可采用华为昇腾芯片训练,这还是在华为与DeepSeek深度合作后,经过几个版本的迭代后才做到的。

图源:昇腾
但是站在Google的角度来看,其实也不需要在所有场景里取代英伟达,只要它能抓住一部分企业客户,然后证明自己的效率高于其他算力生态,那么它就已经能从AI基础设施市场切走一块蛋糕。
尤其是推理阶段,Google的TPU算力服务器明显更占优势。大家都知道,token真要用起来,消耗速度不比开闸放水慢多少,前有Uber四个月烧光一年预算、神秘企业一个月花掉5亿美元的token费用,后有财大气粗的微软限制员工权限,勒令他们使用自家算力。
可以说,随着AI在各个领域的使用频率越来越高,肯定会有更多的案例证明,token的成本才是未来AI竞争的关键。因为谁的token成本更低,谁就能把AI普及到更多的业务线中,去抢占用户和市场。
算力变成基本资源,云厂商的机会来了
小雷觉得有个网友的比喻非常贴切:训练模型就像买车,而推理服务则像每天要烧的汽油,就算是大户人家,也不能天天让所有车都烧98;Google提供的算力就像是92,虽然动力有点不足,但是车一样跑,活一样干,而且更便宜。
前段时间,小雷就写过一篇文章,提到如今行业有个共识:AI算力正在变得越来越像电、水、宽带这样的基本资源。
而且对于用户来说,用户并不需要去知道“算力”是怎么生产出来的,但是会像关心水电费一样关心算力的价格,这个“用户”既可以是个人,也可以是企业、城市,乃至国家。
所以,在未来的AI市场中,英伟达仍然会很重要,因为没有高性能芯片,一切都无从谈起。但是当算力需求变成长期、稳定且规模化的基础资源后,话语权反而会逐渐转到云服务厂商手中。
这也是为什么Google、微软、亚马逊、阿里云、华为云这些云厂商不再满足于只做英伟达GPU算力的“转售商”,而是都在布局自己的算力生态。这当然不是说他们就不会继续采购英伟达GPU,因为市场需要,客户也需要,同样能卖出好价钱。

图源:雷科技
但与此同时,他们的真正发展重心必将转向自己的生态,这也是英伟达最需要警惕的事情,毕竟英伟达如今的市值,很大程度上都是以其作为“AI基础底座”为前提计算的,一旦英伟达失去对非顶级算力卡市场的掌控,那么就可能逐渐回到5年前在游戏显卡市场的位置:虽是顶尖,但并不是非你不可。
事实上,如果我们把视角拉回国内,类似的变化已经出现了。以前我们在聊国产AI算力卡的时候,往往会把焦点放在算力性能对比上,去讨论单卡性能距离顶尖算力卡还有多远。
这个问题固然重要,但如果只盯着芯片性能本身,就会忽略另一个关键:国内云厂商也在把芯片、集群、云平台、模型服务和行业解决方案变成一个完整的AI生产系统,而这才是国产AI最核心的竞争力。
这不是小雷说的,而是华为云、阿里云等核心云服务商都在做的事情。比如说华为的昇腾云服务,虽然屡次出圈的仍然是昇腾芯片,但是如今的华为已经围绕昇腾算力提供云化工具链、超节点集群、模型迁移、训练推理优化和行业落地能力。

图源:微博
而且,华为也在把这套算力生态推给更多的国产AI公司,除了前面提到的DeepSeek外,还有百度、科大讯飞、智谱、MiniMax等头部AI大厂。可以说,华为已经逐渐搭建好自己的算力生态,接下来要做的就是将更多伙伴拉上车,然后用更低的token价格去占领市场。
阿里云同样如此,他们在今年5月发布了真武M890训推一体AI芯片,而在此之前,真武810E也早就大规模部署到阿里云的灵骏智算平台中。在今年的阿里云峰会上,阿里云也直接宣布平头哥真武系列AI芯片累计出货量已达到56万片,年化营收规模跨入百亿级别。
可以说,在学习英伟达这件事上,国内云服务厂商不仅走得更快,而且也走得更早。
最强算力?不,全世界需要“最优算力”
当然,英伟达并不会因为Google开始卖TPU,就突然失去AI时代的核心位置。
至少在很长一段时间里,GPU、CUDA和开发者生态,依然会是整个AI产业绕不开的标准。尤其是在大模型训练、高性能计算和通用AI开发场景中,英伟达仍然是目前最成熟且最被行业认可的选择。
但问题在于,AI算力市场正在进入下一个阶段。
过去大家争的是“谁的芯片更强”,而现在企业真正关心的,正在变成“谁能把算力变得更便宜”。这时候,Google、华为云、阿里云这类云服务厂商的优势就开始显现了:它们拥有海量的个人和企业客户、数据、应用和场景,同时也更擅长把各种硬件包装成一套可以直接使用的生产力系统。
换句话说,AI时代真正稀缺的,已经不只是芯片本身,而是把芯片变成生产力的系统能力。
当算力越来越像水、电、宽带这样的基础资源,最终胜出的公司,未必只是那个单卡性能最强的厂商,而是那个能以更低成本、更高效率,把AI算力持续交付给客户的厂商。
所以,在雷科技看来,Google开卖TPU其实是一个信号,它在提醒整个行业:AI基础设施的竞争,已经不只是芯片大战,而是系统大战。
本文来自微信公众号“雷科技”,作者:雷科技





