Google开卖TPU，大厂想要靠AI芯片生产“低价token”

marsbit发布于2026-06-24更新于2026-06-24

文章摘要

Google开始向第三方客户直接销售自研TPU芯片及配套AI算力硬件。TPU专为AI计算中的矩阵运算设计，能高效处理大模型所需的数学计算。此前TPU仅能通过Google云租用，此举被视作Google向AI基础设施市场扩张的关键一步。文章指出，Google此举并非单纯挑战英伟达的芯片性能，而是学习其模式，将芯片、数据中心、网络、软件等打包成完整的“生产力系统”进行销售。随着AI进入普及期，企业客户在追求算力速度的同时，也越来越关注算力的性价比和长期运行成本（尤其是推理阶段的token成本）。Google的TPU方案被认为在推理场景下更具成本优势。与此同时，云服务厂商如亚马逊、微软、华为云、阿里云等也都在构建自己的算力生态，将自研芯片（如华为昇腾、阿里平头哥）与云平台、工具链和行业解决方案整合。文章认为，AI算力正日益成为像水电一样的基础资源，未来市场竞争的关键不完全是“最强算力”，而是谁能以更低的成本和更高的效率，系统性提供“最优算力”。因此，AI基础设施的竞争已从“芯片大战”升级为“系统大战”。

前段时间,Google宣布正式开始向第三方数据中心及客户直接出售自研TPU芯片,以及配套的AI算力硬件。作为Google在AI领域的“秘密武器”,第三方以前只能通过云数据中心租用TPU,业界也一度以为Google不会对外出售这些芯片,却没想到在今年6月等来了这个好消息。

那么问题来了,什么是“TPU”?这玩意的全称是“Tensor Processing Unit(张量处理器)”,它与CPU、GPU不同,是专为AI计算中的“矩阵与张量数学运算”所设计的芯片,能够用极高的效率来处理相关计算。

听起来像是辅助芯片?然而事实并非如此,因为当下的AI大模型技术,其本质上就是对海量数据的复杂数学运算(主要是矩阵乘法)。所以Google做了一件事,那就是将数以千计的TPU组合成超算集群,然后通过用CPU主机来进行调配(拆解任务、转换数据),打造出拥有极高效率的AI算力中心。

图源:Google

这也是为什么Gemini能够以更低的订阅费用和更高的使用额度,疯狂抢占OpenAI等企业的用户群。即使单独看token价格,Gemini也是海外AI产品中旗舰模型定价较低、且主流模型定价与DeepSeek等国产模型厂商接近的代表之一。

而且,TPU也更擅长处理日常用户的海量计算请求,与未来的AI生态算得上是“专业对口”,以至于外界其实眼馋这套芯片已经很久了。在官宣销售计划后,Google同时也公布了一项50亿美元的协议,将与著名私募公司黑石共同建造一座大型算力中心,暂定容量为500兆瓦。

雷科技(ID:leitech)猜测,这个消息放出后,找Google询价或合作的企业估计不少,特别是那些想自建算力中心的企业。这时候可能有人觉得,亚马逊应该要急了,毕竟这是明抢云服务生意啊。其实不然,现在最头疼的估计是英伟达。

Google给英伟达来了一记“釜底抽薪”?

首先小雷想问一个问题:英伟达为什么能在AI时代成为最重要的公司之一?如果你的答案只是“GPU算力强”,那其实只说对了一半。

英伟达真正厉害的地方,是它早就不只是卖GPU。CUDA、NVLink、DGX、InfiniBand网络、AI软件库、开发者生态、服务器合作伙伴、云厂商适配,这些东西共同构成了英伟达的护城河。

所以,当你买来一张英伟达的算力卡并启动时,你买的并不只是一块卡,而是一整套已经被行业验证过的AI生态,那么对于大多数公司来说,英伟达的CUDA生态让他们无需“重复造轮子”,也就省下了许多精力和成本。

这也是为什么很多AI公司明知道英伟达GPU很贵,仍然不得不用。因为在AI大爆发的时期,“成本”是可以忽略的,唯一的指标是能不能领先对手或更快地追赶对手。但是,随着AI大模型进入普及期,大家想要的就不再只是“速度”了,面对庞大的用户基数,效率和性价比成为了新的重点。

Google显然也看到了这一点,所以他们押注TPU,并且将其打包成一套完整的方案,这套方案里的芯片并不是为了在算力性能上打败英伟达,而是要把Google过去多年在芯片、数据中心、网络、存储、调度和模型训练上的经验,包装成企业可以直接购买的云服务能力。

这才是Google真正“学英伟达”的地方,它学的不是卖芯片,而是卖系统和生态,把一系列硬件变成客户可以使用的“生产力”,这对于那些希望将算力中心掌握在自己手中的企业来说有着不小的吸引力。

那么,英伟达要慌了?倒也不至于,但是头疼也是真头疼,毕竟旗舰算力卡虽然赚钱,但是大家不可能一直处于“有多少买多少”的状态,而是会逐渐将目光投向其他更具性价比的芯片上,届时Google的TPU方案势必会对英伟达的这部分市场造成冲击。

不过对于整个AI行业来说,目前英伟达仍然是AI算力市场最认可的通用标准,CUDA生态的地位也不是一两代芯片就能轻易撼动的。尤其是在大模型训练环节,很多团队已经围绕英伟达的体系积累了大量经验,贸然切换平台风险并不低。

比如DeepSeek,前段时间上线的新模型就宣布可采用华为昇腾芯片训练,这还是在华为与DeepSeek深度合作后,经过几个版本的迭代后才做到的。

图源:昇腾

但是站在Google的角度来看,其实也不需要在所有场景里取代英伟达,只要它能抓住一部分企业客户,然后证明自己的效率高于其他算力生态,那么它就已经能从AI基础设施市场切走一块蛋糕。

尤其是推理阶段,Google的TPU算力服务器明显更占优势。大家都知道,token真要用起来,消耗速度不比开闸放水慢多少,前有Uber四个月烧光一年预算、神秘企业一个月花掉5亿美元的token费用,后有财大气粗的微软限制员工权限,勒令他们使用自家算力。

可以说,随着AI在各个领域的使用频率越来越高,肯定会有更多的案例证明,token的成本才是未来AI竞争的关键。因为谁的token成本更低,谁就能把AI普及到更多的业务线中,去抢占用户和市场。

算力变成基本资源,云厂商的机会来了

小雷觉得有个网友的比喻非常贴切:训练模型就像买车,而推理服务则像每天要烧的汽油,就算是大户人家,也不能天天让所有车都烧98;Google提供的算力就像是92,虽然动力有点不足,但是车一样跑,活一样干,而且更便宜。

前段时间,小雷就写过一篇文章,提到如今行业有个共识:AI算力正在变得越来越像电、水、宽带这样的基本资源。

而且对于用户来说,用户并不需要去知道“算力”是怎么生产出来的,但是会像关心水电费一样关心算力的价格,这个“用户”既可以是个人,也可以是企业、城市,乃至国家。

所以,在未来的AI市场中,英伟达仍然会很重要,因为没有高性能芯片,一切都无从谈起。但是当算力需求变成长期、稳定且规模化的基础资源后,话语权反而会逐渐转到云服务厂商手中。

这也是为什么Google、微软、亚马逊、阿里云、华为云这些云厂商不再满足于只做英伟达GPU算力的“转售商”,而是都在布局自己的算力生态。这当然不是说他们就不会继续采购英伟达GPU,因为市场需要,客户也需要,同样能卖出好价钱。

图源:雷科技

但与此同时,他们的真正发展重心必将转向自己的生态,这也是英伟达最需要警惕的事情,毕竟英伟达如今的市值,很大程度上都是以其作为“AI基础底座”为前提计算的,一旦英伟达失去对非顶级算力卡市场的掌控,那么就可能逐渐回到5年前在游戏显卡市场的位置:虽是顶尖,但并不是非你不可。

事实上,如果我们把视角拉回国内,类似的变化已经出现了。以前我们在聊国产AI算力卡的时候,往往会把焦点放在算力性能对比上,去讨论单卡性能距离顶尖算力卡还有多远。

这个问题固然重要,但如果只盯着芯片性能本身,就会忽略另一个关键:国内云厂商也在把芯片、集群、云平台、模型服务和行业解决方案变成一个完整的AI生产系统,而这才是国产AI最核心的竞争力。

这不是小雷说的,而是华为云、阿里云等核心云服务商都在做的事情。比如说华为的昇腾云服务,虽然屡次出圈的仍然是昇腾芯片,但是如今的华为已经围绕昇腾算力提供云化工具链、超节点集群、模型迁移、训练推理优化和行业落地能力。

图源:微博

而且,华为也在把这套算力生态推给更多的国产AI公司,除了前面提到的DeepSeek外,还有百度、科大讯飞、智谱、MiniMax等头部AI大厂。可以说,华为已经逐渐搭建好自己的算力生态,接下来要做的就是将更多伙伴拉上车,然后用更低的token价格去占领市场。

阿里云同样如此,他们在今年5月发布了真武M890训推一体AI芯片,而在此之前,真武810E也早就大规模部署到阿里云的灵骏智算平台中。在今年的阿里云峰会上,阿里云也直接宣布平头哥真武系列AI芯片累计出货量已达到56万片,年化营收规模跨入百亿级别。

可以说,在学习英伟达这件事上,国内云服务厂商不仅走得更快,而且也走得更早。

最强算力?不,全世界需要“最优算力”

当然,英伟达并不会因为Google开始卖TPU,就突然失去AI时代的核心位置。

至少在很长一段时间里,GPU、CUDA和开发者生态,依然会是整个AI产业绕不开的标准。尤其是在大模型训练、高性能计算和通用AI开发场景中,英伟达仍然是目前最成熟且最被行业认可的选择。

但问题在于,AI算力市场正在进入下一个阶段。

过去大家争的是“谁的芯片更强”,而现在企业真正关心的,正在变成“谁能把算力变得更便宜”。这时候,Google、华为云、阿里云这类云服务厂商的优势就开始显现了:它们拥有海量的个人和企业客户、数据、应用和场景,同时也更擅长把各种硬件包装成一套可以直接使用的生产力系统。

换句话说,AI时代真正稀缺的,已经不只是芯片本身,而是把芯片变成生产力的系统能力。

当算力越来越像水、电、宽带这样的基础资源,最终胜出的公司,未必只是那个单卡性能最强的厂商,而是那个能以更低成本、更高效率,把AI算力持续交付给客户的厂商。

所以,在雷科技看来,Google开卖TPU其实是一个信号,它在提醒整个行业:AI基础设施的竞争,已经不只是芯片大战,而是系统大战。

本文来自微信公众号“雷科技”,作者:雷科技

你可能也喜欢

以太坊质押税收争论因验证者重定向收入提案而爆发

一项名为“验证者重定向收益”的新提案在以太坊研究论坛发布，引发了对质押经济的激烈讨论。该提案旨在解决以太坊长期面临的公共物品和生态系统资金问题，试图让验证者能够将部分收益定向捐赠给选定的受益方，从而建立一种接近协议层的资金流，支持有利于以太坊整体发展的项目。然而，该机制迅速被批评者称为“质押税”，因为它触及了验证者的收入。尽管设计上强调验证者的自愿选择和集体决策，但反对声音担心，这种收益重定向在某些条件下可能变成强制行为，从而政治化验证过程，并围绕资金分配产生压力。支持者则认为，以太坊需要更可持续的长期资助模式，验证者应当能够围绕生态系统优先事项进行协调。目前，该提案仅处于早期讨论阶段，并未获得批准或成为以太坊共识的一部分。从论坛提议到最终协议变更，路径漫长且充满不确定性。尽管如此，由于质押经济是以太坊投资价值的核心，相关讨论仍可能引起ETH持有者的关注。当前这场争论更多是治理层面的探讨，而非实际的政策变化，市场参与者应将其视为一个观察信号，而非直接的交易指令。

bitcoinist17分钟前

bitcoinist17分钟前

IOSG创始人：以太坊不需要再来一次技术信仰，它需要一次马斯克式的妥协

IOSG创始人Jocy撰文指出，以太坊当前的核心问题并非缺乏技术信仰或路线图，而是需要一个“马斯克式的妥协”——即创始人Vitalik需要更深入地理解商业现实，并亲自推动以太坊在现实世界中的杀手级应用落地。文章认为，近期由前EF研究员和大型ETH持有方支持的ETHLabs等新机构的出现，是市场对以太坊基金会“无为而治”模式投下的不信任票。Vitalik与马斯克的根本区别在于，后者善于先吃透商业逻辑再驱动技术，而以太坊则习惯从技术和价值观出发，期待生态自行生长。在当下多链竞争、注意力向AI迁移的时代，这种模式的运气已不可持续。作者指出，以太坊面临的真正威胁是注意力的流失，而不仅仅是其他区块链的竞争。解决方案在于构建一个清晰的、能吸引顶尖人才的现实世界应用叙事。尽管以太坊基金会正试图通过分散化治理（如多节点独立决策）来应对挑战，但这可能带来方向碎片化、凝聚力不足的新问题。真正的凝聚力不能仅靠共同持有ETH资产，更需要一个所有人都看得懂并愿意押注的共同目标。文章最后强调，留给以太坊“俯身入局”、专注商业应用的时间窗口可能只有12到18个月，时间是其最无情的对手。创始人需要从仰望星空转向亲自下场，才能让理想之光真正照进现实。

marsbit59分钟前

marsbit59分钟前

京东和Open AI前CTO Mira Murati，押注了同一个AI赛道

京东开源了全球首个全栈开源视觉语言交互模型JoyAI-VL-Interaction，旨在突破传统AI“问答式”交互的局限，让AI能够基于连续视频流主动感知、判断并在适当时机提供帮助，例如在老人摔倒或赛事关键时刻自动预警或解说。该模型将视觉作为核心驱动模态，能自主决定何时响应、保持沉默或移交复杂任务给后台大模型。其8B参数设计轻量，支持在单张3090显卡上部署，并已集成至vLLM-Omni。几乎同时，OpenAI前CTO Mira Murati创办的Thinking Machines Lab也提出了“交互模型”概念，预示主动交互正成为行业重要方向。京东凭借在零售、物流、健康等真实场景的积累，正构建大规模物理世界数据集，以推动视觉交互在家庭看护、机器人、工业巡检等领域的落地。通过全栈开源，京东希望降低开发门槛，加速AI在物理世界中的主动应用生态发展。

marsbit1小时前

marsbit1小时前

别盲目申请，2026香港身份八大主流路径横评

最近香港人才政策调整频繁，形成了八大主流获取香港身份的途径，包括高才通(TTPS)、优才(QMAS)、技术专才(TP Stream)、职专VPAS等。这些计划各有其核心逻辑、企业聘用门槛及优缺点。本文通过一张全景对比图，清晰梳理了各路径的关键信息，旨在帮助读者避免盲目申请，节省可能高达数万元的中介费用。提醒所有申请人，最终应以香港入境事务处的官方公告为准。

marsbit1小时前

marsbit1小时前

研报解读：半导体板块涨了 155%，伯恩斯坦说 NVDA 和 AVGO 还“荒谬地便宜”

伯恩斯坦发布半导体行业季度报告指出，AI已成为半导体板块的核心驱动力。费城半导体指数过去一年大涨155.6%，主要受基本面强劲的支撑，EPS预期大幅提升。板块内部分化显著，内存、CPU等涨幅领先。报告认为，尽管板块整体估值处于历史高位，但英伟达（NVDA）和博通（AVGO）作为AI供应链最核心的环节，估值相对“荒谬地便宜”。基于其未来巨大的收入潜力，两者均获“跑赢大盘”评级。AMD因其在AI和CPU领域的双重机会也被上调至“跑赢大盘”。而高通（QCOM）因智能手机业务面临压力，增长乏力，评级维持“与大盘持平”。半导体设备和模拟芯片板块前景不一。设备商因产能建设需求持续被看好；模拟芯片虽在复苏，但估值已偏高，获“与大盘持平”评级。报告同时警示风险：板块交易拥挤度和库存水平均处于高位，若下游需求出现疲软，可能引发价格战。当前环境下，选股的重要性已超过单纯看多方向。

marsbit2小时前

研报解读：半导体板块涨了 155%，伯恩斯坦说 NVDA 和 AVGO 还“荒谬地便宜”

marsbit2小时前

交易

现货

合约

Google开卖TPU，大厂想要靠AI芯片生产“低价token”

文章摘要

Google给英伟达来了一记“釜底抽薪”?

算力变成基本资源,云厂商的机会来了

最强算力?不,全世界需要“最优算力”

相关问答

你可能也喜欢

以太坊质押税收争论因验证者重定向收入提案而爆发

IOSG创始人：以太坊不需要再来一次技术信仰，它需要一次马斯克式的妥协

京东和Open AI前CTO Mira Murati，押注了同一个AI赛道

别盲目申请，2026香港身份八大主流路径横评

研报解读：半导体板块涨了 155%，伯恩斯坦说 NVDA 和 AVGO 还“荒谬地便宜”

交易

热门分类

热门标签