微软按下vibe coding暂停键:「烧token」已经比员工贵了

marsbit发布于2026-05-26更新于2026-05-26

文章摘要

微软于2026年5月开始取消大部分员工对Claude Code的内部使用许可,计划在6月30日前完成。此举距离其全面推广该AI编程工具仅过去六个月。此前,微软鼓励员工使用“vibe coding”(通过自然语言描述让AI生成代码)提升效率,工具广受欢迎,但由此产生的巨额token使用成本超出了预期。内部消息指出,员工更偏爱Claude Code而非微软自家的Copilot CLI,这加剧了成本压力。 类似情况也出现在Uber和英伟达等公司,其AI工具预算迅速耗尽,或算力成本已超过人力成本。核心问题在于“副驾模式”:在保留原有员工结构和薪资的前提下,额外增加的浮动token成本导致总开支飙升,而员工生产力的提升未必能转化为直接收入。 与此相反,YC合伙人Tom Blomfield等人提出了不同的AI应用路径。他们认为,真正的AI原生公司应彻底重构组织,将人的角色聚焦为个人贡献者和直接负责人,同时将公司知识和流程沉淀为AI可读的“上下文资产”。在这种模式下,高昂的token消耗替代了传统的人力成本,少数员工加AI能完成以往大量团队的工作,从而实现整体成本的优化。 因此,微软的撤退并非否定AI价值,而是暴露了将AI简单嫁接于旧有组织结构的困境。未来的竞争关键在于能否进行组织重塑,将AI从“效率工具”转变为“核心生产力”,并重新定义企业的核心资产。

2026 年 5 月 14 日,微软已经开始取消大部分员工的 Claude Code 内部许可。截止日期是 6 月 30 日——也是微软财年最后一天。

仅仅 6 个月前,微软还在做完全相反的事——2025 年 12 月,它把 Claude Code 开放给数千名员工,包括工程师、产品经理、设计师,鼓励所有人都用 vibe coding 的方式来重塑工作流。员工很喜欢这个工具,但也许,太喜欢了。

但 6 个月之后,微软自己撤了。

而几乎在同一周,YC 的合伙人 Tom Blomfield 在一场 batch talk 上说了另一句话:「如果你的 API 账单不让你心痛,说明你烧得不够。」

同一个春天,硅谷正在为同一个问题给出两个完全相反的答案——AI 用起来,到底比人贵不贵?

01 vibe coding 的失败现场

微软取消的不是 Claude 这个模型。Anthropic 的模型还会继续通过 Copilot CLI 提供给微软员工。它取消的是 Claude Code 这个产品入口本身。

被影响最深的是「Experiences + Devices」这个部门——也就是 Windows、Microsoft 365、Outlook、Teams 和 Surface 背后的工程师团队。EVP Rajesh Jha 在内部备忘录里把这个决定包装成「工具链统一」(toolchain unification),但 The Verge 援引的微软内部消息更直白:员工普遍认为 Claude Code 比 Copilot CLI 更好用,Anthropic 这个工具在微软内部的流行,甚至让微软自家的 Copilot CLI 被「冷落」了。

换句话说,微软撤掉 Claude Code,不是因为它不行,是因为它太行

那个 6 月 30 日的截止日期也不是巧合——是微软财年的最后一天。砍掉一个员工普遍偏好的工具、换回自家产品、时间点卡在财年节点上——里面有多少是产品判断、有多少是财务考量,大家心知肚明。

微软不是孤例。

一个月前,Uber 的 CTO Praveen Neppalli Naga 对 The Information 透露:公司 2026 年全年的 AI 编程工具预算,在前 4 个月就烧光了。Uber 此前还专门搞过内部排行榜,用比赛的方式激励员工多用 AI——结果是预算崩盘。

更直白的是英伟达应用深度学习副总裁 Bryan Catanzaro 接受 Axios 采访时说的那句:「对我的团队来说,算力的成本远远超过员工的成本。」这是从一家硬件公司的高管嘴里说出来的——这家公司的核心产品就是卖算力。

Fortune 把这些线索串到一起,给文章起了一个非常 Fortune 的标题:「微软的报告暴露了 AI 真正的成本问题——用这玩意儿比养员工还贵」。

如果只读到这一层,结论很简单:vibe coding 失败了,AI 替代人这个故事可以收摊了。

但这个结论下早了。

02 Copilot 模式已经「撞墙」

要解释微软的撤退,得先讲清楚 vibe coding 是什么。

这个词是 Andrej Karpathy 在 2025 年初提出的——他描述了一种新的编程方式:开发者不再一行行写代码,而是用自然语言描述意图,让 LLM 生成代码。开发者甚至不读代码、只看结果——能跑就接受,不能跑就再让 AI 改一遍。

这是 AI 时代最有诱惑力的一种生产力承诺。它意味着:一个不会写 Rust 的工程师能让 AI 帮他写 Rust;一个产品经理能让 AI 帮他做出原型;一个设计师能让 AI 帮他写出能跑的代码。微软 2025 年 12 月那次开放 Claude Code 的对象——工程师、PM、设计师——恰好就是这三类人。这不是巧合,这是 vibe coding 最经典的落地姿势。

但 vibe coding 落到大公司里,会变成一件结构上很别扭的事。

假设微软有一个工程师,年薪 30 万美元。微软给他配一个 Claude Code 之后,他的产出提升了 20%——这是 vibe coding 最理想的状态。但与此同时,他每个月烧掉的 token 成本,是 200 美元、500 美元、还是 2000 美元?这个数字会随着他对 AI 的依赖越来越深而单调上升。

更麻烦的是,他不会因为「用了 AI」就被裁掉——他的 30 万年薪还在,福利还在,他的工位还在。

也就是说,微软的总成本结构是「原来的员工工资 + 新增的 token 账单」。这个公式只有一个方向——成本暴涨。

而「员工产出 +20%」这件事在财务上的反映是「营收 +20%」吗?不是。是「营收维持不变,但成本结构里多了一项 AI 账单」——因为大部分员工的产出,并不直接对应新增的收入,他写得更快不代表公司卖得更多。

这就是 Catanzaro 那句「算力比员工贵」真正的含义。它不是说 AI 笨,是说当你把 AI 装在原来的员工身上,你不可能让账算得过来。

这个逻辑还有数据支撑。

Gartner 最近一份预测里说:到 2030 年,一万亿参数大模型的推理成本将比 2025 年下降近 90%。听上去是 AI 越来越便宜了,但 Gartner 的真正结论是:这并不会让企业的 AI 总账单变便宜。Gartner 高级总监分析师 Will Sommer 说过一句话——「CPO 们不应该把『商品级 token 的通缩』和『前沿推理能力的入门化』混为一谈。」

Goldman Sachs 的预测更直接:到 2030 年,agentic AI 将推动 token 消耗量增长 24 倍,达到每月 120 千万亿。单 token 价格下降 90%、消耗量增长 24 倍——结果是总账单还在涨。

黄仁勋有一个更激进的版本。他几个月前在公开场合说,未来每一个英伟达员工身边都会有 100 个 AI agent 一起工作。

听上去很美。但如果你是 CFO,你听到的是什么?是 100 个 token 烧炉,每天 24 小时不停地烧。

问题不是 AI 太贵。问题是「给每个员工配一个 AI 副驾」这个假设本身。

这种姿势在科技圈有一个流行的名字——「副驾模式」(copilot mode)。它的核心假设是:人继续在驾驶位上,AI 在副驾位上给你建议。它不替代你,只是让你更快。

这个假设在文字层面非常温柔——「AI 不会抢走你的工作,AI 只是帮你」。但在财务层面,它的隐含意思是:原来的所有工资不变,但额外多了一项 token 费用

而 token 不是固定费用,是按消耗计费的。员工用得越多,公司付得越多——这恰好是企业最不愿意看到的成本结构:浮动、上不封顶、跟着产能反向放大。

微软在 2025 年 12 月开放 Claude Code 的时候,可能并没有完全意识到这一点。它本来想的是:让员工试一下,看看 AI 能让工作效率提升多少。但 6 个月之后,员工真的用上瘾了,Claude Code 在微软内部太流行——结果就是 token 账单远超预期,超过了微软自己能从这种流行中拿回的产出。

微软撤了。但撤的不是 AI——撤的是「员工继续在驾驶位、AI 在副驾位」这种结构。

这是一种结构性的失败。它不会因为模型更便宜而消失,也不会因为员工更熟练而消失——它会随着员工对 AI 越来越熟练而更严重

03 烧 token,是因为不烧人头

几乎和微软撤退同一周,Tom Blomfield 在 YC 的 batch talk 上提出了一个完全不同的视角。他没有讨论「AI 该怎么用」——他讨论的是「AI 时代的公司应该长什么样」。

Blomfield 的判断很直接:今天大部分公司还是「罗马军团」式的结构——信息逐级向上传递、命令逐级向下分发、人是协调的核心。把 AI 装到这种结构上,效果就是把热兵器发给罗马步兵——他们会用得更狠,但战术不会变

真正的 AI-native 公司应该是另一种样子。

Blomfield 用了一个很具体的描述:每个动作都应该产生一个可记录、可调用的产物,让一切对 AI 清晰可读(legible to AI);公司应该被设计成「自我改进的 AI 循环」,系统能感知环境、做出决策、调用工具、接收反馈、自我修正。

人在这种公司里只剩两种角色。一是个人贡献者——每个人不论部门都是 builder 和 operator,开会带原型,不光带想法;二是 DRI(直接负责人)——每个产出都有一个明确的责任人,「不能躲到 AI 后面」。

然后 Blomfield 说了那句金句:「如果你的 API 账单不让你心痛,说明你烧得不够。」

这句话如果出现在微软的 CFO 办公室,会被当成笑话;但放在 YC 一屋子初创公司创始人面前,没有人觉得疯狂。

为什么?

YC 另一位合伙人 Diana Hu 在 5 月初的 Startup School 里给出了答案。她讲了一句话——「最大化的不是人头,是 token 消耗」。她还有更直白的版本:「一个人配上 AI 工具,就等于过去一支大工程师团队。」

注意这里的关键词:「等于」。不是「相当于」,不是「类似于」——是替代。

YC 那批 P26 2026 春季 batch 里,已经有不少公司在用 5、6 个人做过去需要 20、30 人才能做的事。它们的 token 账单当然高,但它们的人员账单极低——账整体算下来,是赚的。

更激进的案例是 Block。Jack Dorsey 旗下这家金融科技公司最近裁了 40% 的员工。这不是传统意义上的「降本增效」——Block 同时把 AI 工具的内部投入加大,新结构就是 Diana Hu 描述的那种:IC + DRI + AI agent。

烧 token 在 YC 的语境里不是支出,是替代。它替代的不是 AI 之外的开销,是人头工资。账之所以算得过来,是因为公司同步去掉了那些原本要烧工资的位置。

这就是微软和 YC 看到同一件事,却给出相反答案的根本原因——他们烧的根本不是同一种 token。微软的 token 是给原班人马的副驾加油,YC 的 token 是替代原本的驾驶员

04 真正的资产正在被重新定义

Tom Blomfield 在对谈里,还说了另一句更耐人寻味的话——「人是短暂的,上下文文档才是重要的。」

这是一个会计学层面的判断。

传统公司的资产负债表是怎么写的?左边是固定资产、应收账款、商誉、IP,右边是负债和股东权益。员工不在资产那一栏——员工是成本。但每个公司心里都知道,员工其实是真正的资产:客户关系在销售脑子里,业务直觉在产品经理脑子里,技术 know-how 在工程师脑子里。

这种「资产」的特点是会走的。员工离职,资产就跑了。

而 Blomfield 描述的 AI-native 公司,是在做一件事:把这些原本只存在于人脑里的资产,全部抽取出来,变成 AI 可读、可调用、可迭代的「上下文资产」。

具体形式是什么?是详尽的需求文档;是把每一次决策、每一次邮件往来、每一次 Slack 讨论沉淀下来的过程文档;是开放的 MCP 接口和 API;是每个内部工具产生的 artifact——所有这些东西,构成了一家公司新的、可继承的、不会随员工离职而蒸发的资产层。

人在这种公司里反而变成「变量」——可以快速接入,也可以快速离开,因为公司的核心资产不在人脑里,在文档里。

这种结构如果成立,意味着的不只是一种新的组织模式——意味着公司的资产负债表正在被重写。一家 6 个人、烧着惊人 token 账单的 AI-native 公司,看上去财务不健康,但它真正的资产可能比一家 60 个人的传统公司还厚——只是这种资产,现在的会计准则还没学会怎么计算。

换句话来讲,vibe coding 没有死。它只是不属于传统公司。

微软撤掉 Claude Code 的那天,不是 AI 经济学失败的一天——是一种把 AI 装在旧组织上的姿势,被它自己证伪的一天。

而 YC 那一屋子初创公司里,正在长出另一种姿势——它们小、它们烧、它们没有 KPI 表里的「员工 AI 使用率」、它们的 CFO 也不会因为 token 账单暴涨而恐慌——因为他们烧的本来就不是「员工的副驾」,是「员工的替代品」。

未来几年,所有还在让员工「多用一点 AI」的中型公司,都会撞到微软撞过的那堵墙——结构性必涨的 token 账单。

但撞墙的真正原因,不是 AI 太贵——是组织还没改。

而绝大多数公司,恐怕一时半会儿都不会改。

相关问答

Q微软为何取消Claude Code的内部许可?

A主要原因包括:1. 财务考量,员工广泛使用Claude Code导致API token消耗成本远超预期;2. 工具链统一,员工普遍偏好第三方工具Claude Code,导致微软自家的Copilot CLI被冷落;3. ‘副驾模式’的成本结构问题,即保留原有人力成本的同时新增上不封顶的浮动AI使用成本,导致总成本暴涨。

Q根据文章,vibe coding(副驾模式)在大公司面临的根本困境是什么?

A根本困境是一种成本结构上的悖论:将AI作为‘副驾’赋能现有员工,虽然可能提升个人效率(如+20%),但公司的总成本结构变为‘原有全员工资 + 新增的浮动token账单’。由于大部分员工的产出提升并不直接对应公司营收的线性增长,这导致了总成本飙升而财务收益不明确,最终使账算不过来。

QTom Blomfield和YC所代表的AI-native初创公司,其使用AI的核心逻辑与微软有何本质不同?

A本质不同在于对AI的定位和由此带来的成本结构:微软等大公司是将AI作为现有员工的‘副驾’,是成本叠加;而YC倡导的AI-native公司是用AI‘替代’部分原有岗位,其逻辑是‘最大化token消耗以最小化人头’,通过少数员工驱动大量AI Agent来完成工作,从而在总账上实现人员成本大幅降低,因此高额的token账单被视为一种有效的替代性投资。

Q文章中提到“真正的资产正在被重新定义”,具体指什么?

A指在AI-native公司中,公司的核心资产从传统意义上存在于员工头脑中的经验、知识和客户关系(这些是‘会走的资产’),转变为被系统化抽取和沉淀下来的‘上下文资产’,包括详尽的需求文档、决策过程记录、开放的API接口、内部工具产物等。这些资产是AI可读、可调用、可迭代的,不随员工离职而消失,构成了公司新的、更稳固的价值基础。

Q根据文章,未来多数中型公司在应用AI时将面临的主要挑战是什么?

A主要挑战是‘结构性必涨的token账单’这堵墙。如果这些公司仅停留在鼓励员工‘多用一点AI’的‘副驾模式’,而不对组织架构进行根本性改造(即从‘罗马军团’式的人为核心协调,转向以AI和上下文资产为核心驱动力的AI-native结构),那么随着AI使用程度加深,浮动且上不封顶的token成本将无法被线性增长的业务收益所覆盖,最终导致财务不可持续。

你可能也喜欢

Polymarket在印尼遭禁,全球打击行动日益加剧

在全球加强对线上赌博及预测市场监管的背景下,印度尼西亚近日宣布禁止访问预测市场平台Polymarket,起因是该平台上关于总统普拉博沃·苏比安托任期可能提前结束的投注在社交媒体上广泛传播并引发关注。 印尼通信与数字事务部在官方声明中表示,此举旨在保护公众,尤其是年轻一代和数字空间用户。该部数字空间监管总干事亚历山大·萨巴尔强调,即使以“预测市场”为名并使用区块链或加密资产,只要涉及对事件结果进行真实货币投注,即被视为赌博,违反印尼法律。当局将屏蔽其他涉嫌“便利线上赌博行为”的预测市场服务,并追查与之相关或进行推广的社交媒体账号。 印尼当局指出,此决定与全球其他司法管辖区的措施一致。过去两年,中国台湾、泰国、中国大陆和印度等地已依据当地法律对Polymarket实施限制,新加坡、哥伦比亚和印度则正式屏蔽了该平台。今年三月,阿根廷当局在全国范围内封锁了Polymarket,理由是其作为无照线上赌博平台运营;巴西央行也宣布禁止包括Polymarket和Kalshi在内的预测市场和投注平台,称其未遵守当地衍生品交易规定且引发投资者保护和市场诚信担忧。 在美国,预测市场同样面临审查。众议员詹姆斯·科默近日对Polymarket和Kalshi启动正式调查,起因是一系列涉及美国机密军事行动和地缘政治事件的可疑交易。他已致信两家公司首席执行官,要求说明平台如何检测和防止内幕交易、验证用户身份以及执行对受限地区用户的禁令。同日,这两家预测市场巨头在内华达州和华盛顿州试图阻止针对其的赌博相关执法行动也未获成功。

bitcoinist23分钟前

Polymarket在印尼遭禁,全球打击行动日益加剧

bitcoinist23分钟前

交易

现货
合约
活动图片