Ngày 14 tháng 5 năm 2026, Microsoft đã bắt đầu hủy bỏ giấy phép nội bộ Claude Code cho phần lớn nhân viên. Hạn chót là ngày 30 tháng 6 – cũng là ngày cuối cùng của năm tài chính Microsoft.
Chỉ 6 tháng trước, Microsoft vẫn đang làm điều ngược lại hoàn toàn – Tháng 12 năm 2025, họ mở Claude Code cho hàng nghìn nhân viên, bao gồm kỹ sư, quản lý sản phẩm, nhà thiết kế, khuyến khích mọi người sử dụng phương thức vibe coding để định hình lại quy trình làm việc. Nhân viên rất thích công cụ này, nhưng có lẽ, thích quá rồi.
Nhưng 6 tháng sau, chính Microsoft rút lui.
Và gần như cùng tuần đó, đối tác YC Tom Blomfield đã nói một câu khác trong một buổi batch talk: “Nếu hóa đơn API không làm bạn đau lòng, nghĩa là bạn đốt chưa đủ.”
Cùng một mùa xuân, Thung lũng Silicon đang đưa ra hai câu trả lời hoàn toàn trái ngược cho cùng một vấn đề – Dùng AI, rốt cuộc có đắt hơn con người không?
01 Hiện trường thất bại của vibe coding
Microsoft hủy bỏ không phải là mô hình Claude. Mô hình của Anthropic sẽ tiếp tục được cung cấp cho nhân viên Microsoft thông qua Copilot CLI. Họ hủy bỏ chính bản thân lối vào sản phẩm Claude Code.
Bộ phận bị ảnh hưởng sâu nhất là “Experiences + Devices” – tức là nhóm kỹ sư đứng sau Windows, Microsoft 365, Outlook, Teams và Surface. Phó chủ tịch điều hành Rajesh Jha trong bản ghi nhớ nội bộ đã đóng gói quyết định này thành “thống nhất chuỗi công cụ” (toolchain unification), nhưng thông tin nội bộ Microsoft được The Verge trích dẫn thẳng thắn hơn: Nhân viên nói chung cho rằng Claude Code dễ dùng hơn Copilot CLI, sự phổ biến của công cụ Anthropic này trong nội bộ Microsoft thậm chí còn khiến Copilot CLI của chính Microsoft bị “bỏ rơi”.
Nói cách khác, Microsoft gỡ bỏ Claude Code không phải vì nó không được, mà vì nó quá được.
Ngày hạn chót 30 tháng 6 đó cũng không phải ngẫu nhiên – đó là ngày cuối cùng của năm tài chính Microsoft. Cắt bỏ một công cụ mà nhân viên ưa thích, quay lại sản phẩm của mình, thời điểm khớp với mốc năm tài chính – trong đó có bao nhiêu phần là đánh giá sản phẩm, bao nhiêu phần là cân nhắc tài chính, mọi người đều hiểu.
Microsoft không phải là trường hợp cá biệt.
Một tháng trước, CTO của Uber, Praveen Neppalli Naga, tiết lộ với The Information: Ngân sách cả năm 2026 của công ty cho công cụ lập trình AI, đã bị đốt hết trong 4 tháng đầu tiên. Uber trước đó còn tổ chức bảng xếp hạng nội bộ, dùng cách thi đua để khuyến khích nhân viên dùng nhiều AI – kết quả là ngân sách sụp đổ.
Thẳng thắn hơn là câu nói của Phó chủ tịch Deep Learning Ứng dụng NVIDIA, Bryan Catanzaro, trong một cuộc phỏng vấn với Axios: “Đối với đội của tôi, chi phí tính toán vượt xa chi phí nhân viên.” Câu này được thốt ra từ miệng của một giám đốc điều hành công ty phần cứng – sản phẩm cốt lõi của công ty này chính là bán sức mạnh tính toán.
Fortune xâu chuỗi những manh mối này lại, đặt cho bài viết một tiêu đề rất Fortune: “Báo cáo của Microsoft phơi bày vấn đề chi phí thực sự của AI – Dùng thứ này còn đắt hơn nuôi nhân viên.”
Nếu chỉ đọc đến tầng này, kết luận rất đơn giản: vibe coding thất bại, câu chuyện AI thay thế con người có thể thu dọn.
Nhưng kết luận này hơi sớm.
02 Mô hình Copilot đã “đâm đầu vào tường”
Để giải thích sự rút lui của Microsoft, trước tiên phải nói rõ vibe coding là gì.
Từ này do Andrej Karpathy đề xuất vào đầu năm 2025 – ông mô tả một phương thức lập trình mới: Nhà phát triển không còn viết từng dòng code, mà dùng ngôn ngữ tự nhiên để mô tả ý định, để LLM tạo ra code. Nhà phát triển thậm chí không đọc code, chỉ xem kết quả – chạy được thì chấp nhận, không chạy được thì bảo AI sửa lại.
Đây là một lời hứa về năng suất hấp dẫn nhất trong thời đại AI. Nó có nghĩa là: Một kỹ sư không biết viết Rust có thể nhờ AI viết Rust giúp; một quản lý sản phẩm có thể nhờ AI tạo nguyên mẫu; một nhà thiết kế có thể nhờ AI viết code chạy được. Đối tượng mở Claude Code lần đó của Microsoft vào tháng 12 năm 2025 – kỹ sư, PM, nhà thiết kế – vừa vặn là ba loại người này. Đây không phải trùng hợp, đây là tư thế triển khai kinh điển nhất của vibe coding.
Nhưng vibe coding rơi vào công ty lớn, sẽ trở thành một việc rất vặn vẹo về mặt cấu trúc.
Giả sử Microsoft có một kỹ sư, lương hàng năm 300 nghìn USD. Sau khi Microsoft trang bị cho anh ta một Claude Code, sản lượng của anh ta tăng 20% – đây là trạng thái lý tưởng nhất của vibe coding. Nhưng đồng thời, chi phí token anh ta đốt mỗi tháng là 200 USD, 500 USD, hay 2000 USD? Con số này sẽ tăng đơn điệu cùng với sự phụ thuộc ngày càng sâu vào AI của anh ta.
Phiền phức hơn là, anh ta sẽ không bị sa thải vì “dùng AI” – lương 300 nghìn USD hàng năm của anh ta vẫn còn, phúc lợi vẫn còn, chỗ ngồi của anh ta vẫn còn.
Tức là, cơ cấu tổng chi phí của Microsoft là “lương nhân viên cũ + hóa đơn token mới tăng”. Công thức này chỉ có một hướng – chi phí bùng nổ.
Mà việc “sản lượng nhân viên +20%” này phản ánh trên tài chính là “doanh thu +20%” sao? Không. Là “doanh thu giữ nguyên, nhưng cơ cấu chi phí lại thêm một khoản hóa đơn AI” – bởi vì sản lượng của phần lớn nhân viên không trực tiếp tương ứng với doanh thu mới tăng, anh ta viết nhanh hơn không có nghĩa là công ty bán được nhiều hơn.
Đây chính là ý nghĩa thực sự của câu “sức mạnh tính toán đắt hơn nhân viên” của Catanzaro. Nó không phải nói AI ngu, mà là nói khi bạn lắp AI lên người nhân viên cũ, bạn không thể làm cho sổ sách cân đối được.
Logic này còn có dữ liệu hỗ trợ.
Trong một dự đoán gần đây của Gartner nói rằng: Đến năm 2030, chi phí suy luận của mô hình lớn nghìn tỷ tham số sẽ giảm gần 90% so với năm 2025. Nghe có vẻ là AI ngày càng rẻ, nhưng kết luận thực sự của Gartner là: Điều này sẽ không làm tổng hóa đơn AI của doanh nghiệp rẻ đi. Giám đốc phân tích cấp cao của Gartner, Will Sommer, đã nói một câu – “Các CPO không nên nhầm lẫn giữa ‘giảm phát token cấp hàng hóa’ và ‘phổ cập hóa năng lực suy luận tiên phong’.”
Dự đoán của Goldman Sachs còn trực tiếp hơn: Đến năm 2030, agentic AI sẽ thúc đẩy lượng tiêu thụ token tăng 24 lần, đạt 120 nghìn tỷ mỗi tháng. Giá đơn token giảm 90%, lượng tiêu thụ tăng 24 lần – kết quả là tổng hóa đơn vẫn tăng.
Huang Renxun có một phiên bản cấp tiến hơn. Ông đã nói ở nơi công cộng vài tháng trước, trong tương lai mỗi nhân viên NVIDIA sẽ có 100 AI agent làm việc cùng.
Nghe rất đẹp. Nhưng nếu bạn là CFO, bạn nghe thấy gì? Là 100 lò đốt token, 24 giờ mỗi ngày không ngừng đốt.
Vấn đề không phải là AI quá đắt. Vấn đề là bản thân giả định “trang bị cho mỗi nhân viên một phi công phụ AI”.
Tư thế này có một cái tên phổ biến trong giới công nghệ – “chế độ phi công phụ” (copilot mode). Giả định cốt lõi của nó là: Con người tiếp tục ở vị trí lái, AI ở ghế phụ đưa ra gợi ý cho bạn. Nó không thay thế bạn, chỉ làm bạn nhanh hơn.
Giả định này ở mặt văn tự rất dịu dàng – “AI sẽ không cướp việc của bạn, AI chỉ giúp bạn”. Nhưng ở mặt tài chính, ý nghĩa ngầm của nó là: Tất cả tiền lương cũ không đổi, nhưng thêm một khoản phí token.
Mà token không phải chi phí cố định, là tính phí theo tiêu thụ. Nhân viên dùng càng nhiều, công ty trả càng nhiều – đây vừa vặn là cơ cấu chi phí mà doanh nghiệp không muốn thấy nhất: linh động, không giới hạn trên, phóng đại ngược theo năng lực sản xuất.
Microsoft khi mở Claude Code vào tháng 12 năm 2025, có thể chưa hoàn toàn nhận ra điểm này. Ban đầu họ nghĩ: Để nhân viên thử một chút, xem AI có thể nâng cao hiệu suất làm việc bao nhiêu. Nhưng 6 tháng sau, nhân viên thực sự nghiện dùng, Claude Code quá phổ biến trong nội bộ Microsoft – kết quả là hóa đơn token vượt xa dự kiến, vượt quá sản lượng mà chính Microsoft có thể thu lại từ sự phổ biến đó.
Microsoft rút lui. Nhưng rút lui không phải là AI – rút lui là cấu trúc “nhân viên tiếp tục ở vị trí lái, AI ở ghế phụ” này.
Đây là một thất bại về cấu trúc. Nó sẽ không biến mất vì mô hình rẻ hơn, cũng không biến mất vì nhân viên thành thạo hơn – nó sẽ nghiêm trọng hơn cùng với việc nhân viên ngày càng thành thạo AI.
03 Đốt token, là vì không đốt đầu người
Gần như cùng tuần Microsoft rút lui, Tom Blomfield trong batch talk của YC đã đề xuất một góc nhìn hoàn toàn khác. Ông không thảo luận “AI nên dùng thế nào” – ông thảo luận là “Công ty thời đại AI nên trông như thế nào”.
Phán đoán của Blomfield rất trực tiếp: Hôm nay phần lớn công ty vẫn là cấu trúc kiểu “Quân đoàn La Mã” – thông tin truyền lên từng cấp, mệnh lệnh phân phát xuống từng cấp, con người là hạt nhân phối hợp. Lắp AI lên cấu trúc này, hiệu quả là phát vũ khí nóng cho bộ binh La Mã – họ sẽ dùng mạnh hơn, nhưng chiến thuật sẽ không thay đổi.
Công ty AI-native thực sự nên là một dạng khác.
Blomfield dùng một mô tả rất cụ thể: Mỗi động tác đều nên tạo ra một sản phẩm có thể ghi lại, có thể gọi ra, làm cho mọi thứ rõ ràng, đọc được đối với AI (legible to AI); công ty nên được thiết kế thành “vòng lặp AI tự cải tiến”, hệ thống có thể cảm nhận môi trường, đưa ra quyết định, gọi công cụ, tiếp nhận phản hồi, tự sửa chữa.
Con người trong công ty kiểu này chỉ còn hai vai trò. Một là người đóng góp cá nhân – mỗi người bất kể bộ phận đều là builder và operator, họp mang nguyên mẫu, không chỉ mang ý tưởng; hai là DRI (người chịu trách nhiệm trực tiếp) – mỗi sản phẩm đầu ra đều có một người chịu trách nhiệm rõ ràng, “không thể trốn sau lưng AI”.
Sau đó Blomfield nói câu vàng đó: “Nếu hóa đơn API không làm bạn đau lòng, nghĩa là bạn đốt chưa đủ.”
Câu này nếu xuất hiện ở văn phòng CFO của Microsoft, sẽ bị coi là trò cười; nhưng đặt trước mặt một phòng đầy nhà sáng lập startup của YC, không ai thấy điên rồ.
Tại sao?
Một đối tác khác của YC, Diana Hu, trong Startup School đầu tháng 5 đã đưa ra câu trả lời. Cô nói một câu – “Tối đa hóa không phải đầu người, là tiêu thụ token”. Cô còn có phiên bản thẳng thắn hơn: “Một người trang bị công cụ AI, bằng với một đội kỹ sư lớn trước đây.”
Chú ý từ khóa ở đây: “bằng với”. Không phải “tương đương”, không phải “tương tự” – là thay thế.
Trong lô P26 mùa xuân 2026 của YC, đã có không ít công ty dùng 5, 6 người làm việc mà trước đây cần 20, 30 người mới làm được. Hóa đơn token của họ đương nhiên cao, nhưng hóa đơn nhân sự cực thấp – tính tổng thể, là có lãi.
Trường hợp cấp tiến hơn là Block. Công ty fintech dưới trướng Jack Dorsey này gần đây đã cắt giảm 40% nhân viên. Đây không phải “giảm chi phí tăng hiệu quả” theo nghĩa truyền thống – Block đồng thời tăng cường đầu tư nội bộ vào công cụ AI, cấu trúc mới chính là loại Diana Hu mô tả: IC + DRI + AI agent.
Đốt token trong ngữ cảnh của YC không phải chi tiêu, là thay thế. Nó thay thế không phải chi phí ngoài AI, là lương đầu người. Sổ sách tính được, là vì công ty đồng thời loại bỏ những vị trí vốn phải đốt lương.
Đây chính là nguyên nhân cơ bản Microsoft và YC nhìn cùng một việc, nhưng đưa ra câu trả lời trái ngược – họ đốt căn bản không phải cùng một loại token. Token của Microsoft là đổ nhiên liệu cho phi công phụ của đội ngũ cũ, token của YC là thay thế tài xế vốn có.
04 Tài sản thực sự đang được định nghĩa lại
Tom Blomfield trong cuộc đối thoại, còn nói một câu đáng suy nghĩ hơn – “Con người là nhất thời, tài liệu ngữ cảnh mới là quan trọng.”
Đây là một phán đoán ở tầm kế toán.
Bảng cân đối kế toán của công ty truyền thống viết thế nào? Bên trái là tài sản cố định, khoản phải thu, lợi thế thương mại, IP, bên phải là nợ phải trả và vốn chủ sở hữu. Nhân viên không ở cột tài sản – nhân viên là chi phí. Nhưng mỗi công ty trong lòng đều biết, nhân viên thực ra là tài sản thực sự: quan hệ khách hàng ở trong đầu sales, trực giác nghiệp vụ ở trong đầu quản lý sản phẩm, kỹ thuật know-how ở trong đầu kỹ sư.
Đặc điểm của loại “tài sản” này là sẽ đi. Nhân viên nghỉ việc, tài sản chạy mất.
Mà công ty AI-native Blomfield mô tả, đang làm một việc: Trích xuất toàn bộ những tài sản vốn chỉ tồn tại trong não người này ra, biến thành “tài sản ngữ cảnh” AI có thể đọc, có thể gọi, có thể lặp lại.
Cụ thể hình thức là gì? Là tài liệu yêu cầu chi tiết; là quá trình lắng đọng mỗi quyết định, mỗi lần trao đổi email, mỗi lần thảo luận Slack thành tài liệu; là giao diện MCP mở và API; là artifact do mỗi công cụ nội bộ tạo ra – tất cả những thứ này, cấu thành một tầng tài sản mới, có thể kế thừa, không bay hơi theo nhân viên nghỉ việc của một công ty.
Con người trong công ty kiểu này ngược lại trở thành “biến số” – có thể nhanh chóng tiếp cận, cũng có thể nhanh chóng rời đi, bởi vì tài sản cốt lõi của công ty không ở trong não người, mà ở trong tài liệu.
Cấu trúc này nếu thành lập, ý nghĩa không chỉ là một mô hình tổ chức mới – mà là bảng cân đối kế toán của công ty đang được viết lại. Một công ty AI-native 6 người, đốt hóa đơn token kinh người, nhìn không lành mạnh về tài chính, nhưng tài sản thực sự của nó có thể còn dày hơn một công ty truyền thống 60 người – chỉ là loại tài sản này, chuẩn mực kế toán hiện tại chưa học được cách tính.
Nói cách khác, vibe coding không chết. Nó chỉ không thuộc về công ty truyền thống.
Ngày Microsoft gỡ bỏ Claude Code, không phải là ngày kinh tế học AI thất bại – là ngày một tư thế lắp AI lên tổ chức cũ, bị chính nó chứng minh là sai.
Mà trong phòng đầy startup của YC, đang mọc lên một tư thế khác – chúng nhỏ, chúng đốt, chúng không có “tỷ lệ sử dụng AI của nhân viên” trong biểu KPI, CFO của chúng cũng sẽ không hoảng sợ vì hóa đơn token bùng nổ – bởi vì thứ họ đốt vốn không phải “phi công phụ của nhân viên”, mà là “vật thay thế nhân viên”.
Vài năm tới, tất cả công ty cỡ vừa còn đang bắt nhân viên “dùng thêm một chút AI”, đều sẽ đâm vào bức tường Microsoft đã đâm – hóa đơn token tăng cấu trúc tất yếu.
Nhưng nguyên nhân thực sự đâm vào tường, không phải AI quá đắt – là tổ chức chưa thay đổi.
Mà phần lớn công ty, e rằng một lúc nửa khắc sẽ không thay đổi.









