AI tự động hóa những 'công việc nhân viên ghét' chứ không phải những 'công việc tạo ra tiền' cho doanh nghiệp.
Vài ngày trước, Geek Park đưa tin rằng Microsoft, công ty đặt cược lớn vào AI, đã lặng lẽ dừng cấp phép Claude Code cho phần lớn nhân viên nội bộ.
Điều này rất kỳ lạ, bởi vì trong làn sóng ứng dụng AI lần này, điểm bán hàng lớn nhất hướng tới người dùng doanh nghiệp là 'tăng hiệu suất'. Đã có thể tăng hiệu suất, tại sao Microsoft lại ngừng cho nhân viên sử dụng Claude Code?
Microsoft không phải là công ty duy nhất làm vậy, 'thắt chặt lượng Token sử dụng', không còn khuyến khích nhân viên Vibe Coding điên cuồng, đã trở thành xu hướng mới của các ông lớn Thung lũng Silicon.
Uber đã tiêu hết ngân sách AI token cả năm chỉ trong bốn tháng. Hóa đơn hàng năm của Salesforce cho Anthropic là khoảng 300 triệu USD. Một cố vấn AI tiết lộ rằng một khách hàng của ông có chi tiêu AI lên tới 500 triệu USD mỗi tháng. Thậm chí Meta đã lặng lẽ gỡ bảng xếp hạng 'tokenmaxxing' nội bộ - bảng xếp hạng vốn được tạo ra để khuyến khích nhân viên sử dụng AI nhiều hơn.
Bây giờ, các doanh nghiệp đang làm một việc mà vài năm trước không dám nghĩ tới:
Hạn chế và giám sát việc nhân viên sử dụng AI.
Tại sao các ông lớn lại đồng loạt chuyển hướng?
'Tokenmaxxing', bức tranh thu nhỏ của thời đại
Để hiểu cuộc khủng hoảng chi phí ngày nay, trước tiên phải hiểu 'tokenmaxxing' là gì.
Từ này bắt đầu phổ biến vào khoảng năm 2025, nghĩa đen là 'tối đa hóa lượng token sử dụng'. Đằng sau nó là một logic quản lý - vì công ty đã bỏ tiền lớn mua công cụ AI, nhân viên nên sử dụng hết sức, sử dụng càng nhiều chứng tỏ bạn càng 'chuyển đổi số', sử dụng càng ít là lãng phí tài nguyên. Do đó, nhiều công ty đặt hạn ngạch sử dụng, bảng xếp hạng, thậm chí hiệu suất công việc, thúc giục nhân viên sử dụng AI.
Kết quả là gì?
Nhân viên bắt đầu sử dụng mô hình AI cấp doanh nghiệp của công ty để tra thời tiết, viết lời chúc sinh nhật, hỏi hôm nay ăn gì.
Một nghiên cứu trên 2444 công ty phát hiện ra rằng cứ mỗi 1 USD doanh nghiệp chi cho AI token, 0.44 USD được dùng để sửa lỗi do AI tạo ra, 0.27 USD để viết lại mã code do AI tạo, 0.11 USD tiêu hao do chậm trễ trong việc xem xét và hợp nhất.
Nói cách khác, đằng sau mỗi đô la chi phí mua sắm AI, còn ẩn chứa gần 80% tổn thất ngầm.
Nhà đầu tư Shruti Gandhi dùng một phép ẩn dụ rất chính xác: 'Doanh nghiệp tokenmaxxing, giống như công ty đo năng suất bằng cách bật tất cả đèn - chi nhiều tiền hơn, không bằng sản xuất nhiều hơn.'
Mỉa mai hơn nữa, hầu hết các công ty này thậm chí không biết nhân viên đang dùng AI để làm gì, càng không biết việc hoàn thành những nhiệm vụ đó, có mang lại bất kỳ thay đổi nào nhờ AI hay không.
Cuộc 'đua đốt tiền' này kéo dài từ năm 2024 đến năm 2025, và cuối cùng đã bùng nổ tập trung vào năm nay. JPMorgan đã xuất bản một báo cáo với ngôn từ gay gắt, tiêu đề thẳng thừng đến mức khó chịu - 'Chi phí AI Token đang nuốt chửng lợi nhuận Internet'.
Shopify, Spotify, ServiceNow, Roku trong các cuộc gọi báo cáo tài chính đều đề cập AI trở thành áp lực chính về chi phí vận hành. Bầu không khí của toàn ngành, bắt đầu chuyển từ 'dùng AI thật ngầu' sang 'tiền này cuối cùng có đáng hay không'.
Khi CEO bắt đầu nghi ngờ ROI
Chỉ 14% CFO cho biết họ có thể nhìn thấy lợi tức đầu tư AI rõ ràng, có thể đo lường được.
Andrew Macdonald, Giám đốc điều hành Uber, đã nói một câu rất thẳng thắn trong podcast - họ phát hiện khó liên kết việc tăng năng suất cá nhân của nhân viên với tác động kinh doanh tổng thể của công ty. 'Nếu bạn không thể thấy AI giúp bạn đẩy bao nhiêu tính năng có giá trị cho người dùng, chi phí token càng khó tự biện minh hơn.'
Câu này chỉ ra cốt lõi của tình trạng khó khăn về AI doanh nghiệp: tăng hiệu suất cá nhân, không bằng tăng lợi nhuận công ty.
Nhân viên dùng AI viết báo cáo tuần nhanh gấp ba lần, nhưng doanh thu công ty không thay đổi. Kỹ sư dùng AI tạo mã code tốc độ tăng gấp đôi, nhưng 'tỷ lệ rò rỉ' mã code - tức tỷ lệ bị bỏ hoặc viết lại - tăng 800%.
Sophia Velastegui, cựu Giám đốc AI tại Microsoft, đã nói một câu khiến nhiều nhà quản lý khó chịu: 'Hầu hết mọi người mặc định tự động hóa những nhiệm vụ họ không thích, thay vì những nhiệm vụ có giá trị nhất đối với công ty.'
Nói thẳng ra, doanh nghiệp tự động hóa những 'công việc nhân viên ghét', chứ không phải những 'công việc tạo ra tiền'.
Đây không phải là vấn đề kỹ thuật, mà là vấn đề ưu tiên. Đó cũng là lý do tại sao khoảng 30% dự án AI tạo sinh bị bỏ dở ở giai đoạn xác minh khái niệm - chi phí không rõ ràng, giá trị cũng không rõ ràng, sếp tự nhiên không gia hạn.
Cách xử lý của Marc Benioff, CEO Salesforce, rất tiêu biểu.Đối mặt với hóa đơn 300 triệu USD mỗi năm từ Anthropic, kỳ vọng của ông là một 'bộ định tuyến thông minh': có thể đánh giá truy vấn nào đáng dùng mô hình hàng đầu, truy vấn nào chỉ cần dùng mô hình nhỏ rẻ tiền là đủ.
Ý tưởng này bản thân không có gì mới - ngay từ thời điện toán đám mây, 'trả tiền theo nhu cầu', 'tối ưu hóa tài nguyên' đã là thao tác tiêu chuẩn. Nhưng làn sóng AI lần này đến quá gấp, mọi người mua trước nghĩ sau, bây giờ mới bắt đầu học lại.
Sự trở lại của lý trí, hay tiền đề của mùa đông?
Microsoft gần đây đã hủy hầu hết giấy phép doanh nghiệp Claude Code, lý do chính thức được đưa ra là yếu tố chi phí. Điều này đã gây ra nhiều thảo luận trong ngành - xét cho cùng, chính Microsoft là nhà đầu tư lớn nhất của OpenAI, đồng thời lại đang cắt đăng ký của đối thủ, rất khó nói ở đây có bao nhiêu là cân nhắc chi phí, bao nhiêu là bố cục chiến lược.
Nhưng dù thế nào, nó đại diện cho một tín hiệu: doanh nghiệp bắt đầu bỏ phiếu bằng chân.
Harness và CloudZero hầu như cùng một ngày - 28/5 - lần lượt ra mắt công cụ quản lý chi phí AI, một cái tập trung vào giám sát chi tiêu AI và ROI theo thời gian thực, cái còn lại ra mắt 'mặt phẳng kiểm soát tài chính AI', giúp doanh nghiệp liên kết từng đô la chi tiêu AI với kết quả kinh doanh cụ thể.
Sự xuất hiện của hai sản phẩm này tự nó đã nói lên vấn đề: thị trường có nhu cầu, và nhu cầu rất gấp.
HubSpot từ tháng 4 năm nay bắt đầu điều chỉnh mô hình định giá đại lý AI, không còn tính phí theo token, thay vào đó tính phí theo 'số cuộc hội thoại giải quyết được' hoặc 'số khách hàng tiềm năng tạo ra' - đây là sự chuyển hướng mang tính định hướng, sắp xếp lợi ích của bên bán với đầu ra thực tế của bên mua. ServiceNow cũng đang điều chỉnh tương tự. Các nhà cung cấp AI đang nhận ra rằng nếu họ tiếp tục bán 'lượng dùng' thay vì bán 'kết quả', khách hàng doanh nghiệp sớm muộn sẽ phản đối tập thể.
Cuộc điều chỉnh này, là cơn đau đẻ mà công nghiệp hóa AI phải trải qua, hay là màn mở đầu cho cuộc khủng hoảng lớn hơn?
Tôi nghiêng về phía trước. Nhưng có một chi tiết khiến người ta hơi lo lắng: chi tiêu phần mềm AI toàn cầu dự kiến sẽ đạt 2,59 nghìn tỷ USD vào năm 2026, tăng 47% so với cùng kỳ, nhưng đồng thời, 94% người phụ trách kỹ thuật cho biết các chỉ số ROI quan trọng vẫn thiếu. Tiền càng tiêu nhiều, nhưng không ai biết đốt ở đâu, đốt có đáng hay không - mâu thuẫn này nếu không giải quyết, thời khắc 'tokenmaxxing' tiếp theo chỉ là vấn đề thời gian.
Một bài phân tích của tạp chí Fortune nói rất thẳng thừng: 'Tokenmaxxing rất dễ, thiết kế lại quy trình làm việc rất khó.' Hầu hết các công ty hiện đang làm là tối ưu hóa quy trình hiện có, chứ không phải phát minh lại mô hình kinh doanh. Đây là giá trị thực sự của AI, cũng là nơi hầu hết doanh nghiệp chưa đến được.
Sự trở lại của lý trí là điều tốt. Nhưng sau khi lý trí trở lại, doanh nghiệp còn cần trả lời một câu hỏi khó hơn: AI đối với nghiệp vụ của chúng ta, cuối cùng nên là một cái búa, hay là một khuôn mẫu tư duy mới?
Nếu chỉ dùng AI để làm công việc cũ nhanh hơn, hóa đơn sẽ có ngày buộc bạn quay lại trước câu hỏi này.
Bài viết này đến từ tài khoản công chúng WeChat 'Geek Park' (ID: geekpark), tác giả: Hoa Lâm Vũ Vương, biên tập: Tĩnh Vũ






