Tác giả:Haseeb
Biên dịch: Giai Hoan, ChainCatcher
@SemiAnalysis_ gần đây đã phát hiện ra một hiện tượng khó tin trong kinh tế học đăng ký lập trình AI. Nếu tối đa hóa mức sử dụng, số tiền bạn trả thực tế rẻ hơn từ 20 đến 70 lần so với việc mua token thông qua API.
Nhiều người thấy điều này liền nói: Trời ơi, hãy xem các công ty mô hình lớn đang trợ cấp bao nhiêu tiền trên token, bong bóng chắc chắn sắp vỡ.
Phản ứng này là sai. Các công ty mô hình lớn sẵn sàng cung cấp gói dịch vụ hào phóng như vậy đương nhiên là vì hầu hết người dùng hiếm khi chạm đến giới hạn. Sản phẩm này giống như thẻ hội viên phòng gym: hạn mức rộng rãi, bởi vì đa số mọi người hầu như không dùng nhiều.
Nhưng tôi đã dành nhiều thời gian suy nghĩ về việc này, quả thực có một số điểm kỳ lạ.
Chúng ta không thể biết tỷ suất lợi nhuận tổng hợp thực tế của họ trên mô hình đăng ký, nhưng theo ước tính của SemiAnalysis, ở mức sử dụng trung bình 20%, kế hoạch Max 5x của Anthropic mới vừa hòa vốn. 20% tỷ lệ sử dụng có thể vẫn cao, đặc biệt là trong những tổ chức mà mọi người (kể cả người không lập trình) đều có tài khoản đăng ký nhưng chỉ thỉnh thoảng dùng một lần. Hầu hết các tổ chức tôi biết, bao gồm cả Dragonfly, đều rộng rãi phát hành đăng ký Claude Code và khuyến khích cả nhân viên không lập trình thử.
Lý do như sau: Khi số người vượt quá 150, bạn sẽ bị buộc phải thoát khỏi mô hình đăng ký được gọi là phiên bản "Nhóm (Team)". Bạn phải chuyển sang phiên bản "Doanh nghiệp (Enterprise)", với mức giá là 20 USD/ghế cơ bản, cộng thêm phí API tính theo mức sử dụng token thực tế. Doanh nghiệp chỉ có thể thanh toán theo chi phí token tuyến tính, và SemiAnalysis cho rằng biên lợi nhuận gộp của API token vào khoảng 75%. Đây là một đợt tăng giá khổng lồ, đột ngột có hiệu lực khi số người đạt 150.
Vì vậy, nếu bạn là một doanh nghiệp nhỏ hoặc công ty khởi nghiệp (hoặc người dùng cá nhân), nhận thức của bạn về chi tiêu AI là bị bóp méo. Giá token của bạn thực sự rất ưu đãi, Anthropic có thể chỉ duy trì tỷ suất lợi nhuận cực thấp hoặc âm trên bạn.
Bạn có thể tò mò tại sao Microsoft và Uber lại hoảng hốt về chi tiêu token, và nói nhiều về "tối giản hóa token (token-minning)". Lý do nằm ở đây. Chi phí cấu trúc họ phải trả cho mỗi token cao hơn nhiều so với các công ty khởi nghiệp và cá nhân.
Nhưng Anthropic không quan tâm! Đối với một công ty B2B, việc vắt kiệt giá trị tối đa từ các công ty nhỏ hoặc cá nhân không có nhiều ý nghĩa. Hãy nhìn vào các công ty như Datadog hoặc Cloudflare, 80% đến 90% doanh thu của họ đến từ các hợp đồng lớn (Doanh thu định kỳ hàng năm trên 100.000 USD). Kiếm lợi nhuận bằng không trên khách hàng dài hạn chỉ là một chi phí phát triển khách hàng.
Đây là tư duy bán hàng B2B điển hình.
Nhưng với cùng một tình huống, còn có một cách nhìn khác: từ góc độ chính sách thuế.
Bởi vì nếu token đang thay thế lao động, thì lợi nhuận gộp mà OpenAI và Anthropic thu trên token thực chất là một loại thuế đánh vào lao động AI.
Nhìn nhận định giá token theo cách này sẽ dẫn đến hai hậu quả chính.
Định giá token như một chính sách thuế
Giả sử tỷ suất lợi nhuận trong bài viết của SemiAnalysis là đúng: mô hình đăng ký hòa vốn, biên lợi nhuận gộp API doanh nghiệp lớn là 75%. Phản ứng đầu tiên là gọi nó là thuế lao động AI 75% đánh vào tổ chức lớn, và 0% đánh vào công ty khởi nghiệp.
Phân tích thuế tiêu chuẩn sẽ nói, điều này cản trở các công ty lớn sử dụng nội bộ lao động AI, ở mức cận biên thúc đẩy doanh nghiệp giảm tự động hóa, giữ lại nhiều lao động con người hơn. (Rõ ràng, điều này cũng khuyến khích sử dụng các mô hình nhỏ hơn hoặc mã nguồn mở, nhưng hiệu ứng ròng là cả hai đều được khuyến khích. Hãy nhớ, chúng ta đang nói về biên độ ở đây.)
Tuy nhiên, thứ thúc đẩy hành vi mạnh mẽ hơn không phải là thuế suất trung bình. Trong chính sách thuế, chưa bao giờ là vậy. Điều chúng ta thực sự quan tâm là thuế suất biên.
Đối với các công ty khởi nghiệp sử dụng mô hình đăng ký giá cố định, giá cận biên của token tiếp theo là số 0, cho đến khi chạm giới hạn. Và giá cận biên bằng không, là sự bóp méo lớn nhất mà một chính sách có thể gây ra.
Đối với các công ty khởi nghiệp, mô hình đăng ký về cơ bản là một khoản trợ cấp đổi mới. Động lực áp đảo nhất, là nghĩ cách chi tiêu toàn bộ ngân sách token một cách hiệu quả nhất có thể. Điều này có nghĩa là chạy vòng lặp Ralph, để màn hình đầy các phiên Claude Code, lập lịch cho một nhóm tác nhân thông minh làm việc cùng nhau.
Trước khi chạm giới hạn, khám phá là miễn phí. Vì vậy các công ty khởi nghiệp thực sự đang chạy đua để vắt kiệt đến giọt giá trị cuối cùng của gói đăng ký, lấn át đối thủ bằng sản lượng. Nghịch lý là, càng sử dụng nhiều, giá token trung bình lại càng thấp. Mỗi công ty khởi nghiệp đều muốn trở thành người khiến Anthropic lỗ nhiều nhất trên gói đăng ký.
Các doanh nghiệp lớn phải đối mặt với động lực ngược lại. Nếu bạn vượt quá 150 ghế, mỗi token trong quá trình khám phá đều được tính phí đầy đủ cộng thêm (với phụ phí 75%!), vì vậy mỗi bước họ khám phá thêm ở biên giới, hình phạt lại tăng lên một cách tuyến tính.
Các doanh nghiệp lớn vẫn sẽ tự động hóa các nhiệm vụ hàng loạt rõ ràng, nhưng việc tự động hóa mang tính biên, thử nghiệm, rủi ro sẽ không bao giờ được khai thác, vì chi phí phát hiện quá cao. Cấu trúc thuế này cuối cùng thúc đẩy họ giữ lại nhiều nhân lực hơn, duy trì cấu trúc tổ chức tổng thể ban đầu.
Điều này hoàn toàn ngược lại với Nhật Bản. Do dân số giảm, Nhật Bản phải đối mặt với tình trạng thiếu lao động lớn. Lịch sử điều này có nghĩa là Nhật Bản theo đuổi tự động hóa cao độ, vì chi phí nhân lực cao đã khuyến khích tự động hóa. Đây là lý do tại sao có robot trong các nhà hàng, nhà máy, khách sạn, bệnh viện ở Nhật Bản.
Nhưng kỳ lạ thay, các doanh nghiệp lớn thấy mình rơi vào tình thế ngược lại với Nhật Bản: nếu phải trả thuế cực cao cho việc sử dụng AI, ngược lại sẽ làm suy yếu động lực tự động hóa, củng cố động cơ giữ lại nhân viên hiện có (điều này càng rõ ràng hơn nếu tiền lương trong giai đoạn này trì trệ).
Vậy trong mô hình này, sự thay thế lao động sẽ chảy về đâu?
Mọi người đều đang nhìn vào các công ty lớn, chờ đợi làn sóng sa thải AI đến. Nhưng với mức thuế 75%, việc quá tích cực thay thế nhân viên của mình bằng AI có thể hoàn toàn không đáng, ngân sách token sẽ phát nổ ngay lập tức.
Nhưng điều này không có nghĩa là sự thay thế sẽ không xảy ra, chỉ là sự thay thế sẽ xuất hiện dưới một hình thái khác.
Khi các doanh nghiệp lớn để mất thị phần vào tay các công ty khởi nghiệp AI bản địa có tổng chi phí nhân lực cực thấp, doanh thu và giá cổ phiếu của các doanh nghiệp lớn giảm sẽ kích hoạt sa thải. Nhưng những vị trí bị loại bỏ đó, sẽ không bao giờ xuất hiện trở lại trong các công ty khởi nghiệp chiến thắng. Hiệu ứng giảm biên chế ròng là như nhau, khoảng trống thất nghiệp này chỉ đơn giản là chuyển sang một khâu khác trong nền kinh tế có mức thuế thấp hơn.
Đây cũng là lý do tại sao "AI-washing" (gọi việc sa thải thông thường là hiệu quả AI mới phát hiện) có thể không phải là hiện tượng nhất thời. AI-washing đề cập đến việc một công ty quy việc sa thải cho hiệu quả AI, thực chất chỉ là che giấu sự suy yếu kinh doanh thông thường.
Nhiều người nghĩ rằng đây chỉ là một cơn gió thoảng trong chu kỳ cường điệu AI hiện tại. Tuy nhiên, mặc dù tất cả mọi người đã sẵn sàng chứng kiến các doanh nghiệp lớn tiến hành sa thải AI thực sự, thay thế vị trí bằng AI, điều này có thể không bao giờ xảy ra trên quy mô lớn.
Sự thay thế lao động có thể diễn ra theo cách khác: các công ty khởi nghiệp đánh bại các công ty lớn, các công ty lớn che giấu sự suy thoái dưới danh nghĩa AI cho đến khi phá sản, và các công ty khởi nghiệp sẽ không bao giờ xây dựng lại những vị trí cũ đó. Sự thay thế vị trí vẫn sẽ xảy ra, chỉ là không ở nơi mọi người đang nhìn.
Đây là hậu quả đầu tiên của mô hình này. Nhưng còn một hậu quả thứ hai kỳ lạ hơn.
Vách đá 150 người
Điểm đứt gãy quy định (Notch) là một ranh giới quy định tạo ra sự thay đổi hành vi nhảy vọt. Ví dụ: tiêu chuẩn việc làm toàn thời gian 30 giờ/tuần đã tạo ra một lượng lớn vị trí công việc chỉ làm đúng 29 giờ mỗi tuần.
Như đã biết, Pháp có các quy định lao động cực kỳ nghiêm ngặt, có hiệu lực khi doanh nghiệp đạt 50 nhân viên (Ủy ban nhân viên, chia sẻ lợi nhuận bắt buộc, bảo vệ sa thải), các công ty nhỏ thì được miễn trừ. Điều này tạo động lực cực lớn cho người sử dụng lao động, cố gắng hết sức để giữ quy mô dưới 50 người.
Trích từ: Garicano, Luis, Claire Lelarge, và John Van Reenen, 2016, "Sự bóp méo quy mô doanh nghiệp và phân phối năng suất: Bằng chứng từ Pháp".
Áp dụng phép loại suy này vào AI. Các công ty mô hình lớn đặt ra một ngưỡng thuế, trừng phạt những công ty vượt quá 150 ghế. Điều này có nghĩa là bạn phải giữ quy mô nhỏ, để giữ lại mức giá đăng ký trợ cấp tuyệt vời đó, khiến token bị đánh thuế khoảng 0% (hoặc thậm chí âm), thay vì 75%.
Điều này có thể tạo ra một triết lý quản lý doanh nghiệp hoàn toàn mới. Các công ty khởi nghiệp sẽ ngày càng ám ảnh với việc dùng tác nhân thông minh giải quyết mọi thứ, nhóm nhỏ hơn, sa thải thường xuyên hơn, gia công nhiều hơn, tận dụng mọi cách để giữ số lượng khâu cần đến con người ở mức thấp nhất có thể.
Điều này không phải vì nó là mức độ tự động hóa "tối ưu", mà vì động lực đã đẩy họ đến đó. Nếu con số kỳ diệu là 149, thì mỗi ghế đều quan trọng, bạn không thể lãng phí bất kỳ ai ngoài các khớp nối cốt lõi của công ty.
Sự đứt gãy này có thể được những người như Harvard Business School coi là "quản lý ưu tiên AI thế hệ mới". Nhưng nếu hiểu đúng, nó thực chất chỉ là phản ứng hợp lý trước phương án định giá doanh nghiệp.
Điều này nghe có vẻ hơi cường điệu. Nhưng sự khác biệt hành vi giữa các tổ chức khác nhau, bạn đã có thể thấy ngay bây giờ. Hãy nói chuyện với các nhà phát triển tại các doanh nghiệp lớn, họ đang tính toán kỹ lưỡng từng token, ngày càng lo lắng về việc lãnh đạo cắt giảm ngân sách token. Trong khi đó, các nhà phát triển tại các công ty khởi nghiệp lại đang cố gắng tối đa hóa mức sử dụng (tokenmaxxing), khởi động hàng loạt tác nhân thông minh qua đêm, và xem nhật ký vào buổi sáng. Tôi dự đoán xu hướng này sẽ tăng tốc.
Không ai cố ý thiết kế tất cả những điều này. Không có ủy ban nào quyết định trợ cấp đổi mới cho các công ty khởi nghiệp, đánh thuế các doanh nghiệp lâu năm. Tất cả đều xuất phát trực tiếp từ các chiến lược định giá doanh nghiệp truyền thống đã được kiểm chứng.
Nhưng luật thuế luôn như vậy: một đống quy tắc đi kèm, cuối cùng quyết định công ty nào có thể được xây dựng, và cách những công ty này tự bóp méo để giảm thiểu gánh nặng thuế.
Bạn có thể phản bác rằng điều này chỉ là tạm thời, các công ty mô hình lớn sớm muộn sẽ tính phí theo lượng sử dụng cho tất cả mọi người. Github Copilot đã hoàn thành quá trình chuyển đổi này. Có thể, cũng có thể không. Nhưng trước khi định giá trở lại bình thường, các công ty 149 người và mô hình quản lý ưu tiên AI mới mẻ này có thể đã bùng nổ, nuốt chửng một phần thị trường lớn, và viết kịch bản cho thế hệ công ty khởi nghiệp tiếp theo.
Chính sách thuế là cực kỳ quan trọng. Toàn bộ khái niệm "kinh tế gig" tồn tại chính vì ranh giới pháp lý giữa W-2 (nhân viên chính thức) và 1099 (nhà thầu độc lập). Khi ngày càng nhiều lao động bị AI xâm lấn, định giá token có thể trở thành chính sách thuế có ảnh hưởng nhất trong thập kỷ tới. Tuy nhiên, sẽ không bao giờ có ai bỏ phiếu cho điều này.
(Đừng ngạc nhiên nếu trong chu kỳ tiếp theo, những công ty phát triển nhanh nhất đều lộ rõ việc mắc kẹt ở mốc 149 ghế.)









