Đối tác Dragonfly Haseeb: Những công ty tăng trưởng nhanh nhất tương lai có thể sẽ bị chặn ở mốc 149 người

marsbitXuất bản vào 2026-06-24Cập nhật gần nhất vào 2026-06-24

Tóm tắt

Bài viết phân tích chính sách giá token AI của Anthropic, chỉ ra sự khác biệt lớn về chi phí giữa doanh nghiệp nhỏ và lớn. Các công ty dưới 150 người dùng có thể đăng ký gói "Team" với giá cố định, tạo ra chi phí biên bằng 0 cho mỗi token và hoạt động như một khoản trợ cấp đổi mới. Ngược lại, doanh nghiệp trên 150 người phải chuyển sang gói "Enterprise" với phí theo token và biên lợi nhuận ước tính 75%, giống như một mức thuế đánh vào lao động AI. Điều này tạo ra hai hệ quả. Thứ nhất, nó khuyến khích startup tối đa hóa việc sử dụng AI trong khi khiến các tập đoàn thận trọng hơn, có thể dẫn đến việc thay thế lao động gián tiếp thông qua cạnh tranh thị trường thay vì sa thải trực tiếp. Thứ hai, ngưỡng 150 người tạo ra một "vách đá quy định", khuyến khích các công ty giữ quy mô dưới 149 nhân sự để duy trì mức giá ưu đãi, từ đó thúc đẩy một triết lý quản lý ưu tiên AI và tự động hóa tối đa. Tác giả so sánh cơ chế định giá token với chính sách thuế, có khả năng định hình cấu trúc doanh nghiệp trong tương lai.

Tác giả: Haseeb

Biên dịch: Giai Huan, ChainCatcher

@SemiAnalysis_ gần đây phát hiện một hiện tượng không thể tin được trong kinh tế học đăng ký lập trình AI. Nếu tối đa hóa mức sử dụng, chi phí bạn thực sự trả rẻ hơn 20 đến 70 lần so với việc mua token qua API.

Nhiều người thấy điều này liền nói: Trời ơi, hãy xem các công ty mô hình lớn đang trợ cấp bao nhiêu tiền trên token, bong bóng chắc chắn sắp vỡ rồi.

Phản ứng này là sai. Lý do các công ty mô hình lớn sẵn sàng cung cấp gói dịch vụ hào phóng như vậy, tự nhiên là vì hầu hết người dùng rất hiếm khi chạm tới giới hạn. Sản phẩm này giống như thẻ thành viên phòng gym: hạn mức rộng rãi, vì đại đa số mọi người cơ bản không sử dụng nhiều.

Nhưng tôi đã suy nghĩ rất lâu về việc này, ở đây thực sự có những điểm kỳ lạ.

Chúng ta không thể biết tỷ suất lợi nhuận gộp thực tế của họ trên đăng ký, nhưng theo ước tính của SemiAnalysis, ở mức sử dụng trung bình 20%, kế hoạch Max 5x của Anthropic mới hòa vốn. Tỷ lệ sử dụng 20% có thể vẫn cao, đặc biệt trong các tổ chức mà mọi người (bao gồm cả người không lập trình) đều có tài khoản đăng ký, nhưng chỉ thỉnh thoảng dùng một lần. Hầu hết các cơ quan tôi biết, bao gồm cả Dragonfly, đều rất rộng rãi cấp đăng ký Claude Code, còn khuyến khích nhân viên không lập trình thử.

Lý do như sau: Khi số người vượt quá 150, bạn buộc phải thoát khỏi chế độ đăng ký được gọi là bản "Đội/Nhóm (Team)". Bạn phải chuyển sang bản "Doanh nghiệp (Enterprise)", với giá là 20 USD cơ bản/ghế, cộng thêm phí API tính theo mức sử dụng token thực tế. Doanh nghiệp chỉ có thể trả tiền theo chi phí token một cách tuyến tính, và SemiAnalysis cho rằng biên lợi nhuận gộp của API token khoảng 75%. Đây là một đợt tăng giá khổng lồ, sẽ đột ngột có hiệu lực khi số người đạt 150.

Vì vậy, nếu bạn là một doanh nghiệp nhỏ hoặc công ty khởi nghiệp (hoặc người dùng cá nhân), nhận thức của bạn về chi tiêu AI bị bóp méo. Giá token của bạn thực sự rất ưu đãi, Anthropic trên bạn có thể chỉ duy trì biên lợi nhuận cực thấp thậm chí âm.

Bạn có thể tò mò, tại sao Microsoft và Uber lại lo lắng về chi tiêu token, và nói nhiều về "khai thác token (token-mining)". Lý do là ở đây. Chi phí cấu trúc họ trả cho mỗi token cao hơn nhiều so với công ty khởi nghiệp và cá nhân.

Nhưng Anthropic không quan tâm! Đối với một công ty B2B, việc vắt kiệt giá trị tối đa từ công ty nhỏ hoặc cá nhân không có ý nghĩa lớn. Hãy nhìn vào các công ty như Datadog hay Cloudflare, 80% đến 90% doanh thu của họ đến từ các hợp đồng lớn (Doanh thu định kỳ hàng năm trên 100.000 USD). Kiếm lợi nhuận bằng không trên khách hàng đuôi dài chỉ là một chi phí phát triển khách hàng.

Đây là tư duy bán hàng B2B điển hình.

Nhưng với cùng một tình huống, còn có một cách nhìn khác: từ góc độ chính sách thuế.

Bởi vì nếu token đang thay thế lao động, thì biên lợi nhuận gộp mà OpenAI và Anthropic thu trên token, thực chất là một loại thuế đánh vào lao động AI.

Nhìn nhận giá token theo cách này, sẽ mang lại hai hậu quả chính.

Định giá token như một chính sách thuế

Giả sử tỷ suất lợi nhuận trong bài của SemiAnalysis đúng: đăng ký hòa vốn, biên lợi nhuận gộp API doanh nghiệp lớn 75%. Phản ứng đầu tiên là gọi đó là đánh thuế 75% lên lao động AI của tổ chức lớn, và 0% lên công ty khởi nghiệp.

Phân tích thuế tiêu chuẩn sẽ nói, điều này cản trở các công ty lớn sử dụng lao động AI nội bộ, ở biên độ khiến doanh nghiệp giảm tự động hóa, giữ lại nhiều lao động con người hơn. (Rõ ràng, điều này cũng khuyến khích sử dụng các mô hình nhỏ hơn hoặc nguồn mở, nhưng hiệu ứng ròng là cả hai đều được khuyến khích. Hãy nhớ, chúng ta đang nói về biên độ ở đây.)

Tuy nhiên, thứ thúc đẩy hành vi mạnh mẽ hơn không phải là thuế suất trung bình. Trong chính sách thuế, không bao giờ là vậy. Chúng ta thực sự quan tâm đến thuế suất biên.

Đối với các công ty khởi nghiệp dùng đăng ký giá cố định, trước khi chạm trần, giá biên của token tiếp theo bằng không. Và giá biên bằng không, là sự bóp méo lớn nhất mà một chính sách có thể gây ra.

Đối với công ty khởi nghiệp, chế độ đăng ký về cơ bản là một khoản trợ cấp đổi mới. Động lực áp đảo nhất, là nghĩ cách tiêu hết toàn bộ ngân sách token một cách hiệu quả nhất có thể. Điều này có nghĩa là chạy vòng lặp Ralph, để màn hình chứa đầy phiên Claude Code, lên lịch cho một đám tác nhân thông minh làm việc cùng nhau.

Trước khi chạm trần, việc khám phá là miễn phí. Vì vậy các công ty khởi nghiệp thực tế đang đua nhau vắt kiệt giọt giá trị cuối cùng của đăng ký, dùng sản lượng để áp đảo đối thủ. Nghịch lý là, càng dùng nhiều, giá token trung bình lại càng thấp. Mỗi công ty khởi nghiệp đều muốn trở thành người khiến Anthropic lỗ nhiều nhất trên đăng ký.

Các doanh nghiệp lớn đối mặt với động lực ngược lại. Nếu bạn vượt quá 150 ghế, mỗi token trong khám phá đều được tính phí với mức giá đầy đủ (còn kèm thêm phụ phí 75%!), vì vậy mỗi bước họ khám phá thêm ở biên giới, hình phạt lại tăng lên tuyến tính.

Doanh nghiệp lớn vẫn sẽ tự động hóa những nhiệm vụ số lượng lớn rõ ràng, nhưng tự động hóa biên, thử nghiệm, rủi ro sẽ không bao giờ được khai thác, vì chi phí phát hiện quá cao. Cấu trúc thuế này cuối cùng khiến họ giữ lại nhiều nhân lực hơn, duy trì cấu trúc tổ chức tổng thể nguyên bản.

Điều này ngược lại hoàn toàn với Nhật Bản. Do dân số giảm, Nhật Bản đối mặt với tình trạng thiếu lao động khổng lồ. Trong lịch sử, điều này có nghĩa là Nhật Bản theo đuổi tự động hóa cao độ, vì chi phí nhân lực cao khuyến khích tự động hóa. Đây là lý do tại sao nhà hàng, nhà máy, khách sạn, bệnh viện Nhật Bản đều có robot.

Nhưng kỳ lạ là, các doanh nghiệp lớn thấy mình rơi vào tình thế ngược lại với Nhật Bản: nếu phải trả thuế cực cao cho việc dùng AI, ngược lại sẽ làm suy yếu động lực tự động hóa, tăng cường động cơ giữ lại nhân viên hiện tại (nếu trong thời gian này lương còn trì trệ, thì càng rõ ràng).

Vậy trong mô hình này, dòng thay thế lao động chảy về đâu?

Mọi người đều đang nhìn vào các công ty lớn, chờ đợi làn sóng sa thải AI đến. Nhưng với mức thuế 75%, việc thay thế nhân viên của mình bằng AI quá mạnh mẽ có thể hoàn toàn không đáng, ngân sách token sẽ phát nổ ngay lập tức.

Nhưng điều này không có nghĩa là sự thay thế sẽ không xảy ra, chỉ là sự thay thế sẽ xuất hiện dưới một hình thái khác.

Khi doanh nghiệp lớn thua thị phần vào tay các công ty khởi nghiệp bản địa AI có chi phí nhân lực tổng hợp cực thấp, doanh thu và giá cổ phiếu của doanh nghiệp lớn giảm sẽ kích hoạt việc sa thải. Nhưng những vị trí bị loại bỏ đó, sẽ không bao giờ xuất hiện lại ở công ty khởi nghiệp chiến thắng. Hiệu ứng giảm việc làm ròng là như nhau, khoảng trống thất nghiệp này chỉ chuyển sang một mắt xích khác trong nền kinh tế có thuế suất thấp hơn.

Đây cũng là lý do tại sao "tô hồng AI" (AI-washing - biện minh cho việc sa thải thông thường như là hiệu quả mới phát hiện từ AI) có thể không phải là hiện tượng nhất thời. Tô hồng AI, là chỉ một công ty quy cho việc sa thải là nhờ hiệu quả AI, thực tế chỉ đang che giấu sự suy yếu kinh doanh thông thường.

Nhiều người nghĩ đây chỉ là một cơn gió trong chu kỳ cường điệu AI hiện tại. Nhưng, mặc dù tất cả mọi người đã sẵn sàng chứng kiến các doanh nghiệp lớn thực hiện sa thải AI thực sự, "thay thế vị trí" bằng AI, việc này có thể không bao giờ xảy ra trên quy mô lớn.

Sự thay thế lao động có thể diễn ra theo cách khác: công ty khởi nghiệp đánh bại công ty lớn, công ty lớn che giấu suy thoái dưới danh nghĩa AI cho đến khi đóng cửa, và công ty khởi nghiệp sẽ không bao giờ xây dựng lại những vị trí cũ đó. Sự thay thế vị trí vẫn sẽ xảy ra, chỉ là không ở nơi mọi người đang theo dõi.

Đây là hậu quả đầu tiên của mô hình này. Nhưng còn một hậu quả thứ hai kỳ lạ hơn.

Vách đá 150 người

Cái gọi là điểm ngắt quy định (Notch), là một ranh giới quy định gây ra sự nhảy vọt lớn trong hành vi. Ví dụ: tiêu chuẩn việc làm toàn thời gian 30 giờ/tuần, đã tạo ra rất nhiều vị trí công việc chỉ vừa đúng 29 giờ/tuần.

Như đã biết, Pháp có quy định lao động cực kỳ nghiêm ngặt, có hiệu lực khi doanh nghiệp đạt 50 nhân viên (ủy ban nhân viên, chia sẻ lợi nhuận bắt buộc, bảo vệ sa thải), các công ty nhỏ thì được miễn. Điều này tạo động lực lớn cho người sử dụng lao động, cố gắng hết sức để giữ quy mô dưới 50 người.

Trích từ: Garicano, Luis, Claire Lelarge, và John Van Reenen, 2016, "Sự bóp méo quy mô doanh nghiệp và phân phối năng suất: Bằng chứng từ Pháp".

Mở rộng phép loại suy này sang AI. Các công ty mô hình lớn đã thiết lập một ngưỡng thuế, trừng phạt những công ty vượt quá 150 ghế. Điều này có nghĩa là bạn phải duy trì quy mô nhỏ, để giữ lại mức giá đăng ký trợ cấp tuyệt vời đó, khiến token bị đánh thuế khoảng 0% (thậm chí âm), thay vì 75%.

Điều này có thể tạo ra một triết lý quản lý doanh nghiệp hoàn toàn mới. Các công ty khởi nghiệp sẽ ngày càng ám ảnh với việc dùng tác nhân thông minh giải quyết mọi thứ, đội ngũ nhỏ hơn, sa thải thường xuyên hơn, gia công nhiều hơn, làm mọi cách để khiến các khâu cần dùng đến người càng ít càng tốt.

Điều này không phải vì đó là mức độ tự động hóa "tối ưu", mà vì động lực thúc đẩy họ đến đó. Nếu con số thần kỳ là 149, thì mỗi ghế đều quan trọng, bạn không thể lãng phí bất kỳ người nào ngoài các khớp nối cốt lõi của công ty.

Sự đứt gãy này có thể bị những người như Harvard Business School coi là "quản lý ưu tiên AI thế hệ mới". Nhưng hiểu cho đúng, nó chỉ là phản ứng hợp lý với chương trình định giá doanh nghiệp.

Nghe có vẻ hơi phóng đại. Nhưng sự khác biệt hành vi giữa các tổ chức khác nhau, bạn hiện có thể thấy rồi. Hãy nói chuyện với các nhà phát triển ở doanh nghiệp lớn, họ đang tính toán chi ly từng token, ngày càng lo lắng về việc lãnh đạo cắt giảm ngân sách token. Trong khi đó, các nhà phát triển công ty khởi nghiệp lại đang cố gắng tối đa hóa mức sử dụng (tokenmaxxing), khởi động một đám tác nhân thông minh chỉ trong một đêm, chờ sáng hôm sau xem nhật ký. Tôi dự đoán xu hướng này sẽ tăng tốc.

Không ai cố ý thiết kế tất cả những điều này. Không có ủy ban nào quyết định trợ cấp đổi mới cho công ty khởi nghiệp, đánh thuế doanh nghiệp lâu năm. Tất cả đều xuất phát trực tiếp từ những chiến lược định giá doanh nghiệp truyền thống đã được thử nghiệm thành công.

Nhưng luật thuế luôn như vậy: một đống quy tắc kèm theo, cuối cùng quyết định công ty nào có thể được xây dựng, và những công ty này bóp méo bản thân như thế nào để giảm thiểu gánh nặng thuế.

Bạn có thể phản bác rằng đây chỉ là tạm thời, các công ty mô hình lớn sớm muộn sẽ tính phí theo định lượng cho tất cả mọi người. Github Copilot đã hoàn thành quá trình chuyển đổi này. Có thể, cũng có thể không. Nhưng trước khi định giá trở lại bình thường, những công ty 149 người và bộ quản lý ưu tiên AI kiểu mới này, có thể đã bùng nổ, nuốt chửng thị phần lớn, và viết kịch bản cho thế hệ công ty khởi nghiệp tiếp theo.

Chính sách thuế rất quan trọng. Toàn bộ khái niệm "kinh tế gig", tồn tại chính xác vì ranh giới pháp lý giữa W-2 (nhân viên chính thức) và 1099 (nhà thầu độc lập). Khi ngày càng nhiều lao động bị AI xâm lấn, định giá token có thể trở thành chính sách thuế có ảnh hưởng lớn nhất trong thập kỷ tới. Tuy nhiên, sẽ không bao giờ có ai bỏ phiếu cho điều đó.

(Nếu trong chu kỳ tiếp theo, những công ty tăng trưởng nhanh nhất, đều mắc kẹt rõ ràng ở mốc 149 ghế, cũng đừng ngạc nhiên.)

Câu hỏi Liên quan

QBài viết của Haseeb nêu lên một hiện tượng kinh tế kỳ lạ nào trong mô hình định giá AI hiện tại?

ABài viết chỉ ra một hiện tượng kinh tế kỳ lạ: Các gói đăng ký (subscription) AI, như Claude Code của Anthropic, cung cấp giá cực kỳ ưu đãi cho các công ty nhỏ và người dùng cá nhân. Nếu sử dụng tối đa hạn mức, chi phí trên mỗi token (đơn vị tính toán AI) có thể rẻ hơn 20-70 lần so với mua qua API. Điều này tạo ra một sự bóp méo về nhận thức chi phí AI, nơi các công ty khởi nghiệp được trợ cấp mạnh trong khi các doanh nghiệp lớn phải trả phí theo token với biên độ lợi nhuận cao (khoảng 75%).

QTại sao các công ty lớn như Microsoft hay Uber lại quan tâm và nói nhiều về 'token-mining' (tối ưu hóa/tinh giản token), theo phân tích trong bài?

ALý do là các công ty lớn (trên 150 nhân viên) bị buộc phải sử dụng gói "Doanh nghiệp" (Enterprise) của các nhà cung cấp AI như Anthropic. Gói này tính phí theo số token thực tế sử dụng với mức phí gia tăng (markup) cao, được ước tính có tỷ suất lợi nhuận gộp lên tới 75%. Do đó, chi phí cấu trúc cho mỗi token của họ cao hơn rất nhiều so với công ty khởi nghiệp. Điều này khiến họ cực kỳ nhạy cảm với chi tiêu token và thúc đẩy họ tìm mọi cách để tối ưu hóa, giảm thiểu việc sử dụng token ('token-mining') nhằm kiểm soát ngân sách.

QHaseeb so sánh việc định giá token với chính sách thuế. Hai hệ quả chính của 'chính sách thuế' này là gì?

AHai hệ quả chính khi xem định giá token như một chính sách thuế là: 1. **Trợ cấp đổi mới cho công ty khởi nghiệp, đánh thuế doanh nghiệp lớn:** Công ty khởi nghiệp với gói đăng ký trọn gói có chi phí biên cho token bằng 0, khuyến khích họ thử nghiệm và tự động hóa tối đa. Ngược lại, doanh nghiệp lớn chịu 'thuế' ~75% trên mỗi token, làm tê liệt các nỗ lực tự động hóa mang tính thử nghiệm và rủi ro ở rìa, khiến họ có xu hướng giữ lại nhiều lao động con người hơn. 2. **Vách đá 150 người (The 150-person cliff):** Ngưỡng 150 nhân viên tạo ra một 'điểm gãy quy định' (regulatory notch) lớn, nơi chi phí AI tăng vọt. Điều này tạo động cơ mạnh mẽ để các công ty đang tăng trưởng cố tình duy trì quy mô dưới 149 người để tiếp tục hưởng lợi từ gói đăng ký được trợ cấp, dẫn đến một triết lý quản lý mới 'ưu tiên AI' với đội ngũ siêu tinh gọn.

QTheo bài viết, sự thay thế lao động bằng AI sẽ không diễn ra theo cách mọi người kỳ vọng (các công ty lớn sa thải hàng loạt). Vậy nó sẽ xảy ra như thế nào?

ASự thay thế lao động sẽ diễn ra gián tiếp thông qua cạnh tranh thị trường, chứ không phải trực tiếp trong nội bộ các tập đoàn lớn. Do bị 'đánh thuế' cao khi sử dụng AI, các công ty lớn sẽ không có động lực mạnh để thay thế nhân viên bằng AI một cách triệt để. Thay vào đó, các công ty khởi nghiệp AI-native (được hưởng chi phí AI gần như bằng 0) sẽ có lợi thế cạnh tranh khổng lồ. Họ sẽ giành thị phần từ các công ty lớn. Sự sụt giảm doanh thu và lợi nhuận của các công ty lớn sẽ dẫn đến sa thải nhân sự. Tuy nhiên, những vị trí công việc bị mất đi này sẽ không được tái tạo lại trong các công ty khởi nghiệp chiến thắng (vì họ vận hành với rất ít người). Hiệu ứng ròng về thất nghiệp là như nhau, nhưng nó được chuyển dịch trong nền kinh tế.

QBài viết dự đoán điều gì có thể xảy ra với các công ty tăng trưởng nhanh nhất trong tương lai dựa trên cơ chế định giá hiện tại?

ABài viết dự đoán rằng nhiều công ty tăng trưởng nhanh nhất trong tương lai có thể sẽ 'mắc kẹt' một cách đáng chú ý ở con số 149 nhân viên. Họ sẽ làm mọi cách để duy trì quy mô dưới ngưỡng 150 người nhằm tránh phải chuyển sang gói định giá 'Doanh nghiệp' đắt đỏ của các nhà cung cấp AI. Điều này sẽ thúc đẩy một triết lý quản lý cực kỳ tinh gọn, ưu tiên AI, nơi mọi vị trí con người đều phải là cốt lõi và mọi công việc có thể tự động hóa được đều sẽ được giao cho các tác nhân AI (AI agents).

Nội dung Liên quan

JD.com và Cựu CTO của OpenAI Mira Murati đặt cược vào cùng một đường đua AI

Hãy tưởng tượng một AI có thể chủ động nhìn thấy và hành động trong thế giới vật lý, thay vì chỉ thụ động trả lời câu hỏi. Đây chính là tương lai mà JoyAI-VL-Interaction của JD.com hướng đến – mô hình tương tác ngôn ngữ hình ảnh toàn diện đầu tiên trên thế giới mã nguồn mở. Khác với mô hình hội thoại "luân phiên" truyền thống, JoyAI-VL-Interaction có thể xử lý luồng video liên tục, tự chủ đưa ra quyết định: khi nào nên phản hồi, khi nào nên im lặng và khi nào nên giao nhiệm vụ phức tạp cho mô hình hậu trường. Nó giải quyết một vấn đề cốt lõi: trong thế giới thực, nhiều sự kiện quan trọng (như người già ngã, hỏa hoạn) xảy ra quá nhanh, không cho phép con người kịp đặt câu hỏi. JD.com và Thinking Machines Lab của cựu CTO OpenAI Mira Murati gần như đồng thời nhận ra xu hướng này, khẳng định tầm quan trọng của việc biến khả năng tương tác thành năng lực cốt lõi của AI. JD.com đặt ngôn ngữ hình ảnh vào vị trí trung tâm, coi đó là "phương thức điều khiển chính" để AI ra quyết định chủ động. Mô hình 8B tham số này được thiết kế nhẹ, dễ triển khai (chỉ cần card đồ họa 3090), phù hợp cho các ứng dụng như chăm sóc người già/trẻ em, hỗ trợ người khiếm thị, bình luận sự kiện thể thao, giám sát cửa hàng và điều khiển robot. Nó đóng vai trò như một lớp tương tác tiền trạm, xử lý giao tiếp tức thời và phân phối tác vụ phức tạp. Động thái mã nguồn mở toàn bộ (mô hình, hệ thống suy luận, dữ liệu) của JD.com nhằm mục đích thúc đẩy hệ sinh thái ứng dụng. Lợi thế then chốt của JD nằm ở khối tài sản dữ liệu khổng lồ từ thế giới vật lý – hàng nghìn kịch bản thực tế trong bán lẻ, logistics, chăm sóc sức khỏe và công nghiệp. Công ty đang đẩy mạnh thu thập 10 triệu giờ video chất lượng cao để huấn luyện các mô hình AI thể hiện. Bằng việc kết hợp JoyAI-VL-Interaction (hiểu và tương tác) với JoyAI-Echo (tạo sinh video) đã công bố trước đó, JD.com đang định vị mình không chỉ là một nhà phát triển mô hình, mà còn là một trung tâm vận hành thế giới vật lý, nơi AI học hỏi và phục vụ trong các ngữ cảnh thực.

marsbit17 phút trước

JD.com và Cựu CTO của OpenAI Mira Murati đặt cược vào cùng một đường đua AI

marsbit17 phút trước

Google bán TPU, các ông lớn muốn sản xuất “token giá rẻ” bằng chip AI

Google đã bắt đầu bán trực tiếp chip TPU tự nghiên cứu và phần cứng điện toán AI đi kèm cho các trung tâm dữ liệu và khách hàng bên thứ ba. TPU (Tensor Processing Unit) là chip được thiết kế chuyên biệt cho các phép toán ma trận và tensor trong AI, giúp xử lý tính toán hiệu quả cao. Việc này cho phép Google cung cấp năng lực điện toán với hiệu suất cao và chi phí thấp hơn, góp phần tạo ra "token giá rẻ" cho các mô hình AI như Gemini, từ đó cạnh tranh trực tiếp với OpenAI. Động thái của Google được xem như một đòn tấn công vào thị phần của NVIDIA, đặc biệt trong phân khúc điện toán AI có tính kinh tế cao. Trong khi NVIDIA thống trị nhờ hệ sinh thái CUDA toàn diện, Google tập trung đóng gói TPU cùng kinh nghiệm xây dựng trung tâm dữ liệu và nền tảng phần mềm thành một giải pháp hệ thống hoàn chỉnh, nhắm đến các doanh nghiệp muốn tự xây dựng năng lực điện toán. Xu hướng này phản ánh sự chuyển dịch trong ngành: điện toán AI đang dần trở thành một tài nguyên cơ bản như điện hay nước. Do đó, cuộc cạnh tranh không còn chỉ là về chip mạnh nhất, mà là về hệ thống có thể cung cấp điện toán với hiệu quả chi phí tối ưu nhất. Các nhà cung cấp dịch vụ đám mây như Google, Huawei Cloud hay Alibaba Cloud đang nỗ lực xây dựng hệ sinh thái phần cứng và phần mềm khép kín của riêng mình, với mục tiêu cuối cùng là giảm chi phí token và mở rộng phổ cập AI.

marsbit19 phút trước

Google bán TPU, các ông lớn muốn sản xuất “token giá rẻ” bằng chip AI

marsbit19 phút trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片