Tác giả: Claude, Shenchao TechFlow
Dẫn nhập Shenchao: Mùa báo cáo tài chính quý I năm 2026 của các gã khổng lồ công nghệ tiết lộ một hiện tượng mới: trong khi AI đang giúp doanh nghiệp đóng băng nhân viên, cắt giảm vị trí, thì bản thân sự tiêu hao Token và khấu hao GPU đang ăn mòn ngược lại biên lợi nhuận gộp. Biên lợi nhuận gộp của hoạt động đăng ký của Shopify bị chi phí LLM đè nén, khoảng một phần tư trong hướng dẫn lợi nhuận cả năm của Roblox bị điều chỉnh giảm trực tiếp do đầu tư gia tăng vào AI, chi tiêu vốn AI tổng cộng của bốn công ty Amazon, Meta, Microsoft, Google vào năm 2026 sẽ đạt 7250 tỷ USD, tăng 77% so với cùng kỳ. Hai đầu của cổ tức AI, tiết kiệm nhân lực và tiêu thụ sức mạnh tính toán, lần đầu tiên cùng xuất hiện trên cùng một báo cáo tài chính để đối chiếu, và phần sau rõ ràng lớn hơn.
Mùa báo cáo quý I đang đặt một miếng vá sửa chữa cho câu chuyện đơn giản "AI thay thế lao động".
Trong khi một loạt công ty công nghệ nộp bảng thành tích về đóng băng tuyển dụng, tăng tốc lặp sản phẩm, họ buộc phải giải thích với nhà đầu tư một vấn đề hóc búa hơn, đó là chi phí khấu hao chip AI tăng vọt và sự tiêu thụ Token không thể dự đoán đang ngược lại ăn sạch số tiền tiết kiệm được từ việc cắt giảm nhân sự.
Tổng giám đốc Shopify Harley Finkelstein tại cuộc họp báo cáo tài chính ngày 5/5/2026 cho biết, AI hiện đảm nhận hơn 50% công việc viết mã của công ty, và đã giúp Shopify giao hơn 300 sản phẩm và tính năng trong khi số lượng nhân viên giữ ổn định. Tuy nhiên, cùng tại cuộc họp đó, ban lãnh đạo công ty cũng thừa nhận biên lợi nhuận gộp của giải pháp đăng ký đang bị chi phí mô hình ngôn ngữ lớn (LLM) phần nào bù trừ, và động thái này sẽ tiếp tục.
Shopify: Lỗ hổng chi phí LLM đằng sau biên lợi nhuận gộp 80%
Biên lợi nhuận gộp giải pháp đăng ký của Shopify Q1 là 80%, bằng với cùng kỳ năm ngoái, nhưng cái giá để duy trì con số này đang thay đổi.
Theo tài liệu 10-Q Shopify gửi lên SEC, chi phí giải pháp đăng ký trong quý I năm 2026 tăng 20% so với cùng kỳ, đạt 148 triệu USD, so với 123 triệu USD cùng kỳ năm ngoái. Trong đó, khoản mục chi phí đám mây và cơ sở hạ tầng (bao gồm sử dụng liên quan đến AI) tăng 22 triệu USD, là yếu tố chính thúc đẩy sự mở rộng chi phí. CFO của Shopify Jeff Hoffmeister tại cuộc họp báo cáo tài chính tuyên bố, hiệu ứng quy mô và cải thiện hiệu quả hỗ trợ "bị phần nào bù trừ bởi chi phí LLM tăng, chủ yếu được thúc đẩy bởi việc các thương gia sử dụng Sidekick, dự kiến động thái này sẽ tiếp tục".
Sidekick là trợ lý AI được nhúng vào nền tảng của Shopify, hoạt động tuần này tăng 385% so với cùng kỳ. Trong quý này, các thương gia sử dụng Sidekick tạo ra hơn 12.000 ứng dụng tùy chỉnh, tăng hơn 200% so với quý trước, gần một nửa Shopify Flows được tạo bởi AI. Lưu lượng cửa hàng do AI thúc đẩy tăng 8 lần so với cùng kỳ, đơn hàng từ tìm kiếm AI tăng gần 13 lần so với cùng kỳ.
Nhưng sự bùng nổ mức độ sử dụng này đồng nghĩa với sự tăng trưởng theo cấp số nhân của các lệnh gọi suy luận AI. Mỗi lần tương tác giữa thương gia với Sidekick, mỗi lần tính năng Pulse tạo đề xuất chủ động, đều tương ứng với một hóa đơn Token phải trả cho nhà cung cấp mô hình phía trên.
Shopify tính riêng hai cuốn sổ "AI nội bộ" và "AI bên ngoài" cho nhà đầu tư nghe: AI viết mã nội bộ, đè nén chi phí nhân sự thuộc về chiến thắng của "trò chơi chi phí", còn sản phẩm AI cung cấp ra ngoài cho thương gia là lựa chọn chiến lược "gắn sâu chi phí cơ sở hạ tầng với việc sử dụng của thương gia". Finkelstein tại cuộc họp báo cáo tài chính đã tóm tắt logic này thành "AI là một lợi thế cấu trúc, không chỉ là một khoản chi phí".
Roblox: Một phần tư mức điều chỉnh giảm biên lợi nhuận, trực tiếp đến từ AI
CFO của Roblox Naveen Chopra tại cuộc họp báo cáo tài chính Q1 2026 ngày 30/4 đã tiết lộ rõ ràng, trong mức điều chỉnh giảm biên lợi nhuận cả năm so với hướng dẫn trước đó, khoảng một phần tư xuất phát từ đầu tư gia tăng vào AI và điều chỉnh DevEx (chia sẻ cho nhà phát triển) nhắm vào nhóm người dùng Mỹ từ 18 tuổi trở lên.
Roblox hiện đang chạy hơn 400 mô hình AI trên GPU tự có và đám mây, xử lý 1,5 triệu lần gọi suy luận mỗi giây, bao phủ các kịch bản như đề xuất khám phá, an toàn thông tin liên lạc, đề xuất thị trường, tạo 3D.
Ban lãnh đạo công ty cố gắng cắt giảm chi phí suy luận thông qua điều chỉnh mô hình kinh doanh. Đồng sáng lập kiêm CEO của Roblox David Baszucki tại cuộc họp báo cáo tài chính cho biết, dự án "Roblox Reality" sắp ra mắt của công ty, một công nghệ có thể chạy mô hình video thời gian thực chân thực 2K ở tần suất 60Hz, sẽ không được cung cấp miễn phí. "Điều này sẽ sử dụng tài nguyên điện toán đám mây. Chúng tôi sẽ có một hình thức đăng ký hoặc cơ chế trả phí nào đó, do đó chúng tôi tin rằng có thể bù đắp chi phí ở phía suy luận thời gian thực này." Baszucki giải thích.
Chopra bổ sung rằng, hướng dẫn chi tiêu vốn năm 2026 của công ty vẫn giữ nguyên, chủ yếu dựa vào việc triển khai GPU trong trung tâm dữ liệu tự có để đáp ứng nhu cầu suy luận trong năm, một số nhiệm vụ huấn luyện vẫn sử dụng đám mây. Roblox trước đó đã tiết lộ, đến cuối năm 2025, bằng cách di chuyển một phần tải suy luận AI từ đám mây bên thứ ba sang trung tâm dữ liệu tự có, họ đã đạt được hiệu quả cải thiện 10 lần trên các khối lượng công việc cụ thể như xét duyệt an toàn, khám phá nội dung.
Nhưng hướng dẫn cả năm của Roblox trong quý này bao gồm nhiều áp lực như đầu tư gia tăng AI nói trên, giảm đòn bẩy chi phí cố định do quy mô đặt chỗ kỳ vọng thấp hơn, và điều chỉnh tỷ lệ DevEx lên 37,8% cho người sáng tạo nội dung người lớn 18+..., cuối cùng dẫn đến việc thị trường định giá lại biên lợi nhuận cả năm của họ.
Sổ sách ngành: 7250 tỷ USD chi tiêu vốn so với 2,7 tỷ USD tiết kiệm lương
Các trường hợp vi mô của Shopify và Roblox, đang ở trong một sự mất cân bằng cấu trúc vĩ mô lớn hơn.
Theo dữ liệu được 24/7 Wall St. trích dẫn, tổng chi tiêu vốn AI năm 2026 của bốn công ty Amazon, Meta, Microsoft, Google sẽ đạt 7250 tỷ USD, tăng 77% so với cùng kỳ. Trong đó, hướng dẫn chi tiêu vốn cả năm của Meta nằm trong khoảng 1250 đến 1450 tỷ USD, có nghĩa là chi tiêu hàng ngày cho xây dựng trung tâm dữ liệu lên tới 370 triệu USD; chi tiêu vốn năm dương lịch 2026 của Microsoft là 1900 tỷ USD, Amazon cam kết 2000 tỷ USD.
Con số này so với tỷ lệ chi phí nhân lực khá chênh lệch. Tổng số tiền lương nhân sự của Meta, tất cả tiền lương, phúc lợi, khuyến khích cổ phiếu cộng lại khoảng 27 tỷ USD. Ngay cả khi Meta sa thải tất cả nhân viên vào ngày mai, chi phí tiết kiệm được cũng chỉ bằng chưa đến một phần năm chi tiêu cơ sở hạ tầng năm 2026 của họ.
Nhà phân tích Dan Ives của Wedbush Securities trong báo cáo nghiên cứu ngày 25/4 ước tính, việc cắt giảm 8000 nhân sự sắp tới của Meta mỗi năm có thể giải phóng khoảng 2,4 tỷ USD chi phí hoạt động, chỉ có thể bù đắp khoảng 12% trong số ảnh hưởng kéo lùi do khấu hao gia tăng năm 2026. Nói cách khác, áp lực tài chính cho mỗi đô la chi tiêu sức mạnh tính toán AI, cần tiết kiệm chi phí nhân lực gần mười đô la mới có thể hoàn toàn phòng hộ.
CFO của Meta Susan Li tại cuộc họp báo cáo tài chính Q4 2025 đã định vị việc giảm nhân sự của Meta là "xây dựng một mô hình vận hành tinh gọn hơn, để giúp bù đắp cho khoản đầu tư quy mô lớn mà chúng tôi đang tiến hành". Cách diễn đạt này xác định rõ việc cắt giảm nhân sự là công cụ tài chính cho chi tiêu vốn AI, chứ không phải là sản phẩm phụ của việc nâng cao năng suất.
Chiến thắng của nhà cung cấp mô hình, lưỡng nan của tầng ứng dụng
Người hưởng lợi lớn nhất trong cuộc chơi sổ sách này là các nhà cung cấp mô hình cơ sở và sức mạnh tính toán. Biên lợi nhuận gộp của Microsoft Cloud được duy trì ở mức 69% dưới áp lực mở rộng cơ sở hạ tầng AI, biên lợi nhuận gộp của OpenAI theo ước tính bên ngoài khoảng 50%, Anthropic khoảng 60%. Nvidia thì trong năm tài chính 2026 tiếp tục ghi nhận mức biên lợi nhuận gộp khoảng 70%.
Còn các công ty ở tầng ứng dụng, đặc biệt là những người chơi SaaS vừa tiêu thụ AI, vừa đóng gói khả năng AI thành sản phẩm đăng ký để bán, đang đối mặt với một cấu trúc tài chính mới: doanh thu liên quan chặt chẽ đến cường độ sử dụng AI, nhưng đường cong chi phí lại được định giá bởi nhà cung cấp mô hình phía trên, và mỗi lần nâng cấp mô hình đều có thể mang đến sự tiêu thụ Token mới.
Tanay Jaipuria trong phân tích biên lợi nhuận gộp AI của mình chỉ ra, mặc dù chi phí suy luận của một mô hình duy nhất đang giảm với tốc độ 80%-90% mỗi năm, nhưng giá của các mô hình tiên phong vẫn ổn định hoặc thậm chí tăng, nếu các công ty tầng ứng dụng kiên trì gọi mô hình mạnh nhất trong mỗi yêu cầu, thì chi phí hàng bán (COGS) của họ thực chất đang bị dắt mũi bởi bảng giá của nhà cung cấp mô hình.
Giải pháp đối phó của Shopify là định vị sản phẩm AI như một lối vào chiến lược gắn sâu lưu lượng và thương gia, khiến sự tăng trưởng chi phí suy luận trở thành chỉ số đại diện cho "độ sâu nhúng nền tảng"; giải pháp của Roblox là tách trải nghiệm AI cao cấp ra khỏi tầng miễn phí, buộc người dùng phải trả tiền cho chi phí suy luận. Đằng sau hai con đường là cùng một sự đồng thuận: thuần túy dựa vào tiết kiệm tiền từ cắt giảm nhân sự để trang trải hóa đơn sức mạnh tính toán AI, về mặt toán học căn bản không tính nổi.







