"Siêu thị mô hình" ngày càng nhiều: ByteDance, Alibaba, Tencent cạnh tranh tích hợp

marsbit发布于2026-04-24更新于2026-04-24

文章摘要

Mô hình "siêu thị mô hình" đang trở thành xu hướng cạnh tranh của các gã khổng lồ công nghệ như ByteDance, Alibaba và Tencent. Cụ thể, ByteDance mới ra mắt Coding Plan với khả năng tích hợp nhiều mô hình AI hàng đầu như GLM-5.1, Minimax M2.7, Kimi k2.6 và DeepSeek-V3.2, cho phép nhà phát triển truy cập chỉ với một gói đăng ký từ 40-200 USD/tháng. Tuy nhiên, cộng đồng nhà phát triển phản ánh nhiều vấn đề như giới hạn sử dụng nhanh hết (chỉ 5 giờ), lỗi 429 do quá tải và độ trễ cao. Các gói dịch vụ cũng áp dụng hệ số khấu trừ khác nhau tùy mô hình, khiến chi phí thực tế không minh bạch. Các hãng cloud như Alibaba, Tencent và Baidu cũng đẩy mạnh mô hình tích hợp đa nền tảng, chuyển trọng tâm từ cạnh tranh mô hình đơn lẻ sang khả năng tích hợp và dịch vụ. Điều này đặt ra nguy cơ "ống dẫn hóa" (pipeline) cho các công ty mô hình độc lập, buộc họ tìm cách tự nâng cấp (như智谱 với autonomous agent) hoặc chuyên sâu vào lĩnh vực dọc. Dù vậy, các chuyên gia nhận định đây là sự phân công lại ngành, nơi công ty mô hình tập trung vào thuật toán, còn nền tảng đám mây đảm nhận triển khai. Cuộc cạnh tranh vẫn đang ở giai đoạn đầu và chưa thể kết luận ai sẽ thống trị.

ByteDance Volcano Engine Ark Coding Plan gần đây đã chính thức ra mắt GLM-5.1, bên chính thức cho biết "căn chỉnh khả năng đầy đủ của nhà sản xuất gốc, không giới hạn mua". Trước đó, Coding Plan của Volcano trong thời gian dài chỉ có các mô hình cũ hơn như GLM-4.7. Lần cập nhật này không chỉ giới thiệu GLM-5.1, mà đồng thời tích hợp nhiều mô hình lớn nội địa mới nhất như Minimax M2.7, Kimi k2.6, DeepSeek-V3.2.

Điều này có nghĩa là, nhà phát triển chỉ cần một khoản phí đăng ký để có thể đồng thời gọi nhiều mô hình hàng đầu. Theo phản hồi thị trường, mô hình "đóng gói" này đã giảm đáng kể chi phí thử sai cho nhà phát triển. Hiện tại, gói Lite có giá 40 tệ mỗi tháng, gói Pro giá 200 tệ mỗi tháng, khiến nhiều nhà phát triển sẵn sàng "mua trước để giữ chỗ".

Bản thân GLM-5.1 của ZhiPu trong một bản cập nhật vào đầu tháng 4/2026, đã thể hiện khả năng kỹ thuật ấn tượng. Trong hai video chính thức do ZhiPu phát hành, "Xây dựng máy tính để bàn Linux từ con số 0 trong 8 giờ", "655 vòng lặp, nâng cao thông lượng truy vấn cơ sở dữ liệu vector lên 6.9 lần so với phiên bản chính thức ban đầu", đã làm mới lại trí tưởng tượng của công chúng về "thực thi hiệu quả 8 giờ" của mô hình lớn.

Phóng viên khảo sát thực tế cộng đồng nhà phát triển, đa số người dùng cho biết "không bền"

Phóng viên vào một nhóm giao lưu nhà phát triển Ark Coding, phát hiện ngoài các bài viết chia sẻ trải nghiệm, rất nhiều người dùng phản hồi về sự chênh lệch so với trải nghiệm thực tế. Lướt vài trang cộng đồng giao lưu sẽ thấy, các bài viết khiếu nại, xin hoàn tiền sau bán hàng rất nhiều, không ít cư dân mạng thẳng thắn nói "cảm thấy bị lừa".

Tranh cãi chủ yếu có hai điểm:

Một là vấn đề hạn mức sử dụng hết quá nhanh. Một người dùng tên "Hakimi" đăng bài nói "một vài vòng hội thoại cho một nhiệm vụ, hạn mức 5 giờ sắp hết", và một cư dân mạng khác đăng nguyên nhân kích hoạt hạn mức 5 giờ của mình là do tài khoản liên tục trượt cửa sổ trong 5 giờ liên tiếp, số yêu cầu thực tế đã vượt quá 6004 lần, vượt quá hạn mức hệ thống.

Hai là trải nghiệm giảm sút do điều phối năng lực tính toán chịu áp lực. Nhiều người dùng phản ánh gặp lỗi 429 (quá nhiều yêu cầu), và trong giờ cao điểm "độ trễ ký tự đầu tiên trên 1 phút là bình thường". Một người dùng thẳng thắn nói: "Hạn mức 5 giờ kích hoạt quá thường xuyên, không thể dùng để phát triển nghiêm túc."

Đồng thời, đằng sau mức giá thấp 40 tệ mỗi tháng của Coding Plan, cũng ẩn chứa "dòng chảy ngầm" về hệ số khấu trừ khác nhau cho "một lần yêu cầu gọi" trong gói. Ví dụ, một người dùng trong nhóm giao lưu nhà phát triển đã đăng hình ảnh về "sự khác biệt hệ số khấu trừ khi gọi các mô hình khác nhau". Ví dụ, hệ số khấu trừ cho toàn bộ series Doubao, series Qwen là 1 lần, series DeepSeek là 2 lần, series MiniMax-M2.7, Kimi-K2.6, GLM-5.1 là 5 lần.

Điều này cũng phản ánh, việc xây dựng "siêu thị mô hình" không dễ dàng như tưởng tượng, nhà phát triển bị thu hút bởi "tỷ lệ hiệu suất/chi phí", nhưng những điểm yếu ban đầu lộ ra về điều phối năng lực tính toán, cũng khiến nhiều nhà phát triển sau khi thử đã chọn dừng bước. Điều này cũng phơi bày những cơn đau ban đầu của mô hình "đóng gói". Khi người dùng đổ về, khả năng chịu tải của nền tảng năng lực tính toán đối mặt với thách thức. Làm thế nào để tìm điểm cân bằng bền vững giữa thu hút giá thấp và chất lượng dịch vụ, sẽ là mệnh đề dài hạn mà Volcano Engine và những người theo sau cần giải quyết.

Các nhà cung cấp đám mây tập thể chuyển hướng sang "siêu thị mô hình", sự phân tầng cố định bắt đầu lộ diện

Lần cập nhật "tích hợp" này của Volcano Engine Coding Plan, cũng không phải sự kiện đơn lẻ.

Từ đầu năm 2026, các nhà cung cấp đám mây chủ lưu như Alibaba Cloud, Baidu Intelligent Cloud, Tencent Cloud đều đang thúc đẩy bố cục tích hợp đa mô hình. Ví dụ, Alibaba Cloud là người tiên phong trong ngành, đã sớm ra mắt gói đăng ký đa mô hình "Bailian Coding Plan". Hiện hỗ trợ series Qianwen và các mô hình như kimi-k2.5, glm-5, MiniMax-M2.5. Hiện giá Pro là 200 tệ mỗi tháng, gói Lite từ ngày 20/3 đã ngừng mua mới, từ ngày 13/4 ngừng gia hạn và nâng cấp.

Dịch vụ đăng ký Tencent Cloud Large Model Coding Plan đã ra mắt toàn diện vào tháng 3/2026, hỗ trợ nhiều mô hình mới nhất như Tencent HY 2.0 Instruct, GLM-5, Kimi-K2.5, MiniMax-M2.5. Baidu Qianfan chính thức ra mắt dịch vụ đăng ký mã hóa AI Coding Plan vào tháng 2/2026, cũng là một trong những nhà cung cấp đám mây sớm ra mắt dịch vụ loại này trong nước.

Mô hình "siêu thị mô hình", không phải lựa chọn của một nhà, mà đang trở thành đường đua mà các nhà cung cấp đám mây tranh nhau bố trí. Nhưng xé toạc lớp vỏ ngoài của chiến lược tổng hợp nhà cung cấp đám mây, ai có thể cung cấp dịch vụ ổn định hơn, quy tắc hạn mức minh bạch hơn, cơ chế dự phòng linh hoạt hơn, ai có thể mở rộng thêm khả năng dịch vụ cấp doanh nghiệp ngoài lập trình, tỷ lệ gia hạn có theo kịp hay không, đều trở thành cốt lõi cạnh tranh mới.

Trên thế giới, nền tảng dịch vụ tổng hợp mô hình Amazon Bedrock, Microsoft Azure, khác với trường hợp mô hình đăng ký Coding trong nước, nhưng cùng thuộc xu hướng tích hợp.

Nhìn chung, cạnh tranh ngành cũng chuyển từ "so kè năng lực mô hình đơn nhất" sang "năng lực tích hợp nền tảng + năng lực dịch vụ sinh thái", mức độ tập trung ngành sẽ nhanh chóng nâng cao.

Nhà phân tích cấu hình tài sản chủ quản Quốc Tín Vương Khai nói với phóng viên, mặc dù sự phân hóa ngành đang tăng tốc, nhưng phán đoán thời kỳ tích hợp có thể hơi sớm. "Chính xác hơn, đây là sự tinh tế hóa và lặp lại phân công lao động trong chuỗi industry. Công ty mô hình tập trung vào thuật toán, nhà cung cấp đám mây tập trung vào giao hàng kỹ thuật, mỗi bên phát huy ưu thế chủ nghiệp." Ông cho rằng, dù các nhà cung cấp đám mây khác có theo sau hay không, cục diện cạnh tranh đều sẽ diễn biến từ đơn đấu sang phân hóa vị trí sinh thái.

Áp lực "ống dẫn hóa" của công ty mô hình lớn gia tăng?

Cái gọi là "ống dẫn hóa", không chỉ việc công ty mô hình biến mất, mà chỉ việc họ mất đi giá trị gia tăng sản phẩm, quyền kết nối người dùng và tiếng nói, lợi nhuận chuyển dịch về phía nền tảng năng lực tính toán, trở thành vai trò "bị chi phối".

Dưới làn sóng tổng hợp của nhà cung cấp đám mây, "ống dẫn hóa" cũng đang trở thanh thanh kiếm Damocles treo trên đầu các công ty mô hình lớn độc lập. Trong cuộc cờ câm lặng này, những người chơi hàng đầu như ZhiPu AI, Moonlight (Kimi), MiniMax, không chọn cách thỏa hiệp thụ động, mà từ trong gen của mỗi bên, đã đưa ra những con đường đột phá khác nhau.

CEO ZhiPu AI Trương Bằng trong cuộc đối thoại công khai ngày 8/4, ông nói rõ, mục tiêu cuối cùng của ZhiPu chưa bao giờ là trở thành một "công cụ gọi có thể thay thế tùy ý", mà là xây dựng tác nhân thông minh tự trị hoàn toàn (Autonomous Agent). Định vị này cố gắng để ZhiPu nâng cấp từ "nhà cung cấp mô hình" lên "người thực thi nhiệm vụ", từ đó bỏ qua bẫy giá thấp của API thuần túy.

Moonlight (Kimi) thì áp dụng chiến lược "bố trí phân tán + đào sâu văn bản dài". Đồng bộ tiếp cận nhiều nền tảng đám mây chủ lưu như Volcano Engine, Alibaba Cloud, đạt được cung cấp nguồn tính toán đa dạng, không bị ràng buộc bởi kênh đơn nhất, đảm bảo tính ổn định dịch vụ và khả năng kiểm soát chi phí. Kimi K2.6 ra mắt tháng 4/2026 sử dụng kiến trúc hỗn hợp chuyên gia (MoE), cửa sổ ngữ cảnh tiêu chuẩn đạt 256K tokens.

MiniMax thì đưa nguồn lực cốt lõi vào các lĩnh vực dọc như sáng tạo nội dung, dịch vụ khách hàng thông minh, giáo dục, dịch vụ doanh nghiệp, giải trí xã hội, đặc biệt tập trung bố trí trong các trường hợp như AI game, người số, tương tác đa phương thức, tạo dựng "khả năng tùy chỉnh khó thay thế của nền tảng đám mây".

Việc tích hợp nền tảng của đại厂会加速模型公司被“管道化”吗? Nhà phân tích Vương Khai cho rằng, cần phân biệt góc nhìn ngắn hạn và dài hạn.

"Về ngắn hạn, kênh phân phối bị nền tảng nắm giữ, quyền định giá nhượng bộ một phần, lợi nhuận nhà sản xuất mô hình chuyển dịch về phía cửa vào là quy luật thương mại. Nhưng về lâu dài, mô hình tổng quát dễ đồng nhất hóa, mô hình học sâu trong các trường hợp dọc như tài chính, y tế, luật, rào cản chuyên môn không phải tập trung tổng hợp là có thể xóa bỏ." Ông cho biết.

Về ứng phó rủi ro bị nền tảng hóa, còn có thể tham khảo chiến lược của OpenAI và Anthropic, một mặt tăng cường kênh trực tiếp với người dùng cuối, ví dụ vận hành độc lập ChatGPT và Claude về bản chất là thiết lập kết nối người dùng bỏ qua nền tảng. Mặt khác tốc độ lặp lại công nghệ và nhận thức thương hiệu người dùng là hai hào rào hữu hiệu, do đó công ty mô hình cần cân bằng đầu tư nghiên cứu phát triển và bố trí sản phẩm hóa.

Cờ cuối của cuộc cờ "ống dẫn hóa và nền tảng hóa", có thể không phải ai ăn ai, mà là sự rõ ràng hơn nữa của phân công. Nhà cung cấp đám mây làm ống, công ty mô hình làm công nghệ, hai bên trong cờ cạnh tranh dần dần tìm thấy ranh giới sinh tồn của mỗi bên.

Còn việc ai ăn ai, ở giai đoạn hiện tại, còn chưa đến hồi kết của câu chuyện.

Bài viết từ tài khoản công chúng WeChat "Báo Khoa Sáng Kỷ", tác giả: Vương Nại

热门币种推荐

相关问答

QĐộng cơ Ark của ByteDance đã tích hợp những mô hình AI lớn nào trong Coding Plan mới nhất?

AByteDance Volcano Engine Ark Coding Plan đã tích hợp các mô hình AI lớn mới nhất bao gồm GLM-5.1, Minimax M2.7, Kimi k2.6 và DeepSeek-V3.2, cho phép nhà phát triển gọi nhiều mô hình chỉ với một gói đăng ký.

QNhững vấn đề chính mà người dùng phản ánh về Coding Plan của Volcano Engine là gì?

ANgười dùng phản ánh hai vấn đề chính: giới hạn sử dụng 5 giờ bị vượt quá nhanh do số lượng yêu cầu lớn, và tình trạng tắc nghẽn tính toán dẫn đến lỗi 429 (quá nhiều yêu cầu) cùng độ trễ phản hồi lên tới hơn 1 phút trong giờ cao điểm.

QCác nhà cung cấp điện toán đám mây lớn nào đang triển khai mô hình 'siêu thị mô hình' tương tự?

ACác nhà cung cấp điện toán đám mây lớn như Alibaba Cloud, Baidu Smart Cloud và Tencent Cloud đều đang triển khai các gói đăng ký đa mô hình, ví dụ: Alibaba Cloud có 'Bailian Coding Plan', Tencent Cloud có dịch vụ đăng ký mô hình lớn, và Baidu Qianfan cung cấp dịch vụ đăng ký AI coding.

QCác công ty mô hình lớn như GLM, Kimi và MiniMax đang làm gì để tránh bị 'ống dẫn hóa' bởi nền tảng điện toán đám mây?

AGLM AI tập trung vào xây dựng tác nhân tự trị (Autonomous Agent), Kimi áp dụng chiến lược phân tán và chuyên sâu văn bản dài, còn MiniMax đầu tư vào các lĩnh vực dọc như sáng tạo nội dung và trò chơi AI để tạo ra năng lực tùy chỉnh khó bị thay thế.

QTheo phân tích của chuyên gia, liệu mô hình 'siêu thị mô hình' có dẫn đến sự đồng nhất hóa các công ty mô hình lớn không?

ATheo Wang Kai, nhà phân tích cấu hình tài sản chính của Guoxin Securities, về ngắn hạn, các công ty mô hình có thể mất quyền định giá và lợi nhuận chuyển dịch về phía nền tảng, nhưng về dài hạn, các mô hình chuyên sâu trong lĩnh vực như tài chính hay y tế sẽ duy trì rào cản kỹ thuật, không dễ bị đồng nhất hóa.

你可能也喜欢

交易

现货
合约

热门文章

如何购买S

欢迎来到HTX.com!我们已经让购买Sonic(S)变得简单而便捷。跟随我们的逐步指南,放心开始您的加密货币之旅。第一步:创建您的HTX账户使用您的电子邮件、手机号码注册一个免费账户在HTX上。体验无忧的注册过程并解锁所有平台功能。立即注册第二步:前往买币页面,选择您的支付方式信用卡/借记卡购买:使用您的Visa或Mastercard即时购买Sonic(S)。余额购买:使用您HTX账户余额中的资金进行无缝交易。第三方购买:探索诸如Google Pay或Apple Pay等流行支付方法以增加便利性。C2C购买:在HTX平台上直接与其他用户交易。HTX场外交易台(OTC)购买:为大量交易者提供个性化服务和竞争性汇率。第三步:存储您的Sonic(S)购买完您的Sonic(S)后,将其存储在您的HTX账户钱包中。您也可以通过区块链转账将其发送到其他地方或者用于交易其他加密货币。第四步:交易Sonic(S)在HTX的现货市场轻松交易Sonic(S)。访问您的账户,选择您的交易对,执行您的交易,并实时监控。HTX为初学者和经验丰富的交易者提供了友好的用户体验。

2.6k人学过发布于 2025.01.15更新于 2026.06.02

如何购买S

相关讨论

欢迎来到HTX社区。在这里,您可以了解最新的平台发展动态并获得专业的市场意见。以下是用户对S(S)币价的意见。

活动图片