ByteDance Volcano Engine Ark Coding Plan gần đây đã chính thức ra mắt GLM-5.1, bên chính thức cho biết "căn chỉnh khả năng đầy đủ của nhà sản xuất gốc, không giới hạn mua". Trước đó, Coding Plan của Volcano trong thời gian dài chỉ có các mô hình cũ hơn như GLM-4.7. Lần cập nhật này không chỉ giới thiệu GLM-5.1, mà đồng thời tích hợp nhiều mô hình lớn nội địa mới nhất như Minimax M2.7, Kimi k2.6, DeepSeek-V3.2.
Điều này có nghĩa là, nhà phát triển chỉ cần một khoản phí đăng ký để có thể đồng thời gọi nhiều mô hình hàng đầu. Theo phản hồi thị trường, mô hình "đóng gói" này đã giảm đáng kể chi phí thử sai cho nhà phát triển. Hiện tại, gói Lite có giá 40 tệ mỗi tháng, gói Pro giá 200 tệ mỗi tháng, khiến nhiều nhà phát triển sẵn sàng "mua trước để giữ chỗ".
Bản thân GLM-5.1 của ZhiPu trong một bản cập nhật vào đầu tháng 4/2026, đã thể hiện khả năng kỹ thuật ấn tượng. Trong hai video chính thức do ZhiPu phát hành, "Xây dựng máy tính để bàn Linux từ con số 0 trong 8 giờ", "655 vòng lặp, nâng cao thông lượng truy vấn cơ sở dữ liệu vector lên 6.9 lần so với phiên bản chính thức ban đầu", đã làm mới lại trí tưởng tượng của công chúng về "thực thi hiệu quả 8 giờ" của mô hình lớn.
Phóng viên khảo sát thực tế cộng đồng nhà phát triển, đa số người dùng cho biết "không bền"
Phóng viên vào một nhóm giao lưu nhà phát triển Ark Coding, phát hiện ngoài các bài viết chia sẻ trải nghiệm, rất nhiều người dùng phản hồi về sự chênh lệch so với trải nghiệm thực tế. Lướt vài trang cộng đồng giao lưu sẽ thấy, các bài viết khiếu nại, xin hoàn tiền sau bán hàng rất nhiều, không ít cư dân mạng thẳng thắn nói "cảm thấy bị lừa".
Tranh cãi chủ yếu có hai điểm:
Một là vấn đề hạn mức sử dụng hết quá nhanh. Một người dùng tên "Hakimi" đăng bài nói "một vài vòng hội thoại cho một nhiệm vụ, hạn mức 5 giờ sắp hết", và một cư dân mạng khác đăng nguyên nhân kích hoạt hạn mức 5 giờ của mình là do tài khoản liên tục trượt cửa sổ trong 5 giờ liên tiếp, số yêu cầu thực tế đã vượt quá 6004 lần, vượt quá hạn mức hệ thống.
Hai là trải nghiệm giảm sút do điều phối năng lực tính toán chịu áp lực. Nhiều người dùng phản ánh gặp lỗi 429 (quá nhiều yêu cầu), và trong giờ cao điểm "độ trễ ký tự đầu tiên trên 1 phút là bình thường". Một người dùng thẳng thắn nói: "Hạn mức 5 giờ kích hoạt quá thường xuyên, không thể dùng để phát triển nghiêm túc."
Đồng thời, đằng sau mức giá thấp 40 tệ mỗi tháng của Coding Plan, cũng ẩn chứa "dòng chảy ngầm" về hệ số khấu trừ khác nhau cho "một lần yêu cầu gọi" trong gói. Ví dụ, một người dùng trong nhóm giao lưu nhà phát triển đã đăng hình ảnh về "sự khác biệt hệ số khấu trừ khi gọi các mô hình khác nhau". Ví dụ, hệ số khấu trừ cho toàn bộ series Doubao, series Qwen là 1 lần, series DeepSeek là 2 lần, series MiniMax-M2.7, Kimi-K2.6, GLM-5.1 là 5 lần.
Điều này cũng phản ánh, việc xây dựng "siêu thị mô hình" không dễ dàng như tưởng tượng, nhà phát triển bị thu hút bởi "tỷ lệ hiệu suất/chi phí", nhưng những điểm yếu ban đầu lộ ra về điều phối năng lực tính toán, cũng khiến nhiều nhà phát triển sau khi thử đã chọn dừng bước. Điều này cũng phơi bày những cơn đau ban đầu của mô hình "đóng gói". Khi người dùng đổ về, khả năng chịu tải của nền tảng năng lực tính toán đối mặt với thách thức. Làm thế nào để tìm điểm cân bằng bền vững giữa thu hút giá thấp và chất lượng dịch vụ, sẽ là mệnh đề dài hạn mà Volcano Engine và những người theo sau cần giải quyết.
Các nhà cung cấp đám mây tập thể chuyển hướng sang "siêu thị mô hình", sự phân tầng cố định bắt đầu lộ diện
Lần cập nhật "tích hợp" này của Volcano Engine Coding Plan, cũng không phải sự kiện đơn lẻ.
Từ đầu năm 2026, các nhà cung cấp đám mây chủ lưu như Alibaba Cloud, Baidu Intelligent Cloud, Tencent Cloud đều đang thúc đẩy bố cục tích hợp đa mô hình. Ví dụ, Alibaba Cloud là người tiên phong trong ngành, đã sớm ra mắt gói đăng ký đa mô hình "Bailian Coding Plan". Hiện hỗ trợ series Qianwen và các mô hình như kimi-k2.5, glm-5, MiniMax-M2.5. Hiện giá Pro là 200 tệ mỗi tháng, gói Lite từ ngày 20/3 đã ngừng mua mới, từ ngày 13/4 ngừng gia hạn và nâng cấp.
Dịch vụ đăng ký Tencent Cloud Large Model Coding Plan đã ra mắt toàn diện vào tháng 3/2026, hỗ trợ nhiều mô hình mới nhất như Tencent HY 2.0 Instruct, GLM-5, Kimi-K2.5, MiniMax-M2.5. Baidu Qianfan chính thức ra mắt dịch vụ đăng ký mã hóa AI Coding Plan vào tháng 2/2026, cũng là một trong những nhà cung cấp đám mây sớm ra mắt dịch vụ loại này trong nước.
Mô hình "siêu thị mô hình", không phải lựa chọn của một nhà, mà đang trở thành đường đua mà các nhà cung cấp đám mây tranh nhau bố trí. Nhưng xé toạc lớp vỏ ngoài của chiến lược tổng hợp nhà cung cấp đám mây, ai có thể cung cấp dịch vụ ổn định hơn, quy tắc hạn mức minh bạch hơn, cơ chế dự phòng linh hoạt hơn, ai có thể mở rộng thêm khả năng dịch vụ cấp doanh nghiệp ngoài lập trình, tỷ lệ gia hạn có theo kịp hay không, đều trở thành cốt lõi cạnh tranh mới.
Trên thế giới, nền tảng dịch vụ tổng hợp mô hình Amazon Bedrock, Microsoft Azure, khác với trường hợp mô hình đăng ký Coding trong nước, nhưng cùng thuộc xu hướng tích hợp.
Nhìn chung, cạnh tranh ngành cũng chuyển từ "so kè năng lực mô hình đơn nhất" sang "năng lực tích hợp nền tảng + năng lực dịch vụ sinh thái", mức độ tập trung ngành sẽ nhanh chóng nâng cao.
Nhà phân tích cấu hình tài sản chủ quản Quốc Tín Vương Khai nói với phóng viên, mặc dù sự phân hóa ngành đang tăng tốc, nhưng phán đoán thời kỳ tích hợp có thể hơi sớm. "Chính xác hơn, đây là sự tinh tế hóa và lặp lại phân công lao động trong chuỗi industry. Công ty mô hình tập trung vào thuật toán, nhà cung cấp đám mây tập trung vào giao hàng kỹ thuật, mỗi bên phát huy ưu thế chủ nghiệp." Ông cho rằng, dù các nhà cung cấp đám mây khác có theo sau hay không, cục diện cạnh tranh đều sẽ diễn biến từ đơn đấu sang phân hóa vị trí sinh thái.
Áp lực "ống dẫn hóa" của công ty mô hình lớn gia tăng?
Cái gọi là "ống dẫn hóa", không chỉ việc công ty mô hình biến mất, mà chỉ việc họ mất đi giá trị gia tăng sản phẩm, quyền kết nối người dùng và tiếng nói, lợi nhuận chuyển dịch về phía nền tảng năng lực tính toán, trở thành vai trò "bị chi phối".
Dưới làn sóng tổng hợp của nhà cung cấp đám mây, "ống dẫn hóa" cũng đang trở thanh thanh kiếm Damocles treo trên đầu các công ty mô hình lớn độc lập. Trong cuộc cờ câm lặng này, những người chơi hàng đầu như ZhiPu AI, Moonlight (Kimi), MiniMax, không chọn cách thỏa hiệp thụ động, mà từ trong gen của mỗi bên, đã đưa ra những con đường đột phá khác nhau.
CEO ZhiPu AI Trương Bằng trong cuộc đối thoại công khai ngày 8/4, ông nói rõ, mục tiêu cuối cùng của ZhiPu chưa bao giờ là trở thành một "công cụ gọi có thể thay thế tùy ý", mà là xây dựng tác nhân thông minh tự trị hoàn toàn (Autonomous Agent). Định vị này cố gắng để ZhiPu nâng cấp từ "nhà cung cấp mô hình" lên "người thực thi nhiệm vụ", từ đó bỏ qua bẫy giá thấp của API thuần túy.
Moonlight (Kimi) thì áp dụng chiến lược "bố trí phân tán + đào sâu văn bản dài". Đồng bộ tiếp cận nhiều nền tảng đám mây chủ lưu như Volcano Engine, Alibaba Cloud, đạt được cung cấp nguồn tính toán đa dạng, không bị ràng buộc bởi kênh đơn nhất, đảm bảo tính ổn định dịch vụ và khả năng kiểm soát chi phí. Kimi K2.6 ra mắt tháng 4/2026 sử dụng kiến trúc hỗn hợp chuyên gia (MoE), cửa sổ ngữ cảnh tiêu chuẩn đạt 256K tokens.
MiniMax thì đưa nguồn lực cốt lõi vào các lĩnh vực dọc như sáng tạo nội dung, dịch vụ khách hàng thông minh, giáo dục, dịch vụ doanh nghiệp, giải trí xã hội, đặc biệt tập trung bố trí trong các trường hợp như AI game, người số, tương tác đa phương thức, tạo dựng "khả năng tùy chỉnh khó thay thế của nền tảng đám mây".
Việc tích hợp nền tảng của đại厂会加速模型公司被“管道化”吗? Nhà phân tích Vương Khai cho rằng, cần phân biệt góc nhìn ngắn hạn và dài hạn.
"Về ngắn hạn, kênh phân phối bị nền tảng nắm giữ, quyền định giá nhượng bộ một phần, lợi nhuận nhà sản xuất mô hình chuyển dịch về phía cửa vào là quy luật thương mại. Nhưng về lâu dài, mô hình tổng quát dễ đồng nhất hóa, mô hình học sâu trong các trường hợp dọc như tài chính, y tế, luật, rào cản chuyên môn không phải tập trung tổng hợp là có thể xóa bỏ." Ông cho biết.
Về ứng phó rủi ro bị nền tảng hóa, còn có thể tham khảo chiến lược của OpenAI và Anthropic, một mặt tăng cường kênh trực tiếp với người dùng cuối, ví dụ vận hành độc lập ChatGPT và Claude về bản chất là thiết lập kết nối người dùng bỏ qua nền tảng. Mặt khác tốc độ lặp lại công nghệ và nhận thức thương hiệu người dùng là hai hào rào hữu hiệu, do đó công ty mô hình cần cân bằng đầu tư nghiên cứu phát triển và bố trí sản phẩm hóa.
Cờ cuối của cuộc cờ "ống dẫn hóa và nền tảng hóa", có thể không phải ai ăn ai, mà là sự rõ ràng hơn nữa của phân công. Nhà cung cấp đám mây làm ống, công ty mô hình làm công nghệ, hai bên trong cờ cạnh tranh dần dần tìm thấy ranh giới sinh tồn của mỗi bên.
Còn việc ai ăn ai, ở giai đoạn hiện tại, còn chưa đến hồi kết của câu chuyện.
Bài viết từ tài khoản công chúng WeChat "Báo Khoa Sáng Kỷ", tác giả: Vương Nại















