"Siêu thị mô hình" ngày càng nhiều: ByteDance, Alibaba, Tencent cạnh tranh tích hợp

marsbit发布于2026-04-24更新于2026-04-24

文章摘要

Mô hình "siêu thị mô hình" đang trở thành xu hướng cạnh tranh của các gã khổng lồ công nghệ như ByteDance, Alibaba và Tencent. Cụ thể, ByteDance mới ra mắt Coding Plan với khả năng tích hợp nhiều mô hình AI hàng đầu như GLM-5.1, Minimax M2.7, Kimi k2.6 và DeepSeek-V3.2, cho phép nhà phát triển truy cập chỉ với một gói đăng ký từ 40-200 USD/tháng. Tuy nhiên, cộng đồng nhà phát triển phản ánh nhiều vấn đề như giới hạn sử dụng nhanh hết (chỉ 5 giờ), lỗi 429 do quá tải và độ trễ cao. Các gói dịch vụ cũng áp dụng hệ số khấu trừ khác nhau tùy mô hình, khiến chi phí thực tế không minh bạch. Các hãng cloud như Alibaba, Tencent và Baidu cũng đẩy mạnh mô hình tích hợp đa nền tảng, chuyển trọng tâm từ cạnh tranh mô hình đơn lẻ sang khả năng tích hợp và dịch vụ. Điều này đặt ra nguy cơ "ống dẫn hóa" (pipeline) cho các công ty mô hình độc lập, buộc họ tìm cách tự nâng cấp (như智谱 với autonomous agent) hoặc chuyên sâu vào lĩnh vực dọc. Dù vậy, các chuyên gia nhận định đây là sự phân công lại ngành, nơi công ty mô hình tập trung vào thuật toán, còn nền tảng đám mây đảm nhận triển khai. Cuộc cạnh tranh vẫn đang ở giai đoạn đầu và chưa thể kết luận ai sẽ thống trị.

ByteDance Volcano Engine Ark Coding Plan gần đây đã chính thức ra mắt GLM-5.1, bên chính thức cho biết "căn chỉnh khả năng đầy đủ của nhà sản xuất gốc, không giới hạn mua". Trước đó, Coding Plan của Volcano trong thời gian dài chỉ có các mô hình cũ hơn như GLM-4.7. Lần cập nhật này không chỉ giới thiệu GLM-5.1, mà đồng thời tích hợp nhiều mô hình lớn nội địa mới nhất như Minimax M2.7, Kimi k2.6, DeepSeek-V3.2.

Điều này có nghĩa là, nhà phát triển chỉ cần một khoản phí đăng ký để có thể đồng thời gọi nhiều mô hình hàng đầu. Theo phản hồi thị trường, mô hình "đóng gói" này đã giảm đáng kể chi phí thử sai cho nhà phát triển. Hiện tại, gói Lite có giá 40 tệ mỗi tháng, gói Pro giá 200 tệ mỗi tháng, khiến nhiều nhà phát triển sẵn sàng "mua trước để giữ chỗ".

Bản thân GLM-5.1 của ZhiPu trong một bản cập nhật vào đầu tháng 4/2026, đã thể hiện khả năng kỹ thuật ấn tượng. Trong hai video chính thức do ZhiPu phát hành, "Xây dựng máy tính để bàn Linux từ con số 0 trong 8 giờ", "655 vòng lặp, nâng cao thông lượng truy vấn cơ sở dữ liệu vector lên 6.9 lần so với phiên bản chính thức ban đầu", đã làm mới lại trí tưởng tượng của công chúng về "thực thi hiệu quả 8 giờ" của mô hình lớn.

Phóng viên khảo sát thực tế cộng đồng nhà phát triển, đa số người dùng cho biết "không bền"

Phóng viên vào một nhóm giao lưu nhà phát triển Ark Coding, phát hiện ngoài các bài viết chia sẻ trải nghiệm, rất nhiều người dùng phản hồi về sự chênh lệch so với trải nghiệm thực tế. Lướt vài trang cộng đồng giao lưu sẽ thấy, các bài viết khiếu nại, xin hoàn tiền sau bán hàng rất nhiều, không ít cư dân mạng thẳng thắn nói "cảm thấy bị lừa".

Tranh cãi chủ yếu có hai điểm:

Một là vấn đề hạn mức sử dụng hết quá nhanh. Một người dùng tên "Hakimi" đăng bài nói "một vài vòng hội thoại cho một nhiệm vụ, hạn mức 5 giờ sắp hết", và một cư dân mạng khác đăng nguyên nhân kích hoạt hạn mức 5 giờ của mình là do tài khoản liên tục trượt cửa sổ trong 5 giờ liên tiếp, số yêu cầu thực tế đã vượt quá 6004 lần, vượt quá hạn mức hệ thống.

Hai là trải nghiệm giảm sút do điều phối năng lực tính toán chịu áp lực. Nhiều người dùng phản ánh gặp lỗi 429 (quá nhiều yêu cầu), và trong giờ cao điểm "độ trễ ký tự đầu tiên trên 1 phút là bình thường". Một người dùng thẳng thắn nói: "Hạn mức 5 giờ kích hoạt quá thường xuyên, không thể dùng để phát triển nghiêm túc."

Đồng thời, đằng sau mức giá thấp 40 tệ mỗi tháng của Coding Plan, cũng ẩn chứa "dòng chảy ngầm" về hệ số khấu trừ khác nhau cho "một lần yêu cầu gọi" trong gói. Ví dụ, một người dùng trong nhóm giao lưu nhà phát triển đã đăng hình ảnh về "sự khác biệt hệ số khấu trừ khi gọi các mô hình khác nhau". Ví dụ, hệ số khấu trừ cho toàn bộ series Doubao, series Qwen là 1 lần, series DeepSeek là 2 lần, series MiniMax-M2.7, Kimi-K2.6, GLM-5.1 là 5 lần.

Điều này cũng phản ánh, việc xây dựng "siêu thị mô hình" không dễ dàng như tưởng tượng, nhà phát triển bị thu hút bởi "tỷ lệ hiệu suất/chi phí", nhưng những điểm yếu ban đầu lộ ra về điều phối năng lực tính toán, cũng khiến nhiều nhà phát triển sau khi thử đã chọn dừng bước. Điều này cũng phơi bày những cơn đau ban đầu của mô hình "đóng gói". Khi người dùng đổ về, khả năng chịu tải của nền tảng năng lực tính toán đối mặt với thách thức. Làm thế nào để tìm điểm cân bằng bền vững giữa thu hút giá thấp và chất lượng dịch vụ, sẽ là mệnh đề dài hạn mà Volcano Engine và những người theo sau cần giải quyết.

Các nhà cung cấp đám mây tập thể chuyển hướng sang "siêu thị mô hình", sự phân tầng cố định bắt đầu lộ diện

Lần cập nhật "tích hợp" này của Volcano Engine Coding Plan, cũng không phải sự kiện đơn lẻ.

Từ đầu năm 2026, các nhà cung cấp đám mây chủ lưu như Alibaba Cloud, Baidu Intelligent Cloud, Tencent Cloud đều đang thúc đẩy bố cục tích hợp đa mô hình. Ví dụ, Alibaba Cloud là người tiên phong trong ngành, đã sớm ra mắt gói đăng ký đa mô hình "Bailian Coding Plan". Hiện hỗ trợ series Qianwen và các mô hình như kimi-k2.5, glm-5, MiniMax-M2.5. Hiện giá Pro là 200 tệ mỗi tháng, gói Lite từ ngày 20/3 đã ngừng mua mới, từ ngày 13/4 ngừng gia hạn và nâng cấp.

Dịch vụ đăng ký Tencent Cloud Large Model Coding Plan đã ra mắt toàn diện vào tháng 3/2026, hỗ trợ nhiều mô hình mới nhất như Tencent HY 2.0 Instruct, GLM-5, Kimi-K2.5, MiniMax-M2.5. Baidu Qianfan chính thức ra mắt dịch vụ đăng ký mã hóa AI Coding Plan vào tháng 2/2026, cũng là một trong những nhà cung cấp đám mây sớm ra mắt dịch vụ loại này trong nước.

Mô hình "siêu thị mô hình", không phải lựa chọn của một nhà, mà đang trở thành đường đua mà các nhà cung cấp đám mây tranh nhau bố trí. Nhưng xé toạc lớp vỏ ngoài của chiến lược tổng hợp nhà cung cấp đám mây, ai có thể cung cấp dịch vụ ổn định hơn, quy tắc hạn mức minh bạch hơn, cơ chế dự phòng linh hoạt hơn, ai có thể mở rộng thêm khả năng dịch vụ cấp doanh nghiệp ngoài lập trình, tỷ lệ gia hạn có theo kịp hay không, đều trở thành cốt lõi cạnh tranh mới.

Trên thế giới, nền tảng dịch vụ tổng hợp mô hình Amazon Bedrock, Microsoft Azure, khác với trường hợp mô hình đăng ký Coding trong nước, nhưng cùng thuộc xu hướng tích hợp.

Nhìn chung, cạnh tranh ngành cũng chuyển từ "so kè năng lực mô hình đơn nhất" sang "năng lực tích hợp nền tảng + năng lực dịch vụ sinh thái", mức độ tập trung ngành sẽ nhanh chóng nâng cao.

Nhà phân tích cấu hình tài sản chủ quản Quốc Tín Vương Khai nói với phóng viên, mặc dù sự phân hóa ngành đang tăng tốc, nhưng phán đoán thời kỳ tích hợp có thể hơi sớm. "Chính xác hơn, đây là sự tinh tế hóa và lặp lại phân công lao động trong chuỗi industry. Công ty mô hình tập trung vào thuật toán, nhà cung cấp đám mây tập trung vào giao hàng kỹ thuật, mỗi bên phát huy ưu thế chủ nghiệp." Ông cho rằng, dù các nhà cung cấp đám mây khác có theo sau hay không, cục diện cạnh tranh đều sẽ diễn biến từ đơn đấu sang phân hóa vị trí sinh thái.

Áp lực "ống dẫn hóa" của công ty mô hình lớn gia tăng?

Cái gọi là "ống dẫn hóa", không chỉ việc công ty mô hình biến mất, mà chỉ việc họ mất đi giá trị gia tăng sản phẩm, quyền kết nối người dùng và tiếng nói, lợi nhuận chuyển dịch về phía nền tảng năng lực tính toán, trở thành vai trò "bị chi phối".

Dưới làn sóng tổng hợp của nhà cung cấp đám mây, "ống dẫn hóa" cũng đang trở thanh thanh kiếm Damocles treo trên đầu các công ty mô hình lớn độc lập. Trong cuộc cờ câm lặng này, những người chơi hàng đầu như ZhiPu AI, Moonlight (Kimi), MiniMax, không chọn cách thỏa hiệp thụ động, mà từ trong gen của mỗi bên, đã đưa ra những con đường đột phá khác nhau.

CEO ZhiPu AI Trương Bằng trong cuộc đối thoại công khai ngày 8/4, ông nói rõ, mục tiêu cuối cùng của ZhiPu chưa bao giờ là trở thành một "công cụ gọi có thể thay thế tùy ý", mà là xây dựng tác nhân thông minh tự trị hoàn toàn (Autonomous Agent). Định vị này cố gắng để ZhiPu nâng cấp từ "nhà cung cấp mô hình" lên "người thực thi nhiệm vụ", từ đó bỏ qua bẫy giá thấp của API thuần túy.

Moonlight (Kimi) thì áp dụng chiến lược "bố trí phân tán + đào sâu văn bản dài". Đồng bộ tiếp cận nhiều nền tảng đám mây chủ lưu như Volcano Engine, Alibaba Cloud, đạt được cung cấp nguồn tính toán đa dạng, không bị ràng buộc bởi kênh đơn nhất, đảm bảo tính ổn định dịch vụ và khả năng kiểm soát chi phí. Kimi K2.6 ra mắt tháng 4/2026 sử dụng kiến trúc hỗn hợp chuyên gia (MoE), cửa sổ ngữ cảnh tiêu chuẩn đạt 256K tokens.

MiniMax thì đưa nguồn lực cốt lõi vào các lĩnh vực dọc như sáng tạo nội dung, dịch vụ khách hàng thông minh, giáo dục, dịch vụ doanh nghiệp, giải trí xã hội, đặc biệt tập trung bố trí trong các trường hợp như AI game, người số, tương tác đa phương thức, tạo dựng "khả năng tùy chỉnh khó thay thế của nền tảng đám mây".

Việc tích hợp nền tảng của đại厂会加速模型公司被“管道化”吗? Nhà phân tích Vương Khai cho rằng, cần phân biệt góc nhìn ngắn hạn và dài hạn.

"Về ngắn hạn, kênh phân phối bị nền tảng nắm giữ, quyền định giá nhượng bộ một phần, lợi nhuận nhà sản xuất mô hình chuyển dịch về phía cửa vào là quy luật thương mại. Nhưng về lâu dài, mô hình tổng quát dễ đồng nhất hóa, mô hình học sâu trong các trường hợp dọc như tài chính, y tế, luật, rào cản chuyên môn không phải tập trung tổng hợp là có thể xóa bỏ." Ông cho biết.

Về ứng phó rủi ro bị nền tảng hóa, còn có thể tham khảo chiến lược của OpenAI và Anthropic, một mặt tăng cường kênh trực tiếp với người dùng cuối, ví dụ vận hành độc lập ChatGPT và Claude về bản chất là thiết lập kết nối người dùng bỏ qua nền tảng. Mặt khác tốc độ lặp lại công nghệ và nhận thức thương hiệu người dùng là hai hào rào hữu hiệu, do đó công ty mô hình cần cân bằng đầu tư nghiên cứu phát triển và bố trí sản phẩm hóa.

Cờ cuối của cuộc cờ "ống dẫn hóa và nền tảng hóa", có thể không phải ai ăn ai, mà là sự rõ ràng hơn nữa của phân công. Nhà cung cấp đám mây làm ống, công ty mô hình làm công nghệ, hai bên trong cờ cạnh tranh dần dần tìm thấy ranh giới sinh tồn của mỗi bên.

Còn việc ai ăn ai, ở giai đoạn hiện tại, còn chưa đến hồi kết của câu chuyện.

Bài viết từ tài khoản công chúng WeChat "Báo Khoa Sáng Kỷ", tác giả: Vương Nại

你可能也喜欢

工党领袖换人，压抑已久的英国加密市场要翻身了？

英国工党领袖基尔·斯塔默宣布辞去首相职务，党魁竞选随之启动。前大曼彻斯特市长安迪·伯纳姆成为接任的热门人选，加密行业对其抱有期待，希望他能缓和工党对数字资产的强硬态度，并将该行业塑造为经济增长动力。目前，英国金融行为监管局（FCA）正推进一套全面的加密监管框架，计划于2027年10月正式生效。新规要求相关企业必须获取专项经营授权。尽管领导层更迭可能调整政策优先级或更换官员，但监管框架的核心已通过立法确立，整体方向发生根本逆转的可能性较小。行业希望新政府能推动出台比例适度的资本要求、简化的授权流程，并对质押、借贷等业务给予明确监管界定，同时更切实地贯彻经济增长导向的监管使命。市场预测平台显示伯纳姆接任概率极高，传统金融市场对此反应平静。行业呼吁英国政界和监管机构更积极地接纳加密领域，以利用其深厚的金融科技底蕴抢占全球先机。

Foresight News12分钟前

Foresight News12分钟前

美元硬刚日本干预红线，Carry Trade还会崩盘吗？

6月23日，美元指数维持在101上方，美元兑日元一度逼近161.96的关键位置。若突破该点位，日元将跌至1986年12月以来最低水平。美元走强主要受美联储政策预期转鹰推动，市场对年内加息的押注升温，短端美债收益率高企。日元持续承压的核心在于美日利差扩大。日本财务省已就汇率波动发出警告，市场警惕当局可能干预汇市，但单次干预难以扭转由利差主导的趋势。同时，油价因地缘局势反复波动，若持续反弹可能加剧通胀担忧，进一步支撑美元利率预期。当前市场焦点集中在美联储加息前景、日本干预汇市的可能以及油价走势对通胀的影响上。美元指数能否突破前高、日元会否触及数十年低位以及日本会否实际行动，将决定强美元行情能否延续。

marsbit16分钟前

marsbit16分钟前

60天窗口压低油价，为什么市场反而跌了？

6月23日，国际油价延续跌势。此前市场因担忧霍尔木兹海峡航运中断而推高的风险溢价，正随着两艘油轮恢复通行而减弱。这被视为供应紧张最坏情形暂未发生的信号。同时，美伊临时安排为伊朗石油销售提供了约60天的窗口，进一步缓解了短期供应担忧。然而，这一安排被视为谈判缓冲期而非最终协议，其临时性限制了油价的下跌空间。市场态度谨慎，因中东地缘政治风险并未根除。美伊互信不足，任何关于航运受阻或谈判破裂的消息都可能迅速推高油价。此外，美国战略石油储备处于历史低位，削弱了其应对潜在供应冲击的缓冲能力。综上，当前油价回落主要源于短期供应恐慌降温，但由于长期风险仍在，市场并未将此次下跌视为风险彻底出清。

marsbit27分钟前

marsbit27分钟前

SK 海力士市值 26 年来首超三星，韩国券商喊出仍有 50% 上涨空间

6月22日，SK海力士盘中市值达208万亿韩元，26年来首次超越三星电子，成为韩国股市市值第一。该股今年累计涨幅已超340%，其强势表现主要得益于AI浪潮下的存储芯片需求，尤其是其在HBM（高带宽存储器）市场占据主导地位。韩华投资证券将SK海力士目标价大幅上调至430万韩元，为韩国券商最高目标价。核心逻辑是，长期供货协议（LTA）和稳定的HBM需求已从根本上改变了存储芯片行业的盈利波动性，公司正转型为能够持续产生高利润的企业。多家券商近期也集体上调目标价，认为存储行业估值逻辑正在发生范式转变。业绩方面，SK海力士2026财年一季度营收首次突破50万亿韩元，营业利润率高达72%，创行业纪录。HBM是核心驱动力，目前全球供需紧张局面预计将持续。尽管6月23日股价从盘前高点回落，部分市场观点认为市值反超可能存在短期过热，但仍有高回报投资者将回调视为加仓机会。市场正在给予直接受益于AI基础设施建设的公司更高估值溢价。

marsbit45分钟前

marsbit45分钟前

GPU 租赁价格三周跌 30%，AI 价值链正从英伟达「大迁移」至内存芯片

英伟达B200芯片的云端租赁价格近期显著下跌，从5月底的6.11美元/小时降至4.22美元/小时，三周内跌幅约30%。这反映出AI算力短缺的叙事可能正在动摇，供应增加与竞争加剧是主要原因。与此同时，半导体市场出现分化：以美光、闪迪为代表的内存芯片公司股价飙升，而英伟达股价同期略有下跌。市场逻辑正在转变：GPU供应趋于宽松，但AI模型对高带宽内存（HBM）和存储的需求暴增，使内存成为新的产业瓶颈。内存合约价格上半年涨幅超过100%，连苹果公司都表示难以承受成本压力。高盛交易主管指出，若算力租赁价格持续走低，将动摇整个AI硬件链的估值基础，利润可能从卖芯片的上游（如英伟达）向掌握使用量变现的下游转移。另一方面，长期协议市场依然火热，如Google与SpaceX签订了价值300亿美元的GPU租赁大单，表明大客户仍在锁定长期算力。但这类合同也包含提前终止条款，显示了买方的谨慎。综合来看，AI产业的价值链和利润分配正在发生变化。投资者的关注点需从“算力稀缺”转向产业链中定价权的转移，内存芯片厂商目前似乎占据了更有利的位置。美光即将发布的财报将成为验证这一趋势的关键。

marsbit54分钟前

marsbit54分钟前

交易

现货

合约

"Siêu thị mô hình" ngày càng nhiều: ByteDance, Alibaba, Tencent cạnh tranh tích hợp

文章摘要

Phóng viên khảo sát thực tế cộng đồng nhà phát triển, đa số người dùng cho biết "không bền"

Các nhà cung cấp đám mây tập thể chuyển hướng sang "siêu thị mô hình", sự phân tầng cố định bắt đầu lộ diện

Áp lực "ống dẫn hóa" của công ty mô hình lớn gia tăng?

热门币种推荐

相关问答

你可能也喜欢

工党领袖换人，压抑已久的英国加密市场要翻身了？

美元硬刚日本干预红线，Carry Trade还会崩盘吗？

60天窗口压低油价，为什么市场反而跌了？

SK 海力士市值 26 年来首超三星，韩国券商喊出仍有 50% 上涨空间

GPU 租赁价格三周跌 30%，AI 价值链正从英伟达「大迁移」至内存芯片

交易

热门文章

如何购买S

Sonic：Andre Cronje主导升级，逆势上涨的Layer1新星

成长学院：学习“ Sonic“ ，瓜分价值 1000 USDT

相关讨论

热门问答

热门分类

热门标签