Vào ngày 18 và 19 tháng 3, hai công ty Trung Quốc đã lần lượt ra mắt các mô hình lớn hướng Agent của mình. Công ty khởi nghiệp AI trong nước MiniMax giới thiệu M2.7, trong khi đội ngũ mô hình lớn của Xiaomi là MiMo ra mắt V2-Pro. Cả hai mô hình đều lọt vào nhóm dẫn đầu toàn cầu trên benchmark Agent, nhưng giá đầu ra API của chúng lần lượt chỉ bằng 1/21 và 1/8 so với Claude Opus 4.6.
Cùng ra bài trong một tuần, nhưng lá bài họ nắm giữ hoàn toàn khác nhau. Họ đại diện cho hai con đường công nghệ hoàn toàn khác biệt, đặt cược vào hai tương lai của kỷ nguyên Agent.
Cùng một kỳ thi, học phí 1/17
Trước tiên hãy xem so sánh trực quan nhất.
Theo dữ liệu từ OpenRouter và trang định giá chính thức của các công ty, tính theo giá đầu ra API (trên mỗi triệu tokens), MiniMax M2.7 là 1.2 USD, MiMo-V2-Pro là 3 USD. Để so sánh, giá đầu ra của Claude Opus 4.6 là 25 USD, GPT-5.2 là 14 USD, Claude Sonnet 4.6 là 15 USD.
Khoảng cách giá là khác biệt về cấp số, nhưng khoảng cách năng lực thì không. Trên SWE-bench Verified (benchmark phổ biến nhất hiện nay để đo lường khả năng kỹ thuật mã), MiMo-V2-Pro đạt 78%, Sonnet 4.6 là 79.6%, chênh lệch chưa đến hai phần trăm. Thành tích SWE-Pro của M2.7 là 56.22%, ngang bằng với GPT-5.3-Codex. Trên VIBE-Pro (khả năng giao hàng dự án end-to-end), M2.7 đạt 55.6%, gần với mức của Opus 4.6.
Điểm quan trọng của biểu đồ này không nằm ở chỗ ai cao ai thấp - các hệ thống benchmark của các bên không hoàn toàn đồng nhất, cần thận trọng khi so sánh trực tiếp. Trọng tâm nằm ở "khoảng cách kéo giá-hiệu suất": các mô hình Agent trong nước đã len lỏi vào cùng một dải năng lực, nhưng đứng ở các phân khúc giá hoàn toàn khác nhau.
Ngàn tỷ tham số vs Tự tiến hóa
Giá cả chỉ là bề ngoài. Hai công ty đã đưa ra hai lá bài hoàn toàn khác biệt.
MiMo-V2-Pro đi theo con đường "ra sức đạt được điều kỳ diệu". Theo thông báo chính thức của Xiaomi, V2-Pro có tổng số tham số vượt quá 1 nghìn tỷ, tham số kích hoạt 42B, hỗ trợ ngữ cảnh siêu dài 100 nghìn tokens. Đổi mới cốt lõi của nó là cơ chế chú ý hỗn hợp Hybrid Attention, điều chỉnh tỷ lệ chú ý cửa sổ trượt (SWA) với chú ý toàn cục (GA) thành 7:1 - thế hệ trước V2-Flash là 5:1. Kiến trúc này giúp mô hình ổn định hơn khi xử lý các tài liệu dài, các tình huống Agent gọi song song nhiều công cụ. Trên PinchBench (đánh giá khả năng gọi công cụ Agent), MiMo-V2-Pro đạt 84%.
M2.7 đi một con đường hoàn toàn khác. Theo blog công nghệ chính thức được MiniMax phát hành ngày 18 tháng 3, số lượng tham số của M2.7 không được công bố, nhưng nó cho thấy một cơ chế "tự lặp lại tiến hóa": mô hình tự chạy vòng lặp tối ưu hóa trên 100 vòng, bao gồm phân tích quỹ đạo thất bại, lập kế hoạch sửa đổi, sửa đổi kiến trúc mã của chính nó, chạy đánh giá, rồi lặp lại, cuối cùng đạt được cải thiện hiệu suất 30% trên tập đánh giá nội bộ. Trong 22 câu hỏi khó của MLE Bench Lite (đánh giá độ khó cuộc thi học máy), M2.7 giành được 9 vàng, 5 bạc, 1 đồng, tỷ lệ huy chương trung bình 66.6%.
Xét từ năm chiều, hai con đường có hướng sắc bén hoàn toàn khác nhau: MiMo-V2-Pro vượt trội rõ rệt về độ dài ngữ cảnh và chiều kỹ thuật mã, trong khi M2.7 tạo khoảng cách về khả năng tự động hóa văn phòng và tự lặp lại. Theo cùng blog công nghệ của MiniMax, M2.7 đạt ELO 1495 trên GDPval-AA (đánh giá xử lý tài liệu văn phòng), đứng đầu среди các mô hình nguồn mở, và duy trì tỷ lệ tuân thủ kỹ năng 97% trong bài kiểm tra MM-Claw bao phủ hơn 40 kỹ năng phức tạp.
Bốn phiên bản trong năm tháng
Hai công ty không chỉ khác nhau về con đường công nghệ, mà nhịp độ lặp lại cũng hoàn toàn khác biệt.
Theo hồ sơ phát hành công khai, từ tháng 10 năm 2025 phát hành M2 đến tháng 3 năm 2026 phát hành M2.7, MiniMax đã lặp lại bốn phiên bản trong năm tháng, trung bình mỗi 49 ngày một phiên bản lớn. Khoảng cách giữa M2.5 và M2.7 chỉ khoảng 30 ngày.
Nhịp độ của Xiaomi MiMo thì khác: tháng 4 năm 2025 phát hành MiMo-7B (mô hình suy luận nguồn mở 7B tham số), tháng 12 cùng năm phát hành V2-Flash (309B tổng tham số), tháng 3 năm 2026 phát hành V2-Pro (1T tổng tham số). Quy mô tham số giữa các thế hệ có bước nhảy vọt lớn hơn, nhưng khoảng cách phiên bản cũng dài hơn.
MiniMax chọn cách chạy nước rút nhỏ, mỗi lần lặp lại biên độ không lớn nhưng tần suất cực cao, cơ chế tự lặp lại của M2.7 vốn được thiết kế cho "tiến hóa liên tục". Xiaomi chọn cách ra đòn dồn lực, mỗi phiên bản đều là bước nhảy vọt lớn về quy mô tham số và kiến trúc.
Ẩn danh 8 ngày, đăng quang OpenRouter
Ngoài con đường công nghệ, chiến lược phát hành của Xiaomi cũng phá vỡ thông lệ ngành.
Theo Reuters, vào ngày 11 tháng 3, một mô hình ẩn danh tên là Hunter Alpha xuất hiện trên nền tảng tổng hợp API lớn nhất thế giới OpenRouter. Không có sự hậu thuẫn của thương hiệu, không có sự kiện ra mắt, không có blog công nghệ. API của nó có giá cực thấp, nhưng hiệu suất lại mạnh mẽ đến bất ngờ.
Cộng đồng bắt đầu suy đoán về lai lịch của nó. Theo Republic World và nhiều trang tin công nghệ, phỏng đoán chủ đạo nhất là DeepSeek V4, vì trưởng nhóm MiMo Luo Fuli trước đây từng nghiên cứu tại DeepSeek. Lượng gọi tăng nhanh chóng, tổng lượng gọi trong thời gian ẩn danh vượt 1 nghìn tỷ tokens, đứng đầu bảng xếp hạng tuần của OpenRouter.
Rạng sáng ngày 19 tháng 3, Xiaomi công bố: Hunter Alpha chính là MiMo-V2-Pro. Theo cùng bài báo của Reuters, cổ phiếu Hong Kong của Xiaomi đã có lúc tăng 5.8% sau khi công bố.
Đây là lần đầu tiên một mô hình lớn trong nước chứng minh mình trên nền tảng toàn cầu bằng phương thức hoàn toàn mù. Không dựa vào thương hiệu, không dựa vào tuyên truyền, dùng 8 ngày để các nhà phát triển bỏ phiếu bằng chân.










