Văn | Tượng Tiên Chí
Tối hôm kia, Moon Dark Side đã ra mắt Kimi K2.6 và điều chỉnh giá API đầu vào từ 0,60 USD lên 0,95 USD cho mỗi triệu token.
Tăng 58%. Đây là lần tăng giá đầu tiên kể từ khi series K2 ra mắt.
Nhưng dường như không ai chú ý đến việc này.
Bốn tháng trước, trong thư nội bộ vào ngày cuối cùng của năm 2025, Dương Thực Lân viết rằng Moon Dark Side "trong ngắn hạn không vội IPO". Lúc đó, hồ sơ IPO của Zhipu và MiniMax đã được nộp lên Sở Giao dịch Chứng khoán Hồng Kông, rõ ràng đây là một sự phân biệt vị thế có chủ ý.
Anh ấy cũng viết trong bức thư đó, dự trữ tiền mặt của công ty vượt quá 1,4 tỷ USD, vòng C được định giá vượt mức 500 triệu USD - hàm ý rằng, tiềm năng của thị trường sơ cấp vẫn chưa được phát huy hết, thị trường thứ cấp không vội.
Ba tháng sau, Bloomberg đưa tin anh bắt đầu tiếp xúc với trung kim và Goldman Sachs. Ba tuần sau đó, K2.6 ra mắt.
Một người không thích "vội" lại hoàn thành trong bốn tháng việc mà trước đó anh ấy nói sẽ không làm.
K2.6 chắc chắn không phải là bản phát hành sản phẩm cuối cùng của Moon Dark Side trước khi lên sàn. Nhưng bản phát hành lần này lại là buổi roadshow đầu tiên của Dương Thực Lân sau khi Moon Dark Side lên kế hoạch IPO.
Kimi chưa từng phát hành một phiên bản model như thế này
Kimi trước đây phát hành model có một quy trình cố định.
Phát hành báo cáo kỹ thuật, mã nguồn mở trọng số, leo bảng xếp hạng HuggingFace, rồi chờ sự giám sát của cộng đồng kỹ thuật. K1.5 so sánh với o1 về phương pháp luận suy luận, chi tiết kỹ thuật còn nhiều hơn cả con số benchmark; K2 Thinking trực tiếp đưa trọng số lên HuggingFace, để nhà phát triển tự chạy test. Những động thái này đều viết cho các nhà phát triển và nhà nghiên cứu.
Thuật ngữ cũng là của cộng đồng kỹ thuật: chúng tôi giải quyết vấn đề gì, phương pháp của chúng tôi tốt hơn tại sao, hoan nghênh reproduce.
Động thái của K2.6 hơi khác.
Nói về tăng giá trước. Theo tính toán bằng Nhân dân tệ, giá đầu vào cho mỗi triệu token của K2.6 là 6,5 nhân dân tệ (cache miss), K2.5 là 4 nhân dân tệ. Giá đầu ra tăng từ 21 nhân dân tệ lên 27 nhân dân tệ. Giá khi cache hit là 1,1 nhân dân tệ.
Đây là một đợt tăng giá có cấu trúc. Bề ngoài tất cả các mức đều tăng, nhưng mức tăng của cache hit là nhỏ nhất - từ 0,7 nhân dân tệ lên 1,1 nhân dân tệ, tính bằng USD là 0,16 USD/triệu token.
Con số 0,16 USD này là chìa khóa để hiểu đợt tăng giá lần này.
Đối với người dùng doanh nghiệp lâu dài sử dụng cùng một system prompt: trợ lý mã code, framework điều phối Agent, dịch vụ chăm sóc khách hàng thông minh, prefix của họ được tái sử dụng cao, tỷ lệ cache hit có thể chạy đến 75% đến 83%. Moon Dark Side dành cho nhóm khách hàng này một mức giá gần như ngang bằng.
Đối với khách hàng lẻ sử dụng không thường xuyên, prompt mỗi lần đều khác nhau, đợt tăng giá này được áp dụng đầy đủ lên họ.
Đây là một đợt điều chỉnh giá thân thiện nhắm vào "các doanh nghiệp đã gắn chặt với Kimi" và một đợt điều chỉnh giá không thân thiện nhắm vào "khách hàng lẻ vẫn đang so sánh giá". Nhóm trước là "khách hàng doanh nghiệp bị khóa chặt" trong câu chuyện lên sàn, nhóm sau là "người dùng dài hạn" sẽ không xuất hiện trên slide roadshow. Moon Dark Side rất rõ哪些人 (những ai) là tài sản định giá của mình.
Cấu trúc tính toán thời đại Agent khác với thời đại hội thoại. Model hội thoại là vài chục token qua lại, Agent là hàng nghìn lần gọi công cụ và tiêu thụ hàng chục nghìn token. Case study chính thức của K2.6 — triển khai cục bộ Mac model Qwen3.5 gọi công cụ hơn 4000 lần, kéo dài 12 giờ, tái cấu trúc engine ghép nối mã nguồn mở exchange-core 13 giờ hơn 1000 lần gọi công cụ, cực đoan hơn là chạy tự động 5 ngày giám sát cảnh báo, phản hồi sự cố — mức tiêu thụ token cho mỗi task đơn lẻ này cao gấp hàng trăm thậm chí hàng nghìn lần so với kịch bản hội thoại thời K2.5.
Tất nhiên, bộ case study này dùng để nói về khả năng lập luận dài hạn, nhưng cộng thêm cụm 300 agent của K2.6 lần này, lượng token tiêu thụ chắc chắn đáng kinh ngạc.
Theo mức giá cũ 0,60 USD, mỗi lần gọi task Agent kiểu này có thể lỗ. Với 0,95 USD, vừa đủ trang trải chi phí suy luận.
Vì vậy, tăng giá không phải là tự tin, mà là bắt buộc. Moon Dark Side đã huy động tổng cộng 2,5 tỷ USD, từ vòng C đến C+ có dự trữ tiền mặt 1,4 tỷ USD, nhưng nếu thế hệ K3 tiếp theo thực sự có quy mô 3-4 nghìn tỷ tham số, chỉ một đợt pre-training có thể ăn mất một nửa số đó.
Không tăng giá, dữ liệu biên lợi nhuận trong vài quý cuối trước khi lên sàn sẽ khó coi. Bản cáo bạch phải tiết lộ tỷ suất lợi nhuận gộp.
Việc này đáng lẽ có thể nói một cách thẳng thắn — Thời đại Agent cần mô hình định giá mới. Nhưng Moon Dark Side đã không nói. Bởi vì người dùng C端 (C-side - người dùng cuối) vừa mới trải qua thời kỳ miễn phí của K2 Thinking, giờ nói với họ "tôi tăng giá" không phải là một câu chuyện sản phẩm hay.
Nó là câu chuyện dành cho một thính giả khác — Kimi đã có một nhóm khách hàng doanh nghiệp không thể rời xa nó, đắt hơn một chút họ vẫn dùng. (Ví dụ như bản thân tôi)
Việc thứ hai là benchmark đối chiếu. Đối tượng tham chiếu chính thức mà K2.6 lựa chọn là GPT-5.4, Claude Opus 4.6, Gemini 3.1 Pro. Cả ba đều là flagship thế hệ trước.
Cùng tuần đó, Anthropic phát hành Claude Mythos, Opus 4.7 cũng vừa ra mắt — cả hai đều mạnh hơn Opus 4.6 một thế hệ. K2.6 không so sánh với chúng.
Đây thực ra là lựa chọn chủ động. So với Mythos, K2.6 rơi vào vị trí "kẻ đuổi theo"; so với Opus 4.6, K2.6 rơi vào vị trí "hàng đầu". Định giá 18 tỷ USD cần vị trí sau.
Kimi trước đây ít làm việc kiểu này. Khi K2 Thinking ra mắt, chính thức đã chạy benchmark đầy đủ, có điểm tốt và điểm kém, đưa hết ra để nhà phát triển tự đánh giá. Đó là cách chơi của cộng đồng kỹ thuật — cộng đồng hiểu bạn mạnh ở đâu, yếu ở đâu, và sẵn sàng chấp nhận một model có điểm yếu rõ ràng nhưng con đường rõ ràng.
Slide roadshow thì không. Slide roadshow cần một kết luận mà quỹ quản lý có thể hiểu trong 30 giây "ngang bằng hoặc vượt trội so với các model nguồn đóng hàng đầu quốc tế". Câu này là nguyên văn trong blog chính thức của K2.6.
Việc thứ ba là cụm Agent và song track mã nguồn mở. K2.6 nâng cấp một thứ gọi là Claw Groups — hệ sinh thái Agent dị thể, các Agent với thiết bị, model, toolchain khác nhau chạy trong một không gian cộng tác, K2.6 đóng vai trò điều phối. 300 sub Agent song song, 4000 bước phối hợp, chạy tự động 5 ngày.
Những con số này viết cho khách hàng doanh nghiệp. Không phải cho nhà phát triển. Đối với một nhà phát triển, "300 Agent song song" không có ý nghĩa thực tế — họ sẽ không chạy 300 Agent trong một dự án cục bộ. Cấu hình này chỉ có ý nghĩa với một loại khách hàng: doanh nghiệp lớn cần sử dụng ma trận Agent để tự động hóa toàn bộ quy trình vận hành.
Nhắm vào câu chuyện của Salesforce, không phải câu chuyện của HuggingFace.
Đồng thời K2.6 mã nguồn mở toàn diện. Dương Thực Lân tại diễn đàn Zhongguancun ngày 26/3 nói, mã nguồn mở sẽ là chiến thắng tuyệt đối.
Mã nguồn mở + cụm Agent cấp doanh nghiệp, đây là vị trí giữa DeepSeek và Anthropic, chiếm một nửa cả hai chế độ. Nghe có vẻ là một câu chuyện hay. Nhưng chiếm cả hai đầu, đồng nghĩa với việc cả hai đều phải chứng minh.
Thị trường vốn thực ra không quan tâm những vấn đề này có câu trả lời hay không. Nó chỉ yêu cầu bạn có câu chuyện cho mỗi đường hướng.
Tăng giá, đối chiếu, cụm Agent — ba việc này đặt cùng nhau, có một điểm chung bất thường. Không có việc nào dành cho cộng đồng kỹ thuật.
Logic cơ bản của việc phát hành model trước đây của Kimi là — nếu nhà phát triển thích tôi, khách hàng doanh nghiệp sớm muộn cũng sẽ theo, thị trường vốn càng sớm muộn theo sau. Cách đánh này có một cái tên, gọi là thành ý kỹ thuật.
K2.6 không chờ nữa. Tăng giá là tuyên bố trực tiếp về quyền định giá phía B端 (B-side - Doanh nghiệp), đối chiếu GPT-5.4 là việc giữ chỗ trước cho vị trí định giá, cụm Agent và Claw Groups là gian hàng mẫu cho câu chuyện dịch vụ doanh nghiệp.
Mỗi việc tương ứng với một câu hỏi trên slide roadshow: Năng lực thương mại hóa của bạn là gì? Vị trí đối chiếu của bạn là gì? Rào cản phía B端 của bạn là gì?
Việc nén từ Preview đến GA xuống còn 8 ngày, cũng là logic này. Các phiên bản trước của series K2 đều trải qua thời gian preview 2-3 tháng, để cộng đồng test đủ, phản hồi đủ, lặp lại đủ. K2.6 không dành cho mình không gian này. Không phải công nghệ chín muồi nhanh hơn, mà là cửa sổ cơ hội không chờ đợi ai.
IPO vào nửa cuối năm 2026, theo quy trình của Sở Giao dịch Hồng Kông cần để lại 4 đến 6 tháng để nộp hồ sơ, hỏi đáp, thẩm tra, roadshow, định giá, thời gian im lặng. Khởi động roadshow vào tháng 9, nghĩa là tháng 4 phải chuẩn bị sẵn sản phẩm.
Tháng 4 không phát hành GA, sau đó sẽ không còn cửa sổ nữa.
K3 mới thực sự là điểm nhấn cuối cùng
Nhưng K2.6 cũng không phải là lá bài mạnh nhất mà Moon Dark Side có thể đưa ra.
Trong blog chính thức có một câu rất kiềm chế — K2.6 là "đường băng chuẩn bị cho K3".
Mã hóa dài hạn 12 giờ, cụm 300 Agent, bộ nén ngữ cảnh — đây không phải là hình thái cuối cùng của series K2, mà là cơ sở hạ tầng tầng thực thi mà model nền tảng lớn hơn có thể chịu được. Moon Dark Side sẽ không bỏ công sức để chạy thông suốt những thứ này, trừ khi chắc chắn có một model lớn hơn cần tiêu thụ những khả năng này.
Reddit trước đó đã rò rỉ thông tin về K3, mục tiêu quy mô tham số 3-4 nghìn tỷ. So với quy mô nghìn tỷ của series K2, đây là một bước nhảy vọt nền tảng.
Nếu K3 có thể kịp phát hành trong cửa sổ roadshow — đó mới là bài thi thực sự. Đường băng mà K2.6 lát sẵn, K3 cất cánh.
Vấn đề là có kịp hay không. Huấn luyện một model 3-4 nghìn tỷ tham số mất bao lâu? GPT-5 và Claude Opus 4.6 đều có chu kỳ pre-training khoảng 6-9 tháng, post-training và đánh giá an toàn thêm vài tháng nữa. Năng lực tính toán hiện có của Moon Dark Side — xét theo hợp tác với Alibaba Cloud và dự trữ tiền mặt hiện tại — có thể nén chu kỳ này xuống 5-6 tháng không?
Ván cược này đặt vào K2.6.
Từ Preview đến GA nén thành 8 ngày, cụm Agent một mạch mở rộng từ 100 lên 300, thực thi dài hạn kéo từ vài trăm bước lên 4000 bước — mỗi động thái đều đang nén thời gian, đều đang dành chỗ cho khả năng của K3.
Nếu K3 có thể phát hành trước tháng 8, 9 — đó sẽ là tiết mục压轴 (át chót) trên roadshow.
Nếu không kịp — K3 sẽ trở thành "model chỉ có thể phát hành sau khi lên sàn", K2.6 sẽ phải một mình gánh toàn bộ tường thuật định giá.
Moon Dark Side cá là có thể làm được.
Định giá 18 tỷ USD neo vào điều gì
Quay lại định giá.
Ba tháng trước Moon Dark Side định giá 4,3 tỷ USD, hai tháng trước 5,5 tỷ USD, hiện tại 18 tỷ USD.
Không phải Moon Dark Side trong ba tháng này mạnh lên gấp bốn lần. Mà là Zhipu và MiniMax sau khi lên sàn đã tăng 4 lần, đẩy trần nhà của toàn ngành lên. Vốn hóa thị trường của Zhipu trên HKEX là 3050 tỷ HKD, MiniMax 3092 tỷ HKD — vốn hóa của cả hai đều vượt qua điểm cao nhất lịch sử của SenseTime.
Logic định giá của hai công ty này không phải là "công nghệ thế hệ tiếp theo có thể làm được gì", mà là "trong bể nước thị trường Hồng Kông này, tài sản AI có thể được định giá bao nhiêu".
Định giá 18 tỷ USD của Moon Dark Side neo vào cùng một việc. Nó không còn đang chứng minh mình là công ty AI Trung Quốc mạnh nhất, nó đang chứng minh mình là tài sản AI Trung Quốc có thể được định giá.
Tất cả động thái của K2.6 — tăng giá, đối chiếu, cụm Agent, song track mã nguồn mở — đều đang hồi đáp mệnh đề này.
Nhưng có một việc K2.6 chưa chứng minh. Người dùng C端 của Kimi có sẵn sàng trả tiền cho K2.6 sau khi tăng giá không? Người dùng đăng ký trả phí có chảy sang DeepSeek hoặc MiniMax không? Có bao nhiêu khách hàng doanh nghiệp thực sự đang chạy Claw Groups, bao nhiêu chỉ ký POC?
Những con số này là điều nhà đầu tư chắc chắn sẽ hỏi khi roadshow. K2.6 hiện chỉ có thể bày sản phẩm ra. Nó có thể biến thành con số hay không, phải xem ba tháng tới.
Khi Zhipu lên sàn, họ nộp bản cáo bạch lợi nhuận chưa chuyển dương, MiniMax cũng vậy. Nhà đầu tư chấp nhận câu chuyện này, là vì lúc đó đại tường thuật "tài sản AI Trung Quốc" vừa mở ra. Moon Dark Side đến muộn nửa năm. Cùng một câu hỏi, Zhipu MiniMax có thể nói "chúng tôi đang xác minh", Moon Dark Side phải nói "chúng tôi đang hiện thực hóa".
Áp lực này dồn hết vào ba tháng giữa K2.6 và K3.
Vì vậy, quay lại câu hỏi ban đầu — K2.6 có phải là buổi roadshow cuối cùng của Moon Dark Side trước khi lên sàn không?
Không.
Nếu K3 kịp cửa sổ roadshow, K3 mới thực sự là điểm nhấn cuối cùng. K2.6 chỉ là đường băng đã lát sẵn cho nó. Nếu K3 không kịp cửa sổ roadshow, K2.6 sẽ phải gánh toàn bộ tường thuật lên sàn. Khi đó nó là buổi đầu tiên mà Dương Thực Lân buộc phải mở sớm.
Kết quả nào, bốn tháng trước cũng không phải là điều Dương Thực Lân muốn.
Nhưng tất cả sự việc xảy ra trong bốn tháng này — Zhipu MiniMax lên sàn, trần định giá bị đẩy lên, cửa sổ cơ hội bị nén — đều khiến một người không thích "vội", buộc phải vội lên.
Khi K3 phát hành, sẽ là buổi thứ hai.









