Văn | Tượng Tiên Chí
Lưu Từ Hân (Lưu Từ Hân) trong "Tam Thể" đã viết về một hình ảnh sau này được trích dẫn vô số lần - khu rừng tối. Mỗi nền văn minh đều là một thợ săn mang súng, ai lộ diện trước, người đó chết trước. Trong rừng không phải không có người, mà là mỗi người đều biết thắp đèn sẽ thu hút đạn, vì vậy mọi người đều tắt đèn.
Mùa xuân năm 2026, các phòng thí nghiệm AI hàng đầu đã bước vào khu rừng tối như vậy.
Ngày 16 tháng 4, Anthropic đã ra mắt Claude Opus 4.7. Cùng ngày, họ đã có một động thái bất thường - công khai thừa nhận hiệu suất của Opus 4.7 không bằng một mô hình chưa phát hành là Mythos, với lý do là lo ngại về an toàn (safety concerns).
Ngày 23 tháng 4, OpenAI đã đăng GPT-5.5 lên trang web chính thức. Cùng ngày, Anthropic lại đăng một báo cáo sự cố có tên "An update on recent Claude Code quality reports" trên blog chính thức, thừa nhận rằng trong hơn một tháng qua, Claude Code thực sự đã trở nên kém thông minh hơn - một bên ra lá bài mới, một bên thừa nhận lỗi. Nhưng "nhà vô địch mới" này gần như đang khoe khoang: chúng tôi thừa nhận Claude tạm thời kém thông minh - nhưng bạn đừng quên, chúng tôi vẫn còn giấu một Mythos chưa ra.
Ngày 24 tháng 4, "sức mạnh phương Đông bí ẩn" DeepSeek V4 Preview ra mắt, lần đầu tiên đội ngũ Lương Văn Phong (Liang Wenfeng) công bố chính thức việc gắn kết sâu mô hình với Huawei Ascend 950PR; nhưng tất cả mọi người đều hiểu - phiên bản thực sự "đầy đủ sức mạnh" V4 Pro Max, phải đợi đến nửa cuối năm khi siêu nút Ascend 950 sản xuất hàng loạt mới có thể ra mắt.
Ba công ty, ba động thái. Bề ngoài là nhịp độ sản phẩm riêng của mỗi bên, nhưng khi ghép lại với nhau, một sự việc nổi lên:
Mỗi bên trong tay đều nắm ít nhất một "khẩu súng" - một mô hình mạnh hơn phiên bản công khai, một kiến trúc thế hệ tiếp theo chưa đến lượt công chúng, một siêu nút chip chưa được triển khai rộng rãi. Nhưng không một bên nào dám giương khẩu súng đó lên trước.
Bởi vì trong ngành này, cái giá của việc "ra mắt trước" không chỉ đơn giản là để lộ bí mật. Ra mắt trước có nghĩa là tự tay giao điểm mạnh nhất của mình cho đối thủ làm hệ quy chiếu; có nghĩa là chịu trận toàn bộ hỏa lực của sự giám sát an toàn, siết chặt quản lý, áp lực dư luận; có nghĩa là biến mình thành mục tiêu di động mà tất cả đối thủ cạnh tranh trong lượt tiếp theo đều nhắm đến. Trong rừng không có chủ nghĩa anh hùng - mỗi người bắn phát súng đầu tiên đều biến mình thành người bị ngắm bắn tiếp theo.
Vì vậy, lựa chọn hợp lý nhất của những thợ săn là tắt đèn, nín thở, giấu vũ khí sau lưng.
Đây là giải pháp tối ưu của trò chơi.
Sự tự tin thái quá của Anthropic
Về phía Claude, trong một tháng qua, gần như đã diễn ra một lần phát hành phiên bản tồi tệ nhất.
Sau khi cập nhật Opus 4.7 sớm, Anthropic vẫn thống trị các bảng xếp hạng, và trong tay vẫn còn giấu Mythos chỉ cung cấp cho khách hàng doanh nghiệp - dường như một tư thế không vội vàng.
Nhưng chu kỳ Opus 4.7 này, gần như là trải nghiệm người dùng Claude tệ nhất, "chỉ trích dồn dập".
Đầu tháng 3, Anthropic đã thay đổi độ sâu suy luận mặc định của Claude Code, từ high xuống medium. Xuất phát điểm của quyết định này có thể hiểu được: ở chế độ high, UI thường trông như bị treo, phản hồi chậm khiến người dùng trả phí phát điên. Nhưng vấn đề là, lúc đó họ không công bố.
Cuối tháng 3, lại triển khai một "tối ưu hóa hiệu suất" - nếu phiên Claude Code nhàn rỗi quá một giờ, hệ thống sẽ xóa các reasoning block cũ. Theo thiết kế, đây là để tiết kiệm tính toán. Hiệu quả thực tế khi chạy, là sau mỗi lượt hội thoại Claude đều như mất trí nhớ, quên sạch ngữ cảnh. Cộng đồng nhà phát triển những tuần đó tràn ngập các lời phàn nàn: "Claude bắt đầu không nhớ tôi đã bảo nó làm gì ở lượt trước."
Cho đến gần đây, sự việc thứ ba xảy ra - thêm một chỉ dẫn nén verbosity vào system prompt. Theo lời thừa nhận sau này của Anthropic, chỉ dẫn này khiến chất lượng mã hóa của Claude Code giảm thẳng 3%.
Ba việc chồng chất lên nhau, mới có câu nói của một senior director của AMD trên GitHub - "Claude has regressed to the point it cannot be trusted to perform complex engineering" (Claude đã thoái hóa đến mức không thể được tin tưởng để thực hiện các nhiệm vụ kỹ thuật phức tạp). Bài báo "Anthropic's AI downgrade stings power users" của Axios ngày 16 tháng 4 đã đưa nó vào tầm nhìn chính.
Rồi Anthropic mới thừa nhận, đúng là có chút vấn đề.
Ngày 7 tháng 4, họ lặng lẽ hoàn nguyên điều chỉnh reasoning effort; ngày 10 tháng 4 sửa lỗi cache; ngày 20 tháng 4 gỡ bỏ system prompt nén verbosity. Nhưng báo cáo phân tích sự cố thực sự, phải đợi đến ngày 23 tháng 4 mới đăng - và điều này trùng khớp với ngày công bố chính thức GPT-5.5.
Cảm giác khinh miệt với một chút "ồ, chiến lược kỹ thuật của tôi có bug, sửa là được" này, chỉ cách sự kiện ra mắt quan trọng của OpenAI trước sau vài giờ. Khó mà nói đó là trùng hợp.
Điều đáng suy ngẫm hơn là, khi phát hành Opus 4.7, Anthropic đã kèm theo một động thái bất thường: công khai thừa nhận hiệu suất của Opus 4.7 không bằng một mô hình chưa phát hành - Mythos. Đây rõ ràng là một "sự rút lui chiến lược" - Anthropic giữ lại khả năng mạnh nhất cho phía doanh nghiệp, không vội đẩy ra đại chúng, vì team chưa sẵn sàng phát hành Mythos.
Có thể tin vào lời giải thích này. Nhưng từ góc độ tường thuật thương mại, nửa kia cũng đúng: Anthropic đợi sáu tuần mới công khai thừa nhận Claude Code đang thoái hóa, đợi đến ngày OpenAI ra lá bài mới mới đưa vấn đề ra. Nếu áp lực cạnh tranh không đủ lớn, nếu Opus 4.7 chưa chứng minh được "chúng tôi vẫn còn bài sau", có lẽ tuyên bố này sẽ không bao giờ đến.
Về phía Claude, bóp kem không có nghĩa là cố ý thiến bớt khả năng, mà là: nhịp độ giải phóng khả năng, nhịp độ tiết lộ vấn đề, đều đi theo nhịp độ của đối thủ cạnh tranh.
Đưa ra khả năng tiên phong nhất của mình, chắc chắn sẽ bị coi như bia ngắm. Hoặc nói cách khác, trong mắt Anthropic, áp lực mà 4.6 gây ra cho đối thủ cạnh tranh vẫn chưa tan - vậy thì, không cần thiết phải đánh lá bài mạnh hơn ngay lúc này.
Chiêu cũ của OpenAI
Nếu Anthropic là "giấu một Mythos không phát hành", thì việc bóp kem về phía OpenAI còn tinh vi hơn - nó để quyền giải phóng khả năng lại trong đường cong tải máy chủ của mình và một cơ chế phân loại gọi là auto-router.
Cùng ngày ra mắt GPT-5.5 23 tháng 4, Simon Willison (đồng sáng lập framework Django, nhà đánh giá độc lập nổi tiếng trong giới AI) đã viết một câu thận trọng trên blog của mình: "It's not a dramatic departure from what we've had before." (Đây không phải là một bước nhảy vọt mang tính kịch tính so với những gì chúng ta đã có).
Anh ta tiện tay bổ sung một thông tin rất quan trọng: GPT-5.5 là mô hình cơ sở được đào tạo lại hoàn toàn lần đầu tiên của OpenAI kể từ GPT-4.5; nghĩa là, bốn bản cập nhật nhỏ 5.1, 5.2, 5.3, 5.4 phát hành trong nửa năm qua, tất cả chỉ là cập nhật gia tăng. Nói cách khác, bốn lần cập nhật phiên bản nhỏ vừa qua, OpenAI đều phát hành một cách dè sức - bởi vì họ không rõ đối thủ cạnh tranh sẽ tung ra thứ gì.
"Cập nhật dè sức" có một cách nói dễ hiểu hơn: bóp kem.
Nhưng cảnh đáng nhớ hơn xảy ra vài giờ sau khi GPT-5.5 lên sóng. Người dùng Codex đã gửi Issue #19241 trên GitHub, phàn nàn rằng Fast mode lúc đầu thực sự rất nhanh, nhưng khi nhiều người dùng được cho vào thì thấy rõ là chậm đi, mà tính phí vẫn theo mức Fast. Lời lẽ rất quen thuộc: "Vui lòng để OpenAI điều tra xem GPT-5.5 Fast mode có bị hạ cấp dưới tải cao hay không."
Đây gần như là bản sao chính xác của cảnh tượng ngày ra mắt GPT-5 vào 7 tháng 8 năm 2025 - lần đó, Reddit r/ChatGPT đã đẩy "GPT-5 is horrible" lên 4600+ upvotes, Sam Altman ngày hôm sau trong AMA đã thừa nhận "the autoswitcher broke... GPT-5 seemed way dumber" - thừa nhận router ở hậu trường đã thay người dùng hạ cấp.
Cùng một kịch bản, tám tháng sau lại diễn ra lần nữa.
Châm biếm hơn là, một ngày trước khi GPT-5.5 chính thức phát hành, Codex của OpenAI đã đẩy nhầm môi trường staging nội bộ lên môi trường production, bị vài người dùng Pro chụp lại, sửa trong vài phút, nhưng nội dung bị rò rỉ đã lan truyền khắp nơi. Lúc đó xuất hiện trong bộ chọn, ngoài bản thân GPT-5.5, còn có một series tên Glacier (tooltip ghi "Intelligence that moves continents"), một mô hình khoa học sự sống tên Heisenberg, một mô hình mục đích không rõ tên Arcanine, và nhiều phiên bản khác với mã hiệu oai-2.1.
Tức là, cùng thời điểm OpenAI đưa GPT-5.5 ra như "thế hệ tiếp theo", nội bộ ít nhất đang chạy 5 đến 6 dòng sản phẩm song song, mỗi dòng đều chưa đến lượt công chúng.
Bản thân OpenAI thì thừa nhận. Trong lộ trình năm 2026 chính thức, họ đã dùng một từ lâu được thảo luận trong giới học thuật - capability overhang - thừa nhận giữa năng lực thực tế của mô hình lớn hiện tại và hiệu quả người dùng thực sự sử dụng được, tồn tại một khoảng cách lớn.
Quen chứ? Gần như cùng một câu với cách nói của Anthropic về Mythos. Cho dù vụ rò rỉ Codex ngày 22 tháng 4 đó thực sự là sự cố, thì việc OpenAI chủ động đưa từ capability overhang vào lộ trình, tín hiệu truyền đi đã viết rất rõ - chúng tôi còn rất nhiều trong tay, các bạn liệu mà tính.
Bạn có trong tay nhiều hơn nhiều thứ bán cho người dùng, bạn mới có cái để bóp. 24 giờ của GPT-5.5, một lần nữa biến tiền đề này thành buổi phát trực tiếp.
Sự kiên nhẫn chờ đợi của Deepseek
Về phía DeepSeek, cách "bóp" đã thay đổi hoàn toàn - nó không phải là giấu khả năng, mà là chờ một thời điểm giao hàng phù hợp hơn.
1.6T MoE, ngữ cảnh 1M, hai thông số kỹ thuật Pro/Flash, định giá 3.48 trên 1M tokens - chỉ bằng một phần mấy chục của GPT-5.5, là chênh lệch cấp độ so với Opus 4.7. Các nhà đánh giá độc lập nước ngoài đưa ra kết luận là hai câu: hiệu suất gần nhưng hơi thấp hơn GPT-5.4 / Gemini 3.1-Pro, giá cả "đã đánh thủng kinh tế học của các phòng thí nghiệm tiên phong".
Nhưng trong hệ tọa độ của chính DeepSeek, V4 Preview đã đắt hơn không chỉ một chút so với mức giá "rẻ đến kỳ lạ" của V3. Tất cả mọi người đều biết - đây không phải là bản đầy đủ sức mạnh.
Câu chuyện hoàn chỉnh của DeepSeek V4, không lấy việc phát hành làm điểm kết thúc, càng không lấy phát hành làm điểm khởi đầu.
Phải kể từ buổi ra mắt không thành của R2 vào năm 2025. R2 dự định phát hành vào tháng 5 năm 2025, nhưng cuối cùng bị hoãn đến thu đông. Toàn bộ cơ sở hạ tầng Deepseek Trung Quốc chuyển sang hệ sinh thái CANN của Huawei. Đối với bất kỳ phòng thí nghiệm nào, đây không thể là một công trình hoàn thành trong một quý - trình biên dịch, toán tử, thư viện truyền thông, framework suy luận, định tuyến MoE, tất cả đều phải viết lại.
Và lần V4 này, là lần đầu tiên DeepSeek chính thức ghi Ascend vào danh sách phần cứng đào tạo. V4 là phiên bản đầu tiên của đào tạo hỗn hợp - Ascend lần đầu tiên tham gia.
Nhưng chip thế hệ tiếp下一代 được tối ưu hóa cho đào tạo quy mô lớn Ascend 950DT, theo lộ trình của Huawei phải đến Q4 năm 2026 mới sản xuất hàng loạt. Nghĩa là, V4 có thể chạy đào tạo được, là dùng thế hệ trước 950PR ghép lại; để cho phiên bản đầy đủ sức mạnh như V4 Pro Max loại 1.6T MoE vừa có thể đào tạo triệt để vừa có thể suy luận quy mô lớn, còn phải đợi thế hệ tiếp theo到位.
Điểm khó kỹ thuật thực sự không phải là "V4 có đào tạo được hay không" - đã đào tạo được rồi - mà là "V4 chạy đầy, chạy ổn, chạy rẻ trên Ascend như thế nào".
Ascend 950PR sản xuất hàng loạt vào Q1 năm 2026, FP4 computing power 1.56 PFLOPS, on-chip memory 112GB, thông số kỹ thuật trên giấy tờ tương đương và vượt NVIDIA H20. Nhưng từ một con chip chạy được, đến cả một siêu nút ổn định phục vụ hàng triệu token/giây yêu cầu suy luận, là hai chuyện khác nhau. Phiên bản đầy đủ sức mạnh của V4 Pro Max, khóa chính là "siêu nút" này - phiên bản cluster quy mô lớn của series Ascend 950, sẽ到位 vào nửa cuối năm 2026.
Điều này tạo nên một chiến lược hoàn toàn khác với hai công ty trước. Logic bóp kem của Anthropic và OpenAI là, tôi có cái mạnh hơn trong tay, chưa đưa cho bạn; logic bóp kem của DeepSeek là, phiên bản đầy đủ sức mạnh của tôi, phải chờ một thời điểm để giá cả xuống thêm một bậc nữa.
Sự khác biệt này rất quan trọng.
Vũ khí bí mật thực sự của DeepSeek chưa bao giờ là "hiệu suất tiên phong nhất", mà là "với hiệu suất đủ dùng, cắt giảm giá token đến mức người khác không dám cắt". V4 Preview đã được điều chỉnh trên card NVIDIA và Ascend 950PR, nhưng để đạt được suy luận đầy đủ sức mạnh ở quy mô sản xuất hàng loạt, phải đợi siêu nút到位. Một khi chờ đến thời điểm đó, hai việc sẽ đồng thời xảy ra: một là khả năng của V4 Pro Max có thể được giải phóng tối đa; hai là chi phí suy luận, định giá API sẽ giảm thêm một bậc nữa - đối với một công ty dựa vào giá cả để đánh thị trường, cái sau chết người hơn cái trước.
Khoảnh khắc "DeepSeek" mà mọi người thực sự mong đợi, đã từng xảy ra vào đầu năm 2025, đã không lặp lại trong lần phát hành này. Và việc phát hành V4 Preview thực chất là một đoạn trailer, màn chính thực sự, là khoảnh khắc "DeepSeek + Huawei Ascend" vào nửa cuối năm.
Từ góc độ này, đội ngũ Lương Văn Phong hiện đang làm không phải là sự "giấu" bắt buộc, mà là một sự "lựa chọn" kiềm chế về mặt thương mại - chọn giao buổi ra mắt đầu tiên của phiên bản mạnh nhất, vào một cảnh mà nó có tiếng nói nhất: ngày đầu tiên sau khi triển khai quy mô lớn siêu nút国产. Trước đó, dùng V4 Preview để củng cố thêm một vòng tường thuật về tỷ lệ giá trị trên chi phí.
DeepSeek mang theo chưa bao giờ là "tường thuật điểm mạnh" để đưa mô hình lớn国产 lên vị trí số một trên bảng xếp hạng nào đó, mà là "tường thuật hệ thống" để chạy thông đồng thời bốn tuyến chip, đào tạo, suy luận, định giá - cái sau quan trọng hơn nhiều so với cái trước.
Ngay mới đây, Hoàng Nhân Tân (Jensen Huang) trong podcast của Dwarkesh Patel đã nói, nếu DeepSeek ra mắt đầu tiên trên chip Huawei, "đó sẽ là một kết quả khủng khiếp cho đất nước chúng ta" ("a horrible outcome for our nation").
Hiện tại NVIDIA vẫn nắm giữ computing power đỉnh cao. Nhưng theo chính chiếc "bánh năm tầng AI" do Hoàng Nhân Tân đưa ra - năng lượng, chip, cơ sở hạ tầng, mô hình, ứng dụng - ngành công nghiệp mô hình lớn国产 ở mỗi tầng đều đã có phương án国产 có thể chạy thông, khoảng cách đang thu hẹp với tốc độ có thể nhìn thấy bằng mắt. Lắp đầy mảnh ghép cuối cùng là chip, câu chuyện mô hình lớn mã nguồn mở của DeepSeek, mới là một câu chuyện lớn hơn mô hình lớn Mỹ: Đây là một bước quan trọng để toàn cầu đạt được quyền bình đẳng thông minh mà không cần tiêu hao quá nhiều chi phí.
Để cả thế giới có thể vượt qua computing power tiên tiến bị chế độ bá quyền nắm giữ, bước vào xã hội thông minh hiệu quả.
Lời kết
Sự "giấu" của Anthropic - là chủ động. Họ có Mythos, không phát hành, lý do là safety.
Sự "giấu" của OpenAI - là cấu trúc. Họ có mức Pro, không thường xuyên cung cấp cho bạn, lý do là infrastructure và phân tầng giá.
Sự "giấu" của DeepSeek - là cần thiết. Nó liên quan đến một bản mẫu tường thuật về sự nhảy vọt thông minh xã hội toàn diện.
Nhưng từ một góc độ khác, điều này lại giống hệt khu rừng tối được mô tả bởi Lưu Từ Hân: trong khu rừng thông minh tối đen này, mỗi thợ săn đỉnh cao sẽ không tạo ra phát súng của mình trước.
Lộ diện có nghĩa là không giữ lại gì, có nghĩa là không có bài tẩy, sẽ trở thành bia sống cho một thợ săn khác.
Không ai biết ai sẽ tạo ra phát súng chí mạng trước. Nhưng có thể chắc chắn rằng, mỗi mô hình bạn dùng ngày hôm nay, đều không phải là hình dạng thực sự của nó.








