Văn | Công xưởng Mô hình Thế giới
Hiện tại, Internet Trung Quốc chỉ còn một dấu hỏi: DeepSeek V4, rốt cuộc có phát hành hay không?
Hơn một năm qua, cuộc cạnh tranh mô hình toàn cầu đã bước vào giai đoạn cạnh tranh khốc liệt.
OpenAI, Anthropic, Google và các gã khổng lồ khác về cơ bản duy trì tốc độ lặp lại lớn 2-3 tháng hoặc thậm chí 1 tháng một lần, các phiên bản mới nhanh chóng được đưa ra thị trường để xác minh, lặp lại và xác minh lại.
Trong khi đó, DeepSeek trong 15 tháng qua, việc cập nhật phiên bản lớn đã chậm lại, V4 nhiều lần bị trì hoãn, nhịp độ rõ ràng đã tụt lại phía sau, từ người dẫn đầu ngành trở thành kẻ chậm chân.
Sự lo lắng chờ đợi đã biến thành vòng xoáy nghi ngờ.
Đầu tháng 4, một số phương tiện truyền thông đột nhiên đưa tin: V4 có thể được phát hành trong vài tuần tới, nhưng đừng kỳ vọng quá cao vào DeepSeek V4.
Tại sao một bản phát hành được chờ đợi từ lâu lại phải cảnh báo trước?
Năm nay, rốt cuộc DeepSeek đã xảy ra chuyện gì?
Trọng trách nội địa hóa
Sự thật có lẽ ẩn giấu trong một tin tức mà hầu hết mọi người đã bỏ qua.
Tháng 1 năm 2025, một báo cáo của Reuters tiết lộ một chi tiết: Sau khi Deepseek R1 được phát hành, các cơ quan liên quan đã khuyến khích DeepSeek sử dụng bộ xử lý Ascend của Huawei, thay vì tiếp tục sử dụng NVIDIA.
Hai từ "khuyến khích", trong ngữ cảnh lúc đó, có trọng lượng vượt xa ý nghĩa mặt chữ.
DeepSeek không phải là một công ty khởi nghiệp bình thường, nó là mẫu hình thành công đầu tiên của AI Trung Quốc trong việc phá vỡ sự phong tỏa công nghệ của Mỹ.
Ý nghĩa biểu tượng này đã nhanh chóng biến DeepSeek từ một công ty công nghệ thành một quân cờ then chốt trên bàn cờ chiến lược tự chủ, kiểm soát của quốc gia.
Tiếp đó, vào tháng 2, Liang Wenfeng đã tham dự cuộc họp doanh nghiệp dân doanh được hàng vạn người chờ đợi đó.
Ông được sắp xếp ngồi ở hàng đầu, cùng với Ma Huateng, Ren Zhengfei, Lei Jun và các đại gia công nghệ khác, sát cánh trở thành đại diện đội ngũ quốc gia của lực lượng sản xuất mới.
Bánh răng định hướng chính sách từ đó bắt đầu chuyển động.
Theo các phương tiện truyền thông nước ngoài đưa tin, DeepSeek vào đầu năm 2025 đã thử nghiệm sử dụng chip Ascend 910C của Huawei để huấn luyện mô hình thế hệ tiếp theo.
Nhưng quá trình này gặp phải nhiều trở ngại kỹ thuật: Tính ổn định huấn luyện không đủ, sụp đổ thường xuyên trong các kịch bản phân tán quy mô lớn, tốc độ truyền thông giữa các chip không đạt như dự kiến.
Huawei đã cử đội ngũ kỹ sư đến địa điểm văn phòng của DeepSeek để hỗ trợ tại chỗ, cuối cùng vẫn không thể giải quyết vấn đề thích ứng trong giai đoạn huấn luyện.
Kết quả là một sự thỏa hiệp, DeepSeek trong giai đoạn huấn luyện tiếp tục chuyển về sử dụng GPU của NVIDIA, chip Ascend chỉ được sử dụng cho khâu suy luận.
Điều này có nghĩa là, ít nhất trong khâu huấn luyện then chốt này, DeepSeek đã mất gần một năm để thử nghiệm và mắc sai lầm.
Nhưng công việc thích ứng không dừng lại. Năm 2026, phiên bản V4 lại có động thái mới.
Theo tiết lộ, DeepSeek không cấp quyền kiểm tra trước cho NVIDIA, mà thay vào đó ưu tiên giao phiên bản tiền phát hành cho chip Ascend 950PR thế hệ mới của Huawei để thích ứng.
Đồng thời để phân tán rủi ro, cũng đồng bộ thích ứng với chip của Cambricon.
Nhưng thách thức kỹ thuật vẫn còn rõ rệt.
Theo truyền thông đưa tin, mục tiêu lần này là hoàn thành việc di chuyển từ cấp độ mã nguồn, từ hệ sinh thái CUDA của NVIDIA chuyển hoàn toàn sang khung CANN của Huawei, đạt được thay thế nội địa hóa toàn bộ chuỗi huấn luyện và suy luận.
Theo nguồn tin thân cận với dự án, điểm khó cốt lõi của công việc thích ứng nằm ở việc căn chỉnh độ chính xác, đảm bảo đầu ra mô hình nhất quán trên các hệ sinh thái phần cứng khác nhau, điều này liên quan đến rất nhiều điều chỉnh mã nguồn cấp thấp.
Chi phí thời gian từ đó phát sinh.
Khi các nhà sản xuất chính toàn cầu duy trì nhịp độ lặp mô hình 2-3 tháng, DeepSeek lại ngày càng chậm, trong thời gian đó có thể một tỷ lệ tài nguyên kỹ thuật khá lớn đã được đầu tư vào việc thích ứng chip nội địa.
Rốt cuộc, chip nội địa và NVIDIA thực sự có khoảng cách về hiệu năng thế hệ, độ trưởng thành hệ sinh thái, tính hoàn thiện của chuỗi công cụ, quá trình thích ứng mô hình tốn rất nhiều thời gian.
Điều này tạo nên sự phân cách rõ rệt so với con đường theo đuổi nâng cao hiệu suất mô hình thuần túy ban đầu của DeepSeek.
Việc liên kết ở cấp độ chuỗi công nghiệp cũng đang diễn ra đồng thời.
Đầu năm 2026, thị trường truyền tin rằng Alibaba, ByteDance, Tencent đã đặt hàng hàng trăm nghìn chip Ascend 950PR từ Huawei.
Một suy đoán hợp lý là: Các nhà cung cấp dịch vụ đám mây hàng đầu đang chờ kết quả xác minh của DeepSeek V4 để đánh giá khả năng sử dụng thực tế của chip nội địa trong huấn luyện AI quy mô lớn.
Nếu V4 chạy thông suốt thành công, Huawei 950PR sẽ chuyển từ mẫu kỹ thuật thành sản phẩm thương mại khả dụng. Nếu không đạt được kỳ vọng, tương đương với việc thăm dò rõ ranh giới năng lực hiện tại của chip nội địa cho ngành.
Xét đến yêu cầu cực kỳ cao của Liang Wenfeng đối với việc phát hành mô hình, tiêu chuẩn không đạt kỳ vọng tuyệt đối không phát hành, việc V4 cuối cùng sắp ra mắt, rất có thể đã vượt qua bài kiểm tra hiệu quả ở phía suy luận.
Nếu thực sự xác minh thành công, đây sẽ là bước then chốt cho DeepSeek và thậm chí toàn bộ AI Trung Quốc chuyển hướng sang tự chủ, kiểm soát.
Cái giá của sự chuyển đổi danh tính
Việc DeepSeek chủ động đảm nhận trọng trách xác minh hệ sinh thái tính toán nội địa, sự lựa chọn này khiến nó giống một công ty mang sứ mệnh quốc gia hơn là một người chơi thị trường thuần túy theo đuổi lợi nhuận.
Nhưng cái giá của sự chuyển đổi rõ ràng là: nhịp độ chậm lại trong ngắn hạn, áp lực nhân tài gia tăng, sức cạnh tranh tạm thời chững lại.
Theo dữ liệu từ nhiều đánh giá độc lập và cộng đồng trong tháng 3-4/2026, khả năng tạo mã của DeepSeek trong các bài kiểm tra chuẩn của bên thứ ba đã bị vượt qua đáng kể bởi loạt Claude 4 (Opus 4.6 / Sonnet 4.6).
Khả năng xử lý đa phương tiện của DeepSeek cũng chủ yếu giới hạn ở văn bản + hình ảnh, tụt lại xa so với biểu hiện của Claude và GPT trong phân tích hình ảnh, sử dụng máy tính và hiểu video.
Bước vào năm 2026, DeepSeek chuyển trọng tâm sản phẩm sang kỹ thuật hệ thống Agent đầy thách thức hơn.
Theo phản hồi cộng đồng hiện tại, DeepSeek trong lĩnh vực Agent mã và Agent tìm kiếm tiếng Trung đã tiếp cận nhóm đầu, nhưng trong sự phối hợp đa công cụ, thực thi nhiệm vụ đường dài và độ bền vững môi trường thực tế, vẫn có khoảng cách kỹ thuật hệ thống rõ rệt so với các mô hình đỉnh cao quốc tế như OpenAI, Google.
Khoảng cách này, không nhất thiết là sự suy thoái năng lực kỹ thuật, mà giống như kết quả của sự cân nhắc giữa cạnh tranh thị trường và chiến lược quốc gia.
Cái giá ở cấp độ tổ chức cũng rõ rệt.
Từ nửa cuối năm 2025, các thành viên cốt lõi của đội ngũ DeepSeek bắt đầu có sự lung lay.
Theo xác nhận của LatePost, Wang Bingxuan (tác giả cốt lõi mô hình lớn第一代), Guo Daya (tác giả cốt lõi R1), Wei Haoran (người phụ trách OCR), Ruan Chong (người phụ trách đa phương tiện) lần lượt rời đi.
Đằng sau những cái tên này là sự tích lũy kỹ thuật từ V1 đến R1 của DeepSeek.
Động cơ rời đi phức tạp, nhưng sự bất lợi tương đối của hệ thống lương thưởng là yếu tố hiện hữu.
Headhunter tiết lộ, điều kiện đối thủ cạnh tranh đưa ra là "gấp hai đến ba lần" DeepSeek, một số đại công ty trực tiếp đưa ra gói tổng lên đến tám con số.
DeepSeek với tư cách là công ty khởi nghiệp chưa huy động vốn bên ngoài (công ty mẹ là幻方量化), mức lương tuyệt đối không thấp, nhưng không thể so sánh với các gã khổng lồ thị trường hóa như ByteDance, Alibaba, Tencent về khuyến khích cổ phần và định giá cao hơn.
Liang Wenfeng đã bắt đầu thúc đẩy công việc định giá công ty, xác định giá quyền chọn cổ phiếu rõ ràng, mang lại cảm giác chắc chắn hơn cho đội ngũ.
Nhưng trong bối cảnh các công ty cùng ngành như智谱, MiniMax lên sàn, giá cổ phiếu tăng cao, áp lực giữ chân nhân tài đỉnh cao vẫn không nhỏ.
DeepSeek hiện nay đang rơi vào một sự mơ hồ về danh tính.
Nó vẫn cần thương mại hóa, vẫn cần giữ chân nhân tài, nhưng đồng thời nó lại được gắn kỳ vọng thích ứng nội địa hóa.
Xung đột mang lại từ danh tính kép này, có lẽ chính là logic sâu xa khiến DeepSeek ngày càng chậm trong năm nay.
Vì vậy, kỳ vọng về hiệu suất của V4 trên thị trường cũng đang được điều chỉnh giảm.
Nó chưa chắc sẽ trở thành một mô hình bom tấn một lần nữa gây bão, nhưng có thể là một cột mốc quan trọng về mặt công nghiệp, chứng minh rằng mô hình tiên phong của Trung Quốc có thể đạt đến mức khả dụng trên hệ sinh thái phần cứng nội địa.
Bài làm của V4, đối với hướng đi dài hạn của ngành công nghiệp AI Trung Quốc có thể còn quan trọng hơn.








