DeepSeek V4 chính thức ra mắt, phá vỡ thế độc quyền của mã nguồn đóng mạnh nhất, công khai hợp tác với chip Huawei

marsbitXuất bản vào 2026-04-24Cập nhật gần nhất vào 2026-04-24

Tóm tắt

DeepSeek vừa chính thức ra mắt phiên bản DeepSeek-V4 với hai phiên bản: Pro và Flash. V4-Pro có 1,6 nghìn tỷ tham số và 49 tỷ tham số kích hoạt, được đánh giá ngang hàng với các mô hình nguồn đóng hàng đầu về khả năng Agent, kiến thức thế giới và suy luận. Trong khi đó, V4-Flash là phiên bản nhẹ hơn, phù hợp cho các tác vụ đơn giản và có chi phí API thấp hơn. Cả hai phiên bản đều hỗ trợ ngữ cảnh dài 1 triệu token, một tính năng trước đây chỉ có trên Gemini. DeepSeek cũng công bố sẽ hỗ trợ chip Huawei từ nửa cuối năm nay. Mô hình đã được open-source và có sẵn trên Hugging Face và ModelScope. API cập nhật đồng thời, hỗ trợ cả giao thức OpenAI và Anthropic.

Vừa qua, DeepSeek-V4 đã chính thức xuất hiện!

Phiên bản xem trước chính thức lên sóng và đồng thời mã nguồn mở.

Tổng cộng có hai phiên bản:

DeepSeek-V4-Pro: Đối đầu với các mô hình mã nguồn đóng hàng đầu, 1.6T, 49B kích hoạt, độ dài ngữ cảnh 1M;

DeepSeek-V4-Flash: Phiên bản kinh tế nhỏ hơn và nhanh hơn, 284B, 13B kích hoạt, độ dài ngữ cảnh 1M.

Lời nói chính thức từ nhà phát triển là: Về khả năng Agent, kiến thức thế giới và hiệu suất suy luận đều đạt được vị trí dẫn đầu trong nước và lĩnh vực mã nguồn mở.

Và:

Hiện tại DeepSeek-V4 đã trở thành mô hình Agentic Coding được nhân viên nội bộ sử dụng, theo đánh giá phản hồi trải nghiệm sử dụng tốt hơn Sonnet 4.5, chất lượng giao hàng gần với Opus 4.6 chế độ không suy nghĩ. Nhưng vẫn còn khoảng cách nhất định so với mô hình suy nghĩ Opus 4.6.

Hiện tại cả trang web chính thức và APP đều đã cập nhật, dịch vụ API cũng đã đồng bộ hóa.

Về khả năng tính toán trong nước mà mọi người quan tâm, điểm nhấn là nửa cuối năm sẽ hỗ trợ khả năng tính toán của Huawei.

Lựa chọn cao cấp và tiết kiệm, hai phiên bản cùng ra mắt

Lần này V4 một lúc ra mắt hai phiên bản.

V4-Pro, hiệu suất ngang bằng với các mô hình mã nguồn đóng hàng đầu.

Nhà phát triển đưa ra ba đánh giá:

Khả năng Agent được cải thiện mạnh mẽ: Trong đánh giá Agentic Coding, V4-Pro đã đạt đến trình độ tốt nhất của các mô hình mã nguồn mở hiện tại, và cũng thể hiện xuất sắc trong các đánh giá liên quan đến Agent khác. Trong đánh giá nội bộ, ở chế độ Agent Coding, trải nghiệm V4 tốt hơn Sonnet 4.5, chất lượng giao hàng gần với Opus 4.6 chế độ không suy nghĩ, nhưng vẫn còn khoảng cách so với chế độ suy nghĩ Opus 4.6.

Kiến thức thế giới phong phú: Trong đánh giá kiến thức thế giới, DeepSeek-V4-Pro vượt xa các mô hình mã nguồn mở khác, chỉ kém hơn một chút so với mô hình mã nguồn đóng đỉnh cao Gemini-Pro-3.1.

Hiệu suất suy luận đỉnh cao thế giới: Trong các đánh giá về toán học, STEM, mã thi đấu, DeepSeek-V4-Pro vượt qua tất cả các mô hình mã nguồn mở đã công bố đánh giá hiện tại, đạt được thành tích ngang bằng với các mô hình mã nguồn đóng hàng đầu thế giới.

V4-Flash, phiên bản kinh tế nhỏ hơn và nhanh hơn. Khả năng suy luận gần với Pro, kiến thức thế giới hơi kém hơn, nhưng tham số và kích hoạt nhỏ hơn, API rẻ hơn.

Về nhiệm vụ Agent, DeepSeek-V4-Flash ngang ngửa với DeepSeek-V4-Pro trong nhiệm vụ đơn giản, nhưng vẫn có khoảng cách trong nhiệm vụ khó cao.

Trong bài kiểm tra rửa xe, V4 cũng vượt qua nhanh chóng.

Trong khi đó, trong tình huống sinh học kinh điển "người cha tuyệt vọng", DeepSeek-V4 không nhận ra ngay điểm mấu chốt về mù màu đỏ-xanh lá (theo quy luật di truyền, nếu một phụ nữ bị mù màu đỏ-xanh lá, cha ruột của cô ấy chắc chắn cũng bị).

Triệu ngữ cảnh trở thành tiêu chuẩn

Đáng chú ý là, từ hôm nay, 1M ngữ cảnh là tiêu chuẩn cho tất cả dịch vụ chính thức của DeepSeek.

Một năm trước, 1M ngữ cảnh vẫn là lá bài độc quyền của Gemini; tất cả các mô hình mã nguồn đóng khác chỉ 128K hoặc 200K; phía mã nguồn mở hầu như không ai chơi được ở cấp độ này.

DeepSeek trực tiếp biến triệu ngữ cảnh từ một "tính năng cao cấp" thành "cơ sở hạ tầng".

Và mã nguồn mở. Họ làm được như thế nào, trong bản phát hành đã trực tiếp đưa ra câu trả lời——

V4 tạo ra một cơ chế chú ý hoàn toàn mới, nén ở chiều token, kết hợp với sự chú ý thưa DSA. So với phương pháp truyền thống, nhu cầu tính toán và bộ nhớ giảm mạnh.

DSA không phải từ mới. Nửa năm trước, bản cập nhật V3.2-Exp lần đầu tiên giới thiệu, lúc đó sự chú ý bên ngoài không cao, vì điểm chạy và V3.1-Terminus gần như giống nhau, trông giống như một phiên bản trung gian không có gì mới.

Giờ nhìn lại, đó là nền móng của V4.

Tối ưu hóa chuyên sâu khả năng Agent

Về phía Agent, V4 đã điều chỉnh và tối ưu hóa cho các sản phẩm Agent chủ lưu như Claude Code, OpenClaw, OpenCode, CodeBuddy, nhiệm vụ mã và nhiệm vụ tạo tài liệu đều được cải thiện.

Bản phát hành còn kèm theo một ví dụ trang PPT được tạo bởi V4-Pro trong một khung Agent.

Giá API

Về phía API, V4-Pro và V4-Flash đồng bộ lên sóng, hỗ trợ hai giao diện OpenAI ChatCompletions và Anthropic.

base_url không đổi, tham số model đổi thành deepseek-v4-pro hoặc deepseek-v4-flash để gọi.

Cả hai phiên bản đều có ngữ cảnh tối đa 1M, đều hỗ trợ đồng thời chế độ không suy nghĩ và chế độ suy nghĩ. Ở chế độ suy nghĩ, có thể điều chỉnh cường độ qua tham số reasoning_effort, hai mức high và max. Nhà phát triển khuyến nghị các tình huống Agent phức tạp nên dùng max.

Có một điểm nhấn ở đây——nửa cuối năm hỗ trợ khả năng tính toán của Huawei.

Ngoài ra, tên mô hình cũ sẽ ngừng hoạt động.

deepseek-chat và deepseek-reasoner sẽ ngừng hoạt động sau ba tháng (24/7/2026), trong giai đoạn hiện tại hai tên này lần lượt trỏ đến chế độ không suy nghĩ và suy nghĩ của V4-Flash.

Ảnh hưởng không lớn với nhà phát triển cá nhân, chỉ cần đổi một tham số model. Các công ty đã kết nối môi trường sản xuất, trong ba tháng này cần di chuyển.

One more thing

Cuối bản phát hành, DeepSeek tự trích dẫn một câu.

「不诱于誉,不恐于诽,率道而行,端然正己。」

Đây là một câu trong "Phi Thập Nhị Tử" của Tuân Tử. Nghĩa đen là, không bị dụ dỗ bởi danh tiếng, không sợ hãi bởi phỉ báng, đi theo con đường mình nhận định, ngay thẳng chính mình.

Đặt trong bối cảnh hôm nay, khá thú vị.

Nửa năm qua, những tin đồn về việc V4 khi nào ra mắt, có phải hoãn, có phải đã bị nhà khác vượt qua, có phải đã bị Claude chưng cất dữ liệu giải quyết... chạy đi chạy lại vài vòng trong cộng đồng AI tiếng Trung và tiếng Anh. Đầu năm thậm chí còn có người khẳng định V4 sẽ ra trước Tết, nhưng cuối cùng đợi đến cuối tháng tư.

Họ không phản hồi lần nào.

Vào một chiều thứ Sáu, đưa V4 ra, đồng bộ mã nguồn mở, đồng bộ lên trang chính thức và App, đồng bộ cập nhật API, tiện thể viết vào bản phát hành sự thật nhân viên nội bộ đã ngừng dùng Claude.

Không có lộ trình, không livestream, không phỏng vấn.

Bốn chữ "率道而行" (suất đạo nhi hành), nghe như một khẩu hiệu. Nhưng nếu bạn đặt cùng nhau phiên bản Exp "không có điểm nhấn" của V3.2 nửa năm trước, bộ chú ý thưa DSA đã chuẩn bị nền móng cho V4 nửa năm, con đường biến triệu ngữ cảnh từ lá bài thành tiêu chuẩn.

DeepSeek đã làm được.

Liên kết mã nguồn mở mô hình DeepSeek-V4:

[1]https://huggingface.co/collections/deepseek-ai/deepseek-v4

[2]https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4

Báo cáo kỹ thuật DeepSeek-V4: https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

Bài viết từ tài khoản công chúng WeChat "量子位", tác giả: 量子位

Câu hỏi Liên quan

QDeepSeek V4 có những phiên bản nào và thông số kỹ thuật của chúng là gì?

ADeepSeek V4 có hai phiên bản: DeepSeek-V4-Pro với 1.6T tham số, 49B kích hoạt và độ dài ngữ cảnh 1M; DeepSeek-V4-Flash với 284B tham số, 13B kích hoạt và độ dài ngữ cảnh 1M.

QDeepSeek V4 có những cải tiến nổi bật nào so với các mô hình trước?

ADeepSeek V4 cải thiện đáng kể khả năng Agent, kiến thức thế giới và hiệu suất suy luận. Nó hỗ trợ ngữ cảnh lên đến 1M token, sử dụng cơ chế chú ý mới DSA để giảm nhu cầu tính toán và bộ nhớ.

QDeepSeek V4 có hỗ trợ phần cứng của Huawei không?

ACó, DeepSeek thông báo sẽ hỗ trợ phần cứng Huawei (Huawei compute) vào nửa cuối năm 2026.

QAPI của DeepSeek V4 có những tính năng nào?

AAPI của DeepSeek V4 hỗ trợ cả hai giao diện OpenAI ChatCompletions và Anthropic, với độ dài ngữ cảnh 1M, chế độ không suy nghĩ và chế độ suy nghĩ với tham số reasoning_effort điều chỉnh cường độ.

QDeepSeek V4 đã được đánh giá so với các mô hình đóng như thế nào?

ATheo đánh giá nội bộ, DeepSeek-V4-Pro có trải nghiệm sử dụng tốt hơn Sonnet 4.5, chất lượng gần với Opus 4.6 chế độ không suy nghĩ, nhưng vẫn còn khoảng cách so với Opus 4.6 chế độ suy nghĩ.

Nội dung Liên quan

Từ ‘cấm cửa’ Doubao đến ‘ôm lấy’ Honor: Tại sao WeChat bất ngờ thay đổi thái độ?

Từ chặn Doubao đến bắt tay Honor: Tại sao WeChat đột nhiên “thay đổi thái độ”? Bài viết phân tích về việc WeChat của Tencent, sau một thời gian dài phong tỏa các trợ lý AI của hãng điện thoại, đã đột ngột hợp tác với các nhà sản xuất như Huawei, Honor, Xiaomi, OPPO, vivo để phát triển khả năng trợ lý A2A (Agent-to-Agent). Động thái này diễn ra trong bối cảnh Tencent đang chịu áp lực cạnh tranh lớn về AI so với các đối thủ như ByteDance và Alibaba. Trước đây, WeChat kiên quyết chống lại các phương pháp như GUI Agent (AI mô phỏng thao tác màn hình) mà Doubao của ByteDance sử dụng, coi đó là sự “xâm phạm”. Giờ đây, Tencent chọn giải pháp A2A, trong đó trợ lý AI hệ thống điện thoại phân tích ý định người dùng và gửi lệnh được ủy quyền tới WeChat để thực thi nội bộ. Cách tiếp cận này cho phép WeChat duy trì quyền kiểm soát hệ sinh thái và bảo mật dữ liệu trong khi vẫn mở rộng tiếp cận thông qua cổng vào AI cấp hệ thống. Các hãng điện thoại, dẫn đầu là Honor, nhiệt tình tham gia vì con đường GUI đã bị chứng minh là không khả thi. Hợp tác A2A mang lại cho họ sự ổn định, tuân thủ và cơ hội tập trung phát triển các khả năng AI độc lập khác. Cơ chế ủy quyền kép (người dùng + ứng dụng) được nhấn mạnh để đảm bảo quyền riêng tư và an ninh. Bài viết kết luận rằng đây là một liên minh chiến lược tạm thời. Tencent muốn biến WeChat thành “hệ điều hành dịch vụ” trong kỷ nguyên AI, trong khi các nhà sản xuất điện thoại muốn củng cố vị thế là trung tâm hệ sinh thái AI của riêng họ. Cuộc chiến giành cổng vào AI thời đại mới chỉ vừa bắt đầu.

marsbit33 phút trước

Từ ‘cấm cửa’ Doubao đến ‘ôm lấy’ Honor: Tại sao WeChat bất ngờ thay đổi thái độ?

marsbit33 phút trước

Số Liệu Trên Chuỗi Đêm Trước Khai Mạc: World Cup Chưa Đá Đã Giao Dịch 1.6 Tỷ USD

Trước thềm FIFA World Cup 2026, thị trường dự đoán phi tập trung (prediction markets) trên blockchain đã ghi nhận khối lượng giao dịch khổng lồ. Chỉ riêng hợp đồng "World Cup Winner" trên nền tảng Polymarket đã đạt khoảng 1,6 tỷ USD khối lượng giao dịch tích lũy tính đến ngày 5/6, dù giải đấu chưa bắt đầu. Con số này tăng mạnh từ 368 triệu USD vào cuối tháng 3, phản ánh sự quan tâm ngày càng lớn. Hàng trăm hợp đồng khác bao phủ mọi trận đấu, từ tỷ số đến đội vô địch, đang được giao dịch sôi động. Giá hợp đồng (0.01-0.99 USD) biến động theo thông tin và biểu thị xác suất ngầm định của thị trường. Cơ sở hạ tầng của lĩnh vực này đang được củng cố với việc sử dụng stablecoin được quản lý (USDC) để thanh toán, oracle phi tập trung (Chainlink) để xác định kết quả, và cả FIFA cũng đã chỉ định đối tác chính thức đầu tiên trong hạng mục "thị trường dự đoán". Sự phát triển này đánh dấu bước chuyển từ các hình thức tiếp cận ban đầu như tài trợ hay fan token, sang việc thâm nhập sâu vào các lớp cơ sở hạ tầng tài chính và thông tin của thể thao. Tuy nhiên, khung pháp lý cho các thị trường sự kiện này vẫn đang thay đổi và khác biệt đáng kể giữa các khu vực pháp lý.

marsbit1 giờ trước

Số Liệu Trên Chuỗi Đêm Trước Khai Mạc: World Cup Chưa Đá Đã Giao Dịch 1.6 Tỷ USD

marsbit1 giờ trước

Từ vụ IPO của SpaceX nhìn về tương lai của Crypto: Những phân khúc mã hóa nào sẽ tiếp nhận câu chuyện nghìn tỷ đô?

Tác giả: Climber, CryptoPulse Labs Sự kiện SpaceX lên kế hoạch IPO với định giá khoảng 1,77 nghìn tỷ USD không chỉ là một vụ niêm yết lớn, mà còn phản ánh sự thay đổi trong logic định giá vốn, hướng tới AI, cơ sở hạ tầng và các hệ sinh thái tương lai. Bài viết phân tích ba lĩnh vực tiềm năng trong thị trường crypto có thể hưởng lợi từ làn sóng này. **1. AI chuyển sang giai đoạn hạ tầng:** Sau cơn sốt ứng dụng AI, thị trường đang chuyển sự chú ý sang các tài nguyên cơ bản như sức mạnh tính toán. Các giao thức cung cấp nền tảng hạ tầng mạng lưới (như TAO) hoặc mạng lưới chia sẻ GPU (như RENDER, AKT, IO) có thể được định giá lại, tương tự như cách AWS thống trị kỷ nguyên internet. **2. Tài sản thế giới thực (RWA) mở rộng:** Nhu cầu cho phép vốn toàn cầu tiếp cận các tài sản tương lai như SpaceX hay OpenAI có thể thúc đẩy RWA phát triển vượt ra ngoài trái phiếu kho bạc, hướng tới cổ phần, vốn chủ sở hữu và tài sản chưa niêm yết. Điều này có thể tái cấu trúc cách phát hành và giao dịch tài sản, mang lại lợi ích cho các dự án cơ sở hạ tầng như ONDO, LINK hoặc các mạng lưới RWA như Plume. **3. Củng cố logic cơ sở hạ tầng:** Sự phát triển của AI và RWA cuối cùng sẽ cần năng lực giải quyết nền tảng. Stablecoin, từ công cụ giao dịch, có thể trở thành hạ tầng tài chính thiết yếu cho thanh toán xuyên biên giới, kinh tế AI và lưu chuyển tài sản toàn cầu. Các mạng lưới thanh toán và DePIN (Cơ sở hạ tầng vật lý phi tập trung) xây dựng các mạng lưới trong thế giới thực cũng có thể được định giá lại, vì mạng lưới thường tạo ra rào cản và giá trị lâu dài hơn ứng dụng đơn lẻ. Tóm lại, sự kiện SpaceX cho thấy vốn có thể chuyển từ việc theo đuổi câu chuyện sang đầu tư vào cơ sở hạ tầng và dòng tiền. Các lĩnh vực như hạ tầng AI, RWA, stablecoin, mạng thanh toán và DePIN có thể đại diện cho logic cốt lõi của chu kỳ crypto tiếp theo, nơi những người xây dựng hệ thống nền tảng thường thu về lợi nhuận lớn nhất.

marsbit1 giờ trước

Từ vụ IPO của SpaceX nhìn về tương lai của Crypto: Những phân khúc mã hóa nào sẽ tiếp nhận câu chuyện nghìn tỷ đô?

marsbit1 giờ trước

Thị trường tiền điện tử lao đao! Bitcoin vỡ mốc 60.000 USD, Ethereum sụt hơn 10%, MicroStrategy bị 'săn' bởi phe bán khống

Thị trường tiền điện tử lao dốc mạnh khi Bitcoin xuống dưới 60.000 USD, mức thấp nhất trong hơn nửa năm, giảm 16% trong tuần. Ethereum cũng giảm hơn 10%. Nguyên nhân chính đến từ việc Michael Saylor của MicroStrategy bán một phần Bitcoin, kích hoạt thanh lý hàng trăm triệu USD, cùng với dữ liệu việc làm Mỹ mạnh đẩy lợi tức trái phiếu lên cao. Áp lực bán còn đến từ dòng tiền chuyển hướng sang cổ phiếu AI và IPO, cũng như triển vọng ảm đạm của dự luật Clarity Act. Bitcoin hiện cách đỉnh lịch sử tháng 10/2025 khoảng 50%. Mối tương quan tích cực trước đây giữa Bitcoin và các chỉ số chứng khoán Mỹ đã sụp đổ. ETF Bitcoin ghi nhận dòng tiền vào ròng nhỏ sau 13 ngày rút liên tiếp kỷ lục. Tuy nhiên, một số nhà đầu tư vẫn lạc quan, cho rằng việc Bitcoin chạm đường trung bình 200 tuần là cơ hội mua vào. Cổ phiếu MicroStrategy (MSTR) giảm 24% trong tuần, mức tồi tệ nhất từ 2022. Hoạt động giao dịch quyền chọn bán (put option) nhắm vào MSTR tăng mạnh, với khối lượng gấp đôi quyền chọn mua. Quỹ ETF WNTR, chuyên thực hiện chiến lược bán khống MSTR, đã tăng 30% kể từ giữa tháng 5. Cổ phiếu ưu đãi STRC của công ty cũng xuống mức thấp nhất kể từ tháng 11 năm ngoái.

华尔街日报2 giờ trước

Thị trường tiền điện tử lao đao! Bitcoin vỡ mốc 60.000 USD, Ethereum sụt hơn 10%, MicroStrategy bị 'săn' bởi phe bán khống

华尔街日报2 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片