DeepSeek V4 chính thức ra mắt, phá vỡ thế độc quyền của mã nguồn đóng mạnh nhất, công khai hợp tác với chip Huawei

marsbitXuất bản vào 2026-04-24Cập nhật gần nhất vào 2026-04-24

Tóm tắt

DeepSeek vừa chính thức ra mắt phiên bản DeepSeek-V4 với hai phiên bản: Pro và Flash. V4-Pro có 1,6 nghìn tỷ tham số và 49 tỷ tham số kích hoạt, được đánh giá ngang hàng với các mô hình nguồn đóng hàng đầu về khả năng Agent, kiến thức thế giới và suy luận. Trong khi đó, V4-Flash là phiên bản nhẹ hơn, phù hợp cho các tác vụ đơn giản và có chi phí API thấp hơn. Cả hai phiên bản đều hỗ trợ ngữ cảnh dài 1 triệu token, một tính năng trước đây chỉ có trên Gemini. DeepSeek cũng công bố sẽ hỗ trợ chip Huawei từ nửa cuối năm nay. Mô hình đã được open-source và có sẵn trên Hugging Face và ModelScope. API cập nhật đồng thời, hỗ trợ cả giao thức OpenAI và Anthropic.

Vừa qua, DeepSeek-V4 đã chính thức xuất hiện!

Phiên bản xem trước chính thức lên sóng và đồng thời mã nguồn mở.

Tổng cộng có hai phiên bản:

DeepSeek-V4-Pro: Đối đầu với các mô hình mã nguồn đóng hàng đầu, 1.6T, 49B kích hoạt, độ dài ngữ cảnh 1M;

DeepSeek-V4-Flash: Phiên bản kinh tế nhỏ hơn và nhanh hơn, 284B, 13B kích hoạt, độ dài ngữ cảnh 1M.

Lời nói chính thức từ nhà phát triển là: Về khả năng Agent, kiến thức thế giới và hiệu suất suy luận đều đạt được vị trí dẫn đầu trong nước và lĩnh vực mã nguồn mở.

Và:

Hiện tại DeepSeek-V4 đã trở thành mô hình Agentic Coding được nhân viên nội bộ sử dụng, theo đánh giá phản hồi trải nghiệm sử dụng tốt hơn Sonnet 4.5, chất lượng giao hàng gần với Opus 4.6 chế độ không suy nghĩ. Nhưng vẫn còn khoảng cách nhất định so với mô hình suy nghĩ Opus 4.6.

Hiện tại cả trang web chính thức và APP đều đã cập nhật, dịch vụ API cũng đã đồng bộ hóa.

Về khả năng tính toán trong nước mà mọi người quan tâm, điểm nhấn là nửa cuối năm sẽ hỗ trợ khả năng tính toán của Huawei.

Lựa chọn cao cấp và tiết kiệm, hai phiên bản cùng ra mắt

Lần này V4 một lúc ra mắt hai phiên bản.

V4-Pro, hiệu suất ngang bằng với các mô hình mã nguồn đóng hàng đầu.

Nhà phát triển đưa ra ba đánh giá:

Khả năng Agent được cải thiện mạnh mẽ: Trong đánh giá Agentic Coding, V4-Pro đã đạt đến trình độ tốt nhất của các mô hình mã nguồn mở hiện tại, và cũng thể hiện xuất sắc trong các đánh giá liên quan đến Agent khác. Trong đánh giá nội bộ, ở chế độ Agent Coding, trải nghiệm V4 tốt hơn Sonnet 4.5, chất lượng giao hàng gần với Opus 4.6 chế độ không suy nghĩ, nhưng vẫn còn khoảng cách so với chế độ suy nghĩ Opus 4.6.

Kiến thức thế giới phong phú: Trong đánh giá kiến thức thế giới, DeepSeek-V4-Pro vượt xa các mô hình mã nguồn mở khác, chỉ kém hơn một chút so với mô hình mã nguồn đóng đỉnh cao Gemini-Pro-3.1.

Hiệu suất suy luận đỉnh cao thế giới: Trong các đánh giá về toán học, STEM, mã thi đấu, DeepSeek-V4-Pro vượt qua tất cả các mô hình mã nguồn mở đã công bố đánh giá hiện tại, đạt được thành tích ngang bằng với các mô hình mã nguồn đóng hàng đầu thế giới.

V4-Flash, phiên bản kinh tế nhỏ hơn và nhanh hơn. Khả năng suy luận gần với Pro, kiến thức thế giới hơi kém hơn, nhưng tham số và kích hoạt nhỏ hơn, API rẻ hơn.

Về nhiệm vụ Agent, DeepSeek-V4-Flash ngang ngửa với DeepSeek-V4-Pro trong nhiệm vụ đơn giản, nhưng vẫn có khoảng cách trong nhiệm vụ khó cao.

Trong bài kiểm tra rửa xe, V4 cũng vượt qua nhanh chóng.

Trong khi đó, trong tình huống sinh học kinh điển "người cha tuyệt vọng", DeepSeek-V4 không nhận ra ngay điểm mấu chốt về mù màu đỏ-xanh lá (theo quy luật di truyền, nếu một phụ nữ bị mù màu đỏ-xanh lá, cha ruột của cô ấy chắc chắn cũng bị).

Triệu ngữ cảnh trở thành tiêu chuẩn

Đáng chú ý là, từ hôm nay, 1M ngữ cảnh là tiêu chuẩn cho tất cả dịch vụ chính thức của DeepSeek.

Một năm trước, 1M ngữ cảnh vẫn là lá bài độc quyền của Gemini; tất cả các mô hình mã nguồn đóng khác chỉ 128K hoặc 200K; phía mã nguồn mở hầu như không ai chơi được ở cấp độ này.

DeepSeek trực tiếp biến triệu ngữ cảnh từ một "tính năng cao cấp" thành "cơ sở hạ tầng".

Và mã nguồn mở. Họ làm được như thế nào, trong bản phát hành đã trực tiếp đưa ra câu trả lời——

V4 tạo ra một cơ chế chú ý hoàn toàn mới, nén ở chiều token, kết hợp với sự chú ý thưa DSA. So với phương pháp truyền thống, nhu cầu tính toán và bộ nhớ giảm mạnh.

DSA không phải từ mới. Nửa năm trước, bản cập nhật V3.2-Exp lần đầu tiên giới thiệu, lúc đó sự chú ý bên ngoài không cao, vì điểm chạy và V3.1-Terminus gần như giống nhau, trông giống như một phiên bản trung gian không có gì mới.

Giờ nhìn lại, đó là nền móng của V4.

Tối ưu hóa chuyên sâu khả năng Agent

Về phía Agent, V4 đã điều chỉnh và tối ưu hóa cho các sản phẩm Agent chủ lưu như Claude Code, OpenClaw, OpenCode, CodeBuddy, nhiệm vụ mã và nhiệm vụ tạo tài liệu đều được cải thiện.

Bản phát hành còn kèm theo một ví dụ trang PPT được tạo bởi V4-Pro trong một khung Agent.

Giá API

Về phía API, V4-Pro và V4-Flash đồng bộ lên sóng, hỗ trợ hai giao diện OpenAI ChatCompletions và Anthropic.

base_url không đổi, tham số model đổi thành deepseek-v4-pro hoặc deepseek-v4-flash để gọi.

Cả hai phiên bản đều có ngữ cảnh tối đa 1M, đều hỗ trợ đồng thời chế độ không suy nghĩ và chế độ suy nghĩ. Ở chế độ suy nghĩ, có thể điều chỉnh cường độ qua tham số reasoning_effort, hai mức high và max. Nhà phát triển khuyến nghị các tình huống Agent phức tạp nên dùng max.

Có một điểm nhấn ở đây——nửa cuối năm hỗ trợ khả năng tính toán của Huawei.

Ngoài ra, tên mô hình cũ sẽ ngừng hoạt động.

deepseek-chat và deepseek-reasoner sẽ ngừng hoạt động sau ba tháng (24/7/2026), trong giai đoạn hiện tại hai tên này lần lượt trỏ đến chế độ không suy nghĩ và suy nghĩ của V4-Flash.

Ảnh hưởng không lớn với nhà phát triển cá nhân, chỉ cần đổi một tham số model. Các công ty đã kết nối môi trường sản xuất, trong ba tháng này cần di chuyển.

One more thing

Cuối bản phát hành, DeepSeek tự trích dẫn một câu.

「不诱于誉,不恐于诽,率道而行,端然正己。」

Đây là một câu trong "Phi Thập Nhị Tử" của Tuân Tử. Nghĩa đen là, không bị dụ dỗ bởi danh tiếng, không sợ hãi bởi phỉ báng, đi theo con đường mình nhận định, ngay thẳng chính mình.

Đặt trong bối cảnh hôm nay, khá thú vị.

Nửa năm qua, những tin đồn về việc V4 khi nào ra mắt, có phải hoãn, có phải đã bị nhà khác vượt qua, có phải đã bị Claude chưng cất dữ liệu giải quyết... chạy đi chạy lại vài vòng trong cộng đồng AI tiếng Trung và tiếng Anh. Đầu năm thậm chí còn có người khẳng định V4 sẽ ra trước Tết, nhưng cuối cùng đợi đến cuối tháng tư.

Họ không phản hồi lần nào.

Vào một chiều thứ Sáu, đưa V4 ra, đồng bộ mã nguồn mở, đồng bộ lên trang chính thức và App, đồng bộ cập nhật API, tiện thể viết vào bản phát hành sự thật nhân viên nội bộ đã ngừng dùng Claude.

Không có lộ trình, không livestream, không phỏng vấn.

Bốn chữ "率道而行" (suất đạo nhi hành), nghe như một khẩu hiệu. Nhưng nếu bạn đặt cùng nhau phiên bản Exp "không có điểm nhấn" của V3.2 nửa năm trước, bộ chú ý thưa DSA đã chuẩn bị nền móng cho V4 nửa năm, con đường biến triệu ngữ cảnh từ lá bài thành tiêu chuẩn.

DeepSeek đã làm được.

Liên kết mã nguồn mở mô hình DeepSeek-V4:

[1]https://huggingface.co/collections/deepseek-ai/deepseek-v4

[2]https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4

Báo cáo kỹ thuật DeepSeek-V4: https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

Bài viết từ tài khoản công chúng WeChat "量子位", tác giả: 量子位

Câu hỏi Liên quan

QDeepSeek V4 có những phiên bản nào và thông số kỹ thuật của chúng là gì?

ADeepSeek V4 có hai phiên bản: DeepSeek-V4-Pro với 1.6T tham số, 49B kích hoạt và độ dài ngữ cảnh 1M; DeepSeek-V4-Flash với 284B tham số, 13B kích hoạt và độ dài ngữ cảnh 1M.

QDeepSeek V4 có những cải tiến nổi bật nào so với các mô hình trước?

ADeepSeek V4 cải thiện đáng kể khả năng Agent, kiến thức thế giới và hiệu suất suy luận. Nó hỗ trợ ngữ cảnh lên đến 1M token, sử dụng cơ chế chú ý mới DSA để giảm nhu cầu tính toán và bộ nhớ.

QDeepSeek V4 có hỗ trợ phần cứng của Huawei không?

ACó, DeepSeek thông báo sẽ hỗ trợ phần cứng Huawei (Huawei compute) vào nửa cuối năm 2026.

QAPI của DeepSeek V4 có những tính năng nào?

AAPI của DeepSeek V4 hỗ trợ cả hai giao diện OpenAI ChatCompletions và Anthropic, với độ dài ngữ cảnh 1M, chế độ không suy nghĩ và chế độ suy nghĩ với tham số reasoning_effort điều chỉnh cường độ.

QDeepSeek V4 đã được đánh giá so với các mô hình đóng như thế nào?

ATheo đánh giá nội bộ, DeepSeek-V4-Pro có trải nghiệm sử dụng tốt hơn Sonnet 4.5, chất lượng gần với Opus 4.6 chế độ không suy nghĩ, nhưng vẫn còn khoảng cách so với Opus 4.6 chế độ suy nghĩ.

Nội dung Liên quan

Michael Saylor tuyên bố, đã không thể thông qua bản cập nhật Bitcoin mà ông phản đối!

Michael Saylor tuyên bố rằng về mặt toán học, BIP-110 không thể đạt ngưỡng ủng hộ 55% từ các thợ đào tự nguyện trong chu kỳ điều chỉnh độ khó hiện tại của Bitcoin. Theo dữ liệu Saylor cung cấp, tính đến khối 960.561, chỉ có 24 trong tổng số 946 khối được tạo ra trong kỳ này ghi nhận tín hiệu ủng hộ BIP-110 trong trường phiên bản tiêu đề khối. Ông cho biết tất cả tín hiệu này đều đến từ thợ đào DATUM qua pool OCEAN, và không có sự ủng hộ nào từ các thợ đào bên ngoài OCEAN. Do đó, BIP-110 sẽ không đạt được sự đồng thuận chung của các thợ đào. BIP-110 là đề xuất nhằm hạn chế việc đưa dữ liệu lớn như hình ảnh, văn bản vào mạng Bitcoin, với lập luận Bitcoin chỉ nên dùng để chuyển tiền. Saylor phản đối đề xuất này, cho rằng mạng Bitcoin không nên quyết định giao dịch nào là cần thiết, luật lệ không nên thay đổi theo ý muốn của một nhóm nhỏ, và mức độ ủng hộ cao hiện tại có thể không phản ánh đúng ý chí thực sự của các thợ đào.

cryptonews.ru5 phút trước

Michael Saylor tuyên bố, đã không thể thông qua bản cập nhật Bitcoin mà ông phản đối!

cryptonews.ru5 phút trước

Trong khuôn khổ chiến lược, mức lợi suất cổ tức STRC vẫn giữ ở 12% khi giá cổ phiếu tiếp tục thấp hơn mệnh giá

Giám đốc điều hành Michael Saylor của Strategy (Nasdaq: MSTR) xác nhận tỷ suất cổ tức cho cổ phiếu ưu đãi STRC sẽ giữ ở mức 12% đến tháng 8/2026. Cơ chế "ratchet" tự động tăng tỷ suất 0,5% mỗi khi giá STRC xuống dưới 95 USD, với mục tiêu đưa giá về mệnh giá 100 USD và giảm biến động. Tuy nhiên, cơ chế này chưa hiệu quả: giá STRC vẫn giao dịch thấp hơn 10-11% so với mệnh giá dù tỷ suất cổ tức ở mức cao kỷ lục. Áp lực cạnh tranh từ chứng khoán ưu đãi của đối thủ (như SATA với tỷ suất ~13%) và biến động của Bitcoin khiến Strategy phải tạm dừng chương trình phát hành cổ phiếu mới (ATM), hạn chế khả năng huy động vốn mua Bitcoin. Các nhà phân tích cảnh báo rủi ro dài hạn từ cơ cấu "ratchet" chỉ hoạt động một chiều. Một cuộc điều tra pháp lý đã được mở ra liên quan đến khả năng duy trì cổ tức nếu giá Bitcoin giảm. Để ứng phó, Strategy đã thiết lập dự trữ thanh khoản đủ cho ~26 tháng chi trả và phê duyệt khung quản lý vốn cho phép mua lại 2 tỷ USD cổ phiếu cùng chương trình bán Bitcoin khi có lợi, nhằm củng cố dự trữ và chi trả cổ tức.

cryptonews.ru7 phút trước

Trong khuôn khổ chiến lược, mức lợi suất cổ tức STRC vẫn giữ ở 12% khi giá cổ phiếu tiếp tục thấp hơn mệnh giá

cryptonews.ru7 phút trước

Chuyên gia phân tích: Giá Bitcoin sẽ giảm xuống 60.000 USD vào tháng Tám, sau đó phục hồi về 70.000 USD

Nhà phân tích Andrey Poroshin dự đoán giá Bitcoin sẽ giảm xuống mức 60.000 - 62.000 USD trong tháng 8 do thiếu các động lực vĩ mô, sau đó phục hồi lên 70.000 USD. Ông lý giải rằng thị trường đang thận trọng sau quyết định giữ nguyên lãi suất của Cục Dự trữ Liên bang Mỹ (Fed) và áp lực lạm phát vẫn còn. Sự rút lui của BitMEX có thể là yếu tố hỗ trợ cho đợt phục hồi, khi việc các "tay chơi" yếu rời sàn thường báo hiệu điểm đảo chiều. Poroshin cho rằng trong ngắn hạn, Bitcoin ít chịu ảnh hưởng bởi căng thẳng địa chính trị như xung đột Iran - Mỹ, và thị trường vẫn chờ đợi sự rõ ràng từ dự luật CLARITY. Ông kỳ vọng biến động giá sẽ gia tăng vào tháng 9, liên quan đến các quyết định chính sách của Fed và tiến trình của dự luật này.

cryptonews.ru7 phút trước

Chuyên gia phân tích: Giá Bitcoin sẽ giảm xuống 60.000 USD vào tháng Tám, sau đó phục hồi về 70.000 USD

cryptonews.ru7 phút trước

Vụ hack Coldcard, một trong những vụ hack ví Bitcoin lớn nhất gần đây, đã bắt đầu một làn sóng tổn thất mới! Tổn thất đang tăng

Công ty Galaxy Research thông báo đã phát hiện đợt tấn công thứ ba nhắm vào các ví Bitcoin được tạo trên thiết bị Coldcard. Trong đợt này, 207,7294 BTC đã bị đánh cắp, nâng tổng số thiệt hại lên 1367,05 BTC (khoảng 88,6 triệu USD) từ 4585 địa chỉ. Hai đợt tấn công đầu tiên có đặc điểm tương tự, có thể do cùng một kẻ tấn công. Tuy nhiên, đợt thứ ba lại có nhiều khác biệt về hành vi (sử dụng địa chỉ P2WSH riêng lẻ, gộp nhiều địa chỉ nạn nhân...), khiến các nhà nghiên cứu cho rằng có thể là một kẻ tấn công khác hoặc cùng kẻ tấn công nhưng đã thay đổi công cụ. Số Bitcoin bị đánh cắp hiện vẫn nằm trong các địa chỉ do kẻ tấn công kiểm soát và chưa được chuyển đi. Phần lớn số ví bị ảnh hưởng có số dư dưới 1 BTC, cho thấy chủ yếu là ví cá nhân. Lỗ hổng trên phần mềm Coldcard bắt đầu từ tháng 3/2021, và tất cả Bitcoin bị đánh cắp đều được tạo sau thời điểm đó.

cryptonews.ru1 giờ trước

Vụ hack Coldcard, một trong những vụ hack ví Bitcoin lớn nhất gần đây, đã bắt đầu một làn sóng tổn thất mới! Tổn thất đang tăng

cryptonews.ru1 giờ trước

Trump Media bán thêm 2.628 BTC, khoản nắm giữ giảm xuống còn 4.261 BTC

Công ty Trump Media & Technology Group, chủ sở hữu của Truth Social, đã thực hiện một đợt bán Bitcoin (BTC) lớn khác. Theo dữ liệu từ Lookonchain dẫn nguồn Arkham, công ty đã chuyển 2.628 BTC (trị giá khoảng 165 triệu USD) tới sàn Crypto.com vào Chủ nhật. Đây là một phần trong chuỗi giao dịch bán kéo dài 7 tháng qua. Tính tổng cộng, Trump Media đã bán 7.281 BTC với giá bán trung bình khoảng 74.855 USD/BTC, thu về xấp xỉ 545 triệu USD. Số Bitcoin còn lại trong kho của công ty theo báo cáo là 4.261 BTC, tương đương 269,8 triệu USD. Các giao dịch này diễn ra trong bối cảnh các hoạt động tiền mã hóa liên quan đến cựu Tổng thống Donald Trump đang chịu sự giám sát về đạo đức. Các nhà lập pháp Mỹ đang tranh luận về Đạo luật CLARITY, nhằm siết chặt các quy tắc đạo đức, sở hữu tài sản số và ngăn ngừa xung đột lợi ích đối với các quan chức công quyền, bao gồm cả những lo ngại về các dự án crypto của ông Trump.

cointelegraph1 giờ trước

Trump Media bán thêm 2.628 BTC, khoản nắm giữ giảm xuống còn 4.261 BTC

cointelegraph1 giờ trước

Giao dịch

Giao ngay

DeepSeek V4 chính thức ra mắt, phá vỡ thế độc quyền của mã nguồn đóng mạnh nhất, công khai hợp tác với chip Huawei

Tóm tắt

Lựa chọn cao cấp và tiết kiệm, hai phiên bản cùng ra mắt

Triệu ngữ cảnh trở thành tiêu chuẩn

Tối ưu hóa chuyên sâu khả năng Agent

Giá API

One more thing

Câu hỏi Liên quan

Nội dung Liên quan

Michael Saylor tuyên bố, đã không thể thông qua bản cập nhật Bitcoin mà ông phản đối!

Trong khuôn khổ chiến lược, mức lợi suất cổ tức STRC vẫn giữ ở 12% khi giá cổ phiếu tiếp tục thấp hơn mệnh giá

Chuyên gia phân tích: Giá Bitcoin sẽ giảm xuống 60.000 USD vào tháng Tám, sau đó phục hồi về 70.000 USD

Vụ hack Coldcard, một trong những vụ hack ví Bitcoin lớn nhất gần đây, đã bắt đầu một làn sóng tổn thất mới! Tổn thất đang tăng

Trump Media bán thêm 2.628 BTC, khoản nắm giữ giảm xuống còn 4.261 BTC

Giao dịch

Danh mục Phổ biến

Thẻ Nổi bật