DeepSeek V4 chính thức ra mắt, phá vỡ thế độc quyền của mã nguồn đóng mạnh nhất, công khai hợp tác với chip Huawei

marsbitXuất bản vào 2026-04-24Cập nhật gần nhất vào 2026-04-24

Tóm tắt

DeepSeek vừa chính thức ra mắt phiên bản DeepSeek-V4 với hai phiên bản: Pro và Flash. V4-Pro có 1,6 nghìn tỷ tham số và 49 tỷ tham số kích hoạt, được đánh giá ngang hàng với các mô hình nguồn đóng hàng đầu về khả năng Agent, kiến thức thế giới và suy luận. Trong khi đó, V4-Flash là phiên bản nhẹ hơn, phù hợp cho các tác vụ đơn giản và có chi phí API thấp hơn. Cả hai phiên bản đều hỗ trợ ngữ cảnh dài 1 triệu token, một tính năng trước đây chỉ có trên Gemini. DeepSeek cũng công bố sẽ hỗ trợ chip Huawei từ nửa cuối năm nay. Mô hình đã được open-source và có sẵn trên Hugging Face và ModelScope. API cập nhật đồng thời, hỗ trợ cả giao thức OpenAI và Anthropic.

Vừa qua, DeepSeek-V4 đã chính thức xuất hiện!

Phiên bản xem trước chính thức lên sóng và đồng thời mã nguồn mở.

Tổng cộng có hai phiên bản:

DeepSeek-V4-Pro: Đối đầu với các mô hình mã nguồn đóng hàng đầu, 1.6T, 49B kích hoạt, độ dài ngữ cảnh 1M;

DeepSeek-V4-Flash: Phiên bản kinh tế nhỏ hơn và nhanh hơn, 284B, 13B kích hoạt, độ dài ngữ cảnh 1M.

Lời nói chính thức từ nhà phát triển là: Về khả năng Agent, kiến thức thế giới và hiệu suất suy luận đều đạt được vị trí dẫn đầu trong nước và lĩnh vực mã nguồn mở.

Và:

Hiện tại DeepSeek-V4 đã trở thành mô hình Agentic Coding được nhân viên nội bộ sử dụng, theo đánh giá phản hồi trải nghiệm sử dụng tốt hơn Sonnet 4.5, chất lượng giao hàng gần với Opus 4.6 chế độ không suy nghĩ. Nhưng vẫn còn khoảng cách nhất định so với mô hình suy nghĩ Opus 4.6.

Hiện tại cả trang web chính thức và APP đều đã cập nhật, dịch vụ API cũng đã đồng bộ hóa.

Về khả năng tính toán trong nước mà mọi người quan tâm, điểm nhấn là nửa cuối năm sẽ hỗ trợ khả năng tính toán của Huawei.

Lựa chọn cao cấp và tiết kiệm, hai phiên bản cùng ra mắt

Lần này V4 một lúc ra mắt hai phiên bản.

V4-Pro, hiệu suất ngang bằng với các mô hình mã nguồn đóng hàng đầu.

Nhà phát triển đưa ra ba đánh giá:

Khả năng Agent được cải thiện mạnh mẽ: Trong đánh giá Agentic Coding, V4-Pro đã đạt đến trình độ tốt nhất của các mô hình mã nguồn mở hiện tại, và cũng thể hiện xuất sắc trong các đánh giá liên quan đến Agent khác. Trong đánh giá nội bộ, ở chế độ Agent Coding, trải nghiệm V4 tốt hơn Sonnet 4.5, chất lượng giao hàng gần với Opus 4.6 chế độ không suy nghĩ, nhưng vẫn còn khoảng cách so với chế độ suy nghĩ Opus 4.6.

Kiến thức thế giới phong phú: Trong đánh giá kiến thức thế giới, DeepSeek-V4-Pro vượt xa các mô hình mã nguồn mở khác, chỉ kém hơn một chút so với mô hình mã nguồn đóng đỉnh cao Gemini-Pro-3.1.

Hiệu suất suy luận đỉnh cao thế giới: Trong các đánh giá về toán học, STEM, mã thi đấu, DeepSeek-V4-Pro vượt qua tất cả các mô hình mã nguồn mở đã công bố đánh giá hiện tại, đạt được thành tích ngang bằng với các mô hình mã nguồn đóng hàng đầu thế giới.

V4-Flash, phiên bản kinh tế nhỏ hơn và nhanh hơn. Khả năng suy luận gần với Pro, kiến thức thế giới hơi kém hơn, nhưng tham số và kích hoạt nhỏ hơn, API rẻ hơn.

Về nhiệm vụ Agent, DeepSeek-V4-Flash ngang ngửa với DeepSeek-V4-Pro trong nhiệm vụ đơn giản, nhưng vẫn có khoảng cách trong nhiệm vụ khó cao.

Trong bài kiểm tra rửa xe, V4 cũng vượt qua nhanh chóng.

Trong khi đó, trong tình huống sinh học kinh điển "người cha tuyệt vọng", DeepSeek-V4 không nhận ra ngay điểm mấu chốt về mù màu đỏ-xanh lá (theo quy luật di truyền, nếu một phụ nữ bị mù màu đỏ-xanh lá, cha ruột của cô ấy chắc chắn cũng bị).

Triệu ngữ cảnh trở thành tiêu chuẩn

Đáng chú ý là, từ hôm nay, 1M ngữ cảnh là tiêu chuẩn cho tất cả dịch vụ chính thức của DeepSeek.

Một năm trước, 1M ngữ cảnh vẫn là lá bài độc quyền của Gemini; tất cả các mô hình mã nguồn đóng khác chỉ 128K hoặc 200K; phía mã nguồn mở hầu như không ai chơi được ở cấp độ này.

DeepSeek trực tiếp biến triệu ngữ cảnh từ một "tính năng cao cấp" thành "cơ sở hạ tầng".

Và mã nguồn mở. Họ làm được như thế nào, trong bản phát hành đã trực tiếp đưa ra câu trả lời——

V4 tạo ra một cơ chế chú ý hoàn toàn mới, nén ở chiều token, kết hợp với sự chú ý thưa DSA. So với phương pháp truyền thống, nhu cầu tính toán và bộ nhớ giảm mạnh.

DSA không phải từ mới. Nửa năm trước, bản cập nhật V3.2-Exp lần đầu tiên giới thiệu, lúc đó sự chú ý bên ngoài không cao, vì điểm chạy và V3.1-Terminus gần như giống nhau, trông giống như một phiên bản trung gian không có gì mới.

Giờ nhìn lại, đó là nền móng của V4.

Tối ưu hóa chuyên sâu khả năng Agent

Về phía Agent, V4 đã điều chỉnh và tối ưu hóa cho các sản phẩm Agent chủ lưu như Claude Code, OpenClaw, OpenCode, CodeBuddy, nhiệm vụ mã và nhiệm vụ tạo tài liệu đều được cải thiện.

Bản phát hành còn kèm theo một ví dụ trang PPT được tạo bởi V4-Pro trong một khung Agent.

Giá API

Về phía API, V4-Pro và V4-Flash đồng bộ lên sóng, hỗ trợ hai giao diện OpenAI ChatCompletions và Anthropic.

base_url không đổi, tham số model đổi thành deepseek-v4-pro hoặc deepseek-v4-flash để gọi.

Cả hai phiên bản đều có ngữ cảnh tối đa 1M, đều hỗ trợ đồng thời chế độ không suy nghĩ và chế độ suy nghĩ. Ở chế độ suy nghĩ, có thể điều chỉnh cường độ qua tham số reasoning_effort, hai mức high và max. Nhà phát triển khuyến nghị các tình huống Agent phức tạp nên dùng max.

Có một điểm nhấn ở đây——nửa cuối năm hỗ trợ khả năng tính toán của Huawei.

Ngoài ra, tên mô hình cũ sẽ ngừng hoạt động.

deepseek-chat và deepseek-reasoner sẽ ngừng hoạt động sau ba tháng (24/7/2026), trong giai đoạn hiện tại hai tên này lần lượt trỏ đến chế độ không suy nghĩ và suy nghĩ của V4-Flash.

Ảnh hưởng không lớn với nhà phát triển cá nhân, chỉ cần đổi một tham số model. Các công ty đã kết nối môi trường sản xuất, trong ba tháng này cần di chuyển.

One more thing

Cuối bản phát hành, DeepSeek tự trích dẫn một câu.

「不诱于誉,不恐于诽,率道而行,端然正己。」

Đây là một câu trong "Phi Thập Nhị Tử" của Tuân Tử. Nghĩa đen là, không bị dụ dỗ bởi danh tiếng, không sợ hãi bởi phỉ báng, đi theo con đường mình nhận định, ngay thẳng chính mình.

Đặt trong bối cảnh hôm nay, khá thú vị.

Nửa năm qua, những tin đồn về việc V4 khi nào ra mắt, có phải hoãn, có phải đã bị nhà khác vượt qua, có phải đã bị Claude chưng cất dữ liệu giải quyết... chạy đi chạy lại vài vòng trong cộng đồng AI tiếng Trung và tiếng Anh. Đầu năm thậm chí còn có người khẳng định V4 sẽ ra trước Tết, nhưng cuối cùng đợi đến cuối tháng tư.

Họ không phản hồi lần nào.

Vào một chiều thứ Sáu, đưa V4 ra, đồng bộ mã nguồn mở, đồng bộ lên trang chính thức và App, đồng bộ cập nhật API, tiện thể viết vào bản phát hành sự thật nhân viên nội bộ đã ngừng dùng Claude.

Không có lộ trình, không livestream, không phỏng vấn.

Bốn chữ "率道而行" (suất đạo nhi hành), nghe như một khẩu hiệu. Nhưng nếu bạn đặt cùng nhau phiên bản Exp "không có điểm nhấn" của V3.2 nửa năm trước, bộ chú ý thưa DSA đã chuẩn bị nền móng cho V4 nửa năm, con đường biến triệu ngữ cảnh từ lá bài thành tiêu chuẩn.

DeepSeek đã làm được.

Liên kết mã nguồn mở mô hình DeepSeek-V4:

[1]https://huggingface.co/collections/deepseek-ai/deepseek-v4

[2]https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4

Báo cáo kỹ thuật DeepSeek-V4: https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

Bài viết từ tài khoản công chúng WeChat "量子位", tác giả: 量子位

Câu hỏi Liên quan

QDeepSeek V4 có những phiên bản nào và thông số kỹ thuật của chúng là gì?

ADeepSeek V4 có hai phiên bản: DeepSeek-V4-Pro với 1.6T tham số, 49B kích hoạt và độ dài ngữ cảnh 1M; DeepSeek-V4-Flash với 284B tham số, 13B kích hoạt và độ dài ngữ cảnh 1M.

QDeepSeek V4 có những cải tiến nổi bật nào so với các mô hình trước?

ADeepSeek V4 cải thiện đáng kể khả năng Agent, kiến thức thế giới và hiệu suất suy luận. Nó hỗ trợ ngữ cảnh lên đến 1M token, sử dụng cơ chế chú ý mới DSA để giảm nhu cầu tính toán và bộ nhớ.

QDeepSeek V4 có hỗ trợ phần cứng của Huawei không?

ACó, DeepSeek thông báo sẽ hỗ trợ phần cứng Huawei (Huawei compute) vào nửa cuối năm 2026.

QAPI của DeepSeek V4 có những tính năng nào?

AAPI của DeepSeek V4 hỗ trợ cả hai giao diện OpenAI ChatCompletions và Anthropic, với độ dài ngữ cảnh 1M, chế độ không suy nghĩ và chế độ suy nghĩ với tham số reasoning_effort điều chỉnh cường độ.

QDeepSeek V4 đã được đánh giá so với các mô hình đóng như thế nào?

ATheo đánh giá nội bộ, DeepSeek-V4-Pro có trải nghiệm sử dụng tốt hơn Sonnet 4.5, chất lượng gần với Opus 4.6 chế độ không suy nghĩ, nhưng vẫn còn khoảng cách so với Opus 4.6 chế độ suy nghĩ.

Nội dung Liên quan

TIN VỠ: Mastercard Vừa Mở Cổng Mạng Thanh Toán Toàn Cầu Cho Tiền Mã Hóa — Những Altcoin Nào Được Lựa Chọn?

Vào ngày 3/6, Mastercard thông báo sẽ mở rộng cơ sở hạ tầng thanh toán toàn cầu của mình để hỗ trợ thanh toán trên chuỗi bằng cách sử dụng tiền điện tử thông qua các stablecoin được quản lý. Điều này cho phép các giao dịch thẻ được thanh toán 24/7, kể cả cuối tuần và ngày lễ, lần đầu tiên trong lịch sử mạng lưới. Sáu stablecoin được quản lý được hỗ trợ trong đợt triển khai đầu tiên: USDC của Circle, PYUSD của PayPal, USDG và USDP của Paxos, RLUSD của Ripple và SoFiUSD của SoFi. Việc thanh toán sẽ hoạt động trên tám mạng blockchain: Ethereum, Solana, Polygon, Base, Arbitrum, XRP Ledger, Canton và Tempo. Đây là một bước phát triển ở lớp thanh toán hậu kỳ, không phải là sự thay đổi sản phẩm hướng đến người tiêu dùng. Các đơn vị phát hành và ngân hàng trên mạng Mastercard giờ đây có thể chọn thanh toán các giao dịch thẻ bằng stablecoin trên chuỗi, thay vì thông qua các kênh ngân hàng truyền thống. Cả hai tùy chọn chạy song song. Người dùng thẻ không cần thay đổi cách thanh toán. Sự thay đổi nằm ở cơ sở hạ tầng phụ trợ, giờ có thể hoạt động trên mạng blockchain suốt ngày đêm, loại bỏ các điểm tắc nghẽn do giờ ngân hàng và ngày nghỉ gây ra trong nhiều thập kỷ. Sự kiện này được coi là sự xác nhận thể chế rõ ràng nhất cho nền kinh tế stablecoin cho đến nay.

bitcoinist3 giờ trước

TIN VỠ: Mastercard Vừa Mở Cổng Mạng Thanh Toán Toàn Cầu Cho Tiền Mã Hóa — Những Altcoin Nào Được Lựa Chọn?

bitcoinist3 giờ trước

Hoskinson Cảnh Báo Về 'Làn Sóng Thất Bại' Ở Cardano Sau Khi TapTools Đóng Cửa

Charles Hoskinson, người sáng lập Cardano, đã cảnh báo về một "làn sóng thất bại" có thể xảy ra trong hệ sinh thái Cardano sau khi nền tảng phân tích dữ liệu TapTools thông báo sẽ ngừng hoạt động trong hai tuần tới. Nguyên nhân được nêu ra là do sự ra đi của nhiều lãnh đạo chủ chốt và mô hình kinh tế nền tảng gặp khó khăn. Trong buổi phát trực tiếp ngày 2/6, Hoskinson nhấn mạnh đây không phải là một thất bại riêng lẻ mà là triệu chứng của những vấn đề sâu xa hơn về tài trợ, phối hợp và động lực trong hệ sinh thái. Ông tiên đoán sẽ có thêm nhiều dự án gặp khó khăn trong nửa cuối năm nay, dẫn JPEG Store và TapTools làm ví dụ. Hoskinson cho biết ông đã đề xuất nhiều cơ chế để giải quyết vấn đề, chẳng hạn như quỹ đầu tư của Cardano hoặc mua lại chiến lược, nhưng các ý tưởng này không nhận được đủ sự ủng hộ hoặc bị chỉ trích là tập trung quyền lực. Ông bày tỏ thất vọng khi cơ chế quản trị hiện tại chưa tạo ra cách hiệu quả để sử dụng nguồn lực từ kho bạc nhằm hỗ trợ cơ sở hạ tầng thương mại. Đồng thời, Hoskinson phủ nhận việc ông có quyền kiểm soát đơn phương đối với Cardano, nói rằng ông không có khóa quản trị, không thể khởi xướng một hard fork, và không kiểm soát kho bạc hay thương hiệu. Ông kêu gọi cộng đồng bỏ phiếu (DReps và delegators) cần lựa chọn rõ ràng về lãnh đạo và tầm nhìn để thúc đẩy tăng trưởng, thậm chí đưa ra các lựa chọn cực đoan như cải cách hiến pháp hoặc khởi động một Cardano mới nếu cần thiết.

bitcoinist4 giờ trước

Hoskinson Cảnh Báo Về 'Làn Sóng Thất Bại' Ở Cardano Sau Khi TapTools Đóng Cửa

bitcoinist4 giờ trước

Đợt Tăng Giá Không Thành

Tình hình thị trường Bitcoin hiện tại cho thấy các dấu hiệu yếu kém rõ rệt sau đợt giảm giá gần đây. Giá đã giảm khoảng 13% xuống vùng 67.000 USD, phá vỡ dưới mức trung bình thị trường thực (True Market Mean) ở 77,8k USD, củng cố nhận định rằng thị trường gấu vẫn đang chiếm ưu thế. Phân tích on-chain cho thấy cấu trúc đang xấu đi. Giá hiện giao dịch gần điểm giữa của vùng giá trị thị trường gấu. Lợi nhuận thực tế từ các giao dịch đang bị áp đảo bởi các khoản lỗ, một mô hình thường thấy ở các đỉnh cục bộ trong thị trường gấu. Các nhà đầu tư mới mua ở vùng đỉnh gần 78k-82k USD đang chịu áp lực lớn, và hành động của họ sẽ quyết định liệu mức giá hiện tại có đủ sức hấp thụ áp lực bán hay không. Tổng lỗ thực tế hàng ngày đã tăng mạnh lên 1,35 tỷ USD, cho thấy cả nhà đầu tư dài hạn và ngắn hạn đều đang chốt lỗ. Về off-chain, dòng tiền từ ETF Mỹ đã chứng kiến ba tuần rút vốn liên tiếp, với áp lực bán gia tăng khi giá bị từ chối ở mức giá trung bình của các nhà đầu tư ETF (khoảng 83k USD). Lực mua trên thị trường giao ngay (spot) đã biến mất, và một sự kiện thanh lý lớn đã xóa sổ hơn 400 triệu USD vị thế mua ký quỹ. Thị trường quyền chọn phản ánh tâm lý thận trọng, với nhu cầu bảo vệ trước rủi ro giảm giá (put options) vẫn ở mức cao và phí biến động (volatility premium) gần mức cao nhất trong ba tháng. Tóm lại, thị trường Bitcoin đang trong vị thế mong manh với áp lực bán từ nhiều phía. Một sự phục hồi bền vững cần có sự trở lại của lực mua giao ngay mạnh mẽ, việc giá vượt lại mức trung bình của ETF, và dấu hiệu áp lực bán giảm bớt. Cho đến khi đó, rủi ro tiếp tục điều chỉnh hoặc củng cố trong cấu trúc thị trường gấu vẫn còn hiện hữu.

insights.glassnode5 giờ trước

Đợt Tăng Giá Không Thành

insights.glassnode5 giờ trước

WLFI Cảnh Báo: Ví Bị Trừng Phạt Có Thể Kích Hoạt Khóa Chuyển Giao Tiền Mã Hóa

Thượng nghị sĩ Elizabeth Warren và Jack Reed đã theo dõi sát World Liberty Financial (WLFI) trước cả thông báo tuân thủ hôm thứ Ba, kêu gọi giới chức Mỹ năm ngoái rà soát việc các địa chỉ ví liên quan đến Nga, Triều Tiên và dịch vụ trộn tiền Tornado Cash bị cấm có vượt qua được quy trình sàng lọc từ đợt bán trước của dự án hay không. WLFI bác bỏ cáo buộc, nói rằng họ áp dụng các biện pháp chống rửa tiền và xác minh danh tính nghiêm ngặt. Tuy nhiên, dự án thừa nhận hợp đồng thông minh của họ có quyền đóng băng, hạn chế hoặc đốt số dư ví, điều này làm dấy lên sự giám sát mới về tính phi tập trung mà họ từng quảng bá. Thông báo tuân thủ đăng trên X hôm thứ Ba nói rõ rằng WLFI, dự án tiền mã hóa có liên quan đến cựu Tổng thống Donald Trump, cảnh báo các giao dịch liên quan đến các cá nhân, tổ chức hoặc địa chỉ ví bị trừng phạt có thể bị trì hoãn, hạn chế hoặc từ chối. Các biện pháp kiểm soát này nhằm đáp ứng yêu cầu quy định về các giao dịch bị cấm. Cảnh báo được đưa ra cùng ngày Bộ Tài chính Mỹ trừng phạt một số nền tảng tiền mã hóa của Iran, bao gồm sàn giao dịch lớn nhất Nobitex. Bộ trưởng Tài chính Bessent cho biết các nền tảng này đã xử lý giao dịch cho Lực lượng Vệ binh Cách mạng Hồi giáo Iran. WLFI khuyến cáo người dùng kiểm tra kỹ nguồn tiền và địa chỉ ví không có liên quan đến hoạt động bị cấm trước khi chuyển tiền. Tư thế tuân thủ này tạo ra một số mâu thuẫn với hình ảnh phi tập trung (DeFi) mà dự án từng thể hiện, khi lớp ứng dụng vẫn phải tuân theo các quy định liên bang.

bitcoinist5 giờ trước

WLFI Cảnh Báo: Ví Bị Trừng Phạt Có Thể Kích Hoạt Khóa Chuyển Giao Tiền Mã Hóa

bitcoinist5 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片