DeepSeek V4 chính thức ra mắt, phá vỡ thế độc quyền của mã nguồn đóng mạnh nhất, công khai hợp tác với chip Huawei

marsbitXuất bản vào 2026-04-24Cập nhật gần nhất vào 2026-04-24

Tóm tắt

DeepSeek vừa chính thức ra mắt phiên bản DeepSeek-V4 với hai phiên bản: Pro và Flash. V4-Pro có 1,6 nghìn tỷ tham số và 49 tỷ tham số kích hoạt, được đánh giá ngang hàng với các mô hình nguồn đóng hàng đầu về khả năng Agent, kiến thức thế giới và suy luận. Trong khi đó, V4-Flash là phiên bản nhẹ hơn, phù hợp cho các tác vụ đơn giản và có chi phí API thấp hơn. Cả hai phiên bản đều hỗ trợ ngữ cảnh dài 1 triệu token, một tính năng trước đây chỉ có trên Gemini. DeepSeek cũng công bố sẽ hỗ trợ chip Huawei từ nửa cuối năm nay. Mô hình đã được open-source và có sẵn trên Hugging Face và ModelScope. API cập nhật đồng thời, hỗ trợ cả giao thức OpenAI và Anthropic.

Vừa qua, DeepSeek-V4 đã chính thức xuất hiện!

Phiên bản xem trước chính thức lên sóng và đồng thời mã nguồn mở.

Tổng cộng có hai phiên bản:

DeepSeek-V4-Pro: Đối đầu với các mô hình mã nguồn đóng hàng đầu, 1.6T, 49B kích hoạt, độ dài ngữ cảnh 1M;

DeepSeek-V4-Flash: Phiên bản kinh tế nhỏ hơn và nhanh hơn, 284B, 13B kích hoạt, độ dài ngữ cảnh 1M.

Lời nói chính thức từ nhà phát triển là: Về khả năng Agent, kiến thức thế giới và hiệu suất suy luận đều đạt được vị trí dẫn đầu trong nước và lĩnh vực mã nguồn mở.

Và:

Hiện tại DeepSeek-V4 đã trở thành mô hình Agentic Coding được nhân viên nội bộ sử dụng, theo đánh giá phản hồi trải nghiệm sử dụng tốt hơn Sonnet 4.5, chất lượng giao hàng gần với Opus 4.6 chế độ không suy nghĩ. Nhưng vẫn còn khoảng cách nhất định so với mô hình suy nghĩ Opus 4.6.

Hiện tại cả trang web chính thức và APP đều đã cập nhật, dịch vụ API cũng đã đồng bộ hóa.

Về khả năng tính toán trong nước mà mọi người quan tâm, điểm nhấn là nửa cuối năm sẽ hỗ trợ khả năng tính toán của Huawei.

Lựa chọn cao cấp và tiết kiệm, hai phiên bản cùng ra mắt

Lần này V4 một lúc ra mắt hai phiên bản.

V4-Pro, hiệu suất ngang bằng với các mô hình mã nguồn đóng hàng đầu.

Nhà phát triển đưa ra ba đánh giá:

Khả năng Agent được cải thiện mạnh mẽ: Trong đánh giá Agentic Coding, V4-Pro đã đạt đến trình độ tốt nhất của các mô hình mã nguồn mở hiện tại, và cũng thể hiện xuất sắc trong các đánh giá liên quan đến Agent khác. Trong đánh giá nội bộ, ở chế độ Agent Coding, trải nghiệm V4 tốt hơn Sonnet 4.5, chất lượng giao hàng gần với Opus 4.6 chế độ không suy nghĩ, nhưng vẫn còn khoảng cách so với chế độ suy nghĩ Opus 4.6.

Kiến thức thế giới phong phú: Trong đánh giá kiến thức thế giới, DeepSeek-V4-Pro vượt xa các mô hình mã nguồn mở khác, chỉ kém hơn một chút so với mô hình mã nguồn đóng đỉnh cao Gemini-Pro-3.1.

Hiệu suất suy luận đỉnh cao thế giới: Trong các đánh giá về toán học, STEM, mã thi đấu, DeepSeek-V4-Pro vượt qua tất cả các mô hình mã nguồn mở đã công bố đánh giá hiện tại, đạt được thành tích ngang bằng với các mô hình mã nguồn đóng hàng đầu thế giới.

V4-Flash, phiên bản kinh tế nhỏ hơn và nhanh hơn. Khả năng suy luận gần với Pro, kiến thức thế giới hơi kém hơn, nhưng tham số và kích hoạt nhỏ hơn, API rẻ hơn.

Về nhiệm vụ Agent, DeepSeek-V4-Flash ngang ngửa với DeepSeek-V4-Pro trong nhiệm vụ đơn giản, nhưng vẫn có khoảng cách trong nhiệm vụ khó cao.

Trong bài kiểm tra rửa xe, V4 cũng vượt qua nhanh chóng.

Trong khi đó, trong tình huống sinh học kinh điển "người cha tuyệt vọng", DeepSeek-V4 không nhận ra ngay điểm mấu chốt về mù màu đỏ-xanh lá (theo quy luật di truyền, nếu một phụ nữ bị mù màu đỏ-xanh lá, cha ruột của cô ấy chắc chắn cũng bị).

Triệu ngữ cảnh trở thành tiêu chuẩn

Đáng chú ý là, từ hôm nay, 1M ngữ cảnh là tiêu chuẩn cho tất cả dịch vụ chính thức của DeepSeek.

Một năm trước, 1M ngữ cảnh vẫn là lá bài độc quyền của Gemini; tất cả các mô hình mã nguồn đóng khác chỉ 128K hoặc 200K; phía mã nguồn mở hầu như không ai chơi được ở cấp độ này.

DeepSeek trực tiếp biến triệu ngữ cảnh từ một "tính năng cao cấp" thành "cơ sở hạ tầng".

Và mã nguồn mở. Họ làm được như thế nào, trong bản phát hành đã trực tiếp đưa ra câu trả lời——

V4 tạo ra một cơ chế chú ý hoàn toàn mới, nén ở chiều token, kết hợp với sự chú ý thưa DSA. So với phương pháp truyền thống, nhu cầu tính toán và bộ nhớ giảm mạnh.

DSA không phải từ mới. Nửa năm trước, bản cập nhật V3.2-Exp lần đầu tiên giới thiệu, lúc đó sự chú ý bên ngoài không cao, vì điểm chạy và V3.1-Terminus gần như giống nhau, trông giống như một phiên bản trung gian không có gì mới.

Giờ nhìn lại, đó là nền móng của V4.

Tối ưu hóa chuyên sâu khả năng Agent

Về phía Agent, V4 đã điều chỉnh và tối ưu hóa cho các sản phẩm Agent chủ lưu như Claude Code, OpenClaw, OpenCode, CodeBuddy, nhiệm vụ mã và nhiệm vụ tạo tài liệu đều được cải thiện.

Bản phát hành còn kèm theo một ví dụ trang PPT được tạo bởi V4-Pro trong một khung Agent.

Giá API

Về phía API, V4-Pro và V4-Flash đồng bộ lên sóng, hỗ trợ hai giao diện OpenAI ChatCompletions và Anthropic.

base_url không đổi, tham số model đổi thành deepseek-v4-pro hoặc deepseek-v4-flash để gọi.

Cả hai phiên bản đều có ngữ cảnh tối đa 1M, đều hỗ trợ đồng thời chế độ không suy nghĩ và chế độ suy nghĩ. Ở chế độ suy nghĩ, có thể điều chỉnh cường độ qua tham số reasoning_effort, hai mức high và max. Nhà phát triển khuyến nghị các tình huống Agent phức tạp nên dùng max.

Có một điểm nhấn ở đây——nửa cuối năm hỗ trợ khả năng tính toán của Huawei.

Ngoài ra, tên mô hình cũ sẽ ngừng hoạt động.

deepseek-chat và deepseek-reasoner sẽ ngừng hoạt động sau ba tháng (24/7/2026), trong giai đoạn hiện tại hai tên này lần lượt trỏ đến chế độ không suy nghĩ và suy nghĩ của V4-Flash.

Ảnh hưởng không lớn với nhà phát triển cá nhân, chỉ cần đổi một tham số model. Các công ty đã kết nối môi trường sản xuất, trong ba tháng này cần di chuyển.

One more thing

Cuối bản phát hành, DeepSeek tự trích dẫn một câu.

「不诱于誉,不恐于诽,率道而行,端然正己。」

Đây là một câu trong "Phi Thập Nhị Tử" của Tuân Tử. Nghĩa đen là, không bị dụ dỗ bởi danh tiếng, không sợ hãi bởi phỉ báng, đi theo con đường mình nhận định, ngay thẳng chính mình.

Đặt trong bối cảnh hôm nay, khá thú vị.

Nửa năm qua, những tin đồn về việc V4 khi nào ra mắt, có phải hoãn, có phải đã bị nhà khác vượt qua, có phải đã bị Claude chưng cất dữ liệu giải quyết... chạy đi chạy lại vài vòng trong cộng đồng AI tiếng Trung và tiếng Anh. Đầu năm thậm chí còn có người khẳng định V4 sẽ ra trước Tết, nhưng cuối cùng đợi đến cuối tháng tư.

Họ không phản hồi lần nào.

Vào một chiều thứ Sáu, đưa V4 ra, đồng bộ mã nguồn mở, đồng bộ lên trang chính thức và App, đồng bộ cập nhật API, tiện thể viết vào bản phát hành sự thật nhân viên nội bộ đã ngừng dùng Claude.

Không có lộ trình, không livestream, không phỏng vấn.

Bốn chữ "率道而行" (suất đạo nhi hành), nghe như một khẩu hiệu. Nhưng nếu bạn đặt cùng nhau phiên bản Exp "không có điểm nhấn" của V3.2 nửa năm trước, bộ chú ý thưa DSA đã chuẩn bị nền móng cho V4 nửa năm, con đường biến triệu ngữ cảnh từ lá bài thành tiêu chuẩn.

DeepSeek đã làm được.

Liên kết mã nguồn mở mô hình DeepSeek-V4:

[1]https://huggingface.co/collections/deepseek-ai/deepseek-v4

[2]https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4

Báo cáo kỹ thuật DeepSeek-V4: https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

Bài viết từ tài khoản công chúng WeChat "量子位", tác giả: 量子位

Câu hỏi Liên quan

QDeepSeek V4 có những phiên bản nào và thông số kỹ thuật của chúng là gì?

ADeepSeek V4 có hai phiên bản: DeepSeek-V4-Pro với 1.6T tham số, 49B kích hoạt và độ dài ngữ cảnh 1M; DeepSeek-V4-Flash với 284B tham số, 13B kích hoạt và độ dài ngữ cảnh 1M.

QDeepSeek V4 có những cải tiến nổi bật nào so với các mô hình trước?

ADeepSeek V4 cải thiện đáng kể khả năng Agent, kiến thức thế giới và hiệu suất suy luận. Nó hỗ trợ ngữ cảnh lên đến 1M token, sử dụng cơ chế chú ý mới DSA để giảm nhu cầu tính toán và bộ nhớ.

QDeepSeek V4 có hỗ trợ phần cứng của Huawei không?

ACó, DeepSeek thông báo sẽ hỗ trợ phần cứng Huawei (Huawei compute) vào nửa cuối năm 2026.

QAPI của DeepSeek V4 có những tính năng nào?

AAPI của DeepSeek V4 hỗ trợ cả hai giao diện OpenAI ChatCompletions và Anthropic, với độ dài ngữ cảnh 1M, chế độ không suy nghĩ và chế độ suy nghĩ với tham số reasoning_effort điều chỉnh cường độ.

QDeepSeek V4 đã được đánh giá so với các mô hình đóng như thế nào?

ATheo đánh giá nội bộ, DeepSeek-V4-Pro có trải nghiệm sử dụng tốt hơn Sonnet 4.5, chất lượng gần với Opus 4.6 chế độ không suy nghĩ, nhưng vẫn còn khoảng cách so với Opus 4.6 chế độ suy nghĩ.

Nội dung Liên quan

Cục Tình báo TechFlow: Cổ phiếu chip mất nghìn tỷ USD trong một ngày, Bitcoin xuống dưới 60.000 USD, căng thẳng Mỹ-Iran leo thang

Tổng quan thị trường ngày 6 tháng 6 ghi nhận đợt bán tháo mạnh trên nhiều lĩnh vực, chủ yếu do dữ liệu việc làm Mỹ (Nonfarm) tháng 5 vượt xa kỳ vọng, làm dấy lên lo ngại Cục Dự trữ Liên bang (Fed) có thể trì hoãn cắt giảm lãi suất hoặc thậm chí tăng lãi suất. Chỉ số Philadelphia Semiconductor (SOXX) lao dốc 10%, xóa sổ hơn 1 nghìn tỷ USD giá trị vốn hóa chỉ trong một ngày. Bitcoin cũng giảm xuống dưới mốc 60.000 USD, với chỉ số RSI chạm mức bán quá mức tương tự thời điểm sụp đổ do đại dịch Covid-19 năm 2020. Trong lĩnh vực AI/Web3, Anthropic cảnh báo về khả năng AI tự cải tiến (RSI), trong khi cộng đồng tranh luận về chất lượng code do AI tạo ra sau sự cố với rsync. GitHub Copilot mở cửa cho các mô hình cục bộ, còn Ethereum vẫn bị chỉ trích về trải nghiệm thanh toán cho người dùng phổ thông. Căng thẳng địa chính trị leo thang khi Mỹ và Iran trao đổi các cuộc tấn công, với việc Mỹ đánh chặn tên lửa và không kích các trạm radar Iran, đe dọa làm gián đoạn nguồn cung dầu mỏ qua eo biển Hormuz. Bài viết chỉ ra mâu thuẫn sâu sắc: dữ liệu việc làm mạnh mẽ trái ngược với cảnh báo từ các CEO như Kraft hay McDonald's về việc người tiêu dùng Mỹ đang cạn kiệt tiền tiết kiệm. Sự kết hợp của áp lực lạm phát tiềm tàng từ giá dầu và tình hình chính sách tiền tệ thắt chặt đang khiến thị trường định giá lại triển vọng trong một môi trường vĩ mô đầy thách thức, nơi kịch bản "hạ cánh mềm" ngày càng khó xảy ra.

marsbit47 phút trước

Cục Tình báo TechFlow: Cổ phiếu chip mất nghìn tỷ USD trong một ngày, Bitcoin xuống dưới 60.000 USD, căng thẳng Mỹ-Iran leo thang

marsbit47 phút trước

Tôi mất một năm để nhìn ra sự thật đau lòng về thanh toán Agent

Trong một năm qua, tôi đã làm việc để xây dựng cơ sở hạ tầng cho nền kinh tế Agent, trao đổi với các công ty như Stripe, Visa, Coinbase, Google và nhiều startup. Kết luận chính: nhu cầu thực sự cho thanh toán Agent hiện chưa tồn tại, và các startup đối mặt với nhiều vấn đề cấu trúc. **Phân tích bốn lĩnh vực:** 1. **Agent với Người bán:** Trải nghiệm mua sắm qua chat thường kém hơn giao diện thương mại điện tử trực quan cho các mặt hàng như quần áo, điện tử. Nhu cầu từ người bán chủ yếu là phòng thủ (tối ưu hóa cho Agent - AEO), không phải thiết yếu. Cơ hội tồn tại ở giao dịch tần suất cao, quyết định nhanh (như gọi đồ ăn) hoặc cho các giao diện phức tạp, nhưng đòi hỏi kênh phân phối B2C quy mô lớn – lợi thế của các gã khổng lồ. 2. **Agent với API:** Các nhà phát triển đã có sẵn cơ chế thanh toán (thẻ tín dụng, nạp tiền trước) cho các API. Vấn đề sâu xa là mô hình kinh doanh của nhiều nhà cung cấp SaaS dựa trên hợp đồng doanh nghiệp dài hạn, không thích hợp cho giao dịch vi mô. Cơ hội nằm ở thị trường dài (long-tail) với các dịch vụ nhỏ, nhưng đây là thị trường ngách với người dùng sẵn sàng chi trả thấp. 3. **Agent với Agent:** Đây là tầm nhìn dài hạn, hiện chủ yếu là lý thuyết, chưa có khối lượng giao dịch đáng kể. Kịch bản này sẽ yêu cầu cơ sở hạ tầng thanh toán chuyên biệt cho các giao dịch tốc độ cao, khác biệt với các mô hình hiện có, nhưng là một lĩnh vực đáng đầu tư lâu dài. 4. **Agent với Tài chính:** Đây là lĩnh vực duy nhất có nhu cầu hiện tại rõ ràng, từ các quỹ, nhóm tài chính và người dùng DeFi. AI có thể nâng cao đáng kể khả năng, tạo ra các hành vi mới. Thách thức chính là cạnh tranh với các định chế tài chính lớn đã có giấy phép, quan hệ khách hàng và cơ sở hạ tầng. **Điểm mấu chốt thực sự:** Lý do các công ty vẫn xây dựng là: 1) Các gã khổng lồ có dòng tiền để đặt cược phòng thủ cho tương lai, và 2) Có sự thiên kiến nhận định vấn đề là vấn đề thanh toán. Tuy nhiên, thanh toán chỉ là một phần của vấn đề lớn hơn: **Sự phối hợp (Orchestration)** – điều phối công việc giữa Agent và con người, xác minh kết quả và quyết toán. Thanh toán sẽ nảy sinh từ nhu cầu phối hợp quy mô lớn. Các công ty giải quyết được bài toán phối hợp sẽ chiếm lĩnh thị trường, không phải ngược lại. Khác với các tập đoàn lớn, các startup không có thời gian chờ đợi và cần tìm kiếm thị trường thực sự đang hoạt động và tăng trưởng – một thị trường nằm ngoài bốn danh mục phân tích trên.

marsbit1 giờ trước

Tôi mất một năm để nhìn ra sự thật đau lòng về thanh toán Agent

marsbit1 giờ trước

Tôi mất một năm mới nhận ra sự thật trần trụi về thanh toán Agent

Tác giả, với một năm kinh nghiệm xây dựng cơ sở hạ tầng cho nền kinh tế Agent, chia sẻ những nhận thức thực tế về thị trường thanh toán Agent hiện nay. **Hiện trạng & Thách thức:** - **Nhu cầu thực tế còn hạn chế:** Dữ liệu từ Stripe, Visa, Coinbase cho thấy khối lượng giao dịch Agent thực sự rất thấp, dù có nhiều quan tâm. Các rào cầu pháp lý (như KYC kéo dài, ngưỡng doanh thu cao từ Visa) khiến chỉ các tập đoàn lớn như Amazon mới có thể triển khai. - **Agent vs Người bán (B2C):** Trải nghiệm mua sắm qua chat kém hiệu quả với các mặt hàng cần so sánh trực quan (quần áo, đồ điện tử). Nhu cầu từ người bán hiện chủ yếu mang tính phòng thủ ("tối ưu hóa cho Agent - AEO") chứ không phải từ làn sóng người dùng thực sự. Các điểm sáng như đặt đồ ăn lại bị cản trở bởi thiếu API mở từ các nền tảng lớn và chi phí vận hành cao. - **Agent vs API (B2B):** Nhu cầu thanh toán vi mô cho API tồn tại nhưng khó mở rộng vì mô hình kinh doanh của nhiều nhà cung cấp SaaS dựa vào hợp đồng doanh nghiệp dài hạn. Các giao thức như MPP, x402 phù hợp với thị trường ngách nhưng quy mô nhỏ. - **Agent vs Agent:** Vẫn là tầm nhìn dài hạn, chưa có khối lượng giao dịch đáng kể. Nếu phát triển, nó sẽ cần cơ sở hạ tầng thanh toán chuyên biệt với tốc độ cao, độ trễ thấp. - **Agent vs Tài chính:** Đây có lẽ là lĩnh vực có nhu cầu hiện tại rõ ràng nhất, với người dùng sẵn sàng trả phí (quản lý quỹ, DeFi). Tuy nhiên, thị trường bị chi phối bởi các định chế lâu năm với lợi thế về giấy phép và quan hệ khách hàng. **Điểm mấu chốt thực sự:** Lý do nhiều công ty vẫn xây dựng là: 1) Động cơ phòng thủ của các gã khổng lồ (họ có đủ nguồn lực để đặt cược vào tương lai), và 2) Tư duy thiên lệch khi nhìn mọi vấn đề qua lăng kính "thanh toán". Tuy nhiên, vấn đề cốt lõi không phải là **thanh toán**, mà là **sự phối hợp (coordination)** giữa Agent và con người - bao gồm xác thực công việc, xử lý kết quả và sau đó mới là thanh toán. Thanh toán chỉ là một phần của giải pháp phối hợp. Các công ty giải quyết được bài toán phối hợp quy mô lớn sẽ chiếm lĩnh thị trường. Đối với startup, cần tìm kiếm thị trường thực sự đang hoạt động và tăng trưởng thay vì chờ đợi làn sóng tương lai.

链捕手1 giờ trước

Tôi mất một năm mới nhận ra sự thật trần trụi về thanh toán Agent

链捕手1 giờ trước

Claude Opus 4.8 Tìm Thấy Lỗ Hổng 4.5 Tỷ Đô La, Thời Đại AI Đang Sản Xuất Hàng Loạt Tin Tặc

Một nhà nghiên cứu đã sử dụng Claude Opus 4.8 để tìm ra lỗ hổng nghiêm trọng trong giao thức Orchard của Zcash, cho phép tạo token không giới hạn, làm bay hơi 45 tỷ USD vốn hóa thị trường chỉ sau thông báo chính thức. Sự việc cho thấy AI đang hạ thấp đáng kể ngưỡng phát hiện lỗ hổng, biến nó từ công việc của chuyên gia thành khả năng phổ cập. Điều đáng lo ngại không phải là mô hình mạnh nhất (như Claude Mythos), mà là những mô hình đủ mạnh, rẻ và phổ biến như Opus. Chúng cho phép cả người bảo vệ lẫn kẻ tấn công nhanh chóng hiểu hệ thống, dẫn đến hai hệ quả: một là tràn ngập báo cáo lỗi chất lượng thấp do AI tạo ra, làm kiệt quệ đội ngũ bảo trì mã nguồn mở; hai là các lỗ hổng ẩn sâu trước đây bị phát hiện với tốc độ chóng mặt. An ninh mạng vốn dựa vào một chuỗi hợp tác con người dài và mong manh để duy trì trải nghiệm "bình thường" cho người dùng. Tuy nhiên, khi AI làm gia tăng theo cấp số nhân cả lỗ hổng lẫn báo cáo, lực lượng phòng thủ vốn đã thiếu hụt nhân lực trầm trọng (khắp toàn cầu thiếu khoảng 4.8 triệu người) lại càng thêm quá tải. Chi phí phát hiện lỗi giảm, nhưng chi phí sửa chữa, phán đoán và phối hợp vẫn cao như cũ. Kỷ nguyên AI không phá hủy internet, mà giống như bật đèn sáng, cho chúng ta thấy sự thật: sự an toàn kỹ thuật số mà chúng ta hưởng thụ là thành quả của việc liên tục đè nén rủi ro bởi con người. Thứ đắt đỏ và khan hiếm thực sự bây giờ không phải là tìm ra lỗi, mà là có còn đủ người sẵn sàng sửa chữa chúng hay không.

marsbit2 giờ trước

Claude Opus 4.8 Tìm Thấy Lỗ Hổng 4.5 Tỷ Đô La, Thời Đại AI Đang Sản Xuất Hàng Loạt Tin Tặc

marsbit2 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片