DeepSeek V4 chính thức ra mắt, phá vỡ thế độc quyền của mã nguồn đóng mạnh nhất, công khai hợp tác với chip Huawei

marsbitXuất bản vào 2026-04-24Cập nhật gần nhất vào 2026-04-24

Tóm tắt

DeepSeek vừa chính thức ra mắt phiên bản DeepSeek-V4 với hai phiên bản: Pro và Flash. V4-Pro có 1,6 nghìn tỷ tham số và 49 tỷ tham số kích hoạt, được đánh giá ngang hàng với các mô hình nguồn đóng hàng đầu về khả năng Agent, kiến thức thế giới và suy luận. Trong khi đó, V4-Flash là phiên bản nhẹ hơn, phù hợp cho các tác vụ đơn giản và có chi phí API thấp hơn. Cả hai phiên bản đều hỗ trợ ngữ cảnh dài 1 triệu token, một tính năng trước đây chỉ có trên Gemini. DeepSeek cũng công bố sẽ hỗ trợ chip Huawei từ nửa cuối năm nay. Mô hình đã được open-source và có sẵn trên Hugging Face và ModelScope. API cập nhật đồng thời, hỗ trợ cả giao thức OpenAI và Anthropic.

Vừa qua, DeepSeek-V4 đã chính thức xuất hiện!

Phiên bản xem trước chính thức lên sóng và đồng thời mã nguồn mở.

Tổng cộng có hai phiên bản:

DeepSeek-V4-Pro: Đối đầu với các mô hình mã nguồn đóng hàng đầu, 1.6T, 49B kích hoạt, độ dài ngữ cảnh 1M;

DeepSeek-V4-Flash: Phiên bản kinh tế nhỏ hơn và nhanh hơn, 284B, 13B kích hoạt, độ dài ngữ cảnh 1M.

Lời nói chính thức từ nhà phát triển là: Về khả năng Agent, kiến thức thế giới và hiệu suất suy luận đều đạt được vị trí dẫn đầu trong nước và lĩnh vực mã nguồn mở.

Và:

Hiện tại DeepSeek-V4 đã trở thành mô hình Agentic Coding được nhân viên nội bộ sử dụng, theo đánh giá phản hồi trải nghiệm sử dụng tốt hơn Sonnet 4.5, chất lượng giao hàng gần với Opus 4.6 chế độ không suy nghĩ. Nhưng vẫn còn khoảng cách nhất định so với mô hình suy nghĩ Opus 4.6.

Hiện tại cả trang web chính thức và APP đều đã cập nhật, dịch vụ API cũng đã đồng bộ hóa.

Về khả năng tính toán trong nước mà mọi người quan tâm, điểm nhấn là nửa cuối năm sẽ hỗ trợ khả năng tính toán của Huawei.

Lựa chọn cao cấp và tiết kiệm, hai phiên bản cùng ra mắt

Lần này V4 một lúc ra mắt hai phiên bản.

V4-Pro, hiệu suất ngang bằng với các mô hình mã nguồn đóng hàng đầu.

Nhà phát triển đưa ra ba đánh giá:

Khả năng Agent được cải thiện mạnh mẽ: Trong đánh giá Agentic Coding, V4-Pro đã đạt đến trình độ tốt nhất của các mô hình mã nguồn mở hiện tại, và cũng thể hiện xuất sắc trong các đánh giá liên quan đến Agent khác. Trong đánh giá nội bộ, ở chế độ Agent Coding, trải nghiệm V4 tốt hơn Sonnet 4.5, chất lượng giao hàng gần với Opus 4.6 chế độ không suy nghĩ, nhưng vẫn còn khoảng cách so với chế độ suy nghĩ Opus 4.6.

Kiến thức thế giới phong phú: Trong đánh giá kiến thức thế giới, DeepSeek-V4-Pro vượt xa các mô hình mã nguồn mở khác, chỉ kém hơn một chút so với mô hình mã nguồn đóng đỉnh cao Gemini-Pro-3.1.

Hiệu suất suy luận đỉnh cao thế giới: Trong các đánh giá về toán học, STEM, mã thi đấu, DeepSeek-V4-Pro vượt qua tất cả các mô hình mã nguồn mở đã công bố đánh giá hiện tại, đạt được thành tích ngang bằng với các mô hình mã nguồn đóng hàng đầu thế giới.

V4-Flash, phiên bản kinh tế nhỏ hơn và nhanh hơn. Khả năng suy luận gần với Pro, kiến thức thế giới hơi kém hơn, nhưng tham số và kích hoạt nhỏ hơn, API rẻ hơn.

Về nhiệm vụ Agent, DeepSeek-V4-Flash ngang ngửa với DeepSeek-V4-Pro trong nhiệm vụ đơn giản, nhưng vẫn có khoảng cách trong nhiệm vụ khó cao.

Trong bài kiểm tra rửa xe, V4 cũng vượt qua nhanh chóng.

Trong khi đó, trong tình huống sinh học kinh điển "người cha tuyệt vọng", DeepSeek-V4 không nhận ra ngay điểm mấu chốt về mù màu đỏ-xanh lá (theo quy luật di truyền, nếu một phụ nữ bị mù màu đỏ-xanh lá, cha ruột của cô ấy chắc chắn cũng bị).

Triệu ngữ cảnh trở thành tiêu chuẩn

Đáng chú ý là, từ hôm nay, 1M ngữ cảnh là tiêu chuẩn cho tất cả dịch vụ chính thức của DeepSeek.

Một năm trước, 1M ngữ cảnh vẫn là lá bài độc quyền của Gemini; tất cả các mô hình mã nguồn đóng khác chỉ 128K hoặc 200K; phía mã nguồn mở hầu như không ai chơi được ở cấp độ này.

DeepSeek trực tiếp biến triệu ngữ cảnh từ một "tính năng cao cấp" thành "cơ sở hạ tầng".

Và mã nguồn mở. Họ làm được như thế nào, trong bản phát hành đã trực tiếp đưa ra câu trả lời——

V4 tạo ra một cơ chế chú ý hoàn toàn mới, nén ở chiều token, kết hợp với sự chú ý thưa DSA. So với phương pháp truyền thống, nhu cầu tính toán và bộ nhớ giảm mạnh.

DSA không phải từ mới. Nửa năm trước, bản cập nhật V3.2-Exp lần đầu tiên giới thiệu, lúc đó sự chú ý bên ngoài không cao, vì điểm chạy và V3.1-Terminus gần như giống nhau, trông giống như một phiên bản trung gian không có gì mới.

Giờ nhìn lại, đó là nền móng của V4.

Tối ưu hóa chuyên sâu khả năng Agent

Về phía Agent, V4 đã điều chỉnh và tối ưu hóa cho các sản phẩm Agent chủ lưu như Claude Code, OpenClaw, OpenCode, CodeBuddy, nhiệm vụ mã và nhiệm vụ tạo tài liệu đều được cải thiện.

Bản phát hành còn kèm theo một ví dụ trang PPT được tạo bởi V4-Pro trong một khung Agent.

Giá API

Về phía API, V4-Pro và V4-Flash đồng bộ lên sóng, hỗ trợ hai giao diện OpenAI ChatCompletions và Anthropic.

base_url không đổi, tham số model đổi thành deepseek-v4-pro hoặc deepseek-v4-flash để gọi.

Cả hai phiên bản đều có ngữ cảnh tối đa 1M, đều hỗ trợ đồng thời chế độ không suy nghĩ và chế độ suy nghĩ. Ở chế độ suy nghĩ, có thể điều chỉnh cường độ qua tham số reasoning_effort, hai mức high và max. Nhà phát triển khuyến nghị các tình huống Agent phức tạp nên dùng max.

Có một điểm nhấn ở đây——nửa cuối năm hỗ trợ khả năng tính toán của Huawei.

Ngoài ra, tên mô hình cũ sẽ ngừng hoạt động.

deepseek-chat và deepseek-reasoner sẽ ngừng hoạt động sau ba tháng (24/7/2026), trong giai đoạn hiện tại hai tên này lần lượt trỏ đến chế độ không suy nghĩ và suy nghĩ của V4-Flash.

Ảnh hưởng không lớn với nhà phát triển cá nhân, chỉ cần đổi một tham số model. Các công ty đã kết nối môi trường sản xuất, trong ba tháng này cần di chuyển.

One more thing

Cuối bản phát hành, DeepSeek tự trích dẫn một câu.

「不诱于誉,不恐于诽,率道而行,端然正己。」

Đây là một câu trong "Phi Thập Nhị Tử" của Tuân Tử. Nghĩa đen là, không bị dụ dỗ bởi danh tiếng, không sợ hãi bởi phỉ báng, đi theo con đường mình nhận định, ngay thẳng chính mình.

Đặt trong bối cảnh hôm nay, khá thú vị.

Nửa năm qua, những tin đồn về việc V4 khi nào ra mắt, có phải hoãn, có phải đã bị nhà khác vượt qua, có phải đã bị Claude chưng cất dữ liệu giải quyết... chạy đi chạy lại vài vòng trong cộng đồng AI tiếng Trung và tiếng Anh. Đầu năm thậm chí còn có người khẳng định V4 sẽ ra trước Tết, nhưng cuối cùng đợi đến cuối tháng tư.

Họ không phản hồi lần nào.

Vào một chiều thứ Sáu, đưa V4 ra, đồng bộ mã nguồn mở, đồng bộ lên trang chính thức và App, đồng bộ cập nhật API, tiện thể viết vào bản phát hành sự thật nhân viên nội bộ đã ngừng dùng Claude.

Không có lộ trình, không livestream, không phỏng vấn.

Bốn chữ "率道而行" (suất đạo nhi hành), nghe như một khẩu hiệu. Nhưng nếu bạn đặt cùng nhau phiên bản Exp "không có điểm nhấn" của V3.2 nửa năm trước, bộ chú ý thưa DSA đã chuẩn bị nền móng cho V4 nửa năm, con đường biến triệu ngữ cảnh từ lá bài thành tiêu chuẩn.

DeepSeek đã làm được.

Liên kết mã nguồn mở mô hình DeepSeek-V4:

[1]https://huggingface.co/collections/deepseek-ai/deepseek-v4

[2]https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4

Báo cáo kỹ thuật DeepSeek-V4: https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

Bài viết từ tài khoản công chúng WeChat "量子位", tác giả: 量子位

Câu hỏi Liên quan

QDeepSeek V4 có những phiên bản nào và thông số kỹ thuật của chúng là gì?

ADeepSeek V4 có hai phiên bản: DeepSeek-V4-Pro với 1.6T tham số, 49B kích hoạt và độ dài ngữ cảnh 1M; DeepSeek-V4-Flash với 284B tham số, 13B kích hoạt và độ dài ngữ cảnh 1M.

QDeepSeek V4 có những cải tiến nổi bật nào so với các mô hình trước?

ADeepSeek V4 cải thiện đáng kể khả năng Agent, kiến thức thế giới và hiệu suất suy luận. Nó hỗ trợ ngữ cảnh lên đến 1M token, sử dụng cơ chế chú ý mới DSA để giảm nhu cầu tính toán và bộ nhớ.

QDeepSeek V4 có hỗ trợ phần cứng của Huawei không?

ACó, DeepSeek thông báo sẽ hỗ trợ phần cứng Huawei (Huawei compute) vào nửa cuối năm 2026.

QAPI của DeepSeek V4 có những tính năng nào?

AAPI của DeepSeek V4 hỗ trợ cả hai giao diện OpenAI ChatCompletions và Anthropic, với độ dài ngữ cảnh 1M, chế độ không suy nghĩ và chế độ suy nghĩ với tham số reasoning_effort điều chỉnh cường độ.

QDeepSeek V4 đã được đánh giá so với các mô hình đóng như thế nào?

ATheo đánh giá nội bộ, DeepSeek-V4-Pro có trải nghiệm sử dụng tốt hơn Sonnet 4.5, chất lượng gần với Opus 4.6 chế độ không suy nghĩ, nhưng vẫn còn khoảng cách so với Opus 4.6 chế độ suy nghĩ.

Nội dung Liên quan

Từ Madison Square Garden đến Kalshi: Thị trường dự đoán xông vào Chung kết NBA

Bài viết đề cập đến sự xuất hiện ngày càng phổ biến của các thị trường dự đoán (prediction markets) trong loạt trận chung kết NBA 2026 giữa New York Knicks và San Antonio Spurs, đặc biệt là ở thành phố New York. Hai nền tảng chính được nhắc đến là Polymarket và Kalshi, với khối lượng giao dịch hàng trăm triệu USD xoay quanh kết quả chung kết và các sự kiện liên quan. Điểm nổi bật là sự thâm nhập của các thị trường này vào đời sống thực tế. Họ đã hợp tác chính thức với nhà thi đấu Madison Square Garden, mang lại sự tiếp cận rộng rãi. Một quán bar tên The Jeffrey đã sử dụng hợp đồng trên Kalshi để bảo hiểm cho chương trình khuyến mãi "miễn phí hóa đơn nếu Knicks thắng", minh họa cách các doanh nghiệp nhỏ có thể dùng công cụ này để quản lý rủi ro. Bài viết so sánh thị trường dự đoán với cá cược thể thao truyền thống. Chúng cho phép người tham gia đặt cược vào nhiều sự kiện giải trí đa dạng hơn (như sự xuất hiện của người nổi tiếng), có phạm vi tiếp cận địa lý rộng hơn và độ tuổi tham gia thấp hơn (từ 18 tuổi). Tuy nhiên, điều này cũng gây tranh cãi về ranh giới giữa giao dịch tài chính và cờ bạc. NBA có thái độ thận trọng. Trong khi siêu sao như "Giannis Antetokounmpo" đã đầu tư vào Kalshi, gây lo ngại về xung đột lợi ích, thì ban lãnh đạo NBA lại nhấn mạnh sự cần thiết của khung quy định chặt chẽ để bảo vệ tính toàn vẹn của trận đấu. Nhiều cổ động viên bày tỏ lo ngại rằng sự liên kết sâu rộng giữa liên đoàn với các nền tảng này có thể làm suy giảm độ tin cậy của các trận đấu. Chung kết NBA năm nay đang trở thành một phép thử quan trọng cho sự hội nhập của thị trường dự đoán vào thể thao chính thống, vừa mở ra cơ hội thương mại mới, vừa đặt ra những thách thức về niềm tin và quản lý.

marsbit56 phút trước

Từ Madison Square Garden đến Kalshi: Thị trường dự đoán xông vào Chung kết NBA

marsbit56 phút trước

RSI - Khi AI tự xây dựng chính mình đang nổi lên, Google dội nước lạnh, DeepSeek đã chạm đến mép giới hạn

Gần đây, thuật ngữ "RSI" (Recursive Self-Improvement – Tự cải tiến đệ quy) đang trở thành tâm điểm chú ý trong ngành AI. Khái niệm này đề cập đến việc để AI tự huấn luyện và cải thiện chính mình, hướng tới một hệ thống có thể tự động hóa toàn bộ quá trình nghiên cứu và phát triển, từ đó tạo ra sự tiến bộ vượt bậc. Một số công ty khởi nghiệp như Recursive Superintelligence và dự án Auto-Research của Andrej Karpathy đang tích cực theo đuổi hướng đi này. Tuy nhiên, CEO Google Sundar Pichai tỏ ra thận trọng, cho rằng ngành công nghiệp vẫn chưa đạt đến cột mốc tăng tốc đột biến mà RSI hứa hẹn. Trong khi đó, các công ty AI Trung Quốc như DeepSeek và Baidu mặc dù ít công khai nhắc đến RSI, nhưng trên thực tế đã áp dụng các nguyên lý tương tự – như tối ưu hóa thuật toán cực độ hay sử dụng vòng lặp phản hồi tự động – để cải thiện mô hình của họ một cách hiệu quả. Dù vậy, RSI vẫn đối mặt với nhiều thách thức lớn: hiện tượng "sụp đổ mô hình" khi dữ liệu do AI tạo ra bị suy giảm chất lượng qua mỗi vòng lặp, yêu cầu về nguồn lực tính toán khổng lồ, và môi trường nghiên cứu toàn cầu đang ngày càng bị phân mảnh. Về cơ bản, RSI đại diện cho xu hướng tự động hóa ngày càng sâu trong phát triển AI, dần đẩy con người ra khỏi chuỗi quyết định trực tiếp. Đây là một quá trình có thể mang lại bước nhảy vọt về công nghệ, nhưng cũng tiềm ẩn rủi ro và sự thay đổi khó lường.

marsbit1 giờ trước

RSI - Khi AI tự xây dựng chính mình đang nổi lên, Google dội nước lạnh, DeepSeek đã chạm đến mép giới hạn

marsbit1 giờ trước

Anthropic cảnh báo toàn cầu, OpenAI đã vượt qua 'ngưỡng tin cậy': AI tự kích hoạt tăng tốc

Cộng đồng AI đang chấn động bởi cảnh báo từ Anthropic: nghiên cứu AI cần dừng lại! Hãng này lo ngại AI đang tiến gần đến điểm "tự tạo ra chính mình", với quá trình tự cải tiến đệ quy diễn ra nhanh hơn dự kiến. Đồng thời, Yann Dubois của OpenAI chia sẻ một quan điểm then chốt: sự phát triển của AI là liên tục, nhưng người dùng cảm nhận một bước nhảy vọt khi nó vượt qua "ngưỡng độ tin cậy". OpenAI đã đạt được ngưỡng này vào khoảng tháng 12 năm ngoái. Khi AI đủ tin cậy, nó từ một "thực tập sinh" trở thành một "nhân viên" thực thụ và bắt đầu tự gia tốc, đặc biệt trong việc hỗ trợ lập trình, tạo ra một vòng lặp phát triển ngày càng nhanh. Dubois nhấn mạnh việc xây dựng AI giống "nghề thủ công" hơn là khoa học thuần túy, dựa nhiều vào thử nghiệm và trực giác. Ông cũng đưa ra một tuyên bố gây chú ý: nếu đóng băng các mô hình hiện tại và chỉ tập trung vào hệ thống điều phối (Harness) cho các lĩnh vực chuyên sâu, chúng ta có thể đã đạt được cảm giác của AGI (Trí tuệ nhân tạo phổ quát). Rào cản thực sự không nằm ở bộ não mô hình, mà ở "quyền truy cập, kết nối và dữ liệu" – công việc khó khăn của "chặng đường cuối cùng" để đưa AI vào thực tế. Tuy vậy, một thách thức lớn vẫn tồn tại: khả năng học liên tục (continual learning). Hiện tại, AI thường đạt hiệu suất cao ban đầu nhưng sau đó không cải thiện nhiều trong môi trường cụ thể. Giải quyết vấn đề này là chìa khóa quan trọng cho tương lai. Dubois kết luận rằng vẫn có không gian rộng lớn cho các công ty khởi nghiệp trong việc tạo ra các ứng dụng chuyên sâu, tập trung vào tích hợp và giải quyết các vấn đề thực tế.

marsbit1 giờ trước

Anthropic cảnh báo toàn cầu, OpenAI đã vượt qua 'ngưỡng tin cậy': AI tự kích hoạt tăng tốc

marsbit1 giờ trước

FBI Đàn Áp Các Nghi Phạm Quyên Góp Tiền Mã Hóa Cho ISIS, 3 Công Dân Mỹ Bị Bắt

Các cơ quan liên bang Hoa Kỳ đã bắt giữ ba công dân Mỹ với cáo buộc âm mưu hỗ trợ vật chất cho tổ chức khủng bố ISIS. Những người này, được xác định là Bisaam Ghafoor (21 tuổi), Elias Shamsaldeen (21 tuổi) và Bereen Dzayee (25 tuổi), bị bắt tại Kansas và California sau một cuộc điều tra kéo dài. Theo Bộ Tư pháp, từ đầu năm 2025 đến giữa năm 2026, các nghi phạm đã sử dụng các nền tảng như Discord và ứng dụng mã hóa để thảo luận việc tuyên thệ trung thành với ISIS, lên kế hoạch tấn công binh sĩ Mỹ ở nước ngoài, và bàn về việc ra nước ngoài để chiến đấu. Họ bị cáo buộc đã chuyển hơn 2.000 đô la bằng tiền mã hóa và tiền mặt cho một cá nhân được cho là có liên hệ với ISIS, nhằm mua vũ khí như máy bay không người lái và súng chống tăng RPG. Một chi tiết đáng chú ý là họ đã thảo luận việc khắc tên của Ghafoor lên một máy bay không người lái. Các tài liệu tòa án cũng đề cập đến các cuộc thảo luận về hành vi bạo lực cụ thể, chẳng hạn như đâm một quân nhân Mỹ. Giới chức cho biết hành động phối hợp của FBI và nhóm an ninh quốc gia đã ngăn chặn âm mưu này trước khi có bất kỳ thương vong nào xảy ra.

bitcoinist1 giờ trước

FBI Đàn Áp Các Nghi Phạm Quyên Góp Tiền Mã Hóa Cho ISIS, 3 Công Dân Mỹ Bị Bắt

bitcoinist1 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片