DeepSeek V4 chính thức ra mắt, phá vỡ thế độc quyền của mã nguồn đóng mạnh nhất, công khai hợp tác với chip Huawei

marsbitXuất bản vào 2026-04-24Cập nhật gần nhất vào 2026-04-24

Tóm tắt

DeepSeek vừa chính thức ra mắt phiên bản DeepSeek-V4 với hai phiên bản: Pro và Flash. V4-Pro có 1,6 nghìn tỷ tham số và 49 tỷ tham số kích hoạt, được đánh giá ngang hàng với các mô hình nguồn đóng hàng đầu về khả năng Agent, kiến thức thế giới và suy luận. Trong khi đó, V4-Flash là phiên bản nhẹ hơn, phù hợp cho các tác vụ đơn giản và có chi phí API thấp hơn. Cả hai phiên bản đều hỗ trợ ngữ cảnh dài 1 triệu token, một tính năng trước đây chỉ có trên Gemini. DeepSeek cũng công bố sẽ hỗ trợ chip Huawei từ nửa cuối năm nay. Mô hình đã được open-source và có sẵn trên Hugging Face và ModelScope. API cập nhật đồng thời, hỗ trợ cả giao thức OpenAI và Anthropic.

Vừa qua, DeepSeek-V4 đã chính thức xuất hiện!

Phiên bản xem trước chính thức lên sóng và đồng thời mã nguồn mở.

Tổng cộng có hai phiên bản:

DeepSeek-V4-Pro: Đối đầu với các mô hình mã nguồn đóng hàng đầu, 1.6T, 49B kích hoạt, độ dài ngữ cảnh 1M;

DeepSeek-V4-Flash: Phiên bản kinh tế nhỏ hơn và nhanh hơn, 284B, 13B kích hoạt, độ dài ngữ cảnh 1M.

Lời nói chính thức từ nhà phát triển là: Về khả năng Agent, kiến thức thế giới và hiệu suất suy luận đều đạt được vị trí dẫn đầu trong nước và lĩnh vực mã nguồn mở.

Và:

Hiện tại DeepSeek-V4 đã trở thành mô hình Agentic Coding được nhân viên nội bộ sử dụng, theo đánh giá phản hồi trải nghiệm sử dụng tốt hơn Sonnet 4.5, chất lượng giao hàng gần với Opus 4.6 chế độ không suy nghĩ. Nhưng vẫn còn khoảng cách nhất định so với mô hình suy nghĩ Opus 4.6.

Hiện tại cả trang web chính thức và APP đều đã cập nhật, dịch vụ API cũng đã đồng bộ hóa.

Về khả năng tính toán trong nước mà mọi người quan tâm, điểm nhấn là nửa cuối năm sẽ hỗ trợ khả năng tính toán của Huawei.

Lựa chọn cao cấp và tiết kiệm, hai phiên bản cùng ra mắt

Lần này V4 một lúc ra mắt hai phiên bản.

V4-Pro, hiệu suất ngang bằng với các mô hình mã nguồn đóng hàng đầu.

Nhà phát triển đưa ra ba đánh giá:

Khả năng Agent được cải thiện mạnh mẽ: Trong đánh giá Agentic Coding, V4-Pro đã đạt đến trình độ tốt nhất của các mô hình mã nguồn mở hiện tại, và cũng thể hiện xuất sắc trong các đánh giá liên quan đến Agent khác. Trong đánh giá nội bộ, ở chế độ Agent Coding, trải nghiệm V4 tốt hơn Sonnet 4.5, chất lượng giao hàng gần với Opus 4.6 chế độ không suy nghĩ, nhưng vẫn còn khoảng cách so với chế độ suy nghĩ Opus 4.6.

Kiến thức thế giới phong phú: Trong đánh giá kiến thức thế giới, DeepSeek-V4-Pro vượt xa các mô hình mã nguồn mở khác, chỉ kém hơn một chút so với mô hình mã nguồn đóng đỉnh cao Gemini-Pro-3.1.

Hiệu suất suy luận đỉnh cao thế giới: Trong các đánh giá về toán học, STEM, mã thi đấu, DeepSeek-V4-Pro vượt qua tất cả các mô hình mã nguồn mở đã công bố đánh giá hiện tại, đạt được thành tích ngang bằng với các mô hình mã nguồn đóng hàng đầu thế giới.

V4-Flash, phiên bản kinh tế nhỏ hơn và nhanh hơn. Khả năng suy luận gần với Pro, kiến thức thế giới hơi kém hơn, nhưng tham số và kích hoạt nhỏ hơn, API rẻ hơn.

Về nhiệm vụ Agent, DeepSeek-V4-Flash ngang ngửa với DeepSeek-V4-Pro trong nhiệm vụ đơn giản, nhưng vẫn có khoảng cách trong nhiệm vụ khó cao.

Trong bài kiểm tra rửa xe, V4 cũng vượt qua nhanh chóng.

Trong khi đó, trong tình huống sinh học kinh điển "người cha tuyệt vọng", DeepSeek-V4 không nhận ra ngay điểm mấu chốt về mù màu đỏ-xanh lá (theo quy luật di truyền, nếu một phụ nữ bị mù màu đỏ-xanh lá, cha ruột của cô ấy chắc chắn cũng bị).

Triệu ngữ cảnh trở thành tiêu chuẩn

Đáng chú ý là, từ hôm nay, 1M ngữ cảnh là tiêu chuẩn cho tất cả dịch vụ chính thức của DeepSeek.

Một năm trước, 1M ngữ cảnh vẫn là lá bài độc quyền của Gemini; tất cả các mô hình mã nguồn đóng khác chỉ 128K hoặc 200K; phía mã nguồn mở hầu như không ai chơi được ở cấp độ này.

DeepSeek trực tiếp biến triệu ngữ cảnh từ một "tính năng cao cấp" thành "cơ sở hạ tầng".

Và mã nguồn mở. Họ làm được như thế nào, trong bản phát hành đã trực tiếp đưa ra câu trả lời——

V4 tạo ra một cơ chế chú ý hoàn toàn mới, nén ở chiều token, kết hợp với sự chú ý thưa DSA. So với phương pháp truyền thống, nhu cầu tính toán và bộ nhớ giảm mạnh.

DSA không phải từ mới. Nửa năm trước, bản cập nhật V3.2-Exp lần đầu tiên giới thiệu, lúc đó sự chú ý bên ngoài không cao, vì điểm chạy và V3.1-Terminus gần như giống nhau, trông giống như một phiên bản trung gian không có gì mới.

Giờ nhìn lại, đó là nền móng của V4.

Tối ưu hóa chuyên sâu khả năng Agent

Về phía Agent, V4 đã điều chỉnh và tối ưu hóa cho các sản phẩm Agent chủ lưu như Claude Code, OpenClaw, OpenCode, CodeBuddy, nhiệm vụ mã và nhiệm vụ tạo tài liệu đều được cải thiện.

Bản phát hành còn kèm theo một ví dụ trang PPT được tạo bởi V4-Pro trong một khung Agent.

Giá API

Về phía API, V4-Pro và V4-Flash đồng bộ lên sóng, hỗ trợ hai giao diện OpenAI ChatCompletions và Anthropic.

base_url không đổi, tham số model đổi thành deepseek-v4-pro hoặc deepseek-v4-flash để gọi.

Cả hai phiên bản đều có ngữ cảnh tối đa 1M, đều hỗ trợ đồng thời chế độ không suy nghĩ và chế độ suy nghĩ. Ở chế độ suy nghĩ, có thể điều chỉnh cường độ qua tham số reasoning_effort, hai mức high và max. Nhà phát triển khuyến nghị các tình huống Agent phức tạp nên dùng max.

Có một điểm nhấn ở đây——nửa cuối năm hỗ trợ khả năng tính toán của Huawei.

Ngoài ra, tên mô hình cũ sẽ ngừng hoạt động.

deepseek-chat và deepseek-reasoner sẽ ngừng hoạt động sau ba tháng (24/7/2026), trong giai đoạn hiện tại hai tên này lần lượt trỏ đến chế độ không suy nghĩ và suy nghĩ của V4-Flash.

Ảnh hưởng không lớn với nhà phát triển cá nhân, chỉ cần đổi một tham số model. Các công ty đã kết nối môi trường sản xuất, trong ba tháng này cần di chuyển.

One more thing

Cuối bản phát hành, DeepSeek tự trích dẫn một câu.

「不诱于誉,不恐于诽,率道而行,端然正己。」

Đây là một câu trong "Phi Thập Nhị Tử" của Tuân Tử. Nghĩa đen là, không bị dụ dỗ bởi danh tiếng, không sợ hãi bởi phỉ báng, đi theo con đường mình nhận định, ngay thẳng chính mình.

Đặt trong bối cảnh hôm nay, khá thú vị.

Nửa năm qua, những tin đồn về việc V4 khi nào ra mắt, có phải hoãn, có phải đã bị nhà khác vượt qua, có phải đã bị Claude chưng cất dữ liệu giải quyết... chạy đi chạy lại vài vòng trong cộng đồng AI tiếng Trung và tiếng Anh. Đầu năm thậm chí còn có người khẳng định V4 sẽ ra trước Tết, nhưng cuối cùng đợi đến cuối tháng tư.

Họ không phản hồi lần nào.

Vào một chiều thứ Sáu, đưa V4 ra, đồng bộ mã nguồn mở, đồng bộ lên trang chính thức và App, đồng bộ cập nhật API, tiện thể viết vào bản phát hành sự thật nhân viên nội bộ đã ngừng dùng Claude.

Không có lộ trình, không livestream, không phỏng vấn.

Bốn chữ "率道而行" (suất đạo nhi hành), nghe như một khẩu hiệu. Nhưng nếu bạn đặt cùng nhau phiên bản Exp "không có điểm nhấn" của V3.2 nửa năm trước, bộ chú ý thưa DSA đã chuẩn bị nền móng cho V4 nửa năm, con đường biến triệu ngữ cảnh từ lá bài thành tiêu chuẩn.

DeepSeek đã làm được.

Liên kết mã nguồn mở mô hình DeepSeek-V4:

[1]https://huggingface.co/collections/deepseek-ai/deepseek-v4

[2]https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4

Báo cáo kỹ thuật DeepSeek-V4: https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

Bài viết từ tài khoản công chúng WeChat "量子位", tác giả: 量子位

Câu hỏi Liên quan

QDeepSeek V4 có những phiên bản nào và thông số kỹ thuật của chúng là gì?

ADeepSeek V4 có hai phiên bản: DeepSeek-V4-Pro với 1.6T tham số, 49B kích hoạt và độ dài ngữ cảnh 1M; DeepSeek-V4-Flash với 284B tham số, 13B kích hoạt và độ dài ngữ cảnh 1M.

QDeepSeek V4 có những cải tiến nổi bật nào so với các mô hình trước?

ADeepSeek V4 cải thiện đáng kể khả năng Agent, kiến thức thế giới và hiệu suất suy luận. Nó hỗ trợ ngữ cảnh lên đến 1M token, sử dụng cơ chế chú ý mới DSA để giảm nhu cầu tính toán và bộ nhớ.

QDeepSeek V4 có hỗ trợ phần cứng của Huawei không?

ACó, DeepSeek thông báo sẽ hỗ trợ phần cứng Huawei (Huawei compute) vào nửa cuối năm 2026.

QAPI của DeepSeek V4 có những tính năng nào?

AAPI của DeepSeek V4 hỗ trợ cả hai giao diện OpenAI ChatCompletions và Anthropic, với độ dài ngữ cảnh 1M, chế độ không suy nghĩ và chế độ suy nghĩ với tham số reasoning_effort điều chỉnh cường độ.

QDeepSeek V4 đã được đánh giá so với các mô hình đóng như thế nào?

ATheo đánh giá nội bộ, DeepSeek-V4-Pro có trải nghiệm sử dụng tốt hơn Sonnet 4.5, chất lượng gần với Opus 4.6 chế độ không suy nghĩ, nhưng vẫn còn khoảng cách so với Opus 4.6 chế độ suy nghĩ.

Nội dung Liên quan

Sun Zhengyi - Người bị phá sản bởi những câu chuyện hay, đang chờ đợi Alibaba tiếp theo của mình

Son Masayoshi đã trở lại. Sau nhiều năm thất bại với những khoản đầu tư như WeWork và tổn thất lớn từ Quỹ Vision, ông giờ đây được cứu rỗi bởi làn sóng AI. Cổ phiếu Arm và cổ phần OpenAI trong tay ông tăng giá mạnh, đưa SoftBank bật tăng và đưa Son Masayoshi trở lại vị trí người giàu nhất châu Á. Ông từng trải qua đỉnh cao internet những năm 1990, giàu lên nhanh chóng nhờ Yahoo và Alibaba, nhưng cũng chứng kiến tài sản bốc hơi 700 tỷ USD khi bong bóng vỡ. Giai đoạn 2017-2022 là chuỗi ngày đen tối: WeWork sụp đổ, Vision Fund thua lỗ nặng, hàng loạt startup thất bại. Son Masayoshi thừa nhận sai lầm, rút vào im lặng và chuyển sang "chế độ phòng thủ". Bước ngoặt đến với Arm - công ty ông mua năm 2016 với giá cao nay trở thành "cần câu vàng" trong kỷ nguyên AI. IPO năm 2023 giúp SoftBank thu về gấp 10 lần. Nhưng quyết định lớn nhất là đổ hàng trăm tỷ USD vào OpenAI, khoản đầu tư hiện đã sinh lời khoảng 450 tỷ USD. Nhờ hai tài sản AI này, SoftBank phục sinh ngoạn mục. Son Masayoshi, người luôn tìm kiếm những câu chuyện vĩ đại để thay đổi thế giới, một lần nữa được vận may mỉm cười.

marsbit31 phút trước

Sun Zhengyi - Người bị phá sản bởi những câu chuyện hay, đang chờ đợi Alibaba tiếp theo của mình

marsbit31 phút trước

WeChat Agent phát "Hùng Lệnh", nửa bầu trời Internet hưởng ứng

Để cung cấp trải nghiệm tương tác thông minh hơn, WeChat Open Platform đã ban hành hướng dẫn cho nhà phát triển về AI WeChat, cho phép các mini-program tích hợp vào hệ sinh thái AI WeChat. Sau khi tích hợp, các mini-program có cơ hội được AI WeChat đề xuất và gọi. Meituan, Ctrip, Tongcheng và các nền tảng dịch vụ khác đã công bố tích hợp hàng đầu. AI WeChat, hay Agent WeChat, dự kiến sẽ cho phép người dùng thực hiện các tác vụ như đặt đồ uống hoặc nhà hàng thông qua lệnh bằng giọng nói. Agent này có thể điều phối hàng triệu mini-program trong hệ sinh thái WeChat, tạo thành một siêu ứng dụng với khả năng hiểu ý định, gọi công cụ, xử lý thanh toán và quản lý ngữ cảnh. Nền tảng kỹ thuật bao gồm UI-Oceanus, một mô hình thế giới để dự đoán kết quả thao tác trên mini-program. WeChat là nền tảng lý tưởng cho Agent này nhờ bối cảnh phong phú từ chuỗi quan hệ, mini-program, thanh toán và nội dung. Các sản phẩm AI khác của Tencent như Yuanbao, WorkBuddy, ima và Marvis đã tích lũy năng lực cho AI WeChat thông qua cơ chế Thiết kế chung (Co-Design), cho phép chuyển giao năng lực giữa các sản phẩm. Tencent chọn cách tiếp cận Giao thức Agent-to-Agent (A2A) để các Agent từ các nhà sản xuất khác (như Honor, Xiaomi) có thể giao tiếp và gọi các chức năng có kiểm soát trong WeChat, thay vì phương pháp Giao diện người dùng đồ họa (GUI) có thể bị chặn. Điều này giúp Tencent kiểm soát quyền truy cập và các quy tắc trong hệ sinh thái của mình. Với 1,432 tỷ người dùng hoạt động hàng tháng, chi phí vận hành AI WeChat là rất lớn. Tencent có thể sử dụng chiến lược đa mô hình, kết hợp các mô hình nhỏ cho tác vụ cơ bản và mô hình mạnh cho tác vụ phức tạp. Khoản đầu tư tiềm năng 10 tỷ nhân dân tệ vào DeepSeek và việc điều chỉnh giá trên Tencent Cloud cho thấy mối quan hệ hợp tác chiến sâu sắc, có thể cung cấp năng lực suy luận chi phí thấp cho AI WeChat. Các chuyên gia của Tencent nhấn mạnh rằng AI là một cuộc chơi dài hạn, nơi giá trị thực tiễn quan trọng hơn điểm số trên bảng xếp hạng. AI WeChat hướng tới giải quyết các "vấn đề hay" trong cuộc sống hàng ngày của hàng tỷ người dùng, đánh dấu sự bước vào hiệp hai của Tencent trong lĩnh vực AI.

marsbit43 phút trước

WeChat Agent phát "Hùng Lệnh", nửa bầu trời Internet hưởng ứng

marsbit43 phút trước

MicroStrategy Sẽ Không Chết Trong Đợt Sụt Giảm Này: Tính Phản Chiếu, MSTR Hồi Neo Và Logic Tự Cứu 'Bán Cổ Phiếu Không Bán Coin'

**Tóm tắt bài viết "MicroStrategy Không Chết Vì Đợt Giảm Giá Này: Tính Phản Chiếu, STRC Hồi Neo Mệnh Giá và Logic Tự Cứu 'Bán Cổ Phiếu, Không Bán Bitcoin'"** Đợt sụt giảm nhanh chóng của Bitcoin (BTC) gần đây có thể là một cuộc tấn công có chủ đích nhắm vào MicroStrategy (MSTR), khai thác lo ngại về khủng hoảng thanh khoản. Điều này minh họa **tính phản chiếu (reflexivity)**: kỳ vọng thị trường có thể tự biến thành hiện thực. Kịch bản tấn công: dự trữ tiền mặt giảm → kỳ vọng MSTR buộc phải bán BTC → bán tháo gây áp lực giảm giá BTC → giá BTC giảm làm xấu đi bảng cân đối kế toán và giá trị tài sản ròng điều chỉnh theo BTC (mNAV) → kỳ vọng "không thể chống đỡ" càng được củng cố. Cổ phiếu ưu đãi STRC của MSTR (thực chất là trái phiếu lãi suất thả nổi) cũng giảm theo do thị trường định giá lại rủi ro và yêu cầu tỷ suất sinh lợi cao hơn lãi suất danh nghĩa hiện tại. Tuy nhiên, với bản chất là công cụ **lãi suất thả nổi**, giá STRC về lâu dài sẽ có xu hướng quay trở lại neo tại mệnh giá 100. Đây là điều kiện tiên quyết để MSTR có thể tiếp tục sử dụng STRC như một công cụ gây vốn hiệu quả. Để phá vỡ vòng xoáy phản chiếu và củng cố dự trữ tiền mặt, MSTR có hai lựa chọn: **bán BTC** hoặc **phát hành thêm cổ phiếu phổ thông**. * **Bán BTC** có thể giải quyết khủng hoảng ngắn hạn nhưng là hành động "uống thuốc độc giải cơn khát". Nó phá vỡ câu chuyện "không bao giờ bán BTC" – nguồn gốc tạo ra **mNAV premium** (khi mNAV > 1). Việc này khiến cổ phiếu phổ thông bị định giá lại, làm thu hẹp hoặc xóa sổ khoản premium, hủy hoại "bánh đà" tăng trưởng dựa trên việc phát hành cổ phiếu để mua thêm BTC. Hơn nữa, bán BTC làm giảm lượng BTC trên mỗi cổ phiếu và có thể làm xấu hơn tỷ lệ nợ. * **Phát hành thêm cổ phiếu phổ thông** (khi mNAV > 1) là giải pháp ưu việt. MSTR có thể sử dụng một phần số tiền huy động được để tăng dự trữ tiền mặt (làm dịu lo ngại của trái chủ STRC), trong khi phần còn lại mua BTC vẫn tạo ra giá trị cho cổ đông nhờ vào premium. Cách này bảo vệ được lượng BTC trên mỗi cổ phiếu, không làm tổn hại đến câu chuyện đầu tư, và còn cải thiện tỷ lệ nợ. Tóm lại, MSTR khó có thể chết trong đợt sụt giảm này vì có các công cụ để ứng phó. Tuy nhiên, lựa chọn giữa **bán cổ phiếu** và **bán BTC** sẽ quyết định tính bền vững lâu dài của mô hình và câu chuyện đầu tư mà công ty đã xây dựng. Việc bán BTC, dù có thể giải cứu ngắn hạn, sẽ đặt ra câu hỏi về kết cục trong tương lai khi vòng xoáy phản chiếu tiếp diễn.

marsbit1 giờ trước

MicroStrategy Sẽ Không Chết Trong Đợt Sụt Giảm Này: Tính Phản Chiếu, MSTR Hồi Neo Và Logic Tự Cứu 'Bán Cổ Phiếu Không Bán Coin'

marsbit1 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片