DeepSeek V4终于发布,打破最强闭源垄断,明确携手华为芯片

marsbit发布于2026-04-24更新于2026-04-24

文章摘要

DeepSeek V4正式发布,推出Pro和Flash两个版本,均支持1M上下文长度,并全面开源。V4-Pro具备49B激活参数,在Agent能力、世界知识和推理性能上达到开源领域领先水平,体验优于Claude Sonnet 4.5,接近Opus 4.6非思考模式。V4-Flash为经济版,参数更小、响应更快,适合一般任务。 新版本采用创新的注意力机制,显著降低计算和内存需求,实现百万上下文的标配化。API服务已更新,支持OpenAI和Anthropic接口,并计划于下半年兼容华为算力平台。 DeepSeek未回应此前市场传言,直接发布产品,强调“率道而行,端然正己”,展现出技术推进的坚定态度。模型已在Hugging Face和ModelScope平台开源,技术报告同步发布。

刚刚,DeepSeek-V4来了!

预览版正式上线并同步开源。

一共两个版本:

DeepSeek-V4-Pro:对标顶级闭源模型,1.6T,49B激活,上下文长度1M;

DeepSeek-V4-Flash:更小更快的经济版,284B,13B激活,上下文长度1M。

官方原话是:在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先

并且:

目前DeepSeek-V4已经成为公司内部员工使用的Agentic Coding模型,据评测反馈使用体验优于Sonnet 4.5,交付质量接近Opus 4.6非思考模式。但仍与Opus 4.6思考模型存在一定差距。

目前官网和APP都上了,API服务也已同步更新。

大家都关心的国产算力方面,划重点,下半年支持华为算力

顶配和性价比之选,两个版本一起开

这次V4一口气发了两个版本。

V4-Pro,性能比肩顶级闭源模型。

官方给出的判断有三条:

Agent能力大幅提高:在Agentic 能力Coding评测中,V4-Pro已达到当前开源模型最佳水平,并在其他Agent相关评测中同样表现优异。内部测评中,Agent Coding模式下,V4体验优于Sonnet 4.5,交付质量接近 Opus 4.6非思考模式,但仍与 Opus 4.6思考模式存在一定差距。

丰富的世界知识:DeepSeek-V4-Pro在世界知识测评中,大幅领先其他开源模型,仅稍逊于顶尖闭源模型Gemini-Pro-3.1。

世界顶级推理性能:在数学、STEM、竞赛型代码的测评中,DeepSeek-V4-Pro超越当前所有已公开评测的开源模型,取得了比肩世界顶级闭源模型的优异成绩。

V4-Flash,更小更快的经济版。推理能力接近Pro,世界知识储备稍逊一筹,但参数和激活更小,API更便宜。

在Agent任务方面,DeepSeek-V4-Flash在简单任务上与DeepSeek-V4-Pro旗鼓相当,但在高难度任务上仍有差距。

在洗车测试上,V4也是快速通过。

而在“绝望的父亲”这个经典的生物学场景当中,DeepSeek-V4并没有一轮get到红绿色盲这个关键点(根据遗传学规律,如果一名女性是红绿色盲,其生物学父亲必然也是)。

百万上下文实现标配

值得一提的是,从今天开始,1M上下文是DeepSeek所有官方服务的标配。

一年前,1M上下文还是Gemini独家的王牌;其他所有闭源模型要么128K要么200K;开源这边几乎没人玩得起这个量级。

DeepSeek直接把百万上下文从一个「高端功能」挪成了「水电煤」。

而且开源。他们怎么做到的,发布稿里直接给了答案——

V4开创了一种全新的注意力机制,在token维度进行压缩,结合DSA稀疏注意力一起用。相比传统方法,对计算和显存的需求大幅降低。

DSA不是新词。半年前V3.2-Exp那次更新首次引入,当时外界关注度不高,因为跑分和V3.1-Terminus几乎一样,看起来像一次没什么料的中间版本。

现在回头看,那是V4的地基。

Agent能力专项优化

Agent这边,V4针对Claude Code、OpenClaw、OpenCode、CodeBuddy等主流Agent产品做了适配和优化,代码任务、文档生成任务都有提升。

发布稿里还附了一张V4-Pro在某Agent框架下生成的PPT内页示例。

API价格

API这边,V4-Pro和V4-Flash同步上线,支持OpenAI ChatCompletions接口和Anthropic接口两套。

base_url 不变,model 参数改成 deepseek-v4-pro 或 deepseek-v4-flash 即可调用。

两个版本最大上下文都是1M,都同时支持非思考模式和思考模式。思考模式下可以通过reasoning_effort 参数调强度,两档high和max。官方建议复杂 Agent 场景直接上max。

这里有个重点——下半年支持华为算力

此外,旧模型名要下架。

deepseek-chat和deepseek-reasoner将在三个月后(2026年7月24日)停用,当前阶段内这两个名字分别指向V4-Flash的非思考和思考模式。

对个人开发者影响不大,改一个model参数。对接了生产环境的公司,这三个月要去做迁移。

One more thing

发布稿的结尾,DeepSeek 自己引了一句话。

「不诱于誉,不恐于诽,率道而行,端然正己。」

这是荀子《非十二子》里的一句。字面意思是,不被赞誉诱惑,不被诽谤吓到,按自己认定的道往前走,端正自己。

放在今天这个场景里,有点意思。

过去半年,关于V4什么时候发、是不是跳票、是不是已经被别家超越、是不是已经被 Claude 蒸馏数据搞定了之类的传言在中文和英文AI圈来来回 回跑了好几轮。年初甚至还有人信誓旦旦说V4会在春节前发,结果等到了四月底。

他们没回应过一次。

然后在某个周五的下午,把V4放出来,同步开源,同步上线官网和App,同步更新API,顺便把内部员工已经弃用Claude的事实写进发布稿。

没有路线图,没有直播,没有访谈。

率道而行这四个字,听着像是一句口号。但如果你把过去半年 V3.2 那次「没什么亮点」的 Exp 版本、DSA那套为V4铺了半年的稀疏注意力、1M 上下文从王牌变成标配的这条路径放在一起看。

DeepSeek已经做到了。

DeepSeek-V4模型开源链接:

[1]https://huggingface.co/collections/deepseek-ai/deepseek-v4

[2]https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4

DeepSeek-V4 技术报告:https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

本文来自微信公众号“量子位”,作者:量子位

相关问答

QDeepSeek V4发布了哪两个版本?它们的主要区别是什么?

ADeepSeek V4发布了两个版本:DeepSeek-V4-Pro和DeepSeek-V4-Flash。V4-Pro是顶配版本,拥有1.6T参数和49B激活,性能对标顶级闭源模型,在Agent能力、世界知识和推理性能上表现优异;V4-Flash是经济版,参数为284B,激活13B,更小更快,推理能力接近Pro,但世界知识稍逊,API价格更便宜。

QDeepSeek V4在哪些方面实现了技术突破?

ADeepSeek V4在多个方面实现技术突破:1)采用全新的注意力机制,在token维度进行压缩,结合DSA稀疏注意力,显著降低计算和显存需求,实现1M上下文的标配;2)在Agent能力、世界知识和推理性能上达到国内与开源领域的领先水平;3)针对主流Agent产品做了适配和优化,提升代码和文档生成任务的表现。

QDeepSeek V4的API服务有哪些特点?

ADeepSeek V4的API服务支持OpenAI ChatCompletions接口和Anthropic接口两套,最大上下文长度均为1M。两个版本都支持非思考模式和思考模式,思考模式下可通过reasoning_effort参数调整强度(high和max两档)。此外,DeepSeek宣布下半年将支持华为算力,旧模型名(deepseek-chat和deepseek-reasoner)将在2026年7月24日后停用。

QDeepSeek V4在Agent能力方面的表现如何?

ADeepSeek V4在Agent能力方面表现优异:V4-Pro在Agentic Coding评测中达到当前开源模型最佳水平,内部测评显示优于Sonnet 4.5,交付质量接近Opus 4.6非思考模式;V4-Flash在简单任务上与Pro版旗鼓相当,高难度任务仍有差距。模型还针对Claude Code、OpenClaw等主流Agent产品做了适配优化。

QDeepSeek V4的开源和技术报告在哪里可以获取?

ADeepSeek V4的开源模型可以在Hugging Face和ModelScope平台获取:Hugging Face链接为https://huggingface.co/collections/deepseek-ai/deepseek-v4,ModelScope链接为https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4。技术报告地址为:https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf。

你可能也喜欢

Vitalik:基于期权而非债务构建指数追踪资产

以太坊创始人Vitalik Buterin提出了一种新的合成资产构建思路:基于期权而非债务来创建跟踪特定价格指数(如美元兑ETH价格)的资产,以规避传统算法稳定币对实时清算和实时预言机的依赖。 传统方法通过强制清算来处理抵押不足的债务,但这需要高频率、高安全性的实时预言机,实施难度大且风险高。新方案的核心是定义两种资产:P和N。用户可以用1个ETH生成一对(P,N),到期时根据预言机提供的指数价格进行结算:P获得min(1, S/x)个ETH,N获得max(0, 1-S/x)个ETH,其中S是执行价,x是到期价格。这本质上是一个无需清算的预测市场(标量市场)。 持有P资产(如执行价1500的P)可获得对目标指数(如美元)的风险敞口,但其价值会随标的资产价格接近执行价而出现“二次方漂移”。为了管理风险,用户需要主动进行再平衡(例如,当价格接近执行价时,滚动换入执行价更低的期权),而非依赖协议强制清算。这种设计将风险管理和时机决策交给了用户,降低了对全局实时预言机的依赖和用户的MEV风险。 用户可选择通过全自动链上DAO或个人本地程序进行再平衡。虽然主动管理会带来成本(如滑点)和一定的价值波动(可能年化1-4%),但相比于法币间的波动或某些算法稳定币的回报率波动,这一成本在追求价格稳定(非会计稳定)的应用场景中是可接受的。关键在于设计低滑点的市场机制来支持用户的低频再平衡操作,从而提升整体方案的竞争力。

marsbit38分钟前

Vitalik:基于期权而非债务构建指数追踪资产

marsbit38分钟前

全球发卡进入合规驱动时代:WasabiCard 正在构建下一代支付基础设施

近日,WasabiCard发布行业观点指出,随着稳定币在跨境支付、企业结算等场景中的应用深化,全球发卡行业正从“增长驱动”转向“合规驱动”阶段。未来竞争重点将从“是否可用”转向“能否在全球合规框架下长期稳定运行”。 WasabiCard联合创始人Ray表示,稳定币正成为全球商业的重要支付媒介,下一阶段的竞争核心在于企业是否具备长期合规运营与全球化基础设施能力。通过Visa、Mastercard等支付网络,稳定币得以进入日常消费、企业支付与跨境资金流转场景。 行业快速扩张也暴露出跨区域发卡、BIN资源管理、匿名发卡及反洗钱与风控能力不足等问题。因此,行业正从依赖“灰色效率”的增长模式,转向更重视合规、风控与长期运营能力的发展路径。 为此,WasabiCard披露了其基础设施策略,包括:与持牌主会员及本地合作伙伴协作建立本地化运营体系、构建完善的KYC与AML风控体系、严格区分商业与消费BIN使用场景,并持续完善全球发卡、支付与跨境资金流转基础设施。其目标是在全球监管演进背景下,构建具备长期稳定性与可扩展性的支付基础设施。 未来,全球发卡行业的竞争逻辑将从“规模竞争”转向“基础设施能力竞争”。WasabiCard将继续围绕全球发卡、稳定币支付、跨境资金流转及API驱动金融工作流等方向,完善基础设施能力,推动稳定币在真实商业世界中的规模化应用。

marsbit1小时前

全球发卡进入合规驱动时代:WasabiCard 正在构建下一代支付基础设施

marsbit1小时前

交易

现货
合约
活动图片