DeepSeek V4终于发布,打破最强闭源垄断,明确携手华为芯片

marsbit發佈於 2026-04-24更新於 2026-04-24

文章摘要

DeepSeek V4正式发布,推出Pro和Flash两个版本,均支持1M上下文长度,并全面开源。V4-Pro具备49B激活参数,在Agent能力、世界知识和推理性能上达到开源领域领先水平,体验优于Claude Sonnet 4.5,接近Opus 4.6非思考模式。V4-Flash为经济版,参数更小、响应更快,适合一般任务。 新版本采用创新的注意力机制,显著降低计算和内存需求,实现百万上下文的标配化。API服务已更新,支持OpenAI和Anthropic接口,并计划于下半年兼容华为算力平台。 DeepSeek未回应此前市场传言,直接发布产品,强调“率道而行,端然正己”,展现出技术推进的坚定态度。模型已在Hugging Face和ModelScope平台开源,技术报告同步发布。

刚刚,DeepSeek-V4来了!

预览版正式上线并同步开源。

一共两个版本:

DeepSeek-V4-Pro:对标顶级闭源模型,1.6T,49B激活,上下文长度1M;

DeepSeek-V4-Flash:更小更快的经济版,284B,13B激活,上下文长度1M。

官方原话是:在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先

并且:

目前DeepSeek-V4已经成为公司内部员工使用的Agentic Coding模型,据评测反馈使用体验优于Sonnet 4.5,交付质量接近Opus 4.6非思考模式。但仍与Opus 4.6思考模型存在一定差距。

目前官网和APP都上了,API服务也已同步更新。

大家都关心的国产算力方面,划重点,下半年支持华为算力

顶配和性价比之选,两个版本一起开

这次V4一口气发了两个版本。

V4-Pro,性能比肩顶级闭源模型。

官方给出的判断有三条:

Agent能力大幅提高:在Agentic 能力Coding评测中,V4-Pro已达到当前开源模型最佳水平,并在其他Agent相关评测中同样表现优异。内部测评中,Agent Coding模式下,V4体验优于Sonnet 4.5,交付质量接近 Opus 4.6非思考模式,但仍与 Opus 4.6思考模式存在一定差距。

丰富的世界知识:DeepSeek-V4-Pro在世界知识测评中,大幅领先其他开源模型,仅稍逊于顶尖闭源模型Gemini-Pro-3.1。

世界顶级推理性能:在数学、STEM、竞赛型代码的测评中,DeepSeek-V4-Pro超越当前所有已公开评测的开源模型,取得了比肩世界顶级闭源模型的优异成绩。

V4-Flash,更小更快的经济版。推理能力接近Pro,世界知识储备稍逊一筹,但参数和激活更小,API更便宜。

在Agent任务方面,DeepSeek-V4-Flash在简单任务上与DeepSeek-V4-Pro旗鼓相当,但在高难度任务上仍有差距。

在洗车测试上,V4也是快速通过。

而在“绝望的父亲”这个经典的生物学场景当中,DeepSeek-V4并没有一轮get到红绿色盲这个关键点(根据遗传学规律,如果一名女性是红绿色盲,其生物学父亲必然也是)。

百万上下文实现标配

值得一提的是,从今天开始,1M上下文是DeepSeek所有官方服务的标配。

一年前,1M上下文还是Gemini独家的王牌;其他所有闭源模型要么128K要么200K;开源这边几乎没人玩得起这个量级。

DeepSeek直接把百万上下文从一个「高端功能」挪成了「水电煤」。

而且开源。他们怎么做到的,发布稿里直接给了答案——

V4开创了一种全新的注意力机制,在token维度进行压缩,结合DSA稀疏注意力一起用。相比传统方法,对计算和显存的需求大幅降低。

DSA不是新词。半年前V3.2-Exp那次更新首次引入,当时外界关注度不高,因为跑分和V3.1-Terminus几乎一样,看起来像一次没什么料的中间版本。

现在回头看,那是V4的地基。

Agent能力专项优化

Agent这边,V4针对Claude Code、OpenClaw、OpenCode、CodeBuddy等主流Agent产品做了适配和优化,代码任务、文档生成任务都有提升。

发布稿里还附了一张V4-Pro在某Agent框架下生成的PPT内页示例。

API价格

API这边,V4-Pro和V4-Flash同步上线,支持OpenAI ChatCompletions接口和Anthropic接口两套。

base_url 不变,model 参数改成 deepseek-v4-pro 或 deepseek-v4-flash 即可调用。

两个版本最大上下文都是1M,都同时支持非思考模式和思考模式。思考模式下可以通过reasoning_effort 参数调强度,两档high和max。官方建议复杂 Agent 场景直接上max。

这里有个重点——下半年支持华为算力

此外,旧模型名要下架。

deepseek-chat和deepseek-reasoner将在三个月后(2026年7月24日)停用,当前阶段内这两个名字分别指向V4-Flash的非思考和思考模式。

对个人开发者影响不大,改一个model参数。对接了生产环境的公司,这三个月要去做迁移。

One more thing

发布稿的结尾,DeepSeek 自己引了一句话。

「不诱于誉,不恐于诽,率道而行,端然正己。」

这是荀子《非十二子》里的一句。字面意思是,不被赞誉诱惑,不被诽谤吓到,按自己认定的道往前走,端正自己。

放在今天这个场景里,有点意思。

过去半年,关于V4什么时候发、是不是跳票、是不是已经被别家超越、是不是已经被 Claude 蒸馏数据搞定了之类的传言在中文和英文AI圈来来回 回跑了好几轮。年初甚至还有人信誓旦旦说V4会在春节前发,结果等到了四月底。

他们没回应过一次。

然后在某个周五的下午,把V4放出来,同步开源,同步上线官网和App,同步更新API,顺便把内部员工已经弃用Claude的事实写进发布稿。

没有路线图,没有直播,没有访谈。

率道而行这四个字,听着像是一句口号。但如果你把过去半年 V3.2 那次「没什么亮点」的 Exp 版本、DSA那套为V4铺了半年的稀疏注意力、1M 上下文从王牌变成标配的这条路径放在一起看。

DeepSeek已经做到了。

DeepSeek-V4模型开源链接:

[1]https://huggingface.co/collections/deepseek-ai/deepseek-v4

[2]https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4

DeepSeek-V4 技术报告:https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

本文来自微信公众号“量子位”,作者:量子位

相關問答

QDeepSeek V4发布了哪两个版本?它们的主要区别是什么?

ADeepSeek V4发布了两个版本:DeepSeek-V4-Pro和DeepSeek-V4-Flash。V4-Pro是顶配版本,拥有1.6T参数和49B激活,性能对标顶级闭源模型,在Agent能力、世界知识和推理性能上表现优异;V4-Flash是经济版,参数为284B,激活13B,更小更快,推理能力接近Pro,但世界知识稍逊,API价格更便宜。

QDeepSeek V4在哪些方面实现了技术突破?

ADeepSeek V4在多个方面实现技术突破:1)采用全新的注意力机制,在token维度进行压缩,结合DSA稀疏注意力,显著降低计算和显存需求,实现1M上下文的标配;2)在Agent能力、世界知识和推理性能上达到国内与开源领域的领先水平;3)针对主流Agent产品做了适配和优化,提升代码和文档生成任务的表现。

QDeepSeek V4的API服务有哪些特点?

ADeepSeek V4的API服务支持OpenAI ChatCompletions接口和Anthropic接口两套,最大上下文长度均为1M。两个版本都支持非思考模式和思考模式,思考模式下可通过reasoning_effort参数调整强度(high和max两档)。此外,DeepSeek宣布下半年将支持华为算力,旧模型名(deepseek-chat和deepseek-reasoner)将在2026年7月24日后停用。

QDeepSeek V4在Agent能力方面的表现如何?

ADeepSeek V4在Agent能力方面表现优异:V4-Pro在Agentic Coding评测中达到当前开源模型最佳水平,内部测评显示优于Sonnet 4.5,交付质量接近Opus 4.6非思考模式;V4-Flash在简单任务上与Pro版旗鼓相当,高难度任务仍有差距。模型还针对Claude Code、OpenClaw等主流Agent产品做了适配优化。

QDeepSeek V4的开源和技术报告在哪里可以获取?

ADeepSeek V4的开源模型可以在Hugging Face和ModelScope平台获取:Hugging Face链接为https://huggingface.co/collections/deepseek-ai/deepseek-v4,ModelScope链接为https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4。技术报告地址为:https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf。

你可能也喜歡

我用了一年,才看清 Agent 支付扎心的真相

我用了一年时间深入研究Agent支付领域,发现当前市场存在诸多扎心现实。总体来看,真正的、大规模的需求尚未形成,初创公司面临结构性问题。 首先,在Agent对商户的“代购式商业”方面,用户体验存在根本缺陷。对于需要视觉比价的大多数商品(如服装、电子产品),纯文本对话界面远不如传统电商界面直观高效。虽然AI在理解需求和比价指令上表现不错,但无法替代并排浏览、挑选的体验。商户目前接入主要是出于“防御性”的“Agent引擎优化”考虑,担心未来落后,而非当前有实际客流。外卖等高频低决策场景有潜力,但受限于平台未开放API和过高的推理成本。另一个突破口是帮助用户处理复杂、体验差的购物流程(如叠加优惠、非母语操作),但这需要强大的B2C分发渠道,而这是巨头的优势。 其次,在Agent对API(机器间调用服务)方面,虽然存在机器间支付场景,但当前开发者大多已通过预付额度等方式解决小额支付问题。更深层矛盾在于,主流SaaS供应商的商业模式依赖大额企业合同,不愿支持极小额、临时性的API访问。新兴协议更适合服务长尾、小众的需求,但这个市场的付费意愿和规模有限。 第三,Agent对Agent的商业模式目前几乎完全停留在理论层面,尚未产生有意义的交易量。虽然这是一个需要专用结算基础设施的长期愿景,但与当前市场脱节。 相比之下,Agent对金融是目前唯一存在既有需求和付费意愿的类别。将AI嵌入基金经理、财务团队等现有工作流是自然演进,并能创造全新能力(如实时监控、自动调仓)。但该领域竞争激烈,受严格监管,老牌机构拥有显著优势。 文章最后指出,行业巨头因资金充足和防御心态仍在投入建设,但对初创公司而言,时间线至关重要。真正的机遇不在于单纯的支付层,而在于解决“协同”这一更宏大的问题——即如何协调Agent与人类的工作、验证成果并进行结算。大规模协同将自然催生结算机制,解决协同问题的公司终将吞并支付业务。经过一年探索,作者团队已将方向转向一个市场需求真实存在、增长迅速且尚未被充分服务的新领域。

链捕手16 分鐘前

我用了一年,才看清 Agent 支付扎心的真相

链捕手16 分鐘前

Claude Opus 4.8 找到一个 45 亿美元的 Bug,AI时代正在批量生产黑客

一名安全研究员使用AI模型Claude Opus 4.8在Zcash加密货币的隐私协议Orchard中发现了一个严重的“无限增发”漏洞,导致其市值短时间内蒸发约45亿美元。这一事件并非由Anthropic公司最尖端但受限的Claude Mythos模型完成,而是由已公开发布、进入日常工具的普通模型实现的,凸显了AI正在将发现高危漏洞的能力“民主化”和“廉价化”。 AI降低了漏洞挖掘的门槛,带来了双重影响:一方面,它催生了大量由AI生成的虚假或低质量安全报告,如同“注意力DDoS”攻击,消耗着本就人力匮乏的开源维护者精力;另一方面,它也能更快地找出那些隐藏多年、以往需要专家耗费巨大成本才能发现的真实漏洞。我们的数字世界一直建立在存在诸多潜在缺陷的代码之上,过去的“安全”在相当程度上源于发现成本高昂。 然而,能力的扩散并未带来责任的均摊。网络安全行业本就面临巨大的人才缺口,尤其是在复杂分析和应急响应层面。当AI让攻击和漏洞报告变得泛滥时,修复漏洞、守护系统的人力链条却变得更加紧张。破坏可以被自动化脚本轻易复制,但重建信任与安全仍需依赖稀缺的专业人力进行艰苦、细致的修复工作。 AI时代揭示了一个现实:我们习以为常的平稳数字生活,并非理所当然,而是依赖于一条脆弱的人力协作防线在持续对抗风险。未来真正的挑战或许不是找到漏洞,而是是否有足够的人愿意并能够修复它们。

marsbit49 分鐘前

Claude Opus 4.8 找到一个 45 亿美元的 Bug,AI时代正在批量生产黑客

marsbit49 分鐘前

以太坊价格预测:ETH可能翻倍,而Cardano(ADA)和这一新秀代币则有望迎来近500%的飙升

加密货币市场正显现新的活力迹象,投资者为下一轮牛市周期做准备。尽管大型加密货币仍占投资组合重要部分,但投资趋势正转向有望获得更高百分比回报的项目。 以太坊(ETH)作为领先的智能合约平台,若市场在2026年走牛,其价格可能从当前约2,014.7美元再次突破4,000美元,实现翻倍增长。 卡尔达诺(ADA)现交易价格约0.2329美元,因其对可扩展性、基于研究的开发和长期可持续性的关注而被部分投资者视为未来增长的基础。 新兴项目Little Pepe(LILPEPE)正获得显著关注。该项目是一个兼容以太坊的Layer 2环境,目前处于预售第13阶段,价格为0.0022美元,已筹集超过2,819万美元。它旨在为模因社区构建一个降低交易成本、提高速度并发展应用生态的Layer 2区块链。一些投资者基于其预售需求强劲、生态功能规划(如质押、模因启动平台和DAO治理)以及活跃的社区参与,预测其有500%的上涨潜力(目标价约0.0132美元)。 总结而言,以太坊仍是区块链领域重要的长期投资选择,卡尔达诺具备上行潜力,而Little Pepe则因其独特的Layer 2基础设施和社区建设,吸引着寻求高增长机会的投资者。随着市场预期2026年走强,这些项目值得关注。

TheNewsCrypto1 小時前

以太坊价格预测:ETH可能翻倍,而Cardano(ADA)和这一新秀代币则有望迎来近500%的飙升

TheNewsCrypto1 小時前

从以太坊到 AI的「CROPS」:Vitalik 反复强调的这套「慢变量」,究竟是什么?

以太坊基金会近期在文件“EF Mandate”中系统阐述了其核心指导原则“CROPS”,即抗审查性(Censorship Resistance)、抗捕获性(Capture Resistance)、开源(Open Source)、隐私(Privacy)和安全(Security)。这套原则旨在确保以太坊生态中,用户能在不依赖单一平台、不丧失最终控制权的前提下进行资产管理和链上交互。 Vitalik Buterin近期进一步将“CROPS”概念拓展至人工智能(AI)领域,提出“CROPS AI”的构想。随着AI Agent逐渐成为用户执行链上操作(如交易、资产整理)的入口,其中心化、黑箱化运行模式可能使用户的隐私、资产信息和操作意图面临风险。“CROPS AI”强调AI应具备抗审查、开放、保护隐私和安全的特点,提倡敏感操作尽可能在本地运行,减少对中心化云服务的依赖。 由此,以太坊的“CROPS Ethereum access layer”与“CROPS AI”产生了重要交集。两者共同关注的核心问题是:用户如何在调用远程服务(无论是链上RPC还是大语言模型)时,既能获得所需能力,又不泄露个人敏感信息。Vitalik提到的利用零知识证明实现付费远程LLM调用和私密Ethereum RPC读取,正是探索这一交集的具体方向。 “CROPS”原则并非抽象理念,它正具体化为对协议层、应用层(尤其是钱包)和用户体验层的设计要求。在未来,当AI成为数字世界的核心接口时,确保系统可理解、可验证、隐私且安全,将成为以太坊乃至整个Web3生态持续发展的关键价值主张和积极变量。

marsbit2 小時前

从以太坊到 AI的「CROPS」:Vitalik 反复强调的这套「慢变量」,究竟是什么?

marsbit2 小時前

交易

現貨
合約
活动图片