DeepSeek V4终于发布，打破最强闭源垄断，明确携手华为芯片

marsbit发布于2026-04-24更新于2026-04-24

文章摘要

DeepSeek V4正式发布，推出Pro和Flash两个版本，均支持1M上下文长度，并全面开源。V4-Pro具备49B激活参数，在Agent能力、世界知识和推理性能上达到开源领域领先水平，体验优于Claude Sonnet 4.5，接近Opus 4.6非思考模式。V4-Flash为经济版，参数更小、响应更快，适合一般任务。新版本采用创新的注意力机制，显著降低计算和内存需求，实现百万上下文的标配化。API服务已更新，支持OpenAI和Anthropic接口，并计划于下半年兼容华为算力平台。 DeepSeek未回应此前市场传言，直接发布产品，强调“率道而行，端然正己”，展现出技术推进的坚定态度。模型已在Hugging Face和ModelScope平台开源，技术报告同步发布。

刚刚,DeepSeek-V4来了!

预览版正式上线并同步开源。

一共两个版本:

DeepSeek-V4-Pro:对标顶级闭源模型,1.6T,49B激活,上下文长度1M;

DeepSeek-V4-Flash:更小更快的经济版,284B,13B激活,上下文长度1M。

官方原话是:在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。

并且:

目前DeepSeek-V4已经成为公司内部员工使用的Agentic Coding模型,据评测反馈使用体验优于Sonnet 4.5,交付质量接近Opus 4.6非思考模式。但仍与Opus 4.6思考模型存在一定差距。

目前官网和APP都上了,API服务也已同步更新。

大家都关心的国产算力方面,划重点,下半年支持华为算力。

顶配和性价比之选,两个版本一起开

这次V4一口气发了两个版本。

V4-Pro,性能比肩顶级闭源模型。

官方给出的判断有三条:

Agent能力大幅提高:在Agentic 能力Coding评测中,V4-Pro已达到当前开源模型最佳水平,并在其他Agent相关评测中同样表现优异。内部测评中,Agent Coding模式下,V4体验优于Sonnet 4.5,交付质量接近 Opus 4.6非思考模式,但仍与 Opus 4.6思考模式存在一定差距。

丰富的世界知识:DeepSeek-V4-Pro在世界知识测评中,大幅领先其他开源模型,仅稍逊于顶尖闭源模型Gemini-Pro-3.1。

世界顶级推理性能:在数学、STEM、竞赛型代码的测评中,DeepSeek-V4-Pro超越当前所有已公开评测的开源模型,取得了比肩世界顶级闭源模型的优异成绩。

V4-Flash,更小更快的经济版。推理能力接近Pro,世界知识储备稍逊一筹,但参数和激活更小,API更便宜。

在Agent任务方面,DeepSeek-V4-Flash在简单任务上与DeepSeek-V4-Pro旗鼓相当,但在高难度任务上仍有差距。

在洗车测试上,V4也是快速通过。

而在“绝望的父亲”这个经典的生物学场景当中,DeepSeek-V4并没有一轮get到红绿色盲这个关键点(根据遗传学规律,如果一名女性是红绿色盲,其生物学父亲必然也是)。

百万上下文实现标配

值得一提的是,从今天开始,1M上下文是DeepSeek所有官方服务的标配。

一年前,1M上下文还是Gemini独家的王牌;其他所有闭源模型要么128K要么200K;开源这边几乎没人玩得起这个量级。

DeepSeek直接把百万上下文从一个「高端功能」挪成了「水电煤」。

而且开源。他们怎么做到的,发布稿里直接给了答案——

V4开创了一种全新的注意力机制,在token维度进行压缩,结合DSA稀疏注意力一起用。相比传统方法,对计算和显存的需求大幅降低。

DSA不是新词。半年前V3.2-Exp那次更新首次引入,当时外界关注度不高,因为跑分和V3.1-Terminus几乎一样,看起来像一次没什么料的中间版本。

现在回头看,那是V4的地基。

Agent能力专项优化

Agent这边,V4针对Claude Code、OpenClaw、OpenCode、CodeBuddy等主流Agent产品做了适配和优化,代码任务、文档生成任务都有提升。

发布稿里还附了一张V4-Pro在某Agent框架下生成的PPT内页示例。

API价格

API这边,V4-Pro和V4-Flash同步上线,支持OpenAI ChatCompletions接口和Anthropic接口两套。

base_url 不变,model 参数改成 deepseek-v4-pro 或 deepseek-v4-flash 即可调用。

两个版本最大上下文都是1M,都同时支持非思考模式和思考模式。思考模式下可以通过reasoning_effort 参数调强度,两档high和max。官方建议复杂 Agent 场景直接上max。

这里有个重点——下半年支持华为算力。

此外,旧模型名要下架。

deepseek-chat和deepseek-reasoner将在三个月后(2026年7月24日)停用,当前阶段内这两个名字分别指向V4-Flash的非思考和思考模式。

对个人开发者影响不大,改一个model参数。对接了生产环境的公司,这三个月要去做迁移。

One more thing

发布稿的结尾,DeepSeek 自己引了一句话。

「不诱于誉,不恐于诽,率道而行,端然正己。」

这是荀子《非十二子》里的一句。字面意思是,不被赞誉诱惑,不被诽谤吓到,按自己认定的道往前走,端正自己。

放在今天这个场景里,有点意思。

过去半年,关于V4什么时候发、是不是跳票、是不是已经被别家超越、是不是已经被 Claude 蒸馏数据搞定了之类的传言在中文和英文AI圈来来回回跑了好几轮。年初甚至还有人信誓旦旦说V4会在春节前发,结果等到了四月底。

他们没回应过一次。

然后在某个周五的下午,把V4放出来,同步开源,同步上线官网和App,同步更新API,顺便把内部员工已经弃用Claude的事实写进发布稿。

没有路线图,没有直播,没有访谈。

率道而行这四个字,听着像是一句口号。但如果你把过去半年 V3.2 那次「没什么亮点」的 Exp 版本、DSA那套为V4铺了半年的稀疏注意力、1M 上下文从王牌变成标配的这条路径放在一起看。

DeepSeek已经做到了。

DeepSeek-V4模型开源链接:

[1]https://huggingface.co/collections/deepseek-ai/deepseek-v4

[2]https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4

DeepSeek-V4 技术报告:https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

本文来自微信公众号“量子位”,作者:量子位

你可能也喜欢

从封杀豆包到拥抱荣耀，微信为什么突然“变脸”？

从严防死守到主动合作，微信对手机AI助手的态度在近期发生了180度转变。过去一年，微信曾封杀字节跳动豆包手机、限制OPPO“AI一键闪记”等功能，坚决反对第三方通过模拟点击操控微信。如今，微信却与华为、荣耀、小米等多家厂商合作，推出A2A（智能体到智能体）助手能力，允许用户通过系统AI助手直接发送微信消息、拨打语音电话。这一转变源于腾讯在AI竞争中的焦虑。其AI应用“元宝”月活远低于竞争对手，而微信坐拥14亿月活和小程序生态，成为腾讯在AI时代的关键底牌。微信正内测AI智能体，旨在通过自然语言调用小程序服务，但需要打通手机系统这一首要AI入口。A2A合作让手机厂商的智能体作为“接线员”，将用户指令转交微信执行，腾讯借此既保住了生态控制权，又接入了系统级流量。与之前被封杀的GUI（图形界面模拟操作）路线不同，A2A采用双重授权机制，通过标准化接口调用，微信在其中占据主导。手机厂商之所以愿意合作，是因为GUI强攻路线已被证明行不通，而A2A为其保留了在系统级AI场景中的发展空间，并有助于在激烈的行业竞争中快速提升AI整合能力。尽管存在数据隐私担忧，但A2A被视为比模拟点击更安全合规的路径。这场合作本质是双方在AI入口争夺中的阶段性妥协：腾讯需要手机入口为微信AI引流，手机厂商则需要突破跨应用调用的合规瓶颈。长远看，腾讯试图将微信打造为AI“服务操作系统”，而手机厂商则希望用户深度依赖系统自带助手，双方生态战略的博弈将持续。AI时代的入口之争，已随着用户一句“帮我发微信”悄然展开。

marsbit37分钟前

marsbit37分钟前

开赛前夜的链上数字：世界杯还没开踢，已经成交了 16 亿

在2026年世界杯开赛前夜，链上预测市场已展现出惊人规模。仅Polymarket平台上“世界杯冠军”一个合约的累计成交额就高达约16亿美元，且成交量在开赛前两个月随着信息更新而陡增。预测市场不仅规模扩大，其深度也在增加。平台提供了覆盖全部104场比赛及冠军、金靴等上百个细分合约，合约价格（0.01-0.99美元）直接反映市场隐含概率，并借助预言机等技术实现链上自动结算。更独特的是，市场甚至能将“赛事运营风险”（如比赛是否因治安问题迁址）本身定价为可交易合约。与此同时，该领域正被主流基础设施和官方机构接纳：结算层升级为受监管的原生美元稳定币；Chainlink等去中心化预言机被用于判定赛果；国际足联（FIFA）也首次任命了预测市场类别的官方合作伙伴。尽管预测市场在全球面临复杂的监管环境（美国部分州禁止，中国禁止任何博彩），且其法律定性与传统体育博彩不同，但加密已深度渗透进本届世界杯的金融与预测底层。当世界杯尚未开踢时，链上的市场早已先行。

marsbit1小时前

marsbit1小时前

从SpaceX上市看Crypto未来：哪些加密板块将承接万亿叙事？

SpaceX计划以1.77万亿美元估值上市，其整合火箭、星链、AI与轨道数据中心的超级叙事，反映出资本正围绕AI、基础设施和未来生态重新配置。这一趋势可能为加密市场带来资金溢出效应，推动以下板块成为下一轮周期核心：首先，AI叙事进入下半场，市场焦点从应用转向“卖铲人”式的基础设施。算力成为稀缺资源，类似TAO的AI网络协议，以及RENDER、AKT等提供算力流动性的项目，其估值逻辑可能向更持久的基础设施价值迁移。其次，万亿美元级资产上链可能推动RWA（真实世界资产）爆发式发展。未来方向可能从国债扩展至股权、未上市资产等，通过链上化打破一二级市场壁垒，重构资产发行、交易与清算模式。基础设施如ONDO、LINK等或将率先受益。最后，稳定币、支付网络与DePIN（去中心化物理基础设施）作为底层支撑逻辑日益重要。稳定币需求将超越交易媒介，成为链上经济与全球资产流通的基石；支付网络可能演变为关键入口；而DePIN通过代币激励建设现实世界网络，其基础设施价值有望获得重估。 SpaceX上市事件揭示了资本从追逐故事转向追逐基础设施与现金流的路径。加密市场中，AI基础设施、RWA、稳定币、支付网络及DePIN等板块更贴近未来周期的底层逻辑，它们可能不是短期涨幅最快，但或许是建设下一代数字生态系统的关键赢家。

marsbit1小时前

marsbit1小时前

比特币跌至5.9万美元，为2024年以来首次：加密货币总市值自十月以来蒸发2万亿美元

比特币（BTC）周五加速下跌，跌至约59,685美元，这是自2024年10月以来的最低水平。此次抛售已蔓延至整个加密市场，自2025年10月约4.2万亿美元的市场峰值以来，总市值已蒸发超过2万亿美元。抛售加速由多重因素驱动，包括比特币交易所交易基金（ETF）资金流出大幅增加以及地缘政治紧张局势重燃。以太坊（ETH）等其他主流加密货币也大幅跟跌。市场情绪急剧恶化，加密货币恐惧与贪婪指数降至16，表明市场处于“极度恐惧”状态。比特币目前价格较2024年10月约12.6万美元的历史高点下跌逾50%。展望未来，有预测认为比特币年底可能回升至6.5万美元左右，但仍远低于历史峰值，表明即使出现反弹，也可能无法完全抵消投资者已承受的损失。

bitcoinist1小时前

比特币跌至5.9万美元，为2024年以来首次：加密货币总市值自十月以来蒸发2万亿美元

bitcoinist1小时前

币圈惨烈！比特币破6万美元，以太坊暴跌超10%，Strategy遭空头围猎

比特币市场本周遭遇重创，价格跌至半年多来低点。比特币周五跌破6万美元，周跌幅达16%，自历史高点已回落过半。本轮下跌由多重利空引发：Michael Saylor旗下MicroStrategy公司出售比特币持仓引发数亿美元强制平仓；强于预期的美国非农就业数据推高美债收益率，压制风险资产。 MicroStrategy股价本周暴跌24%，创下两年多最差表现，同时期权市场上针对该公司的空头交易急剧升温。分析指出，投机资金流向AI股票及芯片领域，以及加密市场“Clarity Act”法案立法前景暗淡，共同加剧了跌势。比特币与美股科技股走势的近期背离也令市场困惑。比特币ETF在经历了创纪录的连续资金流出后，周四录得小额净流入，但整体资产管理规模已显著缩水。尽管市场情绪低迷，仍有观点认为当前触及关键长期均线可能是抄底时机。此外，MicroStrategy的优先股价格也大幅下跌。市场对其CEO的风险定价提升，加之美债收益率上行和潜在的加息预期，给此类信用工具带来了额外压力。

华尔街日报2小时前

华尔街日报2小时前

交易

现货

合约

DeepSeek V4终于发布，打破最强闭源垄断，明确携手华为芯片

文章摘要

顶配和性价比之选,两个版本一起开

百万上下文实现标配

Agent能力专项优化

API价格

One more thing

相关问答

你可能也喜欢

从封杀豆包到拥抱荣耀，微信为什么突然“变脸”？

开赛前夜的链上数字：世界杯还没开踢，已经成交了 16 亿

从SpaceX上市看Crypto未来：哪些加密板块将承接万亿叙事？

比特币跌至5.9万美元，为2024年以来首次：加密货币总市值自十月以来蒸发2万亿美元

币圈惨烈！比特币破6万美元，以太坊暴跌超10%，Strategy遭空头围猎

交易

热门分类

热门标签