你等的DeepSeek,早已变了

marsbit发布于2026-04-15更新于2026-04-15

文章摘要

关于DeepSeek V4迟迟未发布的原因,文章指出其发展节奏已明显落后于国际同行,而背后可能涉及国产化适配的战略转型。据透露,自2025年起,有关部门鼓励DeepSeek采用华为昇腾等国产芯片替代英伟达GPU,以支持国家自主可控战略。尽管DeepSeek尝试使用华为昇腾910C进行训练,但因技术障碍未完全成功,最终仅在推理环节使用国产芯片,训练仍依赖英伟达。 2026年,DeepSeek继续推进底层代码迁移至华为CANN框架,并与寒武纪等国产芯片适配,但面临精度对齐和生态成熟度等挑战,消耗了大量技术资源和时间。与此同时,头部云厂商如阿里、腾讯等也在观望DeepSeek V4的验证结果,以评估国产芯片在大规模AI训练中的可行性。 这一战略转向使DeepSeek从纯技术公司逐渐转变为承担国家使命的企业,但也带来了短期代价:第三方评测显示其代码生成和多模态能力已被部分国际模型超越,核心团队多名成员因薪酬劣势离职。尽管面临市场竞争和技术挑战,V4的发布可能成为中国AI国产化进程中的重要里程碑,其产业意义或许大于技术突破。

文 | 世界模型工场

现在中国互联网只剩下一个问号:DeepSeek V4,到底发不发?

过去一年多,全球模型竞争早已进入拼刺刀模式。

OpenAI、Anthropic、Google等巨头基本保持2-3个月甚至1个月一次大迭代,新版本快速推向市场验证、迭代再验证。

而DeepSeek在过去15个月,大版本更新放缓,V4多次延期,节奏明显落后,已从行业领跑者变成了慢半拍的那个。

等待的焦虑演变成猜疑的漩涡。

4月初,有媒体突然放出风声:V4可能在未来几周发布,但不要对DeepSeek V4有太高期待。

为什么期待已久的发布,要提前打预防针?

这一年,DeepSeek到底发生了什么?

国产化的重任

真相或许藏在一条被大多数人忽略的新闻里。

2025年1月,路透社报道透露了一个细节:Deepseek R1发布后,有关部门鼓励DeepSeek采用华为昇腾处理器,而非继续使用英伟达。

"鼓励"二字,在当时的语境下,重量远超字面意思。

DeepSeek不是普通的创业公司,它是中国AI打破美国技术封锁的第一个成功样本。

这种象征意义,让DeepSeek迅速从一家技术公司,变成了国家自主可控战略棋局上的关键棋子。

紧接着,2月份梁文峰参加了那场万众瞩目的民营企业座谈会。

他被安排坐在第一排,和马化腾、任正非、雷军等科技大佬,并肩成为新质生产力的国家队代表。

政策导向的齿轮,由此开始转动。

据外媒报道,DeepSeek在2025年初确实尝试过用华为昇腾910C芯片训练下一代模型。

但过程遭遇多重技术障碍:训练稳定性不足,大规模分布式场景下频繁崩溃,芯片间通信速度未达预期。

华为派遣工程师团队前往DeepSeek办公地点提供现场支持,最终仍未能解决训练阶段的适配问题。

结果是妥协性的,DeepSeek训练阶段继续切回英伟达GPU,昇腾芯片仅用于推理环节。

这意味着,至少在训练这一核心环节,DeepSeek用了近一年时间在试错。

但适配工作并未停止。2026年,V4版本传出新动向。

据爆料,DeepSeek没有提前给英伟达开放测试权限,反而优先把预发布版本交给华为新一代昇腾950PR芯片做适配。

同时为分散风险,还同步适配了寒武纪芯片。

但技术挑战依然显著。

据媒体报道,这次的目标是从底层代码层面完成迁移,从英伟达CUDA生态全面迁移至华为CANN框架,实现训练与推理全链条的国产化替代。

据接近项目的人士透露,适配工作的核心难点在于精度对齐,确保模型在不同硬件生态下输出一致,这涉及大量底层代码调整。

时间成本由此产生。

当全球主流厂商保持2-3个月模型迭代节奏时,DeepSeek却越来越慢,期间可能有相当大比例的技术资源投入了国产芯片适配。

毕竟国产芯片与英伟达在代际性能、生态成熟度、工具链完备性上确实存在差距,模型适配过程耗时巨大。

这与DeepSeek当初纯粹追求模型性能提升的路径,形成明显分野。

产业链层面的联动也在同步发生。

2026年初,市场传出阿里、字节、腾讯已向华为下单数十万颗昇腾950PR芯片。

一种合理的猜测是:头部云厂商在等待DeepSeek V4的验证结果,以评估国产芯片在大规模AI训练中的实际可用性。

若V4成功跑通,华为950PR将从技术样品转化为可商用产品。若未能达到预期,相当于为行业探明了当前国产芯片的能力边界。

考虑到梁文锋对模型发布的要求一贯极高,达不到预期绝不发的标准,V4终于即将亮相,很可能在推理侧已通过效果测试。

如果真的验证成功,这将是DeepSeek乃至整个中国AI转向自主可控的关键一步。

身份转型的代价

DeepSeek主动承担国产算力生态验证的重任,这种选择让它更像一家国家使命型公司,而非纯粹逐利的市场化玩家。

但转型的代价显而易见:短期节奏放缓、人才压力增大、竞争力暂缓。

根据2026年3-4月多家独立评测和社区数据,DeepSeek在第三方基准测试中,代码生成能力已被Claude 4系列(Opus 4.6 / Sonnet 4.6)显著超越。

DeepSeek的多模态处理能力也主要局限于文本+图像,远落后于Claude和GPT在图像分析、计算机使用和视频理解上的表现。

进入2026年,DeepSeek将产品重点转向更具挑战性的Agent系统工程。

根据当前社区反馈,DeepSeek在代码Agent和中文搜索Agent领域已接近第一梯队,但在多工具协同、长链路任务执行以及真实环境鲁棒性上,仍与OpenAI、Google等国际顶尖模型存在明显的系统工程差距。

这种差距,不一定是技术能力的衰退,更像是在市场竞争与国家战略之间做出权衡后的结果。

组织层面的代价同样显性。

2025年下半年起,DeepSeek核心团队成员开始出现松动。

据晚点LatePost确认,王炳宣(第一代大模型核心作者)、郭达雅(R1核心作者)、魏浩然(OCR负责人)、阮翀(多模态负责人)相继离职。

这些名字背后,是DeepSeek从V1到R1的技术积淀。

流失的动因复杂,但薪酬体系的相对劣势是显性因素。

猎头透露,竞争对手开出的条件是DeepSeek的"两到三倍",部分大厂直接给出八位数总包。

DeepSeek作为未外部融资的初创公司(母公司为幻方量化),薪酬虽绝对值不低,但无法匹配字节、阿里、腾讯等市场化巨头的股权激励和估值溢价。

梁文锋已开始推动公司估值工作,明确期权定价,给团队更多确定感。

但在智谱、MiniMax等同行上市、股价高涨的背景下,留住顶尖人才的压力依然不小。

如今的DeepSeek正在陷入一种身份的模糊。

它仍然需要商业化,仍然需要留住人才,但同时它又被赋予了国产化适配的期待。

这种双重身份带来的冲突,或许正是DeepSeek这一年越来越慢的深层逻辑。

因此,市场对V4的性能预期也在下调。

它未必会成为又一次刷屏的王炸模型,但可能是一个产业意义上的里程碑,证明中国前沿模型可以在国产硬件生态上达到可用水平。

V4的答卷,对于中国AI产业的长期走向可能更为重要。

相关问答

QDeepSeek V4的发布为何多次延期?

ADeepSeek V4的延期主要由于公司承担了国产芯片适配的重任,包括从英伟达GPU迁移至华为昇腾处理器和寒武纪芯片,涉及底层代码调整和精度对齐等技术挑战,导致研发资源分散和迭代节奏放缓。

QDeepSeek在国产芯片适配中遇到了哪些具体技术困难?

A适配过程中遇到训练稳定性不足、大规模分布式场景下频繁崩溃、芯片间通信速度未达预期等问题,尤其在精度对齐和从CUDA生态迁移至华为CANN框架时需大量底层代码调整。

QDeepSeek核心团队为何出现人才流失?

A人才流失主要因竞争对手提供2-3倍薪酬及高额股权激励,而DeepSeek作为未融资的初创公司,薪酬体系上无法匹配大厂的待遇,导致部分核心成员被挖角。

QDeepSeek V4的产业意义是什么?

AV4若成功验证国产芯片(如华为昇腾950PR)在大规模AI训练中的可用性,将推动中国AI产业实现自主可控,成为国产硬件生态从技术样品转向商用产品的关键里程碑。

Q当前DeepSeek的技术能力与国际顶尖模型相比如何?

A在代码生成和多模态处理(如图像分析、视频理解)上已被Claude和GPT超越,在Agent系统工程的多工具协同和长链路任务执行方面仍存在差距,但中文搜索和代码Agent领域接近第一梯队。

你可能也喜欢

70%民众反对AI,美国人希望美国输掉人工智能战争

这篇文章主要讲述了美国社会目前普遍存在的反AI情绪。一项民调显示,高达70%的美国人认为AI发展“太快”,需要加强监管。这种情绪已经从线上蔓延到线下,具体表现为: 1. **公开抵制**:谷歌前CEO埃里克·施密特在大学毕业典礼上鼓励学生拥抱AI时,遭到台下学生集体嘘声和社交媒体嘲讽。科技公司的AI广告被涂鸦破坏,硅谷等地爆发了多次反AI游行示威。 2. **阻碍基建**:各地居民强烈反对在当地建设AI数据中心,担心其推高水电费、消耗水资源、造成热污染及破坏环境。多个数据中心项目因居民抗议而推迟或取消,甚至有议员因支持项目而遭罢免或住所被枪击。 3. **走向极端**:出现了向OpenAI CEO奥特曼住宅投掷燃烧弹、枪击支持数据中心项目的议员等暴力事件。 民众反对AI的主要原因包括: * **担忧失业**:普遍认为AI会取代大量工作岗位,让财富更集中于科技巨头,而大众承担失业风险。 * **经济负担**:数据中心巨大的能耗和水耗,导致电网升级和水资源成本被分摊到居民账单上,推高生活成本。 * **环境影响**:数据中心运行加剧碳排放,阻碍碳中和目标,其废热排放也抬升局部气温,引发环保团体反对。 * **社会与政治忧虑**:担心AI存在偏见、制造虚假信息,影响公众舆论和选举公正;同时也忧虑当前AI投资热潮可能是泡沫,一旦破裂会引发经济衰退。 这一问题已演变为复杂的政治难题。特朗普上台后废除了拜登时期加强AI监管的行政令,转而推行以“创新与竞争力”为先的政策,以在AI竞赛中保持领先。但这引发了其支持者阵营(MAGA)内部“硅谷派”与“极右翼”的分歧,后者与民主党在限制AI发展上形成了临时同盟,共同反对数据中心建设。特朗普面临着在支持其的科技金主与反对AI的草根票仓之间做出艰难抉择的困境。

marsbit30分钟前

70%民众反对AI,美国人希望美国输掉人工智能战争

marsbit30分钟前

Agent接管流量分发权,腾讯、字节、阿里在抢什么?

近日,腾讯、阿里、字节三大互联网巨头几乎同时加码AI智能体(Agent)布局,争夺AI时代的入口主导权。核心在于,谁掌握了Agent,谁就掌握了未来的流量分发权。 **阿里**采取“双子星”策略:千问App正演变为超级Agent,深度接入淘宝、支付宝等生态业务,实现从搜索到交易的全流程操作,并已向外部品牌开放接入;夸克则定位为AI旗舰应用,致力于成为“AI超级框”。在B端,阿里推出企业智能体平台“悟空”,探索“一人AI公司”模式。 **字节**凭借“豆包”App已获超3亿月活,并通过“扣子”平台构建开发者生态,支持多智能体协同。其战略是软硬一体,将豆包能力延伸至AI手机、智能眼镜等硬件,旨在让AI入口无处不在。 **腾讯**的杀手锏藏于微信。正在内测的微信AI智能体可通过右滑直接调用数百万小程序完成任务,将微信生态转化为“服务操作系统”。腾讯试图将AI深度融入现有国民应用,而非另造新入口。 三家的竞争折射出商业逻辑的深刻变化:流量分配权正从“用户自主点击”转向“Agent代为决策”。商业模式从争夺用户时长的“注意力经济”,转向以结果和效率为核心的“意图经济”。未来,服务提供者不仅比拼品牌,更需比拼其接入AI生态的能力。 这标志着从PC网页、移动App到AI Agent的又一次入口更迭,新一轮行业洗牌已然开始。

marsbit2小时前

Agent接管流量分发权,腾讯、字节、阿里在抢什么?

marsbit2小时前

交易

现货
合约

热门文章

如何购买S

欢迎来到HTX.com!我们已经让购买Sonic(S)变得简单而便捷。跟随我们的逐步指南,放心开始您的加密货币之旅。第一步:创建您的HTX账户使用您的电子邮件、手机号码注册一个免费账户在HTX上。体验无忧的注册过程并解锁所有平台功能。立即注册第二步:前往买币页面,选择您的支付方式信用卡/借记卡购买:使用您的Visa或Mastercard即时购买Sonic(S)。余额购买:使用您HTX账户余额中的资金进行无缝交易。第三方购买:探索诸如Google Pay或Apple Pay等流行支付方法以增加便利性。C2C购买:在HTX平台上直接与其他用户交易。HTX场外交易台(OTC)购买:为大量交易者提供个性化服务和竞争性汇率。第三步:存储您的Sonic(S)购买完您的Sonic(S)后,将其存储在您的HTX账户钱包中。您也可以通过区块链转账将其发送到其他地方或者用于交易其他加密货币。第四步:交易Sonic(S)在HTX的现货市场轻松交易Sonic(S)。访问您的账户,选择您的交易对,执行您的交易,并实时监控。HTX为初学者和经验丰富的交易者提供了友好的用户体验。

2.5k人学过发布于 2025.01.15更新于 2026.06.02

如何购买S

相关讨论

欢迎来到HTX社区。在这里,您可以了解最新的平台发展动态并获得专业的市场意见。以下是用户对S(S)币价的意见。

活动图片