和美国AI「御三家」聊DeepSeekV4和美团LongCat,有意外收获

marsbit发布于2026-04-28更新于2026-04-28

随着DeepSeek-V4的发布,我问了一下闭源大模型的「御三家」如何看待这个竞争对手,它们各自的表态很有意思:

GPT-5.5比较「傲娇」,强调不是一次「终结比赛」的事件,但要「盯紧」这个对手,承认便宜的百万级上下文,会对整个行业都造成压力。

Gemini 3.1则是个「实诚人」,定性DeepSeek-V4属于「掀桌子」级别的危险竞品,当开源模型在自己的舒适区展现出巨大统治力时,「压迫感是极其真实的」。

Claude Opus 4.7显得最「从容」,表态「高兴对于不安」,甚至直言如果DeepSeek-V4在某些任务场景更好用那就切过去,自己「不需要在每件事上都是最优解」。

三个模型之间的细微差别,其实也和各家公司的风格高度相关,OpenAI的狂躁色彩,Google的家大业大,Anthropic的学究气质,完全吻合有没有?

除了DeepSeek V4,同一天,美团也开放测试了新的万亿级参数大模型LongCat-2.0-Preview,在继续向「御三家」追问时,话题开始拐向对于国产算力集群的惊讶,这就更有看点了。

简单来说,从今年开始,中国第一梯队的大模型,已经无碍的放在了数以万计的国产芯片上去做训练,不再是有限尺寸的小打小闹,也没有避重就轻的「只谈推理、不接训练」了。

这在过去被普遍认为是不可能实现的全链路替代,只能说一座冰山的水下体积,要数十倍于能够看到的大小。

行到水穷处,坐看云起时,看岁月之峥嵘啊。

1

前段时间,黄仁勋做客一档播客的对话切片火了。

因为从画面来看,老黄肉眼可见的急了,在关于英伟达迫切想把芯片卖给中国是不是在「资敌」这个话题上,两人竟然聊出了火药味。

黄仁勋连续用了「Childish」(幼稚)这个词来打断主持人的预设立场,并抛出了后来被各家媒体写进标题的那段话:

「如果DeepSeek的新模型首先在华为的芯片上发布,对于美国来说是一个相当糟糕的结果。」

考虑到播客录制的时间,黄仁勋言辞里的「如果」是多余的,因为这在行业里早就是一个公开的秘密了,实际上DeepSeek-V4发布的多次跳票,就是因为要花更多的时间适配国产芯片集群。

所以并没有什么「黄仁勋担心的事情终于成了事实」,他很清楚,自己是在「基于既定事实而去借题发挥」。

所以在上头时,黄仁勋几乎是在以一种斥责的口吻,批评主持人的禁运论及其支持者,认为这是一种失败主义的表现,美国根本不相信自己能够赢得竞争,所以要用拆台的手段,去遏制中国。

有人用视频模型整活,演绎了当时的「真实」气氛,你们可以感受一下:

无论如何,黄仁勋的即兴演出,可能会注定载入AI发展的史册,尤其是对于那些奋力越过山丘的国行模型厂商而言,自己说自己做对了,还不是那么有说服力,来自对手的肯定,才是货真价实的认证。

就,有一种脚下有路、心里有底的滋味。

2

算上DeepSeek-V4和美团LongCat-2.0-Preview,在全球范围内的万亿级参数模型数量上,中国也是第一次超过了美国,站在了「多数派」的一边。

在前些年的最高点,新加坡消费了英伟达近三成的GPU出口,这显然不是新加坡人突然有了拿芯片泡酒喝的兴致,如果不是特别无知的话,就得承认「转口贸易」其实占了很大比重。

训练领先的模型,尤其是大规模参数的模型,离不开英伟达的卡,这在行业里曾是雷打不动的常识。

但在今年这个晚春,那些曾经坚固的铁律,一条接着一条开始松动。

DeepSeek-V4和国产芯片进行了前所未有的深度适配,是大家都已经知道的了,相比它做这件事情的「政治正确」或是「历史使命」,美团的「主动为之」也很值得注意。

美团启动测试的LongCat-2.0-Preview,只看训练规模的话,可能创下了国产算力的新纪录。

据我所知,美团对国产算力的重视,已经持续许久了。通过几年前开始陆续投资半导体领域的那十多家公司,就能看出来——从新材料到圆晶制造,从芯片设计到TPU,不是明星级的头部企业,就是产业内的隐形冠军。

除了为自身的AI战略铺路,也客观上为国产算力贡献了充足的弹药。

现在的情况是,英伟达高端GPU在中国的名义市占率始终是零,却有两个国产的万亿级大模型同一天发布了。

万亿参数,不再是海外大厂的特权了。

3

去年的这个时候,Anthropic一直在抨击大厂囤积算力是「不负责任」的行为,虽然现在已经在被疯狂打脸了——Codex三天两头重置额度,从Claude Code这里骑脸抢人——但在当初的说法里,有一个理由其实是站得住的:

「你把未来一两年的芯片全买光,小公司根本拿不到卡,AI变成少数巨头的游戏,这是反竞争、反创新。」

之所以「天下苦英伟达久矣」,并非大家对这家公司天然抱有憎恶,而是在奇货可居的供需关系里,英伟达把铲子卖出了比金子更高的价格,这一定不合理。

甲骨文的老板埃里森曾说他和马斯克一起去约黄仁勋吃漂亮饭,全程两人几乎就只是在翻来覆去的说一句话:

「求你了,把钱收下。」

事实证明,有竞争是好事,自从Google的TPU被证明可堪大任以来,市场对于英伟达的垄断预期就有了挥之不去的疑虑,加上中国自主芯片集群成功托了新一代大模型,变数就更大了。

要知道,美团的主营业务战火正酣,AI又是个需要持续砸钱的业务,却依然能够掏出LongCat-2.0-Preview这种水平的模型,足以说明国产算力的经济性和第二选择有价值。

在技术社区Linux DO上,已经有开发者对LongCat-2.0-Preview表达了惊喜,「起码美团还在真做事情。」

很多新的地图,都是从一条不起眼的小路画起的。。

4

脱离英伟达苦心经营的生态,不是没有代价的,而DeepSeek-V4和LongCat-2.0-Preview要克服难以想象的困难:

之所以一直强调万亿级参数,是因为参数越大,对显存容量和带宽的要求更高,需要重构整个软硬件的协同工程;

更不用说CUDA的泛用性,模型团队需要针对国产芯片特性重写和优化核心算子,甚至自研全确定性的算子,以确保训练全程的精确可复现;

承认短期差距并不丢人,在万卡集群上长期训练,硬件故障是必然而非意外的,所以需要同步构建完整的容错、检测与恢复体系;

如果效率上不去,成本就是笑谈,要跑通全链路,就必须针对国产环境的特点,对训练框架和模型结构实现亲和设计,确保性能可以满足需求。

⋯⋯路虽远,行则将至。

公允的讲,自从DeepSeek-V3震惊世界以来又过去了一年多的时间,大家希望看到的开源模型赶超闭源模型的画面依然没有出现,Anthropic的年化收入屡创新高也在说明「一分钱一分货」的基本规律。

国产模型的任重道远和弯道超车,恐怕还是要结合中国产业结构的优势进行,我们的无人机、无人车、机器人乃至工业规模,都在真实生产层面拥有全球独一档的稀缺数据。

这些连接万物的场景,可以为芯片厂商提供长期连续、真实负载的场景,来验证芯片的稳定性和可靠性。

上半场拼算力资源,下半场比物理底座,时间还很长,长到足以产生任何结果的可能性。

本文来自微信公众号 “阑夕”(ID:techread),作者:阑夕

热门币种推荐

你可能也喜欢

Hyperliquid ETF资产声明引关注,HYPE叙事在X平台持续升温

一篇X平台推文声称,三只在2026年5月推出的Hyperliquid(HYPE)交易所交易基金(ETF)已合计积累了1.58亿美元的资产,从而引发了市场关注。 根据用户AlphaOnChain的帖子,其中Bitwise HYPE ETF据称拥有8800万美元资产,21Shares HYPE ETF则为6600万美元。然而,此数据来源于社交媒体,并非官方基金发行人的正式文件或数据看板,因此需要谨慎对待,更多应被视为市场情绪和话题热度的风向标。 这一话题的热度反映了当前加密市场的关注点可能正在从比特币、以太坊等主流资产向外扩散。Hyperliquid以其链上永续交易和交易所生态而闻名,如果相关ETF产品确实吸引了可观的资金流入,可能表明机构和散户投资者开始将目光投向更具潜力的山寨币领域。HYPE本身结合了去中心化金融(DeFi)、衍生品和交易所基础设施等多个叙事,使其在交易者转向高风险资产时成为一个自然的炒作标的。 对于交易者而言,关键在于区分社交媒体热度与基本面支撑。尽管社交讨论可能在短期内影响市场,但持续的价格上行通常需要经过验证的资金流入、充足的流动性以及生态系统的持续成长作为基础。 因此,虽然Hyperliquid ETF的叙事正在获得更多关注,但在获得官方数据证实前,投资者应保持审慎态度。

bitcoinist31分钟前

Hyperliquid ETF资产声明引关注,HYPE叙事在X平台持续升温

bitcoinist31分钟前

芯片设备“铁律”,正在被打破

长期以来,半导体设备行业存在一条“买方市场”铁律:设备商在新设备导入时常需大幅降价,后续重复采购时也面临持续压价压力。但这一规则正在被打破。近期,SK海力士的多家设备供应商反向提出涨价请求,反映出AI算力狂潮引发的设备供需失衡。 以TCB(热压键合)设备为例,因HBM4扩产需求,韩美半导体、韩华Semitech等厂商订单激增。尽管混合键合技术被视为未来方向,但在HBM4阶段,TCB因技术成熟、量产风险低仍是主流,且其自身也在不断升级。市场预计TCB与混合键合将在未来一段时间内共存。 AI扩产潮还导致测试设备面临关键零部件(如FPGA、CPU、Driver IC)短缺,这些部件被数据中心优先抢购,致使测试设备交付延迟,形成“AI芯片缺货-扩产-测试设备需求增加-关键部件被抢-设备延期”的连锁反应。 整体上,半导体设备行业正进入由AI驱动的新一轮上行周期。SEMI预计全球设备销售额将持续增长至2027年。增长动力主要来自三条主线:先进逻辑芯片(如台积电、英特尔扩产)、存储(尤其是HBM带动DRAM投资)以及先进封装(如CoWoS)。AI算力需求正在重塑设备市场的格局与定价权。 总之,头部设备商凭借在关键工艺节点上的技术壁垒和产能保障能力,正获得前所未有的议价权,改写半导体行业的利益分配格局。

marsbit56分钟前

芯片设备“铁律”,正在被打破

marsbit56分钟前

TradingView分析师警告:比特币必须守住6万美元,否则面临重大破位风险

比特币目前正处在一个被交易员视为心理和技术关键价位的位置。分析师weslad在6月20日的分析中指出,BTCUSDT已触及一个新的需求区,这可能决定其下一波主要走势。该区域被视为买盘已经介入,但也绝不能失守的防线。 图表分析显示,只要比特币能守住当前需求区,反弹至81,000美元供应区域的概率仍然很高。这将意味着价格回归近期跌势的起点,若买盘能维持压力,可能引发流动性争夺。 跌破6万美元将严重损害看涨前景。该水位被视作多头的底线,若收盘价明确跌破,将破坏看涨结构,并可能导致更深度的下跌。该价位的重要性不仅在于其是整数心理关口,还在于许多交易者都在关注同一支撑位,一旦失守可能触发止损盘、强制平仓和市场情绪转变。反之,若能守住该区域,则能为多头提供有力论据,表明近期抛售已达衰竭点。 上行目标81,000美元固然诱人,但比特币仍需为此创造条件。多头需要捍卫60,000美元,收复附近阻力位,并证明需求足够强劲,能将防御性反弹转变为趋势反转。在此之前,市场格局最好被理解为一个二元化的支撑测试:守住区域,则复苏希望犹存;明确失守,则市场可能开始为更深度的调整定价。

bitcoinist2小时前

TradingView分析师警告:比特币必须守住6万美元,否则面临重大破位风险

bitcoinist2小时前

交易

现货
合约

热门文章

加密市场宏观研报:原油飓风、AI巨浪与比特币的十字路口

全球金融市场正经历一场由地缘冲突引发的系统性重估:霍尔木兹海峡封锁导致原油一度暴涨30%,G7紧急释放储备后涨幅收窄,滞胀风险取代通胀成为核心担忧,美元成为“唯一避风港”并逼近100大关,亚太及美股遭遇“黑色星期一”全线重挫;AI领域则冰火两重天,国家发改委提出“十五五”末10万亿规模目标,OpenClaw项目火爆推动概念股狂飙;比特币在宏观风暴中跌破70000美元关键防线。

589人学过发布于 2026.03.12更新于 2026.03.12

加密市场宏观研报:原油飓风、AI巨浪与比特币的十字路口

相关讨论

欢迎来到HTX社区。在这里,您可以了解最新的平台发展动态并获得专业的市场意见。以下是用户对AI(AI)币价的意见。

活动图片