从“可用”到“好用”,国产算力跨越了吗?四小龙财报背后的喜与忧

marsbit發佈於 2026-04-27更新於 2026-04-27

2025年12月至2026年初,短短一个多月内,摩尔线程、沐曦股份相继登陆科创板,壁仞科技、天数智芯扎堆港股挂牌。四家头顶“国产GPU四小龙”光环的企业集体完成资本化跨越,合计募资规模超百亿港元。国产算力芯片赛道,终于从漫长的“PPT造芯”阶段,迈入了接受财报检验的“交卷时刻”。

国产算力的2025年,是一场关于“证明”的年份——证明国产GPU可以规模化量产,证明万卡集群能够稳定运行,证明资本市场愿意为国产算力的未来下注,证明国产算力能撑得起万亿甚至更高的市场。

最近一段时间,多家国产芯片公司先后发布了上市后首份年度财报,综合数据来看,各家公司营业收入全线大幅增长,但集体亏损的格局也昭示着这个行业的真实处境。在AI算力需求从训练逐步向推理转移的大背景下,国产算力究竟走到了哪一步?

国产算力交出“完美”答卷

2025年,沐曦股份以16.44亿元的营收规模领跑四小龙,同比增长121.26%;归母净利润亏损7.89亿元,较上年同期大幅收窄43.97%。公司近三年营收从2023年的0.53亿元跃升至2025年的16.44亿元,三年间收入规模增长超过30倍。营收增长的核心驱动力来自GPU产品销量的大幅放量——2025年以曦云C系列为主的训推一体GPU板卡销量达33649片,同比增长147.31%,截至报告期末公司GPU产品累计销量已超过5.5万颗。与此同时,沐曦依然保持高强度研发投入,2025年研发费用为10.27亿元,较上年同期增长14.04%,占营业收入比例高达62.49%。

摩尔线程(688795)2025年实现营收15.05亿元,同比增长243.37%;毛利总额达到9.87亿元,较上年同期增长218.43%;归母净利润、归母扣非净利润分别较上年同期亏损收窄38.16%、33.38%。扣除股份支付影响因素后,2025年净利润亏损6.48亿元,较上年同期收窄8.47亿元,收窄比例达56.65%。同时,摩尔线程(688795)保持了高强度的研发投入,全年研发费用13.05亿元,占比为86.68%。

天数智芯2025年实现营收10.34亿元,同比增长91.6%;毛利5.58亿元,同比增长110.5%,毛利增速高于营收增速,经调整净亏损约4.38亿元,同比收窄32.1%。核心通用GPU业务全年收入9.23亿元,同比增长149.6%,占总营收89.3%。细分来看,天垓训练系列收入5.84亿元,同比增长116.7%;智铠推理系列收入3.39亿元,同比大增238.2%——推理业务的爆发式增长,成为天数智芯2025年财报中最亮眼的注脚之一。

壁仞科技2025年营收10.35亿元,同比增长207.2%;毛利5.57亿元,同比增长210.8%,毛利率达到53.8%。然而,公司年内亏损为164.93亿元,同比扩大972.3%——这一数字乍看惊人,但公司解释称主要与赎回负债账面值变动、股份为基础的薪酬开支以及上市费用有关;剔除这些因素后,经调整年内亏损为8.74亿元。研发投入14.76亿元,同比增长78.5%,主要用于新一代GPU架构及AI软件平台的迭代升级。2025年,壁仞科技完成了旗舰通用GPU产品BR106及BR166的全形态量产与规模交付,其中BR166系列于2025年8月开始量产,在不到半年的销售时间内便快速落地,成为营收跨越式增长的核心驱动力。

从行业整体来看,2025年四家国产GPU厂商营业收入均大幅增长,但仍集体亏损。摩尔线程、沐曦股份、天数智芯亏损同比收窄,壁仞科技因研发开支增长等影响亏损规模有所扩大。沙利文中国咨询顾问池钰曾向媒体表示,从行业阶段来看,国产GPU还处在比较早期的快速发展阶段,即便是目前相对靠前的企业,与英伟达这类海外成熟厂商仍存在明显差距。

从“能用”到“好用”,国产算力仍面临挑战

财报数字的火热,不能掩盖国产算力厂商正在面临的深层挑战。

这其中,最为紧要的就是提升集群稳定性和工程化的能力。大模型训练对算力集群的稳定性提出了极高要求。摩尔线程相关技术负责人坦言,用户在选择国产算力时最关心的问题中,“集群长期稳定性”被排在首位,其次才是“框架兼容性和迁移成本”与实际训推性能。这个排序本身就说明了一个事实:对于真正做大模型训练的企业来说,性能差一点可以接受,但训练任务频繁中断、需要反复回滚 checkpoint,可能才是真正的噩梦。

“摩尔线程基于MTT S5000打造的夸娥万卡集群,浮点运算能力达10 Exa-Flops,在Dense模型训练中MFU达60%,在MoE模型中维持在40%左右,有效训练时间占比超过90%,训练线性扩展效率达到95%。”该名负责人介绍。

但在实际行业环境中,万卡级AI集群的稳定性管理仍是一道高难度考题。据行业媒体披露,当前万卡级别的AI集群平均每天会出现一次甚至多次故障,故障来源包括GPU HBM显存错误、高速互联链路抖动、散热不均导致的热节流、甚至电源模块波动等。这不仅是国产算力的挑战,也是全球AI基础设施面临的共性难题——即便英伟达的DGX SuperPOD,在实际运行中也难以做到完全无中断。

国产厂商在稳定性方面的劣势,更多体现在工程经验的积累深度上。英伟达在过去十年中部署了数百个大规模集群,积累了海量的故障模式和调优经验,这些Know-How是无法通过“堆人”快速追赶的。国产厂商往往在实验室环境下跑通了万卡互联,但一旦进入客户真实的生产环境,面对复杂的网络拓扑、混合负载调度、以及非理想条件下的长时间运行,各种“意想不到”的问题就会暴露出来。

其次,生态的建设也是国产算力老生常谈的话题。当前,国产GPU厂商普遍选择了“兼容生态”的务实路径。摩尔线程相关技术负责人表示,其自主研发的MUSA架构对英伟达CUDA具备优良的兼容性,通过MUSIFY自动移植工具,开发者能够以最小成本将国际主流GPU平台应用移植至MUSA GPU,大幅提升应用移植的效率,缩短开发周期。天数智芯和壁仞科技同样在软件栈层面投入大量资源,确保PyTorch、TensorFlow、Megatron-LM等主流框架能够在其硬件上高效运行。

然而,兼容模式在缩短市场导入期的同时,也带来了一个结构性的困境:开发者习惯被锁定在CUDA生态中,国产平台始终停留在“生态附庸”的位置。更深层的问题在于,兼容路线在管理决策上看似捷径,但代价可能是沉重的:国产GPU厂商需要警惕永远做“生态跟随者”的风险。

英伟达的护城河从来不只是硬件算力,而是CUDA生态过去十五年积累的数百万开发者、数千个加速库以及海量的应用案例。要想从“兼容”走向“主导”,国产厂商必须找到一种方式,让开发者愿意主动为国产平台编写原生代码、贡献开源库,而不是仅仅把这里当作CUDA的“备胎”。

摩尔线程和沐曦股份已经意识到这一点。摩尔线程除了提供MUSIFY自动移植工具外,还开源了Torch-MUSA、vLLM-MUSA等多个软件库,试图逐步培育MUSA原生生态。沐曦则以“1+6+X”战略构建产业生态圈,以数字算力底座为核心,在六大重点行业推动国产GPU的深度渗透。但生态建设非一日之功,需要持续数年甚至十年的投入,以及足够的用户规模来形成正反馈循环。

“条条大路通罗马”

面对挑战,国产算力厂商正在用各自的方式寻找破局之路。从已披露的战略布局来看,差异化正成为这一轮竞争的主旋律,即便选择的路径不同,但他们目标却是相似的——如何提升国产算力。

壁仞科技的战略方向,可以概括为"系统先行,推理卡位"。2025年,公司交付了2048卡光互连光交换GPU超节点集群。但集群的实际运行效率和商业化落地效果,仍有待更大规模部署的检验。

在产品迭代方面,壁仞科技计划于2026年推出下一代BR20X芯片及全系列产品,在保持训练优势的同时,为推理需求进行优化——算力密度、内存容量和带宽、互连能力升级,支持FP8/FP4等低精度计算。截至2025年末,壁仞科技持有现金及金融资产共28.96亿元,加上2026年初上市募集的56.31亿元,账面资金较为充裕。不过,对于一家仍处于大规模研发投入期的芯片企业而言,这些资金能在多长时间内支撑其技术迭代与市场扩张,仍是外界关注的问题。

天数智芯选择了一条更具进攻性的路线。今年1月,公司公布了芯片四代架构路线图:2025年天数天枢架构超越英伟达Hopper,2026年天数天璇架构对标Blackwell、天数天玑架构超越Blackwell,2027年天数天权架构超越Rubin,之后转向突破性计算芯片架构设计。

这一路线图的技术承诺最终需要实际产品来兑现,目前尚未有第三方基准测试数据公开验证其性能宣称。在商业化方面,天数智芯已累计服务超340家客户,产品及解决方案在互联网、AI大模型、科研、金融、医疗、教育等领域部署超1000项。公司还推出了面向机器人、智能终端等领域的彤央系列端侧算力产品。四代架构路线图的发布与边端产品的亮相,显示出天数智芯试图在训练、推理和边缘计算三个维度同时发力。但多线作战也意味着研发资源的分散,其能否在任一领域建立足够深的护城河,仍需观察。

沐曦股份的策略则可以概括为"产品全栈化,生态开源化"。在产品端,公司已形成曦云C系列(训推一体与通用计算)、曦思N系列(AI推理)、曦彩G系列(图形渲染)、曦索X系列(科学智能)四大GPU产品矩阵。

2025年7月,首款基于全国产工艺的曦云C600系列在WAIC大会发布,已于2025年末实现风险量产,预计2026年上半年量产销售。但需要指出的是,"全国产工艺"在当前语境下通常指代特定制程节点,其与行业最先进制程的性能差距,是评估产品竞争力的关键变量。面向科学智能场景的曦索X系列首款产品X206配备128GB超大容量显存,于2026年1月正式面世。沐曦计划2026年进一步推进曦索X206、曦云C700等下一代产品的研发及产业化。上市募集资金净额约38.99亿元,将分三至四年投入新型高性能通用GPU研发及产业化等方向。资金分三至四年投入,意味着短期内难以看到全部成果,技术迭代节奏与市场竞争窗口的匹配度,将是其面临的主要考验。

与专注AI计算的同行不同,摩尔线程坚持全功能GPU路线,从游戏显卡到AI计算试图覆盖多个场景。这种路径的优势在于覆盖面广,但同时也意味着在每一细分领域都可能面临更专注竞争对手的挑战。

摩尔线程的GPU支持AI计算加速、图形渲染、物理仿真和科学计算、超高清视频编解码,并声称是国内极少数原生支持从FP8到FP64全计算精度的厂商。在集群工程化能力上,摩尔线程已推出新一代全功能GPU架构"花港",可支持十万卡以上规模的智算集群扩展。其在科学计算和生物制药等垂直领域的表现尤为突出——据公司披露,在分子动力学引擎SPONGE中,MTT S5000性能达到国际旗舰产品的1.7倍;在生物制药分子对接工具DSDP中,性能达到8.1倍。上述数据均来自公司自身披露,尚未有独立第三方在标准化测试环境下的验证结果。这种在特定垂直领域建立的优势,能否转化为可持续的商业模式,仍有待观察。

除了“四小龙”之外,华为昇腾和寒武纪同样是国产算力版图中不可忽视的力量。据行业分析机构披露,英伟达在中国AI加速卡市场的份额已从制裁前的约95%大幅下降至55%左右,2025年国产厂商合计出货量达165万张,占比约41%,其中华为以81.2万颗领跑国产阵营。寒武纪2025年营收达64.97亿元,同比增长453%,实现净利润20.59亿元。这些数据表明,国产算力替代的整体进程正在加速,而“四小龙”面临的竞争格局远比想象中的更复杂——它们不仅要追赶英伟达,还要与华为、寒武纪等本土玩家同台竞技。

2026年,对于国产算力而言,证明的阶段或许正在转向“超越”——超越的不仅是国际对手的技术指标,更是用户对国产算力的信任阈值。正如弗若斯特沙利文数据所预测的,国产通用GPU产品占比有望从2024年的17.4%提升至2029年的超过50%。市场份额的跃迁背后,是技术、生态、工程化能力与商业模式的系统性较量。

而对于国产算力上市公司而言,上市之后的新课题才刚刚开始:如何在高强度研发投入与可持续盈利之间找到平衡?如何在兼容生态与自主创新之间走出一条独特的路?如何在训练需求与推理爆发的结构性切换中抢得先机?

(文|Leo张ToB杂谈,作者|张申宇,编辑丨杨林)

你可能也喜歡

Hyperliquid ETF资产声明引关注,HYPE叙事在X平台持续升温

一篇X平台推文声称,三只在2026年5月推出的Hyperliquid(HYPE)交易所交易基金(ETF)已合计积累了1.58亿美元的资产,从而引发了市场关注。 根据用户AlphaOnChain的帖子,其中Bitwise HYPE ETF据称拥有8800万美元资产,21Shares HYPE ETF则为6600万美元。然而,此数据来源于社交媒体,并非官方基金发行人的正式文件或数据看板,因此需要谨慎对待,更多应被视为市场情绪和话题热度的风向标。 这一话题的热度反映了当前加密市场的关注点可能正在从比特币、以太坊等主流资产向外扩散。Hyperliquid以其链上永续交易和交易所生态而闻名,如果相关ETF产品确实吸引了可观的资金流入,可能表明机构和散户投资者开始将目光投向更具潜力的山寨币领域。HYPE本身结合了去中心化金融(DeFi)、衍生品和交易所基础设施等多个叙事,使其在交易者转向高风险资产时成为一个自然的炒作标的。 对于交易者而言,关键在于区分社交媒体热度与基本面支撑。尽管社交讨论可能在短期内影响市场,但持续的价格上行通常需要经过验证的资金流入、充足的流动性以及生态系统的持续成长作为基础。 因此,虽然Hyperliquid ETF的叙事正在获得更多关注,但在获得官方数据证实前,投资者应保持审慎态度。

bitcoinist51 分鐘前

Hyperliquid ETF资产声明引关注,HYPE叙事在X平台持续升温

bitcoinist51 分鐘前

芯片设备“铁律”,正在被打破

长期以来,半导体设备行业存在一条“买方市场”铁律:设备商在新设备导入时常需大幅降价,后续重复采购时也面临持续压价压力。但这一规则正在被打破。近期,SK海力士的多家设备供应商反向提出涨价请求,反映出AI算力狂潮引发的设备供需失衡。 以TCB(热压键合)设备为例,因HBM4扩产需求,韩美半导体、韩华Semitech等厂商订单激增。尽管混合键合技术被视为未来方向,但在HBM4阶段,TCB因技术成熟、量产风险低仍是主流,且其自身也在不断升级。市场预计TCB与混合键合将在未来一段时间内共存。 AI扩产潮还导致测试设备面临关键零部件(如FPGA、CPU、Driver IC)短缺,这些部件被数据中心优先抢购,致使测试设备交付延迟,形成“AI芯片缺货-扩产-测试设备需求增加-关键部件被抢-设备延期”的连锁反应。 整体上,半导体设备行业正进入由AI驱动的新一轮上行周期。SEMI预计全球设备销售额将持续增长至2027年。增长动力主要来自三条主线:先进逻辑芯片(如台积电、英特尔扩产)、存储(尤其是HBM带动DRAM投资)以及先进封装(如CoWoS)。AI算力需求正在重塑设备市场的格局与定价权。 总之,头部设备商凭借在关键工艺节点上的技术壁垒和产能保障能力,正获得前所未有的议价权,改写半导体行业的利益分配格局。

marsbit1 小時前

芯片设备“铁律”,正在被打破

marsbit1 小時前

TradingView分析师警告:比特币必须守住6万美元,否则面临重大破位风险

比特币目前正处在一个被交易员视为心理和技术关键价位的位置。分析师weslad在6月20日的分析中指出,BTCUSDT已触及一个新的需求区,这可能决定其下一波主要走势。该区域被视为买盘已经介入,但也绝不能失守的防线。 图表分析显示,只要比特币能守住当前需求区,反弹至81,000美元供应区域的概率仍然很高。这将意味着价格回归近期跌势的起点,若买盘能维持压力,可能引发流动性争夺。 跌破6万美元将严重损害看涨前景。该水位被视作多头的底线,若收盘价明确跌破,将破坏看涨结构,并可能导致更深度的下跌。该价位的重要性不仅在于其是整数心理关口,还在于许多交易者都在关注同一支撑位,一旦失守可能触发止损盘、强制平仓和市场情绪转变。反之,若能守住该区域,则能为多头提供有力论据,表明近期抛售已达衰竭点。 上行目标81,000美元固然诱人,但比特币仍需为此创造条件。多头需要捍卫60,000美元,收复附近阻力位,并证明需求足够强劲,能将防御性反弹转变为趋势反转。在此之前,市场格局最好被理解为一个二元化的支撑测试:守住区域,则复苏希望犹存;明确失守,则市场可能开始为更深度的调整定价。

bitcoinist3 小時前

TradingView分析师警告:比特币必须守住6万美元,否则面临重大破位风险

bitcoinist3 小時前

交易

現貨
合約
活动图片