从“可用”到“好用”,国产算力跨越了吗?四小龙财报背后的喜与忧

marsbitPublicado em 2026-04-27Última atualização em 2026-04-27

2025年12月至2026年初,短短一个多月内,摩尔线程、沐曦股份相继登陆科创板,壁仞科技、天数智芯扎堆港股挂牌。四家头顶“国产GPU四小龙”光环的企业集体完成资本化跨越,合计募资规模超百亿港元。国产算力芯片赛道,终于从漫长的“PPT造芯”阶段,迈入了接受财报检验的“交卷时刻”。

国产算力的2025年,是一场关于“证明”的年份——证明国产GPU可以规模化量产,证明万卡集群能够稳定运行,证明资本市场愿意为国产算力的未来下注,证明国产算力能撑得起万亿甚至更高的市场。

最近一段时间,多家国产芯片公司先后发布了上市后首份年度财报,综合数据来看,各家公司营业收入全线大幅增长,但集体亏损的格局也昭示着这个行业的真实处境。在AI算力需求从训练逐步向推理转移的大背景下,国产算力究竟走到了哪一步?

国产算力交出“完美”答卷

2025年,沐曦股份以16.44亿元的营收规模领跑四小龙,同比增长121.26%;归母净利润亏损7.89亿元,较上年同期大幅收窄43.97%。公司近三年营收从2023年的0.53亿元跃升至2025年的16.44亿元,三年间收入规模增长超过30倍。营收增长的核心驱动力来自GPU产品销量的大幅放量——2025年以曦云C系列为主的训推一体GPU板卡销量达33649片,同比增长147.31%,截至报告期末公司GPU产品累计销量已超过5.5万颗。与此同时,沐曦依然保持高强度研发投入,2025年研发费用为10.27亿元,较上年同期增长14.04%,占营业收入比例高达62.49%。

摩尔线程(688795)2025年实现营收15.05亿元,同比增长243.37%;毛利总额达到9.87亿元,较上年同期增长218.43%;归母净利润、归母扣非净利润分别较上年同期亏损收窄38.16%、33.38%。扣除股份支付影响因素后,2025年净利润亏损6.48亿元,较上年同期收窄8.47亿元,收窄比例达56.65%。同时,摩尔线程(688795)保持了高强度的研发投入,全年研发费用13.05亿元,占比为86.68%。

天数智芯2025年实现营收10.34亿元,同比增长91.6%;毛利5.58亿元,同比增长110.5%,毛利增速高于营收增速,经调整净亏损约4.38亿元,同比收窄32.1%。核心通用GPU业务全年收入9.23亿元,同比增长149.6%,占总营收89.3%。细分来看,天垓训练系列收入5.84亿元,同比增长116.7%;智铠推理系列收入3.39亿元,同比大增238.2%——推理业务的爆发式增长,成为天数智芯2025年财报中最亮眼的注脚之一。

壁仞科技2025年营收10.35亿元,同比增长207.2%;毛利5.57亿元,同比增长210.8%,毛利率达到53.8%。然而,公司年内亏损为164.93亿元,同比扩大972.3%——这一数字乍看惊人,但公司解释称主要与赎回负债账面值变动、股份为基础的薪酬开支以及上市费用有关;剔除这些因素后,经调整年内亏损为8.74亿元。研发投入14.76亿元,同比增长78.5%,主要用于新一代GPU架构及AI软件平台的迭代升级。2025年,壁仞科技完成了旗舰通用GPU产品BR106及BR166的全形态量产与规模交付,其中BR166系列于2025年8月开始量产,在不到半年的销售时间内便快速落地,成为营收跨越式增长的核心驱动力。

从行业整体来看,2025年四家国产GPU厂商营业收入均大幅增长,但仍集体亏损。摩尔线程、沐曦股份、天数智芯亏损同比收窄,壁仞科技因研发开支增长等影响亏损规模有所扩大。沙利文中国咨询顾问池钰曾向媒体表示,从行业阶段来看,国产GPU还处在比较早期的快速发展阶段,即便是目前相对靠前的企业,与英伟达这类海外成熟厂商仍存在明显差距。

从“能用”到“好用”,国产算力仍面临挑战

财报数字的火热,不能掩盖国产算力厂商正在面临的深层挑战。

这其中,最为紧要的就是提升集群稳定性和工程化的能力。大模型训练对算力集群的稳定性提出了极高要求。摩尔线程相关技术负责人坦言,用户在选择国产算力时最关心的问题中,“集群长期稳定性”被排在首位,其次才是“框架兼容性和迁移成本”与实际训推性能。这个排序本身就说明了一个事实:对于真正做大模型训练的企业来说,性能差一点可以接受,但训练任务频繁中断、需要反复回滚 checkpoint,可能才是真正的噩梦。

“摩尔线程基于MTT S5000打造的夸娥万卡集群,浮点运算能力达10 Exa-Flops,在Dense模型训练中MFU达60%,在MoE模型中维持在40%左右,有效训练时间占比超过90%,训练线性扩展效率达到95%。”该名负责人介绍。

但在实际行业环境中,万卡级AI集群的稳定性管理仍是一道高难度考题。据行业媒体披露,当前万卡级别的AI集群平均每天会出现一次甚至多次故障,故障来源包括GPU HBM显存错误、高速互联链路抖动、散热不均导致的热节流、甚至电源模块波动等。这不仅是国产算力的挑战,也是全球AI基础设施面临的共性难题——即便英伟达的DGX SuperPOD,在实际运行中也难以做到完全无中断。

国产厂商在稳定性方面的劣势,更多体现在工程经验的积累深度上。英伟达在过去十年中部署了数百个大规模集群,积累了海量的故障模式和调优经验,这些Know-How是无法通过“堆人”快速追赶的。国产厂商往往在实验室环境下跑通了万卡互联,但一旦进入客户真实的生产环境,面对复杂的网络拓扑、混合负载调度、以及非理想条件下的长时间运行,各种“意想不到”的问题就会暴露出来。

其次,生态的建设也是国产算力老生常谈的话题。当前,国产GPU厂商普遍选择了“兼容生态”的务实路径。摩尔线程相关技术负责人表示,其自主研发的MUSA架构对英伟达CUDA具备优良的兼容性,通过MUSIFY自动移植工具,开发者能够以最小成本将国际主流GPU平台应用移植至MUSA GPU,大幅提升应用移植的效率,缩短开发周期。天数智芯和壁仞科技同样在软件栈层面投入大量资源,确保PyTorch、TensorFlow、Megatron-LM等主流框架能够在其硬件上高效运行。

然而,兼容模式在缩短市场导入期的同时,也带来了一个结构性的困境:开发者习惯被锁定在CUDA生态中,国产平台始终停留在“生态附庸”的位置。更深层的问题在于,兼容路线在管理决策上看似捷径,但代价可能是沉重的:国产GPU厂商需要警惕永远做“生态跟随者”的风险。

英伟达的护城河从来不只是硬件算力,而是CUDA生态过去十五年积累的数百万开发者、数千个加速库以及海量的应用案例。要想从“兼容”走向“主导”,国产厂商必须找到一种方式,让开发者愿意主动为国产平台编写原生代码、贡献开源库,而不是仅仅把这里当作CUDA的“备胎”。

摩尔线程和沐曦股份已经意识到这一点。摩尔线程除了提供MUSIFY自动移植工具外,还开源了Torch-MUSA、vLLM-MUSA等多个软件库,试图逐步培育MUSA原生生态。沐曦则以“1+6+X”战略构建产业生态圈,以数字算力底座为核心,在六大重点行业推动国产GPU的深度渗透。但生态建设非一日之功,需要持续数年甚至十年的投入,以及足够的用户规模来形成正反馈循环。

“条条大路通罗马”

面对挑战,国产算力厂商正在用各自的方式寻找破局之路。从已披露的战略布局来看,差异化正成为这一轮竞争的主旋律,即便选择的路径不同,但他们目标却是相似的——如何提升国产算力。

壁仞科技的战略方向,可以概括为"系统先行,推理卡位"。2025年,公司交付了2048卡光互连光交换GPU超节点集群。但集群的实际运行效率和商业化落地效果,仍有待更大规模部署的检验。

在产品迭代方面,壁仞科技计划于2026年推出下一代BR20X芯片及全系列产品,在保持训练优势的同时,为推理需求进行优化——算力密度、内存容量和带宽、互连能力升级,支持FP8/FP4等低精度计算。截至2025年末,壁仞科技持有现金及金融资产共28.96亿元,加上2026年初上市募集的56.31亿元,账面资金较为充裕。不过,对于一家仍处于大规模研发投入期的芯片企业而言,这些资金能在多长时间内支撑其技术迭代与市场扩张,仍是外界关注的问题。

天数智芯选择了一条更具进攻性的路线。今年1月,公司公布了芯片四代架构路线图:2025年天数天枢架构超越英伟达Hopper,2026年天数天璇架构对标Blackwell、天数天玑架构超越Blackwell,2027年天数天权架构超越Rubin,之后转向突破性计算芯片架构设计。

这一路线图的技术承诺最终需要实际产品来兑现,目前尚未有第三方基准测试数据公开验证其性能宣称。在商业化方面,天数智芯已累计服务超340家客户,产品及解决方案在互联网、AI大模型、科研、金融、医疗、教育等领域部署超1000项。公司还推出了面向机器人、智能终端等领域的彤央系列端侧算力产品。四代架构路线图的发布与边端产品的亮相,显示出天数智芯试图在训练、推理和边缘计算三个维度同时发力。但多线作战也意味着研发资源的分散,其能否在任一领域建立足够深的护城河,仍需观察。

沐曦股份的策略则可以概括为"产品全栈化,生态开源化"。在产品端,公司已形成曦云C系列(训推一体与通用计算)、曦思N系列(AI推理)、曦彩G系列(图形渲染)、曦索X系列(科学智能)四大GPU产品矩阵。

2025年7月,首款基于全国产工艺的曦云C600系列在WAIC大会发布,已于2025年末实现风险量产,预计2026年上半年量产销售。但需要指出的是,"全国产工艺"在当前语境下通常指代特定制程节点,其与行业最先进制程的性能差距,是评估产品竞争力的关键变量。面向科学智能场景的曦索X系列首款产品X206配备128GB超大容量显存,于2026年1月正式面世。沐曦计划2026年进一步推进曦索X206、曦云C700等下一代产品的研发及产业化。上市募集资金净额约38.99亿元,将分三至四年投入新型高性能通用GPU研发及产业化等方向。资金分三至四年投入,意味着短期内难以看到全部成果,技术迭代节奏与市场竞争窗口的匹配度,将是其面临的主要考验。

与专注AI计算的同行不同,摩尔线程坚持全功能GPU路线,从游戏显卡到AI计算试图覆盖多个场景。这种路径的优势在于覆盖面广,但同时也意味着在每一细分领域都可能面临更专注竞争对手的挑战。

摩尔线程的GPU支持AI计算加速、图形渲染、物理仿真和科学计算、超高清视频编解码,并声称是国内极少数原生支持从FP8到FP64全计算精度的厂商。在集群工程化能力上,摩尔线程已推出新一代全功能GPU架构"花港",可支持十万卡以上规模的智算集群扩展。其在科学计算和生物制药等垂直领域的表现尤为突出——据公司披露,在分子动力学引擎SPONGE中,MTT S5000性能达到国际旗舰产品的1.7倍;在生物制药分子对接工具DSDP中,性能达到8.1倍。上述数据均来自公司自身披露,尚未有独立第三方在标准化测试环境下的验证结果。这种在特定垂直领域建立的优势,能否转化为可持续的商业模式,仍有待观察。

除了“四小龙”之外,华为昇腾和寒武纪同样是国产算力版图中不可忽视的力量。据行业分析机构披露,英伟达在中国AI加速卡市场的份额已从制裁前的约95%大幅下降至55%左右,2025年国产厂商合计出货量达165万张,占比约41%,其中华为以81.2万颗领跑国产阵营。寒武纪2025年营收达64.97亿元,同比增长453%,实现净利润20.59亿元。这些数据表明,国产算力替代的整体进程正在加速,而“四小龙”面临的竞争格局远比想象中的更复杂——它们不仅要追赶英伟达,还要与华为、寒武纪等本土玩家同台竞技。

2026年,对于国产算力而言,证明的阶段或许正在转向“超越”——超越的不仅是国际对手的技术指标,更是用户对国产算力的信任阈值。正如弗若斯特沙利文数据所预测的,国产通用GPU产品占比有望从2024年的17.4%提升至2029年的超过50%。市场份额的跃迁背后,是技术、生态、工程化能力与商业模式的系统性较量。

而对于国产算力上市公司而言,上市之后的新课题才刚刚开始:如何在高强度研发投入与可持续盈利之间找到平衡?如何在兼容生态与自主创新之间走出一条独特的路?如何在训练需求与推理爆发的结构性切换中抢得先机?

(文|Leo张ToB杂谈,作者|张申宇,编辑丨杨林)

Leituras Relacionadas

The "Impossible Triad" Is Fundamentally a Pseudo-Problem

The article argues that blockchain's fundamental limitation is not the scalability trilemma (decentralization, scalability, security), which has been largely solved, but the lack of **privacy** and, until recently, clear **legitimacy**. Blockchain is described as a slow, expensive, globally shared computer whose core value is censorship resistance and verifiability. While ideal for native digital assets like money (e.g., stablecoins), its default transparency acts as a **tax**, exposing all transactions and enabling MEV extraction, which deters serious institutional capital. Simultaneously, its permissionless nature created regulatory ambiguity. The piece contends that **privacy** is the missing critical feature. It rejects the false choice between total transparency and complete anonymity. Modern cryptography (like zero-knowledge proofs) enables **compliant privacy**: users can prove facts (solvency, KYC status, compliance) without revealing the underlying sensitive data (specific holdings, identities). This preserves auditability for regulators and eliminates the leak of financial information. With recent regulatory progress (e.g., the GENIUS Act) addressing legitimacy, adding default, provably compliant privacy becomes a pure upgrade. It transforms blockchain from a costly, public ledger into a confidential settlement layer, finally bridging the gap to mainstream institutional and individual adoption of on-chain finance.

链捕手Há 12h

The "Impossible Triad" Is Fundamentally a Pseudo-Problem

链捕手Há 12h

Trading

Spot
Futuros
活动图片