英伟达CPU压境,中国RISC-V迎战:半导体深观察之四

marsbit發佈於 2026-06-18更新於 2026-06-18

文章摘要

英伟达即将向中国客户提供其首款专为AI设计的独立CPU Vera,基于Arm架构,单颗售价超2万美元。这凸显了中国在AI算力需求激增下,对CPU架构自主可控的迫切性。文章指出,除了x86和Arm,RISC-V正成为中国突破“不可能三角”(繁荣、可控、自主)的关键赛道。 RISC-V因其开源、模块化特性,被视为实现自主可控且有机会繁荣的路径。当前,中国已成为全球RISC-V发展的热点,受AI算力需求、出口管制压力、开源降本以及政策支持等多重因素推动。国内多家厂商的高性能RISC-V核心在SPEC定点跑分上已触及或超过15分的行业门槛,并实现了3GHz以上的主频,拿到了进入高性能计算俱乐部的“入场券”。 产业焦点已从单核性能转向完整的“计算子系统”,包括自研一致性片上网络(NoC)和满足数据中心要求的全栈RAS能力。已有厂商交付了40核、严格兼容RVA23国际标准的服务器处理器,体现了对生态统一性的重视。在视频编解码、加解密等特定负载上,部分国产RISC-V处理器已接近甚至超越x86/Arm同代产品。 挑战同样严峻。生态碎片化、EDA工具链不完善、验证复杂度高、单核能效追趕、以及先进工艺制约等都是必须啃下的“硬骨头”。业界清醒认识到,在数据中心领域超越成熟架构的周期将比预期更长。 结论是,面对英伟达Vera的敲门,中国自研CPU并非只有跟随Arm一条路。RISC-V赛道已在中国推开大门,并在高性能计算领域取得了实质性进展。虽然前路漫长,充满工程挑战,但它为中国提供了在下一轮算力革命中掌握主动权的可能性。

本周,一则不大不小的消息从英伟达那边传来:面向AI数据中心的新一代CPU Vera,最早八月就能让中国客户下单,单颗售价远超两万美元,一个含256颗芯片的整柜大约一千万美元。据报道已经有一家中国大型云服务公司盘算着先订三百多台双路服务器,每台塞两颗Vera CPU,先在海外数据中心跑一跑测试,再决定是否正式下单。

Vera是英伟达今年三月发布的、首款专为智能体AI设计的独立CPU,基于Arm技术,全面投产,号称运行速度比竞品同类处理器快1.8倍。英伟达CEO黄仁勋自己也承认,由于先进芯片出口管制等因素,公司在中国市场的份额实际已经大大下降。在这种背景下,把Vera送进中国客户的下单系统,既是一次商业动作,也是给那张几乎被清零的牌桌重新发牌。英伟达对Vera这条产品线的财年预期是两百亿美元。

但放在中国这边读这条消息,会读出另一层意思。Vera这颗CPU仍然是Arm架构的,它的下单链路、长期供给的稳定性、价格的谈判权,全都握在他人手里。

当中国的AI基础设施正在以前所未有的胃口吸纳算力,CPU这一层是否一定要押在Arm的牌桌上?除了x86和Arm这两座成熟得几乎垄断的山头,还有没有一条赛道,既能抵抗Arm的引力,又能撑得起高性能计算的重量?

笔者最近在长三角地区各个城市的几次走访里,反复听到同一个名字被提起:RISC-V。

听起来像一句旧话,毕竟RISC-V诞生已经十多年,在嵌入式领域出货量早就上百亿颗。可真正让它在这一两年被反复推上议程的,不是嵌入式的盘子,而是数据中心、服务器、AI算力这一端的天花板被它一次又一次顶起来的迹象。

我们要尝试回答的,就是这个看似旧、其实新的问题。

刚刚出任香港RISC-V联盟首任会长的赛昉科技董事长徐滔,多年前就曾判断,RISC-V有望与x86和ARM三分天下,事在人为:“预测未来最好的方法,就是把它创造出来。”

所以说,当英伟达带着Vera来敲门,中国自研CPU是不是只剩下“对着Arm跟跑”这一种活法。另一条赛道到底有没有路,路通向哪里。

“不可能三角”等着被打破

芯原股份创始人戴伟民博士在去年的行业峰会中,把整个行业的纠结摆成了一道选择题。这道选择题后来被业界沿用,逐渐被叫作CPU产业的"不可能三角"。

它的三个角,是繁荣、可控、自主。

第一种组合,不可控却足够繁荣的,是x86,全球生态最厚、软件最齐、性能最强,却是别人的私域。第二种组合,想要可控的,花足够的钱也能买到授权、能改、能用,但根上仍然是别人定义的架构,谈不上真正的自主。第三种组合,自主可控却注定不够繁荣的,是各家自己关起门来定义的私有指令集,技术上能立得住,生态上却注定只能在小池子里游泳。这三种组合,分别对应着今天x86、Arm授权路线,以及部分国产CPU的现实处境。

三个角,永远只能占到两个。这就是不可能三角的内核。

而RISC-V被戴伟民博士放在三角之外的位置。他认为,真正既自主可控、又有机会真正繁荣起来的路径,眼下只有RISC-V这一条。

理由不是它今天已经赢了,而是它在结构上具备”三个都要“的可能:开源开放的指令集意味着没有任何一家公司可以单点卡住产业链的脖子,模块化可扩展的设计哲学意味着任何一家厂商都能在它身上做差异化,而国际标准的属性又决定了它有机会和Arm、x86一样,承载起足够大的软件生态。

这个判断在笔者走访中得到了相当一致的回应。基本认为,RISC-V对行业最大的贡献,不是另造一颗”中国芯“,而是给所有人重新发了一张牌:x86和Arm用了几十年才挖出来的护城河,在AI重写计算范式的窗口期,第一次显得没那么不可逾越。

但话又必须说回来。打破不可能三角是一个雄心,雄心要兑现成胜势,必须啃下最硬的那块骨头:高性能计算。

嵌入式的盘子RISC-V已经坐稳,但凡把标尺挪到数据中心、服务器、AI算力这些字眼上,问题立刻变得尖锐起来。这就是接下来要顺着走的那条线。

这股劲,要在中国大陆鼓起来

放眼全球,RISC-V并不是中国独有的概念。Google、Meta、高通、英伟达、特斯拉都已经不同程度地拥抱RISC-V,欧盟通过芯片法案投入数十亿欧元支持RISC-V研发,EuroHPC启动了规模约2.4亿欧元的DARE项目,目标是从2025年起逐步把高性能计算处理器替换成RISC-V,背后写着”数字主权“四个字。

同一个RISC-V,中国看见的是供应链安全和成本,世界看见的是面向AI的下一代架构自由,这两股力量恰好在此刻叠加到了一起。

但要把声势真正鼓起来、要把生态真正从嵌入式推到高性能的,眼下最具备主导势能的,就是中国大陆。这个判断背后有N股推力。

首先是AI带来的”算力洪水“。业界基本共识是,到2030年全球半导体规模将迈过万亿美元,其中超过七成与AI相关。AI对算力、内存带宽、芯片间互联的胃口,远远超过以往任何应用,算力的流量像潮水一样涌向高性能这一端。谁手里没有足够的算力底座,谁就会被甩下。

当然还有出口管制带来的供给收紧。美国商务部把先进计算芯片的出口管制一再收紧,英伟达自家承认在华份额近乎清零;新的Vera虽然要来,但价格、节奏、可获得性,没有一项握在中国厂商手里。一边是水涨船高的需求,一边是被卡住的供给,这把剪刀差,正是中国生态最焦虑、也最有想象力的地方。

另外,是开源带来的结构性降本。一位长期做云端芯片选型的业界专家在笔者调研期间,拆解过数据中心的账本。高性能服务器里,GPU和CPU这两类芯片加在一起,能占到硬件成本的五成到八成。任何想压低总账的努力,最终都会落到最贵的那颗芯片上。而RISC-V最独特的地方,恰恰在于它的开源属性:x86是闭源的黑盒,Arm是单一授权方控制的私域,RISC-V则把指令集这层公共品交还给整个行业。当一家厂商不需要支付授权费、不需要被指令集本身卡住脖子,CPU这条产业链的成本结构就有机会被结构性地重写。

在中国大陆,这三股推力之上还叠了一层独有的东西,基本可以归纳为"中央定调、地方加码"。工信部今年发了和RISC-V数据中心相关的高质量发展专项,各地针对硬科技的政策性资金和应用场景同步跟进,这种自上而下与自下而上的合力,是欧洲和美国都不具备的。

更值得玩味的是态度的转折。几年前,国产CPU六大家中曾有负责人当面调侃做RISC-V的“不过是一群乌合之众”。而到了今天,这六家厂商无一例外都通过了国测,其中已经有人愿意做第一个吃螃蟹的,开始认真把自家下一代尝试嫁接到RISC-V上。从“乌合之众”到“第一个吃螃蟹”,中间隔着的,正是这两年技术、政策与市场合力把舆论场拧过来的过程。

如果说欧洲对RISC-V的拥抱主要是被“数字主权”这一个目标驱动,那么中国大陆的推力则是供应链安全、成本结构、技术主权、应用爆发四股力量叠加而来。这也是为什么,今天全球RISC-V最热闹的会场、最密集的IP公司、最激烈的高性能竞速,几乎都集中在中国大陆。

一句业界已成共识的话是:RISC-V是中国主场。

入场券,依旧还是入场券

要量化RISC-V冲高性能计算的进展,业界心照不宣地立了一道门槛:SPEC定点跑分单位频率下做到15分。

这道门槛要稍微展开解释一下,否则容易被误读。SPEC CPU 2006和2017是工业界长期沿用的处理器性能基准测试,定点跑分(SPECint)衡量的是CPU在通用整数运算上的能力,“单位频率”意味着把主频影响剥离出来,单纯比较微架构本身的执行效率。换句话说,这15分比拼的是一颗核心在不依赖时钟拉高的前提下,单位时间能干多少活,它衡量的是设计水平,不是工艺红利。

为什么是15分。因为x86和Arm阵营在高性能CPU上的微架构基线大致就在这个量级附近,再低于这个数字,一颗RISC-V核心就很难宣称自己“和成熟架构在同一个起跑线上”。换句话说,15分不是绝对意义上的天花板,而是一道资格线。能跨过它,意味着进入高性能俱乐部的对话资格;跨不过去,再多的市场叙事也只能停留在嵌入式和中低端。

一位深度参与高性能微架构设计的业界专家,在笔者调研期间阐述过这道资格线背后的产业含义。苹果M系列和Arm Neoverse的成功告诉所有人,要在x86这种成熟架构已经统治几十年的市场里撕开口子,唯一能依靠的是更高的能效比;先要在单位性能上立住,再等先进工艺成熟把主频拉起来。这个路径同样适用于RISC-V。

那么这道线被够到了吗。答案是:被多家中国大陆团队接连够到,甚至越过。

开源阵营这边,国内主流的开源高性能RISC-V核心已经在真实的八核Mesh网络上把跑分做到了14.78分,与此前公开的15分目标基本对齐。

值得一提的是,团队主动澄清了行业对开源的偏见:开源不等于低质量,他们想给行业留下的,是一条切实可用的开源基线。这条基线的意义在于,任何一家中小芯片厂商不必再从零造轮子,从开源核出发即可进入高性能的起跑线,这是x86的黑盒和Arm的单一授权都给不了的能力。

商业IP阵营更是百花齐放。勉强的共识是,目前中国大陆已经有不下五家厂商,把自家高性能RISC-V核心做到了或宣称做到了15分以上,部分团队甚至跑到16到18分这个区间,典型场景的主频冲到了3.4GHz以上。

”迈过3GHz这道大关,才算真正迈入高性能处理器的大门“,这是一位资深架构师在笔者面前甩出的一句颇有气势的判断。

但跑分只是入场券。真正的较量在跑分之外。

从一颗核到一整套系统:另一种工程跃迁

过去一年中国大陆RISC-V最值得说的一次变化,是关注焦点从单颗核心向“计算子系统”的整体跃迁。

理解这件事,要先理解一颗服务器CPU的真实长相。它不只是一颗指令集执行单元,而是几十个核心、共享缓存、内存控制器、IO通道、安全岛、电源管理单元的一整套SoC,外加把这一切组织起来的片上互连网络。后者通常被称作NoC,更准确地说,是一致性NoC:它要保证几十甚至上百个核心看到的内存视图是一致的,是大规模多核系统的中枢神经。

这一层有多关键。英特尔、AMD、英伟达都有自研的一致性总线,Arm有CMN系列IP,华为昇腾有自家的HCCS。全球能把一致性NoC IP做到商业化交付水平的公司本就寥寥可数,每一家都需要十年量级的迭代。一致性NoC做不好,再强的单核也只是孤岛。

而到今天,已经有中国大陆的RISC-V厂商自研了商用化的一致性片上网络。基本共识是,这是国产RISC-V从“做核”走向”做系统“的关键标志。一位接受笔者访谈的从业者说,中国大陆冲击RISC-V服务器芯片高地的企业已经不下十家,这是几年前所有人不敢想的密度。

除了NoC,还有一长串“跑分上一分都不加,却决定服务器愿不愿意装它”的硬指标。BMC(Baseboard Management Controller,远程基板管理控制器)、IPMI(智能平台管理接口)、虚拟介质支持、全栈RAS(Reliability、Availability、Serviceability,可靠性、可用性、可服务性),这些是数据中心运维的最基本要求。还有一项很现实的良率设计,业界称作Partial Goods:当一颗面积巨大的服务器芯片里某个核、某段缓存或某通道DDR坏掉,整颗芯片不能因此报废,必须能屏蔽坏区继续以降级状态出货。这种设计直接影响成品率,影响成品率就意味着影响经济性。

而最能体现野心的,是已经有中国大陆厂商交付出一颗40核、全自研IP的RISC-V服务器处理器。这颗处理器最值得玩味的地方不是规模,而是它的克制:零自定义指令集,百分之百兼容RVA23标准。这背后是一条几乎被反复强调的产业铁律:在服务器市场,规矩比花样更值钱。

RVA23是什么。简单解释一下:它是RISC-V国际基金会2024年定型的应用处理器配置文件(Application Processor Profile),把一组核心扩展指令固化为一个统一的“合约”,包括58项强制扩展和23项可选扩展。任何宣称符合RVA23的处理器,理论上都能运行同一套二进制软件。它对RISC-V生态的意义,类似于Arm当年推出Armv8-A:从“百家争鸣”走向“一个可对话的标准”的关键一步。

零自定义、严格对齐RVA23,意味着这颗芯片放弃了通过私有指令“加buff”刷跑分的捷径,把承诺押在了软件长期兼容性上。基本共识认为,这是过去几年中国大陆RISC-V冲服务器市场最务实的一次姿态调整。

跑分之外的另一组对照数据,更能说明RISC-V向上爬的真实斜率。在视频编解码这种典型负载上,国产RISC-V高性能处理器已经做到了x86同代产品的九成、Arm同代的九成六;在加解密计算上,甚至跑到x86的1.88倍、Arm的1.67倍;大模型推理的核心算子也接近Arm水平的1.67倍。这些数字背后,是一整套包括操作系统、工具链、计算库在内的软硬件交付,而不是一颗孤立的硅。

更让人踏实的是已经回片、已经在客户那里跑起来的芯片。一颗集成八个核的64位国产RISC-V处理器已经在12纳米工艺下完成量产流片,封测回片后两周之内就把Ubuntu图形界面和主流桌面应用全部跑通。它能落地的场景很接地气:边缘侧的大模型一体机、RISC-V原生编译集群、笔记本、云终端,乃至车载,都在它的射程之内。从能跑分到能点亮、再到能装系统、能干活,每一步距离都不近,但每一步都正在被一点点跨过。

真正的对手不是Arm,是Arm身后那条河

可一旦走到这里,必须把另一个事实摆出来:RISC-V向上爬得越高,绕不开的对手就越清晰,不是x86和Arm的指令集本身,而是它们身后那条几十年挖出来的护城河。

这条河叫生态。而它最深的那一段,叫CUDA。

一位曾在英伟达工作多年的资深从业者,在笔者调研期间给同行泼过一盆清醒的冷水。她说,黄仁勋自己从来不认为英伟达是一家芯片公司,今天GPU的真正优势未必在单位算力,而在CUDA那个极其强大的软件生态。全球CUDA开发者数以百万计,这背后是十多年间培育出来的算子库、编译工具链、调试器、Profiler,以及成千上万篇围绕CUDA的论文和教科书。RISC-V要挑战的,正是这座山。

但有趣的地方在于,Arm和x86拿RISC-V没办法的地方,恰恰是RISC-V反攻的支点。中科院计算所的包云岗在与笔者交流时,把RISC-V对AI的机会拆成了三层逻辑,这套逻辑在走访中得到了相当广泛的认同。

第一层是协同。RISC-V本就是从CPU指令集长出来的,在它身上做AI扩展是顺水推舟。八十年代CPU加了浮点指令,九十年代加了多媒体指令(SIMD),最终都融进了主流CPU设计。AI扩展融入CPU,不过是历史又一次重演。而智能体AI时代,需要在多个模型之间反复调用、反复决策的工作负载,恰恰对CPU与加速器之间的贴身协同提出了更高要求。这一点其实正是英伟达Vera这种“专为智能体AI打造的独立CPU”想去解决的问题。如果RISC-V能把AI扩展指令做进CPU基线,等于在协同这一层就抢先一步。

第二层是裁剪。AI推理场景的多样性远超训练,云端要满血大模型,边缘要蒸馏版,端侧又要极致功耗。x86和Arm的指令集都是“全集合”,裁不下来;RISC-V天生的模块化设计意味着,每一个厂商都可以从一组扩展中(M整数乘除、A原子操作、F单精度浮点、D双精度浮点、V向量等)挑选自己需要的子集,做出更紧凑、更对症的产品。

第三层也是最要命的一层,是软件栈。当前中国国内的AI芯片公司大多是垂直烟囱式各做各的,软件团队规模动辄几百上千人,重复劳动一遍又一遍。一组在业界流传的数字是,国内某头部GPU厂商一千多人的研发团队里,做芯片的只有两百多人,其余六七百人都在做软件。如果RISC-V能在AI指令集层面统一标准,软件栈、编译器、算子库就能跟着统一,芯片厂商可以轻装上阵,把精力还给微架构和工艺。这,才是有机会和CUDA真正掰手腕的路径。

至于AI芯片底层未来长什么样,业界给出了两种想象。一种被称作Baby RISC-V的玩法:在加速器内部塞进一大堆又小又简单的RISC-V核,专门负责调度数据怎么流动、什么时候用什么指令,把宝贵的硅面积全让给计算单元。Tenstorrent是这条路线的代表,中国大陆也有团队在这个方向上做尝试。

另一种是Big RISC-V,把RISC-V当作高性能主控核心,承担调度和重型任务。基本认为,两条路线并不互斥,未来更可能是Baby和Big在同一颗SoC里并存,底下无论是什么物理器件、什么矩阵单元、什么向量引擎,都通过RISC-V拿到一个统一的软件编程接口。这个接口,才是生态繁荣的根。

更大胆的设想,已经有人把它画成了一条演进曲线:从RISC-V加AI(CPU加加速器的简单耦合),到AI加RISC-V(AI算力为主、RISC-V控制为辅),最终走到RISC-V等于AI(指令集与AI算力深度融合,CPU即AI计算的底盘)。这条曲线是否成立还要看接下来五到十年的工程兑现,但它至少说明,RISC-V对AI的想象空间,远不止“在Arm之外做一颗替代品”那么简单。

真问题一个都不少,而且都很硬

讲到这里,故事像是被讲圆了。但一篇负责任的行业分析文章,必须把另一半摊开来讲:RISC-V冲高性能计算,真问题一个都不少,而且都很硬。

第一个真问题,是生态的不完整和碎片化。蓝芯算力高级软件与生态总监许庆伟在笔者面前把话说得很不留情面:RISC-V相比x86和Arm,最大的挑战就是生态不完整、规范不完整、生态碎片化,外加软件成熟度不够。碎片化的根子在自定义指令,每一家厂商都想用私有扩展拉出差异化,最终的结果是软件生态被撕成一片片孤岛。前文提到的那颗“零自定义、全RVA23”的服务器CPU,本质上正是对这个真问题最务实的回答:把规矩看得比花样重。

第二个真问题藏在工具链和验证里。EDA这一环,国产RISC-V的短板暴露得格外清楚。国际EDA巨头,新思科技的技术总监张春林在一次行业活动上告诉笔者,工业界给Arm配齐了非常完备的兼容性测试集和Benchmark,而RISC-V这块还差得远;加上各家拿开源去做定制化指令,每一次定制都意味着一笔不小的验证工程。还有另一重难处:RISC-V是开放架构,今天随手改一段代码,效果到底是变好还是变糟,谁也不愿意等芯片流片回来才知道答案,所以软硬件协同验证必须前置到流片之前完成。

验证有多难?一组业界已经公开的数据是,国内开源高性能核心团队的模拟器与RTL在SPEC定点上的初始性能误差高达12.4%,浮点更是高达30.6%,意味着仿真预测和真实性能严重失真。很多公司花了大量功夫做细粒度校准,才把这两个误差硬生生压到了1.8%和2.6%。这些数字背后,是高性能处理器开发里最不性感却最磨人的苦工,也是任何一家想做服务器CPU的团队都绕不过去的功课。

还有单核性能与能效这两座绕不过去的山。目前行业的基本共识是,当前国产RISC-V芯片的单核性能和片上互联总线性能仍处在追赶阶段,要在数据中心站稳脚跟,还有很多路要走。能效的较量则更隐蔽,它依赖工艺、依赖电源管理、依赖最底层的电路设计,每一项都是x86和Arm阵营用几十年砸出来的肌肉。

晶心科技董事长林志明打过一个特别好懂的比方:从前的晶体管像睡平地上的床,FinFET之后大家改睡立体的3D床,再往后就像在一颗芯片上盖摩天大楼,目的都是在有限的物理空间里挤出更多算力。后摩尔时代谁能把这栋楼盖得又高又省电,谁就赢。RISC-V要在这栋楼里和成熟架构比能效,靠的不是指令集本身,而是近乎手艺人的电路设计活儿,用定制数据通路硬生生把主频和能效抠出来。

最现实的一项,则是工艺和时间。国产高端工艺确实还有问题,这只是一个过渡态。今天敢投片,明天通道收窄拿不回流片怎么办,每家芯片厂商心里都有自己的一本账。中国移动云计算产品部芯片技术总监刘亚南在笔者调研期间说过一句相当坦诚的话:前途是光明的,一定会胜利,但这个过程,尤其是在数据中心领域,周期会超过大家的预期。这句话值得被反复引用,因为它代表了产业界对RISC-V冲高性能这件事最清醒的预期管理。

门已推开,路尚漫长

绕了一大圈,回到开头那个问题:当英伟达带着Vera来敲门,中国自研CPU是不是只剩下“对着Arm跟跑”这一种活法。

所有证据指向同一个答案:另一条赛道是存在的,并且这条赛道的主场就在中国大陆。15分这道入场券,国产已经有不止一家拿到手了;一致性NoC、RAS、Partial Goods这些数据中心的硬指标,也开始被一家家啃下;零自定义、严格对齐RVA23的服务器CPU已经流片,标志着这个产业开始真正按“服务器规矩”长大;汽车、通信、视频转码这些落地场景,已经在用真实订单为RISC-V背书。

但同样必须承认,整机性能头对头对标x86和Arm的标杆产品还没真正出现,CUDA这座生态护城河也远不是几年能挖通的。RISC-V向上爬的每一步,都伴随着碎片化、EDA短板、单核能效、工艺红利、机密计算等真问题,这些问题没有一个可以靠口号或政策一夜解决。

破局”不可能三角“不是一句口号。它意味着RISC-V必须同时把自主、可控、繁荣三件事拼到一起,而每一件单独拿出来都是几十年才能做成的事情。如今的局面是自主的底子已经打下,可控的工程在路上,繁荣的雏形依稀可辨。门是推开了,但门后面是一条比所有人预期都要长的路。

英伟达Vera八月会进入中国客户的下单系统,标价远超两万美元一颗。它会被多少中国客户接住、能在多长时间里维持供给、又会在哪一刻因为下一轮管制收紧而变成一颗“用一颗少一颗”的存货,这些都是产业的近忧。RISC-V不可能在八月这个时间点接住所有需求,它也不必去接。它要回答的不是当下这一颗CPU的供给问题,而是十年之后,当下一波算力革命再次袭来的时候,中国自研CPU是不是还要把命运押在别人的牌桌上。

那群曾经被叫作“乌合之众”的人,如今手里握着的是一张被他们一点点攒起来的入场券。能不能一起把那些不性感的苦工一件件做完,让RISC-V真正在高性能计算的牌桌上有自己的位置,这是接下来五年里,中国自研CPU这条赛道上最值得被反复追问的问题。

本文来自微信公众号: 大橘财经 ,作者:观网财经,原文标题:《英伟达CPU压境,中国RISC-V迎战——半导体深观察之四》

相關問答

Q英伟达即将向中国客户发售的AI数据中心CPU是什么型号?其定价和上市时间如何?

A英伟达即将向中国客户发售的是面向AI数据中心的新一代CPU,名为Vera。它最早将于八月允许中国客户下单,单颗售价远超两万美元,一个含256颗芯片的整柜大约一千万美元。

Q文章中提到的CPU产业“不可能三角”指的是什么?RISC-V被置于何种位置?

ACPU产业的“不可能三角”指的是繁荣、可控、自主这三个目标难以同时实现。它具体表现为:x86架构繁荣但不可控;Arm授权路线可控但不自主;私有指令集自主可控但不够繁荣。RISC-V被文章认为是有机会打破这个“不可能三角”的路径,因为它开源开放、模块化可扩展,具有同时实现自主、可控和繁荣的潜力。

Q为什么说RISC-V在高性能计算领域的进展需要以“SPEC定点跑分单位频率下做到15分”作为门槛?

A“SPEC定点跑分单位频率下做到15分”是业界衡量RISC-V能否进入高性能计算领域的一道关键资格线。SPEC测试衡量CPU的通用整数运算能力,“单位频率”排除了主频影响,纯粹比较微架构效率。这个分数水平大致与x86和Arm高性能CPU的微架构基线相当。达到或超过15分,意味着RISC-V核心的设计水平达到了与成熟架构对话的起点,是进入服务器、数据中心等高端市场的“入场券”。

Q除了单核性能,文章指出RISC-V要进军服务器市场还必须攻克哪些系统级挑战?

A除了单核性能,RISC-V要进军服务器市场还必须攻克一系列系统级挑战,主要包括:1. 一致性片上网络(NoC):这是组织几十上百个核心协同工作的“中枢神经”,技术门槛极高。2. 数据中心运维基础要求:如基板管理控制器(BMC)、智能平台管理接口(IPMI)、全栈可靠性、可用性、可服务性(RAS)等。3. 良率设计(Partial Goods):确保芯片部分单元损坏后仍能降级使用,直接影响经济性。4. 严格遵循标准(如RVA23):放弃私有指令扩展,确保软件长期兼容性,这对构建统一生态至关重要。

Q文章认为RISC-V在应对AI时代计算需求方面,相比x86和Arm有哪些独特的结构性机会?

A文章认为RISC-V在AI时代拥有以下独特机会:1. **协同优势**:其模块化设计便于将AI扩展指令顺滑融入CPU基线,优化CPU与AI加速器之间的协同,这对于需要频繁决策调用的智能体AI尤为重要。2. **裁剪灵活性**:天生模块化允许厂商根据云端、边缘、端侧等不同AI推理场景的需求,裁剪出更紧凑、能效更高的定制化指令集,而x86和Arm是“全集合”难以裁剪。3. **统一软件栈的潜力**:有望在AI指令集层面形成统一标准,从而避免当前国内AI芯片公司“烟囱式”开发导致的软件生态重复建设,让厂商能集中精力于硬件创新,这是挑战CUDA生态护城河的关键路径。

你可能也喜歡

Dylan Patel:黄仁勋力赞的SemiAnalysis,创始人是“养蜂人”、“贴吧老哥”

SemiAnalysis是一家快速崛起的独立半导体行业投研机构,年营收有望突破1亿美元,其创始人Dylan Patel的经历颇为传奇。他并非科班出身,成长于美国佐治亚州乡村,甚至曾当过养蜂人。他的半导体知识主要通过在Reddit等技术论坛以“贴吧老哥”式交流自学而来。 2020年,Dylan创立了个人博客SemiAnalysis,起初仅为小众技术分享。后在朋友建议下转向付费订阅,并逐渐发展为一个提供深度技术分析、商业咨询和研报的机构。如今,SemiAnalysis已拥有约60人的全球团队,并在美国建立了专业的芯片拆解实验室。 该机构以其硬核、细致的分析在业内建立起极高声誉,甚至能直接影响巨头决策。其关于AMD MI300X GPU软件栈存在问题的批评性报告,曾直接促使AMD CEO苏姿丰与之进行长时间通话,后者公开感谢其“建设性反馈”。随后SemiAnalysis发布的追踪报告也对AMD的改进给予了肯定。 英伟达创始人黄仁勋也曾在公开演讲中引用并称赞其报告。其分析内容时常能引发市场波动,例如近期一份关于英伟达AI服务器内存配置调整的研报被部分解读后,曾导致多家内存概念股股价下跌,尽管Dylan本人称报告原意被断章取义。 从论坛发烧友到受行业巨头尊敬的机构创始人,Dylan Patel与SemiAnalysis的故事,展现了深度、独立的技术分析在当今半导体与AI产业中的关键影响力。

marsbit42 分鐘前

Dylan Patel:黄仁勋力赞的SemiAnalysis,创始人是“养蜂人”、“贴吧老哥”

marsbit42 分鐘前

以太坊Q1报告:链上活跃度创新高,代币化资产领跑全行业

以太坊2026年第一季度报告显示,其链上活跃度创下历史新高,但以美元计价的资产规模和手续费收入同步收缩,呈现“量涨价跌”的两极分化态势。 **核心数据:** - **活跃度创新高**:月活跃用户达1320万个(环比+53.5%),一层网络交易量2.004亿笔(环比+38%),平均TPS升至25.78。这得益于1月的BPO#2升级,大幅提升了网络承载能力,导致单笔交易成本下降,总手续费环比减少47.9%。 - **生态规模领先但环比收缩**:全生态总锁仓资产3162亿美元(环比-11%),但仍占据五大公链总锁仓的71%。去中心化交易所交易量1345亿美元(环比-24%),略低于BNB链。生态手续费总收入20亿美元(环比-16.9%),但仍占五大公链总和的58.4%。 - **代币化资产领跑行业**:链上代币化资产总市值2034亿美元,同比大幅增长42.9%。其中,稳定币(1789亿美元)占比最大,代币化基金(194亿美元,环比+4.9%)和大宗商品(47亿美元,环比+60%)增速显著。以太坊在代币化基金和大宗商品赛道的市场份额分别高达73%和84%,显示出极强的统治力。 - **ETH基本面承压**:ETH完全稀释市值环比大跌30.3%至2900亿美元,是主要估值指标中跌幅最大的。但质押比率升至0.31,持币地址数环比增长8.1%至2.928亿个,表明用户长期信心仍在。 **核心解读:** 报告认为,当前“活跃度上升、手续费下降”的现象是网络主动扩容、牺牲短期收入以换取长期增长的体现,符合“杰文斯悖论”。类比互联网发展史,开放、无需许可的以太坊生态在积累了足够的流动性、开发者工具和机构案例后,已跨过临界点,成为机构布局代币化金融的首选底层网络。其在中立性、流动性和可组合性上的优势难以被私有链替代。未来随着监管成熟和扩容持续推进(如计划中的Glamsterdam升级),以太坊作为全球金融核心结算层的地位有望进一步巩固。

marsbit49 分鐘前

以太坊Q1报告:链上活跃度创新高,代币化资产领跑全行业

marsbit49 分鐘前

CryptoQuant指标显示鲸鱼在比特币64,000美元支撑位附近积累

加密货币分析平台CryptoQuant的数据显示,当比特币价格测试64,000美元支撑区域时,现货市场平均订单规模出现激增。这一指标通过交易量除以交易笔数计算,可用于区分市场活动是由小额零售订单还是大额资金流驱动。 分析指出,在价格承压的关键支撑位附近出现平均订单规模上升,可能意味着大型买家(鲸鱼)正在逢低吸纳,而非等待明确突破。这虽然不能保证市场已触底,但为交易者提供了一个关注该支撑区域能否持续守住的理由。 文章强调,并非所有交易量都具有同等意义。由大量小额交易驱动的高成交量可能反映恐慌或短期投机,而平均订单规模的急剧上升则往往指向大型参与者入场。不过,该指标需结合其他证据(如价格企稳、卖压减轻或订单簿深度改善)来综合判断,因为它有时也可能反映交易所内部钱包转移或批量执行等非方向性操作。 目前,64,000美元区域已成为市场焦点。该数据显示有大买家可能愿意捍卫此区域,但后续价格能否守住支撑并开始收复失地,对于判断该信号的真正含义至关重要。鲸鱼的买入行为是市场中的一个线索,表明此次回调并非全由恐慌驱动,但它并不能消除宏观风险、ETF资金流敏感性等影响因素,也不能直接等同于看涨趋势的反转。 总之,当前数据支持了存在谨慎的积累叙事的观点,但并未给出明确的多头反转信号。

bitcoinist1 小時前

CryptoQuant指标显示鲸鱼在比特币64,000美元支撑位附近积累

bitcoinist1 小時前

俄罗斯一边说“USDC 可以用了",一边又要对它收 3% 的钱?

俄罗斯财政部近期就加密货币监管作出两项关键表态,看似矛盾实则统一。首先,其宣布对USDT、USDC、BNB等被视作“高风险”或“不友好”的外国稳定币征收最高3%的专项费用,理由是这些资产背后的发行方有能力配合外部司法要求冻结资金。随后,又表示将USDC与比特币、以太坊、USDT一同列入“受监管名单”,允许其进入合法交易范畴。 这反映出俄罗斯对加密货币的核心立场并非禁止,而是“严格监管、纳入体系”。其策略类似于海关管理:允许特定资产“入境”,但通过差异化收费(风险高的收费高,风险低或友好的收费低甚至免收)进行风险定价和流向引导。这旨在将国际流通的主流加密资产纳入本国监管框架,增加税收,同时鼓励资金流向与卢布或友好国家货币挂钩的“更可控”的数字资产。 这一系列举措的紧迫性,与外部制裁压力直接相关。欧盟正计划升级对俄加密货币制裁,试图限制俄罗斯接入全球加密服务网络,尤其针对其用于跨境结算的通道。俄罗斯因此加速立法,意在外部封锁完全形成前,建立国内加密监管闭环,减少对美元体系稳定币的依赖,保障对外金融通道的自主性。 最终,加密资产的属性在复杂地缘政治下已超越单纯的投资工具,成为不同司法管辖区间争夺规则制定权和金融通道控制权的关键接口。俄罗斯的举措正是为此布局。

marsbit1 小時前

俄罗斯一边说“USDC 可以用了",一边又要对它收 3% 的钱?

marsbit1 小時前

交易

現貨
合約
活动图片