# 架构的所有文章

在 HTX 新聞中心流覽與「架构」相關的最新資訊與深度分析。潘蓋市場趨勢、專案動態、技術進展及監管政策,提供權威的加密行業洞察。

智谱凭什么一天暴涨近30%?

智谱(02513.HK)股价单日暴涨近30%,核心触发因素是公司面向企业客户开放的GLM-5.1高速版API,其模型输出速度达到每秒400个token,刷新全球大模型API速度上限。 这一速度约为行业平均水平的3到5倍,意味着每秒可生成约200个汉字,显著提升了AI任务的执行效率。在AI进入Agent(智能体)时代、任务需要模型进行多轮自我调用的背景下,速度成为关键竞争力,直接影响任务完成时间和智能上限。 实现这一突破依赖智谱在推理引擎、并行策略和网络架构三个层面的技术创新: 1. **TileRT推理引擎**:将整个模型编译成持续运行的流水线,避免传统框架中频繁启动和等待的开销,并通过“Warp专门化”让GPU内不同计算组并行工作。 2. **异构并行策略**:针对GLM-5.1采用的MLA注意力机制,让多块GPU分工协作(如有的负责稀疏检索,有的负责密集计算),优化计算流程。 3. **ZCube网络架构**:取代行业标准的树形网络拓扑,采用扁平化互联设计,使得任意两台GPU间通信路径唯一且最短(仅需2跳),从根本上避免了网络拥塞,提升了集群整体吞吐并降低了延迟。 技术升级带来直接效益:在同等GPU投入下,集群吞吐量提升15%,相当于免费获得更多算力;任务尾延迟下降40.6%,提升了稳定性;网络建设成本因精简结构而节省约三分之一。 从行业影响看,智谱的技术路径证明,在相同算力下可以产出更多,这有助于重构GPU之外的基础设施生态。长期可能侵蚀英伟达在网络侧的溢价,利好能够提供高密度交换机的厂商以及国内光模块企业。同时,该纯软件方案理论上可移植到国产AI芯片,有望降低其软件生态门槛。

marsbit23 小時前

智谱凭什么一天暴涨近30%?

marsbit23 小時前

活动图片