智谱凭什么一天暴涨近30%？

marsbit發佈於 2026-05-23更新於 2026-05-23

文章摘要

智谱（02513.HK）股价单日暴涨近30%，核心触发因素是公司面向企业客户开放的GLM-5.1高速版API，其模型输出速度达到每秒400个token，刷新全球大模型API速度上限。这一速度约为行业平均水平的3到5倍，意味着每秒可生成约200个汉字，显著提升了AI任务的执行效率。在AI进入Agent（智能体）时代、任务需要模型进行多轮自我调用的背景下，速度成为关键竞争力，直接影响任务完成时间和智能上限。实现这一突破依赖智谱在推理引擎、并行策略和网络架构三个层面的技术创新： 1. **TileRT推理引擎**：将整个模型编译成持续运行的流水线，避免传统框架中频繁启动和等待的开销，并通过“Warp专门化”让GPU内不同计算组并行工作。 2. **异构并行策略**：针对GLM-5.1采用的MLA注意力机制，让多块GPU分工协作（如有的负责稀疏检索，有的负责密集计算），优化计算流程。 3. **ZCube网络架构**：取代行业标准的树形网络拓扑，采用扁平化互联设计，使得任意两台GPU间通信路径唯一且最短（仅需2跳），从根本上避免了网络拥塞，提升了集群整体吞吐并降低了延迟。技术升级带来直接效益：在同等GPU投入下，集群吞吐量提升15%，相当于免费获得更多算力；任务尾延迟下降40.6%，提升了稳定性；网络建设成本因精简结构而节省约三分之一。从行业影响看，智谱的技术路径证明，在相同算力下可以产出更多，这有助于重构GPU之外的基础设施生态。长期可能侵蚀英伟达在网络侧的溢价，利好能够提供高密度交换机的厂商以及国内光模块企业。同时，该纯软件方案理论上可移植到国产AI芯片，有望降低其软件生态门槛。

文 | AIDeepDive

今天，"全球大模型第一股"智谱（02513.HK）再次暴涨。

盘中涨幅一度突破30%。收盘报1282港元，全天涨幅超过26%，市值达到5715.7亿港元，再度创下历史新高。

触发这场暴涨的，是一个具体的技术指标：400 tokens/s。

5月22日，智谱正式面向企业客户开放 GLM-5.1 高速版 API（GLM-5.1-highspeed），最关键的核心参数只有一个：模型输出速度达到每秒400个 token，刷新全球大模型厂商 API 速度上限。

我本来认为这又是一次国产大模型的公关包装，但仔细看了下技术细节，终于理解了资本市场背后的逻辑。

400 tokens/s是什么概念？

模型每秒能生成大约200个汉字，相当于一个专业作家一分钟的高强度产出，被压缩到了一秒钟之内。

一位创作者连续伏案数天才能写完的文字量，GLM-5.1 高速版在1分钟内便能交付完毕；一名工程师埋头3天才能完成的系统重构任务，它能在喝一杯咖啡的时间里跑完。

01 速度，比你想的重要

速度，历来是 AI 模型竞争中最容易被忽视的维度。

过去三年，大模型军备竞赛集中在两条赛道：参数规模（模型更大更聪明）和价格战（Token 更便宜更普惠）。"快"，从来不是主角。

这是因为，过去的”快”通常是通过缩小模型参数来实现的。要提速，就必须用更小更精简的模型，代价是能力缩水。

GLM-5.1 高速版这次的意义在于，它在保留旗舰级全尺寸基座能力的同时，将速度推上了400 tokens/s。

无论是从国产模型来说，还是从国际范围来看，"旗舰能力"与"极致低延迟"第一次做到了不妥协。

为什么速度如此关键？因为 AI 的主战场正在发生根本性的迁移。

当AI从ChatBot进入Agent时代，问答已经不是AI的主要场景，而Agent要完成一个任务，往往需要模型进行数十轮甚至上百轮的自我调用：写代码、调接口、搜信息、调用工具……

在这种工作模式下，每一轮调用之间的延迟会被无情地累加放大。一个需要50轮调用的任务，如果每次节省1秒，整个任务就快了将近1分钟。对于 AI 编程助手、语音交互、商业决策系统来说，这种差距是可以决定生死的。

从更深层面来说，在固定时间预算内，更快的推理意味着模型可以完成更深的推理路径、更多轮次的自我验证。速度，正在从系统指标变成智能上限本身。

02 速度这件事，有多难？

那现在行业里在速度方面大概什么水平？

头部厂商中，OpenAI 的 GPT-4o 约在100–150 tokens/s，Anthropic 的 Claude Sonnet 系列约在80–120 tokens/s，国内主流旗舰模型 API 大多在50–100 tokens/s 区间。400 tokens/s 大约是行业平均水平的3到5倍。

更关键的是，这个差距并不是投入更多算力就能弥补的。

一台搭载8块 H200 显卡的服务器，理论上每秒能搬运高达38TB的数据。对于 GLM-5.1，单次生成一个 token 只需读取约42GB的激活参数，纯理论上推算，应该能接近1000 tokens/s。

但现实系统往往只能跑出几十 tokens/s。

这是一个数量级的鸿沟。GPU 不是不够快，而是大量时间都被浪费在了等待、空转和无效调度上。

智谱这次正是在推理引擎、并行策略、网络架构三个层面同时创新，实现了对最终速度的突破。

03 三层技术叠加，逼近硬件物理极限

大模型原来是这样运转的，大模型被分解成一个个独立算子，每个算子单独启动一次计算核心（kernel），计算完就停下，同步等待，再启动下一个。

在训练阶段，每次计算动辄几秒乃至几分钟，这些启动和等待的开销完全可以忽略。但推理时，单次生成一个 token，某个关键步骤可能只需要几十微秒，启动和等待的开销就相对变得不可忽视。

TileRT 的核心思路：把整个模型编译成一个持续运行的引擎，一次启动，永不停歇。

TileRT 在代码编译阶段提前把模型所有计算逻辑静态展开成一条连续流水线，运行时 GPU 始终保持高速运转，计算、数据搬运、通信并行推进，中间结果尽量留在 GPU 内部高速缓存里，不再反复写回慢速显存再重新读取。

这里有一个关键的设计细节：Warp 专门化。

理解 Warp，需要先理解 GPU 的工作方式。GPU 与 CPU 最大的不同，是它内部有成千上万个相对简单的计算单元，这些单元以32个为一组捆绑在一起，这一组就叫 Warp。

同一个 Warp 里的32个单元必须始终同步行动、执行同一条指令，就像军队里的一个班，班长下令所有人同时做同一个动作。

传统框架里，所有 Warp 执行同一套指令序列；TileRT 让不同 Warp 组承担不同职责：一部分专门负责把下一批数据提前搬运进来，一部分专门负责数学计算，一部分专门负责与其他 GPU 通信。三组人同时工作、流水配合，互不等待。

就好比从"一个工人搬砖、砌墙、验收串行干"，变成了"搬砖组、砌墙组、验收组同时转"。

单卡内部的效率解决了，多卡并行又有新挑战。

行业通行做法是张量并行（Tensor Parallel）： 把模型的权重矩阵切分成若干份，每块 GPU 负责其中一份，各自计算完毕后通过高速互联（NVLink）汇总结果。

这套方案对矩阵乘法这类规整的密集计算效果很好，是目前几乎所有大模型推理框架的标准多卡方案。

GLM-5.1 采用 **MLA（Multi-head Latent Attention，多头潜在注意力），这是由DeepSeek 提出一种注意力机制。

传统注意力机制需要把每一步计算的大量中间数据（KV Cache）完整保存下来备用，非常耗显存；MLA 的做法是先把这些中间数据压缩成一个紧凑的"潜在向量"存起来，用的时候再展开还原，显存需求大幅下降，推理效率更高。

但 MLA 的计算流程里有一个特殊环节：需要从大量历史信息中做稀疏索引：类似在一个巨大图书馆里先快速找出最相关的几本书，再精读这几本书。

"找书"这个步骤依赖全局信息，不适合多卡平摊；"精读"才是适合多卡并行的密集计算。如果强行让所有8块 GPU 都参与"找书"，大量时间会浪费在 GPU 之间的同步通信上。

TileRT 的解法是让GPU异构运行：GPU 0 专门担任"图书馆检索员"，负责稀疏索引和路由决策；GPU 1–7 担任"精读分析员"，负责密集的注意力计算和矩阵运算。两类工作者各自采用最适合自己的并行策略协同完成整个计算层。

接下来，TileRT 把 GPU 之间的通信操作也直接内嵌进执行流水线，不再作为独立步骤。对外来看，整个8卡系统完成一层注意力计算只需要一次内核启动，内部的通信和计算全在持续流水线内部无缝完成。

以上两层解决的是单机范围内的问题。当集群扩展到数百乃至数千张 GPU，GPU 之间的数据传输本身就成了新的天花板。

行业通行做法是 ROFT（Rail-Optimized Fat-Tree），这是 NVIDIA 官方推荐方案，业界绝对标配。

它的结构是一棵树：服务器先连接底层的 Leaf 交换机（接入层，直接面向服务器），Leaf 再向上连接 Spine 交换机（骨干层，负责不同 Leaf 之间的互联，如同高速公路枢纽）。数据在两台 GPU 之间传输，必须"先上行到 Spine，再下行到目标 Leaf"，至少经过3跳。

为了避免流量集中在少数链路上，这套架构依赖 ECMP 算法让数据在多条路径之间分配，在互联网流量"统计均匀"的前提下运转良好。

但推理场景的流量完全不均匀。不同请求的上下文长度差异可达数十倍，GPU 之间 KV Cache 的传输方向几乎随机，某几台 Leaf 交换机会周期性地成为热点，触发反压机制，把拥塞从局部扩散到全链路。这种拥塞不是协议调参能解决的，是拓扑结构本身的产物。

ZCube 的根本突破：从架构层面让这类拥塞在物理上无法发生。

核心设计分两步：

第一步，取消 Spine 骨干层，全网扁平化。把所有 Leaf 交换机按奇偶编号分成两组，两组之间完全互联，任意一台奇数交换机连接所有偶数交换机，反之亦然。任意两台 GPU 之间最多经过两台交换机即可互达，跳数从3跳降到2跳。

第二步，也是最精妙的地方：每张 GPU 网卡用两种截然不同的方式分别接入两组交换机。这种特殊拓扑带来一个关键的数学性质：全网任意两张 GPU 之间，有且仅有一条最优路径。

"唯一路径"直接消除了拥塞的根源。传统架构容易出现热点，恰恰是因为有多条路径可选，负载均衡算法选错了就会导致流量集中。ZCube 在设计上消除了"选择"这件事本身：不需要均衡，因为根本没有岔路。

04 同样的硬件条件下，账怎么算？

智谱将 GLM-5.1 生产集群从传统 ROFT 升级到 ZCube 后，得到三个数字：

总结来说的话，同样的 GPU 投入，集群可以服务更多用户；同样的用户体验要求，集群可以少买三分之一的网络设备。效率与成本双向改善。

具体来说，吞吐提升15%，等于免费多出15%的算力。 在GPU数量不变的情况下，吞吐多15%，等价于每个 token 的均摊硬件成本下降约13%，或者说相同成本可以多服务15%的用户。

如果一个集群有1000张 GPU，这次升级相当于凭空多出了150张卡的产能，按当前高端推理卡市价，这是数亿元量级的算力价值。

尾延迟下降40.6%，解决的是稳定性而非平均速度。 一个需要50轮调用的 Agent 任务，如果尾延迟每次减少1秒，整个任务的最坏完成时间就压缩了将近1分钟。

成本减少三分之一，是建设层面的直接节省。 ZCube 取消了 Spine 层，相同集群规模下所需交换机和光模块数量直接减少三分之一。据智谱测算，在万卡规模集群中，仅此一项可节省约2.1亿至6.4亿元。

从长远来看，随着集群规模指数级加剧，GPU 间通信的复杂度增长数倍，拥塞的概率和影响也同步放大。这意味着 ZCube 这类架构级创新的价值，会随着推理集群的持续扩张而加速显现。明天万卡级别的集群收益可能不止今天这15%。

05 写在最后

看完智谱的技术报告，我在想，这是否会像DeepSeek横空出世一样，给行业带来一场风暴？

仔细想想，两者的影响好像在不同的方面。DeepSeek 出来的时候，它证明的是，同样的智能，可以用少得多的算力实现。市场担心"需要的 GPU 变少了"，所以英伟达当天市值蒸发近6000亿美元。

但今天智谱的技术证明：同样的算力，可以产出更多。它是在重构"GPU 之外，其他基础设施应该长什么样"。

短期来看，英伟达不会受到影响，但从长期来看，GPU + NVLink 互联 + InfiniBand 网络 + CUDA 软件生态的护城河正在被“松土”，特别是英伟达 2019 年花 69 亿美元收购 Mellanox 买下的 InfiniBand，英伟达网络侧的溢价会被大幅侵蚀。

此外，ZCube 取消了 Spine 层，但它对 Leaf 交换机的端口密度要求反而更高。受益的是能做高密度、大端口 Leaf 交换机的厂商（锐捷、Arista、博通交换芯片），受损的是主要依赖 Spine 层高端交换机吃溢价的厂商。

2025年 Celestica 和英伟达合计占据约 50% 的 AI 后端网络交换机市场份额，这个格局在 ZCube 范式扩散后会面临重新洗牌。

光模块是这次产业链变化里最直接的受益方向，逻辑非常清晰。对国内光模块厂商（中际旭创、天孚通信等）来说，这是一个结构性利好：不仅总量在涨，而且 ZCube 范式下对高速光模块（800G、1.6T）的需求比传统架构更加集中和迫切。

无论是TileRT还是ZCube 架构，这是一套运行在标准 GPU 之上的纯软件推理引擎，不依赖英伟达私有的硬件特性，理论上可以移植到华为昇腾等国产芯片上。这个方向一旦走通，会大幅降低国产 AI 芯片在推理场景的软件栈门槛。

这或许才是这个技术创新背后更大的意义所在。

你可能也喜歡

Matrixdock连续两年完成独立储备验证，持续完善储备透明体系

近日，BIT旗下RWA代币化平台Matrixdock连续第四次完成半年期独立储备审计，本次审计继续由必维国际检验集团执行，并将代币化白银产品XAGm首次纳入验证范围。审计覆盖了存放在新加坡、香港三座机构级金库中的574根黄金与白银条，确认了底层实物储备与链上代币流通量保持一致。截至审计日，XAUm（代币化黄金）对应黄金重量16,331.184盎司，流通代币量相符，资产价值约6609万美元。XAGm（代币化白银）对应白银重量65,934盎司，在应用调整系数后，储备与65,998.551枚流通代Token保持一致，资产价值约404万美元。 Matrixdock通过定期独立审计、月度储备报表、链上储备证明及金条查询工具，构建了一套名为“储备透明体系”的多层持续验证机制。公司表示，持续由同一家机构审计有助于建立稳定流程，增强长期信任。未来将继续探索与第三方合作，强化资产级验证能力，推动储备资产更广泛地应用于链上金融场景。

marsbit9 分鐘前

marsbit9 分鐘前

Hyperliquid 开放预测市场部署：质押 3000 万美元 HYPE 代币，最高分成 50% 手续费

Hyperliquid 宣布开放其预测市场的部署权限，任何用户只需质押价值约3000万美元的HYPE代币，即可创建自己的预测市场，并有机会获得该市场高达50%的交易手续费作为奖励。此举旨在将预测市场从平台控制转向无许可模式，与Polymarket等对手的集中管理形成对比。部署者需承担风险，若市场规则不清或结算有误，质押金可能被罚没。这一举措正值预测市场经历火热夏季，6月全行业交易量达500亿美元。尽管目前Hyperliquid在该领域份额较小，但其凭借在DEX交易量的强势表现和无许可的永续合约设计，试图以开源基础设施模式在预测市场领域掀起波澜。该功能将先于测试网上线，再部署至主网。文章同期概述了加密货币市场动态：主流币种小幅上涨，比特币ETF持续资金流入，Meme币与NFT市场涨跌互现，以及行业在体育冠名、量子计算防御等领域的进展。

marsbit11 分鐘前

Hyperliquid 开放预测市场部署：质押 3000 万美元 HYPE 代币，最高分成 50% 手续费

marsbit11 分鐘前

法国重拳整治 Polymarket，30 国跟进倒逼欧盟重新定义预测市场

法国国家博彩监管局（ANJ）已下令国内网络服务商屏蔽加密货币预测市场平台Polymarket，将其定性为非法博彩而非金融工具，监管手段升级。此举源于此前资金往来禁令效果不彰，数据显示平台在法国仍有大量访问。监管依据包括用户可通过VPN绕开限制，以及平台缺乏合法博彩的消费者保护机制。调查线索涉及篡改气象数据操纵天气预测合约，以及有交易者大额持仓影响美国大选押注赔率。目前全球已有30多个国家和地区对Polymarket实施管控，但法国作为欧盟最大经济体，其首度采取的全国域名屏蔽措施及将预测市场划入博彩范畴的定性，可能对欧盟产生深远影响。这与欧盟现行的《加密资产市场法规》（MiCA）框架存在冲突，若此定性在欧盟推广，相关平台或面临全面封禁，也将冲击美国合规平台Kalshi的欧洲拓展计划。法国案例正成为欧盟监管的重要参考。

Foresight News16 分鐘前

Foresight News16 分鐘前

OpenAI 至暗时刻：收入恐砍七成，千亿估值还能撑多久？

OpenAI近期面临多重困境：苹果起诉其窃取知识产权，可能导致硬件业务停滞；AI价格战激烈，中国公司如DeepSeek以低成本竞争，迫使OpenAI大幅降价；广告收入预期低迷。若风险叠加，公司2030年收入或暴跌70%，现金流亏损达1650亿美元，千亿估值承压。与此同时，全球市场对AI依赖加深，多个板块（如房地产、公用事业、金融）回报均与AI紧密相关，实际多元化不足。Netflix则因参与度下滑和短视频竞争压力，市值受损，引发对流媒体商业模式可持续性的质疑。文章指出，OpenAI需应对法律、竞争及财务挑战，而整体市场对AI的过度集中也带来风险。投资者需重新评估真正的多元化投资策略。

链捕手20 分鐘前

链捕手20 分鐘前

灰度递交Worldcoin ETF申请，WLD暴涨8% – 后续将如何发展？

灰度投资公司（Grayscale）在2026年7月20日向美国证券交易委员会提交了S-1文件，申请推出世界币（WLD）交易所交易基金，计划以代码“GWLD”在纳斯达克上市。该信托基金旨在让投资者无需直接购买或管理加密货币即可获得WLD的价格敞口，但它并非受监管的商品池或注册投资公司，意味着投资者保护措施与传统基金不同。消息传出之际，世界币价格在发布时上涨约7.97%，至0.3858美元。与此同时，灰度旗下的其他ETF表现不一：其比特币ETF在7月20日录得4140万美元资金流入，而GBTC则出现4540万美元流出，其他山寨币ETF则无资金流动。分析指出，尽管现货比特币ETF自7月14日以来持续获得资金流入，但尚不足以显著推高价格。

ambcrypto30 分鐘前

ambcrypto30 分鐘前

交易

現貨

熱門文章

什麼是 $S$

理解 SPERO：全面概述 SPERO 簡介隨著創新領域的不斷演變，web3 技術和加密貨幣項目的出現在塑造數字未來中扮演著關鍵角色。在這個動態領域中，SPERO（標記為 SPERO,$$s$）是一個引起關注的項目。本文旨在收集並呈現有關 SPERO 的詳細信息，以幫助愛好者和投資者理解其基礎、目標和在 web3 和加密領域內的創新。 SPERO,$$s$ 是什麼？ SPERO,$$s$ 是加密空間中的一個獨特項目，旨在利用去中心化和區塊鏈技術的原則，創建一個促進參與、實用性和金融包容性的生態系統。該項目旨在以新的方式促進點對點互動，為用戶提供創新的金融解決方案和服務。 SPERO,$$s$ 的核心目標是通過提供增強用戶體驗的工具和平台來賦能個人。這包括使交易方式更加靈活、促進社區驅動的倡議，以及通過去中心化應用程序（dApps）創造金融機會的途徑。SPERO,$$s$ 的基本願景圍繞包容性展開，旨在彌合傳統金融中的差距，同時利用區塊鏈技術的優勢。誰是 SPERO,$$s$ 的創建者？ SPERO,$$s$ 的創建者身份仍然有些模糊，因為公開可用的資源對其創始人提供的詳細背景信息有限。這種缺乏透明度可能源於該項目對去中心化的承諾——這是一種許多 web3 項目所共享的精神，優先考慮集體貢獻而非個人認可。通過將討論重心放在社區及其共同目標上，SPERO,$$s$ 體現了賦能的本質，而不特別突出某些個體。因此，理解 SPERO 的精神和使命比識別單一創建者更為重要。誰是 SPERO,$$s$ 的投資者？ SPERO,$$s$ 得到了來自風險投資家到天使投資者的多樣化投資者的支持，他們致力於促進加密領域的創新。這些投資者的關注點通常與 SPERO 的使命一致——優先考慮那些承諾社會技術進步、金融包容性和去中心化治理的項目。這些投資者通常對不僅提供創新產品，還對區塊鏈社區及其生態系統做出積極貢獻的項目感興趣。這些投資者的支持強化了 SPERO,$$s$ 作為快速發展的加密項目領域中的一個重要競爭者。 SPERO,$$s$ 如何運作？ SPERO,$$s$ 採用多面向的框架，使其與傳統的加密貨幣項目區別開來。以下是一些突顯其獨特性和創新的關鍵特徵：去中心化治理：SPERO,$$s$ 整合了去中心化治理模型，賦予用戶積極參與決策過程的權力，關於項目的未來。這種方法促進了社區成員之間的擁有感和責任感。代幣實用性：SPERO,$$s$ 使用其自己的加密貨幣代幣，旨在在生態系統內部提供多種功能。這些代幣使交易、獎勵和平台上提供的服務得以促進，增強了整體參與度和實用性。分層架構：SPERO,$$s$ 的技術架構支持模塊化和可擴展性，允許在項目發展過程中無縫整合額外的功能和應用。這種適應性對於在不斷變化的加密環境中保持相關性至關重要。社區參與：該項目強調社區驅動的倡議，採用激勵合作和反饋的機制。通過培養強大的社區，SPERO,$$s$ 能夠更好地滿足用戶需求並適應市場趨勢。專注於包容性：通過提供低交易費用和用戶友好的界面，SPERO,$$s$ 旨在吸引多樣化的用戶群體，包括那些以前可能未曾參與加密領域的個體。這種對包容性的承諾與其通過可及性賦能的總體使命相一致。 SPERO,$$s$ 的時間線理解一個項目的歷史提供了對其發展軌跡和里程碑的關鍵見解。以下是建議的時間線，映射 SPERO,$$s$ 演變中的重要事件：概念化和構思階段：形成 SPERO,$$s$ 基礎的初步想法被提出，與區塊鏈行業內的去中心化和社區聚焦原則密切相關。項目白皮書的發布：在概念階段之後，發布了一份全面的白皮書，詳細說明了 SPERO,$$s$ 的願景、目標和技術基礎設施，以吸引社區的興趣和反饋。社區建設和早期參與：積極進行外展工作，建立早期採用者和潛在投資者的社區，促進圍繞項目目標的討論並獲得支持。代幣生成事件：SPERO,$$s$ 進行了一次代幣生成事件（TGE），向早期支持者分發其原生代幣，並在生態系統內建立初步流動性。首次 dApp 上線：與 SPERO,$$s$ 相關的第一個去中心化應用程序（dApp）上線，允許用戶參與平台的核心功能。持續發展和夥伴關係：對項目產品的持續更新和增強，包括與區塊鏈領域其他參與者的戰略夥伴關係，使 SPERO,$$s$ 成為加密市場中一個具有競爭力和不斷演變的參與者。結論 SPERO,$$s$ 是 web3 和加密貨幣潛力的見證，能夠徹底改變金融系統並賦能個人。憑藉對去中心化治理、社區參與和創新設計功能的承諾，它為更具包容性的金融環境鋪平了道路。與任何在快速發展的加密領域中的投資一樣，潛在的投資者和用戶都被鼓勵進行徹底研究，並對 SPERO,$$s$ 的持續發展進行深思熟慮的參與。該項目展示了加密行業的創新精神，邀請人們進一步探索其無數可能性。儘管 SPERO,$$s$ 的旅程仍在展開，但其基礎原則確實可能影響我們在互聯網數字生態系統中如何與技術、金融和彼此互動的未來。

271 人學過發佈於 2024.12.17更新於 2024.12.17

什麼是 AGENT S

Agent S：Web3中自主互動的未來介紹在不斷演變的Web3和加密貨幣領域，創新不斷重新定義個人如何與數字平台互動。Agent S是一個開創性的項目，承諾通過其開放的代理框架徹底改變人機互動。Agent S旨在簡化複雜任務，為人工智能（AI）提供變革性的應用，鋪平自主互動的道路。本詳細探索將深入研究該項目的複雜性、其獨特特徵以及對加密貨幣領域的影響。什麼是Agent S？ Agent S是一個突破性的開放代理框架，專門設計用來解決計算機任務自動化中的三個基本挑戰：獲取特定領域知識：該框架智能地從各種外部知識來源和內部經驗中學習。這種雙重方法使其能夠建立豐富的特定領域知識庫，提升其在任務執行中的表現。長期任務規劃：Agent S採用經驗增強的分層規劃，這是一種戰略方法，可以有效地分解和執行複雜任務。此特徵顯著提升了其高效和有效地管理多個子任務的能力。處理動態、不均勻的界面：該項目引入了代理-計算機界面（ACI），這是一種創新的解決方案，增強了代理和用戶之間的互動。利用多模態大型語言模型（MLLMs），Agent S能夠無縫導航和操作各種圖形用戶界面。通過這些開創性特徵，Agent S提供了一個強大的框架，解決了自動化人機互動中涉及的複雜性，為AI及其他領域的無數應用奠定了基礎。誰是Agent S的創建者？儘管Agent S的概念根本上是創新的，但有關其創建者的具體信息仍然難以捉摸。創建者目前尚不清楚，這突顯了該項目的初期階段或戰略選擇將創始成員保密。無論是否匿名，重點仍然在於框架的能力和潛力。誰是Agent S的投資者？由於Agent S在加密生態系統中相對較新，關於其投資者和財務支持者的詳細信息並未明確記錄。缺乏對支持該項目的投資基礎或組織的公開見解，引發了對其資金結構和發展路線圖的質疑。了解其支持背景對於評估該項目的可持續性和潛在市場影響至關重要。 Agent S如何運作？ Agent S的核心是尖端技術，使其能夠在多種環境中有效運作。其運營模型圍繞幾個關鍵特徵構建：類人計算機互動：該框架提供先進的AI規劃，力求使與計算機的互動更加直觀。通過模仿人類在任務執行中的行為，承諾提升用戶體驗。敘事記憶：用於利用高級經驗，Agent S利用敘事記憶來跟蹤任務歷史，從而增強其決策過程。情節記憶：此特徵為用戶提供逐步指導，使框架能夠在任務展開時提供上下文支持。支持OpenACI：Agent S能夠在本地運行，使用戶能夠控制其互動和工作流程，與Web3的去中心化理念相一致。與外部API的輕鬆集成：其多功能性和與各種AI平台的兼容性確保了Agent S能夠無縫融入現有技術生態系統，成為開發者和組織的理想選擇。這些功能共同促成了Agent S在加密領域的獨特地位，因為它以最小的人類干預自動化複雜的多步任務。隨著項目的發展，其在Web3中的潛在應用可能重新定義數字互動的展開方式。 Agent S的時間線 Agent S的發展和里程碑可以用一個時間線來概括，突顯其重要事件： 2024年9月27日：Agent S的概念在一篇名為《一個像人類一樣使用計算機的開放代理框架》的綜合研究論文中推出，展示了該項目的基礎工作。 2024年10月10日：該研究論文在arXiv上公開，提供了對框架及其基於OSWorld基準的性能評估的深入探索。 2024年10月12日：發布了一個視頻演示，提供了對Agent S能力和特徵的視覺洞察，進一步吸引潛在用戶和投資者。這些時間線上的標記不僅展示了Agent S的進展，還表明了其對透明度和社區參與的承諾。有關Agent S的要點隨著Agent S框架的持續演變，幾個關鍵特徵脫穎而出，強調其創新性和潛力：創新框架：旨在提供類似人類互動的直觀計算機使用，Agent S為任務自動化帶來了新穎的方法。自主互動：通過GUI自主與計算機互動的能力標誌著向更智能和高效的計算解決方案邁進了一步。複雜任務自動化：憑藉其強大的方法論，能夠自動化複雜的多步任務，使過程更快且更少出錯。持續改進：學習機制使Agent S能夠從過去的經驗中改進，不斷提升其性能和效率。多功能性：其在OSWorld和WindowsAgentArena等不同操作環境中的適應性確保了它能夠服務於廣泛的應用。隨著Agent S在Web3和加密領域中的定位，其增強互動能力和自動化過程的潛力標誌著AI技術的一次重大進步。通過其創新框架，Agent S展現了數字互動的未來，為各行各業的用戶承諾提供更無縫和高效的體驗。結論 Agent S代表了AI與Web3結合的一次大膽飛躍，具有重新定義我們與技術互動方式的能力。儘管仍處於早期階段，但其應用的可能性廣泛且引人入勝。通過其全面的框架解決關鍵挑戰，Agent S旨在將自主互動帶到數字體驗的最前沿。隨著我們深入加密貨幣和去中心化的領域，像Agent S這樣的項目無疑將在塑造技術和人機協作的未來中發揮關鍵作用。

1.0k 人學過發佈於 2025.01.14更新於 2025.01.14

如何購買S

歡迎來到HTX.com！在這裡，購買Sonic (S)變得簡單而便捷。跟隨我們的逐步指南，放心開始您的加密貨幣之旅。第一步：創建您的HTX帳戶使用您的 Email、手機號碼在HTX註冊一個免費帳戶。體驗無憂的註冊過程並解鎖所有平台功能。立即註冊第二步：前往買幣頁面，選擇您的支付方式信用卡/金融卡購買：使用您的Visa或Mastercard即時購買Sonic (S)。餘額購買：使用您HTX帳戶餘額中的資金進行無縫交易。第三方購買：探索諸如Google Pay或Apple Pay等流行支付方式以增加便利性。C2C購買：在HTX平台上直接與其他用戶交易。HTX 場外交易 (OTC) 購買：為大量交易者提供個性化服務和競爭性匯率。第三步：存儲您的Sonic (S)購買Sonic (S)後，將其存儲在您的HTX帳戶中。您也可以透過區塊鏈轉帳將其發送到其他地址或者用於交易其他加密貨幣。第四步：交易Sonic (S)在HTX的現貨市場輕鬆交易Sonic (S)。前往您的帳戶，選擇交易對，執行交易，並即時監控。HTX為初學者和經驗豐富的交易者提供了友好的用戶體驗。

2.2k 人學過發佈於 2025.01.15更新於 2026.06.02