智谱凭什么一天暴涨近30%?

marsbitXuất bản vào 2026-05-23Cập nhật gần nhất vào 2026-05-23

Tóm tắt

智谱(02513.HK)股价单日暴涨近30%,核心触发因素是公司面向企业客户开放的GLM-5.1高速版API,其模型输出速度达到每秒400个token,刷新全球大模型API速度上限。 这一速度约为行业平均水平的3到5倍,意味着每秒可生成约200个汉字,显著提升了AI任务的执行效率。在AI进入Agent(智能体)时代、任务需要模型进行多轮自我调用的背景下,速度成为关键竞争力,直接影响任务完成时间和智能上限。 实现这一突破依赖智谱在推理引擎、并行策略和网络架构三个层面的技术创新: 1. **TileRT推理引擎**:将整个模型编译成持续运行的流水线,避免传统框架中频繁启动和等待的开销,并通过“Warp专门化”让GPU内不同计算组并行工作。 2. **异构并行策略**:针对GLM-5.1采用的MLA注意力机制,让多块GPU分工协作(如有的负责稀疏检索,有的负责密集计算),优化计算流程。 3. **ZCube网络架构**:取代行业标准的树形网络拓扑,采用扁平化互联设计,使得任意两台GPU间通信路径唯一且最短(仅需2跳),从根本上避免了网络拥塞,提升了集群整体吞吐并降低了延迟。 技术升级带来直接效益:在同等GPU投入下,集群吞吐量提升15%,相当于免费获得更多算力;任务尾延迟下降40.6%,提升了稳定性;网络建设成本因精简结构而节省约三分之一。 从行业影响看,智谱的技术路径证明,在相同算力下可以产出更多,这有助于重构GPU之外的基础设施生态。长期可能侵蚀英伟达在网络侧的溢价,利好能够提供高密度交换机的厂商以及国内光模块企业。同时,该纯软件方案理论上可移植到国产AI芯片,有望降低其软件生态门槛。

文  | AIDeepDive

今天,"全球大模型第一股"智谱(02513.HK)再次暴涨。

盘中涨幅一度突破30%。收盘报1282港元,全天涨幅超过26%,市值达到5715.7亿港元,再度创下历史新高。

触发这场暴涨的,是一个具体的技术指标:400 tokens/s

5月22日,智谱正式面向企业客户开放 GLM-5.1 高速版 API(GLM-5.1-highspeed),最关键的核心参数只有一个:模型输出速度达到每秒400个 token,刷新全球大模型厂商 API 速度上限。

我本来认为这又是一次国产大模型的公关包装,但仔细看了下技术细节,终于理解了资本市场背后的逻辑。

400 tokens/s是什么概念?

模型每秒能生成大约200个汉字,相当于一个专业作家一分钟的高强度产出,被压缩到了一秒钟之内。

一位创作者连续伏案数天才能写完的文字量,GLM-5.1 高速版在1分钟内便能交付完毕;一名工程师埋头3天才能完成的系统重构任务,它能在喝一杯咖啡的时间里跑完。

01 速度,比你想的重要

速度,历来是 AI 模型竞争中最容易被忽视的维度。

过去三年,大模型军备竞赛集中在两条赛道:参数规模(模型更大更聪明)和价格战(Token 更便宜更普惠)。"快",从来不是主角。

这是因为,过去的”快”通常是通过缩小模型参数来实现的。要提速,就必须用更小更精简的模型,代价是能力缩水。

GLM-5.1 高速版这次的意义在于,它在保留旗舰级全尺寸基座能力的同时,将速度推上了400 tokens/s。

无论是从国产模型来说,还是从国际范围来看,"旗舰能力"与"极致低延迟"第一次做到了不妥协。

为什么速度如此关键? 因为 AI 的主战场正在发生根本性的迁移。

当AI从ChatBot进入Agent时代,问答已经不是AI的主要场景,而Agent要完成一个任务,往往需要模型进行数十轮甚至上百轮的自我调用:写代码、调接口、搜信息、调用工具……

在这种工作模式下,每一轮调用之间的延迟会被无情地累加放大。一个需要50轮调用的任务,如果每次节省1秒,整个任务就快了将近1分钟。对于 AI 编程助手、语音交互、商业决策系统来说,这种差距是可以决定生死的。

从更深层面来说,在固定时间预算内,更快的推理意味着模型可以完成更深的推理路径、更多轮次的自我验证。速度,正在从系统指标变成智能上限本身。

02 速度这件事,有多难?

那现在行业里在速度方面大概什么水平?

头部厂商中,OpenAI 的 GPT-4o 约在100–150 tokens/s,Anthropic 的 Claude Sonnet 系列约在80–120 tokens/s,国内主流旗舰模型 API 大多在50–100 tokens/s 区间。400 tokens/s 大约是行业平均水平的3到5倍。

更关键的是,这个差距并不是投入更多算力就能弥补的。

一台搭载8块 H200 显卡的服务器,理论上每秒能搬运高达38TB的数据。对于 GLM-5.1,单次生成一个 token 只需读取约42GB的激活参数,纯理论上推算,应该能接近1000 tokens/s。

但现实系统往往只能跑出几十 tokens/s。

这是一个数量级的鸿沟。GPU 不是不够快,而是大量时间都被浪费在了等待、空转和无效调度上。

智谱这次正是在推理引擎、并行策略、网络架构三个层面同时创新,实现了对最终速度的突破。

03 三层技术叠加,逼近硬件物理极限

大模型原来是这样运转的,大模型被分解成一个个独立算子,每个算子单独启动一次计算核心(kernel),计算完就停下,同步等待,再启动下一个。

在训练阶段,每次计算动辄几秒乃至几分钟,这些启动和等待的开销完全可以忽略。但推理时,单次生成一个 token,某个关键步骤可能只需要几十微秒,启动和等待的开销就相对变得不可忽视。

TileRT 的核心思路:把整个模型编译成一个持续运行的引擎,一次启动,永不停歇。

TileRT 在代码编译阶段提前把模型所有计算逻辑静态展开成一条连续流水线,运行时 GPU 始终保持高速运转,计算、数据搬运、通信并行推进,中间结果尽量留在 GPU 内部高速缓存里,不再反复写回慢速显存再重新读取。

这里有一个关键的设计细节:Warp 专门化

理解 Warp,需要先理解 GPU 的工作方式。GPU 与 CPU 最大的不同,是它内部有成千上万个相对简单的计算单元,这些单元以32个为一组捆绑在一起,这一组就叫 Warp。

同一个 Warp 里的32个单元必须始终同步行动、执行同一条指令,就像军队里的一个班,班长下令所有人同时做同一个动作。

传统框架里,所有 Warp 执行同一套指令序列;TileRT 让不同 Warp 组承担不同职责:一部分专门负责把下一批数据提前搬运进来,一部分专门负责数学计算,一部分专门负责与其他 GPU 通信。三组人同时工作、流水配合,互不等待。

就好比从"一个工人搬砖、砌墙、验收串行干",变成了"搬砖组、砌墙组、验收组同时转"。

单卡内部的效率解决了,多卡并行又有新挑战。

行业通行做法是张量并行(Tensor Parallel): 把模型的权重矩阵切分成若干份,每块 GPU 负责其中一份,各自计算完毕后通过高速互联(NVLink)汇总结果。

这套方案对矩阵乘法这类规整的密集计算效果很好,是目前几乎所有大模型推理框架的标准多卡方案。

GLM-5.1 采用 **MLA(Multi-head Latent Attention,多头潜在注意力),这是由DeepSeek 提出一种注意力机制。

传统注意力机制需要把每一步计算的大量中间数据(KV Cache)完整保存下来备用,非常耗显存;MLA 的做法是先把这些中间数据压缩成一个紧凑的"潜在向量"存起来,用的时候再展开还原,显存需求大幅下降,推理效率更高。

但 MLA 的计算流程里有一个特殊环节:需要从大量历史信息中做稀疏索引:类似在一个巨大图书馆里先快速找出最相关的几本书,再精读这几本书。

"找书"这个步骤依赖全局信息,不适合多卡平摊;"精读"才是适合多卡并行的密集计算。如果强行让所有8块 GPU 都参与"找书",大量时间会浪费在 GPU 之间的同步通信上。

TileRT 的解法是让GPU异构运行:GPU 0 专门担任"图书馆检索员",负责稀疏索引和路由决策;GPU 1–7 担任"精读分析员",负责密集的注意力计算和矩阵运算。两类工作者各自采用最适合自己的并行策略协同完成整个计算层。

接下来,TileRT 把 GPU 之间的通信操作也直接内嵌进执行流水线,不再作为独立步骤。对外来看,整个8卡系统完成一层注意力计算只需要一次内核启动,内部的通信和计算全在持续流水线内部无缝完成。

以上两层解决的是单机范围内的问题。当集群扩展到数百乃至数千张 GPU,GPU 之间的数据传输本身就成了新的天花板。

行业通行做法是 ROFT(Rail-Optimized Fat-Tree),这是 NVIDIA 官方推荐方案,业界绝对标配。

它的结构是一棵树:服务器先连接底层的 Leaf 交换机(接入层,直接面向服务器),Leaf 再向上连接 Spine 交换机(骨干层,负责不同 Leaf 之间的互联,如同高速公路枢纽)。数据在两台 GPU 之间传输,必须"先上行到 Spine,再下行到目标 Leaf",至少经过3跳。

为了避免流量集中在少数链路上,这套架构依赖 ECMP 算法让数据在多条路径之间分配,在互联网流量"统计均匀"的前提下运转良好。

但推理场景的流量完全不均匀。不同请求的上下文长度差异可达数十倍,GPU 之间 KV Cache 的传输方向几乎随机,某几台 Leaf 交换机会周期性地成为热点,触发反压机制,把拥塞从局部扩散到全链路。这种拥塞不是协议调参能解决的,是拓扑结构本身的产物。

ZCube 的根本突破:从架构层面让这类拥塞在物理上无法发生。

核心设计分两步:

第一步,取消 Spine 骨干层,全网扁平化。把所有 Leaf 交换机按奇偶编号分成两组,两组之间完全互联,任意一台奇数交换机连接所有偶数交换机,反之亦然。任意两台 GPU 之间最多经过两台交换机即可互达,跳数从3跳降到2跳。

第二步,也是最精妙的地方:每张 GPU 网卡用两种截然不同的方式分别接入两组交换机。这种特殊拓扑带来一个关键的数学性质:全网任意两张 GPU 之间,有且仅有一条最优路径。

"唯一路径"直接消除了拥塞的根源。传统架构容易出现热点,恰恰是因为有多条路径可选,负载均衡算法选错了就会导致流量集中。ZCube 在设计上消除了"选择"这件事本身:不需要均衡,因为根本没有岔路。

04 同样的硬件条件下,账怎么算?

智谱将 GLM-5.1 生产集群从传统 ROFT 升级到 ZCube 后,得到三个数字:

总结来说的话,同样的 GPU 投入,集群可以服务更多用户;同样的用户体验要求,集群可以少买三分之一的网络设备。效率与成本双向改善。

具体来说,吞吐提升15%,等于免费多出15%的算力。 在GPU数量不变的情况下,吞吐多15%,等价于每个 token 的均摊硬件成本下降约13%,或者说相同成本可以多服务15%的用户。

如果一个集群有1000张 GPU,这次升级相当于凭空多出了150张卡的产能,按当前高端推理卡市价,这是数亿元量级的算力价值。

尾延迟下降40.6%,解决的是稳定性而非平均速度。 一个需要50轮调用的 Agent 任务,如果尾延迟每次减少1秒,整个任务的最坏完成时间就压缩了将近1分钟。

成本减少三分之一,是建设层面的直接节省。 ZCube 取消了 Spine 层,相同集群规模下所需交换机和光模块数量直接减少三分之一。据智谱测算,在万卡规模集群中,仅此一项可节省约2.1亿至6.4亿元。

从长远来看,随着集群规模指数级加剧,GPU 间通信的复杂度增长数倍,拥塞的概率和影响也同步放大。这意味着 ZCube 这类架构级创新的价值,会随着推理集群的持续扩张而加速显现。明天万卡级别的集群收益可能不止今天这15%。

05 写在最后

看完智谱的技术报告,我在想,这是否会像DeepSeek横空出世一样,给行业带来一场风暴?

仔细想想,两者的影响好像在不同的方面。DeepSeek 出来的时候,它证明的是,同样的智能,可以用少得多的算力实现。市场担心"需要的 GPU 变少了",所以英伟达当天市值蒸发近6000亿美元。

但今天智谱的技术证明:同样的算力,可以产出更多。它是在重构"GPU 之外,其他基础设施应该长什么样"。

短期来看,英伟达不会受到影响,但从长期来看,GPU + NVLink 互联 + InfiniBand 网络 + CUDA 软件生态的护城河正在被“松土”,特别是英伟达 2019 年花 69 亿美元收购 Mellanox 买下的 InfiniBand,英伟达网络侧的溢价会被大幅侵蚀。

此外,ZCube 取消了 Spine 层,但它对 Leaf 交换机的端口密度要求反而更高。受益的是能做高密度、大端口 Leaf 交换机的厂商(锐捷、Arista、博通交换芯片),受损的是主要依赖 Spine 层高端交换机吃溢价的厂商。

2025年 Celestica 和英伟达合计占据约 50% 的 AI 后端网络交换机市场份额,这个格局在 ZCube 范式扩散后会面临重新洗牌。

光模块是这次产业链变化里最直接的受益方向,逻辑非常清晰。对国内光模块厂商(中际旭创、天孚通信等)来说,这是一个结构性利好:不仅总量在涨,而且 ZCube 范式下对高速光模块(800G、1.6T)的需求比传统架构更加集中和迫切。

无论是TileRT还是ZCube 架构,这是一套运行在标准 GPU 之上的纯软件推理引擎,不依赖英伟达私有的硬件特性,理论上可以移植到华为昇腾等国产芯片上。这个方向一旦走通,会大幅降低国产 AI 芯片在推理场景的软件栈门槛。

这或许才是这个技术创新背后更大的意义所在。

Câu hỏi Liên quan

Q智谱(02513.HK)股价在一天内暴涨近30%的直接触发因素是什么?

A直接触发因素是智谱于5月22日面向企业客户开放的GLM-5.1高速版API,其核心输出速度达到了每秒400个token,刷新了全球大模型厂商API的速度上限。

Q文章中提到,大模型推理速度的提升为何在AI Agent时代变得至关重要?

A在AI Agent时代,模型需要完成包含数十轮甚至上百轮自我调用的复杂任务(如写代码、调接口)。每一轮调用的延迟都会被累加放大。更快的推理速度能显著缩短总任务时间,并且在固定时间内允许模型进行更深度的推理和更多轮次的自我验证,速度正从系统指标转变为智能上限本身。

Q为了实现400 tokens/s的速度,智谱在技术架构上主要在哪些层面进行了创新?

A智谱主要在三个层面进行了创新:1. **推理引擎层(TileRT)**:将模型编译成持续运行的静态流水线引擎,避免算子频繁启停的开销,并采用Warp专门化实现高效并行。2. **并行策略层**:针对其采用的MLA注意力机制,设计了GPU异构运行策略(如GPU0负责稀疏索引,其他GPU负责密集计算),优化多卡协同。3. **网络架构层(ZCube)**:采用全新的扁平化网络拓扑,消除了传统的Spine层,使得任意两台GPU间通信最多只经过2跳交换机,并拥有唯一最优路径,从根源上避免了网络拥塞。

Q文章中指出,智谱的ZCube网络架构相比传统ROFT架构,带来了哪些具体的性能与成本收益?

AZCube架构相比传统ROFT架构带来了三方面主要收益:1. **吞吐提升15%**:相当于在相同GPU投入下获得额外15%的算力产能,或每个token的均摊硬件成本下降约13%。2. **尾延迟下降40.6%**:显著提升了系统响应稳定性和最坏情况下的任务完成时间。3. **建造成本减少约三分之一**:由于取消了Spine层,在万卡规模集群中,仅交换机和光模块部分预计可节省约2.1亿至6.4亿元。

Q文章认为,智谱的这项技术创新与之前的DeepSeek相比,对行业的影响有何本质不同?它可能重塑哪些产业链格局?

A本质不同在于:DeepSeek证明了用更少的算力可以实现同样的智能,冲击了GPU需求预期;而智谱则证明了同样的算力可以产出更多,其意义在于重构GPU之外的基础设施(如网络架构)。这可能重塑的产业链格局包括:1. **冲击英伟达网络侧溢价**:其InfiniBand网络方案的溢价可能被侵蚀。2. **交换机市场洗牌**:依赖高端Spine交换机的厂商受损,而能提供高密度Leaf交换机的厂商(如锐捷、Arista)受益。3. **利好高速光模块厂商**:ZCube架构对800G、1.6T等高速光模块的需求更集中迫切,利好中际旭创、天孚通信等厂商。4. **降低国产AI芯片门槛**:TileRT作为纯软件推理引擎,理论上可移植到华为昇腾等国产芯片,降低其软件栈门槛。

Nội dung Liên quan

Thị trường chứng khoán Mỹ hứng chịu đợt lao dốc tồi tệ nhất từ năm 2025, ba ngòi nổ kích hoạt đánh giá lại định giá cổ phiếu công nghệ

Ngày 5/6, thị trường chứng khoán Mỹ trải qua một ngày sụt giảm mạnh nhất kể từ sau cuộc khủng hoảng thuế quan tháng 4/2025. Chỉ số Nasdaq Composite lao dốc 4,18%, S&P 500 giảm 2,64% và Dow Jones mất 695 điểm. Sự đảo chiều đột ngột này chỉ sau 48 giờ được thúc đẩy bởi ba yếu tố chính. **Thứ nhất: Báo cáo tài chính của Broadcom làm rạn nứt câu chuyện AI.** Dù doanh thu chip AI của Broadcom tăng 143%, nhưng dự báo cho quý tới thấp hơn kỳ vọng, làm dấy lên lo ngại tốc độ tăng trưởng AI có thể đang chậm lại. Điều này kích hoạt đợt bán tháo trên toàn ngành bán dẫn. **Thứ hai: Dữ liệu việc làm Mỹ quá mạnh.** Báo cáo phi nông nghiệp tháng 5 cho thấy 172.000 việc làm mới, gấp đôi dự báo, củng cố kỳ vọng Cục Dự trữ Liên bang (Fed) có thể không giảm lãi suất mà thậm chí còn tăng. Kỳ vọng lãi suất cao hơn gây áp lực lên định giá cổ phiếu công nghệ. **Thứ ba: Bóng ma lạm phát từ cuộc chiến Iran.** Giá dầu duy trì trên 90 USD/thùng do tình hình căng thẳng leo thang từ tháng 2 tiếp tục đè nặng lên áp lực lạm phát, khiến công cụ chính sách của Fed trở nên phức tạp hơn. Ba yếu tố trên cùng lúc làm suy yếu niềm tin vào các câu chuyện thị trường then chốt: tăng trưởng AI vô hạn, Fed sắp cắt giảm lãi suất và lạm phát đã được kiểm soát. Sự sụt giảm nhanh chóng lan rộng sang thị trường toàn cầu. Đây có thể là một đợt điều chỉnh định giá lại đối với các cổ phiược được định giá quá cao, chứ chưa hẳn là sự kết thúc của câu chuyện AI. Hướng đi tiếp theo của thị trường sẽ phụ thuộc vào cuộc họp sắp tới của Fed, các báo cáo tài chính từ các công ty AI khác và diễn biến tình hình địa chính trị.

marsbit3 giờ trước

Thị trường chứng khoán Mỹ hứng chịu đợt lao dốc tồi tệ nhất từ năm 2025, ba ngòi nổ kích hoạt đánh giá lại định giá cổ phiếu công nghệ

marsbit3 giờ trước

Từ Madison Square Garden đến Kalshi: Thị trường dự đoán xông vào Chung kết NBA

Bài viết đề cập đến sự xuất hiện ngày càng phổ biến của các thị trường dự đoán (prediction markets) trong loạt trận chung kết NBA 2026 giữa New York Knicks và San Antonio Spurs, đặc biệt là ở thành phố New York. Hai nền tảng chính được nhắc đến là Polymarket và Kalshi, với khối lượng giao dịch hàng trăm triệu USD xoay quanh kết quả chung kết và các sự kiện liên quan. Điểm nổi bật là sự thâm nhập của các thị trường này vào đời sống thực tế. Họ đã hợp tác chính thức với nhà thi đấu Madison Square Garden, mang lại sự tiếp cận rộng rãi. Một quán bar tên The Jeffrey đã sử dụng hợp đồng trên Kalshi để bảo hiểm cho chương trình khuyến mãi "miễn phí hóa đơn nếu Knicks thắng", minh họa cách các doanh nghiệp nhỏ có thể dùng công cụ này để quản lý rủi ro. Bài viết so sánh thị trường dự đoán với cá cược thể thao truyền thống. Chúng cho phép người tham gia đặt cược vào nhiều sự kiện giải trí đa dạng hơn (như sự xuất hiện của người nổi tiếng), có phạm vi tiếp cận địa lý rộng hơn và độ tuổi tham gia thấp hơn (từ 18 tuổi). Tuy nhiên, điều này cũng gây tranh cãi về ranh giới giữa giao dịch tài chính và cờ bạc. NBA có thái độ thận trọng. Trong khi siêu sao như "Giannis Antetokounmpo" đã đầu tư vào Kalshi, gây lo ngại về xung đột lợi ích, thì ban lãnh đạo NBA lại nhấn mạnh sự cần thiết của khung quy định chặt chẽ để bảo vệ tính toàn vẹn của trận đấu. Nhiều cổ động viên bày tỏ lo ngại rằng sự liên kết sâu rộng giữa liên đoàn với các nền tảng này có thể làm suy giảm độ tin cậy của các trận đấu. Chung kết NBA năm nay đang trở thành một phép thử quan trọng cho sự hội nhập của thị trường dự đoán vào thể thao chính thống, vừa mở ra cơ hội thương mại mới, vừa đặt ra những thách thức về niềm tin và quản lý.

marsbit5 giờ trước

Từ Madison Square Garden đến Kalshi: Thị trường dự đoán xông vào Chung kết NBA

marsbit5 giờ trước

RSI - Khi AI tự xây dựng chính mình đang nổi lên, Google dội nước lạnh, DeepSeek đã chạm đến mép giới hạn

Gần đây, thuật ngữ "RSI" (Recursive Self-Improvement – Tự cải tiến đệ quy) đang trở thành tâm điểm chú ý trong ngành AI. Khái niệm này đề cập đến việc để AI tự huấn luyện và cải thiện chính mình, hướng tới một hệ thống có thể tự động hóa toàn bộ quá trình nghiên cứu và phát triển, từ đó tạo ra sự tiến bộ vượt bậc. Một số công ty khởi nghiệp như Recursive Superintelligence và dự án Auto-Research của Andrej Karpathy đang tích cực theo đuổi hướng đi này. Tuy nhiên, CEO Google Sundar Pichai tỏ ra thận trọng, cho rằng ngành công nghiệp vẫn chưa đạt đến cột mốc tăng tốc đột biến mà RSI hứa hẹn. Trong khi đó, các công ty AI Trung Quốc như DeepSeek và Baidu mặc dù ít công khai nhắc đến RSI, nhưng trên thực tế đã áp dụng các nguyên lý tương tự – như tối ưu hóa thuật toán cực độ hay sử dụng vòng lặp phản hồi tự động – để cải thiện mô hình của họ một cách hiệu quả. Dù vậy, RSI vẫn đối mặt với nhiều thách thức lớn: hiện tượng "sụp đổ mô hình" khi dữ liệu do AI tạo ra bị suy giảm chất lượng qua mỗi vòng lặp, yêu cầu về nguồn lực tính toán khổng lồ, và môi trường nghiên cứu toàn cầu đang ngày càng bị phân mảnh. Về cơ bản, RSI đại diện cho xu hướng tự động hóa ngày càng sâu trong phát triển AI, dần đẩy con người ra khỏi chuỗi quyết định trực tiếp. Đây là một quá trình có thể mang lại bước nhảy vọt về công nghệ, nhưng cũng tiềm ẩn rủi ro và sự thay đổi khó lường.

marsbit5 giờ trước

RSI - Khi AI tự xây dựng chính mình đang nổi lên, Google dội nước lạnh, DeepSeek đã chạm đến mép giới hạn

marsbit5 giờ trước

Anthropic cảnh báo toàn cầu, OpenAI đã vượt qua 'ngưỡng tin cậy': AI tự kích hoạt tăng tốc

Cộng đồng AI đang chấn động bởi cảnh báo từ Anthropic: nghiên cứu AI cần dừng lại! Hãng này lo ngại AI đang tiến gần đến điểm "tự tạo ra chính mình", với quá trình tự cải tiến đệ quy diễn ra nhanh hơn dự kiến. Đồng thời, Yann Dubois của OpenAI chia sẻ một quan điểm then chốt: sự phát triển của AI là liên tục, nhưng người dùng cảm nhận một bước nhảy vọt khi nó vượt qua "ngưỡng độ tin cậy". OpenAI đã đạt được ngưỡng này vào khoảng tháng 12 năm ngoái. Khi AI đủ tin cậy, nó từ một "thực tập sinh" trở thành một "nhân viên" thực thụ và bắt đầu tự gia tốc, đặc biệt trong việc hỗ trợ lập trình, tạo ra một vòng lặp phát triển ngày càng nhanh. Dubois nhấn mạnh việc xây dựng AI giống "nghề thủ công" hơn là khoa học thuần túy, dựa nhiều vào thử nghiệm và trực giác. Ông cũng đưa ra một tuyên bố gây chú ý: nếu đóng băng các mô hình hiện tại và chỉ tập trung vào hệ thống điều phối (Harness) cho các lĩnh vực chuyên sâu, chúng ta có thể đã đạt được cảm giác của AGI (Trí tuệ nhân tạo phổ quát). Rào cản thực sự không nằm ở bộ não mô hình, mà ở "quyền truy cập, kết nối và dữ liệu" – công việc khó khăn của "chặng đường cuối cùng" để đưa AI vào thực tế. Tuy vậy, một thách thức lớn vẫn tồn tại: khả năng học liên tục (continual learning). Hiện tại, AI thường đạt hiệu suất cao ban đầu nhưng sau đó không cải thiện nhiều trong môi trường cụ thể. Giải quyết vấn đề này là chìa khóa quan trọng cho tương lai. Dubois kết luận rằng vẫn có không gian rộng lớn cho các công ty khởi nghiệp trong việc tạo ra các ứng dụng chuyên sâu, tập trung vào tích hợp và giải quyết các vấn đề thực tế.

marsbit5 giờ trước

Anthropic cảnh báo toàn cầu, OpenAI đã vượt qua 'ngưỡng tin cậy': AI tự kích hoạt tăng tốc

marsbit5 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai

Bài viết Nổi bật

AGENT S là gì

Agent S: Tương Lai của Tương Tác Tự Động trong Web3 Giới thiệu Trong bối cảnh không ngừng phát triển của Web3 và tiền điện tử, các đổi mới đang liên tục định nghĩa lại cách mà cá nhân tương tác với các nền tảng kỹ thuật số. Một dự án tiên phong như vậy, Agent S, hứa hẹn sẽ cách mạng hóa tương tác giữa con người và máy tính thông qua khung tác nhân mở của nó. Bằng cách mở đường cho các tương tác tự động, Agent S nhằm đơn giản hóa các nhiệm vụ phức tạp, cung cấp các ứng dụng chuyển đổi trong trí tuệ nhân tạo (AI). Cuộc khám phá chi tiết này sẽ đi sâu vào những phức tạp của dự án, các tính năng độc đáo của nó và những tác động đối với lĩnh vực tiền điện tử. Agent S là gì? Agent S đứng vững như một khung tác nhân mở đột phá, được thiết kế đặc biệt để giải quyết ba thách thức cơ bản trong việc tự động hóa các nhiệm vụ máy tính: Thu thập Kiến thức Cụ thể theo Miền: Khung này học một cách thông minh từ nhiều nguồn kiến thức bên ngoài và kinh nghiệm nội bộ. Cách tiếp cận kép này giúp nó xây dựng một kho lưu trữ phong phú về kiến thức cụ thể theo miền, nâng cao hiệu suất của nó trong việc thực hiện nhiệm vụ. Lập Kế Hoạch Qua Các Tầm Nhìn Nhiệm Vụ Dài Hạn: Agent S sử dụng lập kế hoạch phân cấp tăng cường kinh nghiệm, một cách tiếp cận chiến lược giúp phân chia và thực hiện các nhiệm vụ phức tạp một cách hiệu quả. Tính năng này nâng cao đáng kể khả năng quản lý nhiều nhiệm vụ con một cách hiệu quả và hiệu suất. Xử Lý Các Giao Diện Động, Không Đều: Dự án giới thiệu Giao Diện Tác Nhân-Máy Tính (ACI), một giải pháp đổi mới giúp nâng cao tương tác giữa các tác nhân và người dùng. Sử dụng các Mô Hình Ngôn Ngữ Lớn Đa Phương Thức (MLLMs), Agent S có thể điều hướng và thao tác các giao diện người dùng đồ họa đa dạng một cách liền mạch. Thông qua những tính năng tiên phong này, Agent S cung cấp một khung vững chắc giải quyết các phức tạp liên quan đến việc tự động hóa tương tác giữa con người với máy móc, mở ra nhiều ứng dụng trong AI và hơn thế nữa. Ai là Người Tạo ra Agent S? Mặc dù khái niệm về Agent S là hoàn toàn đổi mới, thông tin cụ thể về người sáng lập vẫn còn mơ hồ. Người sáng lập hiện vẫn chưa được biết đến, điều này làm nổi bật giai đoạn sơ khai của dự án hoặc sự lựa chọn chiến lược để giữ kín các thành viên sáng lập. Bất chấp sự ẩn danh, sự chú ý vẫn tập trung vào khả năng và tiềm năng của khung này. Ai là Các Nhà Đầu Tư của Agent S? Vì Agent S còn tương đối mới trong hệ sinh thái mã hóa, thông tin chi tiết về các nhà đầu tư và những người tài trợ tài chính của nó không được ghi chép rõ ràng. Sự thiếu vắng thông tin công khai về các nền tảng đầu tư hoặc tổ chức hỗ trợ dự án dấy lên câu hỏi về cấu trúc tài trợ và lộ trình phát triển của nó. Hiểu biết về sự hỗ trợ là rất quan trọng để đánh giá tính bền vững và tác động tiềm năng của dự án. Agent S Hoạt Động Như Thế Nào? Tại cốt lõi của Agent S là công nghệ tiên tiến cho phép nó hoạt động hiệu quả trong nhiều bối cảnh khác nhau. Mô hình hoạt động của nó được xây dựng xung quanh một số tính năng chính: Tương Tác Giống Như Con Người: Khung này cung cấp lập kế hoạch AI tiên tiến, cố gắng làm cho các tương tác với máy tính trở nên trực quan hơn. Bằng cách bắt chước hành vi của con người trong việc thực hiện nhiệm vụ, nó hứa hẹn nâng cao trải nghiệm người dùng. Ký Ức Tường Thuật: Được sử dụng để tận dụng các trải nghiệm cấp cao, Agent S sử dụng ký ức tường thuật để theo dõi lịch sử nhiệm vụ, từ đó nâng cao quy trình ra quyết định của nó. Ký Ức Tình Huống: Tính năng này cung cấp cho người dùng hướng dẫn từng bước, cho phép khung này cung cấp hỗ trợ theo ngữ cảnh khi các nhiệm vụ diễn ra. Hỗ Trợ OpenACI: Với khả năng chạy cục bộ, Agent S cho phép người dùng duy trì quyền kiểm soát đối với các tương tác và quy trình làm việc của họ, phù hợp với tinh thần phi tập trung của Web3. Tích Hợp Dễ Dàng với Các API Bên Ngoài: Tính linh hoạt và khả năng tương thích với nhiều nền tảng AI khác nhau đảm bảo rằng Agent S có thể hòa nhập liền mạch vào các hệ sinh thái công nghệ hiện có, làm cho nó trở thành lựa chọn hấp dẫn cho các nhà phát triển và tổ chức. Những chức năng này cùng nhau góp phần vào vị trí độc đáo của Agent S trong không gian tiền điện tử, khi nó tự động hóa các nhiệm vụ phức tạp, nhiều bước với sự can thiệp tối thiểu của con người. Khi dự án phát triển, các ứng dụng tiềm năng của nó trong Web3 có thể định nghĩa lại cách mà các tương tác kỹ thuật số diễn ra. Thời Gian Phát Triển của Agent S Sự phát triển và các cột mốc của Agent S có thể được tóm tắt trong một dòng thời gian nêu bật các sự kiện quan trọng của nó: 27 tháng 9, 2024: Khái niệm về Agent S được ra mắt trong một bài nghiên cứu toàn diện mang tên “Một Khung Tác Nhân Mở Sử Dụng Máy Tính Như Một Con Người,” trình bày nền tảng cho dự án. 10 tháng 10, 2024: Bài nghiên cứu được công bố công khai trên arXiv, cung cấp một cái nhìn sâu sắc về khung và đánh giá hiệu suất của nó dựa trên tiêu chuẩn OSWorld. 12 tháng 10, 2024: Một video trình bày được phát hành, cung cấp cái nhìn trực quan về khả năng và tính năng của Agent S, thu hút thêm sự quan tâm từ người dùng và nhà đầu tư tiềm năng. Những dấu mốc trong dòng thời gian không chỉ minh họa sự tiến bộ của Agent S mà còn chỉ ra cam kết của nó đối với sự minh bạch và sự tham gia của cộng đồng. Những Điểm Chính Về Agent S Khi khung Agent S tiếp tục phát triển, một số thuộc tính chính nổi bật, nhấn mạnh tính đổi mới và tiềm năng của nó: Khung Đổi Mới: Được thiết kế để cung cấp cách sử dụng máy tính trực quan giống như tương tác của con người, Agent S mang đến một cách tiếp cận mới cho việc tự động hóa nhiệm vụ. Tương Tác Tự Động: Khả năng tương tác tự động với máy tính thông qua GUI đánh dấu một bước tiến tới các giải pháp tính toán thông minh và hiệu quả hơn. Tự Động Hóa Nhiệm Vụ Phức Tạp: Với phương pháp mạnh mẽ của nó, nó có thể tự động hóa các nhiệm vụ phức tạp, nhiều bước, làm cho các quy trình nhanh hơn và ít sai sót hơn. Cải Tiến Liên Tục: Các cơ chế học tập cho phép Agent S cải thiện từ các trải nghiệm trước đó, liên tục nâng cao hiệu suất và hiệu quả của nó. Tính Linh Hoạt: Khả năng thích ứng của nó trên các môi trường hoạt động khác nhau như OSWorld và WindowsAgentArena đảm bảo rằng nó có thể phục vụ một loạt các ứng dụng rộng rãi. Khi Agent S định vị mình trong bối cảnh Web3 và tiền điện tử, tiềm năng của nó để nâng cao khả năng tương tác và tự động hóa quy trình đánh dấu một bước tiến quan trọng trong công nghệ AI. Thông qua khung đổi mới của mình, Agent S minh họa cho tương lai của các tương tác kỹ thuật số, hứa hẹn một trải nghiệm liền mạch và hiệu quả hơn cho người dùng trên nhiều ngành công nghiệp khác nhau. Kết luận Agent S đại diện cho một bước nhảy vọt táo bạo trong sự kết hợp giữa AI và Web3, với khả năng định nghĩa lại cách chúng ta tương tác với công nghệ. Mặc dù vẫn còn ở giai đoạn đầu, những khả năng cho ứng dụng của nó là rộng lớn và hấp dẫn. Thông qua khung toàn diện của mình giải quyết các thách thức quan trọng, Agent S nhằm đưa các tương tác tự động lên hàng đầu trong trải nghiệm kỹ thuật số. Khi chúng ta tiến sâu hơn vào các lĩnh vực tiền điện tử và phi tập trung, các dự án như Agent S chắc chắn sẽ đóng một vai trò quan trọng trong việc định hình tương lai của công nghệ và sự hợp tác giữa con người với máy tính.

Tổng lượt xem 851Xuất bản vào 2025.01.14Cập nhật vào 2025.01.14

AGENT S là gì

Làm thế nào để Mua S

Chào mừng bạn đến với HTX.com! Chúng tôi đã làm cho mua Sonic (S) trở nên đơn giản và thuận tiện. Làm theo hướng dẫn từng bước của chúng tôi để bắt đầu hành trình tiền kỹ thuật số của bạn.Bước 1: Tạo Tài khoản HTX của BạnSử dụng email hoặc số điện thoại của bạn để đăng ký tài khoản miễn phí trên HTX. Trải nghiệm hành trình đăng ký không rắc rối và mở khóa tất cả tính năng. Nhận Tài khoản của tôiBước 2: Truy cập Mua Crypto và Chọn Phương thức Thanh toán của BạnThẻ Tín dụng/Ghi nợ: Sử dụng Visa hoặc Mastercard của bạn để mua Sonic (S) ngay lập tức.Số dư: Sử dụng tiền từ số dư tài khoản HTX của bạn để giao dịch liền mạch.Bên thứ ba: Chúng tôi đã thêm những phương thức thanh toán phổ biến như Google Pay và Apple Pay để nâng cao sự tiện lợi.P2P: Giao dịch trực tiếp với người dùng khác trên HTX.Thị trường mua bán phi tập trung (OTC): Chúng tôi cung cấp những dịch vụ được thiết kế riêng và tỷ giá hối đoái cạnh tranh cho nhà giao dịch.Bước 3: Lưu trữ Sonic (S) của BạnSau khi mua Sonic (S), lưu trữ trong tài khoản HTX của bạn. Ngoài ra, bạn có thể gửi đi nơi khác qua chuyển khoản blockchain hoặc sử dụng để giao dịch những tiền kỹ thuật số khác.Bước 4: Giao dịch Sonic (S)Giao dịch Sonic (S) dễ dàng trên thị trường giao ngay của HTX. Chỉ cần truy cập vào tài khoản của bạn, chọn cặp giao dịch, thực hiện giao dịch và theo dõi trong thời gian thực. Chúng tôi cung cấp trải nghiệm thân thiện với người dùng cho cả người mới bắt đầu và người giao dịch dày dạn kinh nghiệm.

Tổng lượt xem 1.5kXuất bản vào 2025.01.15Cập nhật vào 2026.06.02

Làm thế nào để Mua S

Thảo luận

Chào mừng đến với Cộng đồng HTX. Tại đây, bạn có thể được thông báo về những phát triển nền tảng mới nhất và có quyền truy cập vào thông tin chuyên sâu về thị trường. Ý kiến ​​của người dùng về giá của S (S) được trình bày dưới đây.

活动图片