AMD新论文颠覆认知：FP4训练不稳定，原因不是随机性不足

marsbit發佈於 2026-05-27更新於 2026-05-27

文章摘要

AMD最新研究发现，FP4训练不稳定的主要原因并非此前认为的随机性不足，而是结构性微缩放误差在关键梯度路径上累积放大所致。过去，尝试使用FP4从头训练大模型常因训练不稳定而失败。AMD与宾夕法尼亚州立大学的论文通过实验证明，在Transformer的权重梯度计算路径上使用FP4量化会导致收敛质量显著下降。此前用于缓解量化误差的随机性策略（如随机舍入）在此场景下反而加剧了不稳定性。研究团队采用MXFP4数据格式，并引入确定性Hadamard旋转作为稳定化方法，成功在AMD MI355X GPU上完成了Llama 3.1-8B模型的全流程FP4预训练。结果显示，该方法在仅增加8-9%训练数据开销的情况下，实现了比FP8基线快9-10%的端到端训练速度。这项研究首次在原生FP4硬件上验证了低精度训练的可行性，为降低大模型训练成本提供了新方向，并指出结构性误差分析比增加随机性更为关键。基于开放标准OCP的MXFP4格式也增强了该方案在不同硬件平台间的可移植性。

众所周知,大模型训练成本极高。

但大家又知道,降低训练精度能够显著降低训练成本。DeepSeek-V3 用 FP8 训练把成本打到了 560 万美元,已经让全行业侧目。

在 FP8 成功后,行业仍然在不断探索低精度的边界:从 FP8 降到 FP4,训练成本还能再降多少?

理论上,FP4 的计算吞吐可以是 FP8 的两倍。NVIDIA Blackwell 和 AMD MI350 系列都已经在硬件层面原生支持了 FP4 运算,前者在 B200 上标称 FP4 算力可达 4500 TOPS(稀疏)。硬件已经准备好了,但软件和算法那一侧,一直卡在一个问题上:

用 FP4 从头训练大模型,训练过程非常不稳定。

过去两年里,LLM-FP4、NVFP4 预训练等工作陆续尝试了这条路,但鲜有方案能在 4 比特精度下干净利落地跑通全流程预训练,同时保持接近 FP8 的收敛质量。

更棘手的是,崩溃的原因一直不清楚,分析认为,FP4 训练不稳定的原因很可能来自随机性不足。

但就在最近,AMD 联合宾夕法尼亚州立大学发布了一篇论文,颠覆了传统的认知,为原生 FP4 训练给出了一个全新的清晰诊断。

论文标题:Pretraining large language models with MXFP4 on Native FP4 Hardware
论文链接:https://arxiv.org/abs/2605.09825

这篇论文在 AMD Instinct MI355X GPU 上,用 MXFP4 格式完成了 Llama 3.1-8B 的全流程预训练,端到端训练速度比 FP8 基线快 9-10%,token 开销仅多 8-9%。这是目前第一个在原生 FP4 硬件(非软件模拟)上完成大模型预训练的完整实验。

更重要的是,论文揭示了核心问题:FP4 训练的不稳定性的来源不是随机性不足,是结构性微缩放误差沿敏感梯度路径累积放大。

MXFP4 是什么

在拆解论文之前,有必要先理解 MXFP4 这个数据格式。

传统的整数量化通常对整个张量使用一个缩放因子。MXFP4 的核心设计叫「微缩放」(Micro-scaling):把一个张量切成小块(比如每 32 个元素一组),为每个小块分配一个共享指数(E8M0 格式),块内的每个元素用 4 比特浮点数表示。重建公式可以写成:

其中 E_shared 是块内最大指数,Q_FP4 是最近舍入到 4 比特浮点可表示值。

微缩放的好处在于:每个小块有自己的动态范围,不会被全局异常值「绑架」。这让 4 比特浮点数的表示质量比朴素的全局量化好很多。

但即便有了微缩放,FP4 训练依然不稳定。

排查实验:不稳定的根源

研究团队先设计了一个逐步排查的控制实验。

一次完整的 Transformer 线性层计算,涉及三个通用矩阵乘法操作:

Fprop(前向传播):计算 Y = XW^T,产出激活值

Dgrad(激活梯度):计算 ∇X = ∇Y · W,将梯度回传给输入

Wgrad(权重梯度):计算 ∇W = (∇Y)^T · X,产出用于更新权重的梯度

研究团队保持其他所有因素不变,逐步把这三个操作从 FP8 替换成 MXFP4,观察每一步对收敛的影响。所有实验都在 AMD Instinct MI355X 上用原生 FP4 tensor core 执行,不依赖软件模拟。

训练任务是 MLPerf 标准设置,在 C4 数据集上预训练 Llama 3.1-8B,收敛目标是验证集困惑度达到 3.3。

前两步只带来了温和的额外 token 开销,但一旦把 Wgrad 也换成 MXFP4,开销直接跳到 26-27%。

Wgrad 是 FP4 训练的瓶颈所在。 前向传播和激活梯度对 FP4 量化有相当的容忍度,但权重梯度一旦被量化到 4 比特,收敛质量就出现了显著退化。

业界此前的主流直觉是:FP4 量化误差本质上是噪声问题,因此可以通过注入随机性来「平滑」误差分布。两种常见策略是:

随机舍入(Stochastic Rounding):在量化时引入随机性,使舍入误差的期望值为零

随机 Hadamard 旋转(Randomized Hadamard):在量化前用带随机符号翻转的 Hadamard 变换打散数据分布

当 Wgrad 被量化后,两种随机性策略不仅没有稳定训练,反而直接导致了不收敛。随机性非但没有帮忙,还在关键的梯度路径上引入了更多有效量化误差。

相比之下,确定性 Hadamard 旋转一把将全流程 token 开销从 26-27% 压回到 8-9%,训练轨迹紧密跟踪 FP8 基线。

这是一个非常有诊断价值的结果。随机和确定性 Hadamard 旋转都是正交变换,都能打散异常值的能量分布,理论上对量化误差的缓解效果应该类似。但它们在 Wgrad 场景下的表现截然相反,这揭示了问题的本质:

FP4 训练的不稳定性,是由 MXFP4 微缩放在敏感梯度路径上产生的结构性误差驱动的。 随机性策略失败是因为它们在每一步引入了不同的误差模式(pattern),而这些变化的误差模式沿梯度路径累积,反而放大了不稳定性。确定性旋转之所以有效,恰恰因为它在每一步施加相同的变换,让误差模式保持一致,避免了误差累积。

端到端效率:训练步吞吐 +20%,综合加速 9-10%

把确定性 Hadamard 旋转加上全流程 MXFP4 之后,效率数据如下:

训练步吞吐提升了 20%,扣掉多出的 8-9% token 开销之后,端到端综合加速仍有 9-10%。

考虑到这是把精度从 8 比特直接砍到 4 比特,这个收敛质量和加速幅度都相当可观。

左图:在 C4 数据集上进行 MLPerf 预训练时,Llama 3.1–8B 的验证困惑度随训练 token 数变化的曲线。结果显示,MXFP4 + 确定性 Hadamard 与 FP8 的表现非常接近,而未进行稳定化处理的全流程 MXFP4 收敛速度更慢,训练稳定性也更差。右图:训练后期的局部放大视图。MLPerf 的目标困惑度为 3.3。与未稳定化的 MXFP4 运行相比,确定性 Hadamard(H16)能够与 FP8 基线保持更紧密的一致性。

值得注意的是,作者在论文中明确强调了一项重要限制:这套 FP4 训练方案(MLPerf C4 数据集 + Llama 3.1-8B)的效果已经得到验证,但不能直接假设它能无缝迁移到所有模型、所有数据集和所有训练方法。FP4 训练的行为可能是高度设置依赖的,具体的稳定策略需要根据场景重新验证。

结语

把这篇论文放到更大的产业脉络里,至少有三层意义。

第一层:它回答了一个根本性的「为什么」。 过去的 FP4 训练工作大多聚焦于「怎么让它不崩」,这篇论文第一次给出了清晰的因果诊断:崩溃源于 Wgrad 路径上的结构性微缩放误差,而非随机性不足。这个诊断本身就具有方法论价值,它告诉后续研究者:在低精度训练中遇到不稳定性时,应该优先排查结构性误差源,而非盲目增加随机性。

第二层:它把 FP4 从「推理专属」推向了「训练可用」。此前行业共识是 FP4 只适合推理量化,训练至少要用 FP8。NVIDIA 在 Blackwell 上主推 FP4 推理而非训练,也反映了这一判断。这篇论文在原生 FP4 硬件上跑通了全流程预训练,意味着 MI355X 和 Blackwell 上那些为推理准备的 FP4 算力,理论上也可以用来训练。如果 FP4 训练在更大模型和更多场景上被验证可行,等于现有硬件的可用训练算力直接翻倍。

第三层:它使用了 OCP 开放标准。 MXFP4 是 OCP Microscaling 格式标准的一部分,背后有 AMD、NVIDIA、Intel、Meta、Microsoft、Arm、Qualcomm 七家公司联合支持。基于开放标准意味着这套方法在不同厂商的硬件上都有可移植性,不会被锁定在单一生态里。

从 FP16 到 FP8,DeepSeek-V3 已经证明精度减半可以大幅降低训练成本。从 FP8 到 FP4,这篇论文迈出了关键的第一步。精度每砍一刀,整个大模型训练的经济性都在发生转变。

本文来自微信公众号 “机器之心”(ID:almosthuman2014),编辑:冷猫

你可能也喜歡

前高盛CEO访谈：危机、领导力、AI与年轻人的建议

前高盛CEO Lloyd Blankfein在对话中分享了他对领导力、风险管理和企业文化的见解。他提到，在危机中保持冷静是关键，自己习惯在紧张时刻用幽默缓解气氛。他建议企业在挑选董事会成员时，优先考虑有危机经验的人。 Blankfein回顾了自己从普通家庭到哈佛的成长经历，认为低起点反而是一种优势。他加入高盛源于其收购的商品交易公司J.Aron，这段经历塑造了他的风险管理理念：投资既要勇于承担风险，也要时刻防范潜在危机。他强调，管理层需要平衡鼓励冒险与适时克制风险。谈到技术，他指出金融业是技术的快速采用者，但作为受监管机构，高盛对系统变更极为谨慎。在IPO后，高盛努力保留了合伙人文化，通过薪酬机制和沟通保持员工的归属感。在金融危机中，高盛凭借严格的风险管理和逐日盯市制度提前预警，并坚持对客户负责，维护了长期声誉。他对当前科技公司的建议是：在危机前主动与公众沟通，建立理解。关于AI与市场风险，Blankfein认为，当前风险可能被低估，尤其是自动化交易系统的可靠性与杠杆问题。但他总体上支持技术进步。最后，他建议年轻人拓宽知识面，学习历史与人文，成为一个完整的人。长远来看，广泛的兴趣和坚韧的心态将带来更丰富的职业生涯。

marsbit28 分鐘前

marsbit28 分鐘前

实体比特币的演进之路

比特币的数字化特性使其具备自主托管与全球快速流转的优势，但也因无形属性阻碍了大众接受。多年来，业界不断尝试将比特币实体化，以保留其类似现金的特性，产生了一系列经典产品。 2011年出现的Casascius Coins是早期代表性实体比特币，采用防篡改贴纸覆盖私钥，其中心化铸币模式依赖对发行者的信任，后因监管压力停产。随后出现的RavenBit Coins尝试去中心化铸币，允许用户自行生成并粘贴私钥，但难以保证安全与可信。 2016年推出的Opendimes是一次重大突破。这款U盘形态的硬件设备能自主生成并安全存储私钥，转入比特币后需物理破坏设备才能提取资产，解决了铸币信任问题，但成本较高且形态不便日常流通。 Satodime在Opendimes理念上改进，采用卡片、戒指等多种形态，通过NFC交互，成本有所降低，但仍属于高安全性硬件钱包，难以达到日常现金的普及成本。实现实体比特币普及的核心难点在于硬件成本。美元纸币成本仅数美分，而当前能运行比特币加密算法的芯片成本难以降至1美元以下。虽然恩智浦NTAG X DNA等芯片展现了降价潜力，但原生支持比特币算法、完全开源的安全芯片研发投入巨大。此外，比特币作为数字资产，实体载体需联网核验余额，若依赖发行机构信任则背离了比特币去信任化的初衷。OfflineCash等产品结合安全芯片与纸币形态，构想美好但距大规模落地尚远。近期Coinkite推出的Tapsigner采用借记卡外形，内置自研比特币NFC芯片，支持碰一碰支付，可作为可充值的硬件钱包或定向支付工具，虽单价约20美元，但推动重点回归线下支付生态融合。综上所述，实体比特币的演进在安全、去信任与低成本之间持续探索，目前卡片形态硬件钱包是相对可行的方向，但要实现如现金般低成本、易流通的普及仍面临显著的技术与成本挑战。

marsbit34 分鐘前

marsbit34 分鐘前

PhotonPay 升级嵌入式钱包 API：打造“隐形且势在必行”的稳定币支付底层基础设施

光子支付（PhotonPay）宣布对其嵌入式钱包API进行重大升级，旨在为企业提供“隐形且势在必行”的稳定币支付底层基础设施。此次升级的核心是打造“零触碰”架构，使非加密原生的传统企业能够快速、安全地接入稳定币支付，而无需管理私钥或应对复杂的合规负担，最快可在5天内上线。传统跨境支付存在高成本、低效率的“结构性税收”问题，例如国际汇款平均成本高达6.36%。稳定币以其近乎即时、低成本和可编程的特性，正成为跨境贸易的重要结算层，尤其在B2B领域增长迅猛。然而，技术复杂性与合规门槛阻碍了广大企业采用。 PhotonPay的解决方案通过嵌入式钱包API，为企业提供一站式服务，涵盖KYC验证、钱包配置、链上结算到法币出金的全流程。其关键优势包括：快速部署与集成、内嵌的“合规即基础设施”（如AML/CFT风控）、消除单点故障的安全架构，以及全球法币与稳定币的无缝协同。公司强调，在监管日益明确（如欧盟MiCA）和机构基础设施成熟的当下，“合规优先”已从成本中心转变为关键竞争护城河。其合规技术栈确保交易符合国际标准，为企业安全扩张铺路。市场驱动力包括全球监管框架明朗化、主流金融机构的采纳，以及新兴市场对稳定币结算的强劲需求。PhotonPay的API旨在帮助企业把握这一趋势，高效满足市场需求。 PhotonPay是一家以稳定币驱动的全球金融基础设施操作系统，服务覆盖200多个国家和地区，致力于重新定义全球薪酬发放与跨境支付格局。

链捕手1 小時前

PhotonPay 升级嵌入式钱包 API：打造“隐形且势在必行”的稳定币支付底层基础设施

链捕手1 小時前

三星靠技术周期，海力士靠 HBM，美光凭什么赢了万亿市值？

美光科技（Micron Technology）作为全球三大内存芯片制造商之一，其生存和发展逻辑独特。它缺乏韩国三星、SK海力士的政府或财阀资本支持，却能在多次行业危机中存活并达到万亿市值。美光的核心生存策略是双重的：一方面，它屡次在危机关口诉诸政治与法律手段，通过向华盛顿“求助”来争取喘息空间。例如，1985年投诉日本企业倾销使其获得发展窗口；2002年作为“污点证人”在反垄断调查中脱身；2017年则通过诉讼和游说打压中国初创企业福建晋华。这些行动为其赢得了关键的生存时间，但也使其背负了“政治投机者”的标签。另一方面，也是其立足的根本，是数十年积累的极致制造成本控制能力。其DRAM芯片单元面积（约66.26平方毫米）小于主要竞争对手，意味着相同晶圆能产出更多芯片，单位成本更低。这使其能在残酷的价格周期中比对手撑得更久。然而，美光的战略也埋下隐患。2013年为扩大规模收购日本尔必达，却错失了布局HBM（高带宽存储器）的黄金十年。当AI浪潮引爆HBM需求时，提前十年布局的SK海力士占据绝对主导（HBM3份额约85%），美光份额仅约3%，在高端赛道大幅落后。当前，美光面临三重挤压：在高端HBM市场追赶吃力；在中低端DRAM市场遭到中国长鑫存储等厂商的价格侵蚀；同时因中国市场的网络安全审查，其在中国核心市场的营收份额从2023财年的14%骤降至2025财年的7.1%，失去了AI基础设施建设期的宝贵订单机会。如今，美光正奋力追赶，其HBM3E产品已获得英伟达认证，并借助美国《芯片法案》投资新产线。但其面临的挑战本质上是“时间债”。政治杠杆和成本优势能帮其在现有赛道竞争，却无法弥补在新赛道上提前布局所积累的时间优势。未来，这家依靠特殊策略与硬核制造立足的巨头，能否在需要长期耐心和技术沉淀的HBM等高端竞争中赢得下一轮，仍是未知数。答案，藏在其尚未完成的HBM4晶圆与漫长的技术追赶中。

链捕手1 小時前

链捕手1 小時前

CEO意外离世，ONDO的「代币化叙事」会变吗？

Ondo Finance创始人兼CEO Nathan Allman意外离世。作为RWA（现实世界资产）赛道的重要推动者，他将Ondo从早期的DeFi收益协议，转向聚焦于将美债、美元收益资产及股票ETF等传统金融资产代币化的核心路径，塑造了ONDO作为“代币化第一标的”的市场叙事。公司宣布由总裁Ian De Bode接任CEO。Ian拥有麦肯锡数字资产咨询背景，长期负责Ondo战略与运营，其传统金融机构经验或更契合RWA下一阶段在合规、分销与规模扩张上的需求。短期来看，创始人离世可能引发市场对愿景延续性、机构合作以及ONDO代币定价的担忧。中长期而言，Ondo已构建了包括OUSG、USDY和Ondo Global Markets在内的产品矩阵，其发展更多依赖于产品推进、资产规模增长与真实需求，而非单一创始人。此次事件成为对项目是否已成长为可持续基础设施的压力测试。 Nathan Allman的遗产在于指明了一条将成熟传统金融资产引入链上的清晰路径。ONDO的未来地位，将取决于新团队能否继续交付产品并扩大市场规模。

marsbit2 小時前

marsbit2 小時前

交易

現貨

合約

熱門文章

什麼是 $S$

理解 SPERO：全面概述 SPERO 簡介隨著創新領域的不斷演變，web3 技術和加密貨幣項目的出現在塑造數字未來中扮演著關鍵角色。在這個動態領域中，SPERO（標記為 SPERO,$$s$）是一個引起關注的項目。本文旨在收集並呈現有關 SPERO 的詳細信息，以幫助愛好者和投資者理解其基礎、目標和在 web3 和加密領域內的創新。 SPERO,$$s$ 是什麼？ SPERO,$$s$ 是加密空間中的一個獨特項目，旨在利用去中心化和區塊鏈技術的原則，創建一個促進參與、實用性和金融包容性的生態系統。該項目旨在以新的方式促進點對點互動，為用戶提供創新的金融解決方案和服務。 SPERO,$$s$ 的核心目標是通過提供增強用戶體驗的工具和平台來賦能個人。這包括使交易方式更加靈活、促進社區驅動的倡議，以及通過去中心化應用程序（dApps）創造金融機會的途徑。SPERO,$$s$ 的基本願景圍繞包容性展開，旨在彌合傳統金融中的差距，同時利用區塊鏈技術的優勢。誰是 SPERO,$$s$ 的創建者？ SPERO,$$s$ 的創建者身份仍然有些模糊，因為公開可用的資源對其創始人提供的詳細背景信息有限。這種缺乏透明度可能源於該項目對去中心化的承諾——這是一種許多 web3 項目所共享的精神，優先考慮集體貢獻而非個人認可。通過將討論重心放在社區及其共同目標上，SPERO,$$s$ 體現了賦能的本質，而不特別突出某些個體。因此，理解 SPERO 的精神和使命比識別單一創建者更為重要。誰是 SPERO,$$s$ 的投資者？ SPERO,$$s$ 得到了來自風險投資家到天使投資者的多樣化投資者的支持，他們致力於促進加密領域的創新。這些投資者的關注點通常與 SPERO 的使命一致——優先考慮那些承諾社會技術進步、金融包容性和去中心化治理的項目。這些投資者通常對不僅提供創新產品，還對區塊鏈社區及其生態系統做出積極貢獻的項目感興趣。這些投資者的支持強化了 SPERO,$$s$ 作為快速發展的加密項目領域中的一個重要競爭者。 SPERO,$$s$ 如何運作？ SPERO,$$s$ 採用多面向的框架，使其與傳統的加密貨幣項目區別開來。以下是一些突顯其獨特性和創新的關鍵特徵：去中心化治理：SPERO,$$s$ 整合了去中心化治理模型，賦予用戶積極參與決策過程的權力，關於項目的未來。這種方法促進了社區成員之間的擁有感和責任感。代幣實用性：SPERO,$$s$ 使用其自己的加密貨幣代幣，旨在在生態系統內部提供多種功能。這些代幣使交易、獎勵和平台上提供的服務得以促進，增強了整體參與度和實用性。分層架構：SPERO,$$s$ 的技術架構支持模塊化和可擴展性，允許在項目發展過程中無縫整合額外的功能和應用。這種適應性對於在不斷變化的加密環境中保持相關性至關重要。社區參與：該項目強調社區驅動的倡議，採用激勵合作和反饋的機制。通過培養強大的社區，SPERO,$$s$ 能夠更好地滿足用戶需求並適應市場趨勢。專注於包容性：通過提供低交易費用和用戶友好的界面，SPERO,$$s$ 旨在吸引多樣化的用戶群體，包括那些以前可能未曾參與加密領域的個體。這種對包容性的承諾與其通過可及性賦能的總體使命相一致。 SPERO,$$s$ 的時間線理解一個項目的歷史提供了對其發展軌跡和里程碑的關鍵見解。以下是建議的時間線，映射 SPERO,$$s$ 演變中的重要事件：概念化和構思階段：形成 SPERO,$$s$ 基礎的初步想法被提出，與區塊鏈行業內的去中心化和社區聚焦原則密切相關。項目白皮書的發布：在概念階段之後，發布了一份全面的白皮書，詳細說明了 SPERO,$$s$ 的願景、目標和技術基礎設施，以吸引社區的興趣和反饋。社區建設和早期參與：積極進行外展工作，建立早期採用者和潛在投資者的社區，促進圍繞項目目標的討論並獲得支持。代幣生成事件：SPERO,$$s$ 進行了一次代幣生成事件（TGE），向早期支持者分發其原生代幣，並在生態系統內建立初步流動性。首次 dApp 上線：與 SPERO,$$s$ 相關的第一個去中心化應用程序（dApp）上線，允許用戶參與平台的核心功能。持續發展和夥伴關係：對項目產品的持續更新和增強，包括與區塊鏈領域其他參與者的戰略夥伴關係，使 SPERO,$$s$ 成為加密市場中一個具有競爭力和不斷演變的參與者。結論 SPERO,$$s$ 是 web3 和加密貨幣潛力的見證，能夠徹底改變金融系統並賦能個人。憑藉對去中心化治理、社區參與和創新設計功能的承諾，它為更具包容性的金融環境鋪平了道路。與任何在快速發展的加密領域中的投資一樣，潛在的投資者和用戶都被鼓勵進行徹底研究，並對 SPERO,$$s$ 的持續發展進行深思熟慮的參與。該項目展示了加密行業的創新精神，邀請人們進一步探索其無數可能性。儘管 SPERO,$$s$ 的旅程仍在展開，但其基礎原則確實可能影響我們在互聯網數字生態系統中如何與技術、金融和彼此互動的未來。

85 人學過發佈於 2024.12.17更新於 2024.12.17

什麼是 AGENT S

Agent S：Web3中自主互動的未來介紹在不斷演變的Web3和加密貨幣領域，創新不斷重新定義個人如何與數字平台互動。Agent S是一個開創性的項目，承諾通過其開放的代理框架徹底改變人機互動。Agent S旨在簡化複雜任務，為人工智能（AI）提供變革性的應用，鋪平自主互動的道路。本詳細探索將深入研究該項目的複雜性、其獨特特徵以及對加密貨幣領域的影響。什麼是Agent S？ Agent S是一個突破性的開放代理框架，專門設計用來解決計算機任務自動化中的三個基本挑戰：獲取特定領域知識：該框架智能地從各種外部知識來源和內部經驗中學習。這種雙重方法使其能夠建立豐富的特定領域知識庫，提升其在任務執行中的表現。長期任務規劃：Agent S採用經驗增強的分層規劃，這是一種戰略方法，可以有效地分解和執行複雜任務。此特徵顯著提升了其高效和有效地管理多個子任務的能力。處理動態、不均勻的界面：該項目引入了代理-計算機界面（ACI），這是一種創新的解決方案，增強了代理和用戶之間的互動。利用多模態大型語言模型（MLLMs），Agent S能夠無縫導航和操作各種圖形用戶界面。通過這些開創性特徵，Agent S提供了一個強大的框架，解決了自動化人機互動中涉及的複雜性，為AI及其他領域的無數應用奠定了基礎。誰是Agent S的創建者？儘管Agent S的概念根本上是創新的，但有關其創建者的具體信息仍然難以捉摸。創建者目前尚不清楚，這突顯了該項目的初期階段或戰略選擇將創始成員保密。無論是否匿名，重點仍然在於框架的能力和潛力。誰是Agent S的投資者？由於Agent S在加密生態系統中相對較新，關於其投資者和財務支持者的詳細信息並未明確記錄。缺乏對支持該項目的投資基礎或組織的公開見解，引發了對其資金結構和發展路線圖的質疑。了解其支持背景對於評估該項目的可持續性和潛在市場影響至關重要。 Agent S如何運作？ Agent S的核心是尖端技術，使其能夠在多種環境中有效運作。其運營模型圍繞幾個關鍵特徵構建：類人計算機互動：該框架提供先進的AI規劃，力求使與計算機的互動更加直觀。通過模仿人類在任務執行中的行為，承諾提升用戶體驗。敘事記憶：用於利用高級經驗，Agent S利用敘事記憶來跟蹤任務歷史，從而增強其決策過程。情節記憶：此特徵為用戶提供逐步指導，使框架能夠在任務展開時提供上下文支持。支持OpenACI：Agent S能夠在本地運行，使用戶能夠控制其互動和工作流程，與Web3的去中心化理念相一致。與外部API的輕鬆集成：其多功能性和與各種AI平台的兼容性確保了Agent S能夠無縫融入現有技術生態系統，成為開發者和組織的理想選擇。這些功能共同促成了Agent S在加密領域的獨特地位，因為它以最小的人類干預自動化複雜的多步任務。隨著項目的發展，其在Web3中的潛在應用可能重新定義數字互動的展開方式。 Agent S的時間線 Agent S的發展和里程碑可以用一個時間線來概括，突顯其重要事件： 2024年9月27日：Agent S的概念在一篇名為《一個像人類一樣使用計算機的開放代理框架》的綜合研究論文中推出，展示了該項目的基礎工作。 2024年10月10日：該研究論文在arXiv上公開，提供了對框架及其基於OSWorld基準的性能評估的深入探索。 2024年10月12日：發布了一個視頻演示，提供了對Agent S能力和特徵的視覺洞察，進一步吸引潛在用戶和投資者。這些時間線上的標記不僅展示了Agent S的進展，還表明了其對透明度和社區參與的承諾。有關Agent S的要點隨著Agent S框架的持續演變，幾個關鍵特徵脫穎而出，強調其創新性和潛力：創新框架：旨在提供類似人類互動的直觀計算機使用，Agent S為任務自動化帶來了新穎的方法。自主互動：通過GUI自主與計算機互動的能力標誌著向更智能和高效的計算解決方案邁進了一步。複雜任務自動化：憑藉其強大的方法論，能夠自動化複雜的多步任務，使過程更快且更少出錯。持續改進：學習機制使Agent S能夠從過去的經驗中改進，不斷提升其性能和效率。多功能性：其在OSWorld和WindowsAgentArena等不同操作環境中的適應性確保了它能夠服務於廣泛的應用。隨著Agent S在Web3和加密領域中的定位，其增強互動能力和自動化過程的潛力標誌著AI技術的一次重大進步。通過其創新框架，Agent S展現了數字互動的未來，為各行各業的用戶承諾提供更無縫和高效的體驗。結論 Agent S代表了AI與Web3結合的一次大膽飛躍，具有重新定義我們與技術互動方式的能力。儘管仍處於早期階段，但其應用的可能性廣泛且引人入勝。通過其全面的框架解決關鍵挑戰，Agent S旨在將自主互動帶到數字體驗的最前沿。隨著我們深入加密貨幣和去中心化的領域，像Agent S這樣的項目無疑將在塑造技術和人機協作的未來中發揮關鍵作用。

797 人學過發佈於 2025.01.14更新於 2025.01.14

如何購買S

歡迎來到HTX.com！在這裡，購買Sonic (S)變得簡單而便捷。跟隨我們的逐步指南，放心開始您的加密貨幣之旅。第一步：創建您的HTX帳戶使用您的 Email、手機號碼在HTX註冊一個免費帳戶。體驗無憂的註冊過程並解鎖所有平台功能。立即註冊第二步：前往買幣頁面，選擇您的支付方式信用卡/金融卡購買：使用您的Visa或Mastercard即時購買Sonic (S)。餘額購買：使用您HTX帳戶餘額中的資金進行無縫交易。第三方購買：探索諸如Google Pay或Apple Pay等流行支付方式以增加便利性。C2C購買：在HTX平台上直接與其他用戶交易。HTX 場外交易 (OTC) 購買：為大量交易者提供個性化服務和競爭性匯率。第三步：存儲您的Sonic (S)購買Sonic (S)後，將其存儲在您的HTX帳戶中。您也可以透過區塊鏈轉帳將其發送到其他地址或者用於交易其他加密貨幣。第四步：交易Sonic (S)在HTX的現貨市場輕鬆交易Sonic (S)。前往您的帳戶，選擇交易對，執行交易，並即時監控。HTX為初學者和經驗豐富的交易者提供了友好的用戶體驗。

1.6k 人學過發佈於 2025.01.15更新於 2025.03.21

AMD新论文颠覆认知：FP4训练不稳定，原因不是随机性不足

文章摘要

MXFP4 是什么

排查实验:不稳定的根源

端到端效率:训练步吞吐 +20%,综合加速 9-10%

结语

相關問答

你可能也喜歡

前高盛CEO访谈：危机、领导力、AI与年轻人的建议

实体比特币的演进之路

PhotonPay 升级嵌入式钱包 API：打造“隐形且势在必行”的稳定币支付底层基础设施

三星靠技术周期，海力士靠 HBM，美光凭什么赢了万亿市值？

CEO意外离世，ONDO的「代币化叙事」会变吗？

交易

熱門文章

什麼是 $S$

什麼是 AGENT S

如何購買S

相關討論

熱門問答

熱門分類

熱門標籤