对话亚马逊云科技Mai-Lan:S3的下一个战场,如何应对Agent时代的数据消费狂潮

marsbit發佈於 2026-05-08更新於 2026-05-08

文章摘要

年初,OpenClaw在中国市场的火爆展现了Agent的巨大潜力,但随之而来的是对云基础设施,尤其是数据层的严峻考验。当Agent以极高频率并发调用数据时,传统数据处理方式面临瓶颈。 亚马逊云科技技术副总裁Mai-Lan Tomsen Bukovec指出,Agent采用“并行择优”模式,同时发起数十甚至上百个查询,其数据消费的活跃度和吞吐量远超人类,对底层数据服务的成本与性能提出了决定性要求。 为应对AI时代的数据处理需求,Amazon S3近期实现了三大核心变革:支持Apache Iceberg表格式的S3 Table,使Agent能通过熟悉的SQL高效交互;推出S3 Vector,将向量作为原生数据类型,用于构建数据上下文和充当Agent的共享记忆,使用率增长迅猛;发布S3 Files,允许Agent通过POSIX文件系统标准自然访问S3数据,将其视为共享记忆空间。 这些演进旨在将S3打造为承载AI工作负载的关键底座。Mai-Lan强调,S3始终以经济、可靠的方式支持主流数据类型增长,其设计原则正是客户长期信赖的基础,也将支撑其在Agent时代的持续发展。

年初,OpenClaw在中国市场的火爆,让所有人看到了Agent的巨大潜力。但随之而来的,是一道所有云厂商都必须回答的考题:当Agent开始像赛博龙虾一样疯狂繁殖、高频调用数据时,AI云基础设施层尤其是数据层,准备好了吗?

比方说,企业数据团队在将Agent部署到生产环境时,经常会在数据层面遇到瓶颈。构建向量数据库、关系数据库、图数据库和湖仓等不同平台上的Agent,需要同步数据管道以保持上下文信息的时效性。但在真实的生产环境中,这些上下文信息会逐渐过时。

这个问题的紧迫性,源于Agent与人类工程师截然不同的数据消费模式。

“Agent正在一种极其活跃且激进的方式消费数据,它对于数仓或数据湖的调用频率是惊人的。”

亚马逊云科技技术副总裁Mai-Lan Tomsen Bukovec近日与笔者交流中指出,Agent是一种通过“并行择优”的工作模式,即:不是一次一个查询,而是同时数十、上百个并行,通过比较来寻找最佳路径。这使得Agent成为比人类激进得多的数据消费者——调用频率高出几个数量级,数据吞吐量呈指数级增长。

Mai-Lan进一步指出,“现在客户非常希望构建Agent基础设施,成本亦或者说性价比,不再是次要因素,而变成决定性因素。在未来半年到一年,随着Agent的爆发,底层数据服务的选择将变得至关重要。”

如今,OpenClaw的狂欢正在消退,留下的正是对云厂商底层存算能力的压力测试警告。Mai-Lan认为,亚马逊云科技在这一领域具备天然优势,Amazon S3(Amazon Simple Storage Service)的规模、Amazon Redshift与Amazon Athena在高并发下的成本效率,正是为这种超大规模、超高频的Agent数据交互方式而准备。

时值Amazon S3产品诞生20周年,围绕AI时代客户对数据处理的诉求,Amazon S3近期也实现了S3 Table(表格式)、S3 Files(文件)、S3 Vector(向量)的三大变革。

如S3 Table对Apache Iceberg的原生支持。Mai-Lan指出,Agent在处理数据时,倾向于直接通过SQL与Iceberg格式的数据交互。其底层逻辑在于,Agent构建于大模型之上,而大模型在训练过程中已对SQL语法和Iceberg数据格式形成成熟的处理能力。将所有表数据以Iceberg格式存放于S3,使得Agent无需学习多种复杂的访问API,即可高效处理数据。目前Agent与S3及Iceberg之间展现出高度的契合性。

当Iceberg能力被引入S3时,引发了新一轮创新浪潮,Postgres、Oracle等数据源开始直接写入Iceberg,Agent系统则可直接与这些表进行交互。而随着S3 Vectors的推出,越来越多的AI应用开始将向量作为共享记忆载体,从而为AI交互体验注入“状态”。

Mai-Lan还指出,向量已被引入作为S3的原生数据类型。向量的应用主要集中于两个维度:一是通过向量为存储在S3中的数据构建上下文信息,二是将向量用作共享记忆。S3 Vectors发布后的五个月内,市场反馈符合预期。大量客户开始使用该功能,通过嵌入模型生成向量以丰富数据的上下文。S3 Vectors作为Agent系统记忆空间的使用率呈爆发式增长。

值得一提的是,S3 Files于几周前发布,使Agent能够通过POSIX标准,即文件系统的方式处理S3中的数据。在Agent系统中,大模型高度关注“文件”这一形态,无论是Python库还是Shell脚本,均为大模型训练过程中所熟悉的内容,Agent天然倾向于将文件作为数据接口。

为此,S3 Files的设计思路是在S3存储桶上挂载一个EFS文件系统。通过该机制,用户可以基于POSIX标准在文件系统中处理S3数据:小文件可通过EFS缓存加速访问,大文件则直接从S3进行流式传输。这使得Agent能够以熟悉的文件系统语言与S3数据实现原生交互,并将共享文件系统视为来自S3的“共享记忆空间”。

从大模型记忆能力的发展来看,这一进步具有重要意义。当前的AI体验正逐步引入更深层的对话上下文与个性化互动——无论是在Agent之间、人与Agent之间,还是Agent与数据之间,模型表现均在持续演进。通过文件系统这一自然接口的进一步扩展,Agent系统的记忆能力有望获得更深层次的提升。

笔者注意到,从2006年以图像等半结构化数据为主,到后来的分析型数据,从最初的数仓到数据湖的兴起,亚马逊云科技目前正大力推动Amazon S3成为承载AI工作负载的关键底座,以适应当下客户的诉求。Mai-Lan认为,Amazon S3的设计核心是以经济的方式推动主流数据类型增长,并始终坚守数据的可用性、持久性和韧性等准则。而这也正是客户在20年间持续将其数据业务托付给S3的原因,也将承载其下一个20年的可能。

(本文作者 | 杨丽,编辑 | 杨林)

相關問答

Q根据文章,Agent在数据消费模式上与人类工程师有何根本不同?

AAgent采用“并行择优”的工作模式,能够同时发起数十甚至上百个并行查询来寻找最佳路径。这使得Agent成为比人类激进得多的数据消费者,其调用频率高出几个数量级,数据吞吐量呈指数级增长。

Q亚马逊云科技的Amazon S3近期针对AI时代数据处理,具体推出了哪三大变革?

AAmazon S3近期实现了三大变革:S3 Table(表格式)、S3 Files(文件)和S3 Vector(向量)。这些变革旨在更好地支持AI工作负载,例如,S3 Table原生支持Apache Iceberg格式,S3 Vectors将向量引入为原生数据类型,而S3 Files则允许通过POSIX文件系统接口处理S3数据。

Q文章中提到S3 Vectors的两个主要应用维度是什么?

AS3 Vectors的应用主要集中在两个维度:第一,通过向量为存储在S3中的数据构建上下文信息;第二,将向量用作Agent系统的共享记忆载体。

QMai-Lan指出,随着Agent的爆发,什么因素将成为客户选择底层数据服务的决定性因素?

AMai-Lan指出,随着Agent的爆发,成本或者说性价比,从次要因素变成了决定性因素。客户在构建Agent基础设施时,底层数据服务的成本效率变得至关重要。

Q为什么Agent天然倾向于将文件作为数据接口?

AAgent基于大模型构建,而在大模型的训练过程中,大量接触了Python库、Shell脚本等以“文件”形态存在的内容。因此,Agent天然倾向于将文件作为一种熟悉和自然的数据接口。S3 Files正是顺应这一倾向,让Agent能够通过POSIX文件系统标准与S3数据进行原生交互。

你可能也喜歡

王川:当隔壁老王投资存储股票赚了三十倍后,如何还能不焦虑 (六)- 同质化商品的陷阱

本文以存储行业为例,探讨了投资同质化商品股票所面临的巨大风险与陷阱。 文章首先回顾了上世纪90年代艾美加公司的案例。其Zip驱动器产品一度引发热潮,股价在一年半内暴涨超160倍,但随后因CD刻录技术等廉价替代品的出现而崩溃,市值最终蒸发97%。这揭示了存储产品缺乏品牌溢价、极易被替代的特性。 接着,文章指出以DRAM为代表的存储产品是典型的同质化商品。其核心矛盾在于:需求具有弹性,而供给却是重资产、长周期且刚性的。一旦供需出现轻微过剩,价格便会剧烈下跌,导致相关公司股价暴跌甚至破产,历史上有多次跌幅超过80%乃至95%的案例。 近期(文中指2025-2026年),因AI发展带动高带宽内存需求爆发,而供给短期刚性,存储价格及厂商毛利率(如闪迪、美光)飙升至70%以上,股价随之大涨。然而,这种高利润本身不可持续:它正在催生大规模的新产能投资,并刺激全行业寻求技术方案以减少对存储的依赖。当新产能于2027年左右释放时,可能出现“卖得越多,赚得越少”的局面。 文章进一步警告,行业在周期高点时,公司市盈率往往很低,看似“价值洼地”,实则风险最高。一旦价格反转,利润将迅速萎缩。此外,厂商与客户签订的长期供货协议在现货价格下跌时往往脆弱不堪,难以提供真正保护。 总之,存储行业的本质决定了其强周期性。当前的高利润和低市盈率恰恰是风险积聚的信号,而非投资机会。投资者需警惕这种“财富焚化炉”,避免在行业下行周期中因表象诱惑而蒙受巨大损失。

marsbit40 分鐘前

王川:当隔壁老王投资存储股票赚了三十倍后,如何还能不焦虑 (六)- 同质化商品的陷阱

marsbit40 分鐘前

王川:当隔壁老王投资存储股票赚了三十倍后,如何还能不焦虑 (六)- 同质化商品的陷阱

本文以存储行业为例,探讨了同质化商品的周期性陷阱。文章首先回顾了1990年代艾美加(Iomega)公司因推出大容量移动存储产品而股价暴涨160倍,但随后因竞争(如CD刻录技术)和产品同质化而暴跌97%的历史案例,揭示了存储产品缺乏品牌溢价、价格剧烈波动的本质。 作者指出,存储行业的根本矛盾在于“弹性的需求”面对“重资产、长周期、刚性的供给”。当需求(如近年因AI爆发对高带宽内存HBM的需求)短期内激增而供给固定时,价格会因抢夺有限产能而飙升,带来极高的毛利率(如闪迪、美光近期的财报所示)。然而,这种高利润不可持续:它诱使厂商大幅投资扩产,同时刺激客户寻求技术方案以减少存储依赖。一旦新产能上线或需求放缓,供需逆转将导致价格崩溃,出现“卖的越多,赚的越少”的局面。 文中警告,行业高景气时往往伴随低市盈率的假象,极具迷惑性,但此时风险最高。所谓的长期供货协议在价格下行时非常脆弱,难以真正锁定利润。最终,同质化商品的高毛利本身会消灭高毛利,任何新玩家入场或技术变革都可能打破脆弱的平衡。投资者应警惕这种周期顶点的价值陷阱,而非沉醉于暂时的暴利幻梦。

链捕手58 分鐘前

王川:当隔壁老王投资存储股票赚了三十倍后,如何还能不焦虑 (六)- 同质化商品的陷阱

链捕手58 分鐘前

交易

現貨
合約

熱門文章

如何購買ERA

歡迎來到HTX.com!在這裡,購買Caldera (ERA)變得簡單而便捷。跟隨我們的逐步指南,放心開始您的加密貨幣之旅。第一步:創建您的HTX帳戶使用您的 Email、手機號碼在HTX註冊一個免費帳戶。體驗無憂的註冊過程並解鎖所有平台功能。立即註冊第二步:前往買幣頁面,選擇您的支付方式信用卡/金融卡購買:使用您的Visa或Mastercard即時購買Caldera (ERA)。餘額購買:使用您HTX帳戶餘額中的資金進行無縫交易。第三方購買:探索諸如Google Pay或Apple Pay等流行支付方式以增加便利性。C2C購買:在HTX平台上直接與其他用戶交易。HTX 場外交易 (OTC) 購買:為大量交易者提供個性化服務和競爭性匯率。第三步:存儲您的Caldera (ERA)購買Caldera (ERA)後,將其存儲在您的HTX帳戶中。您也可以透過區塊鏈轉帳將其發送到其他地址或者用於交易其他加密貨幣。第四步:交易Caldera (ERA)在HTX的現貨市場輕鬆交易Caldera (ERA)。前往您的帳戶,選擇交易對,執行交易,並即時監控。HTX為初學者和經驗豐富的交易者提供了友好的用戶體驗。

683 人學過發佈於 2025.07.17更新於 2025.07.17

如何購買ERA

相關討論

歡迎來到 HTX 社群。在這裡,您可以了解最新的平台發展動態並獲得專業的市場意見。 以下是用戶對 ERA (ERA)幣價的意見。

活动图片