从一张午餐桌到无限宇宙,李飞飞押注AI的下一个维度

marsbit發佈於 2026-05-27更新於 2026-05-27

文章摘要

斯坦福大学教授、World Labs创始人李飞飞在近期的多次访谈中系统阐述了她对AI发展方向的判断:空间智能(Spatial Intelligence)是下一个前沿,而当前主流的大语言模型存在根本局限。 李飞飞指出,人类语言仅有约50万年历史,而视觉与空间感知能力则可追溯至5.4亿年前,是智能演化的基础。语言本质上是对世界的一种“有信息损失”的编码,无法完整捕捉物理世界的三维结构、运动和交互。她举例说明,当前AI模型甚至难以完成“数清视频中椅子数量”这类幼儿级空间任务,更无法像牛顿那样从观测数据中推导物理定律。 她创立的World Labs正致力于此方向,其首代模型Marble能够从文本、图像等输入生成可导航、可交互且具有几何一致性的3D环境,这与生成视频有本质区别。Marble模型规模远小于GPT-5,部分原因是高质量3D数据稀缺,且该领域尚处早期。该技术已应用于游戏开发、电影虚拟制作(将周期缩短40倍)、机器人训练、室内设计乃至为强迫症、恐高症患者定制个性化治疗环境。 李飞飞展望,空间智能技术将能创造“无限的宇宙”,应用于社交、旅行、创意等多领域,使人类未来可能生活在“多元宇宙”中。她同时也提醒,对AI的讨论应避免乌托邦或末日论的两极化,技术成功的终极标尺应是让人类文明更美好,并始终维护每个人的尊严与自主性。 她认为,从“谈论世界”到“理解世界”再到“在世界中行动”,是AI必须完成的进化。这条道路虽充满挑战,但意义深远,正如她所言:“感知先于语言,空间先于符号。”

500万年,这是人类语言在进化史上的年龄。5.4亿年,这是视觉和空间感知催生寒武纪生命大爆发的起点。

在硅谷几乎所有顶级实验室都在卷语言模型的2025和2026年,斯坦福大学教授、World Labs创始人李飞飞反复抛出一个让行业不得不抬头的问题:如果AI只会说话和看图片,它永远不会真正“理解”这个世界。

她在三次关键访谈中,包括2025年6月的a16z Podcast、2026年2月的思科AI峰会(Cisco AI Summit),以及2026年5月22日发布、长达1小时19分钟的Lenny's Podcast深度对话,系统阐述了一个正在被加速验证的判断:空间智能(Spatial Intelligence),才是AI的下一个前沿。

其中a16z对话中“创造无限的宇宙”“生活在多元宇宙中”的表述,以及Lenny's Podcast中“世界模型才是下一个前沿”“AGI更像营销术语”等观点,最近在X平台上再度被大量转发。

“我们缺一个世界模型”

据a16z合伙人Martin Casado回忆,在硅谷的一次午餐会上,满桌AI从业者在兴奋地谈论大语言模型。李飞飞坐在餐桌另一头,突然转头问他:

“你知道我们缺什么吗?我们缺一个世界模型。”

Casado是World Labs的早期投资人,也是李飞飞在斯坦福时期就结识的老友。他回忆那一刻时说,“一切都对上了”。他当时刚从大量图像领域的投资中独立得出类似结论:语言不是故事的终点。

但李飞飞对这个问题的思考远比大多数人更久远。

2024年4月,她在TED大会上发表了一场15分钟的演讲,用进化论做了破题:5.4亿年前三叶虫的出现,第一次让生命“看见”了世界。视觉的诞生引爆了智能的演化竞赛,神经系统开始发育,动物变得活跃,智能由此萌芽。而语言,不过是这场漫长竞赛中非常晚近的产物。

这个判断在三次访谈中被反复强化。在思科AI峰会上,她的表述更加直接:

“语言的历史大概只有50万年。但在15亿年前,动物就开始感知光线并触摸环境。在真实的3D、4D物理世界中进行理解、推理、交互和导航的能力是基础性的,与语言智能同样重要。”

李飞飞并非否定语言智能的价值。她的核心论点是:语言在本质上是一种“有信息损失的”对世界的编码方式。

在a16z访谈中,Casado做了一个思维实验:蒙上你的眼睛,用语言描述一个房间,然后让你完成一项任务,你成功的概率极低。因为语言对现实的描述永远是粗糙的。拿掉眼罩,你的大脑瞬间重建3D空间,你就能操作、触摸、移动。

李飞飞补充了一个更极端的例子,即科学史上最著名的一次空间推理:罗莎琳德·富兰克林拍摄的DNA X射线衍射照片是一张平面的二维影像,上面的结构看起来像一个带有衍射的十字。但沃森和克里克通过那张二维照片,在三维空间中推理出了DNA的双螺旋结构。“那个结构不可能是二维的。你不能用二维的思维来推导出那个结构。”

“如果你观察人类智能,很多都超出了语言的范畴。语言是一种有信息损失的捕捉世界的方式。纯粹的生成式‘语言’在自然界中并不存在;我们环顾四周,没有现成的句子或单词,而整个物理、感知、视觉世界却真实存在。”

这是一个容易被忽视的视角:当前大模型的大部分能力,建立在一种天然有损的信息压缩格式之上。而在Lenny's Podcast中,她用一个更日常的测试戳穿了这个幻象:

“今天,你拿一个模型,让它运行一段包含几个办公室房间的视频,然后要求模型数一下椅子的数量。这是幼儿就能做到的事情,而人工智能却做不到。”

更不用说从天体运动中推导出物理定律:“让我们把所有的数据都给人工智能,包括牛顿没有的现代仪器数据,让它创建一套17世纪关于物体运动规律的方程。今天的人工智能做不到。”

Marble:比GPT-5小几个数量级

将这个判断推向产品的是World Labs的第一代模型Marble,2024年底发布。

李飞飞在思科AI峰会上详细拆解了Marble的技术定位:接收文本、图片、视频或简单3D输入,生成一个“完全可导航、可交互且具有永久一致性的3D世界”。她特别强调,这与Sora等视频生成模型有本质区别,Marble生成的环境拥有几何结构,不是一段“看起来像”视频的像素动画。

在Lenny's Podcast中,她用柏拉图的洞穴寓言做了更深的阐释:囚犯被绑在椅子上,只能看到墙上投射的二维影子,但真正的戏剧在背后三维空间中上演。视频模型就是那些影子,而空间智能要做的,是创造和推理那个影子背后的真实世界。

一组对比:GPT-5的训练算力大约在10的26次方FLOPS量级,而Marble在规模上小几个数量级。原因有两层:数据获取难度完全不同(高质量3D物理数据极其稀缺),且这个领域还处于“Scaling Law的上升曲线”的早期阶段。

在Lenny's Podcast中,她进一步解释了为什么机器人学习无法简单复制语言模型的“苦涩的教训”。AI领域有一个著名的论断:拥有海量数据的简单模型最终总能胜过复杂模型。但“语言模型拥有一个完美的设置:训练数据是单词,输出也是文字。”而机器人技术中,“你希望获得行动,训练数据却缺乏在3D世界中的行动。”这种训练目标与数据形态之间的根本错位,才是机器人学习的核心难题。

World Labs采取混合数据策略:互联网规模的文本、图像和视频,加上仿真模拟数据,再加上真实世界采集数据。李飞飞坦承,“我们仍在探索模型架构的相对早期阶段”,但她预计“接下来的几年将会非常令人兴奋”。

话音刚落,World Labs就在2026年2月完成10亿美元融资,英伟达、AMD、a16z参投,估值从一年前的10亿美元飙升至约50亿美元。4月,团队开源了3D高斯溅射渲染引擎Spark 2.0,可在网页端实现亿级3D场景实时渲染,从闭源产品转向“产品+开源生态”的双轨策略,空间智能的技术门槛正在被快速拉低。

在Lenny's Podcast中,李飞飞也罕见地坦露了创业的艰辛:“如果我能对18个月前的自己耳语一句话:“这个领域的竞争强度,无论是技术还是人才,远超你的想象。”

无限宇宙与多元宇宙

真正让a16z那次访谈在X上反复出圈的,是李飞飞关于“无限宇宙”的表述:

“在整个人类文明历史中,我们所有人都共同生活在一个3D世界里。只有少数人去过月球,但人数非常少。而这项技术让数字虚拟世界变得无比精彩。突然间,我们实际上可以创造无限的宇宙,有些是为机器人创造的,有些是为创造力创造的,有些是为社交创造的,有些是为旅行创造的,有些是为讲故事创造的。突然之间,我们能够生活在一个多元宇宙中,想象的空间是无限的。”

Casado则从技术层面做了更具体的阐释:通过一张二维照片,模型就能生成包括桌子背面在内的完整360度3D表示。你可以操作、测量、堆叠,空间中能做的任何事都可以实现。

这不是科幻。在两次访谈中,李飞飞列举了Marble已经落地的应用:

• 游戏开发者用早期版本开发游戏

• 与索尼合作的虚拟制作团队将电影制作周期缩短了40倍

• 英伟达及多家学术实验室利用Marble训练机器人

• 建筑师和设计师用它做室内设计

• 临床研究人员为强迫症、恐高症患者定制个性化的沉浸式触发环境

• 有人用它生成个性化的瑜伽训练空间

最后一个应用尤其出人意料。李飞飞在峰会上提到,OCD患者会被非常具体的场景触发,“比如我个人会被堆积的脏衣服困扰,但每个人的触发点各不相同”。在Lenny's Podcast中她补充道,发布后一位朋友连夜打电话问她是否可以用Marble治疗恐高症。实体环境的搭建成本极高,而Marble只需输入提示词,几分钟就能生成各种环境。

柏拉图的洞穴寓言,恰好也是理解2D与3D分歧的最佳入口。

李飞飞用这个寓言解释:被绑在椅子上的囚犯,只能看到墙上投射的二维影子。当前的语言模型和视频模型,本质上都是那些影子,从二维中猜测三维。空间智能的野心,是创造、推理和交互那个影子背后的真实世界。

在技术路线上,她用一个简洁的对比划清了边界:

“汽车可以被视作一个在二维平面上移动的方块机器人,它的目标是不要碰到任何东西。而机器人是一个三维实体,在三维世界中运行,通用机器人的目标是必须接触物体而不破坏它们。这是一个更高维度的问题。”

她还给出了一个来自亲身经历的时间刻度:2006年,她参与创造了第一辆在沙漠行驶138英里的自动驾驶汽车,当时预言20年后会有自动驾驶汽车。直到2025年,Waymo才开始在城市街道大规模运行。

“看清北极星并不意味着旅程会很短。”

Casado在a16z对话中补充了更具商业直觉的观察:仅自动驾驶一个赛道,行业就投入了大约1000亿美元,20年才走到今天。“我们原本的路线是先解决世界导航问题,但结果极其困难。”

李飞飞甚至在a16z访谈中分享了一段个人经历来强化论点:大约五年前,她因眼角膜受伤失去了几个月的立体视觉。“即使我非常清楚我的车有多大,也大概知道邻居家停的车有多大,而且我在这条路上开了很多年,但我无法很好地判断车和路边停着的车之间的距离。我只能开到时速十英里,以免刮到其他车。”

一个终身研究视觉智能的科学家,用自己失去深度感知后的切身困境,回答了“为什么3D不可替代”这个问题。

技术双刃剑与文明标尺

在技术乐观主义和末日论之间,李飞飞选择了一个更克制也更具操作性的站位。她在思科AI峰会上明确表达了对两极化言论的担忧:

“网络上的讨论往往是非黑即白的:要么是完全的技术乌托邦主义,忽略了技术是一把双刃剑;要么就是末日论调,仿佛人类时刻面临生存危机。对于一项对人类文明如此深远的技术,这种讨论方式是不负责任的。”

她没有停留在批评层面,而是给出了一个可量化的价值锚点:电力。

“如果回拨一百多年,想象当时人们如何定义电力的成功。我希望那时的愿景是:学校灯火通明,家园温暖如春,机器被赋予力量实现工业化,进而延长人类寿命,让更多孩子接受教育。”

然后将这个锚点平移到AI:“成功的定义应该是文明变得更加美好,而文明是由每一个追求幸福、繁荣且拥有尊严的个体组成的。这就是AI以及每一项技术成功的定义。”

在Lenny's Podcast的结尾,她把这份关切落到了具体的人身上。她说自己每到一处都会被问到同一个问题:如果我是农民、护士、音乐家,AI会取代我吗?她的回答是:“归根结底,AI是关于人的。任何技术都不应该剥夺人的尊严。人类的尊严和自主性应该成为每项技术的开发、部署以及治理的核心。”

回顾三次访谈,一条清晰的脉络浮出水面。

李飞飞对空间智能的思考,不是对大模型浪潮的反叛,而是在其基础上的延伸。她比大多数人更早地看到了语言模型的极限,一种有损的信息压缩格式能做的终究有限。而空间智能要解决的问题是:让AI从“谈论世界”进化到“理解世界”,最终到“在世界中行动”。

World Labs团队约30人,已融资超10亿美元。Marble是第一代产品,规模远不及顶级语言模型。3D数据的稀缺和模型架构的早期状态,决定了这不会是一条一蹴而就的路线。但李飞飞在Lenny's Podcast中说了另一句话,或许是对这份耐心最好的注解:

“我们的大脑只消耗约20瓦,比房间里任何灯泡都暗,却能做这么多事。我在AI领域工作得越多,越尊重人类。”

5.4亿年的进化,才让碳基生命获得了这份20瓦的空间智能。AI的这场进化,正在被压缩到几年内完成。

李飞飞在三次访谈中都没有给出时间表。她只是反复回到那个从进化论中提取的判断:感知先于语言,空间先于符号。这场正在硅谷、斯坦福实验室和World Labs办公室里发生的,不是一次技术迭代,而是一次进化论的加速重演。(本文首发钛媒体APP,作者 | 硅谷tech news,编辑 | 赵虹宇)

附:上述三场访谈文字实录收录地址【ima知识库】李飞飞访谈 https://ima.qq.com/wiki/?shareId=3f1d4b4c0d6cb2aeca250e2c5d068390e2d45895816ad607309820e25cb2e9c5

相關問答

Q李飞飞在文章中提出的AI下一个前沿是什么?

A李飞飞提出的AI下一个前沿是空间智能。她认为,如果AI只会说话和看图片,它永远不会真正理解世界,而空间智能(在3D、4D物理世界中进行理解、推理、交互和导航的能力)才是未来发展的关键。

Q李飞飞用哪个进化论观点来支撑空间智能的重要性?

A李飞飞用视觉和空间感知的起源来支撑其观点。她指出,视觉的诞生(约5.4亿年前的寒武纪生命大爆发)引爆了智能的演化竞赛,神经系统开始发育,动物变得活跃。相比之下,语言(约500万年历史)是这场漫长竞赛中非常晚近的产物,因此基于空间感知的智能更为基础。

QWorld Labs的第一代空间智能模型叫什么?它和Sora等视频生成模型的核心区别是什么?

AWorld Labs的第一代空间智能模型叫Marble。它与Sora等视频生成模型的核心区别在于:Marble生成的是一个拥有几何结构的、完全可导航、可交互且具有永久一致性的3D世界,而不仅仅是看起来像视频的像素动画或一段视频。

Q在商业应用方面,Marble模型有哪些已落地的案例?请列举至少三个。

A1. 与索尼合作的虚拟制作团队将电影制作周期缩短了40倍。 2. 英伟达及多家学术实验室利用Marble来训练机器人。 3. 临床研究人员用它为强迫症、恐高症等患者定制个性化的沉浸式触发环境进行暴露疗法。

Q对于AI技术的发展,李飞飞倡导避免哪两种极端言论,并以什么作为衡量AI成功的“文明标尺”?

A李飞飞倡导避免两种极端言论:一种是完全的技术乌托邦主义(忽略技术的双刃剑效应),另一种是末日论调(认为技术时刻带来生存危机)。她以“电力”作为类比,提出了衡量AI成功的“文明标尺”:成功的定义应该是文明变得更加美好,即每个个体都能追求幸福、繁荣且拥有尊严。她强调人类的尊严和自主性应成为技术开发、部署及治理的核心。

你可能也喜歡

刚刚,中国AI闯入全球编程前二,前面只剩Claude

Code Arena最新榜单显示,阿里通义千问Qwen3.7-Max以1541分位列全球第四,成为唯一进入该榜单前列的中国模型,排名仅次于Claude Opus系列模型。 在具体任务测试中,Qwen3.7-Max表现突出。例如,在编写可自我训练的俄罗斯方块AI任务中,其成本仅为1.32美元,性能却超越其他模型56%。在构建3D宇宙模型和生成3D像素风宝塔模型等任务中,其输出速度与质量也全面胜出。 一项硬核的3D赛车游戏生成挑战进一步验证了其能力。Qwen3.7-Max首轮生成即基本可玩,并独特地添加了开始界面和音效,细节处理优于其他对比模型(如Gemini 3.5 Flash、Claude Opus 4.6和GPT-5.5),后者大多需要多轮调试。 Qwen3.7-Max被定位为“Agent基座模型”,专为长时间自主执行复杂任务设计。内测数据显示,它能连续运行35小时,执行超千次工具调用,在长程任务中保持稳定推理,无上下文退化或指令漂移。 其技术核心在于训练方法的升级:一是“环境扩展”,让模型在不同执行框架和验证方式中学习通用解题策略;二是“长程自主执行”训练,使模型能在动态环境中进行超千步连续决策与策略调整。 此次Qwen3.7-Max在Code Arena榜单的突破,标志着中国AI模型已在全球编程竞技场中成为重要的竞争者。

marsbit57 分鐘前

刚刚,中国AI闯入全球编程前二,前面只剩Claude

marsbit57 分鐘前

GSR研究指出以太坊的身份危机正在加深

GSR研究指出,以太坊正面临深刻的身份危机。报告称,以太坊基金会(EF)在2026年已有至少九位高级成员离职,包括多位核心协议负责人,这引发了社区对其战略方向的担忧。内部推行的“CROPS”(抗审查、开源、隐私、安全)框架被部分社区成员视为忽视了增长与采用,而此刻以太坊正面临来自Solana等竞争对手的压力。 人员动荡加剧了一场更广泛的辩论:EF应继续专注于研究和协议开发,还是应更积极地捍卫以太坊的市场地位?前基金会成员Dankrad Feist呼吁建立一个资金超10亿美元的新组织来填补机构空白,而知名ETH支持者David Hoffman则因对领导层失去信心而清仓了ETH。 市场表现加深了危机感。ETH年内下跌约30%,ETH/BTC汇率跌至2025年中期以来最低点,网络收入也被其他公链蚕食。 Vitalik Buterin对此回应,主张EF应保持“小船”定位,聚焦于CROPS,而非成为以太坊的增长部门。他强调以太坊的核心优势在于“可信中立性”,并阐述了三大技术支柱:通过AI实现无漏洞软件的正式验证、独特的“可用链共识”特性,以及通过FOCIL等提案减少对中介的依赖。 报告总结认为,Buterin的愿景虽未出错,但以太坊的执行窗口并非无限。核心问题在于,一个更精简、专注的EF能否在维护以太坊根本优势的同时,让生态系统的其他部分构建起增长引擎。截至发稿时,ETH交易价格为2,097美元。

bitcoinist4 小時前

GSR研究指出以太坊的身份危机正在加深

bitcoinist4 小時前

交易

現貨
合約

熱門文章

什麼是 $S$

理解 SPERO:全面概述 SPERO 簡介 隨著創新領域的不斷演變,web3 技術和加密貨幣項目的出現在塑造數字未來中扮演著關鍵角色。在這個動態領域中,SPERO(標記為 SPERO,$$s$)是一個引起關注的項目。本文旨在收集並呈現有關 SPERO 的詳細信息,以幫助愛好者和投資者理解其基礎、目標和在 web3 和加密領域內的創新。 SPERO,$$s$ 是什麼? SPERO,$$s$ 是加密空間中的一個獨特項目,旨在利用去中心化和區塊鏈技術的原則,創建一個促進參與、實用性和金融包容性的生態系統。該項目旨在以新的方式促進點對點互動,為用戶提供創新的金融解決方案和服務。 SPERO,$$s$ 的核心目標是通過提供增強用戶體驗的工具和平台來賦能個人。這包括使交易方式更加靈活、促進社區驅動的倡議,以及通過去中心化應用程序(dApps)創造金融機會的途徑。SPERO,$$s$ 的基本願景圍繞包容性展開,旨在彌合傳統金融中的差距,同時利用區塊鏈技術的優勢。 誰是 SPERO,$$s$ 的創建者? SPERO,$$s$ 的創建者身份仍然有些模糊,因為公開可用的資源對其創始人提供的詳細背景信息有限。這種缺乏透明度可能源於該項目對去中心化的承諾——這是一種許多 web3 項目所共享的精神,優先考慮集體貢獻而非個人認可。 通過將討論重心放在社區及其共同目標上,SPERO,$$s$ 體現了賦能的本質,而不特別突出某些個體。因此,理解 SPERO 的精神和使命比識別單一創建者更為重要。 誰是 SPERO,$$s$ 的投資者? SPERO,$$s$ 得到了來自風險投資家到天使投資者的多樣化投資者的支持,他們致力於促進加密領域的創新。這些投資者的關注點通常與 SPERO 的使命一致——優先考慮那些承諾社會技術進步、金融包容性和去中心化治理的項目。 這些投資者通常對不僅提供創新產品,還對區塊鏈社區及其生態系統做出積極貢獻的項目感興趣。這些投資者的支持強化了 SPERO,$$s$ 作為快速發展的加密項目領域中的一個重要競爭者。 SPERO,$$s$ 如何運作? SPERO,$$s$ 採用多面向的框架,使其與傳統的加密貨幣項目區別開來。以下是一些突顯其獨特性和創新的關鍵特徵: 去中心化治理:SPERO,$$s$ 整合了去中心化治理模型,賦予用戶積極參與決策過程的權力,關於項目的未來。這種方法促進了社區成員之間的擁有感和責任感。 代幣實用性:SPERO,$$s$ 使用其自己的加密貨幣代幣,旨在在生態系統內部提供多種功能。這些代幣使交易、獎勵和平台上提供的服務得以促進,增強了整體參與度和實用性。 分層架構:SPERO,$$s$ 的技術架構支持模塊化和可擴展性,允許在項目發展過程中無縫整合額外的功能和應用。這種適應性對於在不斷變化的加密環境中保持相關性至關重要。 社區參與:該項目強調社區驅動的倡議,採用激勵合作和反饋的機制。通過培養強大的社區,SPERO,$$s$ 能夠更好地滿足用戶需求並適應市場趨勢。 專注於包容性:通過提供低交易費用和用戶友好的界面,SPERO,$$s$ 旨在吸引多樣化的用戶群體,包括那些以前可能未曾參與加密領域的個體。這種對包容性的承諾與其通過可及性賦能的總體使命相一致。 SPERO,$$s$ 的時間線 理解一個項目的歷史提供了對其發展軌跡和里程碑的關鍵見解。以下是建議的時間線,映射 SPERO,$$s$ 演變中的重要事件: 概念化和構思階段:形成 SPERO,$$s$ 基礎的初步想法被提出,與區塊鏈行業內的去中心化和社區聚焦原則密切相關。 項目白皮書的發布:在概念階段之後,發布了一份全面的白皮書,詳細說明了 SPERO,$$s$ 的願景、目標和技術基礎設施,以吸引社區的興趣和反饋。 社區建設和早期參與:積極進行外展工作,建立早期採用者和潛在投資者的社區,促進圍繞項目目標的討論並獲得支持。 代幣生成事件:SPERO,$$s$ 進行了一次代幣生成事件(TGE),向早期支持者分發其原生代幣,並在生態系統內建立初步流動性。 首次 dApp 上線:與 SPERO,$$s$ 相關的第一個去中心化應用程序(dApp)上線,允許用戶參與平台的核心功能。 持續發展和夥伴關係:對項目產品的持續更新和增強,包括與區塊鏈領域其他參與者的戰略夥伴關係,使 SPERO,$$s$ 成為加密市場中一個具有競爭力和不斷演變的參與者。 結論 SPERO,$$s$ 是 web3 和加密貨幣潛力的見證,能夠徹底改變金融系統並賦能個人。憑藉對去中心化治理、社區參與和創新設計功能的承諾,它為更具包容性的金融環境鋪平了道路。 與任何在快速發展的加密領域中的投資一樣,潛在的投資者和用戶都被鼓勵進行徹底研究,並對 SPERO,$$s$ 的持續發展進行深思熟慮的參與。該項目展示了加密行業的創新精神,邀請人們進一步探索其無數可能性。儘管 SPERO,$$s$ 的旅程仍在展開,但其基礎原則確實可能影響我們在互聯網數字生態系統中如何與技術、金融和彼此互動的未來。

85 人學過發佈於 2024.12.17更新於 2024.12.17

什麼是 $S$

什麼是 AGENT S

Agent S:Web3中自主互動的未來 介紹 在不斷演變的Web3和加密貨幣領域,創新不斷重新定義個人如何與數字平台互動。Agent S是一個開創性的項目,承諾通過其開放的代理框架徹底改變人機互動。Agent S旨在簡化複雜任務,為人工智能(AI)提供變革性的應用,鋪平自主互動的道路。本詳細探索將深入研究該項目的複雜性、其獨特特徵以及對加密貨幣領域的影響。 什麼是Agent S? Agent S是一個突破性的開放代理框架,專門設計用來解決計算機任務自動化中的三個基本挑戰: 獲取特定領域知識:該框架智能地從各種外部知識來源和內部經驗中學習。這種雙重方法使其能夠建立豐富的特定領域知識庫,提升其在任務執行中的表現。 長期任務規劃:Agent S採用經驗增強的分層規劃,這是一種戰略方法,可以有效地分解和執行複雜任務。此特徵顯著提升了其高效和有效地管理多個子任務的能力。 處理動態、不均勻的界面:該項目引入了代理-計算機界面(ACI),這是一種創新的解決方案,增強了代理和用戶之間的互動。利用多模態大型語言模型(MLLMs),Agent S能夠無縫導航和操作各種圖形用戶界面。 通過這些開創性特徵,Agent S提供了一個強大的框架,解決了自動化人機互動中涉及的複雜性,為AI及其他領域的無數應用奠定了基礎。 誰是Agent S的創建者? 儘管Agent S的概念根本上是創新的,但有關其創建者的具體信息仍然難以捉摸。創建者目前尚不清楚,這突顯了該項目的初期階段或戰略選擇將創始成員保密。無論是否匿名,重點仍然在於框架的能力和潛力。 誰是Agent S的投資者? 由於Agent S在加密生態系統中相對較新,關於其投資者和財務支持者的詳細信息並未明確記錄。缺乏對支持該項目的投資基礎或組織的公開見解,引發了對其資金結構和發展路線圖的質疑。了解其支持背景對於評估該項目的可持續性和潛在市場影響至關重要。 Agent S如何運作? Agent S的核心是尖端技術,使其能夠在多種環境中有效運作。其運營模型圍繞幾個關鍵特徵構建: 類人計算機互動:該框架提供先進的AI規劃,力求使與計算機的互動更加直觀。通過模仿人類在任務執行中的行為,承諾提升用戶體驗。 敘事記憶:用於利用高級經驗,Agent S利用敘事記憶來跟蹤任務歷史,從而增強其決策過程。 情節記憶:此特徵為用戶提供逐步指導,使框架能夠在任務展開時提供上下文支持。 支持OpenACI:Agent S能夠在本地運行,使用戶能夠控制其互動和工作流程,與Web3的去中心化理念相一致。 與外部API的輕鬆集成:其多功能性和與各種AI平台的兼容性確保了Agent S能夠無縫融入現有技術生態系統,成為開發者和組織的理想選擇。 這些功能共同促成了Agent S在加密領域的獨特地位,因為它以最小的人類干預自動化複雜的多步任務。隨著項目的發展,其在Web3中的潛在應用可能重新定義數字互動的展開方式。 Agent S的時間線 Agent S的發展和里程碑可以用一個時間線來概括,突顯其重要事件: 2024年9月27日:Agent S的概念在一篇名為《一個像人類一樣使用計算機的開放代理框架》的綜合研究論文中推出,展示了該項目的基礎工作。 2024年10月10日:該研究論文在arXiv上公開,提供了對框架及其基於OSWorld基準的性能評估的深入探索。 2024年10月12日:發布了一個視頻演示,提供了對Agent S能力和特徵的視覺洞察,進一步吸引潛在用戶和投資者。 這些時間線上的標記不僅展示了Agent S的進展,還表明了其對透明度和社區參與的承諾。 有關Agent S的要點 隨著Agent S框架的持續演變,幾個關鍵特徵脫穎而出,強調其創新性和潛力: 創新框架:旨在提供類似人類互動的直觀計算機使用,Agent S為任務自動化帶來了新穎的方法。 自主互動:通過GUI自主與計算機互動的能力標誌著向更智能和高效的計算解決方案邁進了一步。 複雜任務自動化:憑藉其強大的方法論,能夠自動化複雜的多步任務,使過程更快且更少出錯。 持續改進:學習機制使Agent S能夠從過去的經驗中改進,不斷提升其性能和效率。 多功能性:其在OSWorld和WindowsAgentArena等不同操作環境中的適應性確保了它能夠服務於廣泛的應用。 隨著Agent S在Web3和加密領域中的定位,其增強互動能力和自動化過程的潛力標誌著AI技術的一次重大進步。通過其創新框架,Agent S展現了數字互動的未來,為各行各業的用戶承諾提供更無縫和高效的體驗。 結論 Agent S代表了AI與Web3結合的一次大膽飛躍,具有重新定義我們與技術互動方式的能力。儘管仍處於早期階段,但其應用的可能性廣泛且引人入勝。通過其全面的框架解決關鍵挑戰,Agent S旨在將自主互動帶到數字體驗的最前沿。隨著我們深入加密貨幣和去中心化的領域,像Agent S這樣的項目無疑將在塑造技術和人機協作的未來中發揮關鍵作用。

795 人學過發佈於 2025.01.14更新於 2025.01.14

什麼是 AGENT S

如何購買S

歡迎來到HTX.com!在這裡,購買Sonic (S)變得簡單而便捷。跟隨我們的逐步指南,放心開始您的加密貨幣之旅。第一步:創建您的HTX帳戶使用您的 Email、手機號碼在HTX註冊一個免費帳戶。體驗無憂的註冊過程並解鎖所有平台功能。立即註冊第二步:前往買幣頁面,選擇您的支付方式信用卡/金融卡購買:使用您的Visa或Mastercard即時購買Sonic (S)。餘額購買:使用您HTX帳戶餘額中的資金進行無縫交易。第三方購買:探索諸如Google Pay或Apple Pay等流行支付方式以增加便利性。C2C購買:在HTX平台上直接與其他用戶交易。HTX 場外交易 (OTC) 購買:為大量交易者提供個性化服務和競爭性匯率。第三步:存儲您的Sonic (S)購買Sonic (S)後,將其存儲在您的HTX帳戶中。您也可以透過區塊鏈轉帳將其發送到其他地址或者用於交易其他加密貨幣。第四步:交易Sonic (S)在HTX的現貨市場輕鬆交易Sonic (S)。前往您的帳戶,選擇交易對,執行交易,並即時監控。HTX為初學者和經驗豐富的交易者提供了友好的用戶體驗。

1.6k 人學過發佈於 2025.01.15更新於 2025.03.21

如何購買S

相關討論

歡迎來到 HTX 社群。在這裡,您可以了解最新的平台發展動態並獲得專業的市場意見。 以下是用戶對 S (S)幣價的意見。

活动图片