从一张午餐桌到无限宇宙,李飞飞押注AI的下一个维度

marsbitXuất bản vào 2026-05-27Cập nhật gần nhất vào 2026-05-27

Tóm tắt

斯坦福大学教授、World Labs创始人李飞飞在近期的多次访谈中系统阐述了她对AI发展方向的判断:空间智能(Spatial Intelligence)是下一个前沿,而当前主流的大语言模型存在根本局限。 李飞飞指出,人类语言仅有约50万年历史,而视觉与空间感知能力则可追溯至5.4亿年前,是智能演化的基础。语言本质上是对世界的一种“有信息损失”的编码,无法完整捕捉物理世界的三维结构、运动和交互。她举例说明,当前AI模型甚至难以完成“数清视频中椅子数量”这类幼儿级空间任务,更无法像牛顿那样从观测数据中推导物理定律。 她创立的World Labs正致力于此方向,其首代模型Marble能够从文本、图像等输入生成可导航、可交互且具有几何一致性的3D环境,这与生成视频有本质区别。Marble模型规模远小于GPT-5,部分原因是高质量3D数据稀缺,且该领域尚处早期。该技术已应用于游戏开发、电影虚拟制作(将周期缩短40倍)、机器人训练、室内设计乃至为强迫症、恐高症患者定制个性化治疗环境。 李飞飞展望,空间智能技术将能创造“无限的宇宙”,应用于社交、旅行、创意等多领域,使人类未来可能生活在“多元宇宙”中。她同时也提醒,对AI的讨论应避免乌托邦或末日论的两极化,技术成功的终极标尺应是让人类文明更美好,并始终维护每个人的尊严与自主性。 她认为,从“谈论世界”到“理解世界”再到“在世界中行动”,是AI必须完成的进化。这条道路虽充满挑战,但意义深远,正如她所言:“感知先于语言,空间先于符号。”

500万年,这是人类语言在进化史上的年龄。5.4亿年,这是视觉和空间感知催生寒武纪生命大爆发的起点。

在硅谷几乎所有顶级实验室都在卷语言模型的2025和2026年,斯坦福大学教授、World Labs创始人李飞飞反复抛出一个让行业不得不抬头的问题:如果AI只会说话和看图片,它永远不会真正“理解”这个世界。

她在三次关键访谈中,包括2025年6月的a16z Podcast、2026年2月的思科AI峰会(Cisco AI Summit),以及2026年5月22日发布、长达1小时19分钟的Lenny's Podcast深度对话,系统阐述了一个正在被加速验证的判断:空间智能(Spatial Intelligence),才是AI的下一个前沿。

其中a16z对话中“创造无限的宇宙”“生活在多元宇宙中”的表述,以及Lenny's Podcast中“世界模型才是下一个前沿”“AGI更像营销术语”等观点,最近在X平台上再度被大量转发。

“我们缺一个世界模型”

据a16z合伙人Martin Casado回忆,在硅谷的一次午餐会上,满桌AI从业者在兴奋地谈论大语言模型。李飞飞坐在餐桌另一头,突然转头问他:

“你知道我们缺什么吗?我们缺一个世界模型。”

Casado是World Labs的早期投资人,也是李飞飞在斯坦福时期就结识的老友。他回忆那一刻时说,“一切都对上了”。他当时刚从大量图像领域的投资中独立得出类似结论:语言不是故事的终点。

但李飞飞对这个问题的思考远比大多数人更久远。

2024年4月,她在TED大会上发表了一场15分钟的演讲,用进化论做了破题:5.4亿年前三叶虫的出现,第一次让生命“看见”了世界。视觉的诞生引爆了智能的演化竞赛,神经系统开始发育,动物变得活跃,智能由此萌芽。而语言,不过是这场漫长竞赛中非常晚近的产物。

这个判断在三次访谈中被反复强化。在思科AI峰会上,她的表述更加直接:

“语言的历史大概只有50万年。但在15亿年前,动物就开始感知光线并触摸环境。在真实的3D、4D物理世界中进行理解、推理、交互和导航的能力是基础性的,与语言智能同样重要。”

李飞飞并非否定语言智能的价值。她的核心论点是:语言在本质上是一种“有信息损失的”对世界的编码方式。

在a16z访谈中,Casado做了一个思维实验:蒙上你的眼睛,用语言描述一个房间,然后让你完成一项任务,你成功的概率极低。因为语言对现实的描述永远是粗糙的。拿掉眼罩,你的大脑瞬间重建3D空间,你就能操作、触摸、移动。

李飞飞补充了一个更极端的例子,即科学史上最著名的一次空间推理:罗莎琳德·富兰克林拍摄的DNA X射线衍射照片是一张平面的二维影像,上面的结构看起来像一个带有衍射的十字。但沃森和克里克通过那张二维照片,在三维空间中推理出了DNA的双螺旋结构。“那个结构不可能是二维的。你不能用二维的思维来推导出那个结构。”

“如果你观察人类智能,很多都超出了语言的范畴。语言是一种有信息损失的捕捉世界的方式。纯粹的生成式‘语言’在自然界中并不存在;我们环顾四周,没有现成的句子或单词,而整个物理、感知、视觉世界却真实存在。”

这是一个容易被忽视的视角:当前大模型的大部分能力,建立在一种天然有损的信息压缩格式之上。而在Lenny's Podcast中,她用一个更日常的测试戳穿了这个幻象:

“今天,你拿一个模型,让它运行一段包含几个办公室房间的视频,然后要求模型数一下椅子的数量。这是幼儿就能做到的事情,而人工智能却做不到。”

更不用说从天体运动中推导出物理定律:“让我们把所有的数据都给人工智能,包括牛顿没有的现代仪器数据,让它创建一套17世纪关于物体运动规律的方程。今天的人工智能做不到。”

Marble:比GPT-5小几个数量级

将这个判断推向产品的是World Labs的第一代模型Marble,2024年底发布。

李飞飞在思科AI峰会上详细拆解了Marble的技术定位:接收文本、图片、视频或简单3D输入,生成一个“完全可导航、可交互且具有永久一致性的3D世界”。她特别强调,这与Sora等视频生成模型有本质区别,Marble生成的环境拥有几何结构,不是一段“看起来像”视频的像素动画。

在Lenny's Podcast中,她用柏拉图的洞穴寓言做了更深的阐释:囚犯被绑在椅子上,只能看到墙上投射的二维影子,但真正的戏剧在背后三维空间中上演。视频模型就是那些影子,而空间智能要做的,是创造和推理那个影子背后的真实世界。

一组对比:GPT-5的训练算力大约在10的26次方FLOPS量级,而Marble在规模上小几个数量级。原因有两层:数据获取难度完全不同(高质量3D物理数据极其稀缺),且这个领域还处于“Scaling Law的上升曲线”的早期阶段。

在Lenny's Podcast中,她进一步解释了为什么机器人学习无法简单复制语言模型的“苦涩的教训”。AI领域有一个著名的论断:拥有海量数据的简单模型最终总能胜过复杂模型。但“语言模型拥有一个完美的设置:训练数据是单词,输出也是文字。”而机器人技术中,“你希望获得行动,训练数据却缺乏在3D世界中的行动。”这种训练目标与数据形态之间的根本错位,才是机器人学习的核心难题。

World Labs采取混合数据策略:互联网规模的文本、图像和视频,加上仿真模拟数据,再加上真实世界采集数据。李飞飞坦承,“我们仍在探索模型架构的相对早期阶段”,但她预计“接下来的几年将会非常令人兴奋”。

话音刚落,World Labs就在2026年2月完成10亿美元融资,英伟达、AMD、a16z参投,估值从一年前的10亿美元飙升至约50亿美元。4月,团队开源了3D高斯溅射渲染引擎Spark 2.0,可在网页端实现亿级3D场景实时渲染,从闭源产品转向“产品+开源生态”的双轨策略,空间智能的技术门槛正在被快速拉低。

在Lenny's Podcast中,李飞飞也罕见地坦露了创业的艰辛:“如果我能对18个月前的自己耳语一句话:“这个领域的竞争强度,无论是技术还是人才,远超你的想象。”

无限宇宙与多元宇宙

真正让a16z那次访谈在X上反复出圈的,是李飞飞关于“无限宇宙”的表述:

“在整个人类文明历史中,我们所有人都共同生活在一个3D世界里。只有少数人去过月球,但人数非常少。而这项技术让数字虚拟世界变得无比精彩。突然间,我们实际上可以创造无限的宇宙,有些是为机器人创造的,有些是为创造力创造的,有些是为社交创造的,有些是为旅行创造的,有些是为讲故事创造的。突然之间,我们能够生活在一个多元宇宙中,想象的空间是无限的。”

Casado则从技术层面做了更具体的阐释:通过一张二维照片,模型就能生成包括桌子背面在内的完整360度3D表示。你可以操作、测量、堆叠,空间中能做的任何事都可以实现。

这不是科幻。在两次访谈中,李飞飞列举了Marble已经落地的应用:

• 游戏开发者用早期版本开发游戏

• 与索尼合作的虚拟制作团队将电影制作周期缩短了40倍

• 英伟达及多家学术实验室利用Marble训练机器人

• 建筑师和设计师用它做室内设计

• 临床研究人员为强迫症、恐高症患者定制个性化的沉浸式触发环境

• 有人用它生成个性化的瑜伽训练空间

最后一个应用尤其出人意料。李飞飞在峰会上提到,OCD患者会被非常具体的场景触发,“比如我个人会被堆积的脏衣服困扰,但每个人的触发点各不相同”。在Lenny's Podcast中她补充道,发布后一位朋友连夜打电话问她是否可以用Marble治疗恐高症。实体环境的搭建成本极高,而Marble只需输入提示词,几分钟就能生成各种环境。

柏拉图的洞穴寓言,恰好也是理解2D与3D分歧的最佳入口。

李飞飞用这个寓言解释:被绑在椅子上的囚犯,只能看到墙上投射的二维影子。当前的语言模型和视频模型,本质上都是那些影子,从二维中猜测三维。空间智能的野心,是创造、推理和交互那个影子背后的真实世界。

在技术路线上,她用一个简洁的对比划清了边界:

“汽车可以被视作一个在二维平面上移动的方块机器人,它的目标是不要碰到任何东西。而机器人是一个三维实体,在三维世界中运行,通用机器人的目标是必须接触物体而不破坏它们。这是一个更高维度的问题。”

她还给出了一个来自亲身经历的时间刻度:2006年,她参与创造了第一辆在沙漠行驶138英里的自动驾驶汽车,当时预言20年后会有自动驾驶汽车。直到2025年,Waymo才开始在城市街道大规模运行。

“看清北极星并不意味着旅程会很短。”

Casado在a16z对话中补充了更具商业直觉的观察:仅自动驾驶一个赛道,行业就投入了大约1000亿美元,20年才走到今天。“我们原本的路线是先解决世界导航问题,但结果极其困难。”

李飞飞甚至在a16z访谈中分享了一段个人经历来强化论点:大约五年前,她因眼角膜受伤失去了几个月的立体视觉。“即使我非常清楚我的车有多大,也大概知道邻居家停的车有多大,而且我在这条路上开了很多年,但我无法很好地判断车和路边停着的车之间的距离。我只能开到时速十英里,以免刮到其他车。”

一个终身研究视觉智能的科学家,用自己失去深度感知后的切身困境,回答了“为什么3D不可替代”这个问题。

技术双刃剑与文明标尺

在技术乐观主义和末日论之间,李飞飞选择了一个更克制也更具操作性的站位。她在思科AI峰会上明确表达了对两极化言论的担忧:

“网络上的讨论往往是非黑即白的:要么是完全的技术乌托邦主义,忽略了技术是一把双刃剑;要么就是末日论调,仿佛人类时刻面临生存危机。对于一项对人类文明如此深远的技术,这种讨论方式是不负责任的。”

她没有停留在批评层面,而是给出了一个可量化的价值锚点:电力。

“如果回拨一百多年,想象当时人们如何定义电力的成功。我希望那时的愿景是:学校灯火通明,家园温暖如春,机器被赋予力量实现工业化,进而延长人类寿命,让更多孩子接受教育。”

然后将这个锚点平移到AI:“成功的定义应该是文明变得更加美好,而文明是由每一个追求幸福、繁荣且拥有尊严的个体组成的。这就是AI以及每一项技术成功的定义。”

在Lenny's Podcast的结尾,她把这份关切落到了具体的人身上。她说自己每到一处都会被问到同一个问题:如果我是农民、护士、音乐家,AI会取代我吗?她的回答是:“归根结底,AI是关于人的。任何技术都不应该剥夺人的尊严。人类的尊严和自主性应该成为每项技术的开发、部署以及治理的核心。”

回顾三次访谈,一条清晰的脉络浮出水面。

李飞飞对空间智能的思考,不是对大模型浪潮的反叛,而是在其基础上的延伸。她比大多数人更早地看到了语言模型的极限,一种有损的信息压缩格式能做的终究有限。而空间智能要解决的问题是:让AI从“谈论世界”进化到“理解世界”,最终到“在世界中行动”。

World Labs团队约30人,已融资超10亿美元。Marble是第一代产品,规模远不及顶级语言模型。3D数据的稀缺和模型架构的早期状态,决定了这不会是一条一蹴而就的路线。但李飞飞在Lenny's Podcast中说了另一句话,或许是对这份耐心最好的注解:

“我们的大脑只消耗约20瓦,比房间里任何灯泡都暗,却能做这么多事。我在AI领域工作得越多,越尊重人类。”

5.4亿年的进化,才让碳基生命获得了这份20瓦的空间智能。AI的这场进化,正在被压缩到几年内完成。

李飞飞在三次访谈中都没有给出时间表。她只是反复回到那个从进化论中提取的判断:感知先于语言,空间先于符号。这场正在硅谷、斯坦福实验室和World Labs办公室里发生的,不是一次技术迭代,而是一次进化论的加速重演。(本文首发钛媒体APP,作者 | 硅谷tech news,编辑 | 赵虹宇)

附:上述三场访谈文字实录收录地址【ima知识库】李飞飞访谈 https://ima.qq.com/wiki/?shareId=3f1d4b4c0d6cb2aeca250e2c5d068390e2d45895816ad607309820e25cb2e9c5

Câu hỏi Liên quan

Q李飞飞在文章中提出的AI下一个前沿是什么?

A李飞飞提出的AI下一个前沿是空间智能。她认为,如果AI只会说话和看图片,它永远不会真正理解世界,而空间智能(在3D、4D物理世界中进行理解、推理、交互和导航的能力)才是未来发展的关键。

Q李飞飞用哪个进化论观点来支撑空间智能的重要性?

A李飞飞用视觉和空间感知的起源来支撑其观点。她指出,视觉的诞生(约5.4亿年前的寒武纪生命大爆发)引爆了智能的演化竞赛,神经系统开始发育,动物变得活跃。相比之下,语言(约500万年历史)是这场漫长竞赛中非常晚近的产物,因此基于空间感知的智能更为基础。

QWorld Labs的第一代空间智能模型叫什么?它和Sora等视频生成模型的核心区别是什么?

AWorld Labs的第一代空间智能模型叫Marble。它与Sora等视频生成模型的核心区别在于:Marble生成的是一个拥有几何结构的、完全可导航、可交互且具有永久一致性的3D世界,而不仅仅是看起来像视频的像素动画或一段视频。

Q在商业应用方面,Marble模型有哪些已落地的案例?请列举至少三个。

A1. 与索尼合作的虚拟制作团队将电影制作周期缩短了40倍。 2. 英伟达及多家学术实验室利用Marble来训练机器人。 3. 临床研究人员用它为强迫症、恐高症等患者定制个性化的沉浸式触发环境进行暴露疗法。

Q对于AI技术的发展,李飞飞倡导避免哪两种极端言论,并以什么作为衡量AI成功的“文明标尺”?

A李飞飞倡导避免两种极端言论:一种是完全的技术乌托邦主义(忽略技术的双刃剑效应),另一种是末日论调(认为技术时刻带来生存危机)。她以“电力”作为类比,提出了衡量AI成功的“文明标尺”:成功的定义应该是文明变得更加美好,即每个个体都能追求幸福、繁荣且拥有尊严。她强调人类的尊严和自主性应成为技术开发、部署及治理的核心。

Nội dung Liên quan

Tại sao nhìn thấy xu hướng giảm vẫn không bán khống? Charlie Munger đã tính toán một ‘bài toán thua lỗ’

Bài viết thảo luận về lý do tại sao nhà đầu tư nên tránh các công cụ tài chính phức tạp như hợp đồng và đặc biệt là bán khống, ngay cả khi họ có quan điểm giảm giá về thị trường. Tác giả chia sẻ kinh nghiệm cá nhân và lời khuyên từ các huyền thoại đầu tư như Charlie Munger và Stanley Druckenmiller. Munger chỉ ra hai vấn đề cốt lõi của bán khống: (1) Sự bất cân xứng giữa rủi ro và lợi nhuận - lỗ tiềm năng là vô hạn trong khi lợi nhuận tối đa chỉ là 100%; (2) Người bán khống có thể cạn vốn trước khi công ty có vấn đề hoặc những kẻ lừa đảo điều hành nó sụp đổ. Ví dụ điển hình là Stanley Druckenmiller, một nhà giao dịch lão luyện, từng thua lỗ nặng khi bán khống 12 công ty. Mặc dù cuối cùng tất cả các công ty này đều phá sản, nhưng ông đã bị buộc phải đóng vị thế với khoản lỗ 600 triệu USD do giá cổ phiếu tăng mạnh trong ngắn hạn, vượt quá khả năng chịu đựng của ông. Bài viết kết luận rằng ngay cả các bậc thầy cũng không kiếm được lợi nhuận ổn định từ bán khống, vì vậy nhà đầu tư bình thường càng nên tránh xa các công cụ này và tập trung vào các chiến lược đầu tư đơn giản, an toàn hơn.

marsbit5 phút trước

Tại sao nhìn thấy xu hướng giảm vẫn không bán khống? Charlie Munger đã tính toán một ‘bài toán thua lỗ’

marsbit5 phút trước

Ai muốn phòng ngừa rủi ro thì mua vàng/dầu, ai muốn tăng trưởng bùng nổ thì mua AI, Bitcoin “lỗi thời” bước vào thị trường gấu

Tác giả: Wall Street News Bitcoin tiếp tục giảm mạnh, có lúc chạm mức thấp nhất trong hai tháng là 66.123 USD. Nhiều lý do được đưa ra như dòng tiền ETF rút ra, căng thẳng địa chính trị, hay việc Strategy bán bớt cổ phần. Tuy nhiên, phân tích cho thấy những điều này chỉ là biểu hiện bề mặt. Vấn đề cốt lõi là Bitcoin đang thua trong một cuộc cạnh tranh tài sản. Thị trường đã thay đổi. Bitcoin hiện rơi vào một "vùng lưỡng nan" khó xử, bị tấn công từ ba phía: 1. **Vai trò phòng ngừa lạm phát:** Vàng đang chiến thắng. Các nhà đầu tư lo ngại lạm phát hiện nay ưa chuộng vàng, cổ phiếu năng lượng và các nhà sản xuất hàng hóa hơn là Bitcoin, vì chúng có tài sản hữu hình hỗ trợ và logic rõ ràng hơn. 2. **Vai trò tăng trưởng:** AI đang chiến thắng. Những nhà đầu tư muốn tăng trưởng cao có thể chọn các công ty AI có doanh thu và lợi nhuận thực tế. Bitcoin không tạo ra dòng tiền nên không có lợi thế trên sân chơi này. 3. **Vai trò trong lĩnh vực tiền mã hóa:** Stablecoin và cơ sở hạ tầng đang chiến thắng. Ngay cả các nhà đầu tư muốn tiếp xúc với tiền mã hóa cũng không nhất thiết phải mua Bitcoin. Họ có thể chọn các sàn giao dịch, stablecoin, mạng thanh toán - những tài sản có hiệu suất gắn trực tiếp với tỷ lệ ứng dụng thực tế của ngành. Tóm lại, Bitcoin không còn là tài sản phòng ngừa rủi ro tốt nhất, cũng không phải là tài sản tăng trưởng tốt nhất, và cũng không còn là tài sản mã hóa duy nhất. Một ví dụ rõ ràng: cảnh báo gần đây của Chủ tịch Fed Cleveland về rủi ro lạm phát dai dẳng trước đây có thể là tin tốt cho Bitcoin, nhưng lần này thị trường không phản ứng theo cách đó. Cách ứng phó với lạm phát của nhà đầu tư đã thay đổi. Việc ETF rút vốn và Strategy bán bớt cổ phần phản ánh một thực tế cơ bản: vốn giờ đây có nhiều nơi để đầu tư hơn, và các nhà đầu tư cũng đòi hỏi khắt khe hơn đối với Bitcoin. Họ muốn biết Bitcoin mang lại lợi nhuận gì và tại sao phải chọn nó thay vì các tài sản khác. Logic thị trường gấu mới cho Bitcoin không còn là "nó là lừa đảo" hay "công nghệ thất bại", mà là: bản thân tính khan hiếm giờ đây đã không còn đủ sức thuyết phục.

marsbit22 phút trước

Ai muốn phòng ngừa rủi ro thì mua vàng/dầu, ai muốn tăng trưởng bùng nổ thì mua AI, Bitcoin “lỗi thời” bước vào thị trường gấu

marsbit22 phút trước

SaaS Cuộc Đào Tẩu Sinh Tử: Những Người Chiến Thắng Sống Sót Có Một Điểm Chung

Bài viết phân tích tác động của AI đối với ngành SaaS, so sánh sự biến động cổ phiếu gần đây. Các công ty như Snowflake và Datadog tăng mạnh nhờ mô hình tính phí theo mức sử dụng (consumption-based), được AI thúc đẩy nhu cầu xử lý dữ liệu và giám sát. Ngược lại, những công ty dựa trên phí theo chỗ ngồi (per-seat) hoặc theo nhiệm vụ như Intuit và Adobe chịu áp lực khi AI có thể thay thế lao động thủ công. Bài viết phân loại các công ty SaaS thành bốn nhóm: nền tảng tiêu thụ (Snowflake, Datadog), lớp kênh phân phối/nền tảng (Microsoft, Palantir), công ty quy trình làm việc đang chuyển đổi (Salesforce, ServiceNow) và công ty chịu áp lực trực tiếp (Intuit, Workday). Salesforce, dù có doanh thu AI tăng trưởng, vẫn bị ảnh hưởng bởi mô hình cũ, cho thấy quá trình chuyển đổi sang tính phí theo giá trị cần thời gian. Các tín hiệu từ Microsoft Build 2026 cho thấy AI đang trở thành một phần của hệ điều hành và Microsoft đang giảm phụ thuộc vào OpenAI. Thị trường hiện đang trong giai đoạn phân biệt công ty nào được AI hỗ trợ và công ty nào bị ảnh hưởng. Cần theo dõi sự lan rộng của đợt phục hồi, tốc độ chuyển đổi của Salesforce và dữ liệu áp dụng Copilot doanh nghiệp sau sự kiện Build.

marsbit38 phút trước

SaaS Cuộc Đào Tẩu Sinh Tử: Những Người Chiến Thắng Sống Sót Có Một Điểm Chung

marsbit38 phút trước

Giao dịch

Giao ngay
Hợp đồng Tương lai

Bài viết Nổi bật

AGENT S là gì

Agent S: Tương Lai của Tương Tác Tự Động trong Web3 Giới thiệu Trong bối cảnh không ngừng phát triển của Web3 và tiền điện tử, các đổi mới đang liên tục định nghĩa lại cách mà cá nhân tương tác với các nền tảng kỹ thuật số. Một dự án tiên phong như vậy, Agent S, hứa hẹn sẽ cách mạng hóa tương tác giữa con người và máy tính thông qua khung tác nhân mở của nó. Bằng cách mở đường cho các tương tác tự động, Agent S nhằm đơn giản hóa các nhiệm vụ phức tạp, cung cấp các ứng dụng chuyển đổi trong trí tuệ nhân tạo (AI). Cuộc khám phá chi tiết này sẽ đi sâu vào những phức tạp của dự án, các tính năng độc đáo của nó và những tác động đối với lĩnh vực tiền điện tử. Agent S là gì? Agent S đứng vững như một khung tác nhân mở đột phá, được thiết kế đặc biệt để giải quyết ba thách thức cơ bản trong việc tự động hóa các nhiệm vụ máy tính: Thu thập Kiến thức Cụ thể theo Miền: Khung này học một cách thông minh từ nhiều nguồn kiến thức bên ngoài và kinh nghiệm nội bộ. Cách tiếp cận kép này giúp nó xây dựng một kho lưu trữ phong phú về kiến thức cụ thể theo miền, nâng cao hiệu suất của nó trong việc thực hiện nhiệm vụ. Lập Kế Hoạch Qua Các Tầm Nhìn Nhiệm Vụ Dài Hạn: Agent S sử dụng lập kế hoạch phân cấp tăng cường kinh nghiệm, một cách tiếp cận chiến lược giúp phân chia và thực hiện các nhiệm vụ phức tạp một cách hiệu quả. Tính năng này nâng cao đáng kể khả năng quản lý nhiều nhiệm vụ con một cách hiệu quả và hiệu suất. Xử Lý Các Giao Diện Động, Không Đều: Dự án giới thiệu Giao Diện Tác Nhân-Máy Tính (ACI), một giải pháp đổi mới giúp nâng cao tương tác giữa các tác nhân và người dùng. Sử dụng các Mô Hình Ngôn Ngữ Lớn Đa Phương Thức (MLLMs), Agent S có thể điều hướng và thao tác các giao diện người dùng đồ họa đa dạng một cách liền mạch. Thông qua những tính năng tiên phong này, Agent S cung cấp một khung vững chắc giải quyết các phức tạp liên quan đến việc tự động hóa tương tác giữa con người với máy móc, mở ra nhiều ứng dụng trong AI và hơn thế nữa. Ai là Người Tạo ra Agent S? Mặc dù khái niệm về Agent S là hoàn toàn đổi mới, thông tin cụ thể về người sáng lập vẫn còn mơ hồ. Người sáng lập hiện vẫn chưa được biết đến, điều này làm nổi bật giai đoạn sơ khai của dự án hoặc sự lựa chọn chiến lược để giữ kín các thành viên sáng lập. Bất chấp sự ẩn danh, sự chú ý vẫn tập trung vào khả năng và tiềm năng của khung này. Ai là Các Nhà Đầu Tư của Agent S? Vì Agent S còn tương đối mới trong hệ sinh thái mã hóa, thông tin chi tiết về các nhà đầu tư và những người tài trợ tài chính của nó không được ghi chép rõ ràng. Sự thiếu vắng thông tin công khai về các nền tảng đầu tư hoặc tổ chức hỗ trợ dự án dấy lên câu hỏi về cấu trúc tài trợ và lộ trình phát triển của nó. Hiểu biết về sự hỗ trợ là rất quan trọng để đánh giá tính bền vững và tác động tiềm năng của dự án. Agent S Hoạt Động Như Thế Nào? Tại cốt lõi của Agent S là công nghệ tiên tiến cho phép nó hoạt động hiệu quả trong nhiều bối cảnh khác nhau. Mô hình hoạt động của nó được xây dựng xung quanh một số tính năng chính: Tương Tác Giống Như Con Người: Khung này cung cấp lập kế hoạch AI tiên tiến, cố gắng làm cho các tương tác với máy tính trở nên trực quan hơn. Bằng cách bắt chước hành vi của con người trong việc thực hiện nhiệm vụ, nó hứa hẹn nâng cao trải nghiệm người dùng. Ký Ức Tường Thuật: Được sử dụng để tận dụng các trải nghiệm cấp cao, Agent S sử dụng ký ức tường thuật để theo dõi lịch sử nhiệm vụ, từ đó nâng cao quy trình ra quyết định của nó. Ký Ức Tình Huống: Tính năng này cung cấp cho người dùng hướng dẫn từng bước, cho phép khung này cung cấp hỗ trợ theo ngữ cảnh khi các nhiệm vụ diễn ra. Hỗ Trợ OpenACI: Với khả năng chạy cục bộ, Agent S cho phép người dùng duy trì quyền kiểm soát đối với các tương tác và quy trình làm việc của họ, phù hợp với tinh thần phi tập trung của Web3. Tích Hợp Dễ Dàng với Các API Bên Ngoài: Tính linh hoạt và khả năng tương thích với nhiều nền tảng AI khác nhau đảm bảo rằng Agent S có thể hòa nhập liền mạch vào các hệ sinh thái công nghệ hiện có, làm cho nó trở thành lựa chọn hấp dẫn cho các nhà phát triển và tổ chức. Những chức năng này cùng nhau góp phần vào vị trí độc đáo của Agent S trong không gian tiền điện tử, khi nó tự động hóa các nhiệm vụ phức tạp, nhiều bước với sự can thiệp tối thiểu của con người. Khi dự án phát triển, các ứng dụng tiềm năng của nó trong Web3 có thể định nghĩa lại cách mà các tương tác kỹ thuật số diễn ra. Thời Gian Phát Triển của Agent S Sự phát triển và các cột mốc của Agent S có thể được tóm tắt trong một dòng thời gian nêu bật các sự kiện quan trọng của nó: 27 tháng 9, 2024: Khái niệm về Agent S được ra mắt trong một bài nghiên cứu toàn diện mang tên “Một Khung Tác Nhân Mở Sử Dụng Máy Tính Như Một Con Người,” trình bày nền tảng cho dự án. 10 tháng 10, 2024: Bài nghiên cứu được công bố công khai trên arXiv, cung cấp một cái nhìn sâu sắc về khung và đánh giá hiệu suất của nó dựa trên tiêu chuẩn OSWorld. 12 tháng 10, 2024: Một video trình bày được phát hành, cung cấp cái nhìn trực quan về khả năng và tính năng của Agent S, thu hút thêm sự quan tâm từ người dùng và nhà đầu tư tiềm năng. Những dấu mốc trong dòng thời gian không chỉ minh họa sự tiến bộ của Agent S mà còn chỉ ra cam kết của nó đối với sự minh bạch và sự tham gia của cộng đồng. Những Điểm Chính Về Agent S Khi khung Agent S tiếp tục phát triển, một số thuộc tính chính nổi bật, nhấn mạnh tính đổi mới và tiềm năng của nó: Khung Đổi Mới: Được thiết kế để cung cấp cách sử dụng máy tính trực quan giống như tương tác của con người, Agent S mang đến một cách tiếp cận mới cho việc tự động hóa nhiệm vụ. Tương Tác Tự Động: Khả năng tương tác tự động với máy tính thông qua GUI đánh dấu một bước tiến tới các giải pháp tính toán thông minh và hiệu quả hơn. Tự Động Hóa Nhiệm Vụ Phức Tạp: Với phương pháp mạnh mẽ của nó, nó có thể tự động hóa các nhiệm vụ phức tạp, nhiều bước, làm cho các quy trình nhanh hơn và ít sai sót hơn. Cải Tiến Liên Tục: Các cơ chế học tập cho phép Agent S cải thiện từ các trải nghiệm trước đó, liên tục nâng cao hiệu suất và hiệu quả của nó. Tính Linh Hoạt: Khả năng thích ứng của nó trên các môi trường hoạt động khác nhau như OSWorld và WindowsAgentArena đảm bảo rằng nó có thể phục vụ một loạt các ứng dụng rộng rãi. Khi Agent S định vị mình trong bối cảnh Web3 và tiền điện tử, tiềm năng của nó để nâng cao khả năng tương tác và tự động hóa quy trình đánh dấu một bước tiến quan trọng trong công nghệ AI. Thông qua khung đổi mới của mình, Agent S minh họa cho tương lai của các tương tác kỹ thuật số, hứa hẹn một trải nghiệm liền mạch và hiệu quả hơn cho người dùng trên nhiều ngành công nghiệp khác nhau. Kết luận Agent S đại diện cho một bước nhảy vọt táo bạo trong sự kết hợp giữa AI và Web3, với khả năng định nghĩa lại cách chúng ta tương tác với công nghệ. Mặc dù vẫn còn ở giai đoạn đầu, những khả năng cho ứng dụng của nó là rộng lớn và hấp dẫn. Thông qua khung toàn diện của mình giải quyết các thách thức quan trọng, Agent S nhằm đưa các tương tác tự động lên hàng đầu trong trải nghiệm kỹ thuật số. Khi chúng ta tiến sâu hơn vào các lĩnh vực tiền điện tử và phi tập trung, các dự án như Agent S chắc chắn sẽ đóng một vai trò quan trọng trong việc định hình tương lai của công nghệ và sự hợp tác giữa con người với máy tính.

Tổng lượt xem 844Xuất bản vào 2025.01.14Cập nhật vào 2025.01.14

AGENT S là gì

Làm thế nào để Mua S

Chào mừng bạn đến với HTX.com! Chúng tôi đã làm cho mua Sonic (S) trở nên đơn giản và thuận tiện. Làm theo hướng dẫn từng bước của chúng tôi để bắt đầu hành trình tiền kỹ thuật số của bạn.Bước 1: Tạo Tài khoản HTX của BạnSử dụng email hoặc số điện thoại của bạn để đăng ký tài khoản miễn phí trên HTX. Trải nghiệm hành trình đăng ký không rắc rối và mở khóa tất cả tính năng. Nhận Tài khoản của tôiBước 2: Truy cập Mua Crypto và Chọn Phương thức Thanh toán của BạnThẻ Tín dụng/Ghi nợ: Sử dụng Visa hoặc Mastercard của bạn để mua Sonic (S) ngay lập tức.Số dư: Sử dụng tiền từ số dư tài khoản HTX của bạn để giao dịch liền mạch.Bên thứ ba: Chúng tôi đã thêm những phương thức thanh toán phổ biến như Google Pay và Apple Pay để nâng cao sự tiện lợi.P2P: Giao dịch trực tiếp với người dùng khác trên HTX.Thị trường mua bán phi tập trung (OTC): Chúng tôi cung cấp những dịch vụ được thiết kế riêng và tỷ giá hối đoái cạnh tranh cho nhà giao dịch.Bước 3: Lưu trữ Sonic (S) của BạnSau khi mua Sonic (S), lưu trữ trong tài khoản HTX của bạn. Ngoài ra, bạn có thể gửi đi nơi khác qua chuyển khoản blockchain hoặc sử dụng để giao dịch những tiền kỹ thuật số khác.Bước 4: Giao dịch Sonic (S)Giao dịch Sonic (S) dễ dàng trên thị trường giao ngay của HTX. Chỉ cần truy cập vào tài khoản của bạn, chọn cặp giao dịch, thực hiện giao dịch và theo dõi trong thời gian thực. Chúng tôi cung cấp trải nghiệm thân thiện với người dùng cho cả người mới bắt đầu và người giao dịch dày dạn kinh nghiệm.

Tổng lượt xem 1.5kXuất bản vào 2025.01.15Cập nhật vào 2026.06.02

Làm thế nào để Mua S

Thảo luận

Chào mừng đến với Cộng đồng HTX. Tại đây, bạn có thể được thông báo về những phát triển nền tảng mới nhất và có quyền truy cập vào thông tin chuyên sâu về thị trường. Ý kiến ​​của người dùng về giá của S (S) được trình bày dưới đây.

活动图片