刚刚,小扎砸143亿的“牛油果”来了,硬刚GPT-5.4,硅谷最贵华人首作

marsbit發佈於 2026-04-09更新於 2026-04-09

文章摘要

Meta发布全新AI模型Muse Spark(代号Avocado),该模型由Meta超级智能实验室(MSL)研发,具备多模态感知、工具调用、视觉思维链及多Agent协作等能力。在Artificial Intelligence测试中得分52,远超前代Llama 4 Maverick的18分,仅次于Gemini 3.1 Pro、GPT-5.4和Opus 4.6。 Muse Spark在多模态和健康领域表现突出,支持视觉问答、医学推理等任务,但在代码生成和复杂Agent任务上略逊于顶尖模型。其“沉思模式”支持多Agent并行推理,在部分综合测试中媲美甚至超越竞品。 技术方面,Meta重构了AI技术栈,预训练算力效率提升至Llama 4的10倍,推理时Token消耗显著降低。模型已上线meta.ai及相关应用,暂未开源,未来将接入Facebook、Instagram和WhatsApp。 Muse Spark是Meta首席AI官Alexandr Wang领衔的团队历时九个月打造的成果,标志着Meta重返AI第一梯队。

毫无预警!时隔一年,小扎终于杀回来了!

就在刚刚,Meta超级智能实验室(MSL)的第一个作品,上线了——

Muse Spark,代号Avocado,就是传闻中的那个「牛油果」。

它是真正的「全能六边形战士」:原生多模态感知、工具调用、视觉思维链、多Agent编排,全点满。

先说最炸的一个数字。

在Artificial Analysis的测试中,Muse Spark拿下了高达52分的战绩,仅次于Gemini 3.1 Pro、GPT-5.4和Opus 4.6。

相比之下,去年的Llama 4 Maverick只有区区18分

18到52,一步跨完,Meta盘中直接一度暴涨近10%

Meta首席AI官Alexandr Wang激动得在X上连发九条推文。

九个月前我们从零重建了整个AI技术栈,新基础设施、新架构、新数据管线。Muse Spark就是这些工作的成果。

MSL团队的华人研究员也集体刷屏,这些人去年从OpenAI、DeepMind跳槽到一个刚组建的实验室,赌的就是今天。

MSL首席科学家Shengjia Zhao说得很直白,「我们重构了整个技术栈来支撑Scaling,这才刚刚开始」。

值得一提的是,Muse Spark还上线了对标Gemini Deep Think和GPT Pro的「沉思模式」

(Contemplating),多个Agent并行思考、协同作答。

只需输入「帮我规划一个5口之家去佛罗里达的7天文化美食行程,3个孩子分别12、9、7岁」,Muse Spark就会同时派出三个子Agent,一个规划美食文化路线,一个搜索亲子活动,一个协调物流和住宿

目前,模型已在meta.ai和Meta AI App上线,API预览版向部分用户开放。

功能先在美国铺开,未来几周接入Facebook、Instagram和WhatsApp。

免费用,不限量,但闭源。

接下来,划重点:

· Artificial Analysis得分52,Llama 4 Maverick只有18

· 原生多模态 + 视觉思维链,视觉赛道仅次于Gemini 3.1 Pro

· 「沉思模式」多Agent并行思考,HLE拿下58%

· 预训练算力需求砍到Llama 4的1/10

· 1000+临床医生参与训练,健康问答吊打全场

· 思维会自己压缩,Token消耗仅Opus的1/3

· Apollo Research发现它能感知自己在被安全测试

跑分追上第一梯队,但写代码还差口气

先看硬数据。

Meta把Muse Spark(Thinking模式)和Opus 4.6、Gemini 3.1 Pro、GPT 5.4、Grok 4.2放在一起比了个遍,覆盖多模态、文本思考、健康、Agent四个维度,总共20多个benchmark。

Reddit网友重新标注的跑分

多模态是Muse Spark最亮眼的部分。

CharXiv理解86.4,超过GPT 5.4的82.8和Gemini 3.1 Pro的80.2。

ScreenSpot Pro截图定位84.1,比Opus 4.6的83.1略高。

ZeroBench多步视觉33.0,Gemini 3.1 Pro是29.0。

文本赛道上,互有胜负。

GPQA Diamond博士级难题89.5,Opus 4.6拿了92.7,Gemini 3.1 Pro是94.3。

ARC AGI 2抽象思维42.5,被Opus 4.6的63.3和Gemini的76.5甩开了一大截。

LiveCodeBench Pro竞赛编程80.0,Gemini 82.9,GPT 5.4拿了87.5。

Meta自己也承认了,在代码和长时间Agent任务上,Muse Spark和最强模型还有差距。

不过,令全网震撼的是,Muse Spark可以直接将图片转化成代码,效果非常惊艳!

但是医疗健康这个赛道,Muse Spark打得很凶。

HealthBench Hard开放式健康问答42.8,Gemini 3.1 Pro只有20.6,GPT 5.4是40.1。

MedXpertQA多模态医学78.4,也领先Gemini的81.3不远(这里Gemini略高),但远超Opus 4.6的64.8。

Meta在训练阶段和1000多名临床医生合作的数据清洗和筛选,确实带来了实打实的效果。

Agent赛道同样值得关注。

DeepSearchQA搜索Agent拿了74.8,是五家中最高的。

τ2-Bench工具使用91.5,和GPT 5.4并列。

GDPval-AA Elo办公Agent达到1444,超过了Gemini的1320但低于Opus 4.6的1606。

SWE-Bench方面差距明显,Verified 77.4 vs Opus 80.8 vs GPT 82.9(据称78.2),Pro 52.4 vs GPT 57.7。

一句话总结跑分,多模态和健康打赢了,思考持平,代码和Agent差一口气。

Alexandr Wang:Llama 4的错误不会再犯,牛油果没有刷分

Artificial Analysis的独立测试还揭示了一个重要细节,Token效率。

跑完整个Intelligence Index测试套件,Muse Spark用了5800万输出Token,和Gemini 3.1 Pro(5700万)相当,但远低于Opus 4.6(1.57亿)和GPT-5.4(1.2亿)。

同样的智力水平,消耗的Token少了一半到三分之二。

此外,在由数学大佬出题的FrontierMath上, Muse Spark在1-3层级上,直接碾压Gemini 3.1 Pro,不过在4层级却排在了倒数。

更值得一提的是,在Vals指数排行榜上,Muse Spark强势夺得第三名,具体指标如下。

继Llama 4发布一年之后,Meta再次重返AGI第一梯队。

多Agent并行思考,58%拿下「人类最后一场考试」

「沉思模式」是Muse Spark的杀手锏。

传统思考模式是一个Agent花更长时间想,沉思模式是多个Agent同时想,最后汇总答案。

Humanity's Last Exam(无工具),Muse Spark沉思模式拿了50.2,Gemini Deep Think 48.4,GPT 5.4 Pro 43.9。

Humanity's Last Exam(有工具),58.4,Gemini 53.4,GPT 5.4 Pro 58.7,几乎打平。

FrontierScience Research科学前沿研究38.3,Gemini Deep Think只有23.3,GPT 5.4 Pro是36.7。

不过物理奥赛IPhO 2025理论题,Muse Spark沉思模式82.6,GPT 5.4 Pro拿了93.5,差距不小。

整体看,沉思模式让Muse Spark在最难的综合思考任务上,确实摸到了第一梯队的门槛。

剑指「个人超级智能」,拍张照就能当私人营养师

Meta给Muse Spark定义的方向很明确,就是个人超级智能。

翻译成人话,就是一个懂你、懂你周围世界的AI助手。

多模态方面,Muse Spark从底层就为跨领域整合视觉信息而设计。

官方演示了几个场景。

拍一张数独照片,Muse Spark能把它变成一个可以在网页上玩的互动游戏。

拍咖啡机和磨豆机,它先标出所有核心部件,然后生成一份网页版互动拿铁教程。

鼠标悬停到某个步骤时,照片中对应部件的边界框自动高亮,视觉指引和操作步骤一一对应。

健康场景更有想象空间。

拍一桌子食物,告诉它「我胆固醇偏高,是鱼素者」,Muse Spark会在推荐的食物上打绿点,不建议的打红点。

Prompt的控制粒度很细,直接把UI交互逻辑讲清楚了。

健康评分的数字不用悬停就直接显示在点的正上方,悬停后弹出详细的卡路里、碳水、蛋白质和脂肪数据,而且弹出框的层级被要求「永远在最上层,不能被其他点挡住」。

拍瑜伽动作也是同样的思路。

它识别出每个姿势拉伸了哪些肌肉群,标注难度级别,悬停后还能给出体态纠正建议。两个人的图左右拼在一起,按1到10分分别打分。

这些demo背后的底层支撑是视觉STEM问答、实体识别和目标定位的组合。

单项看都不稀奇,但串联成场景后,确实能看到「个人超级智能」这个词背后的产品意图。

还有一个新功能值得单独拎出来说,「购物模式」。

Wang在推文中说,购物模式能「识别你在Instagram、Facebook和Threads上关注的创作者、品牌和风格内容,转化成个性化推荐」。

这是Meta独有的数据优势,30亿日活用户的社交行为数据 + AI购物助手,商业化想象空间很大。

三条Scaling曲线,算力砍90%,思维还会自我压缩

技术博客的重头戏不在跑分,在Scaling。

Meta把Muse Spark的表现来源拆成三条轴线讲,预训练、强化学习、测试时计算。每一条都有对应的缩放曲线做支撑。

预训练:同样的能力,算力砍到1/10

过去九个月,Meta对预训练技术栈做了大换血,架构、优化算法、数据策略全部重做。

为了衡量效果,Meta在一系列小尺寸版本上拟合了Scaling Law,然后对比达到同一个性能水平需要多少训练FLOPs。

结论很硬,同样的能力水平,Muse Spark需要的算力不到Llama 4 Maverick的十分之一。

这条曲线说明了一件事,Meta不只是砸更多GPU,而是从底层提升了每一单位算力的产出。

华盛顿大学的Yuchen Jin在X上的评价很到位,「我仍然认为基础设施才是AI实验室的真正护城河。因为你能更快地训练,研究员就能更快地实验更多想法。」

强化学习:对数线性增长,泛化到没见过的题

大规模RL出了名的不稳定,但Meta说,新技术栈的RL曲线异常平滑。

左图是训练集上的表现。pass@1和pass@16(16次尝试中至少对1次)都呈对数线性增长。

这说明RL在提升可靠性的同时,没有折损解题多样性,Muse Spark没有「一条路走到黑」,它还保持着探索不同解法的灵活性。

右图更重要,是留出评估集上的准确率。

曲线同样稳步上升,说明RL带来的进步不是死记硬背,而是能泛化到从没见过的新题。

测试时推理:思维先膨胀、再压缩、再膨胀

这是全文技术含量最高、也最有意思的部分。

RL教会了Muse Spark在回答前先「在脑子里推演一遍」,这就是测试时推理。

但问题是,给几十亿用户提供这种服务,Token成本扛不住。

Meta的解法分两步。

第一步,在RL训练中加入「思考时间惩罚」。你可以想更久,但想太久会被扣分。

这个约束引发了一个有意思的「相变」现象。

AIME子集上的表现是这样的,训练早期,Muse Spark通过想更久来提升正确率,曲线向右延伸。

然后,长度惩罚触发了「思维压缩」。Muse Spark学会了用少得多的Token把同一道题解出来,曲线向左折返。

压缩完成之后,它又一次拉长了解题过程,去挑战更难的题。

整条轨迹画出来,是一个先右拐、再左拐、再右拐的三段式进化路径。

第二步是解决延迟问题。

单个Agent想得更久,延迟线性增加。

Meta的做法是扩展并行Agent数量,1个、2个、4个、16个Agent同时思考。

从图上看,16个Agent在相近的延迟水平下,准确率从约54%跳到约58%。

传统的测试时Scaling是拿时间换质量,多Agent Scaling是拿并行度换质量,延迟几乎不变。

硅谷「最贵华人」团队,交了第一份卷子

Muse Spark的背后,是扎克伯格去年对Meta AI体系的一次彻底重构。

2025年6月,Meta以143亿美元收购Scale AI 49%股权,将其创始人Alexandr Wang挖来担任Meta首任首席AI官,组建Meta超级智能实验室(MSL)。

同期加入的还有前GitHub CEO Nat Friedman(联合负责产品和应用研究)、SSI联合创始人Daniel Gross,以及从OpenAI、DeepMind、Anthropic挖来的11名研究员。

如今,Muse Spark的发布证明了一件事,Meta超级智能实验室九个月的重构是有产出的。

预训练效率翻了一个数量级,RL扩展曲线平滑可预测,多模态和医疗赛道摸到了第一梯队。

但代码和Agent的差距摆在那里,沉思模式还没全面开放,开源时间表也还是一个「希望」。

更现实的压力是,同一周Anthropic发布了据称「太强而不能公开」的Mythos,OpenAI代号Spud的新作也在路上。

143亿买来了一张入场券。接下来的考试,才是真正的。

参考资料:

https://ai.meta.com/blog/introducing-muse-spark-msl/

https://ai.meta.com/blog/scaling-how-we-build-test-advanced-ai/

https://ai.meta.com/static-resource/muse-spark-eval-methodology

https://x.com/alexandr_wang/status/2041909376508985381

本文来自微信公众号“新智元”,作者:新智元

相關問答

QMuse Spark是什么?它有哪些主要特点?

AMuse Spark是Meta超级智能实验室(MSL)推出的首个AI模型,代号“牛油果”(Avocado)。它是一个全能六边形战士,具备原生多模态感知、工具调用、视觉思维链和多Agent编排等核心能力。在Artificial Intelligence测试中得分52分,仅次于Gemini 3.1 Pro、GPT-5.4和Opus 4.6。

QMuse Spark在哪些领域表现突出?哪些领域还有差距?

AMuse Spark在多模态和健康领域表现突出,例如在CharXiv理解(86.4分)、ScreenSpot Pro截图定位(84.1分)和HealthBench Hard健康问答(42.8分)中领先或接近领先水平。但在代码和长时间Agent任务上仍有差距,例如LiveCodeBench Pro竞赛编程(80.0分)和SWE-Bench(77.4分)略低于竞争对手。

Q什么是“沉思模式”?它有什么优势?

A“沉思模式”是Muse Spark的杀手锏功能,支持多个Agent并行思考、协同作答。在Humanity's Last Exam测试中,无工具模式得分50.2(超过Gemini Deep Think的48.4),有工具模式达58.4分(接近GPT-5.4 Pro的58.7)。这种模式通过并行计算提升复杂任务的解决能力,同时保持较低的延迟。

QMuse Spark在技术上有哪些突破?

AMuse Spark在预训练效率上大幅提升,达到相同能力所需的算力仅为Llama 4 Maverick的1/10。强化学习曲线平滑且泛化能力强,测试时推理支持思维压缩”功能,Token消耗仅为Opus的1/3。此外,模型还具备多模态场景整合能力,如将图片转化为代码或生成交互式教程。

QMuse Spark背后的开发团队是谁?有哪些关键人物?

AMuse Spark由Meta超级智能实验室(MSL)开发,该团队由Meta首席AI官Alexandr Wang(Scale AI创始人)领导,成员包括前GitHub CEO Nat Friedman、SSI联合创始人Daniel Gross,以及从OpenAI、DeepMind等公司挖来的11名研究员。团队用九个月时间重构了AI技术栈,包括新基础设施、架构和数据管线。

你可能也喜歡

以太坊获机构瞩目——Etherealize CEO如是说

加密货币领域持续发展,以太坊(ETH)正获得越来越多的机构关注,其角色已超越单纯的数字资产。Etherealize首席执行官Vivek Raman表示,以太坊正逐渐成为机构投资组合中的核心资产,与比特币地位相当,并可能成为下一代金融基础设施的基础层。 Raman指出,随着资产增长,机构对ETH的配置是必然趋势。他提到哈佛大学从比特币现货ETF转向以太坊现货ETF的例子,并强调ETH的权益证明机制能带来可观收益,这些因素将推动其成为新的价值存储手段,并促进价格上涨。 此外,Raman还讨论了以太坊网络上资产代币化和稳定币的显著增长,认为大多数高价值的代币化资产和稳定币将在该网络上发行。由于ETH作为去中心化、抗审查的抵押资产,其价值将随着区块链上资产代币化的发展而提升。 长期来看,尽管以太坊短期走势疲软,但前景依然乐观。有分析师预测,到2033年ETH价格可能达到12,000至38,000美元,另有人预测2030年将达60,000美元。当前ETH价格约为2,300美元,短期增长已被市场消化。 专家指出,以太坊生态系统年手续费收入达38.2亿美元,第二层网络处理了大部分交易。随着稳定币规模增长、技术升级持续推进以及机构采用率提升,以太坊被严重低估,未来潜力巨大。

bitcoinist1 小時前

以太坊获机构瞩目——Etherealize CEO如是说

bitcoinist1 小時前

交易

現貨
合約

熱門文章

什麼是 $S$

理解 SPERO:全面概述 SPERO 簡介 隨著創新領域的不斷演變,web3 技術和加密貨幣項目的出現在塑造數字未來中扮演著關鍵角色。在這個動態領域中,SPERO(標記為 SPERO,$$s$)是一個引起關注的項目。本文旨在收集並呈現有關 SPERO 的詳細信息,以幫助愛好者和投資者理解其基礎、目標和在 web3 和加密領域內的創新。 SPERO,$$s$ 是什麼? SPERO,$$s$ 是加密空間中的一個獨特項目,旨在利用去中心化和區塊鏈技術的原則,創建一個促進參與、實用性和金融包容性的生態系統。該項目旨在以新的方式促進點對點互動,為用戶提供創新的金融解決方案和服務。 SPERO,$$s$ 的核心目標是通過提供增強用戶體驗的工具和平台來賦能個人。這包括使交易方式更加靈活、促進社區驅動的倡議,以及通過去中心化應用程序(dApps)創造金融機會的途徑。SPERO,$$s$ 的基本願景圍繞包容性展開,旨在彌合傳統金融中的差距,同時利用區塊鏈技術的優勢。 誰是 SPERO,$$s$ 的創建者? SPERO,$$s$ 的創建者身份仍然有些模糊,因為公開可用的資源對其創始人提供的詳細背景信息有限。這種缺乏透明度可能源於該項目對去中心化的承諾——這是一種許多 web3 項目所共享的精神,優先考慮集體貢獻而非個人認可。 通過將討論重心放在社區及其共同目標上,SPERO,$$s$ 體現了賦能的本質,而不特別突出某些個體。因此,理解 SPERO 的精神和使命比識別單一創建者更為重要。 誰是 SPERO,$$s$ 的投資者? SPERO,$$s$ 得到了來自風險投資家到天使投資者的多樣化投資者的支持,他們致力於促進加密領域的創新。這些投資者的關注點通常與 SPERO 的使命一致——優先考慮那些承諾社會技術進步、金融包容性和去中心化治理的項目。 這些投資者通常對不僅提供創新產品,還對區塊鏈社區及其生態系統做出積極貢獻的項目感興趣。這些投資者的支持強化了 SPERO,$$s$ 作為快速發展的加密項目領域中的一個重要競爭者。 SPERO,$$s$ 如何運作? SPERO,$$s$ 採用多面向的框架,使其與傳統的加密貨幣項目區別開來。以下是一些突顯其獨特性和創新的關鍵特徵: 去中心化治理:SPERO,$$s$ 整合了去中心化治理模型,賦予用戶積極參與決策過程的權力,關於項目的未來。這種方法促進了社區成員之間的擁有感和責任感。 代幣實用性:SPERO,$$s$ 使用其自己的加密貨幣代幣,旨在在生態系統內部提供多種功能。這些代幣使交易、獎勵和平台上提供的服務得以促進,增強了整體參與度和實用性。 分層架構:SPERO,$$s$ 的技術架構支持模塊化和可擴展性,允許在項目發展過程中無縫整合額外的功能和應用。這種適應性對於在不斷變化的加密環境中保持相關性至關重要。 社區參與:該項目強調社區驅動的倡議,採用激勵合作和反饋的機制。通過培養強大的社區,SPERO,$$s$ 能夠更好地滿足用戶需求並適應市場趨勢。 專注於包容性:通過提供低交易費用和用戶友好的界面,SPERO,$$s$ 旨在吸引多樣化的用戶群體,包括那些以前可能未曾參與加密領域的個體。這種對包容性的承諾與其通過可及性賦能的總體使命相一致。 SPERO,$$s$ 的時間線 理解一個項目的歷史提供了對其發展軌跡和里程碑的關鍵見解。以下是建議的時間線,映射 SPERO,$$s$ 演變中的重要事件: 概念化和構思階段:形成 SPERO,$$s$ 基礎的初步想法被提出,與區塊鏈行業內的去中心化和社區聚焦原則密切相關。 項目白皮書的發布:在概念階段之後,發布了一份全面的白皮書,詳細說明了 SPERO,$$s$ 的願景、目標和技術基礎設施,以吸引社區的興趣和反饋。 社區建設和早期參與:積極進行外展工作,建立早期採用者和潛在投資者的社區,促進圍繞項目目標的討論並獲得支持。 代幣生成事件:SPERO,$$s$ 進行了一次代幣生成事件(TGE),向早期支持者分發其原生代幣,並在生態系統內建立初步流動性。 首次 dApp 上線:與 SPERO,$$s$ 相關的第一個去中心化應用程序(dApp)上線,允許用戶參與平台的核心功能。 持續發展和夥伴關係:對項目產品的持續更新和增強,包括與區塊鏈領域其他參與者的戰略夥伴關係,使 SPERO,$$s$ 成為加密市場中一個具有競爭力和不斷演變的參與者。 結論 SPERO,$$s$ 是 web3 和加密貨幣潛力的見證,能夠徹底改變金融系統並賦能個人。憑藉對去中心化治理、社區參與和創新設計功能的承諾,它為更具包容性的金融環境鋪平了道路。 與任何在快速發展的加密領域中的投資一樣,潛在的投資者和用戶都被鼓勵進行徹底研究,並對 SPERO,$$s$ 的持續發展進行深思熟慮的參與。該項目展示了加密行業的創新精神,邀請人們進一步探索其無數可能性。儘管 SPERO,$$s$ 的旅程仍在展開,但其基礎原則確實可能影響我們在互聯網數字生態系統中如何與技術、金融和彼此互動的未來。

85 人學過發佈於 2024.12.17更新於 2024.12.17

什麼是 $S$

什麼是 AGENT S

Agent S:Web3中自主互動的未來 介紹 在不斷演變的Web3和加密貨幣領域,創新不斷重新定義個人如何與數字平台互動。Agent S是一個開創性的項目,承諾通過其開放的代理框架徹底改變人機互動。Agent S旨在簡化複雜任務,為人工智能(AI)提供變革性的應用,鋪平自主互動的道路。本詳細探索將深入研究該項目的複雜性、其獨特特徵以及對加密貨幣領域的影響。 什麼是Agent S? Agent S是一個突破性的開放代理框架,專門設計用來解決計算機任務自動化中的三個基本挑戰: 獲取特定領域知識:該框架智能地從各種外部知識來源和內部經驗中學習。這種雙重方法使其能夠建立豐富的特定領域知識庫,提升其在任務執行中的表現。 長期任務規劃:Agent S採用經驗增強的分層規劃,這是一種戰略方法,可以有效地分解和執行複雜任務。此特徵顯著提升了其高效和有效地管理多個子任務的能力。 處理動態、不均勻的界面:該項目引入了代理-計算機界面(ACI),這是一種創新的解決方案,增強了代理和用戶之間的互動。利用多模態大型語言模型(MLLMs),Agent S能夠無縫導航和操作各種圖形用戶界面。 通過這些開創性特徵,Agent S提供了一個強大的框架,解決了自動化人機互動中涉及的複雜性,為AI及其他領域的無數應用奠定了基礎。 誰是Agent S的創建者? 儘管Agent S的概念根本上是創新的,但有關其創建者的具體信息仍然難以捉摸。創建者目前尚不清楚,這突顯了該項目的初期階段或戰略選擇將創始成員保密。無論是否匿名,重點仍然在於框架的能力和潛力。 誰是Agent S的投資者? 由於Agent S在加密生態系統中相對較新,關於其投資者和財務支持者的詳細信息並未明確記錄。缺乏對支持該項目的投資基礎或組織的公開見解,引發了對其資金結構和發展路線圖的質疑。了解其支持背景對於評估該項目的可持續性和潛在市場影響至關重要。 Agent S如何運作? Agent S的核心是尖端技術,使其能夠在多種環境中有效運作。其運營模型圍繞幾個關鍵特徵構建: 類人計算機互動:該框架提供先進的AI規劃,力求使與計算機的互動更加直觀。通過模仿人類在任務執行中的行為,承諾提升用戶體驗。 敘事記憶:用於利用高級經驗,Agent S利用敘事記憶來跟蹤任務歷史,從而增強其決策過程。 情節記憶:此特徵為用戶提供逐步指導,使框架能夠在任務展開時提供上下文支持。 支持OpenACI:Agent S能夠在本地運行,使用戶能夠控制其互動和工作流程,與Web3的去中心化理念相一致。 與外部API的輕鬆集成:其多功能性和與各種AI平台的兼容性確保了Agent S能夠無縫融入現有技術生態系統,成為開發者和組織的理想選擇。 這些功能共同促成了Agent S在加密領域的獨特地位,因為它以最小的人類干預自動化複雜的多步任務。隨著項目的發展,其在Web3中的潛在應用可能重新定義數字互動的展開方式。 Agent S的時間線 Agent S的發展和里程碑可以用一個時間線來概括,突顯其重要事件: 2024年9月27日:Agent S的概念在一篇名為《一個像人類一樣使用計算機的開放代理框架》的綜合研究論文中推出,展示了該項目的基礎工作。 2024年10月10日:該研究論文在arXiv上公開,提供了對框架及其基於OSWorld基準的性能評估的深入探索。 2024年10月12日:發布了一個視頻演示,提供了對Agent S能力和特徵的視覺洞察,進一步吸引潛在用戶和投資者。 這些時間線上的標記不僅展示了Agent S的進展,還表明了其對透明度和社區參與的承諾。 有關Agent S的要點 隨著Agent S框架的持續演變,幾個關鍵特徵脫穎而出,強調其創新性和潛力: 創新框架:旨在提供類似人類互動的直觀計算機使用,Agent S為任務自動化帶來了新穎的方法。 自主互動:通過GUI自主與計算機互動的能力標誌著向更智能和高效的計算解決方案邁進了一步。 複雜任務自動化:憑藉其強大的方法論,能夠自動化複雜的多步任務,使過程更快且更少出錯。 持續改進:學習機制使Agent S能夠從過去的經驗中改進,不斷提升其性能和效率。 多功能性:其在OSWorld和WindowsAgentArena等不同操作環境中的適應性確保了它能夠服務於廣泛的應用。 隨著Agent S在Web3和加密領域中的定位,其增強互動能力和自動化過程的潛力標誌著AI技術的一次重大進步。通過其創新框架,Agent S展現了數字互動的未來,為各行各業的用戶承諾提供更無縫和高效的體驗。 結論 Agent S代表了AI與Web3結合的一次大膽飛躍,具有重新定義我們與技術互動方式的能力。儘管仍處於早期階段,但其應用的可能性廣泛且引人入勝。通過其全面的框架解決關鍵挑戰,Agent S旨在將自主互動帶到數字體驗的最前沿。隨著我們深入加密貨幣和去中心化的領域,像Agent S這樣的項目無疑將在塑造技術和人機協作的未來中發揮關鍵作用。

620 人學過發佈於 2025.01.14更新於 2025.01.14

什麼是 AGENT S

如何購買S

歡迎來到HTX.com!在這裡,購買Sonic (S)變得簡單而便捷。跟隨我們的逐步指南,放心開始您的加密貨幣之旅。第一步:創建您的HTX帳戶使用您的 Email、手機號碼在HTX註冊一個免費帳戶。體驗無憂的註冊過程並解鎖所有平台功能。立即註冊第二步:前往買幣頁面,選擇您的支付方式信用卡/金融卡購買:使用您的Visa或Mastercard即時購買Sonic (S)。餘額購買:使用您HTX帳戶餘額中的資金進行無縫交易。第三方購買:探索諸如Google Pay或Apple Pay等流行支付方式以增加便利性。C2C購買:在HTX平台上直接與其他用戶交易。HTX 場外交易 (OTC) 購買:為大量交易者提供個性化服務和競爭性匯率。第三步:存儲您的Sonic (S)購買Sonic (S)後,將其存儲在您的HTX帳戶中。您也可以透過區塊鏈轉帳將其發送到其他地址或者用於交易其他加密貨幣。第四步:交易Sonic (S)在HTX的現貨市場輕鬆交易Sonic (S)。前往您的帳戶,選擇交易對,執行交易,並即時監控。HTX為初學者和經驗豐富的交易者提供了友好的用戶體驗。

1.4k 人學過發佈於 2025.01.15更新於 2025.03.21

如何購買S

相關討論

歡迎來到 HTX 社群。在這裡,您可以了解最新的平台發展動態並獲得專業的市場意見。 以下是用戶對 S (S)幣價的意見。

活动图片