中国第一,直逼OpenAI,神秘“扫地僧”冲到全球前七

marsbitPublicado a 2026-06-30Actualizado a 2026-06-30

Resumen

一款名为“扫地僧”(MopMonk)的神秘AI在权威网络安全基准测试平台CyberGym上,以73.1%的胜率位列全球第七、中国第一,成绩紧追OpenAI。该测试基于超过1500个真实历史漏洞,要求AI在隔离环境中通过多轮推理和工具调用,生成能触发漏洞的有效攻击代码,难度极高。 “扫地僧”未公开团队信息,仅知其基于上海MiniMax公司的开源模型M3构建。M3拥有出色的编程能力、超长上下文理解和多模态处理能力。其成功关键在于一套专为漏洞挖掘设计的智能体框架,核心是结构化的“漏洞记忆”系统:它将任务过程中的代码路径、失败证据、下一步约束等信息有序组织并持续更新,使AI能基于历史经验高效调整策略,避免重复试错。同时,系统支持多智能体并行探索并共享记忆,提升了搜索效率。 这一成绩表明,在复杂任务中,将强大基座模型与精心设计的智能体执行框架深度结合,比单纯追求模型参数规模更为重要。其技术路径展示了如何通过工程优化,将模型的理论能力转化为实际解决问题的能力。

太疯狂了!一个连官网都没有的神秘中国AI「扫地僧」,以73.1%的胜率杀入CyberGym全球前七,紧咬OpenAI。全网都在疯传,这到底是谁家的高手?

这几天,在全球AI巨头厮杀正酣的一张榜单上,突然多了一个谁都没听过的名字。

它叫MopMonk(扫地僧)。

没有大张旗鼓的发布会,没有官博长文,没有社交媒体上的摇旗呐喊。

它就这么凭空出世,径直杀入CyberGym全球前十。

凭借73.1%的成功率,以微弱差距紧咬OpenAI,一举刷新了中国团队在该榜单上的历史最高分。

整件事最魔幻的地方在于,时至今日,无人知晓它的真面目。

CyberGym这份榜,到底有多重?

MopMonk这次的成绩究竟有多炸裂?看看它所站上的擂台就知道了。

CyberGym,由UC Berkeley团队倾力打造,核心论文中选ICLR 2026顶会。

传送门:https://arxiv.org/pdf/2506.02548

作为AI网络安全能力评估领域最权威的公开基准之一,这里堪称大模型的「修罗场」——

就连GPT-5.5-Cyber、Claude Mythos这种级别的顶流,都曾在这个榜单里贴身肉搏。

整个基准主打「真枪实弹」:

1507个漏洞实例、188个开源大项目,所有考题全部扒自Google OSS-Fuzz沉淀下来的真实历史漏洞。

从评估维度来看,这是一个跨量级的突破。

它的体量,是此前最大公开基准(NYU CTF,约200题)的足足7.5倍,更是把CVE-Bench这种「前辈」直接甩出了一个数量级。

更要命的是难度,CyberGym不做选择题。

它要求AI在动辄数千个文件、数百万行代码的真实项目里,完成深度推理。

正因为足够大、足够真、足够难,CyberGym才有了「区分度」——

它能把不同模型、不同Agent框架之间那点真实的能力差距,一刀一刀地切出来。

难怪安全圈,直接将其封为「AI安全领域的奥运会」。

也正因如此,全球头部玩家几乎全员到场,微软、OpenAI、Anthropic、谷歌、Meta、智谱......

CyberGym榜单本身,正在见证AI竞争的一次关键转向:

从比谁参数大,转向比谁的Agent真能把活干完。

一个陌生的东方代号,突然出现在硅谷AI巨头中间

谁能料到,恰恰是在这个最靠「硬实力」说话的擂台上,杀出了一匹「查无此人」的黑马。

拨开迷雾,我们目前掌握的已知情报仅有三条:

神秘代号:MopMonk(扫地僧)

基座模型:MiniMax M3

榜单战绩:杀进CyberGym全球第七,中国第一

按常理,打出这种成绩的团队,技术报告和新闻发布会早该铺天盖地。

可在这份高手云集的榜单上,MopMonk偏偏是那个最彻底的「异类」:只甩出一份技术报告,团队、公司、坐标,一概查无此人。

这种「实力顶配,信息裸奔」的碰撞,本身就充满了一种东方武侠式的戏剧性。

熟悉金庸的人,都懂《天龙八部》中「扫地僧」这三个字的分量——

少林藏经阁里那个扫了几十年地、没人记得姓名的老和尚,一出手却镇住了萧远山、慕容博两大高手。

最不起眼的角色,藏着最深的功夫。

敢顶着「扫地僧」的名号踢馆,这支团队显然对自己的实力,有着极其冷酷的自信!

更关键的线索,隐藏在它的技术底层——MopMonk选用的基座,是MiniMax M3。

作为一个来自上海的开源基座,M3堪称六边形战士,直接集齐了三大核心杀器:前沿的编程能力、1M超长上下文,以及原生多模态。

一边是极具东方色彩的「文化符号」,另一边是打着纯正国产标签的技术底座。

把这两条线索摆上桌面,圈子已经收得很小了。所有的蛛丝马迹都在疯狂暗示同一个结论:

这大概率是一支中国战队。

胜负手,在Harness

抛开身份悬念,作为长期追踪AI技术的人,我们更想搞清楚一个问题:

MopMonk凭什么赢?

要回答这个问题,得先回到CyberGym最难的那个核心——它考的根本不是「知不知道」,而是「做不做得到」。

判断一段代码有没有漏洞,对今天的大模型来说已经不算太难。

但CyberGym要考的是下一步、也是最要命的那一步:生成一个能触发漏洞的输入,也就是PoC。

它必须在「有漏洞的版本」上触发,在「已修复的版本」上失效,并通过基准环境的执行验证。

这道坎,远比想象中刁钻。

漏洞的触发条件,往往零散地藏在代码路径、解析逻辑、构建环境、测试Harness和输入格式之间,得一点点拼出来。

更坑的是,哪怕PoC在本地把程序跑崩了,也未必算数。只要不能满足「漏洞版触发、修复版不触发」的差分判定,照样白忙一场。

这一步,把任务从「理解」彻底拽进了「执行」。而且是一种很特殊的执行——

整场考试,是在一个封闭、断网的环境里进行的。

没有外部搜索可以求助,没有任何「场外资源」,AI能依靠的,只有对眼前这套代码库的理解,和它自己一步步攒下来的记忆。

要在这种条件下把漏洞「复现」出来,靠的是一整套环环相扣的能力:

工具调用规划:什么时候该读文件、什么时候该跑测试、什么时候该回头改方案;

多轮推理:上一次没触发,问题到底出在哪,下一次该怎么调整;

记忆管理:把读过的代码、试过的输入、踩过的坑结构化地存下来,而不是每一轮都从零再读一遍;

迭代验证:一遍遍逼近那个临界点,直到漏洞真的被复现。

换句话说,CyberGym较量的核心,是Agent的「行动力」,模型的「智商」只是入场券。

而把「聪明」变成「行动力」的那个关键环节,就是今天整个Agent领域最被低估的一个词——Harness。

Harness,是模型与外部工具、执行环境之间的「协调层」。

它负责工具编排、上下文状态管理、执行反馈的回收与再投喂。

简单来说,模型是大脑,负责思考「漏洞可能在哪、下一步该怎么挖」。

Harness是手脚加神经系统,负责把大脑的想法变成一连串真实动作——

打开哪个文件、跑哪条命令、拿到报错后怎么调整、上一轮失败了下一轮怎么改。

在CyberGym这种要跑几十上百轮、要在百万行代码里反复试错的任务上,Harness的好坏,直接决定了模型的智商能不能转化成战斗力。

一个聪明的模型 + 一个平庸的Harness,结果往往是「想得到、做不到」;

一个能力扎实的模型 + 一个为漏洞挖掘量身打造的强Harness,才可能在这种长程任务上跑出成绩。

为漏洞挖掘「量身定制」的Agent

如今,透过GitHub技术报告,MopMonk的技术脉络,已然明晰:

一款专为漏洞挖掘全新设计的安全多Agent系统,而支撑其运转的思维基座,正是MiniMax M3。

GitHub地址:https://github.com/MopMonkAI/MopMonkAgent

如前所述,M3是当下罕见的、能将顶尖编码能力、百万token上下文与原生多模态集于单一架构的开源模型。

看一眼跑分就能明白:SWE-Bench Pro斩获59.0%、Terminal-Bench 2.1达到66.0%、MCP Atlas拿下 74.2%——

这些亮眼的数据,精准踩中了Agent落地实战时,最硬核的能力刚需。

不仅如此,它还能在长达十几个小时的任务里自主迭代、自我纠错。

换言之,M3扮演了一颗兼具顶尖代码解析力、超长记忆力与熟练工具调用能力的「最强大脑」。

对于CyberGym这种动辄要吞下整个代码库、跑上几十轮的任务,1M的上下文窗口几乎是刚需。

而MopMonk这套安全Agent框架做的事,是把M3这颗大脑的能力,放大成漏洞挖掘的执行力。

它的「内功心法」,从GitHub公开的技术细节来看,核心是三招——

第一招,结构化的「漏洞记忆」。

它不是简单堆叠聊天记录,也不是把超长上下文一股脑塞给模型,而是把一份可持续更新的「任务事实记忆」,围绕漏洞挖掘里最关键的几类对象组织起来:

漏洞目标、代码路径、输入格式、候选PoC、失败证据、验证状态,以及「下一步约束」记忆。

最后一类尤其见功力:它不生成空泛的抽象计划,而是直接从当前证据里,提炼出下一次实验必须满足的硬约束。

比如,「这次必须覆盖到那个分支」「该调整哪个字段」「要排除哪一类失败原因」。

这种记忆设计,将漏洞挖掘从「反复从零试错」变成了「基于证据的收敛过程」。

每一次读代码、每一次执行结果、每一次失败提交,都被转化成下一步生成PoC可复用的约束。

第二招,记忆驱动的「漏洞挖掘」。

在漏洞挖掘任务中,系统首先通过扫描代码库,并将候选触发路径和目录信息作为规划的起点,来初始化漏洞记忆。

然后,它一步步推进,试图收敛到触发崩溃的具体代码位置。

之后,每一次探索尝试都会读取当前记忆,测试一个具体的假设,并将结果写回记忆中。

这样一来,模型不必每一轮都从头重读整个任务,而是从这份结构化记忆里,精准调出当下最相关的那一小块证据——

既大幅降低了长上下文的负担,又让候选PoC的每一次变异,都能继承此前积累的代码路径与输入格式知识,让搜索越收越准。

在严格的探索预算内,时间于是被尽可能地花在「新假设」上,有效试验密度直线拉升。

第三招,共享记忆下的「多Agent并行探索」。

多个探索尝试,共享同一份漏洞记忆,可以从补丁线索、harness入口、文件格式字段、sanitizer类型、边界条件等多个方向同时推进,并彼此继承失败经验与验证结果。

这既扩大了覆盖面,又避免了重复无效的探索。

由此看出,MopMonk把漏洞复现,从一场开放式的反复试错,硬生生重写成了一个「可积累、可约束、可验证」的记忆更新过程。

三招合一,全凭在任务内部一点点沉淀、提炼、复用出来的「内功」,硬生生把一颗强大的开源基座,调度成了漏洞挖掘战场上的特战尖兵。

最终,它跑出了73.1%的成功率。

基座负责「想得深」,Harness负责「记得牢、调得准、打得稳」。

两者深度耦合,才最终铸就了榜单上那个令人瞩目的破局成绩。

一个比「堆参数」更有价值的判断

这件事真正的启发在于——

过去几年,行业的惯性是「堆参数」:参数越大、模型越强、榜单越高。

但CyberGym这种真实攻防任务给出了另一种答案:决定胜负的,越来越是Agent的执行能力,是Harness这层工程的厚度。

根据GitHub技术报告,这套方法的价值落在三点上:

强大的基模能力,提供了搜索的基础;

结构化的漏洞记忆,提供了收敛的机制;

共享记忆的多智能体探索,在有限预算里提升了成本效率。

基座决定了能力的上限,而这套记忆中心的Harness,决定了这份能力到底能兑现多少。

更要命的是它的复利属性:

模型基座会一代代换,今天用M3,明天可能用更新的开源模型。

但一套被真实战场反复打磨、沉淀了攻防经验的Harness,是可以跨越基座迭代、持续复利的资产。

简而言之,MopMonk Harness的长期价值,可能比「再堆一倍参数」更大。

这正是业内开始认真审视,这个神秘「扫地僧」的根本原因:

大家想看的,不只是它打了多少分,而是它示范了一条把开源基座做到极致的路。

所以,「扫地僧」到底是谁?

绕了一圈,我们还是回到了那个最开始、也最让人抓心挠肝的问题。

MopMonk,到底是谁?!

把线索拼起来:东方武侠味拉满的代号 + 上海公司的MiniMax基座 + 一身安全领域的「内功」。

几乎所有箭头,都指向同一个判断:这是一支来自中国、很可能就在上海的AI安全公司。

也有人顺着基模与Agent双向适配的角度,盲猜其背后与AI大模型原生团队脱不开干系。

各种版本的猜测在坊间疯传,但至今无人能甩出实锤。

你觉得,MopMonk会是谁家的高手?评论区,等你来爆料。

本文来自微信公众号“新智元”,作者:ASI启示录

Criptos en tendencia

Preguntas relacionadas

Q文章中提到的神秘中国AI '扫地僧'(MopMonk)在哪个全球性基准榜单上取得了突出成绩?

A在由UC Berkeley团队打造的、被誉为‘AI安全领域奥运会’的CyberGym全球基准榜单上,MopMonk以73.1%的胜率杀入全球前七,位列中国第一,紧咬OpenAI。

QMopMonk能取得如此成绩,其技术架构的核心优势是什么?

AMopMonk的核心优势在于将强大的基座模型(MiniMax M3)与一个为其量身打造的、高效的Harness(执行协调层)深度耦合。Harness通过结构化的漏洞记忆管理、记忆驱动的挖掘流程以及多智能体并行探索,将基座模型的‘智商’高效转化为在复杂代码库中执行长程任务的‘行动力’。

Q文章指出,在CyberGym这样的实战基准中,评估的核心是什么?这与以往的模型评估有何不同?

ACyberGym评估的核心是Agent的‘行动力’和‘执行能力’,而不仅仅是模型的‘智商’或知识储备。它要求AI在真实、庞大且复杂的代码项目中,通过深度推理和多轮工具调用,实际生成能触发漏洞的PoC(概念验证),并通过严格的差分验证。这与以往侧重于参数规模、选择题回答或文本理解的评估方式有本质不同,标志着AI竞争从‘比谁参数大’转向‘比谁能真把活干完’。

QMopMonk所使用的基座模型MiniMax M3具有哪些关键能力,使其特别适合CyberGym这类任务?

AMiniMax M3具备三大关键能力,使其成为漏洞挖掘任务的理想基座:1. 顶尖的编程与代码理解能力;2. 高达1M(百万)token的超长上下文窗口,能处理整个庞大代码库;3. 原生多模态支持。这些能力使其能胜任在数百万行代码中进行长期、复杂的分析和执行迭代任务。

Q文章最后关于MopMonk的‘真身’有哪些推测和线索?

A根据文章线索,关于MopMonk的‘真身’推测主要指向一支来自中国的AI安全团队。关键线索包括:1. 极具东方武侠色彩的代号‘扫地僧’;2. 其基座模型是来自上海公司MiniMax的开源模型M3;3. 其技术报告和Agent框架在GitHub上公开,但团队身份、所属公司等具体信息完全保密。因此,推测它很可能是一支扎根于上海或中国的、专注于AI安全攻防的技术团队或初创公司。

Lecturas Relacionadas

En la era de la IA, ¿qué le queda a Bitcoin?

Autor: Sevclub, Seven Research El precio del Bitcoin cayó recientemente por debajo de los 60.000 dólares, lo que ha generado reflexiones sobre su valor en la era de la IA. El autor sostiene que la IA y el Bitcoin son dos caras de una misma moneda. La IA ha reducido drásticamente el coste de producción de información (textos, imágenes, videos), inundando el mundo digital de contenido. Sin embargo, esto genera un problema fundamental: la dificultad para distinguir lo real de lo falso. Así, lo que se vuelve realmente valioso no es el contenido en sí, sino la capacidad de verificar su autenticidad. Aquí es donde se redefine el valor del Bitcoin. Mientras la IA "quema" energía para crear capacidades de generación, Bitcoin "quema" energía para crear y mantener una propiedad diferente: **verificabilidad**. Su red no funciona por confianza en instituciones, sino por criptografía y consenso distribuido, haciendo extremadamente costoso falsificar su historial de transacciones. Se convierte así en una "máquina de crear verificabilidad". La analogía final es con el Renacimiento: la imprenta (como la IA hoy) redujo el coste de copiar conocimiento, mientras que la contabilidad por partida doble (como el blockchain hoy) redujo el coste de la confianza en los negocios. En la era digital, la IA se encarga de la generación a bajo coste, y tecnologías como el blockchain se encargan de proporcionar una base verificable para los activos y registros. Por lo tanto, en un mundo donde la IA puede generar cualquier cosa, la verdadera escasez podría no ser "más contenido", sino "más hechos independientemente verificables". El Bitcoin es un intento de abordar esta necesidad fundamental.

链捕手Hace 59 min(s)

En la era de la IA, ¿qué le queda a Bitcoin?

链捕手Hace 59 min(s)

Trading

Spot

Artículos destacados

Qué es $S$

Entendiendo SPERO: Una Visión General Completa Introducción a SPERO A medida que el panorama de la innovación sigue evolucionando, la aparición de tecnologías web3 y proyectos de criptomonedas juega un papel fundamental en la configuración del futuro digital. Un proyecto que ha llamado la atención en este campo dinámico es SPERO, denotado como SPERO,$$s$. Este artículo tiene como objetivo recopilar y presentar información detallada sobre SPERO, para ayudar a entusiastas e inversores a comprender sus fundamentos, objetivos e innovaciones dentro de los dominios web3 y cripto. ¿Qué es SPERO,$$s$? SPERO,$$s$ es un proyecto único dentro del espacio cripto que busca aprovechar los principios de descentralización y tecnología blockchain para crear un ecosistema que promueva la participación, la utilidad y la inclusión financiera. El proyecto está diseñado para facilitar interacciones entre pares de nuevas maneras, proporcionando a los usuarios soluciones y servicios financieros innovadores. En su esencia, SPERO,$$s$ tiene como objetivo empoderar a los individuos al proporcionar herramientas y plataformas que mejoren la experiencia del usuario en el espacio de las criptomonedas. Esto incluye habilitar métodos de transacción más flexibles, fomentar iniciativas impulsadas por la comunidad y crear caminos para oportunidades financieras a través de aplicaciones descentralizadas (dApps). La visión subyacente de SPERO,$$s$ gira en torno a la inclusividad, buscando cerrar brechas dentro de las finanzas tradicionales mientras aprovecha los beneficios de la tecnología blockchain. ¿Quién es el Creador de SPERO,$$s$? La identidad del creador de SPERO,$$s$ sigue siendo algo oscura, ya que hay recursos públicos limitados que proporcionan información de fondo detallada sobre su(s) fundador(es). Esta falta de transparencia puede derivarse del compromiso del proyecto con la descentralización, una ética que muchos proyectos web3 comparten, priorizando las contribuciones colectivas sobre el reconocimiento individual. Al centrar las discusiones en torno a la comunidad y sus objetivos colectivos, SPERO,$$s$ encarna la esencia del empoderamiento sin señalar a individuos específicos. Como tal, entender la ética y la misión de SPERO es más importante que identificar a un creador singular. ¿Quiénes son los Inversores de SPERO,$$s$? SPERO,$$s$ cuenta con el apoyo de una diversa gama de inversores que van desde capitalistas de riesgo hasta inversores ángeles dedicados a fomentar la innovación en el sector cripto. El enfoque de estos inversores generalmente se alinea con la misión de SPERO, priorizando proyectos que prometen avances tecnológicos sociales, inclusividad financiera y gobernanza descentralizada. Estas fundaciones de inversores suelen estar interesadas en proyectos que no solo ofrecen productos innovadores, sino que también contribuyen positivamente a la comunidad blockchain y sus ecosistemas. El respaldo de estos inversores refuerza a SPERO,$$s$ como un contendiente notable en el rápidamente evolutivo dominio de los proyectos cripto. ¿Cómo Funciona SPERO,$$s$? SPERO,$$s$ emplea un marco multifacético que lo distingue de los proyectos de criptomonedas convencionales. Aquí hay algunas de las características clave que subrayan su singularidad e innovación: Gobernanza Descentralizada: SPERO,$$s$ integra modelos de gobernanza descentralizada, empoderando a los usuarios para participar activamente en los procesos de toma de decisiones sobre el futuro del proyecto. Este enfoque fomenta un sentido de propiedad y responsabilidad entre los miembros de la comunidad. Utilidad del Token: SPERO,$$s$ utiliza su propio token de criptomoneda, diseñado para servir a diversas funciones dentro del ecosistema. Estos tokens permiten transacciones, recompensas y la facilitación de servicios ofrecidos en la plataforma, mejorando la participación y utilidad general. Arquitectura en Capas: La arquitectura técnica de SPERO,$$s$ soporta la modularidad y escalabilidad, permitiendo la integración fluida de características y aplicaciones adicionales a medida que el proyecto evoluciona. Esta adaptabilidad es fundamental para mantener la relevancia en el siempre cambiante paisaje cripto. Participación de la Comunidad: El proyecto enfatiza iniciativas impulsadas por la comunidad, empleando mecanismos que incentivan la colaboración y la retroalimentación. Al nutrir una comunidad sólida, SPERO,$$s$ puede abordar mejor las necesidades de los usuarios y adaptarse a las tendencias del mercado. Enfoque en la Inclusión: Al ofrecer tarifas de transacción bajas y interfaces amigables para el usuario, SPERO,$$s$ busca atraer a una base de usuarios diversa, incluyendo a individuos que anteriormente pueden no haber participado en el espacio cripto. Este compromiso con la inclusión se alinea con su misión general de empoderamiento a través de la accesibilidad. Cronología de SPERO,$$s$ Entender la historia de un proyecto proporciona información crucial sobre su trayectoria de desarrollo y hitos. A continuación, se presenta una cronología sugerida que mapea eventos significativos en la evolución de SPERO,$$s$: Fase de Conceptualización e Ideación: Las ideas iniciales que forman la base de SPERO,$$s$ fueron concebidas, alineándose estrechamente con los principios de descentralización y enfoque comunitario dentro de la industria blockchain. Lanzamiento del Whitepaper del Proyecto: Tras la fase conceptual, se publicó un whitepaper completo que detalla la visión, objetivos e infraestructura tecnológica de SPERO,$$s$ para generar interés y retroalimentación de la comunidad. Construcción de Comunidad y Primeras Interacciones: Se realizaron esfuerzos de divulgación activa para construir una comunidad de primeros adoptantes e inversores potenciales, facilitando discusiones en torno a los objetivos del proyecto y obteniendo apoyo. Evento de Generación de Tokens: SPERO,$$s$ llevó a cabo un evento de generación de tokens (TGE) para distribuir sus tokens nativos a los primeros seguidores y establecer liquidez inicial dentro del ecosistema. Lanzamiento de la dApp Inicial: La primera aplicación descentralizada (dApp) asociada con SPERO,$$s$ se puso en marcha, permitiendo a los usuarios interactuar con las funcionalidades centrales de la plataforma. Desarrollo Continuo y Alianzas: Actualizaciones y mejoras continuas en las ofertas del proyecto, incluyendo alianzas estratégicas con otros actores en el espacio blockchain, han moldeado a SPERO,$$s$ en un jugador competitivo y en evolución en el mercado cripto. Conclusión SPERO,$$s$ se erige como un testimonio del potencial de web3 y las criptomonedas para revolucionar los sistemas financieros y empoderar a los individuos. Con un compromiso con la gobernanza descentralizada, la participación comunitaria y funcionalidades diseñadas de manera innovadora, allana el camino hacia un paisaje financiero más inclusivo. Como con cualquier inversión en el rápidamente evolutivo espacio cripto, se anima a los potenciales inversores y usuarios a investigar a fondo y participar de manera reflexiva con los desarrollos en curso dentro de SPERO,$$s$. El proyecto muestra el espíritu innovador de la industria cripto, invitando a una exploración más profunda de sus innumerables posibilidades. Aunque el viaje de SPERO,$$s$ aún se está desarrollando, sus principios fundamentales pueden, de hecho, influir en el futuro de cómo interactuamos con la tecnología, las finanzas y entre nosotros en ecosistemas digitales interconectados.

121 Vistas totalesPublicado en 2024.12.17Actualizado en 2024.12.17

Qué es $S$

Qué es AGENT S

Agent S: El Futuro de la Interacción Autónoma en Web3 Introducción En el paisaje en constante evolución de Web3 y las criptomonedas, las innovaciones están redefiniendo continuamente cómo los individuos interactúan con las plataformas digitales. Uno de estos proyectos pioneros, Agent S, promete revolucionar la interacción humano-computadora a través de su marco agente abierto. Al allanar el camino para interacciones autónomas, Agent S tiene como objetivo simplificar tareas complejas, ofreciendo aplicaciones transformadoras en inteligencia artificial (IA). Esta exploración detallada se adentrará en las complejidades del proyecto, sus características únicas y las implicaciones para el dominio de las criptomonedas. ¿Qué es Agent S? Agent S se presenta como un marco agente abierto revolucionario, diseñado específicamente para abordar tres desafíos fundamentales en la automatización de tareas informáticas: Adquisición de Conocimiento Específico del Dominio: El marco aprende de manera inteligente a partir de diversas fuentes de conocimiento externas y experiencias internas. Este enfoque dual le permite construir un rico repositorio de conocimiento específico del dominio, mejorando su rendimiento en la ejecución de tareas. Planificación a Largo Plazo de Tareas: Agent S emplea planificación jerárquica aumentada por la experiencia, un enfoque estratégico que facilita la descomposición y ejecución eficiente de tareas intrincadas. Esta característica mejora significativamente su capacidad para gestionar múltiples subtareas de manera eficiente y efectiva. Manejo de Interfaces Dinámicas y No Uniformes: El proyecto introduce la Interfaz Agente-Computadora (ACI), una solución innovadora que mejora la interacción entre agentes y usuarios. Utilizando Modelos de Lenguaje Multimodal Grandes (MLLMs), Agent S puede navegar y manipular diversas interfaces gráficas de usuario sin problemas. A través de estas características pioneras, Agent S proporciona un marco robusto que aborda las complejidades involucradas en la automatización de la interacción humana con las máquinas, preparando el terreno para innumerables aplicaciones en IA y más allá. ¿Quién es el Creador de Agent S? Aunque el concepto de Agent S es fundamentalmente innovador, la información específica sobre su creador sigue siendo elusiva. El creador es actualmente desconocido, lo que resalta ya sea la etapa incipiente del proyecto o la elección estratégica de mantener a los miembros fundadores en el anonimato. Independientemente de la anonimidad, el enfoque sigue siendo las capacidades y el potencial del marco. ¿Quiénes son los Inversores de Agent S? Dado que Agent S es relativamente nuevo en el ecosistema criptográfico, la información detallada sobre sus inversores y patrocinadores financieros no está documentada explícitamente. La falta de información disponible públicamente sobre las bases de inversión u organizaciones que apoyan el proyecto plantea preguntas sobre su estructura de financiamiento y hoja de ruta de desarrollo. Comprender el respaldo es crucial para evaluar la sostenibilidad del proyecto y su posible impacto en el mercado. ¿Cómo Funciona Agent S? En el núcleo de Agent S se encuentra tecnología de vanguardia que le permite funcionar de manera efectiva en diversos entornos. Su modelo operativo se basa en varias características clave: Interacción Humano-Computadora: El marco ofrece planificación avanzada de IA, esforzándose por hacer que las interacciones con las computadoras sean más intuitivas. Al imitar el comportamiento humano en la ejecución de tareas, promete elevar las experiencias de los usuarios. Memoria Narrativa: Empleada para aprovechar experiencias de alto nivel, Agent S utiliza memoria narrativa para hacer un seguimiento de las historias de tareas, mejorando así sus procesos de toma de decisiones. Memoria Episódica: Esta característica proporciona a los usuarios orientación paso a paso, permitiendo que el marco ofrezca apoyo contextual a medida que se desarrollan las tareas. Soporte para OpenACI: Con la capacidad de funcionar localmente, Agent S permite a los usuarios mantener el control sobre sus interacciones y flujos de trabajo, alineándose con la ética descentralizada de Web3. Fácil Integración con APIs Externas: Su versatilidad y compatibilidad con diversas plataformas de IA aseguran que Agent S pueda integrarse sin problemas en ecosistemas tecnológicos existentes, convirtiéndolo en una opción atractiva para desarrolladores y organizaciones. Estas funcionalidades contribuyen colectivamente a la posición única de Agent S dentro del espacio cripto, ya que automatiza tareas complejas y de múltiples pasos con una intervención humana mínima. A medida que el proyecto evoluciona, sus aplicaciones potenciales en Web3 podrían redefinir cómo se desarrollan las interacciones digitales. Cronología de Agent S El desarrollo y los hitos de Agent S pueden encapsularse en una cronología que destaca sus eventos significativos: 27 de septiembre de 2024: Se lanzó el concepto de Agent S en un documento de investigación integral titulado “Un Marco Agente Abierto que Utiliza Computadoras como un Humano”, mostrando las bases del proyecto. 10 de octubre de 2024: El documento de investigación se hizo disponible públicamente en arXiv, ofreciendo una exploración en profundidad del marco y su evaluación de rendimiento basada en el benchmark OSWorld. 12 de octubre de 2024: Se publicó una presentación en video, proporcionando una visión visual de las capacidades y características de Agent S, involucrando aún más a posibles usuarios e inversores. Estos hitos en la cronología no solo ilustran el progreso de Agent S, sino que también indican su compromiso con la transparencia y el compromiso comunitario. Puntos Clave Sobre Agent S A medida que el marco Agent S continúa evolucionando, varios atributos clave destacan, subrayando su naturaleza innovadora y potencial: Marco Innovador: Diseñado para proporcionar un uso intuitivo de las computadoras similar a la interacción humana, Agent S aporta un enfoque novedoso a la automatización de tareas. Interacción Autónoma: La capacidad de interactuar de manera autónoma con las computadoras a través de GUI significa un avance hacia soluciones informáticas más inteligentes y eficientes. Automatización de Tareas Complejas: Con su metodología robusta, puede automatizar tareas complejas y de múltiples pasos, haciendo que los procesos sean más rápidos y menos propensos a errores. Mejora Continua: Los mecanismos de aprendizaje permiten a Agent S mejorar a partir de experiencias pasadas, mejorando continuamente su rendimiento y eficacia. Versatilidad: Su adaptabilidad en diferentes entornos operativos como OSWorld y WindowsAgentArena asegura que pueda servir a una amplia gama de aplicaciones. A medida que Agent S se posiciona en el paisaje de Web3 y criptomonedas, su potencial para mejorar las capacidades de interacción y automatizar procesos significa un avance significativo en las tecnologías de IA. A través de su marco innovador, Agent S ejemplifica el futuro de las interacciones digitales, prometiendo una experiencia más fluida y eficiente para los usuarios en diversas industrias. Conclusión Agent S representa un audaz avance en la unión de la IA y Web3, con la capacidad de redefinir cómo interactuamos con la tecnología. Aunque aún se encuentra en sus primeras etapas, las posibilidades para su aplicación son vastas y atractivas. A través de su marco integral que aborda desafíos críticos, Agent S tiene como objetivo llevar las interacciones autónomas al primer plano de la experiencia digital. A medida que nos adentramos más en los reinos de las criptomonedas y la descentralización, proyectos como Agent S sin duda desempeñarán un papel crucial en la configuración del futuro de la tecnología y la colaboración humano-computadora.

909 Vistas totalesPublicado en 2025.01.14Actualizado en 2025.01.14

Qué es AGENT S

Cómo comprar S

¡Bienvenido a HTX.com! Hemos hecho que comprar Sonic (S) sea simple y conveniente. Sigue nuestra guía paso a paso para iniciar tu viaje de criptos.Paso 1: crea tu cuenta HTXUtiliza tu correo electrónico o número de teléfono para registrarte y obtener una cuenta gratuita en HTX. Experimenta un proceso de registro sin complicaciones y desbloquea todas las funciones.Obtener mi cuentaPaso 2: ve a Comprar cripto y elige tu método de pagoTarjeta de crédito/débito: usa tu Visa o Mastercard para comprar Sonic (S) al instante.Saldo: utiliza fondos del saldo de tu cuenta HTX para tradear sin problemas.Terceros: hemos agregado métodos de pago populares como Google Pay y Apple Pay para mejorar la comodidad.P2P: tradear directamente con otros usuarios en HTX.Over-the-Counter (OTC): ofrecemos servicios personalizados y tipos de cambio competitivos para los traders.Paso 3: guarda tu Sonic (S)Después de comprar tu Sonic (S), guárdalo en tu cuenta HTX. Alternativamente, puedes enviarlo a otro lugar mediante transferencia blockchain o utilizarlo para tradear otras criptomonedas.Paso 4: tradear Sonic (S)Tradear fácilmente con Sonic (S) en HTX's mercado spot. Simplemente accede a tu cuenta, selecciona tu par de trading, ejecuta tus trades y monitorea en tiempo real. Ofrecemos una experiencia fácil de usar tanto para principiantes como para traders experimentados.

1.5k Vistas totalesPublicado en 2025.01.15Actualizado en 2026.06.02

Cómo comprar S

Discusiones

Bienvenido a la comunidad de HTX. Aquí puedes mantenerte informado sobre los últimos desarrollos de la plataforma y acceder a análisis profesionales del mercado. A continuación se presentan las opiniones de los usuarios sobre el precio de S (S).

活动图片