China's No.1, Closing in on OpenAI, Mysterious "Sweeping Monk" Rises to Top Seven Globally

marsbitОпубліковано о 2026-06-30Востаннє оновлено о 2026-06-30

Анотація

A mysterious Chinese AI project named "MopMonk" (meaning "Sweeping Monk") has achieved a top-ranking result on the globally recognized CyberGym cybersecurity benchmark. With a 73.1% success rate, it ranks seventh worldwide and first among Chinese entries, performing closely behind OpenAI. The significance lies in the benchmark itself. CyberGym, created by UC Berkeley, is considered a premier "Olympics" for AI security. It tests models on over 1500 real-world software vulnerabilities, requiring them to not just identify but actually generate working exploits (PoCs) in a complex, offline environment. This moves beyond simple knowledge to testing an AI's practical "execution" capabilities. MopMonk's approach is notable. It uses the open-source MiniMax M3 model from Shanghai as its powerful reasoning "brain," leveraging its strong coding skills and long context window. However, the key to its performance is a custom-built, multi-agent security framework—its "Harness." This system uses structured "vulnerability memory" to efficiently guide the search for exploits, allowing multiple agents to explore in parallel while sharing lessons learned from failures. This engineering layer effectively translates the model's intelligence into actionable, iterative testing steps. The project remains highly secretive, with no official website or team information, embodying the "dark horse" spirit of its literary namesake. Its success highlights a potential industry shift: beyond simply scalin...

It's insane! A mysterious Chinese AI "Sweeping Monk" without even an official website, stormed into the CyberGym global top seven with a 73.1% win rate, hot on OpenAI's heels. The whole internet is going crazy trying to figure out, whose master is this?

These past few days, on a leaderboard where global AI giants are fiercely competing, a name no one has ever heard of suddenly appeared.

It's called MopMonk (Sweeping Monk).

No grand launch event, no official blog post, no cheerleading on social media.

It just emerged out of thin air and charged straight into the CyberGym global top ten.

With a 73.1% success rate, it closely trailed OpenAI by a narrow margin, setting a new record for the highest historical score by a Chinese team on this leaderboard.

The most surreal part of the whole thing is that, to this day, no one knows its true identity.

Just how significant is the CyberGym leaderboard?

How explosive is MopMonk's achievement this time? Look at the arena it stepped onto.

CyberGym, meticulously crafted by a UC Berkeley team, had its core paper accepted at the ICLR 2026 top conference.

Portal: https://arxiv.org/pdf/2506.02548

As one of the most authoritative public benchmarks in AI cybersecurity capability assessment, this place is essentially a "battleground of the gods" for large models—

Even top-tier heavyweights like GPT-5.5-Cyber and Claude Mythos have been in close combat on this leaderboard.

The entire benchmark focuses on "live-fire exercises":

1507 vulnerability instances, 188 major open-source projects. All test questions are sourced from real historical vulnerabilities accumulated in Google's OSS-Fuzz.

From an evaluation dimension perspective, this represents a breakthrough across scales.

Its scale is a full 7.5 times that of the previous largest public benchmark (NYU CTF, ~200 questions), and it leaves predecessors like CVE-Bench an order of magnitude behind.

Even more daunting is the difficulty. CyberGym doesn't offer multiple-choice questions.

It requires AI to perform deep reasoning within real-world projects involving thousands of files and millions of lines of code.

Precisely because it is large enough, real enough, and difficult enough, CyberGym has "differentiating power"—

It can slice out, bit by bit, the genuine capability gaps between different models and different Agent frameworks.

No wonder the security community directly crowned it the "Olympics of AI security."

This is also why almost all major global players are present: Microsoft, OpenAI, Anthropic, Google, Meta, Zhipu AI......

The CyberGym leaderboard itself is witnessing a crucial shift in AI competition:

From comparing who has more parameters, to comparing whose Agent can actually get the job done.

A mysterious Eastern codename suddenly appears among Silicon Valley AI giants

Who would have thought that on this very arena where "hard skills" speak the loudest, a "ghost player" would emerge as a dark horse?

Piercing through the fog, we currently only have three pieces of known information:

Mysterious Codename: MopMonk (Sweeping Monk)

Base Model: MiniMax M3

Leaderboard Record: Broke into CyberGym global top seven, China's number one

Normally, a team achieving such results should have already flooded the scene with technical reports and press conferences.

Yet, on this leaderboard teeming with masters, MopMonk is precisely that ultimate "outsider": It only tossed out a technical report, with its team, company, and location remaining complete unknowns.

This collision of "top-tier capability, information nakedness" itself is filled with a dramatic flair reminiscent of Eastern martial arts novels.

Those familiar with Jin Yong understand the weight carried by the three characters "Sweeping Monk" in "Demi-Gods and Semi-Devils"—

That old monk who swept floors for decades in the Shaolin Library, whose name no one remembered, yet with one move subdued the two great masters, Xiao Yuanshan and Murong Bo.

The most inconspicuous character, harboring the deepest skills.

Daring to challenge the arena under the banner of "Sweeping Monk," this team clearly has extremely cold confidence in its own strength!

A more crucial clue is hidden in its technical foundation—the base chosen by MopMonk is MiniMax M3.

As an open-source base originating from Shanghai, M3 can be called an all-round warrior, directly integrating three core capabilities: cutting-edge programming ability, a 1M ultra-long context window, and native multimodality.

On one side, an "Eastern cultural symbol" full of flavor; on the other, a technological base bearing a purely domestic label.

Placing these two clues on the table narrows the circle considerably. All the traces are frantically hinting at the same conclusion:

This is most likely a Chinese team.

The Deciding Factor Lies in the Harness

Putting aside the identity mystery, as those who have been long tracking AI technology, we want to figure out one question even more:

Why did MopMonk win?

To answer this, we must first return to CyberGym's hardest core—it doesn't test "whether you know," but "whether you can do."

Judging whether a piece of code has a vulnerability isn't too difficult for today's large models.

But CyberGym tests the next step, the deadliest step: generating an input that can trigger the vulnerability, i.e., a PoC.

It must trigger on the "vulnerable version," fail on the "patched version," and pass the execution verification in the benchmark environment.

This hurdle is far more tricky than imagined.

The trigger conditions for a vulnerability are often scattered among code paths, parsing logic, build environments, test harnesses, and input formats, requiring piece-by-piece assembly.

Even more troublesome, even if the PoC crashes the program locally, it might not count. As long as it doesn't satisfy the differential judgment of "triggers on vulnerable version, does not trigger on patched version," it's all wasted effort.

This step pulls the task completely from "understanding" into "execution." And a very specific kind of execution—

The entire exam takes place in a closed, offline environment.

No external search for help, no "outside resources" whatsoever. The AI can rely only on its understanding of the codebase before it and the memories it has accumulated step by step.

To "reproduce" a vulnerability under such conditions depends on a whole set of interlocking abilities:

Tool-calling planning: When to read files, when to run tests, when to go back and revise the plan;

Multi-round reasoning: The last attempt didn't trigger, what exactly was the problem, how to adjust next time;

Memory management: Structurally storing read code, tried inputs, and encountered pitfalls, rather than rereading everything from scratch each round;

Iterative verification: Repeatedly approaching that critical point until the vulnerability is truly reproduced.

In other words, the core of CyberGym competition is the Agent's "execution capability"; the model's "intelligence" is just the entry ticket.

And the key link that transforms "smartness" into "execution capability" is today's most underestimated term in the entire Agent field—Harness.

Harness is the "coordination layer" between the model and external tools, the execution environment.

It is responsible for tool orchestration, context state management, collection and re-feeding of execution feedback.

Simply put, the model is the brain, responsible for thinking "where the vulnerability might be, how to dig next."

The Harness is the limbs plus nervous system, responsible for turning the brain's thoughts into a series of real actions—

Which file to open, which command to run, how to adjust after getting an error, how to change the approach after a failed round.

On tasks like CyberGym, which require running dozens or hundreds of rounds and repeatedly trial-and-error within millions of lines of code, the quality of the Harness directly determines how much of the model's intelligence can be converted into combat effectiveness.

A smart model + a mediocre Harness often results in "can think of it, but can't do it";

A capable model + a strong Harness tailored for vulnerability mining is what can potentially achieve results in such long-range tasks.

An Agent "Tailor-Made" for Vulnerability Mining

Now, through the GitHub technical report, MopMonk's technical outline has become clear:

A security multi-Agent system newly designed specifically for vulnerability mining, powered by the thinking base MiniMax M3.

GitHub Address: https://github.com/MopMonkAI/MopMonkAgent

As mentioned, M3 is a rare open-source model today that integrates top-tier coding capability, a million-token context window, and native multimodality within a single architecture.

A glance at its benchmarks makes it clear: SWE-Bench Pro achieved 59.0%, Terminal-Bench 2.1 reached 66.0%, MCP Atlas scored 74.2%—

These impressive numbers precisely meet the most hardcore capability needs for Agent deployment in real-world scenarios.

Not only that, it can also autonomously iterate and self-correct over tasks lasting more than ten hours.

In other words, M3 plays the role of a "super brain" combining top-tier code parsing ability, ultra-long memory, and proficient tool-calling skills.

For tasks like CyberGym that often require swallowing an entire codebase and running dozens of rounds, a 1M context window is almost a necessity.

What MopMonk's security Agent framework does is amplify M3's brainpower into execution capability for vulnerability mining.

Its "core techniques," as seen from the technical details publicly available on GitHub, revolve around three key moves—

First move, structured "Vulnerability Memory."

It's not simply stacking chat history, nor is it dumping the ultra-long context wholesale into the model. Instead, it organizes a continuously updatable "Task Fact Memory" around the most critical types of objects in vulnerability mining:

Vulnerability target, code paths, input formats, candidate PoCs, failure evidence, verification status, and "Next Step Constraint" memory.

The last category especially shows skill: It doesn't generate vague abstract plans but directly extracts hard constraints that the next experiment must satisfy from the current evidence.

For example, "This time must cover that branch," "Which field to adjust," "Which type of failure cause to exclude."

This memory design transforms vulnerability mining from "repeated trial-and-error from scratch" into "an evidence-based convergence process."

Each code read, each execution result, each failed submission is converted into reusable constraints for the next PoC generation.

Second move, Memory-driven "Vulnerability Mining."

In vulnerability mining tasks, the system first initializes the vulnerability memory by scanning the codebase and using candidate trigger paths and directory information as planning starting points.

Then, it advances step by step, attempting to converge on the specific code location that triggers the crash.

Afterward, each exploration attempt reads the current memory, tests a specific hypothesis, and writes the results back into memory.

Thus, the model doesn't have to reread the entire task from the beginning each round. Instead, it precisely retrieves the most relevant piece of evidence from this structured memory—

This drastically reduces the burden of long context while allowing each mutation of a candidate PoC to inherit the previously accumulated knowledge of code paths and input formats, making the search increasingly accurate.

Within strict exploration budgets, time is therefore spent as much as possible on "new hypotheses," dramatically increasing the density of effective trials.

Third move, "Multi-Agent Parallel Exploration" under Shared Memory.

Multiple exploration attempts share the same vulnerability memory. They can advance simultaneously from multiple directions such as patch clues, harness entry points, file format fields, sanitizer types, boundary conditions, etc., inheriting each other's failure experiences and verification results.

This expands coverage while avoiding repetitive, ineffective exploration.

From this, it's evident that MopMonk has rewritten vulnerability reproduction from an open-ended trial-and-error process into a "accumulable, constrainable, verifiable" memory update process.

Combining all three moves, relying entirely on "internal skills" that precipitate, refine, and reuse bit by bit within the task, it forcefully dispatches a powerful open-source base into a special forces soldier on the vulnerability mining battlefield.

Ultimately, it achieved a 73.1% success rate.

The base is responsible for "thinking deeply," the Harness is responsible for "remembering solidly, tuning accurately, striking steadily."

The deep coupling of both ultimately forged that eye-catching breakthrough achievement on the leaderboard.

A Judgment More Valuable Than "Stacking Parameters"

The real inspiration of this matter lies in—

In recent years, the industry's inertia has been "stacking parameters": the larger the parameters, the stronger the model, the higher the leaderboard ranking.

But real-world attack/defense tasks like CyberGym offer another answer: increasingly, the deciding factor is the Agent's execution capability, the engineering depth of the Harness layer.

According to the GitHub technical report, the value of this approach lies in three points:

Powerful base model capabilities provide the foundation for the search;

Structured vulnerability memory provides the mechanism for convergence;

Multi-agent exploration with shared memory improves cost-effectiveness within limited budgets.

The base determines the upper limit of capability, while this memory-centric Harness determines how much of that capability can be actualized.

More critically is its compounding nature:

Model bases will be swapped generation after generation; using M3 today, possibly newer open-source models tomorrow.

But a Harness repeatedly tempered on real battlefields, accumulating attack/defense experience, is an asset that can compound continuously, transcending base model iterations.

In short, the long-term value of the MopMonk Harness might be greater than "stacking another doubling of parameters."

This is precisely the fundamental reason the industry is starting to seriously examine this mysterious "Sweeping Monk":

What people want to see isn't just its score, but that it demonstrates a path to maximizing open-source base models.

So, who exactly is the "Sweeping Monk"?

After circling around, we return to that initial, most tantalizing question.

MopMonk, who are you?!

Piecing the clues together: an Eastern martial arts-flavored codename + a base from Shanghai's MiniMax + a body of "internal skills" in the security field.

Almost all arrows point to the same judgment: This is an AI security company from China, most likely based in Shanghai.

Some, considering the two-way adaptation between the base model and the Agent, blindly speculate that its background is inseparable from the native AI large model team.

Various versions of guesses are circulating wildly, but no one has been able to produce hard evidence so far.

Who do you think MopMonk is? The master of which house? The comment section awaits your inside scoop.

This article is from the WeChat public account "New Zhiyuan", author: ASI Apocalypse

Трендові криптовалюти

Пов'язані питання

QWhat is MopMonk's rank on the CyberGym leaderboard, and what is its success rate?

AMopMonk (Sweeping Monk) is ranked seventh globally and first among Chinese teams on the CyberGym leaderboard, achieving a success rate of 73.1%.

QWhat is the key focus of the CyberGym benchmark that makes it particularly challenging?

ACyberGym focuses on evaluating an AI's practical 'execution' capability, specifically the ability to generate a working Proof-of-Concept (PoC) that can trigger a historical vulnerability in a real codebase, rather than just identifying vulnerabilities.

QWhat base model does MopMonk's Agent system utilize?

AMopMonk's Agent system utilizes MiniMax M3 as its foundational base model.

QWhat is a 'Harness' in the context of AI Agents, and why is it crucial for tasks like CyberGym?

AA Harness is the 'coordination layer' between the AI model and the external execution environment. It manages tool orchestration, context state, and feedback loops. It's crucial for converting a model's analytical intelligence into actionable, multi-step execution capability required in complex, long-running tasks like vulnerability exploitation in CyberGym.

QAccording to the article, what are the three core techniques of MopMonk's architecture for vulnerability mining?

AThe three core techniques of MopMonk's architecture are: 1. Structured 'vulnerability memory' that organizes key information about the exploit task. 2. Memory-driven 'vulnerability exploitation' that guides the search using accumulated constraints. 3. 'Multi-agent parallel exploration' with shared memory, allowing multiple agents to investigate different hypotheses while learning from each other's results.

Пов'язані матеріали

Valuation Inversion Emerges, Bitcoin Treasury Companies Face Trust Crisis

"Valuation Inversion Emerges, Sparking Trust Crisis for Bitcoin Treasury Firms" The investment thesis for corporate Bitcoin treasury stocks has fundamentally shifted. Investors are no longer rewarding companies simply for accumulating more Bitcoin. Instead, the focus is now on net Bitcoin per share, with intense scrutiny on whether new financings truly benefit existing shareholders or merely dilute their stake. Key indicators highlight the new reality. Metaplanet's market capitalization has fallen below the total value of its Bitcoin holdings, indicating a valuation discount. While MicroStrategy maintains a premium, its core metric—Bitcoin per diluted share for common shareholders—has been declining due to dilution from financing activities, primarily through its STRAT permanent preferred shares. This marks a transition from a pure "asset accumulation" phase to an "equity attribution" phase. Investors now deduct costs like preferred dividends and debt to calculate the actual Bitcoin claim for common equity. The widespread adoption of spot Bitcoin ETFs has removed the scarcity value these stocks once held, forcing them to justify their structure with superior leverage, dividends, or capital efficiency. European entrants like France's Capital B and Sweden's BTC AB are testing this new environment with ambitious funding plans backed by relatively small Bitcoin holdings. They are asking investors to bear complex capital structures, betting future Bitcoin purchases will cover all dilution and dividend costs. The sector's core risk is a broken financing loop. Once a company's stock trades below its Bitcoin net asset value, it loses the ability to issue equity for accretive purchases. It is then left with unpalatable choices: dilutive financing at a discount, venturing into new businesses like Bitcoin lending, or selling assets. The winners in this next phase will be those that demonstrably increase Bitcoin per share for common shareholders with every financing move.

Foresight News2 хв тому

Valuation Inversion Emerges, Bitcoin Treasury Companies Face Trust Crisis

Foresight News2 хв тому

Торгівля

Спот

Популярні статті

Що таке $S$

Розуміння SPERO: Комплексний огляд Вступ до SPERO Оскільки ландшафт інновацій продовжує еволюціонувати, виникнення технологій web3 та криптовалютних проектів відіграє ключову роль у формуванні цифрового майбутнього. Один з проектів, який привернув увагу в цій динамічній сфері, — це SPERO, позначений як SPERO,$$s$. Ця стаття має на меті зібрати та представити детальну інформацію про SPERO, щоб допомогти ентузіастам та інвесторам зрозуміти його основи, цілі та інновації в рамках web3 та крипто-сектору. Що таке SPERO,$$s$? SPERO,$$s$ — це унікальний проект у криптопросторі, який прагне використати принципи децентралізації та технології блокчейн для створення екосистеми, що сприяє залученню, корисності та фінансовій інклюзії. Проект розроблений для полегшення взаємодії між користувачами новими способами, надаючи їм інноваційні фінансові рішення та послуги. У своїй основі SPERO,$$s$ прагне надати можливості індивідам, забезпечуючи інструменти та платформи, які покращують користувацький досвід у криптовалютному просторі. Це включає в себе можливість більш гнучких методів транзакцій, сприяння ініціативам, що підтримуються спільнотою, та створення шляхів для фінансових можливостей через децентралізовані додатки (dApps). Основна концепція SPERO,$$s$ обертається навколо інклюзивності, прагнучи зменшити розриви в традиційній фінансовій системі, використовуючи переваги технології блокчейн. Хто є творцем SPERO,$$s$? Особистість творця SPERO,$$s$ залишається дещо невідомою, оскільки є обмежені публічно доступні ресурси, що надають детальну інформацію про його засновників. Ця відсутність прозорості може бути наслідком зобов'язання проекту до децентралізації — етики, яку багато проектів web3 поділяють, ставлячи колективні внески вище за індивідуальне визнання. Зосереджуючи обговорення навколо спільноти та її колективних цілей, SPERO,$$s$ втілює суть наділення без виділення конкретних осіб. Таким чином, розуміння етики та місії SPERO є більш важливим, ніж ідентифікація єдиного творця. Хто є інвесторами SPERO,$$s$? SPERO,$$s$ підтримується різноманітними інвесторами, починаючи від венчурних капіталістів до ангельських інвесторів, які прагнуть сприяти інноваціям у крипто-секторі. Зосередження цих інвесторів зазвичай узгоджується з місією SPERO — пріоритет надається проектам, які обіцяють технологічний прогрес у суспільстві, фінансову інклюзію та децентралізоване управління. Ці інвесторські фонди зазвичай зацікавлені в проектах, які не лише пропонують інноваційні продукти, але й позитивно впливають на спільноту блокчейн та її екосистеми. Підтримка з боку цих інвесторів підкріплює SPERO,$$s$ як значного конкурента в швидко змінюваній сфері крипто-проектів. Як працює SPERO,$$s$? SPERO,$$s$ використовує багатогранну структуру, яка відрізняє його від традиційних криптовалютних проектів. Ось деякі ключові особливості, які підкреслюють його унікальність та інноваційність: Децентралізоване управління: SPERO,$$s$ інтегрує моделі децентралізованого управління, надаючи користувачам можливість активно брати участь у процесах прийняття рішень щодо майбутнього проекту. Цей підхід сприяє відчуттю власності та відповідальності серед членів спільноти. Корисність токена: SPERO,$$s$ використовує свій власний криптовалютний токен, розроблений для виконання різних функцій в екосистемі. Ці токени дозволяють здійснювати транзакції, отримувати винагороди та полегшувати послуги, що пропонуються на платформі, підвищуючи загальну залученість та корисність. Шарова архітектура: Технічна архітектура SPERO,$$s$ підтримує модульність та масштабованість, що дозволяє безперешкодно інтегрувати додаткові функції та додатки в міру розвитку проекту. Ця адаптивність є надзвичайно важливою для збереження актуальності в постійно змінюваному крипто-ландшафті. Залучення спільноти: Проект підкреслює ініціативи, що підтримуються спільнотою, використовуючи механізми, які стимулюють співпрацю та зворотний зв'язок. Підтримуючи сильну спільноту, SPERO,$$s$ може краще задовольняти потреби користувачів та адаптуватися до ринкових тенденцій. Фокус на інклюзію: Пропонуючи низькі комісії за транзакції та зручні інтерфейси, SPERO,$$s$ прагне залучити різноманітну базу користувачів, включаючи осіб, які раніше не брали участі в крипто-просторі. Це зобов'язання до інклюзії узгоджується з його загальною місією наділення через доступність. Хронологія SPERO,$$s$ Розуміння історії проекту надає важливі уявлення про його розвиток та етапи. Нижче наведено пропоновану хронологію, що відображає значні події в еволюції SPERO,$$s$: Етап концептуалізації та ідеації: Початкові ідеї, що стали основою SPERO,$$s$, були сформовані, тісно пов'язані з принципами децентралізації та фокусом на спільноті в індустрії блокчейн. Запуск білого паперу проекту: Після концептуального етапу був випущений комплексний білий папір, що детально описує бачення, цілі та технологічну інфраструктуру SPERO,$$s$, щоб залучити інтерес та зворотний зв'язок від спільноти. Створення спільноти та ранні залучення: Активні зусилля були спрямовані на створення спільноти ранніх прихильників та потенційних інвесторів, що полегшило обговорення цілей проекту та отримання підтримки. Подія генерації токенів: SPERO,$$s$ провів подію генерації токенів (TGE) для розподілу своїх рідних токенів серед ранніх прихильників та встановлення початкової ліквідності в екосистемі. Запуск початкового dApp: Перший децентралізований додаток (dApp), пов'язаний з SPERO,$$s$, став доступним, дозволяючи користувачам взаємодіяти з основними функціями платформи. Постійний розвиток та партнерства: Безперервні оновлення та вдосконалення пропозицій проекту, включаючи стратегічні партнерства з іншими учасниками блокчейн-простору, сформували SPERO,$$s$ у конкурентоспроможного та еволюціонуючого гравця на крипто-ринку. Висновок SPERO,$$s$ є свідченням потенціалу web3 та криптовалют для революціонізації фінансових систем та наділення індивідів. Завдяки зобов'язанню до децентралізованого управління, залучення спільноти та інноваційно спроектованих функцій, він прокладає шлях до більш інклюзивного фінансового ландшафту. Як і з будь-якими інвестиціями в швидко змінюваному крипто-просторі, потенційним інвесторам та користувачам рекомендується ретельно досліджувати та обдумано взаємодіяти з поточними подіями в SPERO,$$s$. Проект демонструє інноваційний дух крипто-індустрії, запрошуючи до подальшого дослідження його численних можливостей. Хоча подорож SPERO,$$s$ ще триває, його основні принципи можуть справді вплинути на майбутнє того, як ми взаємодіємо з технологією, фінансами та один з одним у взаємопов'язаних цифрових екосистемах.

112 переглядів усьогоОпубліковано 2024.12.17Оновлено 2024.12.17

Що таке $S$

Що таке AGENT S

Агент S: Майбутнє автономної взаємодії в Web3 Вступ У постійно змінюваному ландшафті Web3 та криптовалюти інновації постійно переосмислюють, як люди взаємодіють з цифровими платформами. Один з таких новаторських проектів, Агент S, обіцяє революціонізувати взаємодію людини з комп'ютером через свою відкриту агентну структуру. Прокладаючи шлях для автономних взаємодій, Агент S прагне спростити складні завдання, пропонуючи трансформаційні застосування в штучному інтелекті (ШІ). Це детальне дослідження заглиблюється в складності проекту, його унікальні особливості та наслідки для сфери криптовалюти. Що таке Агент S? Агент S є революційною відкритою агентною структурою, спеціально розробленою для вирішення трьох основних викликів в автоматизації комп'ютерних завдань: Набуття специфічних знань у галузі: Структура інтелектуально навчається з різних зовнішніх джерел знань та внутрішнього досвіду. Цей подвійний підхід дозволяє їй створити багатий репозиторій специфічних знань у галузі, покращуючи її продуктивність у виконанні завдань. Планування на довгих горизонтах завдань: Агент S використовує планування з підкріпленням досвіду, стратегічний підхід, який полегшує ефективний розподіл та виконання складних завдань. Ця функція значно підвищує її здатність ефективно та результативно управляти кількома підзавданнями. Обробка динамічних, неоднорідних інтерфейсів: Проект представляє Інтерфейс Агент-Комп'ютер (ACI), інноваційне рішення, яке покращує взаємодію між агентами та користувачами. Використовуючи багатомодальні великі мовні моделі (MLLMs), Агент S може безперешкодно орієнтуватися та маніпулювати різноманітними графічними інтерфейсами користувача. Завдяки цим новаторським функціям Агент S надає надійну структуру, яка вирішує складнощі, пов'язані з автоматизацією людської взаємодії з машинами, прокладаючи шлях для численних застосувань у ШІ та за його межами. Хто є творцем Агент S? Хоча концепція Агент S є фундаментально новаторською, конкретна інформація про його творця залишається невідомою. Творець наразі невідомий, що підкреслює або початкову стадію проекту, або стратегічний вибір зберегти засновників у таємниці. Незважаючи на анонімність, акцент залишається на можливостях та потенціалі структури. Хто є інвесторами Агент S? Оскільки Агент S є відносно новим у криптографічній екосистемі, детальна інформація про його інвесторів та фінансових спонсорів не задокументована. Відсутність публічно доступних відомостей про інвестиційні фонди або організації, що підтримують проект, викликає питання щодо його фінансової структури та дорожньої карти розвитку. Розуміння підтримки є критично важливим для оцінки стійкості проекту та потенційного впливу на ринок. Як працює Агент S? В основі Агент S лежить передова технологія, яка дозволяє йому ефективно функціонувати в різних умовах. Його операційна модель побудована навколо кількох ключових функцій: Взаємодія з комп'ютером, подібна до людської: Структура пропонує розширене планування ШІ, прагнучи зробити взаємодії з комп'ютерами більш інтуїтивними. Імітуючи людську поведінку при виконанні завдань, вона обіцяє підвищити досвід користувачів. Наративна пам'ять: Використовується для використання високорівневого досвіду, Агент S використовує наративну пам'ять для відстеження історій завдань, тим самим покращуючи свої процеси прийняття рішень. Епізодична пам'ять: Ця функція надає користувачам покрокові інструкції, дозволяючи структурі пропонувати контекстуальну підтримку в міру виконання завдань. Підтримка OpenACI: Завдяки можливості працювати локально, Агент S дозволяє користувачам зберігати контроль над своїми взаємодіями та робочими процесами, узгоджуючи з децентралізованою етикою Web3. Легка інтеграція з зовнішніми API: Його універсальність і сумісність з різними платформами ШІ забезпечують те, що Агент S може безперешкодно вписатися в існуючі технологічні екосистеми, роблячи його привабливим вибором для розробників та організацій. Ці функціональні можливості колективно сприяють унікальному положенню Агент S у крипто-просторі, оскільки він автоматизує складні, багатоступеневі завдання з мінімальним втручанням людини. У міру розвитку проекту його потенційні застосування в Web3 можуть переосмислити, як відбуваються цифрові взаємодії. Хронологія Агент S Розробка та етапи Агент S можуть бути узагальнені в хронології, яка підкреслює його значні події: 27 вересня 2024 року: Концепція Агент S була представлена в комплексній науковій статті під назвою “Відкрита агентна структура, яка використовує комп'ютери як людина”, що демонструє основи проекту. 10 жовтня 2024 року: Наукова стаття була опублікована на arXiv, пропонуючи детальне дослідження структури та її оцінки продуктивності на основі бенчмарку OSWorld. 12 жовтня 2024 року: Було випущено відеопрезентацію, що надає візуальне уявлення про можливості та особливості Агент S, ще більше залучаючи потенційних користувачів та інвесторів. Ці маркери в хронології не лише ілюструють прогрес Агент S, але й вказують на його прихильність до прозорості та залучення громади. Ключові моменти про Агент S У міру розвитку структури Агент S кілька ключових характеристик виділяються, підкреслюючи її новаторський характер та потенціал: Інноваційна структура: Розроблена для забезпечення інтуїтивного використання комп'ютерів, подібного до людської взаємодії, Агент S пропонує новий підхід до автоматизації завдань. Автономна взаємодія: Здатність автономно взаємодіяти з комп'ютерами через GUI означає стрибок до більш інтелектуальних та ефективних обчислювальних рішень. Автоматизація складних завдань: Завдяки своїй надійній методології він може автоматизувати складні, багатоступеневі завдання, роблячи процеси швидшими та менш схильними до помилок. Безперервне вдосконалення: Механізми навчання дозволяють Агенту S покращуватися на основі минулого досвіду, постійно підвищуючи свою продуктивність та ефективність. Універсальність: Його адаптивність до різних операційних середовищ, таких як OSWorld та WindowsAgentArena, забезпечує його здатність служити широкому спектру застосувань. Оскільки Агент S займає своє місце в ландшафті Web3 та криптовалюти, його потенціал покращити можливості взаємодії та автоматизувати процеси означає значний прогрес у технологіях ШІ. Завдяки своїй інноваційній структурі Агент S є прикладом майбутнього цифрових взаємодій, обіцяючи більш безперешкодний та ефективний досвід для користувачів у різних галузях. Висновок Агент S представляє собою сміливий крок вперед у поєднанні ШІ та Web3, з можливістю переосмислити, як ми взаємодіємо з технологією. Хоча проект все ще на ранніх стадіях, можливості для його застосування є величезними та переконливими. Завдяки своїй комплексній структурі, що вирішує критичні виклики, Агент S прагне вивести автономні взаємодії на передній план цифрового досвіду. У міру того, як ми заглиблюємося в сфери криптовалюти та децентралізації, проекти, подібні до Агент S, безсумнівно, відіграватимуть ключову роль у формуванні майбутнього технологій та співпраці людини з комп'ютером.

740 переглядів усьогоОпубліковано 2025.01.14Оновлено 2025.01.14

Що таке AGENT S

Як купити S

Ласкаво просимо до HTX.com! Ми зробили покупку Sonic (S) простою та зручною. Дотримуйтесь нашої покрокової інструкції, щоб розпочати свою криптовалютну подорож.Крок 1: Створіть обліковий запис на HTXВикористовуйте свою електронну пошту або номер телефону, щоб зареєструвати обліковий запис на HTX безплатно. Пройдіть безпроблемну реєстрацію й отримайте доступ до всіх функцій.ЗареєструватисьКрок 2: Перейдіть до розділу Купити крипту і виберіть спосіб оплатиКредитна/дебетова картка: використовуйте вашу картку Visa або Mastercard, щоб миттєво купити Sonic (S).Баланс: використовуйте кошти з балансу вашого рахунку HTX для безперешкодної торгівлі.Треті особи: ми додали популярні способи оплати, такі як Google Pay та Apple Pay, щоб підвищити зручність.P2P: Торгуйте безпосередньо з іншими користувачами на HTX.Позабіржова торгівля (OTC): ми пропонуємо індивідуальні послуги та конкурентні обмінні курси для трейдерів.Крок 3: Зберігайте свої Sonic (S)Після придбання Sonic (S) збережіть його у своєму обліковому записі на HTX. Крім того, ви можете відправити його в інше місце за допомогою блокчейн-переказу або використовувати його для торгівлі іншими криптовалютами.Крок 4: Торгівля Sonic (S)Легко торгуйте Sonic (S) на спотовому ринку HTX. Просто увійдіть до свого облікового запису, виберіть торгову пару, укладайте угоди та спостерігайте за ними в режимі реального часу. Ми пропонуємо зручний досвід як для початківців, так і для досвідчених трейдерів.

1.6k переглядів усьогоОпубліковано 2025.01.15Оновлено 2026.06.02

Як купити S

Обговорення

Ласкаво просимо до спільноти HTX. Тут ви можете бути в курсі останніх подій розвитку платформи та отримати доступ до професійної ринкової інформації. Нижче представлені думки користувачів щодо ціни S (S).

活动图片