Japan's AI Dark Horse Emerges: How a 7B Small Model Challenges Fable and Mythos?

marsbitDipublikasikan tanggal 2026-06-22Terakhir diperbarui pada 2026-06-22

Abstrak

In June 2026, Sakana AI's new model Fugu caused a stir in the AI community. Its Fugu Ultra variant achieved scores of 73.7 on SWE-Bench Pro and 82.1 on TerminalBench 2.1, surpassing GPT-5.5 and Claude Opus 4.8, and was claimed to be comparable to export-restricted models like Fable 5 and Mythos Preview. Remarkably, the core of this high-performance system is not a massive model, but a small 7B-parameter RL Conductor model. Fugu operates as a multi-agent orchestrator: the 7B model acts as a "foreman," dynamically analyzing user tasks and delegating subtasks to a pool of top-tier global models (e.g., GPT-5, Gemini 3.1 Pro). It then synthesizes and verifies their outputs. This architecture represents a paradigm shift from monolithic models to an expert-team approach. It enhances performance in complex, multi-step engineering tasks like code review and security testing by enabling cross-validation from specialized models, improving long-session stability and token efficiency. However, Fugu's strengths come with trade-offs: it faces inherent latency due to multiple API calls, relies heavily on underlying US model APIs (creating dependency risks), and its benchmark comparisons with Fable/Mythos are based on reported scores, not head-to-head testing. For Japan's AI ecosystem, which lacks the massive compute and data resources of the US or China, Fugu exemplifies an "asymmetric breakthrough" strategy. Instead of competing directly in parameter scale, it focuses on intelligent orche...

June 22, 2026 — The new model "Fugu" released by Sakana AI sent shockwaves through the AI community. In the rigorous SWE-Bench Pro and TerminalBench benchmark tests, Fugu Ultra scored 73.7 and 82.1 points respectively, surpassing GPT-5.5 and Claude Opus 4.8, and even claimed to be on par with the export-controlled Fable 5 and Mythos Preview. Surprisingly, the core of this system, which topped the charts in engineering and reasoning capabilities, is not a massive model with hundreds of billions of parameters, but a model with only 7B parameters. It doesn't do the work itself; instead, it acts as a "project manager," dynamically orchestrating top global large models. This counter-intuitive architecture not only shatters the myth of "parameters equal justice" but also reflects Japan's path to AI breakthroughs amidst constrained computing resources.

The 7B "Project Manager": The Counter-Intuitive Architecture of Fugu

To understand the peculiarities of Fugu, one must first look at its origins. Sakana AI was founded in Tokyo in 2023 by Llion Jones, a co-author of the Transformer paper, and former Google researcher David Ha. From its inception, the company carried the "nature-inspired" gene, dedicated to solving AI problems with evolutionary algorithms and natural swarm intelligence. In 2025, Sakana AI secured investments from giants like NVIDIA and Google, valuing the company at over $25 billion. However, despite backing from these giants, Japan still lacks the massive computing infrastructure and data pools found in China and the US. Under these resource constraints, Sakana AI did not choose to compete head-on with trillion-parameter models but instead took an "orchestration" route.

Fugu is officially positioned as "a multi-agent orchestration system acting as a single foundational model." In traditional AI architecture, a large model is a "monolithic beast." A user inputs a prompt, and the model calculates from the first neural network layer to the last, outputting the result. This mode is extremely efficient for simple problems but often leads to hallucinations or logical breakdowns when facing complex, multi-step engineering tasks.

Fugu fundamentally changed this paradigm. Its core is a 7B-parameter model trained with reinforcement learning, called the RL Conductor. This 7B model does not directly generate the final answer; instead, it plays the role of a "project manager." When a user submits a task through a single OpenAI-compatible API, the RL Conductor dynamically analyzes the task type and then assigns subtasks to top global models in its agent pool, such as GPT-5, Gemini 3.1 Pro, or Claude Opus 4.8. It is responsible for scheduling, verifying, and synthesizing the outputs of these models, ultimately providing a result that has undergone multiple rounds of verification.

The theoretical underpinning for this architecture comes from two papers at ICLR 2026: "TRINITY: An Evolved LLM Coordinator" and "Learning to Orchestrate Agents in Natural Language with the Conductor." The papers detail how a small-parameter model can "conduct" large models through reinforcement learning. This changes the paradigm of "Test-time scaling." In the past, computing power was primarily used for deep inference within the model, making the model "struggle" for an answer. Now, computing power is used for external scheduling, verification, and synthesis. Traditional large models are monolithic all-rounders, while Fugu is a team of experts. The 7B RL Conductor proves that model parameter size is no longer the sole determinant of capability; knowing how to call tools and external agents can also lead to performance leaps.

The Truth Behind the Scores: Matching Fable and Surpassing GPT-5.5

The immediate reason for Fugu's sensation is its benchmark scores in rigorous tests. In the AI industry, benchmark scores are the hard currency for measuring model capabilities, but different benchmarks focus on entirely different aspects. The SWE-Bench Pro and TerminalBench 2.1 chosen by Sakana AI are both "tough nuts" biased towards real-world engineering environments.

SWE-Bench Pro focuses on software engineering capabilities, requiring models to locate and fix bugs in real codebases. According to data published in the Sakana AI console, Fugu Ultra scored 73.7 on SWE-Bench Pro. For comparison, Claude Opus 4.8 scored 69.2, GPT-5.5 scored 58.6, and Gemini 3.1 Pro scored 54.2. On TerminalBench 2.1, another test for system operation capabilities, Fugu Ultra scored 82.1, surpassing GPT-5.5's 78.2 and Opus 4.8's 74.6. These two tests not only examine a model's code generation ability but also its logical stability and tool-calling capability in multi-step, long-chain tasks. Fugu Ultra's lead means it experiences fewer mid-process crashes or deviations from goals when handling complex engineering problems compared to monolithic models.

More attention was paid to the comparison between Fugu and Fable 5/Mythos Preview. Anthropic's Fable series and another frontier lab's Mythos series represent the pinnacle of current AI reasoning capabilities. However, due to export controls or incomplete public release, these two models are not part of Fugu's agent pool. Sakana AI officially claims that Fugu Ultra is "on par" with Fable 5 and Mythos Preview on engineering and science benchmarks. It must be clarified, however, that this comparison is not based on head-to-head testing in the same pool. Fugu's scores are based on actual runs of its own system, while Fable and Mythos data are based on report scores publicly released by their respective vendors.

This comparison methodology has sparked some controversy in the developer community. Some argue that test conditions across different systems and environments are difficult to align perfectly, making direct score comparisons unfair. However, other developers point out that referencing vendor-reported data is industry practice in the absence of a unified testing environment. Setting aside the controversy with Fable and Mythos, Fugu Ultra's surpassing of GPT-5.5 and Opus 4.8 on SWE-Bench Pro and TerminalBench 2.1 is a real, like-for-like comparison. This surpassing is not because Fugu's underlying model is smarter than GPT-5.5, but because the RL Conductor performs task decomposition and expert scheduling more precisely. In experiments requiring multiple rounds of reasoning and verification, such as AutoResearch, Rubik's Cube solving, and mechanical design, Fugu consistently showed advantages. This indicates that in handling "long, messy, multi-step" real-world workflows, the multi-agent orchestration architecture indeed offers more resilience than monolithic models.

Real Development Scenario Tests: Code Review and Long Session Stability

For developers and AI tool users, benchmark scores are only references. What truly determines a model's usefulness is its performance in real work scenarios. Fugu underwent beta testing with nearly 500 early users before release. Their feedback revealed Fugu's unique value in practical applications.

Code review is one of the most common AI scenarios for developers. Traditional monolithic models often only find superficial syntax errors or common logic bugs when reviewing code. In beta testing, some developers reported that Fugu demonstrated unusually detailed performance in code reviews, capable of uncovering deep architectural bugs, while other tools often found only a few surface-level issues. This difference stems from Fugu's architecture. Upon receiving a code review task, the RL Conductor can call models specializing in static analysis, logical reasoning, and security auditing respectively to conduct cross-validation on the same piece of code from multiple angles. This "expert consultation" model naturally uncovers more hidden problems than the "solo effort" of a single model.

Another frequently mentioned advantage is long-session stability. When building AI Agent products, one of developers' biggest headaches is the model's "persona drift" in long conversations. As the number of dialogue rounds increases, monolithic models often forget the initial setup or deviate in instruction following. After testing, some enterprise executives reported that Fugu's Persona in long conversations is exceptionally stable, with almost no drift. This is because the RL Conductor itself is not responsible for maintaining long-text memory; it only selects the most appropriate underlying model to generate a response in each dialogue round based on the current context. This architecture of "separation of control and generation" greatly improves Agent stability during long-running sessions.

In the field of cybersecurity, Fugu also demonstrated end-to-end practical capability. In tests, Fugu could independently complete the entire workflow from reconnaissance, XSS/SQLi vulnerability detection to authentication review, and generate a complete penetration test report, strictly adhering to instructions not to cross boundaries and damage systems. This level of completion for complex tasks relies on the RL Conductor's precise orchestration of security toolchains and the capabilities of different large models.

In addition, token efficiency is a major highlight of Fugu. Traditional large models often generate lengthy chains of thought, consuming a large number of tokens when dealing with complex problems. Fugu's RL Conductor avoids wasteful long CoT consumption through precise routing. Official data and early testing show it can significantly reduce waste of ineffective tokens. For developers billed by tokens, this means not only cost reduction but also improved response speed.

The Achilles' Heel of Underlying Dependency: The Cost of Multi-Agent Orchestration

Although Fugu shines in architecture and benchmark scores, as a tool for practical work, it is not without weaknesses. The multi-agent orchestration architecture, while bringing performance breakthroughs, also introduces significant risks and limitations.

The core issue is underlying dependency risk. Fugu's agent pool heavily relies on underlying APIs from US giants like GPT, Claude, and Gemini. Although the RL Conductor has dynamic routing capabilities and can switch to other models if one fails or is rate-limited, this only mitigates single-supplier risk. It does not and cannot detach from the entire US AI infrastructure ecosystem. If these underlying models collectively raise prices, impose large-scale rate limits, or change API terms, Fugu's cost structure and stability will be directly impacted. This "parasitic" mode, living atop others' infrastructure, has inherent fragility in commercialization and long-term stability.

Next is the trade-off between latency and cost structure. While the RL Conductor saves on ineffective token consumption through precise routing, multi-agent orchestration inevitably involves multiple API calls and inter-model communication. For real-time interaction scenarios requiring extremely low latency, such as real-time voice conversations or high-frequency trading assistance, Fugu Ultra's "deep thinking and scheduling" time may be longer than directly calling a monolithic model. In scenarios where response speed is paramount, Fugu's architectural advantage could become a drag on user experience.

Furthermore, controversies over fairness of comparison persist. As mentioned, Fugu claims parity with Fable and Mythos, but the latter two are not in its agent pool. In the developer community, some voices question whether comparisons based on vendor-reported data have practical reference value. After all, model performance can vary greatly across different task distributions, and simple aggregate score comparisons might mask specific strengths and weaknesses. For developers needing precise model capability assessments, the lack of head-to-head test data means they must remain cautious during selection.

Not Competing on Compute, but on Orchestration: Japan's Asymmetric Breakthrough in Large Models

Looking beyond the specific product review, Fugu's birth carries deeper implications for Japan's large model ecosystem. In the global AI arms race, Japan is in an awkward position. It lacks both the continuous influx of top-tier computing power and frontier algorithm accumulation of the US, and the massive data pools and fiercely competitive market environment of China. More critically, Japan also faces export control risks from US frontier models (like Fable/Mythos). Against this backdrop, Sakana AI's "evolutionary algorithm" and "multi-agent orchestration" route showcase the logic of "asymmetric breakthrough" for a resource-constrained nation.

Japan does have domestic large model players. NTT released tsuzumi, and institutions like ELYZA, Rinna, and LLM-jp are also working hard to train local language models. However, most follow the traditional "train from scratch" route, struggling to compete with top US and Chinese models in parameter scale and general capabilities. Sakana AI is the only Japanese lab with global frontier influence that champions an "asymmetric architecture."

Fugu's dynamic routing capability essentially helps Japanese companies and institutions establish "AI Sovereignty." Under limited computing resources, instead of spending huge sums to train a hundred-billion-parameter model that is inferior to GPT-5.5 in all aspects, it's better to train a clever 7B "project manager." This manager can flexibly connect to the world's best models based on task needs. If one day a US model faces export controls or supply cuts, the RL Conductor can quickly route tasks to other available models, even connecting to Japan's domestic specialized models. This architecture gives Japan a degree of autonomy and risk resilience in utilizing AI capabilities.

Observing the global AI tool ecosystem, OmniTools notes that large model capabilities are gradually leveling, and the main battleground of competition is shifting from mere parameter stacking to toolchains and landing scenarios. The emergence of Fugu precisely confirms this trend. It no longer pursues perfection in a single model but pursues optimality at the system level. This thinking holds significant reference value for nations and regions lacking advantages in compute and data.

Of course, this "asymmetric breakthrough" has its ceiling. As long as the core technology of underlying models remains in the hands of a few giants, the capability ceiling of orchestration systems will be limited by those underlying models. Fugu proves a 7B model can be an excellent conductor, but it cannot magically create capabilities that the underlying models lack. For Japan's large models to truly achieve a breakthrough, beyond architectural innovation in orchestration, continued investment in underlying computing power, core algorithms, and high-quality data is still necessary. Fugu is an ingenious system-level innovation, but it's not a panacea. For developers and enterprise users, Fugu provides a highly competitive new option in complex engineering scenarios. However, when using it, one must also be clear-eyed about its underlying dependency vulnerabilities and the latency-cost trade-offs.

Kripto yang Sedang Tren

Pertanyaan Terkait

QWhat is the core innovation and role of the 7B-parameter model in Sakana AI's Fugu system?

AThe core innovation is a 7B-parameter model called the RL Conductor, which acts as a 'foreman' or intelligent orchestrator. It does not directly generate final answers but dynamically analyzes user tasks and dispatches subtasks to a pool of top-tier global foundation models like GPT-5 or Claude Opus. It is responsible for scheduling, verifying, and synthesizing these models' outputs.

QOn which two benchmark tests did Fugu Ultra outperform models like GPT-5.5 and Claude Opus 4.8, and what do these tests evaluate?

AFugu Ultra outperformed competitors on SWE-Bench Pro and TerminalBench 2.1. SWE-Bench Pro evaluates software engineering capabilities, specifically locating and fixing bugs in real codebases. TerminalBench 2.1 tests system operation capabilities, focusing on multi-step tasks in real-world engineering environments.

QAccording to the article, what are two key practical advantages of Fugu's architecture reported by early beta testers?

ATwo key practical advantages are: 1) Superior code review capabilities, where Fugu's multi-agent 'expert consultation' approach finds deeper architectural bugs compared to single models. 2) Exceptional long-session stability, where the RL Conductor's 'control-generation separation' architecture prevents persona drift over long conversations by selecting the best model for each turn based on context.

QWhat are the main weaknesses or risks associated with Fugu's multi-agent orchestration architecture?

AThe main weaknesses are: 1) Underlying dependency risk, as Fugu's agent pool relies on APIs from major US AI providers, making it vulnerable to collective price changes, rate limits, or policy shifts. 2) Latency trade-offs, where the orchestration process involving multiple API calls can introduce higher latency unsuitable for real-time interaction scenarios.

QHow does the Fugu system represent a 'non-symmetric breakthrough' strategy for Japan's AI industry, according to the article?

AIt represents a 'non-symmetric breakthrough' by circumventing Japan's limitations in compute power and data. Instead of expensively training a massive general-purpose model that can't compete with US/China leaders, Japan focused on training a smart, small 'foreman' model (the RL Conductor) that orchestrates the world's best models. This grants a degree of AI sovereignty and risk resilience, allowing flexible routing if certain US models become unavailable, though ultimate capability is still bounded by the underlying models.

Bacaan Terkait

Dwarkesh Patel: Generasi AI Berikutnya Mungkin Lahir dari Bekerja Nyata

Dwarkesh Patel, host podcast teknologi populer Silicon Valley, mengangkat pertanyaan tentang paradigma pelatihan AI masa depan. Ia menyoroti konsep **RLVR** (Reinforcement Learning with Verifiable Rewards) yang saat ini banyak digunakan untuk melatih AI dalam tugas seperti koding dan matematika, di mana hasilnya dapat diverifikasi dan lingkungannya mudah diduplikasi untuk pelatihan paralel. Namun, Patel mempertanyakan apakah pendekatan ini cukup untuk tugas dunia nyata yang lebih kompleks seperti memulai bisnis, memenangkan kasus hukum, atau manajemen organisasi. Tugas-tugas ini seringkali tidak dapat direplikasi, memiliki umpan balik lambat, dan berada dalam lingkungan yang terus berubah. Ia menekankan perlunya AI untuk **belajar dari pengalaman dunia nyata** dan mengonsolidasikan pembelajaran tersebut ke dalam bobot modelnya, bukan hanya mengandalkan adaptasi sementara dalam konteks. Dua arah yang diusulkan adalah: 1. **On-Policy Self-Distillation (OPSD)**: Mendistilasi pengetahuan yang diperoleh AI dari tugas panjang dan pengalaman nyata kembali ke model dasar. 2. **Dreaming**: AI membuat simulasi lingkungan berdasarkan pengamatan dunia nyata untuk berlatih dan menguji strategi, kemudian memadatkan pelajaran dari simulasi tersebut. Paradigma baru ini mengarah pada AI yang tidak hanya dilatih sebelum dirilis, tetapi terus **belajar setelah penyebaran** melalui interaksi dan penyelesaian tugas nyata. Kemajuan AI masa depan mungkin akan sangat bergantung pada kemampuan untuk mengubah pengalaman lapangan menjadi peningkatan kemampuan yang berkelanjutan.

marsbit24m yang lalu

Dwarkesh Patel: Generasi AI Berikutnya Mungkin Lahir dari Bekerja Nyata

marsbit24m yang lalu

Trading

Spot

Artikel Populer

Apa Itu $S$

Memahami SPERO: Tinjauan Komprehensif Pengenalan SPERO Seiring dengan perkembangan lanskap inovasi, munculnya teknologi web3 dan proyek cryptocurrency memainkan peran penting dalam membentuk masa depan digital. Salah satu proyek yang telah menarik perhatian di bidang dinamis ini adalah SPERO, yang dilambangkan sebagai SPERO,$$s$. Artikel ini bertujuan untuk mengumpulkan dan menyajikan informasi terperinci tentang SPERO, untuk membantu para penggemar dan investor memahami dasar-dasar, tujuan, dan inovasi dalam domain web3 dan crypto. Apa itu SPERO,$$s$? SPERO,$$s$ adalah proyek unik dalam ruang crypto yang berusaha memanfaatkan prinsip desentralisasi dan teknologi blockchain untuk menciptakan ekosistem yang mendorong keterlibatan, utilitas, dan inklusi finansial. Proyek ini dirancang untuk memfasilitasi interaksi peer-to-peer dengan cara baru, memberikan pengguna solusi dan layanan keuangan yang inovatif. Pada intinya, SPERO,$$s$ bertujuan untuk memberdayakan individu dengan menyediakan alat dan platform yang meningkatkan pengalaman pengguna dalam ruang cryptocurrency. Ini termasuk memungkinkan metode transaksi yang lebih fleksibel, mendorong inisiatif yang dipimpin komunitas, dan menciptakan jalur untuk peluang finansial melalui aplikasi terdesentralisasi (dApps). Visi mendasar dari SPERO,$$s$ berputar di sekitar inklusivitas, bertujuan untuk menjembatani kesenjangan dalam keuangan tradisional sambil memanfaatkan manfaat teknologi blockchain. Siapa Pencipta SPERO,$$s$? Identitas pencipta SPERO,$$s$ tetap agak samar, karena ada sumber daya publik yang terbatas yang memberikan informasi latar belakang terperinci tentang pendiriannya. Kurangnya transparansi ini dapat berasal dari komitmen proyek terhadap desentralisasi—sebuah etos yang banyak proyek web3 bagi, memprioritaskan kontribusi kolektif di atas pengakuan individu. Dengan memusatkan diskusi di sekitar komunitas dan tujuan kolektifnya, SPERO,$$s$ mewujudkan esensi pemberdayaan tanpa menonjolkan individu tertentu. Dengan demikian, memahami etos dan misi SPERO tetap lebih penting daripada mengidentifikasi pencipta tunggal. Siapa Investor SPERO,$$s$? SPERO,$$s$ didukung oleh beragam investor mulai dari modal ventura hingga investor malaikat yang berdedikasi untuk mendorong inovasi di sektor crypto. Fokus investor ini umumnya sejalan dengan misi SPERO—memprioritaskan proyek yang menjanjikan kemajuan teknologi sosial, inklusivitas finansial, dan tata kelola terdesentralisasi. Fondasi investor ini biasanya tertarik pada proyek yang tidak hanya menawarkan produk inovatif tetapi juga memberikan kontribusi positif kepada komunitas blockchain dan ekosistemnya. Dukungan dari investor ini memperkuat SPERO,$$s$ sebagai pesaing yang patut diperhitungkan di domain proyek crypto yang berkembang pesat. Bagaimana SPERO,$$s$ Bekerja? SPERO,$$s$ menerapkan kerangka kerja multi-faceted yang membedakannya dari proyek cryptocurrency konvensional. Berikut adalah beberapa fitur kunci yang menekankan keunikan dan inovasinya: Tata Kelola Terdesentralisasi: SPERO,$$s$ mengintegrasikan model tata kelola terdesentralisasi, memberdayakan pengguna untuk berpartisipasi aktif dalam proses pengambilan keputusan mengenai masa depan proyek. Pendekatan ini mendorong rasa kepemilikan dan akuntabilitas di antara anggota komunitas. Utilitas Token: SPERO,$$s$ memanfaatkan token cryptocurrency-nya sendiri, yang dirancang untuk melayani berbagai fungsi dalam ekosistem. Token ini memungkinkan transaksi, hadiah, dan fasilitasi layanan yang ditawarkan di platform, meningkatkan keterlibatan dan utilitas secara keseluruhan. Arsitektur Berlapis: Arsitektur teknis SPERO,$$s$ mendukung modularitas dan skalabilitas, memungkinkan integrasi fitur dan aplikasi tambahan secara mulus seiring dengan perkembangan proyek. Kemampuan beradaptasi ini sangat penting untuk mempertahankan relevansi di lanskap crypto yang selalu berubah. Keterlibatan Komunitas: Proyek ini menekankan inisiatif yang dipimpin komunitas, menggunakan mekanisme yang memberikan insentif untuk kolaborasi dan umpan balik. Dengan memelihara komunitas yang kuat, SPERO,$$s$ dapat lebih baik memenuhi kebutuhan pengguna dan beradaptasi dengan tren pasar. Fokus pada Inklusi: Dengan menawarkan biaya transaksi yang rendah dan antarmuka yang ramah pengguna, SPERO,$$s$ bertujuan untuk menarik basis pengguna yang beragam, termasuk individu yang mungkin sebelumnya tidak terlibat dalam ruang crypto. Komitmen ini terhadap inklusi sejalan dengan misi utamanya untuk memberdayakan melalui aksesibilitas. Garis Waktu SPERO,$$s$ Memahami sejarah proyek memberikan wawasan penting tentang trajektori dan tonggak perkembangannya. Berikut adalah garis waktu yang disarankan yang memetakan peristiwa signifikan dalam evolusi SPERO,$$s$: Fase Konseptualisasi dan Ideasi: Ide awal yang membentuk dasar SPERO,$$s$ dikembangkan, sangat selaras dengan prinsip desentralisasi dan fokus komunitas dalam industri blockchain. Peluncuran Whitepaper Proyek: Setelah fase konseptual, whitepaper komprehensif yang merinci visi, tujuan, dan infrastruktur teknologi SPERO,$$s$ dirilis untuk menarik minat dan umpan balik komunitas. Pembangunan Komunitas dan Keterlibatan Awal: Upaya jangkauan aktif dilakukan untuk membangun komunitas pengguna awal dan investor potensial, memfasilitasi diskusi seputar tujuan proyek dan mendapatkan dukungan. Acara Generasi Token: SPERO,$$s$ melakukan acara generasi token (TGE) untuk mendistribusikan token asli kepada pendukung awal dan membangun likuiditas awal dalam ekosistem. Peluncuran dApp Awal: Aplikasi terdesentralisasi (dApp) pertama yang terkait dengan SPERO,$$s$ diluncurkan, memungkinkan pengguna untuk terlibat dengan fungsionalitas inti platform. Pengembangan Berkelanjutan dan Kemitraan: Pembaruan dan peningkatan berkelanjutan terhadap penawaran proyek, termasuk kemitraan strategis dengan pemain lain di ruang blockchain, telah membentuk SPERO,$$s$ menjadi pemain yang kompetitif dan berkembang di pasar crypto. Kesimpulan SPERO,$$s$ berdiri sebagai bukti potensi web3 dan cryptocurrency untuk merevolusi sistem keuangan dan memberdayakan individu. Dengan komitmen terhadap tata kelola terdesentralisasi, keterlibatan komunitas, dan fungsionalitas yang dirancang secara inovatif, ia membuka jalan menuju lanskap keuangan yang lebih inklusif. Seperti halnya investasi di ruang crypto yang berkembang pesat, calon investor dan pengguna dianjurkan untuk melakukan riset secara menyeluruh dan terlibat dengan perkembangan yang sedang berlangsung dalam SPERO,$$s$. Proyek ini menunjukkan semangat inovatif industri crypto, mengundang eksplorasi lebih lanjut ke dalam berbagai kemungkinan yang ada. Meskipun perjalanan SPERO,$$s$ masih berlangsung, prinsip-prinsip dasarnya mungkin benar-benar mempengaruhi masa depan cara kita berinteraksi dengan teknologi, keuangan, dan satu sama lain dalam ekosistem digital yang saling terhubung.

96 Total TayanganDipublikasikan pada 2024.12.17Diperbarui pada 2024.12.17

Apa Itu $S$

Apa Itu AGENT S

Agent S: Masa Depan Interaksi Otonom di Web3 Pendahuluan Dalam lanskap Web3 dan cryptocurrency yang terus berkembang, inovasi secara konstan mendefinisikan ulang cara individu berinteraksi dengan platform digital. Salah satu proyek perintis, Agent S, menjanjikan untuk merevolusi interaksi manusia-komputer melalui kerangka agen terbuka. Dengan membuka jalan untuk interaksi otonom, Agent S bertujuan untuk menyederhanakan tugas-tugas kompleks, menawarkan aplikasi transformasional dalam kecerdasan buatan (AI). Eksplorasi mendetail ini akan menyelami seluk-beluk proyek, fitur uniknya, dan implikasinya untuk domain cryptocurrency. Apa itu Agent S? Agent S berdiri sebagai kerangka agen terbuka yang inovatif, dirancang khusus untuk mengatasi tiga tantangan mendasar dalam otomatisasi tugas komputer: Memperoleh Pengetahuan Spesifik Domain: Kerangka ini secara cerdas belajar dari berbagai sumber pengetahuan eksternal dan pengalaman internal. Pendekatan ganda ini memberdayakannya untuk membangun repositori pengetahuan spesifik domain yang kaya, meningkatkan kinerjanya dalam pelaksanaan tugas. Perencanaan Selama Rentang Tugas yang Panjang: Agent S menggunakan perencanaan hierarkis yang ditingkatkan pengalaman, pendekatan strategis yang memfasilitasi pemecahan dan pelaksanaan tugas-tugas rumit dengan efisien. Fitur ini secara signifikan meningkatkan kemampuannya untuk mengelola beberapa subtugas dengan efisien dan efektif. Menangani Antarmuka Dinamis dan Tidak Seragam: Proyek ini memperkenalkan Antarmuka Agen-Komputer (ACI), solusi inovatif yang meningkatkan interaksi antara agen dan pengguna. Dengan memanfaatkan Model Bahasa Besar Multimodal (MLLM), Agent S dapat menavigasi dan memanipulasi berbagai antarmuka pengguna grafis dengan mulus. Melalui fitur-fitur perintis ini, Agent S menyediakan kerangka kerja yang kuat yang mengatasi kompleksitas yang terlibat dalam mengotomatisasi interaksi manusia dengan mesin, membuka jalan untuk berbagai aplikasi dalam AI dan seterusnya. Siapa Pencipta Agent S? Meskipun konsep Agent S secara fundamental inovatif, informasi spesifik tentang penciptanya tetap samar. Pencipta saat ini tidak diketahui, yang menyoroti baik tahap awal proyek atau pilihan strategis untuk menjaga anggota pendiri tetap tersembunyi. Terlepas dari anonimitas, fokus tetap pada kemampuan dan potensi kerangka kerja. Siapa Investor Agent S? Karena Agent S relatif baru dalam ekosistem kriptografi, informasi terperinci mengenai investor dan pendukung keuangannya tidak secara eksplisit didokumentasikan. Kurangnya wawasan yang tersedia untuk umum mengenai fondasi investasi atau organisasi yang mendukung proyek ini menimbulkan pertanyaan tentang struktur pendanaannya dan peta jalan pengembangannya. Memahami dukungan sangat penting untuk mengukur keberlanjutan proyek dan potensi dampak pasar. Bagaimana Cara Kerja Agent S? Di inti Agent S terletak teknologi mutakhir yang memungkinkannya berfungsi secara efektif dalam berbagai pengaturan. Model operasionalnya dibangun di sekitar beberapa fitur kunci: Interaksi Komputer yang Mirip Manusia: Kerangka ini menawarkan perencanaan AI yang canggih, berusaha untuk membuat interaksi dengan komputer lebih intuitif. Dengan meniru perilaku manusia dalam pelaksanaan tugas, ia menjanjikan untuk meningkatkan pengalaman pengguna. Memori Naratif: Digunakan untuk memanfaatkan pengalaman tingkat tinggi, Agent S memanfaatkan memori naratif untuk melacak sejarah tugas, sehingga meningkatkan proses pengambilan keputusannya. Memori Episodik: Fitur ini memberikan panduan langkah demi langkah kepada pengguna, memungkinkan kerangka untuk menawarkan dukungan kontekstual saat tugas berlangsung. Dukungan untuk OpenACI: Dengan kemampuan untuk berjalan secara lokal, Agent S memungkinkan pengguna untuk mempertahankan kontrol atas interaksi dan alur kerja mereka, sejalan dengan etos terdesentralisasi Web3. Integrasi Mudah dengan API Eksternal: Versatilitas dan kompatibilitasnya dengan berbagai platform AI memastikan bahwa Agent S dapat dengan mulus masuk ke dalam ekosistem teknologi yang ada, menjadikannya pilihan menarik bagi pengembang dan organisasi. Fungsionalitas ini secara kolektif berkontribusi pada posisi unik Agent S dalam ruang kripto, saat ia mengotomatisasi tugas-tugas kompleks yang melibatkan banyak langkah dengan intervensi manusia yang minimal. Seiring proyek ini berkembang, aplikasi potensialnya di Web3 dapat mendefinisikan ulang bagaimana interaksi digital berlangsung. Garis Waktu Agent S Pengembangan dan tonggak Agent S dapat dirangkum dalam garis waktu yang menyoroti peristiwa pentingnya: 27 September 2024: Konsep Agent S diluncurkan dalam sebuah makalah penelitian komprehensif berjudul “Sebuah Kerangka Agen Terbuka yang Menggunakan Komputer Seperti Manusia,” yang menunjukkan dasar untuk proyek ini. 10 Oktober 2024: Makalah penelitian tersebut dipublikasikan secara terbuka di arXiv, menawarkan eksplorasi mendalam tentang kerangka kerja dan evaluasi kinerjanya berdasarkan tolok ukur OSWorld. 12 Oktober 2024: Sebuah presentasi video dirilis, memberikan wawasan visual tentang kemampuan dan fitur Agent S, lebih lanjut melibatkan pengguna dan investor potensial. Tanda-tanda dalam garis waktu ini tidak hanya menggambarkan kemajuan Agent S tetapi juga menunjukkan komitmennya terhadap transparansi dan keterlibatan komunitas. Poin Kunci Tentang Agent S Seiring kerangka Agent S terus berkembang, beberapa atribut kunci menonjol, menekankan sifat inovatif dan potensinya: Kerangka Inovatif: Dirancang untuk memberikan penggunaan komputer yang intuitif seperti interaksi manusia, Agent S membawa pendekatan baru untuk otomatisasi tugas. Interaksi Otonom: Kemampuan untuk berinteraksi secara otonom dengan komputer melalui GUI menandakan lompatan menuju solusi komputasi yang lebih cerdas dan efisien. Otomatisasi Tugas Kompleks: Dengan metodologinya yang kuat, ia dapat mengotomatisasi tugas-tugas kompleks yang melibatkan banyak langkah, membuat proses lebih cepat dan kurang rentan terhadap kesalahan. Perbaikan Berkelanjutan: Mekanisme pembelajaran memungkinkan Agent S untuk belajar dari pengalaman masa lalu, terus meningkatkan kinerja dan efektivitasnya. Versatilitas: Adaptabilitasnya di berbagai lingkungan operasi seperti OSWorld dan WindowsAgentArena memastikan bahwa ia dapat melayani berbagai aplikasi. Saat Agent S memposisikan dirinya di lanskap Web3 dan kripto, potensinya untuk meningkatkan kemampuan interaksi dan mengotomatisasi proses menandakan kemajuan signifikan dalam teknologi AI. Melalui kerangka inovatifnya, Agent S mencerminkan masa depan interaksi digital, menjanjikan pengalaman yang lebih mulus dan efisien bagi pengguna di berbagai industri. Kesimpulan Agent S mewakili lompatan berani ke depan dalam pernikahan AI dan Web3, dengan kapasitas untuk mendefinisikan ulang cara kita berinteraksi dengan teknologi. Meskipun masih dalam tahap awal, kemungkinan aplikasinya sangat luas dan menarik. Melalui kerangka komprehensifnya yang mengatasi tantangan kritis, Agent S bertujuan untuk membawa interaksi otonom ke garis depan pengalaman digital. Saat kita melangkah lebih dalam ke dalam ranah cryptocurrency dan desentralisasi, proyek-proyek seperti Agent S pasti akan memainkan peran penting dalam membentuk masa depan teknologi dan kolaborasi manusia-komputer.

944 Total TayanganDipublikasikan pada 2025.01.14Diperbarui pada 2025.01.14

Apa Itu AGENT S

Cara Membeli S

Selamat datang di HTX.com! Kami telah membuat pembelian Sonic (S) menjadi mudah dan nyaman. Ikuti panduan langkah demi langkah kami untuk memulai perjalanan kripto Anda.Langkah 1: Buat Akun HTX AndaGunakan alamat email atau nomor ponsel Anda untuk mendaftar akun gratis di HTX. Rasakan perjalanan pendaftaran yang mudah dan buka semua fitur.Dapatkan Akun SayaLangkah 2: Buka Beli Kripto, lalu Pilih Metode Pembayaran AndaKartu Kredit/Debit: Gunakan Visa atau Mastercard Anda untuk membeli Sonic (S) secara instan.Saldo: Gunakan dana dari saldo akun HTX Anda untuk melakukan trading dengan lancar.Pihak Ketiga: Kami telah menambahkan metode pembayaran populer seperti Google Pay dan Apple Pay untuk meningkatkan kenyamanan.P2P: Lakukan trading langsung dengan pengguna lain di HTX.Over-the-Counter (OTC): Kami menawarkan layanan yang dibuat khusus dan kurs yang kompetitif bagi para trader.Langkah 3: Simpan Sonic (S) AndaSetelah melakukan pembelian, simpan Sonic (S) di akun HTX Anda. Selain itu, Anda dapat mengirimkannya ke tempat lain melalui transfer blockchain atau menggunakannya untuk memperdagangkan mata uang kripto lainnya.Langkah 4: Lakukan trading Sonic (S)Lakukan trading Sonic (S) dengan mudah di pasar spot HTX. Cukup akses akun Anda, pilih pasangan perdagangan, jalankan trading, lalu pantau secara real-time. Kami menawarkan pengalaman yang ramah pengguna baik untuk pemula maupun trader berpengalaman.

1.5k Total TayanganDipublikasikan pada 2025.01.15Diperbarui pada 2026.06.02

Cara Membeli S

Diskusi

Selamat datang di Komunitas HTX. Di sini, Anda bisa terus mendapatkan informasi terbaru tentang perkembangan platform terkini dan mendapatkan akses ke wawasan pasar profesional. Pendapat pengguna mengenai harga S (S) disajikan di bawah ini.

活动图片