When AI's Bottleneck Is No Longer the Model: Perseus Yang's Open Source Ecosystem Building Practices and Reflections

marsbitDipublikasikan tanggal 2026-04-13Terakhir diperbarui pada 2026-04-13

Abstrak

In 2026, the AI industry's primary bottleneck is no longer model capability but rather the encoding of domain knowledge, agent-world interfaces, and toolchain maturity. The open-source community is rapidly bridging this gap, evidenced by projects like OpenClaw and Claude Code experiencing explosive growth in their Skill ecosystems. Perseus Yang, a contributor to over a dozen AI open-source projects, argues that Skill systems are the most underestimated infrastructure of the AI agent era. They enable non-coders to program AI by writing natural language SKILL.md files, transferring power from engineers to all professionals. His project, GTM Engineer Skills, demonstrates this by automating go-to-market workflows, proving Skills can extend far beyond engineering into areas like product strategy and business analysis. He also identifies a critical blind spot: while browser automation thrives, agent operations are nearly absent from mobile apps, the world's dominant computing interface. His project, OpenPocket, is an open-source framework that allows agents to operate Android devices via ADB. It features human-in-the-loop security, agent isolation, and the ability for agents to autonomously create and save new reusable Skills. Yang believes the value of open source lies not in the code itself, but in defining the infrastructure standards during this formative period. His work validates the SKILL.md format as a portable unit for agent capability and pioneers new architectures for...

Author: Liu Jun

In 2026, a consensus is forming in the AI industry: model capability is no longer the bottleneck. The gap lies outside the model—in the encoding of domain knowledge, in the interface between agents and the real world, in the maturity of toolchains. This gap is being filled by the open-source community, and the speed exceeds everyone's expectations. OpenClaw gained 60,000 GitHub stars within 72 hours, surpassing 350,000 three months later. The Claude Code Skill ecosystem grew from 50 to over 334 Skills within half a year. Hermes Agent is even more radical, enabling agents to autonomously build reusable skills. Data from Vela Partners shows that in the past 90 days, the combined categories of personal AI assistants and Agentic Skill plugins added 244,000 new stars. This is a Skill explosion.

Perseus Yang's work sits at the heart of this explosion. With a background in Mathematics and Computer Science from Cornell, a member of the Forbes Business Council, and a THINC Fellowship recipient, he has participated in and maintained over a dozen AI-related open-source projects on GitHub in recent years, covering areas such as agent skill expansion, mobile device-level control, AI engine optimization toolchains, GEO data analysis agents, content automation workflows, and payment protocol infrastructure. His characteristic is possessing both a deep engineering background and strong product intuition. He doesn't just write code; he defines what a tool should look like based on user needs, then builds it end-to-end and drives its adoption.

Here are several core judgments he has formed during this process.

First Judgment: The Skill System is the Most Underestimated Infrastructure in the AI Agent Era

After Anthropic released Agent Skills as an open standard at the end of 2025, OpenAI's Codex CLI also adopted the same SKILL.md format. OpenClaw's ClawHub registry has accumulated over 13,000 community-contributed Skills, and the Claude Code ecosystem is quickly following suit. The significance of Skills goes far beyond "adding plugins to agents." It essentially enables people who don't know how to code to participate in AI programming. An operations personnel can write a SKILL.md in natural language, enabling an agent to learn a new workflow. This is a paradigm shift: the true power of AI depends not on the model's parameter count, but on what domain knowledge is injected into the model, and Skills extend the power to inject knowledge from engineers to everyone.

But Perseus observed a problem. The vast majority of Skills are concentrated in the engineering field—code review, front-end design, DevOps, testing. Expertise in non-engineering fields has hardly been systematically encoded into Skills. This means the coverage of the Skill ecosystem is far from reaching its potential boundary.

This observation drove a series of his open-source work in the GTM (Go-To-Market) toolchain direction. The most representative is GTM Engineer Skills, a set of Claude Code and Codex skill sets covering the complete workflow of AI engine discoverability, which has accumulated over 600 stars on GitHub. It encodes work that traditionally requires collaboration between SEO experts, content strategists, and front-end developers into an automated process executable by a single person: website AI discoverability audit, content structure optimization, keyword research, a machine-parsable layer for data visualization. The auditor doesn't output suggestions; instead, it automatically detects the front-end framework and generates code fixes that can be directly submitted as a Pull Request. Around the same direction, he also built a supporting GEO analysis tool that can simultaneously send queries to ChatGPT, Claude, Gemini, and Perplexity to analyze brand mention rates, sentiment, market share, and competitive positioning, outputting interactive HTML reports and structured data.

The actual results demonstrate the product value of this toolset. Companies like Articuler AI and Axis Robotics used GTM Engineer Skills to complete the full process from research to Resource Center setup in a few hours, whereas such work traditionally requires dozens of hours of cross-team collaboration. This efficiency gap is not achieved by model capability, but by Perseus's deep understanding and productized breakdown of the GTM workflow: he broke down a vague "improve AI discoverability" requirement into standardized stages executable step-by-step by an agent, each with clear inputs, outputs, and quality checks. This toolchain is currently adopted by over a dozen startups and several Fortune 500 companies. The open-source tool is the entry point, the commercial product is the scaled extension, and both share the same technical core.

The project itself is valuable, but Perseus believes the proposition is more important: the capability boundary of the Skill system extends far beyond the engineering field. Product strategy, go-to-market, business analysis—any expertise that can be structurally described can be encoded into agent capabilities.

Second Judgment: AI Agent's Operational Boundary Should Not Stop at Browsers and APIs

The agent discussion in 2026 is dominated by browser agents and API integrations. LangGraph, CrewAI, and Google ADK constitute a thriving multi-agent orchestration ecosystem. But Perseus noticed a structural blind spot: most global digital activity happens in native mobile apps—social, payment, gaming, communication—and these apps lack public APIs and browser equivalents. Existing frameworks cannot operate WeChat, Douyin, WhatsApp, or Alipay. Mobile is the world's dominant computing interface, but the infrastructure for native mobile agents is almost zero.

Perseus's thinking is: Why is everyone teaching AI to operate browsers, but no one is seriously teaching it to operate phones? The prosperity of browser agents is largely because the web is naturally automation-friendly, with DOM, APIs, and mature toolchains like Playwright. But the phone is a completely different world. Native apps are black boxes, without structured interface descriptions; operations can only be performed by simulating human touches and swipes. The difficulty of this problem lies not in getting the LLM to understand whether a button should be pressed, but in building the entire execution layer infrastructure from scratch: device connection management, screen state parsing, device mutex between multiple agents, security boundaries for sensitive operations.

This judgment drove the birth of OpenPocket. It is an open-source framework that uses ADB to allow LLM-driven agents to autonomously operate Android devices, currently with about a dozen contributors and over 500 commits. What users are really doing with it speaks volumes: automatically managing social media accounts, replying to messages in IMs for you, handling payments and bills on the phone, even automatically playing mobile games. A typical scenario is: the user tells the agent in natural language "Open Slack every morning at 8 am to check in," and the agent will persistently run this task in an isolated session, turning a previously manual, repetitive daily operation into background automation.

Perseus made several key product and architectural choices in this project. First, agents can automatically create new Skills during runtime. When encountering an unfamiliar operation flow, it can save the learned steps as a reusable SKILL.md for direct调用 next time. This means the agent is not a tool with fixed capabilities, but a system that grows stronger with use. Second, all sensitive operations must be approved by a human, rather than letting the agent judge what is safe. In his view, the most dangerous thing about autonomous agents is not that they do the wrong thing, but that they do the wrong thing "confidently" while thinking they are right. Third, each agent is completely isolated, bound to an independent device, configuration, and session state, allowing multiple agents to run simultaneously without interfering with each other. If only TypeScript engineers can extend the agent's capabilities, this ecosystem will never grow large, so OpenPocket, like Claude Code, uses SKILL.md as the standard format for capability extension.

The entire system supports 29+ LLM configurations. Agent phones are completely isolated from users' personal phones, and all data remains local. In 2026, with OWASP listing "Tool Misuse" among the Top 10 Risks for Agentic AI and the high-risk obligations of the EU AI Act about to take effect, this local-first, human-in-the-loop design is not conservative but a prerequisite for agents entering real-world scenarios.

Third Judgment: The Value of Open Source Lies Not in the Code Itself, But in the Definition of Standards at the Infrastructure Layer

Perseus's understanding of open source is not "putting code on GitHub." He repeatedly mentions a viewpoint: The open-source AI ecosystem in 2026 is in a window where standards have not yet solidified. The architectural patterns and interface specifications adopted by the community now will become the industry's default infrastructure in the coming years. In this window, defining a niche is more important than optimizing an existing solution.

Specifically, his Skill project pushed forward something technically meaningful: proving that the SKILL.md format is not just a container for engineering tools, but a sufficiently general standard for encoding domain knowledge. When the same SKILL.md can be loaded and executed by Claude Code, OpenAI Codex CLI, and OpenClaw, it de facto becomes the "portable capability unit" of the AI agent ecosystem. Perseus stuffed the complete workflow of go-to-market—a non-engineering field—into this format and successfully ran end-to-end automation from audit to code fix. This is a significant validation of the generality of the entire Skill standard.

His mobile agent project addresses an architectural gap at the agent execution layer. Existing agent frameworks rely on structured interfaces at the tool-calling level, either APIs or DOM. OpenPocket must operate in an environment without any structured interface, relying purely on screen pixel parsing and touch event injection. This forced the project to redesign the agent's perception-decision-execution loop from the ground up, including real-time parsing of device state, device mutex protocols for multiple agents, and automatic recovery mechanisms after operation failures. These are not simple adaptations of existing agent frameworks, but an architectural solution independently evolved for the problem of "autonomous operation in API-less environments."

The engineering design of the two projects is worth mentioning separately. OpenPocket adopts a three-layer separated architecture of Manager, Gateway, and Agent Runtime, where each layer can be iterated independently, and community contributors only need to focus on the layer they are familiar with. Each Skill within GTM Engineer Skills follows a staged pipeline design internally, where the output of the previous stage is the input of the next, with mandatory quality check gates in between. The workflow can be interrupted and resumed at any stage, and errors can be pinpointed to a specific stage. The purpose of these architectural choices is the same: to make the open-source project trustworthy for real users in production environments.

From a product perspective, these two projects also share a commonality: Perseus always places "who will use it" and "how to extend it" at the forefront of architectural decisions. The target users of GTM Engineer Skills are not engineers but growth teams, so each Skill has clear input-output contracts and built-in quality checks, allowing non-technical users to understand what the agent is doing. OpenPocket's SKILL.md extension mechanism, natural language scheduled tasks, and multi-channel access (Telegram, Discord, WhatsApp, CLI) are all designed to lower the barrier to entry for non-engineering users. In his view, if an open-source infrastructure project can only be used by engineers, its ceiling is the size of the engineering community. The truly leveraged design is to enable the boundary of agent capabilities to be expanded collectively by practitioners from all fields.

This pattern runs through his multiple projects. It's not about doing application-layer development on existing frameworks, but identifying missing components in the infrastructure layer of the agent ecosystem and then building them.

The Bigger Picture

The open-source AI ecosystem in 2026 is experiencing a moment similar to the early cloud-native ecosystem of the 2010s: standards and tools at the infrastructure layer are being defined, and these definitions will constrain the entire industry's development path for years to come. In this window, every Skill format adopted by the community, every agent architectural pattern validated, every ecosystem gap filled, is participating in shaping the next interface layer of AI.

What Perseus Yang is doing is simple: using engineering capability and product thinking to explore the paradigm at the technological frontier of the AI era. Models will continue to become more powerful, but who defines how agents should interact with the real world, who decides in what form domain knowledge should be encoded and distributed—the answers to these questions will not grow out of models. They can only be figured out bit by bit by people who build things.

Pertanyaan Terkait

QAccording to the article, what is the current bottleneck in the AI industry as of 2026?

AThe bottleneck is no longer the model capabilities themselves, but rather the gap in encoding domain knowledge, creating interfaces for agents and the real world, and the maturity of toolchains.

QWhat is the significance of the SKILL.md format, as discussed in the article?

AThe SKILL.md format is an open standard that allows non-coders to participate in AI programming. It enables anyone to define a new workflow for an AI agent using natural language, making it a portable unit of capability that can be executed across different AI platforms like Claude Code and OpenAI Codex CLI.

QWhat problem did Perseus Yang identify with the current landscape of AI agents and mobile applications?

AHe identified a structural blind spot: while most digital activity happens within native mobile apps (like WeChat, TikTok, WhatsApp, Alipay), these apps lack public APIs and are not accessible to browser-based agents. This creates a significant gap, as there is almost no infrastructure for native mobile AI agents.

QWhat are the key architectural and safety features of the OpenPocket project?

AKey features include: agents that can autonomously create new Skills from learned operations; a requirement for human approval on sensitive operations; complete isolation of each agent with its own device and session state; and a design that keeps all operations local to the device for security and privacy.

QHow does Perseus Yang view the role of open source in the current AI ecosystem?

AHe believes the value of open source lies not just in sharing code, but in defining the architectural patterns and interface standards that will become the default infrastructure for the entire industry. He focuses on identifying and building missing components at the infrastructure layer to shape how agents interact with the real world.

Bacaan Terkait

Trading

Spot
Futures

Artikel Populer

Apa Itu $S$

Memahami SPERO: Tinjauan Komprehensif Pengenalan SPERO Seiring dengan perkembangan lanskap inovasi, munculnya teknologi web3 dan proyek cryptocurrency memainkan peran penting dalam membentuk masa depan digital. Salah satu proyek yang telah menarik perhatian di bidang dinamis ini adalah SPERO, yang dilambangkan sebagai SPERO,$$s$. Artikel ini bertujuan untuk mengumpulkan dan menyajikan informasi terperinci tentang SPERO, untuk membantu para penggemar dan investor memahami dasar-dasar, tujuan, dan inovasi dalam domain web3 dan crypto. Apa itu SPERO,$$s$? SPERO,$$s$ adalah proyek unik dalam ruang crypto yang berusaha memanfaatkan prinsip desentralisasi dan teknologi blockchain untuk menciptakan ekosistem yang mendorong keterlibatan, utilitas, dan inklusi finansial. Proyek ini dirancang untuk memfasilitasi interaksi peer-to-peer dengan cara baru, memberikan pengguna solusi dan layanan keuangan yang inovatif. Pada intinya, SPERO,$$s$ bertujuan untuk memberdayakan individu dengan menyediakan alat dan platform yang meningkatkan pengalaman pengguna dalam ruang cryptocurrency. Ini termasuk memungkinkan metode transaksi yang lebih fleksibel, mendorong inisiatif yang dipimpin komunitas, dan menciptakan jalur untuk peluang finansial melalui aplikasi terdesentralisasi (dApps). Visi mendasar dari SPERO,$$s$ berputar di sekitar inklusivitas, bertujuan untuk menjembatani kesenjangan dalam keuangan tradisional sambil memanfaatkan manfaat teknologi blockchain. Siapa Pencipta SPERO,$$s$? Identitas pencipta SPERO,$$s$ tetap agak samar, karena ada sumber daya publik yang terbatas yang memberikan informasi latar belakang terperinci tentang pendiriannya. Kurangnya transparansi ini dapat berasal dari komitmen proyek terhadap desentralisasi—sebuah etos yang banyak proyek web3 bagi, memprioritaskan kontribusi kolektif di atas pengakuan individu. Dengan memusatkan diskusi di sekitar komunitas dan tujuan kolektifnya, SPERO,$$s$ mewujudkan esensi pemberdayaan tanpa menonjolkan individu tertentu. Dengan demikian, memahami etos dan misi SPERO tetap lebih penting daripada mengidentifikasi pencipta tunggal. Siapa Investor SPERO,$$s$? SPERO,$$s$ didukung oleh beragam investor mulai dari modal ventura hingga investor malaikat yang berdedikasi untuk mendorong inovasi di sektor crypto. Fokus investor ini umumnya sejalan dengan misi SPERO—memprioritaskan proyek yang menjanjikan kemajuan teknologi sosial, inklusivitas finansial, dan tata kelola terdesentralisasi. Fondasi investor ini biasanya tertarik pada proyek yang tidak hanya menawarkan produk inovatif tetapi juga memberikan kontribusi positif kepada komunitas blockchain dan ekosistemnya. Dukungan dari investor ini memperkuat SPERO,$$s$ sebagai pesaing yang patut diperhitungkan di domain proyek crypto yang berkembang pesat. Bagaimana SPERO,$$s$ Bekerja? SPERO,$$s$ menerapkan kerangka kerja multi-faceted yang membedakannya dari proyek cryptocurrency konvensional. Berikut adalah beberapa fitur kunci yang menekankan keunikan dan inovasinya: Tata Kelola Terdesentralisasi: SPERO,$$s$ mengintegrasikan model tata kelola terdesentralisasi, memberdayakan pengguna untuk berpartisipasi aktif dalam proses pengambilan keputusan mengenai masa depan proyek. Pendekatan ini mendorong rasa kepemilikan dan akuntabilitas di antara anggota komunitas. Utilitas Token: SPERO,$$s$ memanfaatkan token cryptocurrency-nya sendiri, yang dirancang untuk melayani berbagai fungsi dalam ekosistem. Token ini memungkinkan transaksi, hadiah, dan fasilitasi layanan yang ditawarkan di platform, meningkatkan keterlibatan dan utilitas secara keseluruhan. Arsitektur Berlapis: Arsitektur teknis SPERO,$$s$ mendukung modularitas dan skalabilitas, memungkinkan integrasi fitur dan aplikasi tambahan secara mulus seiring dengan perkembangan proyek. Kemampuan beradaptasi ini sangat penting untuk mempertahankan relevansi di lanskap crypto yang selalu berubah. Keterlibatan Komunitas: Proyek ini menekankan inisiatif yang dipimpin komunitas, menggunakan mekanisme yang memberikan insentif untuk kolaborasi dan umpan balik. Dengan memelihara komunitas yang kuat, SPERO,$$s$ dapat lebih baik memenuhi kebutuhan pengguna dan beradaptasi dengan tren pasar. Fokus pada Inklusi: Dengan menawarkan biaya transaksi yang rendah dan antarmuka yang ramah pengguna, SPERO,$$s$ bertujuan untuk menarik basis pengguna yang beragam, termasuk individu yang mungkin sebelumnya tidak terlibat dalam ruang crypto. Komitmen ini terhadap inklusi sejalan dengan misi utamanya untuk memberdayakan melalui aksesibilitas. Garis Waktu SPERO,$$s$ Memahami sejarah proyek memberikan wawasan penting tentang trajektori dan tonggak perkembangannya. Berikut adalah garis waktu yang disarankan yang memetakan peristiwa signifikan dalam evolusi SPERO,$$s$: Fase Konseptualisasi dan Ideasi: Ide awal yang membentuk dasar SPERO,$$s$ dikembangkan, sangat selaras dengan prinsip desentralisasi dan fokus komunitas dalam industri blockchain. Peluncuran Whitepaper Proyek: Setelah fase konseptual, whitepaper komprehensif yang merinci visi, tujuan, dan infrastruktur teknologi SPERO,$$s$ dirilis untuk menarik minat dan umpan balik komunitas. Pembangunan Komunitas dan Keterlibatan Awal: Upaya jangkauan aktif dilakukan untuk membangun komunitas pengguna awal dan investor potensial, memfasilitasi diskusi seputar tujuan proyek dan mendapatkan dukungan. Acara Generasi Token: SPERO,$$s$ melakukan acara generasi token (TGE) untuk mendistribusikan token asli kepada pendukung awal dan membangun likuiditas awal dalam ekosistem. Peluncuran dApp Awal: Aplikasi terdesentralisasi (dApp) pertama yang terkait dengan SPERO,$$s$ diluncurkan, memungkinkan pengguna untuk terlibat dengan fungsionalitas inti platform. Pengembangan Berkelanjutan dan Kemitraan: Pembaruan dan peningkatan berkelanjutan terhadap penawaran proyek, termasuk kemitraan strategis dengan pemain lain di ruang blockchain, telah membentuk SPERO,$$s$ menjadi pemain yang kompetitif dan berkembang di pasar crypto. Kesimpulan SPERO,$$s$ berdiri sebagai bukti potensi web3 dan cryptocurrency untuk merevolusi sistem keuangan dan memberdayakan individu. Dengan komitmen terhadap tata kelola terdesentralisasi, keterlibatan komunitas, dan fungsionalitas yang dirancang secara inovatif, ia membuka jalan menuju lanskap keuangan yang lebih inklusif. Seperti halnya investasi di ruang crypto yang berkembang pesat, calon investor dan pengguna dianjurkan untuk melakukan riset secara menyeluruh dan terlibat dengan perkembangan yang sedang berlangsung dalam SPERO,$$s$. Proyek ini menunjukkan semangat inovatif industri crypto, mengundang eksplorasi lebih lanjut ke dalam berbagai kemungkinan yang ada. Meskipun perjalanan SPERO,$$s$ masih berlangsung, prinsip-prinsip dasarnya mungkin benar-benar mempengaruhi masa depan cara kita berinteraksi dengan teknologi, keuangan, dan satu sama lain dalam ekosistem digital yang saling terhubung.

75 Total TayanganDipublikasikan pada 2024.12.17Diperbarui pada 2024.12.17

Apa Itu $S$

Apa Itu AGENT S

Agent S: Masa Depan Interaksi Otonom di Web3 Pendahuluan Dalam lanskap Web3 dan cryptocurrency yang terus berkembang, inovasi secara konstan mendefinisikan ulang cara individu berinteraksi dengan platform digital. Salah satu proyek perintis, Agent S, menjanjikan untuk merevolusi interaksi manusia-komputer melalui kerangka agen terbuka. Dengan membuka jalan untuk interaksi otonom, Agent S bertujuan untuk menyederhanakan tugas-tugas kompleks, menawarkan aplikasi transformasional dalam kecerdasan buatan (AI). Eksplorasi mendetail ini akan menyelami seluk-beluk proyek, fitur uniknya, dan implikasinya untuk domain cryptocurrency. Apa itu Agent S? Agent S berdiri sebagai kerangka agen terbuka yang inovatif, dirancang khusus untuk mengatasi tiga tantangan mendasar dalam otomatisasi tugas komputer: Memperoleh Pengetahuan Spesifik Domain: Kerangka ini secara cerdas belajar dari berbagai sumber pengetahuan eksternal dan pengalaman internal. Pendekatan ganda ini memberdayakannya untuk membangun repositori pengetahuan spesifik domain yang kaya, meningkatkan kinerjanya dalam pelaksanaan tugas. Perencanaan Selama Rentang Tugas yang Panjang: Agent S menggunakan perencanaan hierarkis yang ditingkatkan pengalaman, pendekatan strategis yang memfasilitasi pemecahan dan pelaksanaan tugas-tugas rumit dengan efisien. Fitur ini secara signifikan meningkatkan kemampuannya untuk mengelola beberapa subtugas dengan efisien dan efektif. Menangani Antarmuka Dinamis dan Tidak Seragam: Proyek ini memperkenalkan Antarmuka Agen-Komputer (ACI), solusi inovatif yang meningkatkan interaksi antara agen dan pengguna. Dengan memanfaatkan Model Bahasa Besar Multimodal (MLLM), Agent S dapat menavigasi dan memanipulasi berbagai antarmuka pengguna grafis dengan mulus. Melalui fitur-fitur perintis ini, Agent S menyediakan kerangka kerja yang kuat yang mengatasi kompleksitas yang terlibat dalam mengotomatisasi interaksi manusia dengan mesin, membuka jalan untuk berbagai aplikasi dalam AI dan seterusnya. Siapa Pencipta Agent S? Meskipun konsep Agent S secara fundamental inovatif, informasi spesifik tentang penciptanya tetap samar. Pencipta saat ini tidak diketahui, yang menyoroti baik tahap awal proyek atau pilihan strategis untuk menjaga anggota pendiri tetap tersembunyi. Terlepas dari anonimitas, fokus tetap pada kemampuan dan potensi kerangka kerja. Siapa Investor Agent S? Karena Agent S relatif baru dalam ekosistem kriptografi, informasi terperinci mengenai investor dan pendukung keuangannya tidak secara eksplisit didokumentasikan. Kurangnya wawasan yang tersedia untuk umum mengenai fondasi investasi atau organisasi yang mendukung proyek ini menimbulkan pertanyaan tentang struktur pendanaannya dan peta jalan pengembangannya. Memahami dukungan sangat penting untuk mengukur keberlanjutan proyek dan potensi dampak pasar. Bagaimana Cara Kerja Agent S? Di inti Agent S terletak teknologi mutakhir yang memungkinkannya berfungsi secara efektif dalam berbagai pengaturan. Model operasionalnya dibangun di sekitar beberapa fitur kunci: Interaksi Komputer yang Mirip Manusia: Kerangka ini menawarkan perencanaan AI yang canggih, berusaha untuk membuat interaksi dengan komputer lebih intuitif. Dengan meniru perilaku manusia dalam pelaksanaan tugas, ia menjanjikan untuk meningkatkan pengalaman pengguna. Memori Naratif: Digunakan untuk memanfaatkan pengalaman tingkat tinggi, Agent S memanfaatkan memori naratif untuk melacak sejarah tugas, sehingga meningkatkan proses pengambilan keputusannya. Memori Episodik: Fitur ini memberikan panduan langkah demi langkah kepada pengguna, memungkinkan kerangka untuk menawarkan dukungan kontekstual saat tugas berlangsung. Dukungan untuk OpenACI: Dengan kemampuan untuk berjalan secara lokal, Agent S memungkinkan pengguna untuk mempertahankan kontrol atas interaksi dan alur kerja mereka, sejalan dengan etos terdesentralisasi Web3. Integrasi Mudah dengan API Eksternal: Versatilitas dan kompatibilitasnya dengan berbagai platform AI memastikan bahwa Agent S dapat dengan mulus masuk ke dalam ekosistem teknologi yang ada, menjadikannya pilihan menarik bagi pengembang dan organisasi. Fungsionalitas ini secara kolektif berkontribusi pada posisi unik Agent S dalam ruang kripto, saat ia mengotomatisasi tugas-tugas kompleks yang melibatkan banyak langkah dengan intervensi manusia yang minimal. Seiring proyek ini berkembang, aplikasi potensialnya di Web3 dapat mendefinisikan ulang bagaimana interaksi digital berlangsung. Garis Waktu Agent S Pengembangan dan tonggak Agent S dapat dirangkum dalam garis waktu yang menyoroti peristiwa pentingnya: 27 September 2024: Konsep Agent S diluncurkan dalam sebuah makalah penelitian komprehensif berjudul “Sebuah Kerangka Agen Terbuka yang Menggunakan Komputer Seperti Manusia,” yang menunjukkan dasar untuk proyek ini. 10 Oktober 2024: Makalah penelitian tersebut dipublikasikan secara terbuka di arXiv, menawarkan eksplorasi mendalam tentang kerangka kerja dan evaluasi kinerjanya berdasarkan tolok ukur OSWorld. 12 Oktober 2024: Sebuah presentasi video dirilis, memberikan wawasan visual tentang kemampuan dan fitur Agent S, lebih lanjut melibatkan pengguna dan investor potensial. Tanda-tanda dalam garis waktu ini tidak hanya menggambarkan kemajuan Agent S tetapi juga menunjukkan komitmennya terhadap transparansi dan keterlibatan komunitas. Poin Kunci Tentang Agent S Seiring kerangka Agent S terus berkembang, beberapa atribut kunci menonjol, menekankan sifat inovatif dan potensinya: Kerangka Inovatif: Dirancang untuk memberikan penggunaan komputer yang intuitif seperti interaksi manusia, Agent S membawa pendekatan baru untuk otomatisasi tugas. Interaksi Otonom: Kemampuan untuk berinteraksi secara otonom dengan komputer melalui GUI menandakan lompatan menuju solusi komputasi yang lebih cerdas dan efisien. Otomatisasi Tugas Kompleks: Dengan metodologinya yang kuat, ia dapat mengotomatisasi tugas-tugas kompleks yang melibatkan banyak langkah, membuat proses lebih cepat dan kurang rentan terhadap kesalahan. Perbaikan Berkelanjutan: Mekanisme pembelajaran memungkinkan Agent S untuk belajar dari pengalaman masa lalu, terus meningkatkan kinerja dan efektivitasnya. Versatilitas: Adaptabilitasnya di berbagai lingkungan operasi seperti OSWorld dan WindowsAgentArena memastikan bahwa ia dapat melayani berbagai aplikasi. Saat Agent S memposisikan dirinya di lanskap Web3 dan kripto, potensinya untuk meningkatkan kemampuan interaksi dan mengotomatisasi proses menandakan kemajuan signifikan dalam teknologi AI. Melalui kerangka inovatifnya, Agent S mencerminkan masa depan interaksi digital, menjanjikan pengalaman yang lebih mulus dan efisien bagi pengguna di berbagai industri. Kesimpulan Agent S mewakili lompatan berani ke depan dalam pernikahan AI dan Web3, dengan kapasitas untuk mendefinisikan ulang cara kita berinteraksi dengan teknologi. Meskipun masih dalam tahap awal, kemungkinan aplikasinya sangat luas dan menarik. Melalui kerangka komprehensifnya yang mengatasi tantangan kritis, Agent S bertujuan untuk membawa interaksi otonom ke garis depan pengalaman digital. Saat kita melangkah lebih dalam ke dalam ranah cryptocurrency dan desentralisasi, proyek-proyek seperti Agent S pasti akan memainkan peran penting dalam membentuk masa depan teknologi dan kolaborasi manusia-komputer.

751 Total TayanganDipublikasikan pada 2025.01.14Diperbarui pada 2025.01.14

Apa Itu AGENT S

Cara Membeli S

Selamat datang di HTX.com! Kami telah membuat pembelian Sonic (S) menjadi mudah dan nyaman. Ikuti panduan langkah demi langkah kami untuk memulai perjalanan kripto Anda.Langkah 1: Buat Akun HTX AndaGunakan alamat email atau nomor ponsel Anda untuk mendaftar akun gratis di HTX. Rasakan perjalanan pendaftaran yang mudah dan buka semua fitur.Dapatkan Akun SayaLangkah 2: Buka Beli Kripto, lalu Pilih Metode Pembayaran AndaKartu Kredit/Debit: Gunakan Visa atau Mastercard Anda untuk membeli Sonic (S) secara instan.Saldo: Gunakan dana dari saldo akun HTX Anda untuk melakukan trading dengan lancar.Pihak Ketiga: Kami telah menambahkan metode pembayaran populer seperti Google Pay dan Apple Pay untuk meningkatkan kenyamanan.P2P: Lakukan trading langsung dengan pengguna lain di HTX.Over-the-Counter (OTC): Kami menawarkan layanan yang dibuat khusus dan kurs yang kompetitif bagi para trader.Langkah 3: Simpan Sonic (S) AndaSetelah melakukan pembelian, simpan Sonic (S) di akun HTX Anda. Selain itu, Anda dapat mengirimkannya ke tempat lain melalui transfer blockchain atau menggunakannya untuk memperdagangkan mata uang kripto lainnya.Langkah 4: Lakukan trading Sonic (S)Lakukan trading Sonic (S) dengan mudah di pasar spot HTX. Cukup akses akun Anda, pilih pasangan perdagangan, jalankan trading, lalu pantau secara real-time. Kami menawarkan pengalaman yang ramah pengguna baik untuk pemula maupun trader berpengalaman.

1.1k Total TayanganDipublikasikan pada 2025.01.15Diperbarui pada 2025.03.21

Cara Membeli S

Diskusi

Selamat datang di Komunitas HTX. Di sini, Anda bisa terus mendapatkan informasi terbaru tentang perkembangan platform terkini dan mendapatkan akses ke wawasan pasar profesional. Pendapat pengguna mengenai harga S (S) disajikan di bawah ini.

活动图片