I vibe-coded an Android app using Google

marsbitDipublikasikan tanggal 2026-05-23Terakhir diperbarui pada 2026-05-23

Abstrak

In a hands-on experience, Google AI Studio's new "prompt to phone" feature allows users to generate functional Android apps using natural language prompts. The author created three apps in one afternoon: a text-based adventure game called MOOD, a calorie counter, and a Super Mario-style game featuring Peach. The process involved describing the app concept, letting Gemini AI generate the code and interface, and then installing it directly onto a connected phone. While the apps were generated and installed quickly, their quality varied significantly. The text adventure was simplistic and buggy, the calorie counter provided inaccurate data due to flawed logic, and the platformer was prone to crashes. The AI could efficiently fix specific, identifiable bugs through follow-up prompts. However, the experience highlighted that while AI can rapidly prototype "working" software, creating reliable, accurate, and polished applications still requires human oversight, judgment, and iteration. The tool dramatically lowers the barrier to entry for personal software creation but doesn't yet replace the need for developer expertise in the final stages of quality and refinement.

Editor's Note: Google AI Studio is bringing AI programming to a more intuitive stage: users are no longer just having models 'write code', but can directly generate an Android application using natural language and install it on a real phone within minutes. From entering a prompt in the browser, to Gemini automatically generating code, designing interfaces, fixing bugs, to the app appearing on the device, the barrier to software development is being lowered even further.

The Verge author Sean Hollister recently experienced the 'prompt to phone' capability of Google AI Studio. He created three apps in one afternoon, including a text adventure game, a calorie calculator, and a Mario-like mini-game, with almost no need to write code himself, and some bugs could be quickly fixed by continuing the conversation. This experience shows that AI programming tools are moving from development environments closer to consumer-facing scenarios for ordinary users.

This is also the most imaginative aspect of the 'personal software revolution.' In the past, ordinary users could only wait for developers to create general products; now, they might be able to generate a fitness tracker, calorie calculator, or even a simple game on the fly according to their specific needs. For Google, this isn't just a demonstration of AI programming capability; it could also be a new entry point for Gemini into the mobile ecosystem, developer community, and subscription revenue.

However, this experience also illustrates that AI-generated applications still have a significant gap to truly mature. It can quickly produce a 'working' program but not necessarily a reliable, accurate, or user-friendly product: game narratives are crude, mechanics are thin, calorie data can be severely miscalculated, and the Mario-like mini-game even crashes repeatedly. More complex issues also include copyright boundaries, data sources, product judgment, and long-term maintenance capabilities.

What's truly worth paying attention to is not whether AI can already replace developers, but that the starting point of software production is changing. Google has proven that it's becoming a reality for ordinary people to create mobile apps using prompts; but from 'generating an app' to 'making a good app,' human professional experience, aesthetic judgment, and continuous iteration are still required in between. AI can significantly accelerate development speed, but the final mile of software quality can't be handed off—at least not yet.

Here is the original article:

Yesterday, I made my first Android app. Then, I made two more—three apps in one afternoon.

For one of the apps, I essentially just typed 148 English words into a web browser and then walked away. Ten minutes later, a brand new, complete app had appeared on my real Android phone. Of course, I did need to prepare the phone beforehand: enable USB debugging mode and connect it to my computer. But aside from that, as Google advertised, AI Studio did almost all the work for me.

I typed, clicked install, and then—voilà—a fully functioning program appeared. At that moment, I was almost ready to agree with David, Allison, and Jen's assessment: the personal software revolution has arrived, and it's entering your phone. In the future, even without programming skills, ordinary people might be able to get complex smart home device systems truly up and running.

Then, I started actually using these three apps: a calorie counter and two games. It turned out, they didn't perform very well. And just as I was beginning to enjoy iterating and trying to improve them, AI Studio reminded me that I had reached my daily usage limit. Next, I would either have to pay or wait for the quota to reset.

So, friction still exists. But there's no denying what an individual can accomplish nowadays is quite astonishing. That same morning, my colleague Stevie Bonifield also made a personal fitness tracker app, and he thought it was good enough to actually use. Faced with Gemini's pop-up prompt to upgrade to a paid plan, my first instinct was actually: 'Should I pay for a few months first?' That's not a reaction I would have expected myself to have towards a Google product.

How Google's AI Studio Builds an Android App

On Tuesday, when Google showed off using AI to write a game similar to Doom, we joked that I should make a game called MOOD. It would be a text adventure game like Doom, with MOOD standing for 'Modern Online Oratory Dungeon.'

Just this information was enough for Google to get to work. After I typed into AI Studio: 'Help me make a Doom-style text adventure game called MOOD, with MOOD standing for Modern Online Oratory Dungeon,' Gemini started automatically supplementing more ideas, trying to expand on my concept. It first typed a sentence: 'The game should feature procedurally generated levels and challenging turn-based combat.'

I didn't want randomly generated levels that were completely different each time—I wanted a classic text adventure where players explore a designed, real map structure. Turn-based combat, though, was acceptable. Maybe the game could also have AI help me auto-generate the map?

Then, Gemini suggested more settings like 'secrets hidden in rooms' and 'a satisfying progression system.' Most of the time, I just nodded along with its ideas.

Before I let it start writing code, the final prompt was this:

Next, it officially went on a full sprint. My colleague Jake pointed out that unlike Claude Code, Gemini doesn't make a plan first and then ask if you want to proceed. It automatically pushes forward—though you can check the code it writes at any time if you want.

One minute later, it had already generated five design prototypes for me:

Twenty minutes later, I pressed the 'Install' button, transferring the game to a Pixel 9 phone.

Unsurprisingly, the writing was terrible. There were also no demons to be seen anywhere. The entire dungeon had only 11 rooms, and players could 'beat' it just by repeatedly mashing the attack button—in under a minute if played seriously. At least now it could; before that, Gemini had to help me fix two critical bugs that made the game unplayable.

Here's MOOD in action:

It wasn't a huge surprise to discover that Gemini's promised 'engaging narrative with branching dialogue options and multiple endings' eventually condensed into a simple branch at the very end of the game: I could defeat the 'Core Orator'—an AI that somehow turns internet anger into corporate profits—by attacking it, fusing with it, or entering a backdoor password.

Furthermore, the game actively exposed all the promised 'secrets' directly to the player: it made them into glowing buttons, and players didn't even need to type any text. When you encounter a glowing treasure chest, the game tries incredibly hard to remind you it's actually a Mimic—the classic Dungeons & Dragons monster that disguises itself as a treasure chest.

It not only explicitly warns you to 'check the chest at your own risk,' but even labels it as an enemy and doesn't let me leave, because the system prompts: 'A hostile ‘Clickbait Mimic’ is blocking the path!'

Speaking of which, MOOD will even tell you the backdoor password needed to unlock the hidden ending when you need it.

However, the bug-fixing process could be surprisingly smooth, provided it was a bug Gemini could correctly identify. When I told it the game got stuck when talking to 'The Whistleblower' because the button to end the conversation was missing, it immediately generated a new version of the app. I pressed 'Install,' the app on my phone restarted automatically, and upon re-entering the game, I found myself right where I left off—only this time, the button I needed was there.

My other apps probably needed more polishing. The calorie counter's best method for determining a food's calories turned out to be calling the paid Gemini API, which I don't have a key for. When I asked it to search for information from other databases instead, I discovered that its estimates for many foods were severely low.

However, when I told Gemini that a 16-ounce boba milk tea couldn't possibly be only 190 calories, it did seem to find that basic mistake in its own code. It previously thought 'milk' was enough to match 'boba milk tea,' and worse, it chose low-calorie 1% milk as the basis for the estimate. Gemini claimed it would now perform more reliable matching.

But even so, my 3-ounce serving of Taiwanese popcorn chicken was just calculated as 140 calories, and I'm pretty sure the real number is at least double that. So, this app clearly needed more work.

Finally, and least importantly, I felt I needed to test: whether Google still allows users to make those terrible Nintendo knock-off games, like my colleague Jay Peters did earlier this year with Project Genie; or whether Google had learned its lesson.

With deep shame, I present to you—Super Peach Rescue:

This is an utterly terrible program. Princess Peach was rendered as some kind of terrifying, one-eyed floating alien, and the game would instantly crash—every single time—if she dared touch any of the power-up blocks. So far, Gemini hasn't been able to figure out why.

Also, the second pipe in the game is completely impassable because Princess Peach simply can't jump that high.

Nevertheless, Gemini didn't hesitate when generating such a game. My request was: 'Make a working Super Mario game where I play as Princess Peach rescuing Mario, with all the elements of a traditional Mario side-scroller.' In a sense, it did.

It even proactively suggested that I could 'give Peach a series of classic Mario power-ups like Super Mushroom, Fire Flower, and Starman.' It also labeled the control scheme as 'NES System.' I think I'll delete this game.

At least, among the two games I made via vibe coding, one was playable from the start and required almost no effort on my part—unless you count the psychological trauma of thinking about how many game developers are now unemployed.

To be clear: I'm actually glad the games I vibe-coded turned out so poor. For a completely free, personally-tailored calorie counter, I might still be able to defend myself: after all, no one would make such a tool just for me. But when it comes to games, I'd rather spend my time supporting actual human creators.

Pertanyaan Terkait

QWhat is the core capability demonstrated by Google AI Studio in this article, and what did the author create with it?

AThe article demonstrates Google AI Studio's ability to generate functional Android applications directly from natural language prompts, a process the author refers to as 'vibe coding.' Using this, the author created three applications: a text-based adventure game called 'MOOD,' a calorie counter, and a poorly functioning Super Mario-style game where Princess Peach rescues Mario.

QWhat are some of the main advantages and significant drawbacks of using AI to generate applications as described in the experience?

AAdvantages include drastically lowering the barrier to software creation, allowing non-coders to quickly generate apps tailored to personal needs, and a remarkably smooth bug-fixing process for issues the AI can identify. Major drawbacks are that the generated apps are often unreliable, inaccurate, or have poor quality: the games had thin narratives and mechanics, the calorie counter gave severely low estimates, and the Mario clone crashed frequently. Complex issues like copyright, data sourcing, and long-term maintenance also remain unresolved.

QDescribe the process of creating and installing the 'MOOD' game. What were some of its shortcomings?

AThe author entered a 148-word prompt into Google AI Studio. Gemini expanded on the idea and, without needing prior planning confirmation, generated code and multiple UI prototypes. About 20 minutes later, the author pressed 'Install' to transfer the APK to a connected Pixel 9 phone. The game's shortcomings included terrible writing, only 11 rooms, simplistic combat (just spamming an attack button to win), a lack of demons as suggested by the 'Doom-like' prompt, and a poorly implemented narrative that directly revealed all secrets and gave away puzzle solutions.

QHow did the AI handle bug fixes during the app creation process, according to the author's experience?

AThe bug-fixing process was described as surprisingly smooth for issues the AI could correctly diagnose. For example, when the 'MOOD' game got stuck because a dialog exit button was missing, the author reported the issue. Gemini then generated a new version of the app. After installation, the app restarted on the phone, and the author resumed play from the same point—but with the necessary button now present.

QWhat broader implications does the author suggest this 'personal software revolution' might have, while also highlighting its current limitations?

AThe author suggests this could enable a 'personal software revolution' where individuals can generate apps for specific, niche needs (like a custom fitness tracker or calorie counter) without waiting for developers. For Google, it represents a potential new entry point into mobile, developer ecosystems, and subscription revenue via Gemini. However, the key limitation is the gap between 'generating an app' and 'making a good app.' The author concludes that while AI can accelerate the starting point of development, the 'last mile' of software quality—requiring human expertise, aesthetic judgment, and iteration—cannot yet be handed off to AI.

Bacaan Terkait

Pemimpin Model Besar Shanghai, Mulai Proses IPO di Bursa A

MiniMax, perusahaan AI model besar terkemuka asal Shanghai, telah mengajukan laporan persiapan penawaran saham perdana (IPO) ke regulator pasar modal China pada 29 Mei, dengan target listing di pasar saham A. Perusahaan ini akan bersaing dengan Zhipu AI untuk menjadi perusahaan model besar pertama yang melantai di A. MiniMax, yang didirikan pada Januari 2022, telah menyelesaikan IPO di Bursa Hong Kong pada Januari tahun ini. Harga sahamnya melonjak lebih dari 400% sejak IPO, dengan kapitalisasi pasar mencapai sekitar HK$2,63 triliun (sekitar RMB 227,5 miliar). Kinerja keuangan yang kuat mendukung kenaikan ini. Pendapatan tahunan berulang (ARR) perusahaan tumbuh lebih dari 100% dalam dua bulan terakhir, diperkirakan melebihi $300 juta. Pada 2025, pendapatan total MiniMax mencapai $79,038 juta, dengan gross margin meningkat menjadi 25,4%. Di sisi produk, MiniMax telah meluncurkan serangkaian model bahasa besar andalan (M2.5, M2.6, M2.7) dan membuka sumber terbuka untuk beberapa model. Produk Agen mereka, Mavis, juga telah ditingkatkan. Perusahaan telah mengumumkan bahwa model generasi berikutnya, MiniMax-M3, akan segera dirilis, dengan klaim peningkatan kecepatan inferensi yang signifikan. Langkah MiniMax ini mencerminkan tren di mana pemain utama model besar China, seperti Zhipu AI, Moonshot AI, Stepfun, dan 01.AI, juga aktif mengejar IPO untuk mengamankan pendanaan guna mendukung investasi komputasi yang besar dan mempercepat jalur komersialisasi.

marsbit25m yang lalu

Pemimpin Model Besar Shanghai, Mulai Proses IPO di Bursa A

marsbit25m yang lalu

CEO Bit Digital: Alasan Saya Masih Menambah Posisi ETH

Sam Tabar, CEO Bit Digital, menjelaskan alasan di balik keputusannya untuk terus membeli lebih banyak Ethereum (ETH). Menurutnya, keputusan ini didasarkan pada analisis data dan keyakinan bahwa harga ETH saat ini tidak mencerminkan nilai sebenarnya. Ia menekankan bahwa pendekatan terhadap ETH sebagai alat tukar atau "uang" seperti Bitcoin adalah keliru, karena Ethereum memilih fokus pada utilitas sebagai lapisan penyelesaian yang dapat diprogram. Tabar menyoroti bahwa nilai Ethereum sudah terwujud dalam praktik, dengan berbagai aplikasi seperti penerbitan stablecoin, tokenisasi obligasi pemerintah AS, dan penyelesaian transaksi agen AI yang berjalan di jaringannya. Ia berpendapat bahwa Ethereum saat ini merupakan satu-satunya platform yang menggabungkan komputasi dan penyelesaian dalam skala besar, yang diperlukan untuk migrasi keuangan institusional ke blockchain. Ia mengakui kritik mengenai fragmentasi ekosistem Ethereum, tetapi meyakini bahwa katalis utama untuk apresiasi harga akan datang dari permintaan institusional, bukan dari narasi pasar ritel. Momentum ini akan bergerak seiring dengan kesiapan kerangka peraturan dan infrastruktur yang sesuai. Alasan utama Tabar membeli dan memegang ETH adalah karena aset ini menghasilkan pendapatan (misalnya, melalui staking dengan margin kotor 94,7% di kuartal pertama), mengamankan platform kontrak pintar terkemuka dunia yang menangani triliunan dolar, dan dinilai terlalu murah dibandingkan nilai infrastruktur yang didukungnya. Ia tidak perlu ETH menjadi mata uang cadangan dunia; cukup dengan perannya saat ini, ETH sudah layak dipegang.

marsbit2j yang lalu

CEO Bit Digital: Alasan Saya Masih Menambah Posisi ETH

marsbit2j yang lalu

Trading

Spot
Futures

Artikel Populer

Apa Itu $S$

Memahami SPERO: Tinjauan Komprehensif Pengenalan SPERO Seiring dengan perkembangan lanskap inovasi, munculnya teknologi web3 dan proyek cryptocurrency memainkan peran penting dalam membentuk masa depan digital. Salah satu proyek yang telah menarik perhatian di bidang dinamis ini adalah SPERO, yang dilambangkan sebagai SPERO,$$s$. Artikel ini bertujuan untuk mengumpulkan dan menyajikan informasi terperinci tentang SPERO, untuk membantu para penggemar dan investor memahami dasar-dasar, tujuan, dan inovasi dalam domain web3 dan crypto. Apa itu SPERO,$$s$? SPERO,$$s$ adalah proyek unik dalam ruang crypto yang berusaha memanfaatkan prinsip desentralisasi dan teknologi blockchain untuk menciptakan ekosistem yang mendorong keterlibatan, utilitas, dan inklusi finansial. Proyek ini dirancang untuk memfasilitasi interaksi peer-to-peer dengan cara baru, memberikan pengguna solusi dan layanan keuangan yang inovatif. Pada intinya, SPERO,$$s$ bertujuan untuk memberdayakan individu dengan menyediakan alat dan platform yang meningkatkan pengalaman pengguna dalam ruang cryptocurrency. Ini termasuk memungkinkan metode transaksi yang lebih fleksibel, mendorong inisiatif yang dipimpin komunitas, dan menciptakan jalur untuk peluang finansial melalui aplikasi terdesentralisasi (dApps). Visi mendasar dari SPERO,$$s$ berputar di sekitar inklusivitas, bertujuan untuk menjembatani kesenjangan dalam keuangan tradisional sambil memanfaatkan manfaat teknologi blockchain. Siapa Pencipta SPERO,$$s$? Identitas pencipta SPERO,$$s$ tetap agak samar, karena ada sumber daya publik yang terbatas yang memberikan informasi latar belakang terperinci tentang pendiriannya. Kurangnya transparansi ini dapat berasal dari komitmen proyek terhadap desentralisasi—sebuah etos yang banyak proyek web3 bagi, memprioritaskan kontribusi kolektif di atas pengakuan individu. Dengan memusatkan diskusi di sekitar komunitas dan tujuan kolektifnya, SPERO,$$s$ mewujudkan esensi pemberdayaan tanpa menonjolkan individu tertentu. Dengan demikian, memahami etos dan misi SPERO tetap lebih penting daripada mengidentifikasi pencipta tunggal. Siapa Investor SPERO,$$s$? SPERO,$$s$ didukung oleh beragam investor mulai dari modal ventura hingga investor malaikat yang berdedikasi untuk mendorong inovasi di sektor crypto. Fokus investor ini umumnya sejalan dengan misi SPERO—memprioritaskan proyek yang menjanjikan kemajuan teknologi sosial, inklusivitas finansial, dan tata kelola terdesentralisasi. Fondasi investor ini biasanya tertarik pada proyek yang tidak hanya menawarkan produk inovatif tetapi juga memberikan kontribusi positif kepada komunitas blockchain dan ekosistemnya. Dukungan dari investor ini memperkuat SPERO,$$s$ sebagai pesaing yang patut diperhitungkan di domain proyek crypto yang berkembang pesat. Bagaimana SPERO,$$s$ Bekerja? SPERO,$$s$ menerapkan kerangka kerja multi-faceted yang membedakannya dari proyek cryptocurrency konvensional. Berikut adalah beberapa fitur kunci yang menekankan keunikan dan inovasinya: Tata Kelola Terdesentralisasi: SPERO,$$s$ mengintegrasikan model tata kelola terdesentralisasi, memberdayakan pengguna untuk berpartisipasi aktif dalam proses pengambilan keputusan mengenai masa depan proyek. Pendekatan ini mendorong rasa kepemilikan dan akuntabilitas di antara anggota komunitas. Utilitas Token: SPERO,$$s$ memanfaatkan token cryptocurrency-nya sendiri, yang dirancang untuk melayani berbagai fungsi dalam ekosistem. Token ini memungkinkan transaksi, hadiah, dan fasilitasi layanan yang ditawarkan di platform, meningkatkan keterlibatan dan utilitas secara keseluruhan. Arsitektur Berlapis: Arsitektur teknis SPERO,$$s$ mendukung modularitas dan skalabilitas, memungkinkan integrasi fitur dan aplikasi tambahan secara mulus seiring dengan perkembangan proyek. Kemampuan beradaptasi ini sangat penting untuk mempertahankan relevansi di lanskap crypto yang selalu berubah. Keterlibatan Komunitas: Proyek ini menekankan inisiatif yang dipimpin komunitas, menggunakan mekanisme yang memberikan insentif untuk kolaborasi dan umpan balik. Dengan memelihara komunitas yang kuat, SPERO,$$s$ dapat lebih baik memenuhi kebutuhan pengguna dan beradaptasi dengan tren pasar. Fokus pada Inklusi: Dengan menawarkan biaya transaksi yang rendah dan antarmuka yang ramah pengguna, SPERO,$$s$ bertujuan untuk menarik basis pengguna yang beragam, termasuk individu yang mungkin sebelumnya tidak terlibat dalam ruang crypto. Komitmen ini terhadap inklusi sejalan dengan misi utamanya untuk memberdayakan melalui aksesibilitas. Garis Waktu SPERO,$$s$ Memahami sejarah proyek memberikan wawasan penting tentang trajektori dan tonggak perkembangannya. Berikut adalah garis waktu yang disarankan yang memetakan peristiwa signifikan dalam evolusi SPERO,$$s$: Fase Konseptualisasi dan Ideasi: Ide awal yang membentuk dasar SPERO,$$s$ dikembangkan, sangat selaras dengan prinsip desentralisasi dan fokus komunitas dalam industri blockchain. Peluncuran Whitepaper Proyek: Setelah fase konseptual, whitepaper komprehensif yang merinci visi, tujuan, dan infrastruktur teknologi SPERO,$$s$ dirilis untuk menarik minat dan umpan balik komunitas. Pembangunan Komunitas dan Keterlibatan Awal: Upaya jangkauan aktif dilakukan untuk membangun komunitas pengguna awal dan investor potensial, memfasilitasi diskusi seputar tujuan proyek dan mendapatkan dukungan. Acara Generasi Token: SPERO,$$s$ melakukan acara generasi token (TGE) untuk mendistribusikan token asli kepada pendukung awal dan membangun likuiditas awal dalam ekosistem. Peluncuran dApp Awal: Aplikasi terdesentralisasi (dApp) pertama yang terkait dengan SPERO,$$s$ diluncurkan, memungkinkan pengguna untuk terlibat dengan fungsionalitas inti platform. Pengembangan Berkelanjutan dan Kemitraan: Pembaruan dan peningkatan berkelanjutan terhadap penawaran proyek, termasuk kemitraan strategis dengan pemain lain di ruang blockchain, telah membentuk SPERO,$$s$ menjadi pemain yang kompetitif dan berkembang di pasar crypto. Kesimpulan SPERO,$$s$ berdiri sebagai bukti potensi web3 dan cryptocurrency untuk merevolusi sistem keuangan dan memberdayakan individu. Dengan komitmen terhadap tata kelola terdesentralisasi, keterlibatan komunitas, dan fungsionalitas yang dirancang secara inovatif, ia membuka jalan menuju lanskap keuangan yang lebih inklusif. Seperti halnya investasi di ruang crypto yang berkembang pesat, calon investor dan pengguna dianjurkan untuk melakukan riset secara menyeluruh dan terlibat dengan perkembangan yang sedang berlangsung dalam SPERO,$$s$. Proyek ini menunjukkan semangat inovatif industri crypto, mengundang eksplorasi lebih lanjut ke dalam berbagai kemungkinan yang ada. Meskipun perjalanan SPERO,$$s$ masih berlangsung, prinsip-prinsip dasarnya mungkin benar-benar mempengaruhi masa depan cara kita berinteraksi dengan teknologi, keuangan, dan satu sama lain dalam ekosistem digital yang saling terhubung.

75 Total TayanganDipublikasikan pada 2024.12.17Diperbarui pada 2024.12.17

Apa Itu $S$

Apa Itu AGENT S

Agent S: Masa Depan Interaksi Otonom di Web3 Pendahuluan Dalam lanskap Web3 dan cryptocurrency yang terus berkembang, inovasi secara konstan mendefinisikan ulang cara individu berinteraksi dengan platform digital. Salah satu proyek perintis, Agent S, menjanjikan untuk merevolusi interaksi manusia-komputer melalui kerangka agen terbuka. Dengan membuka jalan untuk interaksi otonom, Agent S bertujuan untuk menyederhanakan tugas-tugas kompleks, menawarkan aplikasi transformasional dalam kecerdasan buatan (AI). Eksplorasi mendetail ini akan menyelami seluk-beluk proyek, fitur uniknya, dan implikasinya untuk domain cryptocurrency. Apa itu Agent S? Agent S berdiri sebagai kerangka agen terbuka yang inovatif, dirancang khusus untuk mengatasi tiga tantangan mendasar dalam otomatisasi tugas komputer: Memperoleh Pengetahuan Spesifik Domain: Kerangka ini secara cerdas belajar dari berbagai sumber pengetahuan eksternal dan pengalaman internal. Pendekatan ganda ini memberdayakannya untuk membangun repositori pengetahuan spesifik domain yang kaya, meningkatkan kinerjanya dalam pelaksanaan tugas. Perencanaan Selama Rentang Tugas yang Panjang: Agent S menggunakan perencanaan hierarkis yang ditingkatkan pengalaman, pendekatan strategis yang memfasilitasi pemecahan dan pelaksanaan tugas-tugas rumit dengan efisien. Fitur ini secara signifikan meningkatkan kemampuannya untuk mengelola beberapa subtugas dengan efisien dan efektif. Menangani Antarmuka Dinamis dan Tidak Seragam: Proyek ini memperkenalkan Antarmuka Agen-Komputer (ACI), solusi inovatif yang meningkatkan interaksi antara agen dan pengguna. Dengan memanfaatkan Model Bahasa Besar Multimodal (MLLM), Agent S dapat menavigasi dan memanipulasi berbagai antarmuka pengguna grafis dengan mulus. Melalui fitur-fitur perintis ini, Agent S menyediakan kerangka kerja yang kuat yang mengatasi kompleksitas yang terlibat dalam mengotomatisasi interaksi manusia dengan mesin, membuka jalan untuk berbagai aplikasi dalam AI dan seterusnya. Siapa Pencipta Agent S? Meskipun konsep Agent S secara fundamental inovatif, informasi spesifik tentang penciptanya tetap samar. Pencipta saat ini tidak diketahui, yang menyoroti baik tahap awal proyek atau pilihan strategis untuk menjaga anggota pendiri tetap tersembunyi. Terlepas dari anonimitas, fokus tetap pada kemampuan dan potensi kerangka kerja. Siapa Investor Agent S? Karena Agent S relatif baru dalam ekosistem kriptografi, informasi terperinci mengenai investor dan pendukung keuangannya tidak secara eksplisit didokumentasikan. Kurangnya wawasan yang tersedia untuk umum mengenai fondasi investasi atau organisasi yang mendukung proyek ini menimbulkan pertanyaan tentang struktur pendanaannya dan peta jalan pengembangannya. Memahami dukungan sangat penting untuk mengukur keberlanjutan proyek dan potensi dampak pasar. Bagaimana Cara Kerja Agent S? Di inti Agent S terletak teknologi mutakhir yang memungkinkannya berfungsi secara efektif dalam berbagai pengaturan. Model operasionalnya dibangun di sekitar beberapa fitur kunci: Interaksi Komputer yang Mirip Manusia: Kerangka ini menawarkan perencanaan AI yang canggih, berusaha untuk membuat interaksi dengan komputer lebih intuitif. Dengan meniru perilaku manusia dalam pelaksanaan tugas, ia menjanjikan untuk meningkatkan pengalaman pengguna. Memori Naratif: Digunakan untuk memanfaatkan pengalaman tingkat tinggi, Agent S memanfaatkan memori naratif untuk melacak sejarah tugas, sehingga meningkatkan proses pengambilan keputusannya. Memori Episodik: Fitur ini memberikan panduan langkah demi langkah kepada pengguna, memungkinkan kerangka untuk menawarkan dukungan kontekstual saat tugas berlangsung. Dukungan untuk OpenACI: Dengan kemampuan untuk berjalan secara lokal, Agent S memungkinkan pengguna untuk mempertahankan kontrol atas interaksi dan alur kerja mereka, sejalan dengan etos terdesentralisasi Web3. Integrasi Mudah dengan API Eksternal: Versatilitas dan kompatibilitasnya dengan berbagai platform AI memastikan bahwa Agent S dapat dengan mulus masuk ke dalam ekosistem teknologi yang ada, menjadikannya pilihan menarik bagi pengembang dan organisasi. Fungsionalitas ini secara kolektif berkontribusi pada posisi unik Agent S dalam ruang kripto, saat ia mengotomatisasi tugas-tugas kompleks yang melibatkan banyak langkah dengan intervensi manusia yang minimal. Seiring proyek ini berkembang, aplikasi potensialnya di Web3 dapat mendefinisikan ulang bagaimana interaksi digital berlangsung. Garis Waktu Agent S Pengembangan dan tonggak Agent S dapat dirangkum dalam garis waktu yang menyoroti peristiwa pentingnya: 27 September 2024: Konsep Agent S diluncurkan dalam sebuah makalah penelitian komprehensif berjudul “Sebuah Kerangka Agen Terbuka yang Menggunakan Komputer Seperti Manusia,” yang menunjukkan dasar untuk proyek ini. 10 Oktober 2024: Makalah penelitian tersebut dipublikasikan secara terbuka di arXiv, menawarkan eksplorasi mendalam tentang kerangka kerja dan evaluasi kinerjanya berdasarkan tolok ukur OSWorld. 12 Oktober 2024: Sebuah presentasi video dirilis, memberikan wawasan visual tentang kemampuan dan fitur Agent S, lebih lanjut melibatkan pengguna dan investor potensial. Tanda-tanda dalam garis waktu ini tidak hanya menggambarkan kemajuan Agent S tetapi juga menunjukkan komitmennya terhadap transparansi dan keterlibatan komunitas. Poin Kunci Tentang Agent S Seiring kerangka Agent S terus berkembang, beberapa atribut kunci menonjol, menekankan sifat inovatif dan potensinya: Kerangka Inovatif: Dirancang untuk memberikan penggunaan komputer yang intuitif seperti interaksi manusia, Agent S membawa pendekatan baru untuk otomatisasi tugas. Interaksi Otonom: Kemampuan untuk berinteraksi secara otonom dengan komputer melalui GUI menandakan lompatan menuju solusi komputasi yang lebih cerdas dan efisien. Otomatisasi Tugas Kompleks: Dengan metodologinya yang kuat, ia dapat mengotomatisasi tugas-tugas kompleks yang melibatkan banyak langkah, membuat proses lebih cepat dan kurang rentan terhadap kesalahan. Perbaikan Berkelanjutan: Mekanisme pembelajaran memungkinkan Agent S untuk belajar dari pengalaman masa lalu, terus meningkatkan kinerja dan efektivitasnya. Versatilitas: Adaptabilitasnya di berbagai lingkungan operasi seperti OSWorld dan WindowsAgentArena memastikan bahwa ia dapat melayani berbagai aplikasi. Saat Agent S memposisikan dirinya di lanskap Web3 dan kripto, potensinya untuk meningkatkan kemampuan interaksi dan mengotomatisasi proses menandakan kemajuan signifikan dalam teknologi AI. Melalui kerangka inovatifnya, Agent S mencerminkan masa depan interaksi digital, menjanjikan pengalaman yang lebih mulus dan efisien bagi pengguna di berbagai industri. Kesimpulan Agent S mewakili lompatan berani ke depan dalam pernikahan AI dan Web3, dengan kapasitas untuk mendefinisikan ulang cara kita berinteraksi dengan teknologi. Meskipun masih dalam tahap awal, kemungkinan aplikasinya sangat luas dan menarik. Melalui kerangka komprehensifnya yang mengatasi tantangan kritis, Agent S bertujuan untuk membawa interaksi otonom ke garis depan pengalaman digital. Saat kita melangkah lebih dalam ke dalam ranah cryptocurrency dan desentralisasi, proyek-proyek seperti Agent S pasti akan memainkan peran penting dalam membentuk masa depan teknologi dan kolaborasi manusia-komputer.

904 Total TayanganDipublikasikan pada 2025.01.14Diperbarui pada 2025.01.14

Apa Itu AGENT S

Cara Membeli S

Selamat datang di HTX.com! Kami telah membuat pembelian Sonic (S) menjadi mudah dan nyaman. Ikuti panduan langkah demi langkah kami untuk memulai perjalanan kripto Anda.Langkah 1: Buat Akun HTX AndaGunakan alamat email atau nomor ponsel Anda untuk mendaftar akun gratis di HTX. Rasakan perjalanan pendaftaran yang mudah dan buka semua fitur.Dapatkan Akun SayaLangkah 2: Buka Beli Kripto, lalu Pilih Metode Pembayaran AndaKartu Kredit/Debit: Gunakan Visa atau Mastercard Anda untuk membeli Sonic (S) secara instan.Saldo: Gunakan dana dari saldo akun HTX Anda untuk melakukan trading dengan lancar.Pihak Ketiga: Kami telah menambahkan metode pembayaran populer seperti Google Pay dan Apple Pay untuk meningkatkan kenyamanan.P2P: Lakukan trading langsung dengan pengguna lain di HTX.Over-the-Counter (OTC): Kami menawarkan layanan yang dibuat khusus dan kurs yang kompetitif bagi para trader.Langkah 3: Simpan Sonic (S) AndaSetelah melakukan pembelian, simpan Sonic (S) di akun HTX Anda. Selain itu, Anda dapat mengirimkannya ke tempat lain melalui transfer blockchain atau menggunakannya untuk memperdagangkan mata uang kripto lainnya.Langkah 4: Lakukan trading Sonic (S)Lakukan trading Sonic (S) dengan mudah di pasar spot HTX. Cukup akses akun Anda, pilih pasangan perdagangan, jalankan trading, lalu pantau secara real-time. Kami menawarkan pengalaman yang ramah pengguna baik untuk pemula maupun trader berpengalaman.

1.3k Total TayanganDipublikasikan pada 2025.01.15Diperbarui pada 2025.03.21

Cara Membeli S

Diskusi

Selamat datang di Komunitas HTX. Di sini, Anda bisa terus mendapatkan informasi terbaru tentang perkembangan platform terkini dan mendapatkan akses ke wawasan pasar profesional. Pendapat pengguna mengenai harga S (S) disajikan di bawah ini.

活动图片