I vibe-coded an Android app using Google

marsbitPublié le 2026-05-23Dernière mise à jour le 2026-05-23

Résumé

In a hands-on experience, Google AI Studio's new "prompt to phone" feature allows users to generate functional Android apps using natural language prompts. The author created three apps in one afternoon: a text-based adventure game called MOOD, a calorie counter, and a Super Mario-style game featuring Peach. The process involved describing the app concept, letting Gemini AI generate the code and interface, and then installing it directly onto a connected phone. While the apps were generated and installed quickly, their quality varied significantly. The text adventure was simplistic and buggy, the calorie counter provided inaccurate data due to flawed logic, and the platformer was prone to crashes. The AI could efficiently fix specific, identifiable bugs through follow-up prompts. However, the experience highlighted that while AI can rapidly prototype "working" software, creating reliable, accurate, and polished applications still requires human oversight, judgment, and iteration. The tool dramatically lowers the barrier to entry for personal software creation but doesn't yet replace the need for developer expertise in the final stages of quality and refinement.

Editor's Note: Google AI Studio is bringing AI programming to a more intuitive stage: users are no longer just having models 'write code', but can directly generate an Android application using natural language and install it on a real phone within minutes. From entering a prompt in the browser, to Gemini automatically generating code, designing interfaces, fixing bugs, to the app appearing on the device, the barrier to software development is being lowered even further.

The Verge author Sean Hollister recently experienced the 'prompt to phone' capability of Google AI Studio. He created three apps in one afternoon, including a text adventure game, a calorie calculator, and a Mario-like mini-game, with almost no need to write code himself, and some bugs could be quickly fixed by continuing the conversation. This experience shows that AI programming tools are moving from development environments closer to consumer-facing scenarios for ordinary users.

This is also the most imaginative aspect of the 'personal software revolution.' In the past, ordinary users could only wait for developers to create general products; now, they might be able to generate a fitness tracker, calorie calculator, or even a simple game on the fly according to their specific needs. For Google, this isn't just a demonstration of AI programming capability; it could also be a new entry point for Gemini into the mobile ecosystem, developer community, and subscription revenue.

However, this experience also illustrates that AI-generated applications still have a significant gap to truly mature. It can quickly produce a 'working' program but not necessarily a reliable, accurate, or user-friendly product: game narratives are crude, mechanics are thin, calorie data can be severely miscalculated, and the Mario-like mini-game even crashes repeatedly. More complex issues also include copyright boundaries, data sources, product judgment, and long-term maintenance capabilities.

What's truly worth paying attention to is not whether AI can already replace developers, but that the starting point of software production is changing. Google has proven that it's becoming a reality for ordinary people to create mobile apps using prompts; but from 'generating an app' to 'making a good app,' human professional experience, aesthetic judgment, and continuous iteration are still required in between. AI can significantly accelerate development speed, but the final mile of software quality can't be handed off—at least not yet.

Here is the original article:

Yesterday, I made my first Android app. Then, I made two more—three apps in one afternoon.

For one of the apps, I essentially just typed 148 English words into a web browser and then walked away. Ten minutes later, a brand new, complete app had appeared on my real Android phone. Of course, I did need to prepare the phone beforehand: enable USB debugging mode and connect it to my computer. But aside from that, as Google advertised, AI Studio did almost all the work for me.

I typed, clicked install, and then—voilà—a fully functioning program appeared. At that moment, I was almost ready to agree with David, Allison, and Jen's assessment: the personal software revolution has arrived, and it's entering your phone. In the future, even without programming skills, ordinary people might be able to get complex smart home device systems truly up and running.

Then, I started actually using these three apps: a calorie counter and two games. It turned out, they didn't perform very well. And just as I was beginning to enjoy iterating and trying to improve them, AI Studio reminded me that I had reached my daily usage limit. Next, I would either have to pay or wait for the quota to reset.

So, friction still exists. But there's no denying what an individual can accomplish nowadays is quite astonishing. That same morning, my colleague Stevie Bonifield also made a personal fitness tracker app, and he thought it was good enough to actually use. Faced with Gemini's pop-up prompt to upgrade to a paid plan, my first instinct was actually: 'Should I pay for a few months first?' That's not a reaction I would have expected myself to have towards a Google product.

How Google's AI Studio Builds an Android App

On Tuesday, when Google showed off using AI to write a game similar to Doom, we joked that I should make a game called MOOD. It would be a text adventure game like Doom, with MOOD standing for 'Modern Online Oratory Dungeon.'

Just this information was enough for Google to get to work. After I typed into AI Studio: 'Help me make a Doom-style text adventure game called MOOD, with MOOD standing for Modern Online Oratory Dungeon,' Gemini started automatically supplementing more ideas, trying to expand on my concept. It first typed a sentence: 'The game should feature procedurally generated levels and challenging turn-based combat.'

I didn't want randomly generated levels that were completely different each time—I wanted a classic text adventure where players explore a designed, real map structure. Turn-based combat, though, was acceptable. Maybe the game could also have AI help me auto-generate the map?

Then, Gemini suggested more settings like 'secrets hidden in rooms' and 'a satisfying progression system.' Most of the time, I just nodded along with its ideas.

Before I let it start writing code, the final prompt was this:

Next, it officially went on a full sprint. My colleague Jake pointed out that unlike Claude Code, Gemini doesn't make a plan first and then ask if you want to proceed. It automatically pushes forward—though you can check the code it writes at any time if you want.

One minute later, it had already generated five design prototypes for me:

Twenty minutes later, I pressed the 'Install' button, transferring the game to a Pixel 9 phone.

Unsurprisingly, the writing was terrible. There were also no demons to be seen anywhere. The entire dungeon had only 11 rooms, and players could 'beat' it just by repeatedly mashing the attack button—in under a minute if played seriously. At least now it could; before that, Gemini had to help me fix two critical bugs that made the game unplayable.

Here's MOOD in action:

It wasn't a huge surprise to discover that Gemini's promised 'engaging narrative with branching dialogue options and multiple endings' eventually condensed into a simple branch at the very end of the game: I could defeat the 'Core Orator'—an AI that somehow turns internet anger into corporate profits—by attacking it, fusing with it, or entering a backdoor password.

Furthermore, the game actively exposed all the promised 'secrets' directly to the player: it made them into glowing buttons, and players didn't even need to type any text. When you encounter a glowing treasure chest, the game tries incredibly hard to remind you it's actually a Mimic—the classic Dungeons & Dragons monster that disguises itself as a treasure chest.

It not only explicitly warns you to 'check the chest at your own risk,' but even labels it as an enemy and doesn't let me leave, because the system prompts: 'A hostile ‘Clickbait Mimic’ is blocking the path!'

Speaking of which, MOOD will even tell you the backdoor password needed to unlock the hidden ending when you need it.

However, the bug-fixing process could be surprisingly smooth, provided it was a bug Gemini could correctly identify. When I told it the game got stuck when talking to 'The Whistleblower' because the button to end the conversation was missing, it immediately generated a new version of the app. I pressed 'Install,' the app on my phone restarted automatically, and upon re-entering the game, I found myself right where I left off—only this time, the button I needed was there.

My other apps probably needed more polishing. The calorie counter's best method for determining a food's calories turned out to be calling the paid Gemini API, which I don't have a key for. When I asked it to search for information from other databases instead, I discovered that its estimates for many foods were severely low.

However, when I told Gemini that a 16-ounce boba milk tea couldn't possibly be only 190 calories, it did seem to find that basic mistake in its own code. It previously thought 'milk' was enough to match 'boba milk tea,' and worse, it chose low-calorie 1% milk as the basis for the estimate. Gemini claimed it would now perform more reliable matching.

But even so, my 3-ounce serving of Taiwanese popcorn chicken was just calculated as 140 calories, and I'm pretty sure the real number is at least double that. So, this app clearly needed more work.

Finally, and least importantly, I felt I needed to test: whether Google still allows users to make those terrible Nintendo knock-off games, like my colleague Jay Peters did earlier this year with Project Genie; or whether Google had learned its lesson.

With deep shame, I present to you—Super Peach Rescue:

This is an utterly terrible program. Princess Peach was rendered as some kind of terrifying, one-eyed floating alien, and the game would instantly crash—every single time—if she dared touch any of the power-up blocks. So far, Gemini hasn't been able to figure out why.

Also, the second pipe in the game is completely impassable because Princess Peach simply can't jump that high.

Nevertheless, Gemini didn't hesitate when generating such a game. My request was: 'Make a working Super Mario game where I play as Princess Peach rescuing Mario, with all the elements of a traditional Mario side-scroller.' In a sense, it did.

It even proactively suggested that I could 'give Peach a series of classic Mario power-ups like Super Mushroom, Fire Flower, and Starman.' It also labeled the control scheme as 'NES System.' I think I'll delete this game.

At least, among the two games I made via vibe coding, one was playable from the start and required almost no effort on my part—unless you count the psychological trauma of thinking about how many game developers are now unemployed.

To be clear: I'm actually glad the games I vibe-coded turned out so poor. For a completely free, personally-tailored calorie counter, I might still be able to defend myself: after all, no one would make such a tool just for me. But when it comes to games, I'd rather spend my time supporting actual human creators.

Questions liées

QWhat is the core capability demonstrated by Google AI Studio in this article, and what did the author create with it?

AThe article demonstrates Google AI Studio's ability to generate functional Android applications directly from natural language prompts, a process the author refers to as 'vibe coding.' Using this, the author created three applications: a text-based adventure game called 'MOOD,' a calorie counter, and a poorly functioning Super Mario-style game where Princess Peach rescues Mario.

QWhat are some of the main advantages and significant drawbacks of using AI to generate applications as described in the experience?

AAdvantages include drastically lowering the barrier to software creation, allowing non-coders to quickly generate apps tailored to personal needs, and a remarkably smooth bug-fixing process for issues the AI can identify. Major drawbacks are that the generated apps are often unreliable, inaccurate, or have poor quality: the games had thin narratives and mechanics, the calorie counter gave severely low estimates, and the Mario clone crashed frequently. Complex issues like copyright, data sourcing, and long-term maintenance also remain unresolved.

QDescribe the process of creating and installing the 'MOOD' game. What were some of its shortcomings?

AThe author entered a 148-word prompt into Google AI Studio. Gemini expanded on the idea and, without needing prior planning confirmation, generated code and multiple UI prototypes. About 20 minutes later, the author pressed 'Install' to transfer the APK to a connected Pixel 9 phone. The game's shortcomings included terrible writing, only 11 rooms, simplistic combat (just spamming an attack button to win), a lack of demons as suggested by the 'Doom-like' prompt, and a poorly implemented narrative that directly revealed all secrets and gave away puzzle solutions.

QHow did the AI handle bug fixes during the app creation process, according to the author's experience?

AThe bug-fixing process was described as surprisingly smooth for issues the AI could correctly diagnose. For example, when the 'MOOD' game got stuck because a dialog exit button was missing, the author reported the issue. Gemini then generated a new version of the app. After installation, the app restarted on the phone, and the author resumed play from the same point—but with the necessary button now present.

QWhat broader implications does the author suggest this 'personal software revolution' might have, while also highlighting its current limitations?

AThe author suggests this could enable a 'personal software revolution' where individuals can generate apps for specific, niche needs (like a custom fitness tracker or calorie counter) without waiting for developers. For Google, it represents a potential new entry point into mobile, developer ecosystems, and subscription revenue via Gemini. However, the key limitation is the gap between 'generating an app' and 'making a good app.' The author concludes that while AI can accelerate the starting point of development, the 'last mile' of software quality—requiring human expertise, aesthetic judgment, and iteration—cannot yet be handed off to AI.

Lectures associées

Apple réinvente la compression d'images avec l'IA : La même qualité pour des fichiers trois fois plus petits

La compression d’image entre dans une nouvelle ère avec l’arrivée de l’IA. En février 2025, le groupe JPEG a officiellement lancé JPEG AI, le premier standard international de codage d’images basé sur l’apprentissage automatique. Toutefois, même cette avancée reste éloignée de la « compression perceptuelle », qui optimise l’expérience visuelle humaine plutôt que des indicateurs mathématiques comme le PSNR. Apple répond à ce défi avec PICO (Perceptual Image Codec), un codec conçu pour plaire à l’œil humain. Il résout trois problèmes clés : 1. **Vitesse** : grâce à un modèle de contexte « one-shot », il évite la lenteur de l’encodage autorégressif classique. 2. **Hallucinations** : une fonction de perte dédiée (TextFidelityLoss) préserve la précision du texte, réduisant de moitié les erreurs dans ces zones. 3. **Artefacts** : une perte spécifique (TilingArtifactLoss) supprime les différences de couleur entre les blocs d’image. Lors d’un test subjectif à grande échelle, PICO a réduit la taille des fichiers de 30 à 43 % par rapport aux codecs comme AV1, VVC ou JPEG AI, à qualité visuelle équivalente. Sur un iPhone 17 Pro Max, il code une photo 12 MP en 230 ms et la décode en 150 ms. Bien que moins efficace sur les images synthétiques (dessins, schémas), PICO marque un tournant en priorisant systématiquement la perception humaine, ouvrant la voie à une compression plus intelligente et intégrée dans nos appareils.

marsbitIl y a 23 mins

Apple réinvente la compression d'images avec l'IA : La même qualité pour des fichiers trois fois plus petits

marsbitIl y a 23 mins

Le leader des grands modèles de Shanghai lance son introduction en bourse sur le marché A

L'entreprise leader des grands modèles d'IA à Shanghai, MiniMax, a déposé le 29 mai un dossier de préparation à l'introduction en bourse auprès de la CSRC, visant une entrée sur le marché A, avec Citic Securities comme conseiller. Elle concourt ainsi avec Zhipu AI pour devenir la première entreprise de grands modèles cotée sur le marché A. MiniMax, fondée en janvier 2022 et déjà cotée à Hong Kong depuis janvier de cette année, a vu son cours s'envoler de 409,09% depuis son introduction, atteignant une capitalisation d'environ 227,5 milliards de yuans. Elle intégrera l'indice Hang Seng Tech à partir du 8 juin. Cette performance s'appuie sur des données financières solides. L'entreprise a annoncé un taux de croissance de son revenu annuel récurrent (ARR) supérieur à 100% sur les deux derniers mois. Son ARR dépasse désormais 300 millions de dollars. Pour l'exercice 2025, son chiffre d'affaires s'est élevé à environ 535 millions de yuans, avec une marge brute améliorée à 25,4%, bien qu'elle ait enregistré une perte nette ajustée d'environ 1,69 milliard de yuans. Sur le plan des produits, MiniMax a lancé plusieurs versions de son modèle phare (M2.5, M2.6, M2.7) et a annoncé la prochaine sortie de MiniMax-M3. Cette nouvelle version utilise un mécanisme d'attention éparse propriétaire (MiniMax Sparse Attention) permettant des gains significatifs de vitesse de traitement. L'entreprise propose également Mavis, un produit Agent amélioré. Dans un contexte de concurrence intense et d'investissements élevés en puissance de calcul, les principaux acteurs chinois des grands modèles, tels que MiniMax, Zhipu AI, Moonshot AI et Stepfun, accélèrent leurs démarches d'introduction en bourse pour diversifier leurs sources de financement.

marsbitIl y a 26 mins

Le leader des grands modèles de Shanghai lance son introduction en bourse sur le marché A

marsbitIl y a 26 mins

Le PDG de Bit Digital : Pourquoi je continue d'augmenter mes positions en ETH

Le PDG de Bit Digital, Sam Tabar, explique pourquoi il continue d'accumuler de l'ETH. Il base sa décision sur l'analyse des données et non sur les cycles ou les récits du marché, estimant que l'actif est sous-évalué. Il rejette l'idée de considérer l'ETH comme une simple monnaie, un cadre plus adapté au Bitcoin. L'Ethereum, selon lui, a choisi l'utilité en créant une couche de règlement programmable sur laquelle le monde construit activement. Sa valeur réside dans cette utilité institutionnelle concrète : émission de stablecoins, tokenisation de bons du Trésor américain et règlement de transactions d'agents IA. Tabar répond aux critiques sur la fragmentation de l'écosystème en soulignant que le capital institutionnel n'a pas besoin qu'Ethereum gagne une guerre de narration. Il a besoin d'une infrastructure fiable et éprouvée, ce qu'Ethereum fournit déjà à grande échelle, combinant calcul (via des partenariats comme WhiteFiber) et règlement. Il conteste l'idée que le potentiel de l'ETH soit épuisé, arguant que le vrai catalyseur de la revalorisation sera la demande institutionnelle, qui suivra la mise en place des cadres réglementaires et de garde adaptés. Enfin, il justifie son achat par un devoir fiduciaire : l'ETH est un actif générateur de revenus (avec une marge brute de 94,7% pour le staking au premier trimestre) qui sécurise la principale plateforme de contrats intelligents, traitant des milliers de milliards de dollars de transactions. Il n'a pas besoin qu'il devienne une monnaie de réserve mondiale, seulement qu'il continue son travail actuel à un prix qu'il juge attractif.

marsbitIl y a 2 h

Le PDG de Bit Digital : Pourquoi je continue d'augmenter mes positions en ETH

marsbitIl y a 2 h

Trading

Spot
Futures

Articles tendance

Qu'est ce que $S$

Comprendre SPERO : Un aperçu complet Introduction à SPERO Alors que le paysage de l'innovation continue d'évoluer, l'émergence des technologies web3 et des projets de cryptomonnaie joue un rôle central dans la façon dont se dessine l'avenir numérique. Un projet qui a attiré l'attention dans ce domaine dynamique est SPERO, désigné comme SPERO,$$s$. Cet article vise à rassembler et à présenter des informations détaillées sur SPERO, afin d'aider les passionnés et les investisseurs à comprendre ses fondations, ses objectifs et ses innovations dans les domaines du web3 et de la crypto. Qu'est-ce que SPERO,$$s$ ? SPERO,$$s$ est un projet unique dans l'espace crypto qui cherche à tirer parti des principes de décentralisation et de la technologie blockchain pour créer un écosystème qui favorise l'engagement, l'utilité et l'inclusion financière. Le projet est conçu pour faciliter les interactions entre pairs de nouvelles manières, offrant aux utilisateurs des solutions et des services financiers innovants. Au cœur de SPERO,$$s$, l'objectif est d'autonomiser les individus en fournissant des outils et des plateformes qui améliorent l'expérience utilisateur dans l'espace des cryptomonnaies. Cela inclut la possibilité de méthodes de transaction plus flexibles, la promotion d'initiatives dirigées par la communauté et la création de voies pour des opportunités financières via des applications décentralisées (dApps). La vision sous-jacente de SPERO,$$s$ tourne autour de l'inclusivité, visant à combler les lacunes au sein de la finance traditionnelle tout en exploitant les avantages de la technologie blockchain. Qui est le créateur de SPERO,$$s$ ? L'identité du créateur de SPERO,$$s$ reste quelque peu obscure, car il existe peu de ressources publiques fournissant des informations détaillées sur son ou ses fondateurs. Ce manque de transparence peut découler de l'engagement du projet envers la décentralisation—une éthique que de nombreux projets web3 partagent, privilégiant les contributions collectives plutôt que la reconnaissance individuelle. En centrant les discussions autour de la communauté et de ses objectifs collectifs, SPERO,$$s$ incarne l'essence de l'autonomisation sans désigner des individus spécifiques. Ainsi, comprendre l'éthique et la mission de SPERO reste plus important que d'identifier un créateur unique. Qui sont les investisseurs de SPERO,$$s$ ? SPERO,$$s$ est soutenu par une diversité d'investisseurs allant des capital-risqueurs aux investisseurs providentiels dédiés à favoriser l'innovation dans le secteur crypto. L'objectif de ces investisseurs s'aligne généralement avec la mission de SPERO—priorisant les projets qui promettent des avancées technologiques sociétales, l'inclusivité financière et la gouvernance décentralisée. Ces fondations d'investisseurs s'intéressent généralement à des projets qui non seulement offrent des produits innovants, mais qui contribuent également positivement à la communauté blockchain et à ses écosystèmes. Le soutien de ces investisseurs renforce SPERO,$$s$ en tant que concurrent notable dans le domaine en rapide évolution des projets crypto. Comment fonctionne SPERO,$$s$ ? SPERO,$$s$ utilise un cadre multifacette qui le distingue des projets de cryptomonnaie conventionnels. Voici quelques-unes des caractéristiques clés qui soulignent son unicité et son innovation : Gouvernance décentralisée : SPERO,$$s$ intègre des modèles de gouvernance décentralisée, permettant aux utilisateurs de participer activement aux processus de décision concernant l'avenir du projet. Cette approche favorise un sentiment de propriété et de responsabilité parmi les membres de la communauté. Utilité du token : SPERO,$$s$ utilise son propre token de cryptomonnaie, conçu pour servir diverses fonctions au sein de l'écosystème. Ces tokens permettent des transactions, des récompenses et la facilitation des services offerts sur la plateforme, améliorant ainsi l'engagement et l'utilité globaux. Architecture en couches : L'architecture technique de SPERO,$$s$ supporte la modularité et l'évolutivité, permettant une intégration fluide de fonctionnalités et d'applications supplémentaires à mesure que le projet évolue. Cette adaptabilité est primordiale pour maintenir la pertinence dans le paysage crypto en constante évolution. Engagement communautaire : Le projet met l'accent sur des initiatives dirigées par la communauté, utilisant des mécanismes qui incitent à la collaboration et aux retours d'expérience. En cultivant une communauté forte, SPERO,$$s$ peut mieux répondre aux besoins des utilisateurs et s'adapter aux tendances du marché. Accent sur l'inclusion : En proposant des frais de transaction bas et des interfaces conviviales, SPERO,$$s$ vise à attirer une base d'utilisateurs diversifiée, y compris des individus qui n'ont peut-être pas engagé auparavant dans l'espace crypto. Cet engagement envers l'inclusion s'aligne avec sa mission globale d'autonomisation par l'accessibilité. Chronologie de SPERO,$$s$ Comprendre l'histoire d'un projet fournit des aperçus cruciaux sur sa trajectoire de développement et ses jalons. Voici une chronologie suggérée cartographiant les événements significatifs dans l'évolution de SPERO,$$s$ : Phase de conceptualisation et d'idéation : Les idées initiales formant la base de SPERO,$$s$ ont été conçues, s'alignant étroitement avec les principes de décentralisation et de concentration sur la communauté au sein de l'industrie blockchain. Lancement du livre blanc du projet : Suite à la phase conceptuelle, un livre blanc complet détaillant la vision, les objectifs et l'infrastructure technologique de SPERO,$$s$ a été publié pour susciter l'intérêt et les retours de la communauté. Construction de la communauté et engagements précoces : Des efforts de sensibilisation actifs ont été entrepris pour construire une communauté d'adopteurs précoces et d'investisseurs potentiels, facilitant les discussions autour des objectifs du projet et recueillant du soutien. Événement de génération de tokens : SPERO,$$s$ a organisé un événement de génération de tokens (TGE) pour distribuer ses tokens natifs aux premiers soutiens et établir une liquidité initiale au sein de l'écosystème. Lancement de la première dApp : La première application décentralisée (dApp) associée à SPERO,$$s$ a été mise en ligne, permettant aux utilisateurs d'interagir avec les fonctionnalités principales de la plateforme. Développement continu et partenariats : Des mises à jour et des améliorations continues des offres du projet, y compris des partenariats stratégiques avec d'autres acteurs de l'espace blockchain, ont façonné SPERO,$$s$ en un acteur compétitif et évolutif sur le marché crypto. Conclusion SPERO,$$s$ se dresse comme un témoignage du potentiel du web3 et de la cryptomonnaie pour révolutionner les systèmes financiers et autonomiser les individus. Avec un engagement envers la gouvernance décentralisée, l'engagement communautaire et des fonctionnalités conçues de manière innovante, il ouvre la voie vers un paysage financier plus inclusif. Comme pour tout investissement dans l'espace crypto en rapide évolution, les investisseurs et utilisateurs potentiels sont encouragés à mener des recherches approfondies et à s'engager de manière réfléchie avec les développements en cours au sein de SPERO,$$s$. Le projet illustre l'esprit d'innovation de l'industrie crypto, invitant à une exploration plus approfondie de ses nombreuses possibilités. Bien que le parcours de SPERO,$$s$ soit encore en cours, ses principes fondamentaux pourraient en effet influencer l'avenir de nos interactions avec la technologie, la finance et entre nous dans des écosystèmes numériques interconnectés.

101 vues totalesPublié le 2024.12.17Mis à jour le 2024.12.17

Qu'est ce que $S$

Qu'est ce que AGENT S

Agent S : L'avenir de l'interaction autonome dans Web3 Introduction Dans le paysage en constante évolution de Web3 et des cryptomonnaies, les innovations redéfinissent constamment la manière dont les individus interagissent avec les plateformes numériques. Un projet pionnier, Agent S, promet de révolutionner l'interaction homme-machine grâce à son cadre agentique ouvert. En ouvrant la voie à des interactions autonomes, Agent S vise à simplifier des tâches complexes, offrant des applications transformantes dans l'intelligence artificielle (IA). Cette exploration détaillée plongera dans les subtilités du projet, ses caractéristiques uniques et les implications pour le domaine des cryptomonnaies. Qu'est-ce qu'Agent S ? Agent S se présente comme un cadre agentique ouvert révolutionnaire, spécifiquement conçu pour relever trois défis fondamentaux dans l'automatisation des tâches informatiques : Acquisition de connaissances spécifiques au domaine : Le cadre apprend intelligemment à partir de diverses sources de connaissances externes et d'expériences internes. Cette approche double lui permet de construire un riche répertoire de connaissances spécifiques au domaine, améliorant ainsi sa performance dans l'exécution des tâches. Planification sur de longs horizons de tâches : Agent S utilise une planification hiérarchique augmentée par l'expérience, une approche stratégique qui facilite la décomposition et l'exécution efficaces de tâches complexes. Cette fonctionnalité améliore considérablement sa capacité à gérer plusieurs sous-tâches de manière efficace et efficiente. Gestion d'interfaces dynamiques et non uniformes : Le projet introduit l'Interface Agent-Ordinateur (ACI), une solution innovante qui améliore l'interaction entre les agents et les utilisateurs. En utilisant des Modèles de Langage Multimodaux de Grande Taille (MLLMs), Agent S peut naviguer et manipuler sans effort diverses interfaces graphiques. Grâce à ces fonctionnalités pionnières, Agent S fournit un cadre robuste qui aborde les complexités impliquées dans l'automatisation de l'interaction humaine avec les machines, préparant le terrain pour d'innombrables applications en IA et au-delà. Qui est le créateur d'Agent S ? Bien que le concept d'Agent S soit fondamentalement innovant, des informations spécifiques sur son créateur restent insaisissables. Le créateur est actuellement inconnu, ce qui souligne soit le stade naissant du projet, soit le choix stratégique de garder les membres fondateurs sous le radar. Quoi qu'il en soit, l'accent reste mis sur les capacités et le potentiel du cadre. Qui sont les investisseurs d'Agent S ? Étant donné qu'Agent S est relativement nouveau dans l'écosystème cryptographique, des informations détaillées concernant ses investisseurs et soutiens financiers ne sont pas explicitement documentées. Le manque d'aperçus publiquement disponibles sur les fondations d'investissement ou les organisations soutenant le projet soulève des questions sur sa structure de financement et sa feuille de route de développement. Comprendre le soutien est crucial pour évaluer la durabilité du projet et son impact potentiel sur le marché. Comment fonctionne Agent S ? Au cœur d'Agent S se trouve une technologie de pointe qui lui permet de fonctionner efficacement dans divers environnements. Son modèle opérationnel est construit autour de plusieurs caractéristiques clés : Interaction homme-ordinateur semblable à l'humain : Le cadre offre une planification IA avancée, s'efforçant de rendre les interactions avec les ordinateurs plus intuitives. En imitant le comportement humain dans l'exécution des tâches, il promet d'élever l'expérience utilisateur. Mémoire narrative : Utilisée pour tirer parti des expériences de haut niveau, Agent S utilise la mémoire narrative pour suivre les historiques de tâches, améliorant ainsi ses processus de prise de décision. Mémoire épisodique : Cette fonctionnalité fournit aux utilisateurs un accompagnement étape par étape, permettant au cadre d'offrir un soutien contextuel au fur et à mesure que les tâches se déroulent. Support pour OpenACI : Avec la capacité de fonctionner localement, Agent S permet aux utilisateurs de garder le contrôle sur leurs interactions et flux de travail, s'alignant avec l'éthique décentralisée de Web3. Intégration facile avec des API externes : Sa polyvalence et sa compatibilité avec diverses plateformes IA garantissent qu'Agent S peut s'intégrer sans effort dans des écosystèmes technologiques existants, en faisant un choix attrayant pour les développeurs et les organisations. Ces fonctionnalités contribuent collectivement à la position unique d'Agent S dans l'espace crypto, alors qu'il automatise des tâches complexes en plusieurs étapes avec un minimum d'intervention humaine. À mesure que le projet évolue, ses applications potentielles dans Web3 pourraient redéfinir la manière dont les interactions numériques se déroulent. Chronologie d'Agent S Le développement et les jalons d'Agent S peuvent être encapsulés dans une chronologie qui met en évidence ses événements significatifs : 27 septembre 2024 : Le concept d'Agent S a été lancé dans un document de recherche complet intitulé “Un cadre agentique ouvert qui utilise les ordinateurs comme un humain”, présentant les bases du projet. 10 octobre 2024 : Le document de recherche a été rendu publiquement disponible sur arXiv, offrant une exploration approfondie du cadre et de son évaluation de performance basée sur le benchmark OSWorld. 12 octobre 2024 : Une présentation vidéo a été publiée, fournissant un aperçu visuel des capacités et des caractéristiques d'Agent S, engageant davantage les utilisateurs et investisseurs potentiels. Ces jalons dans la chronologie illustrent non seulement les progrès d'Agent S, mais indiquent également son engagement envers la transparence et l'engagement communautaire. Points clés sur Agent S Alors que le cadre Agent S continue d'évoluer, plusieurs attributs clés se distinguent, soulignant sa nature innovante et son potentiel : Cadre innovant : Conçu pour offrir une utilisation intuitive des ordinateurs semblable à l'interaction humaine, Agent S propose une approche nouvelle de l'automatisation des tâches. Interaction autonome : La capacité d'interagir de manière autonome avec les ordinateurs via une interface graphique signifie un bond vers des solutions informatiques plus intelligentes et efficaces. Automatisation des tâches complexes : Avec sa méthodologie robuste, il peut automatiser des tâches complexes en plusieurs étapes, rendant les processus plus rapides et moins sujets aux erreurs. Amélioration continue : Les mécanismes d'apprentissage permettent à Agent S de s'améliorer grâce à ses expériences passées, améliorant continuellement sa performance et son efficacité. Polyvalence : Son adaptabilité à travers différents environnements d'exploitation comme OSWorld et WindowsAgentArena garantit qu'il peut servir un large éventail d'applications. Alors qu'Agent S se positionne dans le paysage Web3 et crypto, son potentiel à améliorer les capacités d'interaction et à automatiser les processus représente une avancée significative dans les technologies IA. Grâce à son cadre innovant, Agent S incarne l'avenir des interactions numériques, promettant une expérience plus fluide et efficace pour les utilisateurs à travers divers secteurs. Conclusion Agent S représente un saut audacieux en avant dans le mariage de l'IA et de Web3, avec la capacité de redéfinir notre interaction avec la technologie. Bien qu'il soit encore à ses débuts, les possibilités de son application sont vastes et convaincantes. Grâce à son cadre complet abordant des défis critiques, Agent S vise à mettre les interactions autonomes au premier plan de l'expérience numérique. À mesure que nous plongeons plus profondément dans les domaines des cryptomonnaies et de la décentralisation, des projets comme Agent S joueront sans aucun doute un rôle crucial dans la façon dont la technologie et la collaboration homme-machine évolueront à l'avenir.

808 vues totalesPublié le 2025.01.14Mis à jour le 2025.01.14

Qu'est ce que AGENT S

Comment acheter S

Bienvenue sur HTX.com ! Nous vous permettons d'acheter Sonic (S) de manière simple et pratique. Suivez notre guide étape par étape pour commencer votre parcours crypto.Étape 1 : Création de votre compte HTXUtilisez votre adresse e-mail ou votre numéro de téléphone pour ouvrir un compte sur HTX gratuitement. L'inscription se fait en toute simplicité et débloque toutes les fonctionnalités.Créer mon compteÉtape 2 : Choix du mode de paiement (rubrique Acheter des cryptosCarte de crédit/débit : utilisez votre carte Visa ou Mastercard pour acheter instantanément Sonic (S).Solde :utilisez les fonds du solde de votre compte HTX pour trader en toute simplicité.Prestataire tiers :pour accroître la commodité d'utilisation, nous avons ajouté des modes de paiement populaires tels que Google Pay et Apple Pay.P2P :tradez directement avec d'autres utilisateurs sur HTX.OTC (de gré à gré) : nous offrons des services personnalisés et des taux de change compétitifs aux traders.Étape 3 : stockage de vos Sonic (S)Après avoir acheté vos Sonic (S), stockez-les sur votre compte HTX. Vous pouvez également les envoyer ailleurs via un transfert sur la blockchain ou les utiliser pour trader d'autres cryptos.Étape 4 : tradez des Sonic (S)Tradez facilement Sonic (S) sur le marché Spot de HTX. Il vous suffit d'accéder à votre compte, de sélectionner la paire de trading, d'exécuter vos trades et de les suivre en temps réel. Nous offrons une expérience conviviale aux débutants comme aux traders chevronnés.

1.6k vues totalesPublié le 2025.01.15Mis à jour le 2025.03.21

Comment acheter S

Discussions

Bienvenue dans la Communauté HTX. Ici, vous pouvez vous tenir informé(e) des derniers développements de la plateforme et accéder à des analyses de marché professionnelles. Les opinions des utilisateurs sur le prix de S (S) sont présentées ci-dessous.

活动图片