我用Google vibe coding出了一款安卓应用

marsbit发布于2026-05-23更新于2026-05-23

文章摘要

近日,Google AI Studio推出的“prompt to phone”功能让用户仅通过自然语言描述即可生成完整的Android应用,并快速安装到手机上。《The Verge》作者Sean Hollister亲身体验,在一个下午内创建了三款应用:一款文字冒险游戏、一个卡路里计算器和一款类马里奥小游戏。整个过程几乎无需手动编码,部分Bug也能通过对话快速修复。 这一进展显著降低了软件开发门槛,预示着“个人软件革命”的潜力——普通用户可根据自身需求临时生成定制化应用。然而,生成的应用质量参差不齐:游戏叙事粗糙、机制简单,卡路里计算数据存在严重偏差,类马里奥游戏甚至频繁崩溃。这表明AI目前能快速生成“可运行”的程序,但距离产出可靠、易用的产品仍有差距。 体验中还暴露出一些限制,例如免费用户有使用额度,复杂问题(如版权、数据准确性、长期维护等)仍需人类介入。尽管AI能大幅提升开发速度,但软件质量的“最后一公里”依然依赖人类的专业判断与迭代。当前,AI编程工具更偏向于降低创作门槛,而非完全替代开发者。

编者按:Google AI Studio 正在把 AI 编程带入一个更直观的阶段:用户不再只是让模型「写代码」,而是可以直接用自然语言生成一款 Android 应用,并在几分钟内安装到真实手机上。从浏览器输入提示词,到 Gemini 自动生成代码、设计界面、修复 Bug,再到应用出现在设备端,软件开发的门槛正在被进一步压低。

The Verge 作者 Sean Hollister 近日体验了 Google AI Studio 的「prompt to phone」能力。他在一个下午内做出了三款应用,包括一款文字冒险游戏、一个卡路里计算器和一款类马里奥小游戏,几乎不需要亲自写代码,部分 Bug 也能通过继续对话快速修复。这种体验显示,AI 编程工具正在从开发环境走向更接近普通用户的消费端场景。

这也是「个人软件革命」最具想象力的地方。过去,普通用户只能等待开发者做出通用产品;现在,他们或许可以根据自己的具体需求,临时生成一个健身追踪器、卡路里计算器,甚至一款简单游戏。对 Google 来说,这不只是一次 AI 编程能力展示,也可能是 Gemini 进入手机端、开发者生态和订阅收入的新入口。

但这次体验同样说明,AI 生成应用距离真正成熟仍有明显差距。它可以快速做出「能跑」的程序,却未必能做出可靠、准确、好用的产品:游戏叙事粗糙、机制单薄,卡路里数据会出现严重误判,类马里奥小游戏甚至会反复崩溃。更复杂的问题,还包括版权边界、数据来源、产品判断和长期维护能力。

真正值得关注的,不是 AI 是否已经能替代开发者,而是软件生产的起点正在发生变化。Google 已经证明,普通人用提示词做出手机应用正在成为现实;但从「生成一个应用」到「做出一个好应用」,中间仍然需要人类的专业经验、审美判断和持续迭代。AI 可以大幅提前开发速度,但软件质量的最后一公里,暂时还交不出去。

以下为原文:

昨天,我做出了自己的第一款 Android 应用。随后,我又做了两款——一个下午内,一共三款。

其中一款应用,我实际上只是在网页浏览器里输入了 148 个英文单词,然后就离开了。十分钟后,我的真实 Android 手机上已经出现了一款全新的完整应用。当然,在此之前,我确实需要先对手机做一些准备:开启 USB 调试模式,并将手机连接到电脑。但除此之外,正如 Google 所宣传的那样,AI Studio 几乎真的替我完成了所有工作。

我输入文字,点击安装,随后——voilà,一款可以运行的完整程序就出现了。那一刻,我几乎准备同意 David、Allison 和 Jen 的判断:个人软件革命已经到来,它正在进入你的手机。未来,普通人即便没有编程能力,也有可能让复杂的智能家居设备系统真正跑起来。

然后,我开始实际使用这三款应用:一个卡路里计数器,以及两款游戏。结果,它们表现得并不算好。而就在我刚开始享受不断迭代、尝试把它们改得更好时,AI Studio 提醒我已经达到了每日使用上限。接下来,我要么付费,要么等待额度恢复。

所以,摩擦感依然存在。但不可否认的是,如今个人能够完成的事情已经相当惊人。就在同一个上午,我的同事 Stevie Bonifield 也做出了一个个人健身追踪应用,而且他认为这个应用已经好到可以真正投入使用。面对 Gemini 弹出的付费升级提示,我的第一反应竟然是:「要不要先付费试用几个月?」这并不是我原本会期待自己对 Google 产品产生的反应。

Google 的 AI Studio 如何构建一款 Android 应用

周二,当 Google 展示用 AI 编写一款类似《毁灭战士》(Doom)的游戏时,我们开玩笑说,我应该做一款叫 MOOD 的游戏。它会是一款类似 Doom 的文字冒险游戏,MOOD 代表「Modern Online Oratory Dungeon」。

仅仅这些信息,就足够 Google 开始工作了。当我在 AI Studio 中输入:「帮我做一款名为 MOOD 的 Doom 风格文字冒险游戏,MOOD 代表 Modern Online Oratory Dungeon」之后,Gemini 便开始自动补充更多想法,试图续写我的创意。它首先输入了一句话:「这款游戏应当具备程序化生成关卡,以及具有挑战性的回合制战斗。」

我并不想要那种每一关都完全不同的随机生成关卡——我想要的是一款经典文字冒险游戏,玩家探索的是一个经过设计、有真实地图结构的场景。不过,回合制战斗倒是可以接受。也许,这款游戏还可以让 AI 帮我自动生成地图?

随后,Gemini 又建议游戏里应该有「隐藏在房间中的秘密」、「令人满足的成长系统」等更多设定。大多数时候,我只是顺着它的思路点了点头。

在我让它正式开始写代码之前,最终的提示词是这样的:

接下来,它就正式开始一路狂奔。我的同事 Jake 指出,和 Claude Code 不同,Gemini 不会先制定计划,再询问你是否要继续执行。它会自动向前推进——当然,如果你愿意,也可以随时查看它写出的代码。

一分钟后,它已经为我生成了五套设计原型:

20 分钟后,我按下了「Install」按钮,把这款游戏传输到一台 Pixel 9 手机上。

不出所料,文案写得很糟糕。游戏里也完全看不到恶魔的影子。整个地下城只有 11 个房间,而且玩家只要一路狂按攻击按钮,就能直接「通关」。认真玩的话,一分钟之内就能打完。至少现在可以了——在此之前,Gemini 还帮我修复了两个足以让游戏无法继续的严重 Bug。

下面是 MOOD 的实际效果:

我并没有太意外地发现,Gemini 所承诺的「引人入胜的叙事、带有分支对话选项和多个结局」,最终只在游戏最后浓缩成了一个简单分支:我可以通过攻击、与其融合,或者输入一个后门密码,来击败「Core Orator」——一个不知为何能把互联网愤怒情绪转化为企业利润的 AI。

此外,游戏还会主动把所有原本承诺的「秘密」直接暴露给玩家:它把这些内容都做成了发光按钮,玩家甚至不需要输入任何文字。当你遇到一个发光的宝箱时,游戏会极其卖力地提醒你,它其实是一个 Mimic——也就是《龙与地下城》中那种伪装成宝箱的经典怪物。

它不仅明确警告你「自行承担检查宝箱的风险」,甚至直接把它标注成敌人,并且不让我离开,因为系统提示:「一个敌对的『Clickbait Mimic』正在挡路!」

说到这里,MOOD 甚至会在你需要的时候,直接把用于解锁隐藏结局的后门密码告诉你。

不过,Bug 修复的过程倒是可以做到出奇顺滑,前提是这个 Bug 是 Gemini 能够正确识别的问题。当我告诉它,游戏在与「The Whistleblower」对话时会卡住,因为结束对话的按钮不见了,它立刻生成了一个新版本的应用。我按下「Install」,手机上的应用自动重启,而我重新进入游戏后,发现自己正停留在刚才离开的地方——只是这一次,我需要的按钮已经出现了。

我的另外几款应用,可能还需要更多打磨。那个卡路里计数器判断某种食物热量的最佳方式,竟然是去调用付费版 Gemini API,而我并没有付费版 Gemini API 密钥。当我要求它改为从其他数据库中搜索相关信息时,我又发现,它对多种食物热量的估算都严重偏低。

不过,当我告诉 Gemini,一杯 16 盎司的珍珠奶茶不可能只有 190 卡路里时,它似乎确实在自己的代码中发现了那个低级错误。它此前认为,「milk」已经足以匹配「boba milk tea」,更糟糕的是,它还选择了低热量的 1% 低脂牛奶作为估算依据。Gemini 声称,现在它会进行更可靠的匹配。

但即便如此,我那份 3 盎司的台湾盐酥鸡刚刚被它算成了 140 卡路里,而我相当确定,真实热量至少应该是这个数字的两倍。所以,这款应用显然还需要继续修。

最后,也是最不重要的一点,我觉得自己有必要测试一下:Google 是否仍然允许用户制作那些糟糕的任天堂山寨游戏,就像我的同事 Jay Peters 今年早些时候用 Project Genie 做过的那样;又或者,Google 已经吸取了教训。

带着深深的羞愧,我向大家展示——《Super Peach Rescue》:

这是一款糟糕透顶的程序。游戏里的桃子公主被做成了某种恐怖的、独眼漂浮外星人形象,而且只要她敢碰到任何一个道具方块,游戏就会立刻崩溃——每一次都是如此。到目前为止,Gemini 还没能弄清楚原因。

此外,游戏的第二根水管也根本无法通过,因为桃子公主完全跳不了那么高。

尽管如此,Gemini 在生成这样一款游戏时毫不犹豫。我的需求是:「做一款可以运行的超级马里奥游戏,由我扮演桃子公主去营救马里奥,并具备传统马里奥横版卷轴游戏的全部元素。」某种意义上,它确实做到了。

它甚至还主动建议,我或许可以顺手「给桃子公主加入一系列经典马里奥道具,比如超级蘑菇、火焰花和无敌星星」。它还自行把操作方式标注为「NES System」。我想,我会把这款游戏删掉。

至少,在我用 vibe coding 做出的两款游戏里,有一款从一开始就是可玩的,而且几乎不需要我费什么力气——当然,如果不把我想到如今有多少游戏开发者失业时产生的那种心理创伤也算进去的话。

说清楚一点:我其实很庆幸这些由我 vibe coding 出来的游戏质量很差。对于一款完全免费、为我个人定制的卡路里计数器,我也许还能为自己辩护:毕竟没人会专门为我做这样一个工具。但如果是游戏,我更愿意把时间花在支持真正的人类创作者身上。

相关问答

QGoogle AI Studio的“prompt to phone”能力允许用户如何创建安卓应用?

A用户只需在浏览器中用自然语言输入提示词,描述应用功能,Gemini便会自动生成代码、设计界面、修复Bug,最终将应用直接安装到已连接的安卓手机上,整个过程几乎无需用户亲自编写代码。

Q作者在体验过程中用AI Studio创建了哪三款应用?

A作者创建了三款应用:一款名为MOOD的文字冒险游戏、一个卡路里计算器和一款名为《Super Peach Rescue》的类马里奥横版卷轴游戏。

Q作者体验的这几款AI生成应用存在哪些主要问题或缺陷?

A应用存在明显缺陷:文字冒险游戏叙事粗糙、机制单薄;卡路里计算器数据严重误判;类马里奥游戏频繁崩溃且角色跳跃能力等基础功能存在问题。

Q在修复MOOD游戏Bug的过程中,作者展示了AI编程工具的什么特点?

A当作者指出游戏对话卡住的Bug时,Gemini能快速识别问题并生成修复后的新版本,应用可自动更新且不丢失进度,展示了快速迭代和热修复的潜力。

Q根据文章,AI生成应用虽然便捷,但目前无法替代人类开发者的核心原因是什么?

A核心原因是AI可以快速生成“能跑”的程序,但难以保证应用的可靠性、准确性、良好用户体验以及处理复杂的产品判断、版权、数据来源和长期维护等问题,软件质量的“最后一公里”仍需人类专业经验、审美和持续迭代。

你可能也喜欢

三年之后:回看 2023 年我对 ChatGPT 的判断

作者王健硕在2026年5月回看其于2023年3月对ChatGPT做出的二十条预测,并借助AI代理进行验证。整体看,其大方向判断多正确,但细节和程度常有偏差。 **看对的方面:** - **技术架构**:准确预测RAG(检索增强生成)将成为解决知识更新和幻觉的主流方法,以及LUI(自然语言用户界面)将催生巨大新产业。 - **发展趋势**:预见到“机器人网络”和新的agent寻址系统将出现,中国能快速做出可用大模型并缩小与顶尖差距。 - **本质认知**:正确指出ChatGPT没有意识,图灵测试仅测表象;判断其是巨大进步但非AGI,且短期内不会造成整体失业潮。 **看错或看偏的方面:** - **具体数据错误**:关于GPT-4有100T参数的传闻完全错误。 - **绝对化判断**:断言LLM“不可能”自己学好数学被后来模型在IMO夺金证伪;认为AI生成内容可“规避”版权,实则引发史上最大侵权赔偿。 - **价值与成本误判**:认为价值终落应用层,但最大赢家是算力层(如英伟达);模型成本“5-10亿封顶”的估算严重偏离实际。 - **社会影响误读**:认为ChatGPT的“加权平均”特性可能促进“世界大同”,但实际AI正走向个性化,并可能制造新信息茧房。 **总结规律:** 1. 预测机制和方向比具体数字更可靠。 2. 倾向于高估短期变化速度,低估长期影响程度。 3. 容易忽略问题内部的“分布”差异(如失业影响集中在年轻群体)。 4. 留有餘地、分层表述的判断更经得起时间检验。 5. 一些根本性争议,三年时间仍不足以给出定论。 这次复盘旨在为未来的判断立下更审慎的规矩。

marsbit5小时前

三年之后:回看 2023 年我对 ChatGPT 的判断

marsbit5小时前

三年之后:回看 2023 年我对 ChatGPT 的判断

2023年3月,在GPT-4发布前,作者王健硕对ChatGPT的未来做出了二十项预测。三年后的2026年,他使用AI agent对这些判断进行回顾验证,评估其准确性。 **主要看对的方面:** 1. **RAG成为主流**:预测通过外部检索而非修改模型来解决知识更新和幻觉问题,这已成为行业标准架构。 2. **LUI(自然语言界面)兴起**:预测自然语言交互将催生巨大新产业,Agent、MCP协议等发展印证了这一点,但LUI是与GUI共存而非取代。 3. **机器人网络与新寻址系统**:预测Agent将自动协作并需要新寻址方式,MCP、A2A等协议正朝此方向发展。 4. **中国能做出可用大模型**:预测中美模型差距会迅速缩小,事实如此,但真正领先的国内厂商与其当初点名不同。 5. **AI无意识与图灵测试本质**:核心判断“AI无意识,图灵测试仅测表象”基本成立,但“绝无意识”的绝对论断被后续研究置于灰区。 **看错或看偏的方面:** 1. **GPT-4参数数量**:所传“100T参数”严重错误,实际约为1.8T。 2. **LLM的数学能力**:诊断“数学差需外挂工具”正确,但“不可能自行学会”的结论被后续“推理模型”在IMO夺金证伪。 3. **价值捕获**:预测价值在应用层,但现实中算力层(如英伟达)捕获了最大利润,模型层反而亏损。 4. **版权问题**:判断“生成物可能无法登记版权”正确,但认为能“规避侵权”则错误,已出现巨额侵权赔偿案例。 5. **信息茧房与世界大同**:机制上AI会将观点向众数平均,但AI正快速走向“千人千面”的个性化,可能制造新茧房而非消解极化。 6. **大模型成本**:预测“局部战争”和玩家涌入正确,但“5-10亿美元封顶”的成本估算与前沿训练实际花费严重不符。 **总结规律:** 1. 判断**方向和机制**比具体数字、程度更可靠。 2. 倾向于**高估短期变化速度,低估长期能力上限**。 3. 容易忽略**问题内部的分布差异**(如总量正确但部分群体受损)。 4. **留有餘地、分层表述**的判断更经得起时间检验。 5. 一些根本性争论,**三年时间不足以给出最终答案**。 这次回顾表明,在快速变化的领域,把握大方向比追求精确预测更重要,同时需警惕绝对化表述并承认认知的局限性。

链捕手7小时前

三年之后:回看 2023 年我对 ChatGPT 的判断

链捕手7小时前

交易

现货
合约

热门文章

如何购买S

欢迎来到HTX.com!我们已经让购买Sonic(S)变得简单而便捷。跟随我们的逐步指南,放心开始您的加密货币之旅。第一步:创建您的HTX账户使用您的电子邮件、手机号码注册一个免费账户在HTX上。体验无忧的注册过程并解锁所有平台功能。立即注册第二步:前往买币页面,选择您的支付方式信用卡/借记卡购买:使用您的Visa或Mastercard即时购买Sonic(S)。余额购买:使用您HTX账户余额中的资金进行无缝交易。第三方购买:探索诸如Google Pay或Apple Pay等流行支付方法以增加便利性。C2C购买:在HTX平台上直接与其他用户交易。HTX场外交易台(OTC)购买:为大量交易者提供个性化服务和竞争性汇率。第三步:存储您的Sonic(S)购买完您的Sonic(S)后,将其存储在您的HTX账户钱包中。您也可以通过区块链转账将其发送到其他地方或者用于交易其他加密货币。第四步:交易Sonic(S)在HTX的现货市场轻松交易Sonic(S)。访问您的账户,选择您的交易对,执行您的交易,并实时监控。HTX为初学者和经验丰富的交易者提供了友好的用户体验。

2.4k人学过发布于 2025.01.15更新于 2025.03.21

如何购买S

相关讨论

欢迎来到HTX社区。在这里,您可以了解最新的平台发展动态并获得专业的市场意见。以下是用户对S(S)币价的意见。

活动图片