Codex goal模式使用指南:如何让AI持续推进一个具体目标

marsbitОпубликовано 2026-06-06Обновлено 2026-06-06

Введение

OpenAI推出的Codex目标模式(/goal)允许AI围绕一个具体目标持续工作数小时甚至数天,直至任务完成。其核心在于设定清晰、可验证的退出标准(如“部署时间降低30%”),而非冗长的需求描述。用户需提供足够的方向、工具和真实环境,让Codex能衡量进展并验证结果。文章强调,应避免让AI陷入视觉细节等模糊任务,建议将目标拆解为可评估的功能清单或指标。对于长期任务,需通过提交代码、更新文档或发送进度通知等方式跟踪进展。任务完成后,建议让AI审查并清理尝试过程中遗留的无效改动。总之,目标模式标志着AI从响应指令的助手,转变为需要被定义目标、配置环境并管理进度的工程执行者。

编者按:这篇文章来自 OpenAI 开发者关系成员 Dominik Kundel,对 Codex「goal mode / /goal」功能的使用经验进行总结。它讨论的并不是一个普通 prompt 技巧,而是 AI 编程工具正在发生的一次角色变化:Codex 不再只是响应单轮指令的代码助手,而开始成为一个可以围绕明确目标持续推进的执行型 Agent。

在 /goal 模式下,真正重要的不是把需求写得越长越细,而是为 Codex 设定清晰、可验证的退出标准。比如「部署时间降低 30%」「测试覆盖达到 100% parity」「LCP 降到 2.5 秒以下」。这些指标让 Codex 能够判断任务是否完成,也避免它在模糊目标中无限试错。与此同时,用户还需要提供足够的方向、工具和真实环境,让 Codex 能衡量进展、验证结果,而不是只在本地或假设条件下完成一个看似可行的方案。

文章尤其提醒,视觉类任务最容易让 Codex 陷入细节泥潭。与其要求「100% 像素级还原」,不如将视觉目标拆解为功能清单、设计系统规范和可评估指标。对于持续数小时甚至数天的长期任务,也需要通过 commit、draft PR、进度文档、Slack 更新或 side chat 等方式持续跟踪,避免最终只得到一堆不可追溯的改动。

这篇文章的信息增量在于,它把 /goal 重新定义为一种「长期任务管理机制」。当 AI 可以连续执行几十甚至上百小时,开发者的核心能力也随之变化:不只是让 AI 生成代码,而是为它定义目标、建立度量体系、配置执行环境,并在最后完成审查和复盘。换句话说,AI 编程正在从「写提示词」走向「管理一个持续工作的工程执行者」。

以下为原文:

我们推出了目标模式(goal mode,或 /goal),是为了帮助你让 Codex 朝着一个具体结果持续推进。当你设定一个目标后,Codex 会一直工作,直到目标达成——无论这需要几个小时,还是几天。已经有人让 Codex 为同一个目标连续工作超过 120 小时。

目标模式非常强大。想要最大化发挥它的作用,使用 /goal 时有 7 件事值得注意。

设定清晰、可验证的标准

当你激活目标模式时输入的提示词,既可以作为初始提示,更重要的是,它会成为这个目标的退出标准。Codex 会在每一轮工作之后检查:这个目标是否已经完成。

因此,你的目标提示不应该写得过长,而应该聚焦于一个清晰标准:什么情况下,才算这个目标已经达成。

多数情况下,一个好的目标最好包含一个明确的数字指标,供模型判断是否完成。例如:

「将构建和部署时间减少 30%。」

「把这个功能从 TypeScript 迁移到 Rust,并达到 100% 的测试一致性。」

「优化应用脚手架,使生产环境中的最大内容绘制(Largest Contentful Paint,衡量页面主要内容加载速度的指标)低于 2.5 秒。」

这个提示不一定总要包含数字,但通常来说,数字会让后续步骤更容易推进。

如果你还不确定该如何定义目标,或者想先和 Codex 一起头脑风暴这个项目,也不必一开始就用目标模式开启对话。

Codex 可以自行设定目标。你可以先正常开启一段对话,等你准备好让 Codex 开始执行时,再让 Codex 根据前面的讨论内容设定目标。

你也可以随时编辑目标:在 Codex 应用中点击编辑按钮,或在 CLI 中再次使用 /goal。

尽可能提供指引

像「将构建和部署时间减少 30%」这样的提示,听起来很酷,也可能让 Codex 找到一些创造性的解决方案。但如果你已经大致知道问题可能出在哪里,这种提示也可能让 Codex 走上弯路。

所以,在可能的情况下,最好告诉 Codex 应该从哪里开始排查、可以使用哪些工具来完成目标,或者给出其他提示,避免它钻进错误方向。

例如,我的同事 @reach_vb 在一次实验中就这样做了:他告诉 Codex,可以使用 Chrome 浏览器进入 Google Colab,并说明了一些可接受的限制条件,比如在让 Codex 训练模型时,可以让它自己生成数据集。

同样,如果你想缩短构建时间,并且已经知道大部分时间消耗在哪个环节,最好在提示词中先把 Codex 指向那个区域。

另一种做法是,你可以先让 Codex 在计划模式(plan mode)下做一些初步研究,并让它创建一个计划文件,用来记录潜在方案。随后,再让你的目标引用这份计划。

让进展可衡量

如果你的目标很有野心,或者 Codex 有很多种方式可以逐步接近目标,那么很重要的一点是:你要给 Codex 提供衡量进展的工具。

对于某些任务来说,这一点可能天然成立。比如优化构建时间、提高测试覆盖率,因为 Codex 通常已经能使用相关工具,或者会自然地创建这些工具。

但对于其他目标,你最好先和 Codex 一起头脑风暴:哪些工具有助于判断进展?或者给它一些提示,让它知道该如何确认自己是否正在向目标靠近。例如,为两个截图创建视觉差异比对工具,或者为你正在调试的智能体创建一套评估集。

我曾让 Codex 根据一段视频复刻一些组件,当时 Codex 为自己创建了一个工具,用来比较截图并检查差异。后来,它还持续迭代这个工具,加入了不同的差异比对模式。

根据任务不同,你还需要考虑是否有一些额外标准需要被测量或检查。否则,Codex 可能会以为任务已经完成,但在你看来其实还不完整。

比如,Codex 可能为了「像素级还原」某个 UI,直接裁剪设计参考图并内嵌到页面里;或者为了让测试通过率达到 100%,反过来削减测试覆盖范围。这些都不是你真正想要的完成方式。

创建一个真实的环境

如果你希望 Codex 真正朝目标取得有效进展,它就需要在一个足够真实的环境中运行。

在实践中,这意味着:如果你想优化部署时间或延迟问题,Codex 应该能访问部署和测试环境,而且这些环境要尽可能模拟生产环境。也就是使用相同的技术栈、相同的配置开关,以及类似的数据库。

举个例子,我们曾经在调试 developers.openai.com 的构建和部署时间优化。当时我们已经在使用部署预览,因此 Codex 可以利用这些预览环境进行部署,并查看相关日志。但问题在于,我们的预览部署和完整生产环境相比,禁用了一些构建路径。

因此,Codex 最后不得不进行手动部署,把代码部署到与生产配置更接近的环境中,才能真正检查问题所在。

类似地,你也可以让 Codex 使用 computer use(让模型操作真实应用界面的能力)来测试实际应用。为了优化 iOS 上的一些性能问题,@dimillian 甚至使用了实体设备,以获得最准确的测试环境。

谨慎设定视觉目标

给 Codex 一个视觉目标,比如「根据这张图片 100% 像素级还原这个 UI」,确实很诱人。但根据具体设置不同,这也可能带来麻烦。

如果你没有给出合适的指引和约束,Codex 可能会在某些细节上越陷越深,反而忽略整体目标。比如,如果参考图中包含一些图形元素,而你期待 Codex 生成这些元素——无论是 SVG 图标还是图片——它可能会把大量精力耗在「如何精确复刻这些素材」上,而不是正确拆解整个问题。

此外,Codex 需要工具才能正确进行视觉比较。这意味着更多图片输入、更高的整体 token 消耗,但并不一定能给 Codex 提供一种简单方式,让它识别真正有价值的改进机会。

所以,图片通常更适合作为目标上下文,而不是唯一的完成标准。你应该寻找其他方式,让 Codex 判断目标是否已经达成,例如功能清单、实现规范、是否符合设计系统等。

跟踪进展

如果 Codex 最终在后台工作数小时甚至数天,甚至是在另一台机器上运行,你很容易忘记它到底推进到哪里、已经做了哪些工作。

根据不同目标,我发现下面几种方式很有帮助:

·让 Codex 在关键节点提交代码,并推送到一个草稿 PR。尤其是当你在做网站,并且有预览部署时,这会非常有用。

·让 Codex 更新一份面向管理层的交付物。它可以是一个 HTML 文件,你可以在应用内浏览器里一直打开;也可以是·一个通过 Sites 部署给团队查看的页面;可以是一张渲染后的进度图,也可以只是一份普通的 Markdown 文件。

指示 Codex 主动发布进展更新。你也可以把这写进目标里:让 Codex 在取得重要进展时,把更新发送到 Slack 频道,或者你希望记录进展的其他地方。

使用其他聊天窗口询问状态。如果你只是想快速了解当前状态,可以运行 /side 启动一个新的侧边聊天,并在那里提问。因为它会从当前线程分叉出来,所以拥有截至目前的全部上下文,但生命周期很短。

在 Codex 应用中的另一个替代方法是:开启一个普通新聊天,让 Codex 阅读另一个目标线程,并回答你的问题。如果你让 Codex 设置一个自动化任务,定期检查进展,这种方式会尤其强大。

清理并最终确认结果

太好了,目标终于完成了!现在是不是就可以直接把成果甩给团队,然后收工?

通常来说,尤其是在优化类任务中,我发现让 Codex 回顾并审查自己完成的工作会很有帮助。你可以先用 /review 运行一次本地代码审查,但也值得让 Codex 更深入地反思:它为达成目标尝试过哪些路径?哪些尝试有效?哪些尝试无效?然后据此清理代码。

因为 Codex 会一直工作,直到达到目标,所以它可能尝试过一些效果不够好、甚至完全无效的方法,而这些残留改动可能还留在最终代码中。

给你的下一个任务也设一个 goal

Codex 的目标功能是一个极其强大的工具,可以帮助你解决一些最有意义的工程挑战。但只有当你提供了正确的环境和指令,它才能更高效地抵达目标。

你用 /goal 做过什么?

Трендовые криптовалюты

Связанные с этим вопросы

Q什么是Codex的目标模式(/goal),它的核心目的是什么?

A目标模式(goal mode,或 /goal)是OpenAI Codex的一项功能,其核心目的是让AI能够围绕一个明确、具体的目标持续工作,直到目标达成为止。它不再只是一个响应单轮指令的代码助手,而是转变为一个可以自主推进、执行任务的执行型代理。用户可以为同一个目标设定长达数小时甚至数天的连续任务。

Q在设定/goal目标时,提示词最重要的原则是什么?一个好的目标提示通常包含什么?

A提示词最重要的原则是设定清晰、可验证的退出标准。真正重要的不是把需求写得很长很细,而是要定义在什么情况下才算任务完成。一个好的目标提示通常包含一个明确的数字指标,例如“将构建和部署时间减少30%”或“测试覆盖率达到100%”,以便Codex能够客观地判断进度并决定何时停止。

Q为了最大化/goal模式的效果,用户需要为Codex提供哪三方面的支持?

A用户需要为Codex提供三方面的支持:1. **提供方向指引**:告知可能的问题排查方向、可用的工具或约束条件,避免AI走弯路。2. **创建真实的环境**:让AI能在接近生产环境的条件下运行、测试和验证结果,而不仅是本地假设。3. **建立衡量进展的体系**:提供或让AI创建必要的工具来量化进展(如性能测试工具、视觉差异比对工具),确保它能判断是否在向目标靠近。

Q文章指出,哪种类型的任务最容易让Codex陷入困境?应该如何改进对这类目标的设定?

A视觉类任务最容易让Codex陷入细节泥潭,例如要求“100%像素级还原UI”。这可能导致AI过度纠结于复刻图形素材等细节。改进方法是:避免将图片作为唯一的完成标准,而是将视觉目标拆解为功能清单、设计系统规范或可评估的性能指标(如加载速度),为AI提供更清晰、可验证的非视觉化完成标准。

Q当Codex为一个目标长时间工作时,有哪些有效的方法来跟踪其进展和状态?

A有几种有效的方法可以跟踪进展:1. **代码提交与草稿PR**:让Codex在关键节点提交代码并推送到草稿PR,便于审查和预览。2. **更新进度文档**:让AI更新一个HTML、Markdown文件或部署一个进度页面供团队查看。3. **主动通知**:在目标中指示Codex将重要进展发送到Slack等协作平台。4. **使用侧边聊天(/side)**:开启一个新的侧边聊天,基于当前上下文快速询问状态。5. **让另一个Codex实例审查**:开启新聊天,让另一个Codex阅读目标线程并汇报进度。

Похожее

Сэм Бэнкман-Фрид хочет создать новый токен, чтобы вернуть средства жертвам FTX. Возможно ли это?

Сам Бэнкман-Фрид, осужденный основатель рухнувшей криптобиржи FTX, вновь оказался в заголовках. Сообщается, что он выразил надежду на создание нового токена для возмещения убытков жертвам краха. Однако эти заявления следует рассматривать исключительно как его личное мнение, а не как реальный план. Юридическая реальность прямо противоречит такой возможности. 12 июня 2026 года апелляционный суд США оставил в силе 25-летний тюремный срок Бэнкман-Фрида. Как осужденный преступник, отбывающий длительный срок, он сталкивается с непреодолимыми препятствиями для управления компаниями, привлечения капитала или выпуска каких-либо токенов. Любые подобные инициативы потребовали бы одобрения судов, регуляторов и администраторов по делам о банкротстве, чего на данный момент не существует. Тем не менее, эта тема привлекает внимание, поскольку FTX остается одним из самых громких крахов в истории крипторынка. Любое упоминание о возможном возмещении ущерба жертвам вызывает резонанс. В конечном счете, реальный процесс возврата средств жертвам FTX зависит исключительно от официальных судебных и процедур банкротства, а не от непроверенных идей, высказанных из тюремной камеры.

bitcoinist6 ч. назад

Сэм Бэнкман-Фрид хочет создать новый токен, чтобы вернуть средства жертвам FTX. Возможно ли это?

bitcoinist6 ч. назад

BlackRock запускает биткоин-ETF с покрытым коллом под тикером BITA

Компания BlackRock запустила iShares Bitcoin Premium Income ETF (тикер BITA) — биткоин-ETF, использующий стратегию покрытого колла для генерации дохода. В отличие от спотовых ETF, BITA продает опционы колл на базовый актив, получая премию и выплачивая ежемесячный доход инвесторам. Это дает более консервативным инвесторам возможность получить доход, связанный с криптовалютой, без прямого использования DeFi или зарубежных кредитных продуктов. Однако существует компромисс: стратегия ограничивает потенциал роста при сильном ралли биткоина, но может быть привлекательна на боковом или волатильном рынке. Запуск BITA демонстрирует эволюцию рынка биткоин-ETF от простого доступа к сложным стратегиям, таким как получение дохода и хеджирование, что способствует интеграции биткоина в традиционные инвестиционные портфели. Продукт рассчитан в первую очередь на инвесторов и финансовых советников, которые уже верят в биткоин, но ищут сглаженный, ориентированный на доход продукт в рамках брокерского счета. Это не замена спотовому биткоину или ETF IBIT, а другой инструмент, чьи характеристики риска и доходности необходимо четко понимать.

bitcoinist8 ч. назад

BlackRock запускает биткоин-ETF с покрытым коллом под тикером BITA

bitcoinist8 ч. назад

Дэвид Шварц поддерживает обновление XRP Ledger 3.2.0, переведя крупный хаб XRPL

Дэвид Шварц, один из создателей XRP Ledger и технический директор Ripple Labs, поддержал переход ключевого узла сети XRPL на версию 3.2.0. Этот апгрейд, завершенный менее чем за десять минут планового обслуживания, демонстрирует приверженность последним версиям программного обеспечения XRP Ledger. Версия 3.2.0 знаменует переименование базового ПО в «xrpld» (ранее «rippled»), чтобы подчеркнуть независимость реестра от компании Ripple. Обновление включает оптимизацию использования памяти, что может снизить потребление серверами до 40%, и поправку fixCleanup3_2_0 для усиления защиты таких функций, как сейфы с одним активом, кредитные протоколы и децентрализованные биржи (DEX). Также введены улучшения для разработчиков: упрощен доступ к информации о протоколе и конфигурациям серверов, что должно помочь в интеграции кошельков, работе обозревателей блокчейна и API. Параллельно Фонд XRP Ledger работает над обновлением валидаторов и сети, внося изменения в уникальный список узлов. Рынок наблюдает за влиянием этих обновлений на экосистему сети XRP Ledger.

TheNewsCrypto9 ч. назад

Дэвид Шварц поддерживает обновление XRP Ledger 3.2.0, переведя крупный хаб XRPL

TheNewsCrypto9 ч. назад

Почему повышение процентных ставок Японии вызывает нервозность во всем мире?

В июне 2026 года Банк Японии объявил о повышении ключевой ставки до 1%, впервые с 1995 года. Хотя этот уровень кажется незначительным на фоне ставок США и Европы, это событие вызвало повышенное внимание мировых финансовых рынков. Причина в уникальной роли Японии как глобального источника дешевого финансирования на протяжении более двух десятилетий. Долгий период сверхнизких (около нуля или отрицательных) ставок превратил иену в основную валюту для операций кэрри-трейд — инвесторы занимали дешевые йены для вложений в более доходные активы по всему миру, поддерживая рост цен на многие классы активов. Изменение курса Японии обусловлено структурными сдвигами: устойчивый рост инфляции выше целевого уровня в 2%, значительное повышение заработной платы (свыше 5% три года подряд), что создает долгожданный цикл «зарплаты — инфляция», а также давлением на иену из-за большого разрыва в ставках с США. Повышение ставок в Японии угрожает фундаменту глобальных арбитражных сделок. Рост стоимости заимствования в йенах вынуждает инвесторов пересматривать риски и снижать кредитное плечо, что может привести к синхронному сокращению ликвидности на мировых рынках. Ключевым фактором остается динамика разницы ставок между США и Японией: если ФРС начнет снижать ставки, а Банк Японии продолжит ужесточение, это может кардинально изменить глобальные потоки капитала. Таким образом, рынки реагируют не на текущий уровень ставки в 1%, а на конец эры дешевых йен и возможную переоценку моделей ценообразования активов, построенных на этой предпосылке.

marsbit10 ч. назад

Почему повышение процентных ставок Японии вызывает нервозность во всем мире?

marsbit10 ч. назад

Конгресс одобряет запрет на CBDC до 2030 года в рамках крупного законопроекта о жилищной реформе

Законодатели приняли законопроект о реформе жилищного сектора, который включает временный запрет на создание цифрового доллара (CBDC) Федеральной резервной системой до 31 декабря 2030 года. Эта мера, включённая в двухпартийный «Закон о дороге к жилью XXI века», призвана дать политикам время на изучение потенциального воздействия CBDC, включая вопросы конфиденциальности и финансового надзора. Запрет касается розничного цифрового доллара, выпускаемого напрямую или через посредников, но не ограничивает работу открытых блокчейн-сетей. Хотя основной целью законопроекта является решение проблем с доступным жильём, положение о CBDC привлекло значительное внимание в криптосообществе, поскольку может повлиять на будущее цифровых платежей в США. Дальнейшие шаги в законодательном процессе определят судьбу этого запрета.

TheNewsCrypto11 ч. назад

Конгресс одобряет запрет на CBDC до 2030 года в рамках крупного законопроекта о жилищной реформе

TheNewsCrypto11 ч. назад

Торговля

Спот
Фьючерсы

Популярные статьи

Неделя обучения по популярным токенам (2): 2026 может стать годом приложений реального времени, сектор AI продолжает оставаться в тренде

2025 год — год институциональных инвесторов, в будущем он будет доминировать в приложениях реального времени.

1.8k просмотров всегоОпубликовано 2025.12.16Обновлено 2025.12.16

Неделя обучения по популярным токенам (2): 2026 может стать годом приложений реального времени, сектор AI продолжает оставаться в тренде

Обсуждения

Добро пожаловать в Сообщество HTX. Здесь вы сможете быть в курсе последних новостей о развитии платформы и получить доступ к профессиональной аналитической информации о рынке. Мнения пользователей о цене на AI (AI) представлены ниже.

活动图片