Если бы вы спросили, какой AI-продукт показал самый впечатляющий рост в 2026 году, «Codex» определенно был бы на первом месте.
С января этого года количество еженедельных активных пользователей этого продукта выросло более чем в 5 раз, кривая роста очень крутая. В настоящее время его еженедельная аудитория достигла 5 миллионов человек. При этом скорость, с которой интеллектуальные работники (не разработчики) принимают Codex, более чем в 3 раза выше, чем у разработчиков.

Стоит отметить, что у этой крутой кривой роста был важный катализатор — выпуск настольного приложения в феврале. Эта десктопная версия предоставила специализированный, оптимизированный интерфейс, значительно снизила порог входа и вызвала взрывной рост скачиваний и внедрения Codex.
А за этой крутой кривой роста, за изменениями в форме продукта стоит относительно менее обсуждаемая публично фигура — руководитель команды разработки настольного приложения Codex Эндрю Амброзино.
Как человек, непосредственно отвечающий за эволюцию десктопной версии Codex, он одновременно находится на стыке двух быстро сближающихся миров: с одной стороны — инструментарий для разработчиков, сфокусированный на «написании кода», с другой — быстро расширяющийся вход для работы с AI практически во всех сценариях интеллектуального труда. От ритма выпуска продукта до изменений в поведении пользователей и того, как команда внутри переосмысливает границы «дизайна», «инжиниринга» и «продукта», — то, что он видит, часто ближе к сути этих изменений, чем сами данные о росте.
Следующее интервью с его точки зрения анализирует, что изменил Codex, почему он объединяется с ChatGPT и каковы направления его будущих итераций.

Ссылка на видео: https://www.youtube.com/watch?v=P3KDebPTUrw
Мы отредактировали часть содержания интервью, подробности смотрите в оригинальном видео.
Реализация стала дешевле,
тогда что же стало дороже?
Несколько лет назад логика разработки продукта была такой: реализация — дорого. Поэтому перед тем, как писать код, нужно было проделать огромную подготовительную работу по снижению рисков — писать документацию, проводить исследования, создавать прототипы, чтобы сделать проектирование дешевле. Именно потому, что сама реализация была дорогой, нужно было все тщательно проработать заранее.
Но теперь это предположение полностью перевернулось. В OpenAI ситуация стала такой: дать людям много токенов, у всех есть хорошие идеи, поэтому все что-то делают. В результате для одной нужной функции может быть 90 разных команд, одновременно исследующих 90 разных способов реализации.
Это означает, что реализация больше не является дорогой частью. Тогда что стало дорогим? Эндрю говорит прямо: это вкус. Конкретнее — процесс кураторства. Когда перед тобой 90 разных попыток, нужно иметь глазомер, чтобы решить: какие вещи сделаны хорошо? Как их следует интегрировать в другие функции? Как это оформить концептуально? Сколько ступеней должно быть у этого переключателя? Эти решения сами по себе сейчас — самое дорогое, самое требующее размышлений место.
Что такое вкус на самом деле?
Слово «вкус» в Кремниевой долине заезжено до дыр. Но у Эндрю оно имеет очень конкретное значение.
Есть забавная шутка: руководитель продукта Linear как-то сказал, что кто-то чрезмерно подчеркивает эстетическую часть вкуса, и привел в пример Пола Грэма — у Пола Грэма явно хороший вкус, но он носит рабочие штаны. Это показывает, что вкус — это не только внешний вид. Эндрю перечисляет содержание понятия вкуса: есть эстетический аспект, но это лишь часть; есть аспект системного мышления — как эта вещь вписывается в общую систему; есть аспект чувства направления, частью какой темы это является; аспект способа презентации. И, конечно, есть детальный аспект, например, соответствует ли эта анимация взаимодействия семантическому значению, которое она должна выражать — не слишком ли она быстрая, чтобы подходить для выражения этой концепции.

Но настоящие ключевые вопросы вкуса таковы: если мы можем построить что угодно, то чего мы хотим? Что это? Как нам туда попасть? Это и есть настоящие вопросы вкуса.
Это не только о выборе, что делать. Это и о том, как представить информацию, как достичь цели, какой носитель использовать. Вкус — это то место, где человеческий мозг по-прежнему остается наиболее ценным в эту новую эпоху.
Почему AI до сих пор плохо справляется с дизайном?
Это интересный парадокс: Codex уже очень мощный в написании кода, но когда его используют для генерации дизайна, результат часто посредственный. Редко можно сказать: «Вау, он полностью справился».
Эндрю считает, что за этим стоят несколько причин. Во-первых, практическая причина. Дизайн оценивать сложнее, чем программное обеспечение, потому что человеческий вкус, оценивающий качество дизайна, сам является частью механизма обратной связи. Это затрудняет обучение модели — в отличие от кода, объективными критериями (компилируется ли код? Функционирует ли?) измерить сложно. Во-вторых, с точки зрения исследовательских вложений, лаборатория традиционно вкладывала больше всего ресурсов в развитие тех способностей, которые ускоряют сами исследования AI. На ранних этапах моделей для кодирования очевидно, что умение писать правильный код ускорит исследования. Но качество дизайнерских способностей не так прямо ускоряет исследования AI.
Более глубокая проблема касается сложности самой работы дизайнера. В дизайне есть культурный аспект — что считается «хорошим дизайном», определяется культурой. В прошлом году все новые сайты копировали дизайн Linear, это был хороший дизайн, со вкусом. Но если модель каждый раз выдает что-то похожее на Linear, это не прогресс, а провал. Дизайн требует новизны, в то время как программная инженерия, наоборот, почти всегда хочет, чтобы код следовал известным паттернам.
Самая сложная для решения проблема лежит на уровне абстракции. Когда код управляет визуальным дизайном, между ними существует глубокое взаимодействие. Например, какая-то штука в левом верхнем углу должна в кодовой базе иметь тот же абстрактный уровень, что и что-то внизу. Это не просто вопрос того, что модель должна стать лучшим дизайнером, а в том, что модель должна понимать эти более глубокие структурные отношения — если компания завтра проведет ребрендинг, поверхностный подход — обновить 263 компонента по одному, но глубокое понимание должно быть таким: эти две внешне разные вещи семантически одинаковы, они оба являются списками, имеют одинаковые стили, передают одинаковые паттерны взаимодействия. Это понимание на уровне абстракции пока остается недостижимым для AI.
Почему Codex нельзя было выпустить раньше?
Это очень глубокое наблюдение: успех продукта зависит не только от самого дизайна, но и от момента, когда появляются соответствующие возможности модели.
Эндрю абсолютно уверен: если бы приложение Codex вышло в ноябре прошлого года, оно бы полностью провалилось на рынке. А тот же самый продукт, выпущенный в феврале, добился огромного успеха. Единственная переменная — прогресс возможностей модели за эти несколько месяцев. Другими словами, дизайн взаимодействия, пользовательский интерфейс, вся концепция продукта не изменились, но повышение уровня интеллекта модели полностью изменило результат.
Это раскрывает глубокую истину: в эпоху AI то, насколько продукт удобен и ценен, определяется не только UI-дизайном или дизайном взаимодействия, а тем, «что модель может делать в данный момент». Одна и та же идея, реализованная на старой модели, может быть бесполезной, а на новой — гениальной.
Это также меняет способ планирования продукта. Эндрю видел этот переход в предыдущей компании: больше не «что мы планируем делать в течение года», а «во что мы верим, что модель сможет делать к какому моменту, давайте перечислим все интересные вещи, сделаем для них всех прототипы, а потом решим, что можно делать сейчас, остальное отложим и подождем, когда модель совершит новый скачок, и тогда попробуем отложенные ранее идеи на обновленной модели». Потому что предпосылка того, хороша ли функция в целом, — не форма дизайна, а достаточно ли умна модель.
Исчезли ли границы между инженером, дизайнером и PM?
Ленни отмечает, что, глядя на резюме Эндрю — инженер, дизайнер, менеджер по продукту, предприниматель, он все это делал, а сейчас руководит всем десктопным приложением, — и спрашивает, подчиняется ли ему также команда дизайнеров. Эндрю смеется: «Смотря на какой неделе» — отношения подчинения постоянно меняются, но команда всегда тесно сидит вместе и работает, тесно переплетаясь.
Эндрю говорит, что внешний мир уже обсуждает «коллапс ролей», говорит, что в будущем роли больше не будут разделяться, их команда еще не дошла до этого, но пересечение ролей действительно более заметно, чем в других отделах компании и даже во всей отрасли — отчасти потому, что Codex изначально технический продукт для инженеров, дизайнеры в команде говорят на языке инженеров, менеджеры по продукту тоже могут писать код, например, другой руководитель продукта Александр имеет степень магистра компьютерных наук, а у самого Эндрю ее нет.
Он считает, что сейчас более точное описание такое: человека больше не определяют границы типа «где заканчивается дизайн и начинается инжиниринг», а скорее тем, на что он в среднем тратит время — это также связано со способом работы команды, потому что все приложение работает по принципу «собака ест свой корм», все хотят по возможности делать дела в приложении, даже если оно пока не лучший инструмент для этого, чтобы оно постепенно стало лучшим инструментом. Они также вскользь обсуждают происхождение титула «член технического штата» (member of technical staff), Эндрю считает, что, возможно, его первым начала использовать Xerox, и теперь это уже традиция в исследовательских компаниях.
Ленни спрашивает дальше: означает ли это, что в будущем все станут «строителями» (builders) без разделения функций, сохранятся ли такие классификации навыков, как PM, дизайн, инжиниринг. Позиция Эндрю четкая: он не согласен с полной отменой разделения ролей. Он видел, как многие компании заявляли «отменяем продуктовую должность, все — строители», в результате лучшие практики и опыт проб и ошибок, накопленные профессией продукта за годы, выбрасывались как ненужные из-за мысли «я тоже могу писать код». Исчезновение ощущения границ по типу «это не твоя территория» он приветствует, но у каждой профессии по-прежнему есть свой порог входа — не каждый, кто умеет пользоваться Excel, может пойти подменять в финансовый отдел.
Он также отмечает, что сменить роль сейчас действительно легче, чем раньше, потому что способности больше не привязаны намертво к «владению ли конкретным инструментом в совершенстве»: он сам долгое время считал, что не должен быть инженером, потому что не любил копаться в ассемблере, зубрить синтаксис TypeScript, а этот порог входа «владеть каким-то инструментом в совершенстве, чтобы хорошо работать» сейчас разрушается. Однако он предупреждает, что эту тенденцию сейчас чрезмерно преувеличивают.
Самые передовые на сегодняшний день способы AI-ассистированной разработки
Ленни возвращает тему на уровень глубже: от чистого ручного написания кода к тому, что AI может писать 100% кода, а теперь «написание кода» превратилось в «направление AI» — оценка того, сколько кода написал человек, почти свелась к «сколько раз ты поправил направление AI». Он спрашивает, самый передовой подход сейчас — это «цикл» (автономный цикл разработки)? Как именно сейчас работают самые продвинутые AI-команды?
Эндрю упоминает, что фундаментальный вопрос в том, что сам вопрос «сколько кода написан AI» уже не важен, потому что по стандартам прошлого года сейчас почти 100% кода написаны AI; на самом деле следует спрашивать, этот код написан «под наблюдением» или «без наблюдения», это две совершенно разные вещи. Он говорит, что рад, что эти критерии оценки постоянно обновляются, потому что это как раз показывает, что продукт движется вперед. Команда провела много исследований в направлении «автономной разработки программного обеспечения», включая множество попыток, связанных с «инжинирингом управления» (harness engineering), например, идея позволить модели самой ночью пробежаться и сделать «сборку мусора» в кодовой базе.
Он также признает, что у всех моделей сейчас есть общий недостаток — тенденция делать код все более сложным. Он в шутку говорит, что если какая-нибудь исследовательская команда слушает, хотелось бы, чтобы они лучше натренировали способность модели «удалять код». Это также практическая проблема при полной передаче разработки автопилоту, с обеих сторон — и человека, и кодовой базы: как научить модель решать, какие функции делать, какие игнорировать, какие объединять и переклассифицировать; как научить модель строить правильные абстракции. Эти способности улучшаются, но он считает, что пока невозможно достичь уровня «задать цикл, чтобы она сама улучшала продукт, одновременно отслеживая Twitter, Slack, почту», хотя команда постоянно работает в этом направлении.
Ленни спрашивает дальше: может ли наступить день, когда команда просто поставит AI конечную цель типа «выиграть» или «заработать мне миллиард», и на этом все. Эндрю смеется и говорит, что не берется категорично утверждать «никогда» или «обязательно».
Почему пришлось объединять Codex и ChatGPT?
Какое будущее ждет Codex?
Codex изначально был инструментом командной строки, потом стал отдельным приложением, первоначальное позиционирование было четким: «инструмент для разработчиков» — не IDE, можно смотреть код, но нельзя его редактировать.
Перед официальным публичным выпуском приложения команда сначала провела внутреннее тестирование в OpenAI (январь-февраль). В инженерных и исследовательских сценариях обратная связь была очень четкой и очень позитивной. Но команда одновременно обнаружила, что приложение используют люди почти из всех отделов — маркетинга, PR, финансов, юридического, хотя для них опыт не был дружелюбным, интерфейс был полон кода и запросов разрешений командной строки, совсем не предназначенный для них.
Первоначальная реакция команды — перенести возможности Codex в интерфейсы других продуктов, например, в настольное приложение ChatGPT и браузер Atlas, сделав более универсальный инструмент для интеллектуального труда. Но результат — никто не хотел уходить из приложения Codex, чтобы использовать эти «специально» созданные приложения. Это заставило команду осознать: граница между инструментами для разработчиков и универсальными инструментами для знаний рушится, Codex и ChatGPT больше похожи на разные точки входа к одному и тому же набору возможностей, а не на два независимых продукта.
Вывод команды: этот продукт должен быть достаточно универсальным, расширяемым фундаментом, способным одновременно обслуживать глубокие сценарии финансов, юридических вопросов, науки и т.д. Настоящая задача только в том, «как сделать его достаточно универсальным» — это и есть ответ команды на вопрос «Codex — это инструмент для разработчиков или просто ChatGPT?».
Ведущий Ленни отмечает: Codex уже стал удобнее и интереснее, чем само приложение ChatGPT, пользователи побежали к нему, поэтому объединение — неизбежное направление, позволяющее избежать путаницы.
Эндрю смеясь отвечает, что кто-то назвал это направление «суперирложением» (super app), и он очень сожалеет, что кто-то когда-то произнес это слово, потому что с тех пор его каждый день окружают этим термином.
Ленни спрашивает: не называя его «суперирложением», но основная идея — «пользователь приходит в одно место и может сделать все дела»? Или это пока не решено?
Ответ Эндрю — концепция «домашней базы» (home base): это должно быть хорошее «домашнее поле», место, где пользователь может отслеживать все свои задачи на разных продуктах и интерфейсах. Некоторые вещи пользователь может полностью сделать внутри приложения; для других приложение отвечает за вызов и открытие других приложений для их выполнения — например, приложение может подключиться к Excel, внутри приложения действительно есть встроенный редактор электронных таблиц, но для человека, который занимается финансированием OpenAI на миллиарды долларов и нуждается в сложном финансовом моделировании, этого встроенного редактора может быть далеко недостаточно. Поэтому приложение будет напрямую общаться с плагином Microsoft Excel на рабочем столе пользователя, а когда дело будет сделано, пользователь сможет просто закрыть Excel.
То есть речь никогда не шла о «мы рисуем на экране прямоугольник, и все должно происходить внутри этого прямоугольника», а скорее о том, что эта штука должна стать «домом» для пользователя: здесь вы начинаете работу, заканчиваете работу, автоматизируете работу, а какие инструменты нужны — она сама их вызовет.
Чтобы проиллюстрировать это, Эндрю рассказывает конкретную историю. Когда приложение Codex впервые вышло, команда сняла серию промо-видео, и монтаж этих видео лег на плечи внутреннего оператора. В итоге оператор смонтировал все эти видео, используя только Codex — это был один из первых моментов, когда команда действительно осознала: «Боже, люди на самом деле используют эту штуку для таких вещей!»
Оператору пришла в голову использовать Codex для монтажа видео чисто из любопытства, просто чтобы посмотреть, сможет ли Codex вообще это делать. Codex сам по себе совсем не видеоредактор, в интерфейсе нет никакого UI, связанного с монтажом, но он понимал, что оператор использует Premiere Pro, и мог путем прямого редактирования инженерных файлов, лежащих в основе отображаемого на экране содержимого Premiere Pro, выполнить часть операций монтажа — но этого было недостаточно для всех потребностей. Тогда Codex сделал следующее: написал себе расширение-плагин, которое можно установить в Premiere Pro, и через этот плагин начал «разговаривать» с Premiere Pro — «Эй, расширение Premiere Pro, можешь поменять мне эту метку?» Когда команда впервые увидела, как это происходит в реальности, все подумали, что это невероятно.
Таким образом, Эндрю вывел модель: в мире уже существует огромное количество профессиональных инструментов, доведенных до совершенства в своих областях, и Codex — а теперь вместе с ChatGPT — хочет делать две вещи одновременно.
Первое — как бесшовно сотрудничать с теми инструментами, которые пользователи уже используют: команде не нужно заново изобретать лучший видеоредактор, а нужно научить Codex и ChatGPT использовать существующие инструменты — уметь взаимодействовать с ними, передавать им задачи, обычно через коннекторы (connectors), возможности использования компьютера (computer use) или, как в случае с Premiere Pro, через расширения-плагины.
Второе — это идея, которую упоминал Дэн Шиппер: у пользователя уже есть куча веб-приложений, которые можно использовать, нажимая кнопки, но хочется открывать эти приложения прямо в Codex, чтобы Codex делал за пользователя больше вещей внутри них. Эти две модели почти зеркальны друг другу, и команда в настоящее время активно продвигается по обоим направлениям одновременно.
Эта статья взята с официального аккаунта WeChat «Машинный разум» (ID:almosthuman2014), автор: Машинный разум






