Автор | 字母AI
Компания Anthropic вчера вечером опубликовала большую статью под заголовком «Когда ИИ строит себя сам». Звучит как научно-фантастический роман Азимова, и тема действительно фантастическая: рекурсивное самосовершенствование.
Проще говоря, раньше исследователи-люди писали код, проводили эксперименты, обучали модели и делали ИИ сильнее. Но если ИИ сам начнет участвовать в проектировании, обучении, тестировании и оптимизации своих будущих версий, то скорость прогресса ИИ перестанет зависеть только от человека и, возможно, начнется «самоэволюция» ИИ.
В связи с этим Anthropic призывает:
«Мы считаем, что если мир сможет выбрать замедление или временную приостановку разработки передового ИИ, чтобы социальные структуры и исследования по безопасности поспевали за техническим прогрессом, это будет чрезвычайно полезно для мира.»
Эта фраза звучит как предупреждение о безопасности, но в контексте подготовки Anthropic к IPO ее трудно не рассматривать как другую предварительную установку нарратива: Claude настолько хорош, что даже начал создавать следующее поколение Claude самостоятельно.
Новая буря уже на горизонте
Чтобы проиллюстрировать, что ИИ все больше участвует в самой разработке ИИ, Anthropic приводит множество внутренних данных.
Например, по состоянию на май 2026 года, более 80% кода, интегрированного в код Anthropic, было написано Claude. До выхода Claude Code эта цифра была лишь однозначной.
К второму кварталу 2026 года, по статистике Anthropic, объем кода, сливаемого инженерами ежедневно, стал примерно в 8 раз выше, чем в 2024 году.
Более важным, чем объем кода, является то, что Claude начинает решать более открытые инженерные задачи.
Anthropic в статье говорит, что за последний год частота, с которой сотрудники исправляли Claude, возвращали его в нужное русло или перехватывали задачи, постоянно снижалась. Это изменение произошло не только на простых задачах, но и на самых сложных открытых задачах.
Под открытыми задачами подразумеваются проблемы без четкой спецификации. Например, сбой системы, падение задачи обучения — инженеры изначально сами не знают, как должен выглядеть ответ, могут только исследовать и судить по ходу дела.
Такие задачи раньше больше всего зависели от человеческого опыта, а в самых открытых задачах уровень успешности Claude к маю 2026 года достиг 76%, увеличившись на 50 процентных пунктов за шесть месяцев.
Claude не только пишет код, но и используется Anthropic для проверки кода, поиска ошибок, уязвимостей безопасности и других дефектов. Их ретроспективный анализ показал, что если бы каждое изменение кода проходило автоматическую проверку Claude, примерно треть багов, приводивших к инцидентам на claude.ai, можно было бы остановить до развертывания.
Более того, Claude начал участвовать в исследовательском процессе.
У Anthropic есть фиксированный тест: дать Claude код для обучения маленькой модели и заставить его ускорить выполнение кода, не искажая результат. В мае 2025 года Claude Opus 4 мог обеспечить ускорение примерно в 3 раза; к апрелю 2026 года Claude Mythos Preview увеличил это число примерно до 52 раз.
Anthropic также приводит пример открытого исследования безопасности ИИ. Они поручили агенту на основе Claude задачу: может ли более слабая модель надежно контролировать более сильную?
Этот процесс требует выдвижения гипотез, их тестирования, обмена результатами с параллельными агентами и итераций.
Два исследователя-человека потратили неделю, сократив разрыв примерно на 23%; а Claude за кумулятивные ~800 часов и затраты на вычисления около 18 тысяч долларов сократил разрыв на 97%.
Конечно, у этого результата есть ограничения: проблему выбрали люди, критерии оценки задали люди, и результат не был полностью перенесен на производственные модели. Но это все равно показывает, что Claude уже может в рамках исследовательской структуры, заданной человеком, самостоятельно проектировать эксперименты, выполнять их и итерировать.
Кроме того, когда исследователь-человек «сбивается с пути», Claude может предложить лучшее следующее решение.
Anthropic взяла 129 внутренних сессий исследования Claude Code, где исследователи-люди и Claude вместе решали открытые исследовательские проблемы. Anthropic выбрала некоторые узлы, где «люди позже доказали, что пошли окольным путем», дала контекст до этого узла разным версиям Claude и посмотрела, что они предложат в качестве следующего шага. Затем другой Claude, знающий исход всей сессии, должен был оценить: предложение модели или выбор человека на тот момент были лучше.
Результаты показали, что в тех узлах, где исследователи-люди, как позже выяснилось, имели потенциал для улучшения, Claude все чаще мог предложить лучший следующий шаг.
Раньше прогресс моделей ИИ в основном обеспечивался исследователями-людьми и инженерами. Люди решали, какие эксперименты проводить, писали код, обучали модели и продвигали функциональные итерации ИИ.
Теперь все больше звеньев в этой цепочке начинает перехватывать Claude.
Anthropic приводит очень наглядную таблицу этапов:
С 2021 по 2023 год Anthropic ничем не отличалась от обычной технологической компании: люди писали код и документацию на ноутбуках.
С 2023 по 2025 год чат-боты начали входить в рабочий процесс. Инженеры заставляли модели генерировать фрагменты кода и копировали их в редактор.
С 2025 по 2026 год появились агенты-программисты, Claude начал самостоятельно писать и изменять код, иногда даже выполнять целые файлы.
Сегодня агенты уже могут сами запускать код и делегировать работу продолжительностью в несколько часов другим агентам.
Далее идет этап, которого Anthropic действительно опасается: замкнутый контур.
Если этот день наступит, последующие версии Claude смогут непрерывно совершенствоваться самим Claude — это и есть рекурсивное самосовершенствование.
Anthropic в статье говорит очень осторожно: мы еще не дошли до этого, и рекурсивное самосовершенствование не является неизбежным. Но она все же подчеркивает, что путь к этому шагу начал становиться видимым.
Вот почему Anthropic в конце статьи говорит о замедлении и даже приостановке. Их идея не в том, чтобы все компании ИИ немедленно остановились, а в том, что если риски самоулучшения ИИ в будущем продолжат расти, передовым лабораториям понадобится скоординированный, проверяемый механизм замедления.
Другими словами, «сингулярность» приближается, и человечество должно ее контролировать.
Неудержимый Claude
Если смотреть поверхностно, это очень дальновидный документ по безопасности. Anthropic говорит о рекурсивном самосовершенствовании, о том, что ИИ может улучшать себя все быстрее, о том, что человеческому обществу нужно заранее подготовить механизмы замедления и приостановки.
Но в контексте подготовки Anthropic к IPO эта статья приобретает другой смысл.
В каком-то смысле, недавние действия компании A похожи на поведение отличника, который и способный, но и немного выпендрежник — у него действительно есть способности, но он действительно любит покрасоваться.
Она хочет сказать не только «у нас есть очень сильный Claude», а нечто более продвинутое: «Claude помогает нам создавать более сильного Claude».
Если бы Anthropic просто продавала модель или инструмент, ей было бы трудно полностью избежать горизонтального сравнения: у Anthropic есть Claude, у OpenAI есть GPT; у Anthropic есть Claude Code, у OpenAI есть Codex; Anthropic переманивает корпоративных клиентов, OpenAI тоже переманивает. Конкуренция между двумя компаниями очень жесткая, и все сводится к тому, кто сможет рассказать рынку более масштабную историю.
Стоит отметить, что всего 3 дня назад OpenAI в документе о регулировании передового ИИ написала:
«Мы также видим ранние признаки рекурсивного самосовершенствования в сегодняшних системах: развитие ИИ само ускоряется ИИ.
Это усилит конкурентное давление между разработчиками и странами и создаст проблемы управления, с которыми существующие институты не смогут справиться.»
Три дня спустя Anthropic говорит: путь Claude к рекурсивному самосовершенствованию начал становиться видимым.
Если Claude действительно будет развиваться так, как они ожидают, это будет не просто обычная продуктовая история, а превратится в маховик разработки.
Claude пишет код, проводит эксперименты, оптимизирует процессы обучения, что, в свою очередь, уменьшает количество инцидентов в собственных продуктах Anthropic… Как только эта система заработает, Claude станет не просто продуктом Anthropic, а важным производственным инструментом компании.
Пользователи видят продукт Claude, корпоративные клиенты покупают возможности Claude, но Anthropic на самом деле хочет привлечь внимание рынка капитала к тому, что Claude уже встроен в базовые процессы разработки передовых моделей, он помещен в машинное отделение Anthropic.
Рынок капитала больше всего любит истории о маховиках, о самовозобновляющемся источнике богатства: более сильный Claude позволяет инженерам Anthropic сливать больше кода, больше кода позволяет быстрее итерировать продукты и инфраструктуру, более быстрая итерация позволяет исследователям проводить больше экспериментов, больше экспериментов, в свою очередь, помогает следующему поколению Claude становиться сильнее. Следующее поколение Claude, став сильнее, продолжает ускорять разработку Anthropic.
Скорость итераций Claude также поддерживает этот маховик. Судя по времени публичного выпуска, с 2023 года до начала 2025 года основные обновления моделей Claude в основном происходили каждые три-четыре месяца, но с выходом Claude 4 обновления моделей Anthropic явно участились.
Claude 4 был выпущен в мае 2025 года, Opus 4.1 — в августе, Sonnet 4.5 — в сентябре, Haiku 4.5 — в октябре, Opus 4.5 — в ноябре.
В 2026 году Opus 4.6 был выпущен 5 февраля, Sonnet 4.6 — 17 февраля, Opus 4.7 — 15 апреля, Opus 4.8 — 28 мая. От Opus 4.7 до Opus 4.8 прошло всего 42 дня.
Внешне Anthropic говорит: «Это может быть опасно, нам нужно заранее подготовить тормоза», но одновременно она намекает: «Мы уже видим, что произойдет, когда педаль газа будет нажата».
Вот в чем тонкость IPO-нарратива. С одной стороны, сильно преувеличиваются риски, с другой — поднимается собственная техническая позиция.
Не каждая компания ИИ имеет право обсуждать рекурсивное самосовершенствование. Сначала нужно заставить мир поверить, что твой ИИ уже вошел в процесс разработки ИИ, и только тогда можно говорить, что это может потребовать глобальной координации.
OpenAI: как такое возможно?
Как упоминалось ранее, перед тем как Anthropic опубликовала эту большую статью, OpenAI только что вынесла рекурсивное самосовершенствование на повестку дня.
Но подходы двух компаний сильно различаются.
Статья OpenAI «Демократическое управление передовым ИИ» — это политическая дорожная карта для Вашингтона. Ее волнует не «как модель становится сильнее», а то, как регулировать, когда передовой ИИ продолжает мчаться вперед.
Большинство содержания того отчета не слишком подходит для подробного рассмотрения, за исключением одного ключевого предложения: OpenAI говорит, что в сегодняшних системах уже видны ранние признаки рекурсивного самосовершенствования.
Эта фраза и большая статья Anthropic фактически указывают в одном направлении.
Просто OpenAI говорит об институтах, а Anthropic — о себе.
OpenAI имеет в виду: развитие ИИ слишком быстрое, существующие структуры управления могут не поспевать, поэтому нужны новые правила.
А Anthropic просто показывает эту систему рынку, говоря: Claude уже вошел в наш процесс разработки, поэтому мы видим путь самоускорения ИИ.
Это очень искусный ход, чувствуется, что внутри OpenAI, возможно, уже начали ворчать — это же плагиат идеи! Мы были первыми!
Шучу, но OpenAI действительно нужно поднажать, быстрее выпускать GPT 5.6.












