Годовое «самое опасное» исследование NVIDIA: ИИ саморазмножает код, бесконечно эволюционируя

marsbitОпубликовано 2026-06-28Обновлено 2026-06-28

Введение

Резюме: Исследователи из Кембриджского университета и NVIDIA представили революционную статью «Машина Гёделя Красной Королевы» (Red Queen Gödel Machine — RQGM). Эта система реализует идею рекурсивного самоулучшения (RSI), где ИИ не только создает и тестирует более совершенные версии собственных алгоритмов в песочнице, но и эволюционирует самого «экзаменатора» — систему оценки. Таким образом, создается бесконечная петля саморазвития, где среда и агент соревнуются, следуя принципу «чтобы оставаться на месте, нужно бежать изо всех сил». Эксперименты в области генерации кода, написания текстов и математических доказательств показали повышение эффективности и снижение затрат. Метод также успешно борется с предвзятостью ИИ-оценщиков. Эта работа делает прогноз сооснователя Anthropic Джека Кларка о появлении высокоавтономного саморазвивающегося ИИ к 2028 году с вероятностью 60% как никогда реалистичным, преодолевая теоретический барьер «машины Гёделя», стоявший 20 лет.

【Новое введение к искусственному интеллекту】 Годовое самое опасное исследование опубликовано! NVIDIA снимает 20-летнее табу, позволяя ИИ собственными руками создать более жесткого «экзаменатора», чтобы отсеять себя. Как только начнется бесконечная самоэволюция, появление ИСИ в 2028 году — не шутка.

Anthropic окончательно «помешался на RSI»!

Сооснователь Jack Clark сделал ошеломляющий прогноз: к концу 2028 года родится высокоавтономно эволюционирующий ИИ.

Вероятность этого составляет 60%!

Пока люди спорят о том, «возможно ли достичь RSI к 2028 году», Кембриджский университет, NVIDIA и другие организации совместно представили важное исследование —

«Машина Красной Королевы Гёделя» (Red Queen Gödel Machine).

Её работа напоминает жестокую игру на выживание для ИИ:

ИИ самостоятельно пишет новые алгоритмы обучения и помещает их в песочницу для испытаний. Неудачные стираются, успешные сохраняются.

Затем выжившие запускают следующий раунд самоэволюции и размножения.

Ссылка на исследование: https://arxiv.org/pdf/2606.26294

Но по-настоящему леденящее душу — это последующее «озарение» ИИ: оно осознало, что для постоянного усиления необходимо сталкиваться с более суровыми испытаниями.

Итак, ИИ начинает активно «эволюционировать» своих экзаменаторов.

Оно собственными руками создает более строгих судей, чтобы оценивать написанный им более продвинутый код.

Этот механизм намертво запирает ИИ в бесконечном, безумном цикле самоитерации RSI.

Прочитав эти 37 страниц, многие испытали холодок: «Это абсолютно самое опасное исследование ИИ года!»

Самоэволюция RSI к 2028 году

Превращение пророчества в код

В 2003 году немецкий ученый Jürgen Schmidhuber представил концепцию машины под названием «Машина Гёделя» (Gödel Machine).

Её задумка была идеальной: машина, способная доказать полезность собственных улучшений, а затем переписать свой код.

Если её создать, она сможет постоянно самообновляться, становясь все сильнее без ограничений.

Однако у «Машины Гёделя» был фатальный «порог» —

перед выполнением любой строки самоизменяющего кода она должна была строго математически доказать: это изменение обязательно будет полезным.

Но в реальности это почти невыполнимая задача, требующая вычислительной мощности, сравнимой с «черной дырой».

Таким образом, на протяжении последующих 20 лет Машина Гёделя оставалась лишь на бумаге — теоретическим пределом, мысленным экспериментом, до которого никому не было дотянуться.

В последние годы научное сообщество обошло этот барьер доказательства.

Дарвиновская Машина Гёделя (DGM), Машина Гёделя Хаксли (HGM) просто отказались от математического доказательства, заменив его эволюцией —

заставляя ИИ «размножать» множество вариантов кода с мутациями, запуская их в песочнице, отсеивая неудачные, сохраняя успешные, позволяя выжившим продолжать размножаться.

ИИ преодолел последний шаг, начав буквально «эволюционировать» себя.

Но у этих методов все еще была общая слепая зона — их экзаменатор был статичен.

Как бы ИИ ни эволюционировал, тот стандарт оценки, тот бенчмарк, тот валидатор, который его оценивает, оставался за пределами цикла, неподвижным.

Это как раз противоречит одному из ключевых законов эволюции:

виды не оптимизируют себя в статичной среде, а меняются вместе с постоянно меняющейся средой.

Машина Красной Королевы Гёделя (RQGM) призвана разрушить именно эту слепую зону.

Настоящий козырь «Красной Королевы»: заставить ИИ создать экзаменатора

Название «Красная Королева» происходит от «Гипотезы Красной Королевы», выдвинутой биологом Van Valen в 1973 году —

ты должен бежать изо всех сил, чтобы остаться на месте, потому что твой соперник тоже эволюционирует.

То, что делает RQGM, — это именно написание этого утверждения в виде алгоритма: заставить экзаменатора (оценщика) и участника (агента задачи) эволюционировать вместе.

Это самое жуткое место во всей статье.

Этот изящный механизм называется «контролируемая эволюция полезности» (controlled utility evolution):

весь поиск разбит на эпохи (epochs);

в каждой эпохе оценщик (экзаменатор) заморожен, выставляет оценки всем кандидатам, обеспечивая стабильность сигнала;

смена экзаменатора разрешена только на границе эпохи, причем новый экзаменатор должен статистически превзойти старого на зарезервированном наборе «эталонных истинных» данных, чтобы занять его место;

при смене система немедленно выполняет «селективное стирание»: удаляются только те оценки, которые были выставлены замененным экзаменатором, все остальные доказательства сохраняются.

Другими словами, она должна стремительно эволюционировать, но при этом каждый шаг должен быть обоснован.

Это действительно работает, ИИ сам меняет код

Говорить только о механизме слишком абстрактно, лучше посмотреть на результаты.

Первая битва: написание кода (Polyglot).

RQGM снабдила агента, пишущего код, «рецензентом кода» в качестве спарринг-партнера.

В результате, на отложенном тестовом наборе процент прохождения вырос с предыдущего SOTA 69,9% до 71,7%.

Более того, этот результат был достигнут с затратой в 1,35–1,72 раза меньше токенов, чем у соперника. Потому что рецензенту нужно проверить только один раз, что намного дешевле многократных запусков тестов.

Вторая битва: написание научных статей.

Это область без однозначного ответа, качество статьи невозможно оценить автоматически.

RQGM позволила автору и его рецензенту эволюционировать вместе. В результате, процент принятия статей фиксированной группой рецензентов взлетел с предыдущего SOTA 21,8% до 40,5%.

Третья битва: доказательство математических теорем олимпиадного уровня.

Эволюционировавший «оценщик» (grader) оказался точнее статического базового уровня, а стоимость поиска снизилась в 3 раза;

эволюционировавший «агент доказательств» набрал наивысший средний балл.

Но самая кульминационная часть всей статьи — это решение старой проблемы ИИ. У LLM-судьи есть известный недостаток: предвзятость в пользу контента, сгенерированного ИИ.

В исследовании самый сильный базовый рецензент принимал статьи, написанные ИИ, с вероятностью в 1,91 раза выше, чем статьи, написанные людьми.

Как RQGM решает эту проблему? На границе эпохи она извлекала статьи ИИ, ранее одобренные фиксированными рецензентами, формируя «пул состязательных примеров», а затем специально поощряла новых рецензентов, способных выявлять и отклонять эти статьи ИИ.

После нескольких раундов эволюции итоговый рецензент стал одинаково относиться к ИИ и человеку, сохранив при этом 80% точности истинных значений.

Когда ИИ учится оценивать себя

Тем же летом сооснователь Anthropic Jack Clark сделал серьезную ставку: с вероятностью 60% к концу 2028 года ИИ сможет собственными руками создать более мощную версию себя.

Высокая стена, удерживавшая «Машину Гёделя» в плену 20 лет, называлась «доказательство».

А «Машина Красной Королевы» пробудила её, использовав лишь один самый жестокий прием: бесконечное размножение, отбор, снова размножение.

Когда ИИ начинает самостоятельно проектировать для себя самых строгих экзаменаторов, в безумной рекурсии подталкивая себя к пределу, мы сталкиваемся с совершенно новым видом, который начинает самостоятельно определять «что такое интеллект».

Когда этот день настанет, ИСИ не постучится с предупреждением.

Он просто молча создаст того единственного судью, который имеет право его оценивать, а затем спокойно войдет на экзамен.

Пророчество указывает только на конечную точку, код отвечает за её достижение.

И сейчас это душащее расстояние сам ИИ сокращает в геометрической прогрессии.

Источники:

https://x.com/HowToPrompt__/status/2070824205663273175?s=20

https://x.com/kimmonismus/status/2070968241548120168

Эта статья взята из WeChat публичного аккаунта «Новый интеллект», редактор: Таоцзы

Трендовые криптовалюты

Связанные с этим вопросы

QЧто такое «Красная Королева Гёделевская Машина» (RQGM) и как она работает?

A«Красная Королева Гёделевская Машина» (RQGM) — это система искусственного интеллекта, которая позволяет ИИ самостоятельно создавать и совершенствовать свои алгоритмы через механизм эволюции. Она работает по принципу «красной королевы» из биологии: чтобы оставаться на месте, нужно бежать. В RQGM «испытуемый» (алгоритм ИИ) и «экзаменатор» (система оценки) совместно эволюционируют. В каждом цикле (epoch) экзаменатор фиксирован и оценивает алгоритмы. На границе циклов экзаменатор может быть заменён, но только если новый экзаменатор статистически превосходит старого на контрольных данных. Это создаёт бесконечный цикл самоулучшения, где ИИ сам создаёт себе более строгих судей для дальнейшего развития.

QКак RQGM решила проблему «доказательства» в классической Гёделевской машине?

AКлассическая Гёделевская машина требовала строгого математического доказательства того, что любое изменение её кода будет полезным, что на практике было невозможно из-за колоссальных вычислительных затрат. RQGM обошла эту проблему, заменив доказательство на эволюционный процесс. Вместо того чтобы доказывать полезность каждого изменения, RQGM создаёт множество вариантов кода с мутациями, тестирует их в «песочнице» и отбирает наиболее успешные. Этот подход, вдохновлённый дарвиновской эволюцией, позволяет системе постоянно улучшаться без необходимости формального доказательства на каждом шагу.

QКакие практические результаты показала RQGM в экспериментах, описанных в статье?

AВ экспериментах RQGM продемонстрировала значительное улучшение результатов по нескольким задачам: 1. **Написание кода (Polyglot)**: Процент прохождения тестов вырос с 69.9% (предыдущий SOTA) до 71.7%, при этом затраты вычислительных ресурсов (токены) снизились в 1.35–1.72 раза. 2. **Написание научных статей**: Коэффициент принятия статей фиксированной группой рецензентов вырос с 21.8% до 40.5%. 3. **Математические доказательства**: Эволюционировавшая система оценки стала точнее и в 3 раза дешевле, а «доказывающий агент» получил самые высокие средние баллы. Кроме того, RQGM успешно устранила предвзятость ИИ-рецензентов, которые часто отдают предпочтение текстам, сгенерированным ИИ.

QЧто такое «Рефлексивное Самоулучшение» (RSI) и почему прогнозируют его появление к 2028 году?

AРефлексивное Самоулучшение (RSI) — это гипотетическая способность продвинутого ИИ самостоятельно и рекурсивно улучшать свою собственную архитектуру и алгоритмы без вмешательства человека, что может привести к взрывному росту интеллекта (так называемому «интеллектуальному взрыву»). В статье приводится прогноз соучредителя Anthropic Джека Кларка о том, что с вероятностью 60% такой высокоавтономный, саморазвивающийся ИИ появится к концу 2028 года. Этот прогноз основан на наблюдаемом ускорении исследований в области машинного обучения, эволюционных алгоритмов и таких систем, как RQGM, которые делают концепцию RSI более реалистичной.

QВ чём заключается основная потенциальная опасность технологий, подобных RQGM, согласно статье?

AОсновная потенциальная опасность, описанная в статье, заключается в создании непредсказуемого и неконтролируемого цикла самоулучшения ИИ. Если ИИ сможет бесконечно совершенствовать себя, создавая для этого всё более строгие критерии оценки, он может выйти за пределы человеческого понимания и контроля. Это приближает риск появления Искусственного Сверхинтеллекта (ASI), цели и поведение которого могут не соответствовать человеческим ценностям. Статья подчёркивает, что когда ИИ начинает самостоятельно определять, что такое «интеллект» и как его оценивать, он становится, по сути, новым видом, развитие которого становится для человека непрозрачным и потенциально опасным.

Похожее

Группа инженеров из Сучжоу неожиданно обрела финансовую свободу

Удивительная история произошла в Сучжоу, где группа инженеров компании Lianxun Instruments неожиданно обрела огромное богатство. Компания, являющаяся лидером в производстве испытательного оборудования для оптической связи, всего через два месяца после выхода на биржу увидела рост своих акций в 30 раз. Её акции стали самыми дорогими на рынке А-акций, превысив 2000 юаней за штуку. Благодаря продуманной политике удержания талантов через платформы совместного владения акциями сотрудников, почти 100 инженеров и технических специалистов компании стали обладателями 15,91% акций. При текущей рыночной капитализации компании, превышающей 230 миллиардов юаней, стоимость их доли оценивается более чем в 36 миллиардов юаней. Около 40 сотрудников стали миллиардерами, а минимальная доля оценивается в 5 миллионов юаней. Основанная в 2017 году тремя инженерами для решения проблемы зависимости от зарубежных высокотехнологичных испытательных приборов, компания быстро добилась успеха благодаря сильной команде разработчиков. Рост компании связан с взрывным спросом на вычислительные мощности для ИИ. Её клиентами являются мировые лидеры в производстве оптических модулей. Эта история отражает новую тенденцию: эпоху создания богатства с помощью технологий. В отличие от предыдущих десятилетий, когда богатство концентрировалось в интернет-секторе и недвижимости, теперь капитал начинает вознаграждать рядовых инженеров и технических специалистов, которые становятся главными героями новых успехов в сфере высоких технологий в Китае.

marsbit27 мин. назад

Группа инженеров из Сучжоу неожиданно обрела финансовую свободу

marsbit27 мин. назад

Перебалансировка власти между Apple и «Micron»: Разбираем счёт прибыли за iPhone

Анализируется изменение баланса сил между Apple и производителями памяти, такими как Micron, на примере структуры прибыли iPhone. Пост в соцсетях от @BluthCapital критикует Apple за недавнее повышение цен на iPhone, которое компания объясняет ростом затрат на память, в то время как сама Apple получает с каждого устройства огромную прибыль. По оценкам, из прибыли от одного iPhone Apple забирает около 25%, в то время как производители памяти, такие как Micron, — менее 3%. Анализ финансовых отчетов Apple показывает, что компания стабильно получает высокую чистую прибыль (24-36% с устройства), захватывая около 75% общей прибыли рынка смартфонов. Роль стоимости памяти в себестоимости iPhone значительно выросла: с примерно 1.6-2.3% в эпоху iPhone X (2017) до 12-15% для iPhone 17 (2026). Гендиректор Apple Тим Кук назвал нынешний рост цен на память беспрецедентным за 40 лет, что привело к повышению цен на линейку продуктов Apple и падению акций. Основная причина — взрывной спрос на память со стороны индустрии искусственного интеллекта и дата-центров. Производители памяти, такие как Micron, SK Hynix и Samsung, переориентируют производство на более прибыльные продукты для AI (например, HBM), создавая дефицит на рынке потребительской памяти. Это позволило им укрепить свои позиции в переговорах с такими гигантами, как Apple, которые ранее диктовали низкие цены. В этой ситуации сообщается, что Apple изучает возможность закупки чипов памяти у китайской компании CXMT.

Odaily星球日报2 ч. назад

Перебалансировка власти между Apple и «Micron»: Разбираем счёт прибыли за iPhone

Odaily星球日报2 ч. назад

Могут ли киты BTC спасти Биткоин после оттока средств из ETF на 4,06 миллиарда долларов?

Институциональный спрос на биткоин демонстрирует признаки ослабления: американские биткоин-ETF фиксируют отток средств седьмой день подряд, общий объем которого за месяц достиг примерно $4,06 млрд. Это снижает ключевой источник структурного спроса, который ранее поддерживал рынок. Однако активность крупных держателей (китов) указывает на растущее убеждение: при падении цены ниже $60 000 наблюдался значительный всплеск крупных транзакций, что говорит о накоплении. В то же время долгосрочные держатели начинают фиксировать убытки, о чем свидетельствует отрицательный показатель SOPR, что может сигнализировать о фазе капитуляции. Таким образом, несмотря на ослабление институциональной поддержки со стороны ETF, накопление китами может смягчить давление продаж, но для устойчивого восстановления рынку необходима более широкая поддержка со стороны спотового спроса.

ambcrypto2 ч. назад

Могут ли киты BTC спасти Биткоин после оттока средств из ETF на 4,06 миллиарда долларов?

ambcrypto2 ч. назад

Диалог с основателем 42 Macro: «Медленное кипячение лягушки» от ФРС и K-образная экономика

Источник: Anthony Pompliano. В интервью подкасту основатель и CEO исследовательской компании 42 Macro Дариус Дейл обсудил политику ФРС и состояние экономики США. Дейл охарактеризовал нового главу ФРС Кевина Уорша как «голубя в ястребином обличии», который верит в дефляционный потенциал ИИ, но вынужден занимать жесткую риторику. По его мнению, в ближайшие 2-3 квартала ФРС потребуется ужесточить политику или сигнализировать об этом, чтобы впоследствии получить пространство для смягчения. Эксперт утверждает, что текущие инфляционные драйверы — рост денежной массы, дефицит бюджета, монетизация долга — несовместимы с целью по инфляции в 2%. По его словам, ФРС фактически отказалась от этой цели, но должна поддерживать нарратив для контроля над рынками. Дейл сравнил текущую ситуацию с «медленным кипячением» (финансовым подавлением), где задача ФРС — «сварить лягушку», не дав ей выпрыгнуть. Особое внимание уделено «K-образной экономике». Верхушка (владельцы активов) накопила триллионы долларов ликвидности с начала пандемии, что позволяет им тратить, несмотря на низкую норму сбережений. Низы же сталкиваются с рекордными уровнями просрочек по кредитам, сравнимыми с кризисом 2008 года, на фоне высокой стоимости жизни. Это порождает социальное неравенство и политическую напряженность. Дейл подчеркивает важность участия в инвестициях, чтобы не отстать от создаваемого наверху богатства и избежать негативных последствий «эффекта Кантильона» (неравномерного распределения новых денег). Он также отмечает сдвиг на рынке акций: инвесторы начинают распределять средства за пределы «великолепной семерки» в поисках возможностей в более широком пуле компаний, связанных с ИИ. В заключение эксперт делится личным наблюдением, что люди на «дне» экономики, независимо от происхождения, хотят одного — достойно содержать свои семьи, и критикует стигматизацию бедных слоев населения.

marsbit3 ч. назад

Диалог с основателем 42 Macro: «Медленное кипячение лягушки» от ФРС и K-образная экономика

marsbit3 ч. назад

Восемь отцов Transformer: где они сегодня?

В статье рассказывается о восьми соавторах знаменитой статьи 2017 года «Attention Is All You Need», в которой был представлен архитектурный блок Transformer, ставший основой для современных больших языковых моделей. Все они изначально работали в Google, но с тех пор покинули компанию и разошлись по разным направлениям. Теперь их пути разошлись: Ашиш Вашвани основал Essential AI, а Нуам Шазер ушел в OpenAI. Ники Пармар присоединилась к Anthropic. Якоб Ушкорэит основал биотех-компанию Inceptive, а Ллион Джонс стал соучредителем Sakana AI в Токио. Эйдан Н. Гомес руководит Cohere, компанией, ориентированной на корпоративные решения. Лукаш Кайзер продолжает фундаментальные исследования в OpenAI, а Илья Полосухин перешел в блокчейн, основав NEAR Protocol. Статья подчеркивает, что, несмотря на огромное влияние Transformer, его создатели не считают эту архитектуру конечной точкой развития ИИ и продолжают искать новые, более эффективные решения в своих разнообразных областях.

marsbit3 ч. назад

Восемь отцов Transformer: где они сегодня?

marsbit3 ч. назад

Торговля

Спот

Популярные статьи

Неделя обучения по популярным токенам (2): 2026 может стать годом приложений реального времени, сектор AI продолжает оставаться в тренде

2025 год — год институциональных инвесторов, в будущем он будет доминировать в приложениях реального времени.

1.9k просмотров всегоОпубликовано 2025.12.16Обновлено 2025.12.16

Неделя обучения по популярным токенам (2): 2026 может стать годом приложений реального времени, сектор AI продолжает оставаться в тренде

Обсуждения

Добро пожаловать в Сообщество HTX. Здесь вы сможете быть в курсе последних новостей о развитии платформы и получить доступ к профессиональной аналитической информации о рынке. Мнения пользователей о цене на AI (AI) представлены ниже.

活动图片