ИИ общего назначения (AGI) приближается.
Только что главный исследователь OpenAI Марк Чен заявил:
В некотором смысле, как хотелось бы, чтобы вы почувствовали, AGI (искусственный интеллект общего назначения) приближается...
Мы всё ближе к миру, в котором модели смогут самостоятельно предлагать больше инноваций — они смогут вести самоподдерживающиеся исследования.
Это не просто повышение эффективности, сама «эволюция» передается на аутсорсинг кремниевой жизни.
Когда Марк Чен на камеру ловко режет грибы и лук, он говорит не только о супе, а о последнем бастионе человеческой цивилизации.
Если ИИ сможет сам исследовать себя, то в канун появления AGI, какую роль должно играть человечество?

Каждая область переживает свой «божественный ход»
Чтобы понять вес этих слов, нужно вернуться к моменту, когда Марк пришел в эту область.
2016 год, AlphaGo против Ли Седоля.

Во второй партии был ход «37-й ход», который в момент его совершения никто из человеческих игроков не понял.

Позже стало ясно, что это был ход, который сделала машина и который человеку было невозможно даже представить. Этот момент зажег многих, включая Марка Чена, который втянулся в эту сферу.
А что сейчас?
«Самое безумное, — говорит Марк, — это то, что сейчас ты видишь «божественный ход» почти в каждой области».
Они есть в математике, в компьютерных науках, в программировании.

Он описывает очень тонкий момент: многие люди «проснулись» в начале этого года и внезапно осознали: AI-агенты в моей отрасли действительно могут работать.
Не игрушки. Не демо. Они могут выполнять за вас значимую, долгосрочную реальную работу.
Это значит, что «модели, проводящие исследования самостоятельно», больше не сцена из научной фантастики.
Это следующий шаг, естественно вытекающий из цепочки уже произошедших «божественных ходов».
Если смотреть по этой линии вперед, в ее конце стоит та самая модель, которая сама будет заниматься исследованиями.
Scaling не остановился, предобучение живо
Но на чем держится этот оптимизм?
На вере: кривая масштабирования (Scaling) еще не достигла потолка.
В последние пару лет идеи «предобучение умерло», «языковые модели не достигнут AGI» периодически всплывают.
Марк Чен «довольно яростно возражает» против этого пессимизма.
Он указал на шаблон.
«Предобучение умерло» звучит свежо, но на самом деле это заезженная пластинка, которую проигрывали раз за разом в прошлые годы.

Каждый раз кто-то указывает на какой-то барьер и говорит «потолок, дальше не пройти»; каждый раз OpenAI находит новую инженерную технику или новое исследовательское понимание, чтобы пробить эту стену.
Марк Чен твердо верит: «Мы находимся на экспоненциальной кривой. Она выдержала почти 10 порядков, и нет никаких причин, почему она не продолжит держаться».

И самое убедительное доказательство — это то, что OpenAI однажды уже выиграла на свою ставку.
Ставка была на рассуждение (reasoning).
Когда проект o1 только начинался, даже внутри OpenAI были те, кто не верил.
Парадигма «предобучение + дообучение» тогда была слишком сильна, и люди естественно спрашивали: машина и так хорошо работает, зачем возиться с чем-то другим?
Именно Якуб Пачоцки, Илья Суцкевер и еще несколько человек с верой и проницательностью настаивали, постепенно превращая это в фундаментальную ставку всей компании.

Год спустя вышел o1, и парадигма рассуждений взорвала всю индустрию.
Кривая еще не достигла потолка, плюс самые большие прорывы часто происходят из ставок, в которые изначально никто не верил. Вместе эти два фактора дают Марку Чену уверенность говорить, что «самоподдерживающиеся исследования моделей не за горами».
Когда модель начинает думать над задачами длительностью в недели или даже месяцы, инновации, которые она производит, могут выйти за пределы слепых зон человеческих экспертов.
Это и есть фундамент «самоподдерживающихся исследований»: если она может вывести математическую формулу, которую человек никогда не видел, она, конечно, может написать архитектуру алгоритма лучше человеческой.
Исследователь по настроению (Vibe Researcher): когда исполнение становится дешевым
У нас уже есть «программист по настроению» — скажи, и ИИ напишет код.

Исследования тоже движутся в этом направлении.
В интервью неоднократно упоминалась очень спорная концепция: Исследователь по настроению (Vibe Researcher).
Это слегка самоироничный, но глубоко продуманный прогноз о профессии.
Марк считает, что будущий топ-исследователь будет не тем, кто пишет каждую строку кода на PyTorch, а тем, кто «улавливает ощущение».

И в OpenAI, и в других лабораториях вы начинаете видеть, что огромный объем работы превращается в работу по «оркестровке».
Если говорить проще: человек отвечает за идеи, модель — за выполнение всей работы.
Исследователь думает, придумывает идеи, а реализация, исполнение, планирование — модель делает сама.
Трехлетняя дорожная карта OpenAI четко прописывает конечную цель: заставить модель проводить сквозные (end-to-end) исследования, от идеи до результата, полностью самостоятельно.

Но на этом пути полно незаполненных ям
По мере того как ИИ сможет автономно выполнять и оркестрировать задачи, человеческая работа будет сжата до двух крайностей:
1. Постановка по-настоящему важных вопросов.
2. Определение, есть ли у ответа ИИ «душа».
Это и есть так называемый «вкус» (Taste).
Потому что у машины нет «жизни», поэтому у нее нет «здравого смысла» и, соответственно, не может быть «вкуса».
Но если охладить пыл, сам Марк Чен понимает лучше всех, что этот путь далеко не вымощен.
Первая яма: бенчмарки, крах.
Он использует внутренний термин «Benchmaxxing» — взять кучу задач, почти идентичных тестовому набору, и тренировать до смерти, получая отличные баллы, при этом обобщающая способность не растет ни на йоту.
Что еще хуже, общепризнанных золотых стандартов бенчмарков слишком мало.
«Мы действительно находимся в состоянии кризиса оценки», — говорит он. Классические тесты, такие как SAT, для сегодняшних моделей полностью насыщены.
Более того, как только бенчмарк публикуется в мире, он уже не является хорошим бенчмарком, как экзаменационный билет, который становится недействительным сразу после печати.

Две стратегии для решения этой проблемы:
1. Отделить команду, создающую оценки, от команды, оптимизирующей модели, создавая таким образом конфликтующие стимулы.
2. Массовое развертывание моделей и наблюдение за режимами сбоев в реальных применениях.

Он также отмечает, что появление каждой новой способности сопровождается соответствующей потребностью в оценке, и направление этой оценки — довольно важная часть его работы.
Вторая яма: неровный фронт (jagged frontier).
Модель может решать олимпиадные задачи по математике и информатике, но может не справиться с мелочами, которые человек делает на раз-два. Это гений, который может в уме считать интегралы, но не может завязать шнурки.

В чем разница? В «контексте», в непрерывном обучении — способности использовать уроки, извлеченные из одной задачи, в следующей.
Для человека это так естественно, для модели же — это кость, над которой вся индустрия ломает голову.
Когда его спросили, нужны ли для достижения AGI еще два-три фундаментальных прорыва, Марк не ответил напрямую.
Он сказал, что такие вещи, как непрерывное обучение, являются «основными способностями, которые нужно разблокировать». Является ли это «прорывом», он сказать не может, но «многие удары уже нацелены в ворота, и я вполне уверен, что они попадут».
Таково его отношение: ямы реальны, над каждой уже кто-то работает, и он ставит на то, что они будут заполнены.
Метафора супа: после AGI открыть лапшичную
Самый теплый момент интервью — история о «супе».
Говорят, Марк Цукерберг пытался переманить исследователей из OpenAI своим домашним супом, а ответ Марка Чена был таков: просто принести суп в офис и раздать всем.

На вопрос о конечном желании после реализации AGI, этот человек, управляющий самыми мощными ИИ-мозгами в мире, ответил:
«Я хочу открыть лапшичную. Это, возможно, будет моим хобби после AGI».
В этом ответе скрыт глубокий смысл.
Когда ИИ сможет выполнять все «самоподдерживающиеся исследования», когда все знания и инновации будут создаваться со скоростью света, самым дефицитным ресурсом для человечества будет не интеллект, а «опыт».
Машина может вычислить оптимальную соленость супа, но она никогда не сможет придать этому супу «теплоту» и «историю».
Источники:
https://www.youtube.com/watch?v=fpAthTtha8c
https://finance.biggo.com/podcast/1241bc21164ccc75
Эта статья из официального аккаунта WeChat «Новая Эра Искусственного Интеллекта», автор: ASI Откровение








