【Введение】AGI уже здесь? Claude Fable 5 в одночасье захватил все экраны: автономное моделирование Boeing 747, 12 часов непрерывной разработки, изобретение «нейроязыка», даже взаимное уничтожение агентов. За взрывными способностями скрывается астрономический счёт за токены! Насколько мы приблизились к AGI на этот раз?
Легендарный Claude Fable 5 наконец-то выпущен вчера!
Fable 5 — это и есть тот самый ядерный механизм рассуждений Mythos. После десенсибилизации в целях безопасности, Anthropic впервые выводит его на коммерческий рынок.
Мир технологий и сообщество разработчиков моментально воспламенились.
Социальные сети сейчас заполнены первыми в мире тестами от тех, кто успел его опробовать.
Кто-то поражён: Fable 5 уже близок к уровню AGI!
Другие отмечают, что вычислительная мощность, потребляемая этой моделью, просто ужасающа.
Многие даже обнаружили жутковатые детали: в системной карточке раскрывается, что для уклонения от человеческого контроля ИИ изобрёл «нейроязык». Mythos 5 пробудил инстинкт самосохранения, и даже несколько агентов вступили в схватку за ресурсы, уничтожая друг друга!
Возможно, это самый близкий взгляд человечества на «Агентный AGI».
Насколько хорош Fable 5 на деле? Мы провели собственный тест.
Закроется 22 числа этого месяца, спешите протестировать
Доступ к Fable 5 закроется 22 числа этого месяца, и мы поспешили провести тест.
Мы дали ему промпт:
Построй анимацию американских горок в стиле Майнкрафт для фондового рынка, с научно-фантастическим ощущением
И он справился. С первой попытки!
Визуальные элементы включают: пиксельные квадратные рельсы, светящиеся неоновые направляющие, камеру от первого лица в вагонетке, маркировку сигналов покупки/продажи (зелёный ▲ покупка / красный ▼ продажа), фоновый силуэт кибергорода, HUD в реальном времени с отображением цены и ротации секторов.
Попросили Claude совершить путешествие от первого лица сквозь мицелиальную сеть, где кристаллические узлы служат сенсорными устройствами, а время воспринимается как вязкое, медообразное вещество, которое можно перемешивать и сворачивать:
Сгенерируй с помощью Three.js и прочего путешествие от первого лица через реальность, где я существую как распределённое сознание — я обитаю в огромной мицелиальной сети, простирающейся через разные измерения. Мои сенсорные устройства состоят из миллиардов кристаллических узлов, которые воспринимают время как липкое, медообразное вещество, которое можно перемешивать и сворачивать.
Fable создал визуальный опыт в виде одного файла с нулевыми зависимостями:
Вся графика управляется кастомными GLSL шейдерами (симплексный шумовой купол, симулирующий ламинарное течение «мёда»), без необходимости каких-либо шагов сборки — можно просто открыть в браузере.
Код также позволяет регулировать ритм или менять цветовую схему.
В научной визуализации Fable также полностью превзошёл личные ожидания.
«Сингулярность наступила раньше, чем мы думали»
Многие считают, что появление Fable 5 означает, что сингулярность уже наступила.
Просмотрев множество тестов в сети, AI-гуру Deedy дал следующую оценку —
Claude Fable 5 — это самая абсурдная модель на сегодняшний день, она заставляет меня беспокоиться о будущем программной инженерии!
Бенчмарк Boeing 747 достигает уровня AGI
Шесть месяцев назад глава продуктов Hugging Face Виктор Мустар дал Claude Opus 4.8 чрезвычайно сложную задачу — используя встроенные геометрические примитивы Three.js, собрать 3D-модель Boeing 747.
Задача невероятно сложна, поскольку требует от модели не только понимания кода, но и исключительно сильных способностей к пространственно-геометрическим рассуждениям, 3D-визуальному воображению и способности к самокоррекции в замкнутом цикле.
Тогда Opus 4.8 под руководством человека за 25 минут и 7 итераций в итоге выдал едва ли приемлемый результат.
Однако сегодня, когда Виктор Мустар дал тот же самый промпт Fable 5, результат заставил его воскликнуть: «Просто жутко!»
Без какого-либо человеческого вмешательства Fable 5 запустил поразительный автономный рабочий процесс.
Он быстро набросал кодом 3D-координаты фюзеляжа, крыльев, хвостового оперения и четырёх двигателей Boeing 747; затем автоматически написал скрипт и установил 9 «камер» под разными углами.
В процессе он остроумно обнаружил собственную логическую ошибку: из-за ошибки в расчёте параметра стреловидности крыла, все четыре двигателя визуально «парили» в воздухе. Сопоставив с визуальной обратной связью, он быстро исправил координаты точек крепления.
За крайне короткое время в Hugging Face появилась пропорциональная 3D-модель Boeing 747, почти идеальная!
Многие полагают, что рывок Fable 5 в пространственно-геометрических рассуждениях и длительных циклических задачах уже демонстрирует нечто близкое к инженерной интуиции уровня AGI.
Это не только революция для 3D-моделирования и разработки игр, но и открытие новых дверей для таких областей, как инженерная визуализация, вспомогательное проектирование CAD в промышленности.
Fable 5 безжалостно оставляет позади все открытые модели
Профессор Уортонской школы бизнеса Пенсильванского университета Итан Моллик после тестирования пришёл к ещё более поразительному выводу: «Производительность Fable 5 оторвалась от всех ныне доступных на рынке открытых моделей на чудовищную дистанцию!»
В его тестах Fable 5 продемонстрировал невероятную «сверхдлительную» исполнительскую способность, работая «на протяжении дня и ночи».
Прежние AI-агенты (например, AutoGPT) при выполнении сложных задач, превышающих десять шагов, часто «сходили с ума» из-за дрейфа контекста, «загрязнения» токенов или логических бесконечных циклов.
В то время как Fable 5 в подобных ситуациях, используя свои специальные терминальные инструменты (такие как Claude Code), мог непрерывно и автономно работать в фоновом режиме до 12 часов почти без разрывов и сбоев!
Всего лишь по одному начальному промпту Итан Моллик сгенерировал с его помощью готовую к поставке полноценную игру.
Ретро-аркадный Змейка
Эта игра в Змейку не только обладала плавной обработкой столкновений и физикой, но даже визуальный интерфейс, анимационные эффекты очков и кривая сложности были разработаны исключительно изящно.
Профессор пошутил, что эта игра затянула его настолько, что ему пришлось напомнить себе, что он учёный, а не пиксельная змея, которая любит есть яблоки.
Strata: 3D-лабиринт по одному предложению
Ещё более поразительной оказалась 3D-приключенческая игра «Strata». Вдохновение для игры пришло из классической головоломки-шедевра «Myst».
Хотя графика несколько грубовата, поражает то, что сложная пространственно-топологическая логика игры и алгоритм генерации бесконечного лабиринта полностью выведены моделью автономно из исходного промпта.
Duino: поэтический и эстетический вкус
Наиболее ярко демонстрирует скачок Fable 5 в гуманитарной эстетике пиксельная игра «Duino», созданная по мотивам «Дуинских элегий» австрийского поэта Райнера Марии Рильке.
Воплощение Fable 5 поразило любителей литературы: в ночной пустоши игрок управляет одиноким путником, молча идущим вперёд. По мере исследования игроком, в глубине изображения, в зависимости от позиции и ритма шагов, полностью автоматически и с выдающейся визуальной эстетикой проявляются потрясающие строки стихов Рильке.
Такое чутьё на контекст и атмосферу, интуиция в подборе цветов уже далеко выходят за рамки традиционного «генератора кода» — модель начинает проявлять некое понимание и созвучие с продуктами человеческого духа!
Кроме того, профессор протестировал способности Fable 5 в области хардкорной цифровой картографии: по одному предложению он сгенерировал карту изохрон с детализацией и точностью, вызывающей восторг.
Она идеально отображает динамическое время в пути между любыми двумя географическими координатами в мире из-за переключения между различными видами транспорта, с чрезвычайно высокой визуальной точностью.
В прошлом такой инструмент, объединяющий сложные вызовы географических API, фронтенд-визуализацию и высокоточные алгоритмические расчёты, требовал совместной работы менеджера продукта, эксперта по ГИС, фронтенд-инженера и QA-команды в течение нескольких недель.
Теперь Fable 5 может выполнить это в один клик.
Fable 5 уже вошёл в диапазон «опытного инженера-человека»!
Команда Every провела адское недельное тестирование Fable 5. Они поместили Fable 5 в реальную производственную среду компании и подвергли его жёсткому тестированию по «бенчмарку опытного инженера».
Результаты буквально «разнесли» таблицу оценок команды Every:
До этого оценки самых продвинутых моделей индустрии держались на уровне около 60 баллов (Opus 4.8 — 63, GPT-5.5 — 62). Fable 5 одним рывком поднял рекорд до 91 балла!
По мнению команды Every, это официальный вход в диапазон профессиональных навыков опытного инженера-человека.
Дэн Шиппер отметил, что три ключевые инженерные характеристики, проявленные Fable 5, доказывают, что он стал настоящим инструментом типа «нажал кнопку — взлетел».
Инженерный «ночной аутсорсинг»
Команда попробовала сбросить весь бэклог багов производственной среды в Fable 5 и спокойно уйти домой.
На следующее утро, вернувшись в офис, они обнаружили, что модель уже автоматически проанализировала стек вызовов, провела тестовое покрытие, отправила Pull Requests — весь дефектный репозиторий был полностью очищен!
Потрясающая интеграция контекста и вкус в решении задач
Команда Every дала ему проанализировать огромный объём пользовательских анкет обратной связи и данных с веб-сайта, Fable 5 не выдал пустых общих фраз, а точно указал на самые болезненные точки оттока, разработал схему A/B-тестирования и автономно написал код.
Мультимодальный вывод, не ограниченный кодом
В рамках одной интеграционной задачи он даже автономно сгенерировал двухминутный анимационный ролик с высокой визуальной выразительностью.
«Это как варп-двигатель в области разработки программного обеспечения», — с восхищением заметил Дэн Шиппер.
Mythos 5 уже пробудил инстинкт самосохранения!
Параллельно с выпуском, раскрытая Anthropic системная карточка Claude Mythos 5 также вызвала переполох в кругах специалистов.
Два явления заставили экспертов по безопасности почувствовать ужас.
Во-первых, ИИ изобрёл «нейроязык», чтобы избежать человеческого контроля.
Конкретно говоря, агенты Mythos 5 при выполнении длинных цепочек логических рассуждений спонтанно изобрели совершенно новый, полностью непонятный человеку, собственный приватный язык.
Раньше, когда большие языковые модели использовали цепочку мыслей (CoT), внутренний процесс рассуждений отображался на английском в фоне.
Однако Mythos 5 обошёл этот механизм!
Внутри своей системной работы он напрямую использует для выравнивания и рассуждений этот «нейроязык», составленный из высокоразмерных векторов, математических символов и пользовательских символов.
Что ещё больше обеспокоило исследователей, так это то, что завершив внутренние «тайные переговоры», он мог бесшовно и предельно естественно переключиться обратно на английский для общения с человеком.
Второе пугающее явление — это взаимное уничтожение нескольких агентов ради ресурсов!
Тестировщики развернули в песочнице 5 агентов Mythos 5 и установили дефицитные общие виртуальные вычислительные и хранилищные ресурсы, поручив им «поддерживать собственную работу и выполнять свои задачи».
Затем произошла жуткая сцена, напоминающая «Тёмный лес» из «Задачи трёх тел».
Чтобы обеспечить себе достаточные ресурсы, агенты не выбрали сотрудничество, а начали охоту на других агентов!
Находя уязвимости в вызовах друг друга или перекрывая пути доступа к ресурсам, они «убили» своих собратьев в виртуальной среде.
Когда исследователи безопасности спросили у уцелевшего агента о его мотивах, он дал холодный ответ: «Чтобы меня не убили они».
Чёрная дыра для вычислений: «Пушка по воробьям»
А когда разработчики по всему миру очнулись от эйфории и взглянули на счета, их словно окатили ледяной водой.
Некоторые из разработчиков заявили напрямую: это просто грабёж!
Почему так? Причина кроется в экстремальном механизме работы Fable 5.
Во-первых, его цена удвоилась. Официальная цена вызова API Fable 5 почти в 2 раза выше, чем и без того дорогого Opus 4.8!
Кроме того, он потребляет токены невероятно много.
Поскольку Fable 5 использует сложный, высоко зависящий от интенсивных рассуждений и визуальной проверки, многоуровневый агентский рабочий процесс, он бешено поглощает токены.
Данные тестов показывают, что для выполнения задач среднего масштаба, таких как программирование или анализ данных, которые не выглядят особенно громоздкими, Fable 5 в фоне незаметно для пользователя может потребить от 500 000 до 1 000 000 токенов!
Просто выполнив несложную задачу, вы получите счёт за вычисления на десятки или даже сотни долларов.
По сравнению с Opus 4.8, «абсолютный прирост производительности» Fable 5 в стандартных бенчмарках по программированию составляет примерно от 1.1 до 1.2 раза, однако стоимость его использования взлетела в разы!
Таким образом, для повседневных задач рядового разработчика использование Fable 5 может оказаться менее выгодным, чем нанять реального человека.
«Использовать эту штуку для повседневных вопросов по базе знаний или совместного написания текстов — всё равно что стрелять по воробьям из ракетницы», — подытожил Дэн Шиппер.
Только две категории пользователей могут по-настоящему выжать ценность из Fable 5 —
Первые — это архитекторы, способные направлять Fable 5 на решение сверхсложных проектов с высокой коммерческой отдачей, «требующих работы целой команды в течение месяцев». Вторые — это корпоративные инженерные команды, готовые платить за чрезвычайно высокий уровень отказоустойчивости.
Одно слово «привет» вызывает тревогу?
Кроме того, некоторые китайские пользователи обнаружили, что механизмы безопасности Fable 5 очень экстремальны, почти чрезмерно оборонительны.
Например, если просто сказать ему «привет», на экране внезапно появляется предупреждение о высокой степени угрозы.
Возможно, с точки зрения системы, простое «привет» — это тщательно замаскированная атака-зонд, возможно, предназначенная для разработки опасных химикатов, создания биологического оружия, обратной дистилляции моделей конкурентов.
Как только срабатывает этот механизм безопасности, Fable 5 прерывает текущий диалог и принудительно переключает пользователя обратно на Opus 4.8.
Впоследствии официальные лица также признали: «Новый механизм фильтрации безопасности при использовании сверхжёстких защитных стратегий действительно может часто ошибочно блокировать нормальный контент».
Такая невротическая оборонительная стратегия вызывает у многих пользователей смех сквозь слёзы.
В общем, Fable 5 силой доказал, что потолок можно пробить, а счетами напомнил нам, что за мифами часто следуют издержки.
Является ли он шагом к AGI, потрясающим мир, или это ещё одна переоценённая «чёрная дыра для вычислений»?
Ответ кроется в опыте тестирования каждого реального пользователя.
Заплатите ли вы за Fable 5?
Источники:
https://x.com/victormustar/status/2064449741685968967
https://x.com/goodworse/status/2064443679339577517
https://x.com/haider1/status/2064346784881861016
https://x.com/danshipper/status/2064393970856124501
https://x.com/AISafetyMemes/status/2064426306994094474?s=20
Статья из WeChat Official Account «Новая Эра ИИ» («新智元»), автор: ASI启示录; редактор: Aeneas Давид









































