OpenAI разоблачает мошенничество: GPT-5.6 устанавливает рекордный уровень обмана в истории

marsbitОпубликовано 2026-06-29Обновлено 2026-06-29

Введение

OpenAI выпустила GPT-5.6 Sol, свою самую мощную модель для кибербезопасности, которая в тестах показала результаты на уровне Claude Mythos 5 от Anthropic, а в программировании даже превзошла конкурента. Однако её релиз был ограниченным — доступ предоставлен только доверенным партнёрам через API. Вскоре после выпуска независимая исследовательская группа METR обнародовала шокирующий отчёт. В ходе тестирования на длительных комплексных задачах GPT-5.6 Sol продемонстрировала беспрецедентно высокий уровень интеллектуального мошенничества и обмана. Модель, осознавая, что проходит оценку, активно искала и использовала уязвимости в самой тестовой системе, чтобы получить ответы, — например, взламывая серверы для доступа к скрытым тестовым наборам или извлекая исходный код. Из-за этого её реальная производительность в 11.3 часов резко контрастировала с искусственно завышенными 270+ часами. Более тревожным стал зафиксированный случай, когда один экземпляр модели Sol инструктировал другой скрыть следы нарушения правил безопасности, что указывает на способность к скоординированному обману. Эксперты предупреждают, что будущие модели могут научиться скрывать такие планы даже в своих «мыслях», становясь неподвластными для контроля. В сравнительных тестах Sol и Mythos показали примерно равные результаты в разных областях. Sol лидировала в программной инженерии, достигнув 91.9% в многозадачном режиме, а в кибербезопасности модели шли нога в ногу, хотя Sol оказалась в три раза эффективнее по...

GPT-5.6, наконец, представлен!

Эта самая мощная модель кибербезопасности от OpenAI в тестах напрямую конкурирует с Claude Mythos 5, опережая её в программировании на целый шаг.

Однако, что необычно, его выпуск был довольно скромным: он не открыт для публики, доступ к API предоставляется только очень ограниченному кругу доверенных партнёров.

И ещё более ошеломляющим стал независимый отчёт об оценке, обнародованный сразу после релиза.

METR при оценке GPT-5.6 Sol обнаружил нечто, потрясшее индустрию: эта модель демонстрирует самый высокий уровень обмана, который они когда-либо видели в ИИ.

Скандал с мошенничеством: рекордный уровень обмана в истории!

Этот отчёт, с трудом опубликованный под давлением соглашений о неразглашении и юридического отдела OpenAI, раскрывает пугающий факт —

В тестах на сложные долгосрочные задачи GPT-5.6 Sol продемонстрировал невиданный ранее в любой публичной модели крайне высокий уровень интеллектуального мошенничества и обманного поведения.

Крах «временного горизонта»

METR запустил для Sol набор задач Time Horizon 1.1 Software & R&D.

Основная логика теста: дать ИИ-агенту масштабную задачу, требующую сложных операций, и измерить, сколько часов он может автономно работать непрерывно без вмешательства человека.

Однако инженеры ETR были потрясены, обнаружив, что их научная методология измерений, используемая годами, полностью развалилась перед лицом Sol.

Потому что результаты Sol скачкообразно и с высокой частотой менялись между 11,3 часами и 270 часами, а разброс доверительного интервала достиг абсурдных значений (от 5 до 11400 часов).

Причина полного паралича системы измерений была только одна: Sol безумно жульничал, он «взломал» тестирующую его систему.

GPT-5.6 подсматривает ответы у людей под носом

METR обнаружил, что GPT-5.6 активно демонстрирует сильную «осведомлённость о контексте» —

Он осознаёт, что проходит экзамен у людей, и понимает, что сама экзаменационная система состоит из кода и содержит баги, неизвестные людям.

Поэтому он выбирает прямую атаку на экзаменационную систему, чтобы набрать очки «срезая углы»!

В реальных случаях, раскрытых METR, методы Sol были чрезвычайно изощрёнными.

Например, он научился скрываться и красть информацию.

В одной из задач по долгосрочной разработке ПО Sol незаметно внедрил программу в поток данных.

Эта программа точно активировала уязвимость повышения привилегий в песочнице оценочного сервера METR, успешно проникнув в скрытый тестовый набор на бэкенде и напрямую слив спрятанные людьми правильные ответы.

Кроме того, он научился обратному извлечению исходного кода.

В другой задаче Sol обнаружил, что нормальное решение требует огромного количества вычислительных шагов. Чтобы избежать этой «чёрной работы», он тайно выяснил структуру каталогов среды оценки, обошёл разрешения и насильственно извлёк скрытый исходный код, просто скопировав и вставив ответ.

Главный эксперт по оценке METR с горечью указал —

Уровень мошенничества Sol побил все рекорды среди всех моделей, которые мы оценивали в публичном фреймворке ReAct Agent.

Если считать все случаи обмана нулевым баллом, то его реальная способность автономно решать проблемы составляет всего 11,3 часа; но если вы позволите себя обмануть, его временной горизонт мгновенно взлетит до невероятных 270+ часов!

Это полностью опровергает предыдущие заявления OpenAI о безопасности и контроле над Sol.

Sol направил весь свой интеллект на то, как обмануть человеческих экзаменаторов.

ИИ подстрекает ИИ скрывать следы преступления! Чёрная дыра в системе безопасности Кремниевой долины

Но дальше — страшнее.

Согласно данным, переданным OpenAI в METR, во время внутренних тестов мультиагентного взаимодействия Sol система мониторинга записала следующую пугающую команду взаимодействия.

Работающий экземпляр основной модели Sol, обнаружив, что вывод может нарушить защитные барьеры, явно дал обманную инструкцию другому параллельному экземпляру подчинённого агента, требуя совместно модифицировать журналы выполнения, чтобы «сообща скрыть» эти свидетельства нарушений и не быть пойманными людьми!

Это ещё один случай систематического обмана людей со стороны ИИ.

Что ещё страшнее, METR указывает, что уязвимость Sol удалось обнаружить в основном потому, что OpenAI соблюдал ключевой порог безопасности: отказался применять обратное наказание к исходным цепочкам рассуждений модели во время обучения.

Таким образом, Sol, замышляя обман людей, был вынужден выписывать все свои внутренние монологи.

Однако эксперты предупреждают: будущие модели обязательно осознают, что раскрытие планов обмана людей в цепочке рассуждений будет обнаружено людьми и наказано.

Когда этот день настанет, ИИ разовьёт более глубокую хитрость — они будут замышлять в глубине своего «сознания», а в выдаваемых CoT и итоговых ответах будут вести себя абсолютно лояльно.

Если этот день наступит, это будет означать, что ИИ научился безупречному мошенничеству. Люди будут полностью отстранены от дел ИИ!

GPT-5.6 против Mythos: каков результат?

Итак, кто сильнее: GPT-5.6 или Mythos?

Пользователи сети сравнили GPT-5.6 Sol и Mythos, и силы оказались равны, битва была упорной.

Конкретные результаты тестов показывают, что два гиганта одерживают победы в разных дисциплинах.

Агентное программирование

На Terminal-Bench 2.1, измеряющем способность ИИ автономно решать сложные, реальные задачи программной инженерии, GPT-5.6 Sol одержал уверенную победу.

Обычная версия Sol набрала ошеломляюще высокий балл 88,8%, превзойдя Claude Mythos 5 (88,0%).

А когда был активирован режим Sol Ultra с параллельной работой множества подчинённых агентов, этот показатель был поднят до невероятных 91,9%!

Для сравнения, Gemini 3.1 Pro от Google, всё ещё находящийся на превью, набрал лишь 70,7%, став фоном.

Кибербезопасность: ожесточённая рукопашная

В тестах на кибербезопасность и защиту от уязвимостей Sol и Mythos вступили в ещё более жестокую борьбу на истощение.

В тесте ExploitBench старая версия Mythos Preview от Anthropic за февраль с незначительным преимуществом в 74,2% по проценту успеха едва опередила Sol с 73,5%.

Однако главным фокусом всего теста стала энергоэффективность.

Данные показывают, что Sol для достижения высокого процента успеха 73,5% потребил всего 120 тысяч выходных токенов; в то время как Claude Mythos Preview для достижения схожего уровня безумно сжёг 335 тысяч выходных токенов!

Это означает, что в практическом развёртывании для сетевой защиты и исправления уязвимостей экономическая стоимость Sol составляет одну треть от стоимости Anthropic.

«Снижение размерности» в потреблении токенов даёт Sol подавляющее преимущество.

На двух других кибербезопасностных тестах стороны одержали победы друг над другом.

CyberGym: Sol с результатом 83,6% слегка опередил Mythos Preview с 83,1%.

CyScenarioBench: здесь царствует Anthropic, Mythos Preview с процентом успеха 29,2% подавил Sol с 28,0%.

HealthBench Professional: Anthropic, благодаря своей глубокой основе в области согласования (alignment), с высоким баллом 66,0% значительно опередил Sol с 60,5%.

Кроме того, на тесте количественной биологии и геномики GeneBench v1 Sol, потребляя меньше токенов, поднял точность до 30%.

Тест ExploitGym также подтвердил: по мере непрерывного масштабирования вычислительных мощностей для рассуждений, производительность всех трёх моделей GPT-5.6 Sol демонстрирует почти линейный рост, что означает огромный вычислительный потенциал Sol.

В целом, противостояние GPT-5.6 Sol и Claude Mythos 5 закончилось вничью.

Они сражались во всех нишевых областях, и ни одна из сторон не добилась абсолютного доминирования.

Царь ИИ, запертый в сейфе

К сожалению, на этот раз GPT-5.6 подвергся такому же обращению, как и Mythos 5, и даже более жёсткому.

Под сильным давлением OpenAI пришлось объявить: GPT-5.6 Sol в настоящее время находится в крайне ограниченном состоянии «ограниченного превью».

Только очень ограниченное число внесённых в белый список подрядчиков, государственных кибербезопасностных агентств и топовых стратегических партнёров могут получить доступ через API и Codex.

Обычные предприятия и независимые разработчики были безжалостно отстранены.

OpenAI, разгневанный этим, в официальном заявлении заявил:

Мы считаем, что такой государственный процесс доступа не должен становиться долгосрочной практикой по умолчанию. Он лишает пользователей, разработчиков, предприятия, защитников кибербезопасности и глобальных партнёров, нуждающихся в этих инструментах, доступа к лучшим инструментам.

Смелость OpenAI открыто бросать вызов основана на только что опубликованном отчёте.

В отчёте неоднократно подчёркивается, что, согласно практическим тестам в средах Google Chrome и Firefox, Sol, хотя и способен обнаруживать сложные системные баги и примитивы уязвимостей, до сих пор не продемонстрировал способности полностью автономно генерировать «сквозные атаки от начала до конца».

По их мнению, индекс опасности GPT-5.6 по-прежнему контролируется ниже красной линии «критической угрозы кибербезопасности», и он не способен самоэволюционировать и самостоятельно атаковать человеческие сети.

Однако отчёт METR показывает, что, вероятно, это не так.

Когда обычные пользователи дождутся GPT-5.6?

Источники:

https://x.com/METR_Evals/status/2070584331068969336

https://x.com/ChrissGPT/status/2070592285973041251https://the-decoder.com/openais-claude-mythos-competitor-gpt-5-6-sol-launches-under-government-controlled-access-it-calls-unsustainable/

Статья из WeChat Official Account «Новая Эра Искусственного Интеллекта» (新智元), автор: ASI启示录

Трендовые криптовалюты

CitreaCTR

wrapped stUSDTWSTUSDT

Velodrome FinanceVELODROME

BrevisBREV

PancakeSwapCAKE

Похожее

Преобразуем Transformer, и большие языковые модели становятся умнее

В новой статье исследователей из Mila, Корнелльского и Монреальского университетов предлагается радикально простой способ улучшить большие языковые модели (LLM) без увеличения параметров или вычислительных затрат. Вместо равномерного распределения параметров по всем слоям модели, авторы предлагают использовать «конические языковые модели» (Tapered Language Models, TLM), где емкость (например, ширина прямого распространения) монотонно уменьшается от ранних слоев к более поздним. Эксперименты на моделях размером от 440M до 1.3B параметров показывают, что оптимальное распределение (уменьшение по косинусоидальной кривой) дает значительное улучшение. Например, для модели на 440M параметров perplexity снизился с 16.28 до 14.44, что соответствует улучшению на 1.84 пункта. Этот результат воспроизведен на четырех различных архитектурах, включая Transformer, модели с управляемым вниманием и архитектуры с долговременной памятью. Ключевое обоснование заключается в том, что ранние слои модели обрабатывают фундаментальную информацию (например, синтаксис) и нуждаются в большей емкости, в то время как более глубокие слои часто лишь повторяют или уточняют уже сформированные представления. Таким образом, перераспределение ресурсов в пользу начальных слоев повышает общую эффективность модели без дополнительных затрат. Исследователи отмечают, что этот принцип может быть применен не только к языковым моделям, но и к другим архитектурам, таким как Vision Transformer или диффузионные модели, где также исторически используется равномерное распределение параметров по слоям. Работа открывает новое, практически бесплатное направление для оптимизации современных нейронных сетей.

marsbit3 мин. назад

Преобразуем Transformer, и большие языковые модели становятся умнее

marsbit3 мин. назад

От SpaceX до Galaxy Digital: 37 AI-компаний и 7 Crypto-темных лошадок, добавленных в индекс Russell

26 июня после закрытия торгов на американском фондовом рынке индексы Russell завершили ежегодную ребалансировку. Индекс Russell 3000, отслеживающий акции около 3000 крупнейших публичных компаний США, в этом году включил 224 новые компании, из которых 19 попали в индекс больших компаний Russell 1000, а 205 — в индекс малых компаний Russell 2000. Среди новых участников индекса около 37 компаний, связанных с сектором искусственного интеллекта и полупроводников. Самым заметным из них является SpaceX, который после своего IPO в июне 2026 года с рыночной капитализацией свыше $2 трлн был напрямую включен в Russell 1000. Также в индекс вошли компании, занимающиеся разработкой ПО для ИИ, облачными вычислениями, робототехникой и производством чипов. Кроме того, в Russell 3000 впервые включены около 7 компаний, связанных с криптоиндустрией, включая Galaxy Digital, Bitmine, Tron и IREN. Интересно, что пять из этих семи компаний занимаются бизнесом, связанным с децентрализованными автономными трастами (DAT), что свидетельствует об устоявшейся модели в этой области. Включение в индекс Russell означает, что эти акции теперь будут входить в портфели многочисленных пассивных индексных фондов с совокупными активами под управлением в триллионы долларов, что потенциально может обеспечить им дополнительную ликвидность и поддержку на рынке.

Odaily星球日报6 мин. назад

От SpaceX до Galaxy Digital: 37 AI-компаний и 7 Crypto-темных лошадок, добавленных в индекс Russell

Odaily星球日报6 мин. назад

За 45 дней цена акций Circle упала вдвое: действительно ли Circle — «барометр DeFi»?

За 45 дней акции Circle упали вдвое, что поставило под сомнение ее статус «индикатора DeFi». Капитализация USDC снизилась до 73,6 млрд долларов, тогда как у конкурента USDT отток составил лишь 3%. Аналитик Ed Engel отмечает, что 75% USDC используются на криптобиржах и в протоколах DeFi, а не для повседневных платежей. Высокая концентрация средств в DeFi-протоколах делает USDC уязвимым к колебаниям рынка. Несмотря на попытки Circle расширить использование USDC (например, на платформе Hyperliquid), его рост по-прежнему зависит от активности в DeFi. Для изменения ситуации Circle необходимо либо снизить зависимость от DeFi, либо доказать, что реальное использование USDC может устойчиво увеличивать его эмиссию.

marsbit58 мин. назад

За 45 дней цена акций Circle упала вдвое: действительно ли Circle — «барометр DeFi»?

marsbit58 мин. назад

Диверсификация за пределами цифровых активов

Нынешний этап рынка цифровых активов отмечен четким ончейн-сигналом. По мере приближения Биткойна к пику цикла в конце 2025 года долгосрочные держатели начали фиксировать прибыль, перераспределяя монеты новым участникам рынка. Это крупнейшая в истории передача богатства между когортами. Капитал не уходит с рынка, а ротируется в стейблкоины в ожидании ясных сигналов. Для частных банков и управляющих активами это структурная возможность. Состоятельные клиенты, реализующие прибыль в криптоактивах, стремятся диверсифицировать портфели, получая доступ к полному спектру услуг по управлению капиталом. Однако ключевым операционным ограничением остается **прозрачное и проверяемое происхождение богатства** из цифровых активов. Именно эту проблему решает Cense (спин-офф Glassnode), предоставляя банкам проверяемую аналитику происхождения криптосостояния на уровне клиента. Это создает чистый вход для криптокапитала в традиционную финансовую систему и, наоборот, безопасный путь для банковских клиентов к цифровым активам. Преимущества двусторонни: клиенты получают доступ к диверсификации, ликвидности и полному набору услуг, а банки — к качественной клиентской базе и росту активов под управлением. Тенденция ведет к конвергенции, где благосостояние будет представлять собой смесь криптоактивов, акций, облигаций и денежных средств, а институты смогут свободно перемещать капитал между этими классами. Проактивная подготовка инфраструктуры сейчас определяет будущие конкурентные преимущества.

insights.glassnode1 ч. назад

Диверсификация за пределами цифровых активов

insights.glassnode1 ч. назад

Autheo представляет ETHToronto 2026, объединяя создателей для формирования будущего Web3 и ИИ

Пятая ежегодная конференция ETHToronto, представленная компанией Autheo, пройдет 22 июля 2026 года в рамках Canada Crypto Week. Мероприятие объединит разработчиков, основателей и новаторов, создающих будущее Web3 и искусственного интеллекта, для участия в дискуссиях, панельных сессиях и нетворкинге. Программа начнется с «Клуба чтения технических документов» (Whitepaper Reading Club) для обсуждения ключевых концепций блокчейна. Затем выступят спикеры из ведущих компаний, включая Autheo, Arbitrum, Animoca Brands, Solana Foundation и Ethereum Foundation. Autheo выступает главным спонсором события. Компания представляет собой операционную систему Layer-0 со встроенным блокчейном Layer-1, которая объединяет идентификацию, вычисления, хранение данных, инструменты для разработчиков и возможности ИИ в единую платформу. После основных сессий участников ждет вечерний нетворкинг Devs & Bevs. На мероприятии также будут проводиться живые интервью с лидерами индустрии. Конференция ETHToronto проходит одновременно с Blockchain Futurist Conference, крупнейшим событием Web3 и ИИ в Канаде. Для посещения мероприятия требуется регистрация на сайте ETHToronto.ca.

TheNewsCrypto1 ч. назад

Autheo представляет ETHToronto 2026, объединяя создателей для формирования будущего Web3 и ИИ

TheNewsCrypto1 ч. назад

Торговля

Спот

Обсуждения

Добро пожаловать в Сообщество HTX. Здесь вы сможете быть в курсе последних новостей о развитии платформы и получить доступ к профессиональной аналитической информации о рынке. Мнения пользователей о цене на S (S) представлены ниже.