Автор: Сюн Лэй
Редактор: Сюй Цинъян
12 июня по местному времени в США произошло редкое в истории регулирования ИИ прямое столкновение между правительством и компанией, внезапно разразившееся в эту пятницу.
Правительство США, ссылаясь на соображения национальной безопасности, направило компании Anthropic распоряжение об экспортном контроле, требуя немедленно приостановить доступ всех иностранных субъектов к двум моделям ИИ Fable 5 и Mythos 5. Сфера действия этого распоряжения чрезвычайно широка: оно распространяется не только на иностранных пользователей за пределами США, но и на иностранных граждан, находящихся на территории США, включая иностранных сотрудников самой компании Anthropic.
В качестве меры соответствия требованиям Anthropic пришлось полностью закрыть точки доступа к этим двум моделям для всех пользователей — это единственное возможное на данный момент решение для обеспечения соответствия, поскольку компания не может на техническом уровне точно различать группы пользователей «иностранных субъектов» и «граждан США». Доступ к другим моделям компании не затронут, пользователи автоматически вернутся к работе с Claude Opus 4.8.
Это экстренное прекращение доступа стало полной неожиданностью. Fable 5 и Mythos 5 были официально выпущены всего три дня назад, 9 июня. Внезапное прекращение их работы вызвало широкий резонанс в технологических кругах и сообществе ИИ.
01 Что представляют собой эти две модели
Чтобы понять суть этого противостояния, необходимо сначала понять, что представляют собой модели Fable 5 и Mythos 5, и почему они с самого начала находились в центре внимания регулирующих органов.
Mythos — это новое семейство моделей Anthropic, превосходящее по уровню возможностей серию Opus, представляющее собой самый высокий уровень возможностей, который Anthropic может публично развернуть на данный момент. Первая модель класса Mythos, Claude Mythos Preview, была выпущена в апреле этого года в рамках проекта «Project Glasswing», доступ к ней был строго ограничен небольшим числом партнеров по причине чрезмерно мощных возможностей в области кибербезопасности, что делало её непригодной для широкого доступа.
Fable 5 — это первая модель уровня Mythos, официально выпущенная для широкой публики, её возможности превосходят все ранее выпущенные Anthropic доступные модели, она демонстрирует передовой в отрасли уровень практически по всем тестовым эталонам: разработка программного обеспечения, интеллектуальный труд, визуальное понимание, научные исследования и др.
Для обеспечения публичного выпуска Anthropic оснастила Fable 5 специальными механизмами безопасности — в высокорисковых областях, таких как кибербезопасность, биология, химия и т.д., модель автоматически блокирует ответы и передает обработку обратно Claude Opus 4.8.
Mythos 5 — это версия на той же базовой модели, но с меньшим количеством средств защиты, доступная только ранее одобренным организациям, уже имевшим доступ к Project Glasswing, и позиционируется как профессиональный инструмент для защитников кибербезопасности и операторов критически важной инфраструктуры. Цены на обе модели одинаковы: 10 долларов за миллион входных токенов и 50 долларов за миллион выходных токенов.
02 Спусковой крючок, приведший к распоряжению
По сообщениям, министр торговли США Ховард Латник (Howard Lutnick) 12 июня направил генеральному директору Anthropic Дарио Амодеи (Dario Amodei) письмо, объявляя, что Mythos 5 и Fable 5 подпадают под экспортный контроль. Непосредственной причиной, побудившей принять это решение, стали заявления другой компании о возможности «взлома» (jailbreak) Mythos, что вызвало обеспокоенность администрации Трампа в отношении потенциальных рисков для национальной безопасности.
Сообщается, что администрация Трампа ранее пыталась помешать Anthropic выпустить эти две модели, но не смогла — что впоследствии побудило правительство применить более жесткую меру экспортного контроля.
Столкнувшись с этим неожиданным распоряжением, Anthropic, соблюдая требования, опубликовала необычайно резкое по формулировкам объемное заявление, в котором систематически оспорила доводы правительства.
Anthropic считает, что имеющиеся у правительства доказательства «взлома» касаются лишь одного чрезвычайно узкого и непереносимого метода атаки, суть которого заключается в требовании к модели прочитать определенный код и исправить в нем уязвимости программного обеспечения — подобные возможности существуют и в других публично доступных моделях, включая OpenAI GPT-5.5, и ежедневно используются специалистами по кибербезопасности для обычного обслуживания систем.
Anthropic четко заявила в своем заявлении, что если принять «наличие ограниченного по масштабу потенциального взлома» в качестве стандарта для отзыва уже развернутых коммерческих моделей, это фактически приведет к полной остановке всех новых развертываний передовых моделей во всей отрасли. Компания также подчеркнула, что действия правительства на этот раз не следовали ранее публично декларируемым принципам прозрачной, справедливой, основанной на технических фактах установленной процедуры.
Anthropic заявила, что будет соблюдать законные распоряжения правительства, одновременно активно работая над коммуникацией с правительством, стремясь как можно скорее восстановить доступ, и в течение следующих 24 часов обнародует дополнительные технические детали. Компания считает, что данный инцидент вызван недопониманием, и приносит глубокие извинения за причиненные пользователям неудобства.
Ниже приводится полный текст заявления Anthropic под названием «Заявление в связи с распоряжением правительства США о приостановке доступа к Fable 5 и Mythos 5»:
Правительство США, ссылаясь на полномочия в области национальной безопасности, выпустило распоряжение об экспортном контроле, требующее приостановить доступ всех иностранных граждан к Fable 5 и Mythos 5, независимо от их нахождения на территории США или за ее пределами, включая иностранных сотрудников Anthropic. Фактическим результатом этого распоряжения является следующее: мы должны немедленно закрыть доступ к Fable 5 и Mythos 5 для всех пользователей, чтобы обеспечить соответствие. На другие модели Anthropic это не распространяется.
Мы получили это распоряжение сегодня в 17:21 по восточному времени США. В письме не указаны конкретные опасения, связанные с национальной безопасностью. Насколько нам известно, правительство считает, что у него есть метод обхода защитных механизмов Fable 5, так называемая техника «взлома» (jailbreak). Мы изучили демонстрацию этой техники и обнаружили, что она позволяет выявить лишь небольшое количество ранее известных, незначительных уязвимостей. Все эти уязвимости относительно просты, и другие публично доступные модели могут обнаружить те же проблемы без необходимости взлома.
В блоге о выпуске Fable Anthropic изложила нашу позицию относительно его защитных механизмов, а именно:
Мы создали надежные механизмы безопасности, значительно снижающие вероятность использования Fable в злонамеренных целях для выполнения задач, связанных с кибербезопасностью и другими областями. Фактически, некоторые пользователи сообщают, что наши меры защиты слишком строгие.
За несколько недель до выпуска Fable Anthropic совместно с правительством США, Британским институтом безопасности ИИ, несколькими сторонними организациями и внутренними командами провела тысячи часов тестирования на проникновение (red team testing) защитных механизмов Fable. Результаты тестов показали, что защита Fable значительно эффективнее, чем у любой ранее развернутой модели.
На данный момент ни один тестировщик не смог найти метода «универсального взлома» — то есть способа, который бы полностью преодолел защиту модели и разблокировал широкий спектр возможностей для сетевых атак.
Мы считаем, что на данный момент ни один поставщик моделей не может обеспечить идеальную защиту от взлома. Все защитные механизмы в отрасли потенциально уязвимы для «неуниверсального взлома» (т.е. получения части сетевой информации в определенных условиях), а в будущем могут появиться и методы универсального взлома. Мы четко указали на это при выпуске Fable 5.
Учитывая, что идеальная защита от взлома в настоящее время недостижима, Anthropic применила к Fable 5 стратегию эшелонированной защиты. Наша цель — сделать атаки взлома либо чрезвычайно узкими по охвату (для неуниверсального взлома), либо чрезвычайно дорогостоящими (для универсального взлома), дополненными комплексным мониторингом для быстрого обнаружения и сдерживания любых успешных атак. Именно по этой причине Anthropic требует 30-дневного хранения данных клиентов — хотя эта политика оказывает реальное влияние на наши отношения с клиентами, она помогает нам изучать и противодействовать рискам взлома.
Мы придерживаемся этой стратегии эшелонированной защиты. Она эффективно снижает риски, связанные с Fable, до уровня, сопоставимого с рисками существующих развернутых моделей в отрасли.
На сегодняшний день мы даже не получили никаких официальных раскрытий информации о неуниверсальных взломах, которые могли бы привести к вредоносным последствиям. Известные нам потенциальные случаи взлома либо полностью безвредны, либо представляют собой незначительные обнаружения, не демонстрирующие уникальных возможностей Mythos.
В настоящее время правительство США предоставило нам лишь устные доказательства, касающиеся потенциального, ограниченного по масштабу неуниверсального метода взлома, суть которого заключается в требовании к модели прочитать определенный код и исправить в нем уязвимости программного обеспечения. Насколько нам известно, этот потенциальный метод взлома был предоставлен правительству. Мы изучили отчет — мы считаем, что именно этот отчет послужил основанием для выпуска распоряжения правительством — и подтвердили, что продемонстрированный в отчете уровень возможностей также широко распространен в других моделях (включая GPT-5.5 от OpenAI) и ежедневно используется специалистами по кибербезопасности для поддержания безопасности систем. Мы обнародуем дополнительные детали в течение следующих 24 часов.
Мы будем соблюдать законные распоряжения правительства и закрывать доступ к Fable 5 и Mythos 5 для всех пользователей. Однако мы не согласны с тем, что обнаружение ограниченного по масштабу потенциального метода взлома является достаточным основанием для отзыва коммерческой модели, уже развернутой для сотен миллионов пользователей. Если применять этот стандарт ко всей отрасли, это фактически приведет к полной остановке всех новых развертываний моделей у всех поставщиков передовых моделей.
Мы публично заявляли, что правительство должно иметь право на основе прозрачной, справедливой, четкой и основанной на технических фактах установленной процедуры предотвращать развертывание небезопасных моделей. Данные действия не следовали указанным выше принципам.
Мы приносим глубокие извинения за причиненные пользователям неудобства. Мы считаем, что данный инцидент вызван недопониманием, и активно работаем над тем, чтобы как можно скорее восстановить доступ.





