«Мне не нужна лучшая модель»: панорама сообщества ИИ в горячем треде на Reddit

marsbitОпубликовано 2026-06-12Обновлено 2026-06-12

Введение

Автор: пятница, Deep Tide TechFlow Anthropic выпустила Claude Fable 5, свою первую общедоступную модель класса Mythos. Она показала рекордные 80.3% на бенчмарке SWE-Bench Pro, значительно опередив предыдущие флагманы. Однако реакция пользователей на Reddit оказалась прохладной. В популярном посте на r/artificial пользователь заявил: «Claude Fable дал мне понять, что мне не нужна лучшая модель». Многие согласились, отмечая, что с Opus 4.5 или 4.8 их рабочие потребности уже полностью удовлетворены, а переход на более дорогую модель (Fable 5 стоит почти в два раза дороже) не дает ощутимой пользы. Некоторые считают, что развитие публичных ИИ-моделей достигло плато. Главной претензией к Fable 5 стали излишне строгие «защитные ограждения» (safety classifiers). Пользователи жалуются, что модель часто отказывается выполнять задачи, связанные даже с безопасностью кода, перенаправляя их на Opus. Для платящих клиентов это особенно неприятно. Однако есть и противоположное мнение. Пользователи, работающие с исключительно сложными задачами (например, симуляции в физике высоких энергий с тысячами строк кода), отмечают кардинальную разницу в качестве и называют Fable 5 прорывом. Обсуждение подняло вопрос о будущем публичного ИИ: станут ли модели, доступные обычным людям, еще мощнее, или элитные версии (как Mythos 5 для госструктур) навсегда останутся в закрытом доступе? Пока что Fable 5 демонстрирует разрыв между бенчмарками и повседневным опытом. Ее успех будет зависеть от настройки ба...

Автор: Пятница, TechFlow глубокого анализа

Anthropic только что представила бумажные результаты, которые выглядят безупречно.

Выпущенная 9 июня Claude Fable 5 — это первая общедоступная модель компании уровня Mythos, которая набрала 80,3% в бенчмарке SWE-Bench Pro для задач реального программного инжиниринга, что примерно на 11 процентных пунктов опережает её предыдущий флагман Opus 4.8 и более чем на 20 пунктов — GPT-5.5.

Но реакция пользователей охладила энтузиазм.

Спустя три дня после анонса, в сабреддите r/artificial (еженедельный трафик 305 тыс.) появился горячий тред с заголовком: «Claude Fable дал мне понять, что мне не нужна лучшая модель». Автор, Axi0m-22, рассказал, что некоторое время использовал Fable для исследований по безопасности и рутинных задач, но затем почти сразу вернулся к Opus для написания кода и Haiku для рутины. Он провёл аналогию: Это как смотреть на анонс iPhone 17 с iPhone 14 в руках: «Ты знаешь, что новая модель лучше, но думаешь: да ладно, моя и так хороша».

Топ-комментарии захватили «довольные тем, что есть»: усталость от улучшений стала главным настроением

Комментарий, занявший первое место, набрал 42 лайка: «Помимо большего контекстного окна, я перестал чувствовать потребность в более мощной модели, начиная с Opus 4.5».

Заявление другого пользователя, hyprlab, получило 13 лайков: «Я не вижу пользы для своего рабочего процесса от перехода на модель, которая просто сжигает больше токенов. Высокопроизводительный режим Opus 4.8 уже достаточно удобен».

За такими высказываниями стоит общий расчёт стоимости.

API-цены на Fable 5 составляют $10 за миллион входных токенов, что почти вдвое дороже, чем у Opus 4.8. Пользователь siromega37 высказался прямо: «Расход токенов выше, но нет отдачи на вложения. Мне кажется, мы видим плато. Пузырь, в конечном итоге, лопнет».

Пользователь hobopwnzor дал более системное объяснение: «Мы находимся на вершине S-образной кривой уже некоторое время. Последние улучшения в основном связаны с вызовами инструментов и периферийной инженерией, а не с фундаментальными способностями самой модели».

Защитные ограничения — главная претензия: «90% запросов просто отклоняются»

Если «достаточность» — это лишь настроение, то жалобы на защитные ограничения — это конкретная проблема продукта.

Согласно официальному заявлению Anthropic, Fable 5 использует ту же базовую модель, что и Mythos 5, доступный лишь ограниченному кругу организаций, отличие заключается в установленных в Fable классификаторах безопасности: запросы, касающиеся таких областей высокого риска, как кибербезопасность, перехватываются и перенаправляются для ответа на Opus 4.8. Компания заявляет, что эта механизм настроен консервативно, срабатывая в среднем менее чем в 5% сессий, и может ложно блокировать безвредные запросы.

В этой ветке Reddit ощущаемая частота срабатываний явно намного выше 5%. Пользователь jradoff, чей комментарий набрал 17 лайков, сказал, что попросил Fable проверить безопасность своего кода, и «как только упоминается что-то, связанное с безопасностью, он почти всегда отказывается обрабатывать», после чего запрос переадресовывается Opus. Ещё один комментарий с 12 лайками был менее сдержан: «90% того, что вы хотите с ним сделать, будет отклонено, что делает его бесполезным».

Недовольство платящих пользователей было ещё сильнее. Пользователь kaitava с подпиской за $200 написал: «Я плачу вдвое больше за использование, хочу, чтобы он провёл проверку безопасности, а меня понижают до Opus. Теперь мне в нём не нравится всё. Жду, когда OpenAI догонит».

Для флагманского продукта, основное преимущество которого — скачок в возможностях, «плата за безопасность в виде удобства использования» становится ключевой переменной в решении пользователя о покупке.

Голоса оппонентов: для пользователей со сложными задачами разница — «как между ночью и днём»

Не все в треде были согласны с негативом, и портрет оппонентов довольно чёток: чем сложнее задачи, тем выше оценка.

Комментарий пользователя Phylaras набрал 15 лайков: «Fable для меня дал существенную разницу. В тех сложных задачах, которые требуют огромного контекстного окна, он нашёл ошибки, которые раньше не замечались». Пользователь, назвавшийся занимающимся моделированием в физике высоких энергий, сказал, что отдельные модели симуляции часто содержат от 8000 до 10 000 строк кода, с сотнями взаимодействующих моделей: «Модель, которая может самостоятельно и непрерывно работать, понимая детали среды, для меня — это то, чего очень ждёшь».

Самое резкое возражение было от пользователя Navetz: «Честно говоря, тот, кто использовал эту модель, сочтёт подобные посты безумием. Для меня она умнее настолько, что кажется другой личностью. Я пользуюсь ей постоянно. Я объяснил не-техническому другу: это как перейти прямо от студенческого игрока к стартовому составу НБА».

Кто-то предложил компромиссный подход. Пользователь ready-eddy посоветовал использовать Fable как «планировщика и исправителя», а не ежедневного «строителя», если только не жалко денег. Другой комментарий подвёл итог больше похоже на руководство: использовать Fable для вычислений в таблицах — значит выбрать неправильную модель; использовать Haiku для запуска 16 сложных агентов с ИИ — тоже выбрать неправильную модель. «Нет изначально плохих моделей, есть модели, используемые не по назначению».

После разрыва между бенчмарками и ощущениями, станут ли публичные ИИ сильнее?

Самый интересный комментарий в этой дискуссии сместил фокус с продукта на структуру индустрии.

Пользователь KedMcJenna выдвинул «тезис о заморозке публичного ИИ»: модели, доступные обычным людям, могут навсегда остаться примерно на текущем уровне, в то время как корпоративные и государственные элиты будут продолжать получать более мощные приватные модели. «Мы знаем как минимум о Mythos, и, вероятно, есть ещё более сильные модели, о которых мы никогда не услышим».

Этот комментарий указывает на факт: Mythos 5 действительно не является публично доступным и в настоящее время предлагается только организациям по киберзащите и предприятиям критической инфраструктуры через программу Project Glasswing.

Совместный взгляд на бенчмарки и общественное мнение приводит к непротиворечивому выводу.

Бенчмарки измеряют верхний предел возможностей, а топ-комментарии на Reddit отражают потолок повседневных потребностей. Когда задачи большинства пользователей уже удовлетворялись на уровне Opus 4.6, более сильные модели могут доказать своё превосходство только в экстремальных сценариях, таких как физическое моделирование или сверхдлинный контекст. Перед производителями моделей стоит уже не вопрос «можем ли мы это сделать», а вопросы «кому это нужно, сколько они готовы платить и какой компромисс в удобстве из-за безопасности они готовы терпеть».

Спустя три дня после выпуска Fable 5 получил два совершенно разных отчёта — в таблице бенчмарков и на поле общественного мнения. Какой из них ближе к истине, будет зависеть от того, как быстро Anthropic скорректирует классификаторы безопасности и как проголосуют кошельки пользователей со сложными задачами.

Трендовые криптовалюты

Связанные с этим вопросы

QКакой был пользовательский отклик на запуск Claude Fable 5, судя по статье?

AПользовательский отклик был сдержанным и даже разочарованным. Несмотря на впечатляющие результаты на бенчмарках, многие пользователи на Reddit выражали мнение, что новый, более мощный и дорогой модель им не нужен, так как предыдущие версии (например, Opus) уже достаточно хороши для их повседневных задач. Главными проблемами были названы высокая цена и чрезмерно строгие защитные ограничения (guardrails), которые блокируют множество запросов.

QКакие две основные причины недовольства пользователей моделью Claude Fable 5 упоминаются в статье?

AВ статье упоминаются две основные причины недовольства: 1) **Стоимость**: API Fable 5 почти вдвое дороже, чем у Opus 4.8, при этом многие пользователи не видят соответствующего повышения ценности для своих рабочих процессов. 2) **Защитные ограничения (Guardrails)**: Встроенный классификатор безопасности, предназначенный для перехвата потенциально опасных запросов, работает слишком консервативно. Пользователи сообщают, что он блокирует множество безобидных или полезных задач, связанных с безопасностью (например, аудит кода), что резко снижает практическую полезность модели.

QКакая категория пользователей, согласно статье, положительно оценила Claude Fable 5 и почему?

AПоложительно модель оценили **пользователи с особыми, ресурсоёмкими задачами**. Например, те, кто работает со сложными программными проектами на десятки тысяч строк кода, физическим моделированием или задачами, требующими обработки очень большого контекста. Для них существенный рост способностей Fable 5, особенно в понимании сложных взаимосвязей и поиске ошибок, оправдывает более высокую стоимость. Они описывают разницу между моделями как «ночь и день».

QЧто означает теория «заморозки публичного ИИ», выдвинутая в комментариях на Reddit?

AТеория «заморозки публичного ИИ» предполагает, что возможности моделей искусственного интеллекта, доступных широкой публике, могут надолго остановиться на текущем уровне. Дальнейший значительный прогресс будет доступен только в закрытых, приватных моделях для корпораций, правительств и спецслужб (как Mythos 5, доступный лишь избранным организациям). Таким образом, может возникнуть разрыв между тем, что видят обычные пользователи, и тем, что используют элитные группы.

QКакой вывод делает статья о противоречии между результатами тестов и пользовательским опытом?

AСтатья делает вывод, что противоречия нет, так как они измеряют разные вещи. Бенчмарки (например, SWE-Bench Pro) измеряют **потенциальный максимум возможностей** модели в идеальных условиях. Отзывы же пользователей отражают **практическую полезность и удовлетворённость** в повседневных сценариях. Для большинства пользователей «потолок» потребностей был достигнут более ранними моделями, поэтому новый прорыв актуален только для узкого сегмента сложных задач. Успех модели теперь зависит не столько от «может ли она», сколько от «кому нужно, сколько они готовы платить и какие ограничения готовы терпеть».

Похожее

Знакомство: Market Compass

Glassnode представляет Market Compass — инструмент, который консолидирует тысячи метрик в единую систему из семи компонентов для оценки состояния рынка Биткоина. Четыре компонента являются прогнозными и формируют основной индекс (0–100), отражающий ожидания от «Снижения рисков» (Risk-Off) до «Стремления к риску» (Risk-On): * **Макроэкономика**: от ужесточения до экспансии. * **Движение капитала и ликвидность**: от оттока до притока. * **Поведение инвесторов**: от распределения к накоплению. * **Базовые ончейн-показатели**: от спада к активному росту. Три компонента описывают текущую ситуацию: * **Позиция в цикле**: от капитуляции до эйфории. * **Деривативы**: от снижения левериджа до перегрева. * **Ротация между активами**: сезон Биткоина или альткоинов. **Текущее состояние (на момент публикации):** Основной индекс — 14 (Risk-Off), что характерно для медвежьей фазы (BTC ~64 400$, -16% за месяц). Сильнее всего индекс сдерживает макрокомпонент (23) из-за сильного доллара (DXY выше 200-дневной средней). Однако три других прогнозных компонента демонстрируют умеренное улучшение, указывая на внутреннее восстановление. Например, долгосрочные холдеры накопили рекордную долю монет. **Ключевой вывод:** Compass показывает картину, которую не увидеть по отдельным метрикам: на рынке идут процессы накопления («донная ловля»), но режим не изменился, поскольку ключевой негативный фактор — сильный доллар — сохраняется. Инструмент не дает прямых сигналов к покупке/продаже, а предоставляет контекст для принятия решений.

insights.glassnode3 ч. назад

Знакомство: Market Compass

insights.glassnode3 ч. назад

Nvidia атакует процессорами, Китай отвечает RISC-V. Четвертое глубокое наблюдение за полупроводниками

Статья сообщает, что Nvidia намерена поставлять в Китай свои новые CPU Vera для AI-центров обработки данных по цене свыше $20 000 за чип. На этом фоне в Китае активно развивается альтернативная архитектура RISC-V как путь к созданию собственных, независимых и конкурентоспособных высокопроизводительных процессоров. Ключевая задача для китайского RISC-сектора – преодолеть «невозможный треугольник», совместив независимость, управляемость и процветающую экосистему. В то время как x86 и Arm доминируют, открытая и модульная природа RISC-V дает такую возможность. Усилия сейчас сосредоточены на переходе от встраиваемых систем к высокопроизводительным вычислениям для центров обработки данных и AI. В материковом Китае наблюдается высокая активность: несколько команд уже достигли или превзошли порог в 15 баллов SPECint (ключевой показатель производительности ядра), разрабатываются собственные согласованные сетевые интерфейсы (NoC) и полноценные процессоры с десятками ядер, соответствующие стандарту RVA23 для совместимости. RISC-V рассматривается как потенциальная основа для будущих AI-ускорителей, предлагая лучшую интеграцию CPU и ускорителей, возможность кастомизации и перспективу единого программного стека. Однако остаются серьезные вызовы: фрагментация экосистемы, незрелость инструментов и ПО, отставание в одноядерной производительности и энергоэффективности, а также зависимость от передовых производственных процессов. Эксперты признают, что путь к полной конкурентоспособности в сфере высокопроизводительных вычислений будет долгим. В итоге, хотя RISC-V не может мгновенно заменить предложения вроде Nvidia Vera, он представляет собой стратегический путь для Китая к созданию независимой и жизнеспособной альтернативы на следующем этапе гонки вычислительных мощностей.

marsbit4 ч. назад

Nvidia атакует процессорами, Китай отвечает RISC-V. Четвертое глубокое наблюдение за полупроводниками

marsbit4 ч. назад

Stratosphere, Pudgy Penguins и Streamex провели VIP-ужин Founders Table во время ETHConf 2026 и NYC Tech Week

Нью-Йорк, 18 июня 2026 года, Chainwire. Стратосфера, Pudgy Penguins и Streamex провели закрытый VIP-ужин Founders Table в Нью-Йорке в рамках ETHConf 2026 и NYC Tech Week. Мероприятие собрало лидеров из сфер цифровых активов, технологий, ИИ, традиционных финансов и институционального капитала. Ужин состоялся 9 июня для отобранного круга основателей, операторов, фондов, топ-менеджеров и институциональных лидеров. Формат Founders Table предусматривает приватную атмосферу без формальной программы, чтобы способствовать естественному общению. Среди гостей были представители Citi, BitMine, BitGo, Mirae Asset Securities USA, Experian, Pyth Network и других компаний. Stratosphere предоставила сеть контактов, Pudgy Penguins — сильный потребительский бренд в цифровых активах, а Streamex — экспертизу в области токенизированных товарных рынков, таких как золото. Основатель Stratosphere Хассан Шейх отметил оптимизм относительно следующей фазы развития цифровых активов, особенно токенизации товаров. Серия ужинов Founders Table будет продолжена на других крупных конференциях, объединяя основателей, капитал и институции.

TheNewsCrypto7 ч. назад

Stratosphere, Pudgy Penguins и Streamex провели VIP-ужин Founders Table во время ETHConf 2026 и NYC Tech Week

TheNewsCrypto7 ч. назад

Панель ставок на Polymarket заработала благодаря коду, но Polymarket — не лучшее место для «арбитража»

В статье рассказывается о создании пользовательской панели мониторинга для платформы прогнозирования Polymarket, которая помогла автору достичь 30% доходности за несколько недель при стартовом капитале в $1600. Однако автор подчеркивает, что основная цель статьи — не продвижение Polymarket как источника легкой прибыли, а предупреждение о рисках и структурных ловушках этой платформы. Ключевые выводы автора: 1. **Polymarket — не место для арбитража.** Это рынок, где высока зависимость от интерпретации правил и информационного преимущества. Даже при высокой уверенности в исходе события всегда существует риск полной потери инвестиции в случае ошибки. 2. **Управление рисками и диверсификация важнее поиска «верных ставок».** * Автор внедрил систему классификации ставок по уровням уверенности (T1, T2, T3) с строгими лимитами на размер позиции для каждого уровня. * Важна **истинная диверсификация** по некоррелирующим темам (например, Восточная Азия, Ближний Восток, криптовалюты), а не просто участие во множестве рынков с общей базовой переменной. * Высокая вероятность успеха (например, 95%) не оправдывает крупную позицию, так как даже малая вероятность провала означает потерю 100% вложенных средств. 3. **Математическое ожидание и хвостовые риски.** Необходимо оценивать не только потенциальную доходность, но и разницу между личной оценкой вероятности и рыночной ценой, а также влияние потери всей позиции на общий портфель. 4. **Polymarket как тренировочный полигон.** Автор рассматривает платформу скорее как инструмент для тренировки аналитического мышления и дисциплины в условиях неопределенности, чем как источник стабильного дохода. В заключение, автор отмечает, что ценность созданной панели заключается не в подсчете прибыли, а в наложении строгих рамок управления капиталом и рисками на интуитивные решения, превращая разрозненные ставки в систематизированный процесс.

marsbit7 ч. назад

Панель ставок на Polymarket заработала благодаря коду, но Polymarket — не лучшее место для «арбитража»

marsbit7 ч. назад

Разбор роста Notion: от приложения для заметок до 100 миллионов пользователей — как Notion построил тройную маховик роста на основе продукта, шаблонов и сообщества

Notion — это уникальный пример роста SaaS-компании, который основан не на одной функции или агрессивном маркетинге, а на взаимосвязанной системе из трех «маховиков роста»: продукта, шаблонов и сообщества. Изначально Notion начинал как сложный инструмент для создания пользовательских рабочих пространств, но после перезапуска команда сосредоточилась на модульности и простоте. Это позволило превратить его в гибкую платформу, где пользователи могут комбинировать блоки для различных задач — от ведения заметок до управления проектами. Первый маховик — Product-Led Growth (PLG). Свободный план позволил быстро привлечь студентов, создателей и стартапы. Продукт обладает встроенными вирусными механиками: страницы и шаблоны легко делиться, а необходимость сотрудничества естественным образом приводит к приглашению новых пользователей. Второй маховик — экономика шаблонов. Высокая гибкость Notion может отпугнуть новичков. Шаблоны решают эту проблему, превращая абстрактные возможности в готовые решения для конкретных сценариев (планирование, учёба, управление контентом). Пользователи и создатели генерируют тысячи шаблонов, что расширяет экосистему, улучшает SEO и создаёт сообщество заинтересованных создателей. Третий маховик — сообщество. Пользователи делятся своими рабочими процессами, обучают других и формируют идентичность вокруг философии «лучших способов работы». Программа Ambassador помогает локализовать контент и проводить мероприятия по всему миру, превращая пользователей в активных евангелистов. Notion успешно перешёл от индивидуальных пользователей к корпоративному рынку благодаря стратегии «снизу вверх»: сотрудники сначала используют его неформально, а затем компании официально внедряют его для команд. В эпоху ИИ Notion интегрирует возможности искусственного интеллекта непосредственно в рабочие процессы (написание, суммирование, управление знаниями), что повышает ценность платформы и открывает новые сценарии использования. Секрет устойчивого роста Notion заключается не в отдельных функциях, а в целостной экосистеме, где продукт, пользовательский контент и сообщество взаимно усиливают друг друга, создавая значительные барьеры для конкурентов.

marsbit10 ч. назад

Разбор роста Notion: от приложения для заметок до 100 миллионов пользователей — как Notion построил тройную маховик роста на основе продукта, шаблонов и сообщества

marsbit10 ч. назад

Торговля

Спот
Фьючерсы

Популярные статьи

Неделя обучения по популярным токенам (2): 2026 может стать годом приложений реального времени, сектор AI продолжает оставаться в тренде

2025 год — год институциональных инвесторов, в будущем он будет доминировать в приложениях реального времени.

1.9k просмотров всегоОпубликовано 2025.12.16Обновлено 2025.12.16

Неделя обучения по популярным токенам (2): 2026 может стать годом приложений реального времени, сектор AI продолжает оставаться в тренде

Обсуждения

Добро пожаловать в Сообщество HTX. Здесь вы сможете быть в курсе последних новостей о развитии платформы и получить доступ к профессиональной аналитической информации о рынке. Мнения пользователей о цене на AI (AI) представлены ниже.

活动图片