Только что Anthropic представил Sonnet 5, производительность близка к Opus 4.8, но не обязательно дешевле
Только что Anthropic представила новую модель Claude Sonnet 5, назвав её «самой агентной версией Sonnet на сегодняшний день». Модель способна планировать, использовать такие инструменты, как браузер и терминал, и автономно работать на уровне, который ещё несколько месяцев назад требовал более крупных и дорогих моделей.
По сравнению с Sonnet 4.6, Sonnet 5 демонстрирует значительный прирост производительности в рассуждениях, использовании инструментов, программировании и интеллектуальной работе, приближаясь к возможностям Opus 4.8, но по более низкой цене. На графиках видно, что Sonnet 5 (оранжевая линия) обеспечивает более широкий диапазон вариантов баланса стоимость-производительность, чем Sonnet 4.6 (серая линия). При среднем уровне «усилий» он значительно повышает экономическую эффективность, а при более высоком — в некоторых задачах может сравниться с Opus 4.8 (жёлтая линия).
Ранние пользователи отмечают возросшую автономность и способность выполнять сложные задачи, где предыдущие Sonnet-модели останавливались. В оценках безопасности Sonnet 5 в целом улучшился по сравнению с Sonnet 4.6, демонстрируя более низкий уровень галлюцинаций и менее рискованное поведение, хотя и немного уступает Opus 4.8.
Однако анализ затрат от Artificial Analysis показывает, что из-за увеличения расхода токенов стоимость выполнения задачи на Sonnet 5 составляет около $2,29, что примерно в 2 раза дороже Sonnet 4.6 и на 15% дороже Opus 4.8, делая его одной из самых дорогих в эксплуатации моделей.
Sonnet 5 доступен по специальной вводной цене до 31 августа 2026 года: $2 за 1 млн токенов на входе и $10 на выходе. После этой даты стандартная цена составит $3 и $15 соответственно. Важно отметить обновление токенизатора: тот же текст теперь может преобразовываться в большее количество токенов (в 1.0–1.35 раза больше), поэтому вводная цена призвана сохранить общую стоимость использования на прежнем уровне. Также были увеличены лимиты запросов (rate limits) для поддержки режимов с высоким уровнем «усилий».
marsbit4 мин. назад