Оригинальный заголовок: Крупнейшая американская криптобиржа тайно перешла на китайскую AI-модель, сэкономив половину средств
Автор: AI 上手笔记
Данные, которые не дают покоя Кремниевой долине
Недавно CEO крупнейшей американской криптовалютной биржи Coinbase, Брайан Армстронг, заявил нечто, что взбудоражило технологический мир:
«Мы переключили наши AI-модели на китайские GLM 5.2 и Kimi 2.7, и расходы на AI сразу сократились вдвое.»
Вдвое? А может, и использование упало?
Как раз наоборот. Объём использования токенов в Coinbase продолжает расти.
Экономить деньги, используя при этом больше — вот что действительно заставило OpenAI и Anthropic понервничать.
Как им это удалось? Три стратегии экономии
Coinbase не просто перешла на более дешёвую модель. Они построили целую «систему экономии»:
Первая стратегия: не привязываться к одной модели, позволить системе выбирать
Coinbase создала систему автоматической маршрутизации. Каждый входящий запрос система автоматически направляет к наиболее подходящей модели, исходя из типа задачи, цены и состояния кэша.
Не для всех задач нужна самая дорогая модель. Простой перевод — подешевле, сложные рассуждения — получше — всё равно что не поехать за продуктами вниз на спорткаре.
Вторая стратегия: повышение эффективности кэширования с 5% до 60%
Это самый мощный ход. Благодаря оптимизации стратегии кэширования Coinbase повысила эффективность кэша с 5% до 60%.
Проще говоря, 60% запросов могут повторно использовать предыдущие результаты вычислений, что значительно снижает фактическую стоимость каждого вызова. Одна эта оптимизация сэкономила огромные суммы.
Третья стратегия: Context Engineering (инженерия контекста)
Coinbase требует от разработчиков оптимизировать контекст, для новых задач начинать новые сессии, не загружая в один диалог слишком много информации.
Это не лень, а новая дисциплина — в отрасли её называют Context Engineering. Anthropic в одном из своих технических блогов прямо указала: при управлении AI-агентами инженерия контекста более эффективна, чем инженерия промптов.
Проще говоря: дело не в том, чтобы сделать AI умнее, а в том, чтобы давать AI более точную информацию.

▲ Всё больше компаний начинают тщательно считать расходы на AI-модели
Это не только Coinbase, это тренд
Coinbase — не первый, кто попробовал.
Lindy, AI-стартап всего из 25 человек, CEO Фло Кривелло полностью заменил Claude на Deepseek. Он рассказал CNBC: «Стоимость AI уже превысила стоимость человеческих ресурсов, это неустойчиво.» После смены модели затраты «обрушились», сэкономив миллионы долларов.
Snowflake, CEO Шридхар Рамасвами провёл практическое сравнение: в 103 задачах по программированию GLM-5.2 справился с 66%, Claude Opus 4.7 — с 67%. Разница? Практически нулевая.
Но разница в цене ощутима:
Сравнение цен (за миллион токенов)
- GLM-5.2: ввод $1.40 / вывод $4.40
- Claude Opus 4.7: ввод $5 / вывод $25
- GPT-5.5: ввод $5 / вывод $30
Цена вывода отличается в 5-7 раз.
Дешёвое — некачественное? Не спешите с выводами
Читая это, вы можете спросить: так сильно дешевле, а качество такое же?
Честно говоря, не совсем, но разница меньше, чем вы думаете.
Тесты Snowflake показали, что GLM-5.2 действительно менее стабилен в некоторых задачах — процент успешного выполнения с первой попытки составил 47,6%, что ниже 53,7% у Opus. И GLM иногда «зацикливается» на неправильном направлении: в одной задаче он потратил 24 минуты, вызвав инструмент 411 раз, и всё равно потерпел неудачу. Opus справился за 9 минут с 49 вызовами.
Но в большинстве задач итоговый процент успеха почти одинаков. Ключевой вопрос: готовы ли вы платить в 5 раз больше за несколько процентных пунктов стабильности?
Для многих компаний ответ становится всё более однозначным: нет.

▲ Разрыв в ценах на западные и китайские AI-модели меняет отраслевой ландшафт
Что это значит для нас, простых людей?
Вы можете сказать: я же не Coinbase, какое это ко мне отношение?
На самом деле, этот тренд даёт три прямых указания, как вам использовать AI:
1. Не зацикливайтесь на одной модели
Многие используют AI, признавая только один вариант — либо ChatGPT, либо Claude. Но профи так уже не делают. Разные задачи — разные модели, это самый экономически эффективный подход.
Повседневные вопросы — подешевле, написание кода, анализ — получше. Как с едой: не станете же вы каждый раз ходить в ресторан со звёздами Мишлен.
2. Кэширование и повторное использование — ключ к экономии
Если вы часто используете AI для однотипных задач (например, еженедельные отчёты, ежедневное ведение заметок), умение использовать кэш и шаблоны может значительно снизить расходы.
3. Оптимизация контекста = лучшие результаты
Многие в диалоге с AI стремятся впихнуть весь бэкграунд. Но практика показывает, что давать AI меньше, но более точной информации, эффективнее. Новая задача — новый диалог. Не заставляйте AI искать ответы в куче истории.
Более глубокие изменения: меняется модель ценообразования AI
За этой «волной миграции моделей» стоит потрясение всей логики ценообразования в индустрии AI.
Высокая оценка OpenAI и Anthropic основана на предположении о «непрерывном высоком росте доходов». Но если всё больше компаний, подобных Coinbase и Lindy, переходят на более дешёвые альтернативы, это предположение перестаёт быть устойчивым.
По сообщениям, между OpenAI и Anthropic уже началась ценовая война. В только что выпущенной серии GPT-5.6 от OpenAI, модель Terra вдвое дешевле GPT-5.5, а Luna позиционируется как самая низкая по цене.
Для пользователей это хорошо. Чем острее конкуренция, тем ниже цены и больше выбор.
Когда американские гиганты начинают экономить на китайских моделях, это означает, что конкуренция в AI больше не является соревнованием бенчмарков в лабораториях, а настоящей битвой за реальные затраты. Уметь делать то же самое за меньшие деньги — вот истинное мастерство.








