Оригинальное название: Крупнейшая американская криптобиржа незаметно перешла на китайскую AI-модель, сэкономив вдвое
Автор: Заметки по освоению ИИ
Данные, которые беспокоят Кремниевую долину
Недавно генеральный директор крупнейшей американской криптовалютной биржи Coinbase Брайан Армстронг сказал одну фразу, которая взбудоражила техническое сообщество:
«Мы переключили наши AI-модели на китайские GLM 5.2 и Kimi 2.7, и расходы на ИИ сократились вдвое.»
Сократились вдвое? Но значит ли это, что объем использования тоже снизился?
Как раз наоборот. Использование токенов Coinbase продолжает расти.
Больше экономии при большем использовании — вот что действительно беспокоит OpenAI и Anthropic.
Как они этого достигли? Три стратегии экономии
Coinbase не просто заменила модель на более дешевую. Они построили целую «систему экономии»:
Первая стратегия: не привязываться к одной модели, позволить системе самой выбирать
Coinbase создала систему автоматической маршрутизации. Каждый входящий запрос система автоматически направляет к наиболее подходящей модели, исходя из типа задачи, цены и состояния кэша.
Не для всех задач нужна самая дорогая модель. Для простого перевода используй дешевую, для сложных рассуждений — хорошую — как не поедешь на спорткаре за продуктами в соседний магазин.
Вторая стратегия: увеличение кэширования с 5% до 60%
Это самая эффективная мера. Оптимизировав стратегию кэширования, Coinbase увеличила его эффективность с 5% до 60%.
Проще говоря, 60% запросов могут использовать предыдущие расчеты, значительно снижая фактическую стоимость каждого вызова. Только эта оптимизация сэкономила огромные суммы.
Третья стратегия: Контекстная инженерия
Coinbase требует от разработчиков упрощать контекст, для новых задач начинать новые сессии и не загружать в один диалог слишком много информации.
Это не лень, а новая дисциплина — в отрасли ее называют Context Engineering. Anthropic в своем техническом блоге четко указали: при управлении AI-агентами контекстная инженерия эффективнее, чем инженерия подсказок.
Проще говоря: задача не в том, чтобы сделать ИИ умнее, а в том, чтобы давать ему более точную информацию.

▲ Все больше компаний начинает считать деньги на AI-моделях
Не только Coinbase, это тенденция
Coinbase не первая, кто попробовал.
Lindy, AI-стартап с 25 сотрудниками, генеральный директор Фло Кривелло полностью заменил Claude на Deepseek. Он рассказал CNBC: «Затраты на ИИ уже превысили затраты на персонал, это неустойчиво.» После смены модели затраты «обвалились», сэкономив миллионы долларов.
Snowflake, генеральный директор Шридхар Рамасвами провел сравнительный тест: в 103 задачах по кодированию GLM-5.2 справился с 66%, Claude Opus 4.7 — с 67%. Разница? Почти нет.
Но разница в цене ощутима:
Сравнение цен (за миллион токенов)
- GLM-5.2: ввод $1.40 / вывод $4.40
- Claude Opus 4.7: ввод $5 / вывод $25
- GPT-5.5: ввод $5 / вывод $30
Цена вывода отличается в 5-7 раз.
Дешевое — значит плохое? Не спешите с выводами
Прочитав это, вы можете спросить: если он такой дешевый, будет ли качество таким же?
Честно говоря, не совсем такое, но разница меньше, чем вы думаете.
Тесты Snowflake показали, что GLM-5.2 в некоторых задачах действительно менее стабилен — успешность с первой попытки 47,6%, ниже чем у Opus (53,7%). И иногда GLM может «упорствовать» в неправильном направлении: в одной задаче он потратил 24 минуты, вызвав инструмент 411 раз, и все равно потерпел неудачу. Opus справился за 49 вызовов и 9 минут.
Но в большинстве задач конечный успех почти одинаков. Ключевой вопрос: готовы ли вы платить в 5 раз больше за несколько процентных пунктов стабильности?
Для многих компаний ответ становится все более очевидным: нет.

▲ Разрыв в ценах между китайскими и западными AI-моделями меняет структуру отрасли
Что это значит для нас, обычных людей?
Вы можете сказать: я не Coinbase, какое это имеет ко мне отношение?
На самом деле, эта тенденция имеет три прямых следствия для вашего использования ИИ:
1. Не ограничивайтесь одной моделью
Многие используют только одну модель — либо ChatGPT, либо Claude. Но профессионалы уже так не делают. Использование разных моделей для разных задач — наиболее выгодный подход.
Для повседневных вопросов используйте дешевые, для написания кода, анализа — хорошие. Как и в еде: не каждый прием пищи — в мишленовском ресторане.
2. Кэширование и повторное использование — ключ к экономии
Если вы часто используете ИИ для похожих задач (например, еженедельные отчеты, ежедневное структурирование заметок), научитесь использовать кэширование и шаблоны — это значительно снизит расходы.
3. Упрощение контекста = лучший результат
Многие в диалоге с ИИ пытаются впихнуть весь возможный контекст. Но практика показывает, что давать ИИ меньше, но более точной информации работает лучше. Для новой задачи — новый диалог. Не заставляйте ИИ искать ответ в куче истории.
Более глубокие изменения: модель ценообразования ИИ трансформируется
За этой «волной миграции моделей» стоит потрясение всей логики ценообразования в индустрии ИИ.
Высокая оценка OpenAI и Anthropic основана на предположении о «постоянном высоком росте доходов». Но если все больше компаний, таких как Coinbase и Lindy, переключатся на более дешевые альтернативы, это предположение не устоит.
По сообщениям, между OpenAI и Anthropic уже началась ценовая война. В недавно выпущенной OpenAI серии GPT-5.6 модель Terra вдвое дешевле GPT-5.5, а Luna позиционируется как самая низкая по цене.
Для пользователей это хорошо. Чем острее конкуренция, тем ниже цены и больше выбор.
Когда американские гиганты начинают экономить с помощью китайских моделей, это показывает, что конкуренция в ИИ больше не сводится к лабораторным тестам, а стала настоящим соревнованием по затратам. Делать то же самое за меньшие деньги — вот настоящее мастерство.








