Экономия 3 миллиардов токенов в неделю: руководство по кэшированию Claude Code от инженера Anthropic

marsbitОпубликовано 2026-05-24Обновлено 2026-05-24

Введение

Авторы из Anthropic объясняют, как система кэширования (prompt caching) в Claude Code позволяет значительно экономить токены. Кэшированные токены стоят лишь 10% от обычных. Например, 91 миллион кэшированных токенов эквивалентны по стоимости примерно 9 миллионам обычных. Кэш делится на три уровня: системный (инструкции, инструменты), проектный (CLAUDE.md, правила) и диалоговый (история общения). Ключевой принцип — префиксное соответствие: если начало нового запроса совпадает с уже обработанным, модель использует кэш. Время жизни кэша (TTL) в подписке Claude Code составляет 1 час. Для API и Sub-agent по умолчанию — 5 минут. Основные советы пользователям: 1. Не оставлять сессию бездействующей более часа. 2. При смене задачи выполнять четкий «handoff» (резюмировать прогресс) и начинать новую сессию. 3. Помещать большие документы в Projects, а не в диалог. 4. Избегать переключения моделей (включая режим «opus plan»), так как это сбрасывает кэш. Эти привычки помогают поддерживать высокий процент повторного использования кэша, что снижает затраты, увеличивает эффективность сессий и уменьшает нагрузку на сервис. Мониторинг показателя cache read в панели управления помогает оценить эффективность использования кэша.

От редактора: Когда многие люди используют Claude Code, самое непосредственное впечатление — токены расходуются слишком быстро, длинные сессии легко "съедают" лимит. Но с точки зрения инженеров Anthropic, реальное влияние на стоимость оказывает не то, сколько кода вы написали, а то, насколько система постоянно повторно использует уже обработанный контекст.

Основная идея, которой делится эта статья, — как экономить токены с помощью механизма кэширования. Автор за неделю сэкономил более 300 миллионов токенов благодаря кэшированию, достигнув 91 миллиона в один день. Поскольку стоимость кэшированного токена составляет всего 10% от стоимости обычного входного токена, это означает, что 91 миллион кэшированных токенов фактически стоят примерно как 9 миллионов обычных токенов. Причина, по которой длинные сессии Claude Code кажутся более "выносливыми", не в том, что модель работает бесплатно, а в том, что большое количество повторяющегося контекста успешно переиспользуется.

Ключ к кэшированию промптов (prompt caching) — "не прерывать кэш". Claude Code кэширует системные подсказки, определения инструментов, CLAUDE.md, правила проекта и историю диалогов послойно; до тех пор, пока префикс последующих запросов остаётся неизменным, Claude может напрямую читать из кэша, а не обрабатывать весь контекст заново. Внутри Anthropic также отслеживают показатель повторного использования кэша промптов, поскольку это влияет не только на лимиты пользователей, но и напрямую на стоимость обслуживания модели и эффективность работы.

Обычным пользователям не нужно понимать все технические детали, достаточно усвоить несколько ключевых привычек: не оставлять сессию бездействующей более 1 часа; правильно выполнять "передачу сессии" (session handoff) при смене задачи; избегать частой смены моделей; большие документы по возможности помещать в Projects, а не постоянно вставлять их в диалог.

Эта статья — скорее не просто рассказ о технике экономии токенов, а предложение подхода к использованию Claude Code, более близкого к мышлению инженера: рассматривать контекст как актив, который нужно управлять, чтобы кэш постоянно переиспользовался, а длинные сессии выполняли меньше повторяющихся вычислений.

Ниже оригинальный текст:

На этой неделе я сэкономил 300 миллионов токенов, 91 миллион за день, за неделю — более 300 миллионов.

Я не менял никаких настроек. Это просто обычная работа промпт-кэширования в фоновом режиме.

Но когда я действительно понял, что такое кэш и как избежать его "сброса", при том же самом лимите использования мои сессии стали длиться дольше. Итак, вот краткое руководство 80/20 по промпт-кэшированию в Claude Code, без глубоких технических деталей уровня API.

TL;DR

Стоимость кэшированного токена составляет всего 10% от стоимости обычного входного токена. 91 миллион кэшированных токенов фактически стоят примерно как 9 миллионов токенов.

TTL (время жизни) кэша для подписочной версии Claude Code — 1 час; для API по умолчанию — 5 минут; для Sub-agent — всегда 5 минут.

Кэш делится на три уровня: системный, проектный, уровень диалога.

Смена модели в середине сессии сбрасывает кэш, включая включение режима "opus plan".

Как именно считается стоимость кэша?

Каждый кэшированный токен стоит 10% от стоимости обычного входного токена.

Поэтому, когда на моей панели управления видно, что за день 91 миллион токенов попал в кэш, фактическая оплата примерно эквивалентна обработке 9 миллионов токенов. Вот почему по сравнению с отсутствием кэширования при длительном использовании Claude Code кажется, что сессии почти "бесплатно" продлеваются.

На панели управления стоит обратить внимание на две цифры:

Cache create: Разовые затраты при записи контента в кэш. Они начнут приносить пользу в следующем раунде диалога.
Cache read: Токены, которые Claude повторно использует из кэша, например, ваш CLAUDE.md, определения инструментов, предыдущие сообщения и т.д. По сравнению с повторной обработкой как ввода, они дешевле в 10 раз.

Если у вас высокий показатель Cache read, значит, вы эффективно используете кэш; если этот показатель низкий, значит, вы платите за один и тот же контекст снова и снова.

У Тарика из Anthropic есть фраза, которая меня глубоко впечатлила: "Мы фактически отслеживаем процент попаданий в промпт-кэш (cache hit rate), и как только он становится слишком низким, срабатывает сигнал тревоги, даже объявляется инцидент уровня SEV."

Он также написал хорошую статью в X. Когда процент попаданий в кэш высок, происходят четыре вещи одновременно: Claude Code ощущается быстрее, стоимость обслуживания Anthropic снижается, ваша подписка кажется более "выносливой", а длинные сессии кодирования становятся более реальными.

Но если процент попаданий низкий, проигрывают все.

Таким образом, стимулы обеих сторон на самом деле совпадают: Anthropic хочет, чтобы у вас был высокий процент попаданий в кэш, и вы сами тоже этого хотите. То, что действительно мешает, — это некоторые, казалось бы, незначительные привычки, которые незаметно сбрасывают кэш.

Как кэш увеличивается в каждом раунде диалога?

Кэширование зависит от префиксного совпадения (prefix matching).

Не нужно погружаться в глубокие технические детали, просто поймите одну вещь: если всё, что было до определённой позиции, полностью совпадает с уже закэшированным содержимым, Claude может повторно использовать эти закэшированные токены.

Новая сессия обычно разворачивается примерно так:

Согласно документации Claude Code, новая сессия обычно работает так:

Первый раунд диалога: Кэша ещё нет. Системные промпты, контекст вашего проекта (например, CLAUDE.md, memory, правила), а также ваше первое сообщение обрабатываются заново и записываются в кэш.

Второй раунд диалога: Весь контент из первого раунда теперь закэширован. Claude нужно обработать только ваш новый ответ и следующее сообщение. Стоимость этого раунда будет намного ниже.

Третий раунд диалога: Логика та же. Предыдущий диалог по-прежнему хранится в кэше, только последний раунд взаимодействия нужно обработать заново.

Сам кэш можно разделить на три уровня:

Из статьи Тарика в X:

Системный уровень (System layer): Включает базовые инструкции, определения инструментов (read, write, bash, grep, glob) и стиль вывода. Этот уровень кэшируется глобально.

Проектный уровень (Project layer): Включает CLAUDE.md, memory, правила проекта. Этот уровень кэшируется по проектам.

Уровень диалога (Conversation): Включает ответы и сообщения, растёт с каждым раундом диалога.

Если в середине сессии что-либо на системном или проектном уровне изменяется, весь контент должен быть заново закэширован с самого начала. Это самая "дорогая" операция. Представьте: вы уже дошли до 16-го сообщения, и вдруг меняете системный промпт, или делаете перерыв на час, тогда все токены, начиная с первого сообщения, должны быть обработаны заново.

Путаница с 1 часом и 5 минутами

Это место, где легче всего запутаться.

Подписочная версия Claude Code: TTL по умолчанию — 1 час.

Claude API: TTL по умолчанию — 5 минут. Вы можете повысить его до 1 часа, но за более высокую стоимость.
Sub-agent на любом тарифе: Всегда 5 минут.

Веб-чат Claude.ai: Официально не задокументировано. Возможно, как и в подписочной версии, но я не проверял.

Несколько месяцев назад многие жаловались, что лимиты подписки Claude расходуются слишком быстро. Тогда некоторые думали, что Anthropic тихо снизила TTL с 1 часа до 5 минут без уведомления пользователей. Но это не так, TTL Claude Code по-прежнему составляет 1 час.

Проблема в том, что документация Claude Code и API размещена отдельно, а это две совершенно разные вещи, что вызвало немало путаницы.

Если вы активно используете рабочие процессы с Sub-agent или напрямую используете API, то цифра в 5 минут важна. Но для 95% пользователей Claude Code реально важно учитывать только это окно в 1 час.

Три привычки, покрывающие 95% пользователей

Вот то, что я считаю по-настоящему полезным в повседневном использовании.

Не делайте слишком долгих перерывов

Если вы бездействовали более часа, предыдущий контент в основном уже "протух" в кэше. Ваше следующее сообщение будет заново строить кэш. В этом случае вместо того, чтобы возобновлять уже "остывшую" старую сессию, часто дешевле сделать чёткую передачу (handoff) и начать новую сессию.

При смене задачи — просто начните заново

/compact или /clear сами по себе сбрасывают кэш, так что лучше использовать этот момент для полного сброса.

Я сделал себе навык "session handoff skill" (навык передачи сессии) вместо /compact. Он подводит итог тому, что мы завершили, какие решения ещё в ожидании, какие файлы самые важные и с чего следует продолжить. Затем я выполняю /clear, вставляю это резюме и могу продолжать так, будто ничего не прерывалось.

Команда compact иногда тоже работает медленно. А этот handoff skill обычно выполняется меньше чем за минуту.

В чате Claude большие документы по возможности помещайте в Projects

Механизм кэширования на Claude.ai официально не очень подробно описан, но очевидно, что Projects и обычные потоки диалога используют разные методы оптимизации. Поэтому, если вам нужно вставить большой документ, лучше поместите его в Project, а не напрямую в диалог.

Какие действия незаметно сбрасывают кэш?

Есть несколько вещей, которые полностью сбрасывают кэш без явного предупреждения.

Смена модели: Поскольку кэширование зависит от префиксного совпадения, а у каждой модели свой собственный кэш. Как только вы меняете модель, следующий запрос будет обрабатывать полную историю без каких-либо попаданий в кэш.

Режим "Opus plan": Эта настройка использует Opus на этапе планирования, а Sonnet — на этапе выполнения. Я рекомендовал её в некоторых видео по оптимизации токенов не просто так. Но важно понимать, что каждое переключение плана по сути является сменой модели, а значит, требует перестройки кэша. В долгосрочной перспективе это всё равно помогает продлить сессии, но вам нужно знать, что происходит на самом деле.

Редактирование CLAUDE.md в середине сессии возможно: Это изменение не вступит в силу немедленно, а будет применено при следующем перезапуске. Таким образом, текущий кэш не пострадает.

Моя панель управления "бесплатными" токенами

Скриншоты, которые я показывал ранее, взяты из токен-панели управления.

Это простой репозиторий на GitHub. Вы даёте ссылку Claude Code, чтобы он развернул его локально на localhost, и он будет читать все ваши прошлые записи сессий, а не начинать статистику с нуля. Сразу же вы увидите ежедневные данные по input, output, cache create и cache read.

Но есть один нюанс: эта панель управления считает данные по токенам на локальном устройстве. Если вы переключитесь с настольного ПК на ноутбук, цифры не будут полностью совпадать. У каждого устройства свой собственный набор статистики.

Итог

Промпт-кэширование — это тема, в которую можно глубоко погрузиться. В статье Тарика всё описано полнее, чем здесь, если хотите увидеть полную картину, стоит почитать.

Но вам не нужно полностью понимать все детали, чтобы извлечь выгоду. Достаточно усвоить ключевые 80/20: кэшированные токены в 10 раз дешевле обычных; TTL Claude Code — 1 час; смена модели сбрасывает кэш; чёткая передача между задачами обычно выгоднее, чем продолжение использования старой сессии после её "протухания".

Трендовые криптовалюты

CitreaCTR

wrapped stUSDTWSTUSDT

Velodrome FinanceVELODROME

BrevisBREV

PancakeSwapCAKE

JUSTJST

Связанные с этим вопросы

QЧто такое промпт-кэширование в Claude Code и как оно позволяет экономить токены?

AПромпт-кэширование в Claude Code — это механизм, при котором уже обработанные системные инструкции, определения инструментов, CLAUDE.md, правила проекта и история диалогов сохраняются в кэше. Если последующие запросы начинаются с того же префикса (совпадающего содержимого), Claude может повторно использовать эти токены из кэша, вместо того чтобы обрабатывать весь контекст заново. Это значительно снижает расход токенов, так как стоимость кэшированного токена составляет лишь 10% от стоимости обычного входного токена.

QКакие три уровня кэширования существуют в Claude Code?

AВ Claude Code существует три уровня кэширования: 1) Системный уровень (System layer): включает базовые инструкции, определения инструментов (read, write, bash, grep, glob) и стиль вывода. Кэшируется глобально. 2) Уровень проекта (Project layer): включает CLAUDE.md, память (memory) и правила проекта. Кэшируется для каждого конкретного проекта. 3) Уровень диалога (Conversation layer): включает ответы модели и сообщения пользователя, которые накапливаются с каждым раундом беседы.

QКаковы рекомендуемые привычки для эффективного использования кэширования и экономии токенов?

AАвтор рекомендует три ключевые привычки: 1) Не оставлять сессию бездействующей более чем на 1 час (TTL для Claude Code), чтобы не потерять кэш. 2) При смене задачи выполнять четкую передачу сессии (session handoff), резюмируя прогресс, вместо использования `/compact` или продолжения «остывшей» беседы. 3) Помещать большие документы в Projects, а не вставлять их многократно в диалог, так как Projects оптимизированы для работы с большим контекстом.

QКакие действия могут незаметно сбросить кэш в Claude Code?

AКэш может быть сброшен следующими действиями: 1) Переключение модели (например, с Opus на Sonnet), так как каждый модель имеет свой собственный кэш. 2) Использование режима «Opus plan», который переключает модели между этапами планирования и выполнения, что каждый раз приводит к перестроению кэша. 3) Внесение изменений в системные инструкции или определения инструментов в середине сессии приводит к необходимости полной переобработки контекста.

QЧем отличается время жизни кэша (TTL) в Claude Code, Claude API и для Sub-agent?

AВремя жизни кэша (TTL) различается: 1) Для подписочной версии Claude Code TTL по умолчанию составляет 1 час. 2) Для Claude API TTL по умолчанию — 5 минут, но его можно увеличить до 1 часа за дополнительную плату. 3) Для Sub-agent (вложенных агентов) в любом тарифном плане TTL всегда составляет 5 минут. В Claude.ai (веб-чат) точный TTL официально не указан, но предположительно может соответствовать подписочной версии Claude Code.

Похожее

Майкл Сэйлор заявил, что стало невозможно принять обновление биткойна, против которого он выступал!

Майкл Сэйлор заявил, что обновление Bitcoin BIP-110 математически не сможет достичь требуемого порога в 55% добровольной поддержки майнеров в текущем цикле сложности. По его данным, из 946 блоков, сгенерированных к моменту блока 960 561, лишь в 24 был зафиксирован сигнал поддержки этого предложения, и все они исходили от майнеров DATUM через пул OCEAN. Сэйлор подчеркнул, что отсутствие сигналов от остальных майнеров означает, что текущий уровень поддержки не отражает консенсуса. BIP-110 предлагает ограничить возможность добавления в блокчейн Bitcoin данных, не связанных с денежными переводами (например, изображений или текста), чтобы предотвратить «засорение» сети. Сэйлор выступает против, считая, что сеть не должна решать, какие транзакции являются «нужными», а правила не могут меняться по воле небольшой группы. Он также утверждает, что высокая статистика поддержки может быть искусственно завышена из-за автоматизированного процесса сигнализации в некотором программном обеспечении.

cryptonews.ru38 мин. назад

Майкл Сэйлор заявил, что стало невозможно принять обновление биткойна, против которого он выступал!

cryptonews.ru38 мин. назад

В рамках стратегии дивидендная доходность STRC сохраняется на уровне 12%, поскольку цена акций остается ниже номинальной стоимости

Исполнительный председатель Strategy Майкл Сэйлор подтвердил, что дивидендная ставка по бессрочным привилегированным акциям STRC сохранится на уровне 12% до августа 2026 года. Механизм «трещотки» повышает ставку на 0,5%, когда цена падает ниже $95, но не может её понизить при восстановлении цены, что призвано поддерживать стоимость акций на уровне номинала в $100. Несмотря на рекордную дивидендную доходность, акции STRC продолжают торговаться со скидкой около 10-11% от номинала, закрывшись 31 июля на отметке $89.46. Конкуренция с продуктами вроде SATA (13% доходность) и волатильность биткоина усложняют задачу. Устойчивый дисконт вынудил Strategy приостановить выпуск новых акций STRC, ограничив один из каналов финансирования закупок биткоина. Аналитики и юристы высказывают опасения по поводу долгосрочных рисков структуры «трещотки» и способности компании поддерживать выплаты при падении цены биткоина. Strategy создала финансовые резервы, покрывающие около 26 месяцев обязательств, и утвердила программу выкупа акций и монетизации биткоинов для управления рисками.

cryptonews.ru40 мин. назад

В рамках стратегии дивидендная доходность STRC сохраняется на уровне 12%, поскольку цена акций остается ниже номинальной стоимости

cryptonews.ru40 мин. назад

Аналитик: В августе курс биткоина упадет до 60 тыс. долларов, а затем восстановится до 70 тыс. долларов

Аналитик Андрей Порошин (Bitbanker) прогнозирует динамику биткоина на август. Он ожидает, что криптовалютный рынок переживёт спад из-за отсутствия макроэкономических стимулов. Решение ФРС США сохранить процентные ставки не дало рынку чётких сигналов, оставив инвесторов в состоянии осторожности. По базовому сценарию, биткоин в августе может упасть до уровня $60 000 – $62 000, после чего восстановится до $70 000. Этот уровень всё ещё ниже себестоимости майнинга в США, что вынуждает некоторых майнеров переходить в бизнес ИИ-центров обработки данных. В качестве положительного катализатора аналитик отмечает уход со рынка слабых игроков, например, сворачивание деятельности BitMEX, что традиционно снижает краткосрочное давление на цену. Геополитические факторы (эскалация конфликта Иран-США) и неопределённость вокруг закона CLARITY, по его мнению, не окажут существенного влияния на рынок в августе. Более активные ценовые колебания Порошин ожидает в сентябре в связи с новыми решениями ФРС и возможным движением по закону CLARITY Act.

cryptonews.ru40 мин. назад

Аналитик: В августе курс биткоина упадет до 60 тыс. долларов, а затем восстановится до 70 тыс. долларов

cryptonews.ru40 мин. назад

В результате взлома Coldcard, одного из крупнейших взломов биткоин-кошельков за последнее время, началась новая волна убытков! Убытки растут

В результате взлома Coldcard, одного из крупнейших взломов биткоин-кошельков за последнее время, произошла третья волна атак. Исследовательская компания Galaxy Research сообщает, что из кошельков, созданных на этих устройствах, было выведено еще 207,73 BTC. Общие потери теперь составляют около 1367 BTC (примерно 88,6 млн долларов США) по 4585 адресам. Первые две волны атак демонстрировали схожие черты, что указывало на одного злоумышленника. Однако третья волна отличается по методам: используются отдельные адреса для каждой жертвы, адреса P2WSH вместо P2WPKH, и атака нацелена на стандартный путь генерации. Это может означать либо модификацию инструментов первоначальным взломщиком, либо появление нового. Похищенные биткоины, общая стоимость которых оценивается в 88,6 млн долларов, пока не были потрачены злоумышленниками. Анализ показывает, что потери в основном пришлись на кошельки с небольшим балансом, что характерно для индивидуальных пользователей, а не институциональных сервисов. Уязвимое ПО Coldcard было выпущено 17 марта 2021 года, и все украденные средства были созданы после этой даты.

cryptonews.ru1 ч. назад

В результате взлома Coldcard, одного из крупнейших взломов биткоин-кошельков за последнее время, началась новая волна убытков! Убытки растут

cryptonews.ru1 ч. назад

Trump Media продаёт ещё 2628 BTC, запасы снижаются до 4261 BTC

Компания Trump Media & Technology Group (TMTG), стоящая за социальной сетью Truth Social, продолжает сокращать свои вложения в Bitcoin. По данным аналитической платформы Lookonchain, компания продала ещё 2628 BTC на сумму около 165 миллионов долларов через платформу Crypto.com. Это продолжение серии продаж, начавшихся семь месяцев назад. Всего за этот период TMTG продала 7281 BTC на общую сумму примерно 545 миллионов долларов по средней цене 74 855 долларов за монету. Первоначально компания приобрела 11542 BTC по средней цене 118 522 доллара. После последних транзакций её резервы сократились до 4261 BTC (около 269,8 миллиона долларов), что на 63% меньше изначальных холдингов. Эти продажи происходят на фоне усиленного внимания законодателей к криптовалютным интересам, связанным с Дональдом Трампом. В Конгрессе идут дебаты по закону CLARITY Act, который касается этических норм, владения цифровыми активами и потенциальных конфликтов интересов государственных лиц. Критики указывают на такие проекты, как мемкойны TRUMP и MELANIA, а также на токены World Liberty Financial, связывая политическое влияние с частными криптоинтересами.

cointelegraph2 ч. назад

Trump Media продаёт ещё 2628 BTC, запасы снижаются до 4261 BTC

cointelegraph2 ч. назад

Торговля

Спот

Обсуждения

Добро пожаловать в Сообщество HTX. Здесь вы сможете быть в курсе последних новостей о развитии платформы и получить доступ к профессиональной аналитической информации о рынке. Мнения пользователей о цене на PEOPLE (PEOPLE) представлены ниже.

Экономия 3 миллиардов токенов в неделю: руководство по кэшированию Claude Code от инженера Anthropic

Введение

TL;DR

Как именно считается стоимость кэша?

Как кэш увеличивается в каждом раунде диалога?

Путаница с 1 часом и 5 минутами

Три привычки, покрывающие 95% пользователей

Не делайте слишком долгих перерывов

При смене задачи — просто начните заново

В чате Claude большие документы по возможности помещайте в Projects

Какие действия незаметно сбрасывают кэш?

Моя панель управления "бесплатными" токенами

Итог

Трендовые криптовалюты

Связанные с этим вопросы

Похожее

Майкл Сэйлор заявил, что стало невозможно принять обновление биткойна, против которого он выступал!

В рамках стратегии дивидендная доходность STRC сохраняется на уровне 12%, поскольку цена акций остается ниже номинальной стоимости

Аналитик: В августе курс биткоина упадет до 60 тыс. долларов, а затем восстановится до 70 тыс. долларов

В результате взлома Coldcard, одного из крупнейших взломов биткоин-кошельков за последнее время, началась новая волна убытков! Убытки растут

Trump Media продаёт ещё 2628 BTC, запасы снижаются до 4261 BTC

Торговля

Популярные статьи

Как купить PEOPLE

Обсуждения

Топ вопросы

Популярные категории

Популярные теги