Автор: xiyu
Хотите использовать Claude Opus 4.6, но боитесь огромного счёта в конце месяца? Это руководство поможет сократить ваши затраты на 60-85%.
1. На что уходят токены?
Вы думаете, что токены — это только «ваши слова + ответ ИИ»? На самом деле, всё гораздо сложнее.
Скрытые затраты каждого диалога:
-
System Prompt (~3000-5000 токенов): Ключевые инструкции OpenClaw, изменить нельзя.
-
Внедрение файлов контекста (~3000-14000 токенов): AGENTS.md, SOUL.md, MEMORY.md и другие, которые подгружаются в каждый диалог — это самый большой скрытый расход.
-
История сообщений: Чем дольше диалог, тем она длиннее.
-
Ваш ввод + вывод ИИ: Это то, что вы считаете «всем».
Простой вопрос «Какая сегодня погода?» на самом деле потребляет 8000-15000 входных токенов. При использовании Opus, только контекст обойдётся в $0.12-0.22.
Cron ещё хуже: Каждый запуск = новый диалог = повторное внедрение всего контекста. Cron, запускаемый каждые 15 минут (96 раз в день), на Opus будет стоить $10-20 в день.
Heartbeat работает по тому же принципу: По сути, это тоже вызов диалога, чем короче интервал, тем больше денег сжигается.
2. Разделение моделей: Sonnet для повседневных задач, Opus для ключевых
Первый и самый мощный способ экономии. Цена Sonnet примерно в 5 раз ниже, чем у Opus, и его достаточно для 80% повседневных задач.
markdown
Промт:
Пожалуйста, помогите мне изменить модель по умолчанию в OpenClaw на Claude Sonnet,
используя Opus только для глубокого анализа или творческих задач.
Конкретные требования:
1) Установить Sonnet как модель по умолчанию
2) Cron-задачи по умолчанию используют Sonnet
3) Только задачи, связанные с написанием текстов и глубоким анализом, должны использовать Opus
Сценарии для Opus: Написание длинных текстов, сложный код, многошаговые рассуждения, творческие задачи.
Сценарии для Sonnet: Повседневное общение, простые вопросы и ответы, проверки по cron, heartbeat, операции с файлами, перевод.
Реальные замеры: После переключения месячные затраты снизились на 65%, разница в опыте практически незаметна.
3. Сокращение контекста: Убираем скрытых пожирателей токенов
«Фоновый шум» каждого вызова может составлять 3000-14000 токенов. Сокращение внедряемых файлов — это оптимизация с самой высокой отдачей.
markdown
Промт:
Помогите мне сократить контекстные файлы OpenClaw для экономии токенов.
В частности: 1) Удалите ненужные части из AGENTS.md (правила групповых чатов, TTS, неиспользуемые функции), сократите до 800 токенов.
2) Сократите SOUL.md до ключевых пунктов, 300-500 токенов.
3) Очистите MEMORY.md от устаревшей информации, ограничьте 2000 токенов.
4) Проверьте конфигурацию workspaceFiles, удалите ненужные внедряемые файлы.
Эмпирическое правило: Сокращение на 1000 токенов внедрения, при 100 вызовах Opus в день, экономит около $45 в месяц.
4. Оптимизация Cron: Самый скрытый убийца бюджета
markdown
Промт: Помогите мне оптимизировать cron-задачи OpenClaw для экономии токенов.
Пожалуйста:
1) Составьте список всех cron-задач с их частотой и моделью.
2) Понизьте все нетворческие задачи до Sonnet.
3) Объедините задачи, выполняемые в одно время (например, несколько проверок в одну).
4) Уменьшите ненужную высокую частоту (проверки системы с 10 минут до 30, проверки версий с 3 раз в день до 1).
5) Настройте delivery на уведомления по требованию, в нормальном состоянии сообщения не отправлять.
Ключевой принцип: Не всегда чем чаще, тем лучше. Большинство потребностей в «реальном времени» — ложные. Объединение 5 отдельных проверок в 1 вызов экономит 75% стоимости внедрения контекста.
5. Оптимизация Heartbeat
markdown
Промт: Помогите мне оптимизировать конфигурацию heartbeat в OpenClaw:
1) Установите интервал в рабочее время на 45-60 минут.
2) Установите период тишины с 23:00 до 08:00.
3) Сократите HEARTBEAT.md до минимального количества строк.
4) Объедините разрозненные задачи проверки в пакетное выполнение через heartbeat.
6. Точный поиск: Экономьте 90% Input Token с помощью qmd
Когда агент ищет информацию, по умолчанию он «читает весь файл» — файл на 500 строк это 3000-5000 токенов, а ему нужно всего 10 строк. 90% входных токенов тратится впустую.
qmd — это инструмент локального семантического поиска, который создает полнотекстовый + векторный индекс, позволяя агенту точно находить абзацы, а не читать весь файл. Все вычисления локальные, нулевая стоимость API.
Используется вместе с mq (Mini Query): предварительный просмотр структуры каталогов, точное извлечение абзацев, поиск по ключевым словам — читаются только нужные 10-30 строк за раз.
markdown
Промт:
Помогите мне настроить поиск по базе знаний qmd для экономии токенов.
Адрес на Github: https://github.com/tobi/qmd
Требуется:
1) Установить qmd.
2) Создать индекс для рабочей директории.
3) Добавить правила поиска в AGENTS.md, обязывающие агента в первую очередь использовать qmd/mq, а не прямое чтение всего файла.
4) Настроить регулярное обновление индекса.
Реальные результаты: Поиск информации теперь стоит 1500 токенов вместо 15000, сокращение на 90%.
Отличие от memorySearch: memorySearch управляет «воспоминаниями» (MEMORY.md), qmd управляет «поиском информации» (пользовательская база знаний), они не мешают друг другу.
7. Выбор Memory Search
markdown
Промт: Помогите мне настроить memorySearch в OpenClaw.
Если у меня немного файлов памяти (десятки md),
посоветуйте использовать локальное внедрение или Voyage AI?
Пожалуйста, объясните разницу в стоимости и качестве поиска для каждого.
Простой вывод: При малом количестве файлов памяти используйте локальное внедрение (бесплатно), при высоких требованиях к многоязычности или большом количестве файлов — Voyage AI (2 миллиарда бесплатных токенов на аккаунт).
8. Исчерпывающий список конфигурации
markdown
Промт:
Пожалуйста, помогите мне единоразово оптимизировать конфигурацию OpenClaw для максимальной экономии токенов, выполнив следующий список:
Изменить модель по умолчанию на Sonnet, оставить Opus только для творческих/аналитических задач.
Сократить AGENTS.md / SOUL.md / MEMORY.md.
Понизить ВСЕ cron-задачи до Sonnet + объединить + уменьшить частоту.
Интервал Heartbeat 45 минут + ночной период тишины.
Настроить точный поиск через qmd вместо полного чтения.
В workspaceFiles оставить только необходимые файлы.
Регулярно очищать файлы памяти, держать MEMORY.md в пределах 2000 токенов.
Настройте один раз, пользуйтесь долго:
1. Разделение моделей — Sonnet на каждый день, Opus для ключевых задач, экономия 60-80%.
2. Сокращение контекста — Урезание файлов + точный поиск qmd, экономия 30-90% входных токенов.
3. Сокращение вызовов — Объединение cron, увеличение интервала heartbeat, включение периодов тишины.
Sonnet 4 уже очень мощный, в повседневном использовании разницы не ощущается. Когда действительно понадобится Opus — просто переключитесь на него.
Основано на практическом опыте работы с multi-agent системами, данные являются обезличенными оценочными значениями.






