Автор: Haseeb
Компиляция: Джяхуань, ChainCatcher
@SemiAnalysis_ недавно обнаружил невероятный феномен в экономике подписок на ИИ-программирование. Если использовать все доступные ресурсы по максимуму, вы платите на 20–70 раз меньше, чем если бы покупали токены через API.
Многие, видя это, восклицают: «Боже мой, посмотрите, сколько крупные компании на моделях субсидируют на токенах, пузырь скоро лопнет!»

Эта реакция ошибочна. Крупные компании на моделях предоставляют такие щедрые пакеты по простой причине: большинство пользователей редко достигают лимита. Этот продукт похож на абонемент в спортзал: лимит велик, потому что подавляющее большинство людей почти им не пользуется.
Но я долго размышлял над этим, и здесь действительно есть нечто странное.
Мы не знаем их фактическую совокупную маржу по подпискам, но, по оценкам SemiAnalysis, тарифный план Anthropic Max 5x лишь выходит в ноль при средней утилизации в 20%. Утилизация в 20% может быть даже завышенной, особенно в организациях, где у всех (включая непрограммистов) есть учетная запись по подписке, но они используют ее лишь изредка. Большинство организаций, которые я знаю, включая Dragonfly, щедро раздают подписки Claude Code и поощряют непрограммистов пробовать их.

Но то, о чем не упомянул SemiAnalysis, — это то, что это явление исключительно для малого бизнеса. Крупные предприятия не могут использовать такое ценообразование для подписок.
Причина в следующем: когда количество пользователей превышает 150, вы вынуждены покинуть модель подписки, известную как «Команда» (Team). Вы должны переключиться на версию «Предприятие» (Enterprise), цена которой составляет 20 долларов США за место (базовая ставка) плюс плата за API, рассчитываемая по фактическому использованию токенов. Корпоративные клиенты платят только по линейной стоимости токенов, а, согласно SemiAnalysis, валовая маржа API на токены составляет около 75%. Это огромное повышение цены, которое вступает в силу резко при достижении отметки в 150 человек.
Итак, если вы являетесь малым бизнесом, стартапом (или индивидуальным пользователем), ваше восприятие расходов на ИИ искажено. Ваша цена на токены на самом деле очень выгодна; возможно, Anthropic имеет очень низкую или даже отрицательную маржу на вас.
Возможно, вам интересно, почему Microsoft и Uber так волнуются о расходах на токены и говорят о «добыче токенов» (token-mining). Вот причина. Их структурные затраты на каждый токен намного выше, чем у стартапов и частных лиц.
Но Anthropic все равно! Для B2B-компании выжимать максимальную ценность из малых компаний или частных лиц не имеет большого смысла. Посмотрите на такие компании, как Datadog или Cloudflare: 80–90% их доходов поступает от крупных контрактов (годовой повторяющийся доход более 100 000 долларов). Зарабатывать нулевую прибыль на длинном хвосте клиентов — это просто стоимость привлечения клиентов.
Это типичная B2B-логика продаж.
Но ту же ситуацию можно рассмотреть с другой точки зрения: через призму налоговой политики.
Потому что если токены заменяют рабочую силу, то валовая прибыль, которую OpenAI и Anthropic получают с токенов, по сути является налогом на ИИ-труд.
Рассмотрение ценообразования на токены в таком свете приводит к двум основным последствиям.
Ценообразование на токены как налоговая политика
Предположим, что оценки маржи из статьи SemiAnalysis верны: подписки безубыточны, валовая маржа API для крупных предприятий — 75%. Первая реакция — назвать это налогом на ИИ-труд в размере 75% для крупных организаций и 0% для стартапов.
Стандартный налоговый анализ скажет, что это препятствует использованию ИИ-труда внутри крупных компаний и на марже побуждает предприятия меньше автоматизировать и сохранять больше человеческого труда. (Очевидно, это также поощряет использование более мелких или открытых моделей, но чистый эффект заключается в том, что оба пути стимулируются. Помните, мы говорим о маржинальном эффекте.)
Однако сильнее всего влияет на поведение не средняя налоговая ставка. В налоговой политике — никогда. Нас действительно волнует предельная налоговая ставка.
Для стартапов, использующих подписку с фиксированной ценой, предельная цена следующего токена равна нулю, пока не достигнут лимит. А нулевая предельная цена — это самое сильное искажение, которое может создать политика.
Для стартапов модель подписки по сути является субсидией на инновации. Самое сильное побуждение — придумать, как наиболее эффективно потратить весь бюджет на токены. Это означает запуск циклов Ralph, заполнение экрана сессиями Claude Code, планирование работы целых групп агентов.

До достижения лимита исследование бесплатно. Таким образом, стартапы фактически соревнуются в том, чтобы выжать последнюю каплю ценности из подписки, превзойдя конкурентов объемом. Парадоксально, но чем больше вы используете, тем ниже средняя цена токена. Каждый стартап хочет быть тем, кто заставляет Anthropic терять больше всего на подписке.
У крупных предприятий стимулы прямо противоположные. Если вы превысили 150 мест, каждый токен в исследовании оплачивается по полной наценке (плюс 75% надбавка!), поэтому их наказание за каждый дополнительный шаг в исследовании новых возможностей растет линейно.
Крупные предприятия по-прежнему будут автоматизировать очевидные, объемные задачи, но маргинальная, экспериментальная, рискованная автоматизация никогда не будет раскрыта, потому что стоимость ее обнаружения слишком высока. Эта налоговая структура в конечном итоге побуждает их сохранять больше человеческого труда и сохранять общую организационную структуру.
Это полная противоположность Японии. Из-за сокращения населения Япония столкнулась с огромным дефицитом рабочей силы. Исторически это означало, что Япония стремится к высокой автоматизации, потому что высокие затраты на рабочую силу стимулируют автоматизацию. Вот почему в японских ресторанах, на заводах, в отелях и больницах есть роботы.
Но, как ни странно, крупные предприятия оказываются в ситуации, противоположной японской: если они должны платить очень высокий налог за использование ИИ, это подрывает стимулы к автоматизации и усиливает мотивацию сохранять существующих сотрудников (что особенно заметно, если в это время заработная плата стагнирует).
Тогда куда же в этой модели направляется замещение рабочей силы?
Все смотрят на крупные компании, ожидая волны увольнений из-за ИИ. Но при 75% налоге слишком агрессивная замена собственных сотрудников ИИ может быть просто нерентабельной — бюджет на токены взлетит до небес.
Но это не значит, что замещение не произойдет; просто оно проявится в другой форме.
Когда крупные предприятия теряют долю рынка в пользу ИИ-нативных стартапов с чрезвычайно низкими совокупными затратами на рабочую силу, падение их доходов и цен на акции вызывает увольнения. Но те рабочие места, которые были уничтожены, никогда не появятся вновь в стартапах-победителях. Чистый эффект сокращения рабочих мест тот же, просто этот пробел в занятости переносится в другой сектор экономики с более низкими налоговыми ставками.
Вот почему «AI-washing» (приписывание обычных увольнений новообретенной эффективности ИИ) может быть не временным явлением. Под AI-washing подразумевается, когда компания приписывает увольнения эффективности ИИ, хотя на самом деле просто маскирует обычные бизнес-слабости.
Многие думают, что это просто преходящее явление в текущем цикле хайпа вокруг ИИ. Однако, хотя все готовы увидеть, как крупные предприятия действительно проводят увольнения из-за ИИ, «замещая» рабочие места ИИ, этого, возможно, никогда не произойдет в массовом масштабе.
Замещение рабочей силы может развернуться по-другому: стартапы побеждают крупные компании, крупные компании маскируют свой спад под видом ИИ до самого банкротства, а стартапы никогда не восстанавливают эти старые рабочие места. Замещение рабочих мест все равно произойдет, просто не там, где все смотрят.
Это первое следствие данной модели. Но есть и второе, более странное следствие.
Обрыв в 150 человек
Регуляторный разрыв (Notch) — это регуляторная граница, которая вызывает резкое изменение поведения. Например: стандарт полной занятости в 30 часов в неделю породил множество рабочих мест ровно на 29 часов в неделю.
Хорошо известно, что во Франции существуют чрезвычайно строгие трудовые нормы, которые вступают в силу, когда у предприятия достигается 50 сотрудников (советы персонала, обязательное участие в прибыли, защита от увольнений), от которых малые компании освобождены. Это дает работодателям огромный стимул изо всех сил стараться оставаться ниже отметки в 50 человек.

Источник: Garicano, Luis, Claire Lelarge и John Van Reenen, 2016, «Firm Size Distortions and the Productivity Distribution: Evidence from France».
Применим эту аналогию к ИИ. Компании на больших моделях установили налоговый порог, который наказывает компании, превышающие 150 мест. Это означает, что вы должны оставаться небольшими, чтобы сохранить прекрасную субсидированную цену подписки и облагаться налогом примерно 0% (или даже отрицательным) на токены, а не 75%.
Это может породить совершенно новую философию управления предприятиями. Стартапы будут все больше одержимы решением всего с помощью агентов, команды будут меньше, увольнения — чаще, больше аутсорсинга, все возможные средства будут использованы, чтобы свести к минимуму человеческий фактор там, где он необходим.
Это не потому, что это «оптимальный» уровень автоматизации, а потому, что стимулы толкают их к этому. Если волшебное число — 149, то каждое место имеет решающее значение, и вы не можете тратить ни одного человека за пределами ключевых точек компании.
Этот разрыв может быть воспринят такими людьми, как в Гарвардской школе бизнеса, как «новое поколение управления с приоритетом на ИИ». Но при правильном понимании это просто рациональный ответ на корпоративное ценообразование.
Это может звучать преувеличенно. Но различия в поведении между организациями уже видны. Поговорите с разработчиками в крупных предприятиях — они скрупулезно подсчитывают токены и все больше беспокоятся о том, что руководство сокращает бюджет на токены. А разработчики в стартапах изо всех сил стараются максимизировать использование (tokenmaxxing), запуская группы агентов на ночь и проверяя логи утром. Я ожидаю, что эта тенденция ускорится.
Никто специально это не проектировал. Ни один комитет не решал субсидировать инновации для стартапов и облагать налогом устоявшиеся предприятия. Все это прямо вытекает из проверенных временем традиционных стратегий корпоративного ценообразования.
Но так всегда было с налоговым кодексом: набор побочных правил, которые в конечном итоге определяют, какие компании могут быть построены и как эти компании искажают себя, чтобы минимизировать налоговое бремя.
Вы можете возразить, что это временно, и компании на больших моделях в конечном итоге перейдут на расчет по использованию для всех. Github Copilot уже осуществил этот переход. Может быть. А может и нет. Но к тому времени, как ценообразование нормализуется, компании с 149 сотрудниками и этот новый, ориентированный на ИИ стиль управления, возможно, уже взорвутся, захватят значительную долю рынка и напишут сценарий для следующего поколения стартапов.
Налоговая политика имеет решающее значение. Вся концепция «гиг-экономики» существует благодаря юридическому различию между статусом W-2 (официальный сотрудник) и 1099 (независимый подрядчик). По мере того, как все больше рабочей силы поглощается ИИ, ценообразование на токены может стать наиболее влиятельной налоговой политикой следующего десятилетия. Однако за нее никогда никто не будет голосовать.
(Не удивляйтесь, если в следующем цикле самые быстрорастущие компании будут заметно застревать на отметке в 149 мест.)





