Сколько из вашей подписной платы за Claude достается компаниям, производящим оптические модули?

marsbitОпубликовано 2026-06-17Обновлено 2026-06-17

Введение

TL;DR На примере предполагаемого разбора подписки Claude Pro (примерно $20 в месяц) между компанией-разработчиком модели, облачными вычислениями, амортизацией GPU, электроэнергией и цепочкой поставок обсуждается, как оценивать доходы от AI-приложений. Ключевой вопрос: какая часть абонентской платы оседает в виде маржи, как в традиционном SaaS, учитывая, что каждое использование модели влечет переменные затраты на вычисления (инференс). В отличие от SaaS с низкими предельными издержками, AI-сервисы несут значительные расходы на инфраструктуру (GPU, HBM, электроэнергия, ЦОДы) при каждом запросе пользователя. Поэтому рост выручки от подписок не гарантирует высокой рентабельности, если затраты на вычисления растут пропорционально объему использования. Сейчас более предсказуемую выручку получают инфраструктурные компании (NVIDIA, TSMC, поставщики HBM, облачные провайдеры). Для разработчиков AI-приложений путь к высокой оценке лежит через повышение эффективности: снижение стоимости инференса, оптимизация моделей, кэширование, использование более дешевых моделей для простых задач и совершенствование ценообразования. Итоговая маржа будет зависеть от того, удастся ли снизить удельную стоимость использования быстрее, чем растут его объем и сложность задач пользователей.

Краткое содержание:

Схема, которая разбивает примерно 20 долларов США ежемесячной платы за Claude Pro на модельную компанию, облачные вычисления, амортизацию GPU, электроэнергию и цепочку поставок, заставляет инвесторов вновь обсуждать, как следует оценивать доходы от AI-приложений.

Эта схема не является официальными данными о распределении доходов от Anthropic, Amazon Web Services или NVIDIA и не может рассматриваться как реальный финансовый отчет какой-либо компании. Ее ценность заключается в том, что она поднимает более фундаментальный вопрос: какая часть подписной платы пользователей за AI-приложения может превратиться в валовую прибыль от программного обеспечения, как в традиционном SaaS?

Логика оценки традиционного SaaS ясна. После того как программное обеспечение написано, продажа дополнительной учетной записи обычно несет невысокие дополнительные затраты. Зрелые компании, занимающиеся чистым ПО, часто имеют валовую маржу на уровне 70% или даже выше 80%. Инвесторы готовы давать высокие мультипликаторы, потому что с ростом масштаба доходов рентабельность имеет возможность продолжать расти.

Проблема с AI-приложениями заключается в том, что каждый запрос пользователя, написание кода, анализ файла или вызов агента потребляют время GPU, электроэнергию, пропускную способность памяти и облачные ресурсы. На поверхности – фиксированная ежемесячная плата, в основе же – цепочка затрат, меняющаяся в зависимости от интенсивности использования. Легкие пользователи могут приносить высокую маржу, но при интенсивном использовании в рамках доступного лимита или пакета инструментов, когда задачи выполняются непрерывно, затраты могут быстро возрасти.

Таким образом, схема разбивки 20 долларов бросает вызов не тому, сколько долларов получает конкретная компания, а самому утверждению, что «доход от AI-приложений по своей природе равен доходу от SaaS». Чтобы доказать свою высокую стоимость, AI-компании должны продемонстрировать не только готовность пользователей платить, но и то, что валовая маржа, взвешенная по интенсивности использования, может постоянно улучшаться.

За подписной платой скрывается цепочка затрат на инференс

Самое большое отличие AI-подписки от обычной программной подписки заключается в том, что «предельные затраты на одно использование» больше не близки к нулю.

В традиционном SaaS, когда команда открывает дополнительную учетную запись, у поставщика услуг также возникают затраты на серверы, поддержку клиентов и пропускную способность, но эти затраты обычно не растут линейно с каждым кликом. Настоящие дорогие затраты – это первоначальные расходы на разработку, продажи и привлечение клиентов. После масштабирования продукта значительная часть дополнительного дохода может оставаться у компании.

С продуктами на основе больших языковых моделей все иначе. Пользователь вводит вопрос, модель генерирует ответ – этот процесс называется инференсом, т.е. фактическими вычислениями при вызове модели пользователем. Токен – это базовая единица измерения для чтения и записи текста моделью. Чем больше пользователь спрашивает, чем длиннее контекст и сложнее генерируемый контент, тем больше токенов и вычислительных ресурсов потребляется.

Так возникает противоречие между фиксированной подпиской и переменными затратами. Ежемесячная плата за Claude Pro в США составляет примерно 20 долларов (цена может варьироваться в зависимости от региона, налогов и корректировок Anthropic). Пользователь видит фиксированную цену, в то время как модельная компания сталкивается с совершенно разным поведением пользователей: одни просто пишут письма и ищут информацию, другие обрабатывают длинные документы, запускают задачи по коду или используют более сложные автоматизированные процессы.

Схема разбивки, циркулирующая на рынке, пытается визуализировать это: из 20 долларов часть остается у модельной компании, часть идет поставщикам облачных и вычислительных услуг. Затраты на вычисления включают электроэнергию, обслуживание, амортизацию GPU. Закупка GPU, в свою очередь, направляет средства вверх по цепочке к NVIDIA, TSMC, поставщикам HBM (памяти высокой пропускной способности), производителям оптических модулей, ODM-компаниям и предприятиям, связанным с электроэнергией.

Здесь «амортизация GPU» можно понимать как то, что дорогостоящие GPU не списываются единовременно, а постепенно распределяются на стоимость AI-услуг в течение срока службы, интенсивности использования или в соответствии с бухгалтерскими стандартами. Фактическое распределение будет зависеть от лимитов тарифных планов, соотношения легких и активных пользователей, внутренних цен расчетов между облачными провайдерами, скидок на резервированные мощности, коэффициента использования GPU и срока амортизации. Средние затраты также не равны предельным затратам.

Инвесторам на самом деле нужно следить за тенденцией: AI-компаниям на уровне приложений недостаточно раскрывать только рост доходов, они также должны отвечать на вопрос, растут ли пропорционально затраты на вычислительные мощности. Если объем использования растет быстрее, чем эффективность моделей, чем выше доход от подписок, тем более заметным может стать давление на валовую прибыль. Только если повышение эффективности будет достаточно быстрым, у модельных компаний появится шанс вновь приблизиться к структуре прибыли программных компаний.

Инфраструктура получает более определенный доход уже сейчас

На данном этапе рост использования AI более непосредственно направляется в инфраструктуру, а не полностью оседает на уровне приложений.

Независимо от того, используют ли пользователи модель в Claude, ChatGPT, Gemini или корпоративных агентах, инференс в конечном итоге требует вычислительных мощностей, электроэнергии, памяти и сети. На уровне приложений может происходить смена продуктов, в то время как потребление базовых ресурсов более жесткое. Пока использование AI продолжает расти, будут расти и капитальные расходы на облачные сервисы, закупки GPU, спрос на HBM и потребление электроэнергии центрами обработки данных.

Это также является причиной продолжающейся переоценки рынком цепочки инфраструктуры, включающей NVIDIA, TSMC, SK Hynix и других. Общая валовая маржа NVIDIA в последние годы остается на высоком уровне: по GAAP и non-GAAP за 2026 финансовый год она составила около 71,1% и 71,3% соответственно, прогнозы на последующие кварталы также остаются высокими. Стоит отметить, что отдельные кварталы могут подвергаться влиянию специфических расходов, а открытая финансовая отчетность не всегда позволяет напрямую разложить реальную структуру маржи центров обработки данных AI, но тот факт, что дефицитная инфраструктура обладает ценообразовательной властью, уже отражен в результатах.

HBM является наиболее типичным звеном в этой цепочке. Это не обычная память, а ключевой компонент в AI-ускорителях, поддерживающий вычисления с высокой пропускной способностью. С ростом масштаба моделей, длины контекста и потребности в параллельном инференсе зависимость AI-чипов от памяти с высокой пропускной способностью усиливается. Оценки цепочки поставок показывают, что доля HBM в стоимости AI-чипов нового поколения возрастает, что также является важной причиной переоценки SK Hynix, Samsung, Micron в рамках AI-цикла.

Электроэнергия и центры обработки данных также превратились из фоновых затрат в основное направление инвестиций. Энергопотребление одного обычного текстового запроса может быть не столь значительным, но сложные агенты, длинный контекст, генерация кода и многоуровневые задачи увеличивают объем вычислений. Для облачных провайдеров и операторов ЦОД ключевым моментом является не то, сколько электроэнергии потребляет один запрос, а то, что при непрерывном возникновении огромного количества запросов на инференс, коэффициент использования кластеров, цена на электроэнергию, охлаждение, емкость дата-центра и возможности подключения к электросети становятся факторами затрат и узкими местами.

Преимущество инфраструктурного сегмента заключается в более быстрой верификации результатов. Капитальные расходы на AI облачных провайдеров уже имеют место, доходы и валовая маржа NVIDIA отражены в финансовой отчетности, заказы и цены производителей HBM также относительно быстро попадают в отчеты о прибылях и убытках. На уровне модельных приложений торгуются в основном будущие ожидания: конверсия в подписки, уровень проникновения в корпоративный сектор, доходы от API и высвобождение прибыли после снижения будущей кривой затрат.

Повышение эффективности остается основным аргументом «быков»

У инвесторов в ПО и сторонников AI («быков») тоже есть контраргументы. Основная идея сторонников эффективности заключается в том, что высокая стоимость инференса сегодня – это лишь явление ранней стадии. Оптимизация моделей, кэширование, небольшие модели, собственные чипы и более высокий коэффициент использования кластеров будут постоянно снижать удельную стоимость. Если затраты будут снижаться достаточно быстро, AI-приложения могут вернуться к логике ПО с высокой маржой.

У этого контраргумента есть реальная основа. Стоимость за токен для некоторых основных моделей при сопоставимых или более высоких возможностях уже значительно снизилась. OpenAI сообщала, что стоимость GPT-4o mini за токен снизилась на 99% по сравнению с ранней text-davinci-003. Темпы у разных компаний не полностью совпадают; недавние действия Anthropic больше проявлялись в виде обновлений по той же цене и стратификации моделей, но отраслевой тренд по-прежнему заключается в предоставлении более мощных возможностей по более низкой стоимости.

У модельных компаний также есть несколько способов улучшить удельную экономику. Простые задачи можно поручить небольшим моделям, часто встречающиеся запросы можно повторно использовать через кэш, длинный контекст и сложные задачи – более мощным моделям. Облачные провайдеры, в свою очередь, снижают удельную стоимость вычислений за счет собственных чипов и планирования кластеров. У Google есть TPU, Microsoft представила Maia для инференса, Amazon также продвигает Trainium и Inferentia.

Если рассматривать только технологический прогресс, у рентабельности AI-приложений действительно есть потенциал для улучшения. Более дешевый инференс, лучшая маршрутизация моделей, более мощные возможности сжатия – все это может позволить той же подписке за 20 долларов выдерживать больший объем использования. Легкие пользователи, дорогие корпоративные тарифы, многоуровневое ценообразование API и более строгие лимиты использования также могут улучшить общую удельную экономику.

Сложность заключается в том, что снижение затрат – не единственная переменная. AI-приложения переходят от простого чата к более ресурсоемким рабочим нагрузкам. Раньше пользователи могли только задавать вопросы и переписывать текст, сейчас все больше запросов связано с код-агентами, обработкой длинных документов, генерацией видео и мультимодального контента, корпоративными автоматизированными процессами. Эти сценарии имеют более высокую ценность, но и потребляют больше ресурсов. Чем полезнее модель, тем с большей вероятностью пользователи будут поручать ей более сложные и длительные задачи.

Таким образом, расхождения становятся более конкретными: сможет ли скорость снижения затрат на инференс опередить рост объема использования и сложности задач. Если удельная стоимость снижается быстро, но среднее потребление пользователей растет еще быстрее, взвешенная валовая маржа модельных компаний по-прежнему будет испытывать давление. И наоборот, если маршрутизация моделей, кэширование, собственные чипы и ценовое расслоение окажутся достаточно эффективными, AI-подписка может постепенно избавиться от сегодняшних характеристик высоких затрат.

Количество подписчиков – это не валовая маржа

Схему разбивки 20 долларов не следует понимать как конечный результат. Скорее, это напоминание об оценке на текущем этапе: пока рынок не видит достаточно прозрачных данных о валовой марже модельных компаний, инвесторам нужно скидывать с предположения, что «AI-приложения по своей природе равны SaaS».

Для таких непубличных модельных компаний, как OpenAI, Anthropic, внешним инвесторам сложно увидеть полную финансовую картину. Материалы по привлечению финансирования, раскрытие информации партнерами, структура облачных затрат, цены на корпоративные тарифы, доля доходов от API и ограничения использования станут ключами для оценки. Ценными данными являются не количество платящих пользователей, а пропорция легких и активных пользователей, готовность корпоративных клиентов платить более высокую цену за интенсивное использование, снижаются ли затраты на облачные расчеты, а также находит ли снижение удельных затрат на инференс отражение в валовой марже компаний.

Верификация по публичным компаниям в цепочке быстрее появится в финансовой отчетности. Общая валовая маржа NVIDIA и темпы роста доходов от центров обработки данных, спрос на передовые технологические процессы и упаковку TSMC, цены и рентабельность производителей HBM, интенсивность капитальных расходов облачных провайдеров – все это продолжит отражать, передается ли рост использования AI на инфраструктурный уровень. Если эти показатели останутся сильными, а на уровне модельных приложений будет не хватать доказательств улучшения маржи, рынок продолжит давать инфраструктуре более определенную премию к оценке.

В конечном счете, чтобы вернуть более высокую точку привязки оценки, модельным компаниям нужно доказать не только то, что пользователи готовы платить 20 долларов, но и то, что после интенсивного использования от этих подписных платежей остается достаточно высокой валовой прибыли. Следующий раунд разногласий по оценкам, вероятно, будет связан не с громкими цифрами ARR (ежегодного регулярного дохода), а с тем, смогут ли одновременно быть успешными затраты на инференс, ограничения тарифных планов и цены на корпоративные подписки.

Связанные с этим вопросы

QПочему автор статьи ставит под сомнение, что доходы от ИИ-приложений можно напрямую сравнивать с доходами SaaS-компаний?

AПотому что в традиционном SaaS бизнесе дополнительные продажи имеют очень низкую маржинальную стоимость, тогда как каждый запрос пользователя в ИИ-приложении (инференс) требует затрат вычислительных ресурсов (GPU), электроэнергии и сетевой инфраструктуры. Эти затраты напрямую зависят от интенсивности использования, что делает переменные издержки значительными и ставит под вопрос возможность достижения такой же высокой рентабельности, как у классического софтверного бизнеса.

QСогласно статье, какая доля выручки от подписки на ИИ-услуги в текущий период более надежно достается инфраструктурным компаниям, и почему?

AБолее надежную и предсказуемую долю выручки в текущий период получают инфраструктурные компании (поставщики GPU, облачных услуг, HBM-памяти, электроэнергии). Причина в том, что рост использования ИИ напрямую и незамедлительно ведет к увеличению спроса на их продукцию и услуги, независимо от того, какое именно приложение использует конечный пользователь. Их доходы и прибыль подтверждаются финансовой отчетностью быстрее, чем прибыль компаний, разрабатывающих модели, которая зависит от будущего снижения затрат на инференс.

QКаков основной аргумент оптимистов (быков) относительно потенциальной прибыльности ИИ-приложений в долгосрочной перспективе?

AОсновной аргумент оптимистов заключается в том, что текущие высокие затраты на инференс — явление временное, характерное для ранней стадии развития технологии. Они ожидают, что благодаря оптимизации моделей, использованию кэширования, разработке более дешевых и специализированных чипов (ASIC), а также улучшению эффективности кластеров, удельная стоимость обработки одного токена будет быстро снижаться. Если скорость этого снижения превысит рост сложности и объема запросов пользователей, бизнес-модель ИИ-приложений сможет приблизиться к высокой рентабельности традиционного SaaS.

QЧто, по мнению автора, является ключевым показателем для оценки реальной стоимости ИИ-компаний, а не просто рост числа платных подписчиков?

AКлючевым показателем является не количество платных подписчиков (ARR), а валовая прибыль (gross margin), взвешенная по интенсивности использования. Инвесторам необходимо видеть, как соотносятся рост выручки от подписок и соответствующий рост затрат на вычислительные мощности. Важными данными для анализа являются доля интенсивных и легких пользователей, структура тарифов для корпоративных клиентов, динамика затрат на облачные вычисления и фактическое снижение удельной стоимости инференса, отраженное в финансовых результатах компании.

QКакую проблему или дилемму иллюстрирует пример с подпиской Claude Pro стоимостью 20 долларов в статье?

AПример с подпиской Claude Pro за 20 долларов иллюстрирует фундаментальное противоречие между фиксированной ценой для пользователя и переменными издержками для компании-разработчика модели. Пользователи с разной интенсивностью использования (легкие — например, для проверки почты, и тяжелые — для обработки длинных документов или запуска агентов) генерируют совершенно разную нагрузку и стоимость обслуживания. Это ставит под вопрос экономическую устойчивость фиксированной подписки и требует от компаний более сложных моделей ценообразования (например, многоуровневых тарифов, ограничений, отдельных цен на API), чтобы обеспечить рентабельность при обслуживании как легких, так и интенсивных пользователей.

Похожее

ChatGPT потерял половину своей империи: за три с половиной года, от монополии к разделу рынка

Прошло три с половиной года с момента появления ChatGPT. Когда-то он был революционным явлением, самым быстрорастущим приложением в истории, достигшим 1 миллиарда пользователей. Однако сейчас его глобальная доля на рынке AI-ассистентов впервые упала ниже 50%, составив 46,4% по данным Sensor Tower на конец мая 2026 года. Лидерство больше не означает монополию. Основными конкурентами, отвоевавшими долю, стали Gemini (27,7%) от Google и Claude (10,3%) от Anthropic. Рост Gemini объясняется глубокой интеграцией в экосистему Google (поиск, почта, Android), что делает его удобным для массового пользователя. Claude завоевал популярность среди "тяжелых" пользователей благодаря сильным сторонам в обработке длинных текстов, написании кода и сложных задачах, демонстрируя высокую конверсию в платные подписки (13%). Рынок перешел от фазы удивления к фазе сравнения, монетизации и экосистемной привязки. Пользователи стали более прагматичными и готовы мигрировать к тому ассистенту, который лучше справляется с конкретной задачей. Помимо "сырой" мощности модели, на выбор теперь влияют интеграция с привычными сервисами, цена, доверие к бренду и даже этические соображения. Монетизация становится ключевой темой. Общие расходы пользователей в AI-приложениях за первое полугодие 2026 года превысили $4,2 млрд. ChatGPT экспериментирует с рекламой, которую уже видят 17% пользователей, дополняя модель подписок. Это отражает жесткую финансовую реальность: затраты на вычисления и инфраструктуру огромны (OpenAI потратила $3,7 млрд только в первом квартале 2026 года), и компаниям необходимо находить устойчивые бизнес-модели. Эпоха, когда один продукт определял всю отрасль, закончилась. ChatGPT остается крупнейшим ассистентом, но рынок поделили несколько крупных игроков. AI перестал быть диковинкой и превратился в повседневный инструмент, который оценивают по практической пользе, цене и удобству. Потеряв "половину империи", ChatGPT уступил место более зрелому и конкурентному рынку, где побеждает тот, кто лучше всего решает реальные задачи пользователей.

marsbit8 мин. назад

ChatGPT потерял половину своей империи: за три с половиной года, от монополии к разделу рынка

marsbit8 мин. назад

Прогнозные рынки становятся медвежьими: трейдеры Kalshi оценивают вероятность падения биткойна до $50 000 в 69%

Платформа прогнозных рынков Kalshi указывает на усиление медвежьих настроений среди трейдеров: в настоящее время контракты оценивают вероятность падения биткойна до $50 000 до достижения $100 000 в 69%. Эти данные отражают коллективные ожидания участников платформы на конкретный момент, а не гарантированный прогноз. Такой сценарий предполагает возможное дальнейшее снижение на фоне ужесточения макроэкономических условий или ослабления спроса на биткойн-ETF. Сигнал контрастов с оптимистичными заявлениями некоторых инвесторов о приближении дна рынка. Важно отметить, что коэффициенты на прогнозных рынках могут быстро меняться в зависимости от текущей цены и позиций трейдеров, поэтому их следует рассматривать скорее как снимок настроений, чем как самостоятельную торговую систему. Разрыв между бычьими и медвежьими нарративами подчеркивает неопределенность текущего момента, а следующими ключевыми факторами для курса BTC останутся потоки ETF, макрополитика и преодоление важных технических уровней.

bitcoinist35 мин. назад

Прогнозные рынки становятся медвежьими: трейдеры Kalshi оценивают вероятность падения биткойна до $50 000 в 69%

bitcoinist35 мин. назад

Чемпионат мира начинается: подсчитываем "громкие" прибыли и разорительные убытки на рынках предсказаний

Чемпионат мира по футболу стартовал, что привело к экспоненциальному росту объема торгов на прогнозных рынках. По отчету Bernstein, ожидается, что событие привлечет до $10 млрд объема потребительских ставок и более $3 млрд дополнительных средств. На платформе Polymarket появились как крупные победители, так и проигравшие. Например, пользователь @mintblade за один день получил прибыль в $9,24 млн, правильно угадав исход четырех матчей, включая неожиданный результат в матче Ирана и Новой Зеландии. Новый кошелек @Fishalive заработал $9,06 млн, спрогнозировав ничью Испании с Кабо-Верде при коэффициенте выше 1000%. Пользователь @LEEEROYJENKINS заработал $5,2 млн на двух сделках, а @endlessFate поднялся на третье место в еженедельном рейтинге с прибылью $7,85 млн. Однако есть и значительные убытки. Пользователь @betoor619 потерял почти $1 млн, поставив на победу Испании, которая сыграла вничью. Другой крупный игрок, @weatherman12, проиграл более $1,8 млн, поставив против победы Аргентины, которая выиграла у Алжира со счетом 3:0. Статья напоминает, что прогнозы на спортивные события сопряжены с высоким риском неожиданных результатов.

Odaily星球日报47 мин. назад

Чемпионат мира начинается: подсчитываем "громкие" прибыли и разорительные убытки на рынках предсказаний

Odaily星球日报47 мин. назад

a16z: Эра криптоиндустрии, когда требуются доказательства

Криптоиндустрия вступает в эпоху «покажи мне доказательства». Раньше для привлечения внимания хватало белой книги, токена и грандиозного видения. Но на фоне усиления регулирования, скандалов и информационного шума терпение аудитории к «историям» иссякает. Теперь рынок спрашивает не о планах, а о реальных результатах: что уже создано, кто пользуется, каковы реальные данные, реализованы ли партнерства. Приход традиционных финансовых институтов, таких как BlackRock, Fidelity и JPMorgan, которые выпускают реальные продукты, а не просто концепции, поднял планку «серьезности» для всего сектора. Криптопроекты вынуждены перестраивать коммуникацию: видение остается важным, но его уже недостаточно. Убедительными становятся конкретные доказательства — реальные объемы транзакций в основной сети, активные пользователи, доходы, партнерские интеграции с публичным подтверждением, аудиторские отчеты. Это создает как давление, так и возможности. Более высокий порог входа отсеивает шумные проекты, построенные на обещаниях, но позволяет выделиться тем, у кого есть работающий продукт, данные и пользователи. Успех теперь определяется не масштабом рассказанной истории, а способностью представить убедительные доказательства, которые эту историю подтверждают. Коммуникация должна строиться от фактов и конкретики («мы сократили время кросс-бордерных расчетов с трех дней до четырех минут, и три компании уже это используют») к более широкому видению, а не наоборот. Эпоха обещаний сменилась эпохой доказательств.

marsbit1 ч. назад

a16z: Эра криптоиндустрии, когда требуются доказательства

marsbit1 ч. назад

Торговля

Спот
Фьючерсы
活动图片