В последние годы, на фоне стремительного развития ИИ, китайские интернет-гиганты активно развертывают большие модели ИИ. Особенно в последнее время популярность Lobster (вероятно, отсылка к OpenClaw/OpenAI) принесла огромные прибыли их ИИ-системам. Однако, как и ожидалось, волна подорожания ИИ наступила. На фоне коллективного повышения цен зарубежными гигантами, такими как Amazon и Google, а также китайскими гигантами BAT, китайские компании, разрабатывающие большие модели, такие как Zhipu, также последовали их примеру. Это заставляет задуматься: пришла ли волна подорожания, и станут ли сотрудники-лобстеры недоступными по цене?
I. Гиганты коллективно поднимают цены
Согласно сообщению Haibao News, недавно акции, связанные с концепцией оптических модулей и аппаратного обеспечения для вычислений, значительно выросли на фоне общего падения рынка. За этим стоит то, что в этом году бум OpenClaw (в Китае часто называют «Лобстер»), распространившийся из-за рубежа в Китай, вызвал взрывной рост объема вызовов Token, что напрямую стимулировало спрос на вычислительные мощности, а монетизация цепочки поставок Token стала новой ключевой темой для внимания.
AliCloud и Baidu Intelligent Cloud официально объявили о повышении цен на продукты, связанные с ИИ-вычислениями. В公告 на официальном сайте AliCloud говорится, что из-за взрывного мирового спроса на ИИ и роста цен в цепочке поставок, цены на продукты для ИИ-вычислений и хранения данных в AliCloud выросли на максимум до 34%. По данным осведомленных источников, платформа MaaS (Model-as-a-Service) AliCloud, Bailian, показала исторически максимальные темпы роста с января по март этого года.
Baidu Intelligent Cloud заявила, что под влиянием быстрого развития глобальных приложений искусственного интеллекта, спрос на вычислительные мощности продолжает расти, а стоимость核心ного аппаратного обеспечения и связанной инфраструктуры значительно выросла, поэтому было принято решение повысить цены на услуги, связанные с ИИ-вычислениями, на 5% до 30%, а на параллельное файловое хранилище и подобное — примерно на 30%.
В начале года Amazon AWS и Google Cloud相继 объявили о повышении цен на некоторые услуги. 22 января AWS announced о повышении цен на 15% для EC2, используемого для обучения больших моделей. 27 января Google Cloud significantly скорректировал цены на услуги передачи данных, такие как CDN Interconnect, Direct Peering, Carrier Peering, с ростом на 100% в Северной Америке.
На внутреннем рынке Китая 11 марта Tencent Cloud объявил о подорожании услуг больших моделей, скорректировав стратегию тарификации для некоторых моделей. Например, для модели Tencent HY2.0 Instruct цена ввода大幅上调 с первоначальных 0.0008 юаня / тысячу токенов до 0.004505 юаня / тысячу токенов, что представляет собой рост на 463,13%.
И волна подорожания не закончилась. 8 апреля Zhipu AI announced свой третий с начала года план повышения цен, представив новую флагманскую модель GLM-5.1 и одновременно подняв цены на 10%, всего через месяц после последнего повышения цен как минимум на 30%. В отличие от снижения цен и бесплатных试用 в 2025 году, явным сигналом сейчас является то, что отечественные большие модели ИИ вступают в эпоху коллективного подорожания.
II. Пришла ли волна подорожания ИИ, и станут ли сотрудники-лобстеры недоступными?
Недавно крупные гиганты больших моделей коллективно объявили о повышении цен на некоторые из своих облачных услуг и связанных продуктов, что вселило надежду в тех, кто ранее беспокоился о своем «дистиллировании» (вероятно, замене ИИ). По сравнению с дорогими токенами, мы, кажется, дешевле. Так какая же отраслевая логика скрывается за этой волной подорожания?
Во-первых, взрывная популярность ИИ-агентов вызвала резкий скачок спроса на вычислительные мощности. С точки зрения структурных изменений на стороне спроса, взрывная популярность нового поколения ИИ-агентов, представленного OpenClaw, полностью изменила底层ную логику потребления вычислительных мощностей. На начальном этапе применения больших моделей пользовательское поведение в основном ограничивалось однораундовыми диалогами или простым генерацией текста, при таком режиме взаимодействия потребление токенов было относительно ограниченным и предсказуемым. Однако с成熟тием технологий автономных интеллектуальных агентов, ИИ перестал быть пассивной машиной для вопросов и ответов, а стал цифровым сотрудником, способным самостоятельно планировать, использовать инструменты и выполнять сложные задачи.
Суточное потребление токенов на одного зрелого интеллектуального агента часто в десятки или даже сотни раз превышает потребление традиционного пользователя чата. Такой экспоненциальный рост спроса — это не линейный бизнес, а скачок в измерении. Когда огромное количество интеллектуальных агентов работают одновременно, осуществляя高频ные логические рассуждения и взаимодействие с данными, вычислительная инфраструктура, изначально разработанная для человеческого взаимодействия, мгновенно сталкивается с огромным压力 пропускной способности.
Такой взрывной рост спроса напрямую нарушил прежний баланс спроса и предложения, превратив вычислительные ресурсы из «относительно достаточных» в «чрезвычайно дефицитные». Когда предельная полезность резко возрастает, а эластичность предложения недостаточна, рост цен является не только неизбежным проявлением рыночных законов, но и необходимым средством отбора высокоценных сценариев применения и сдерживания неэффективных потерь вычислительных мощностей.
Во-вторых, дефицит核心ного аппаратного обеспечения приводит к нехватке вычислительных мощностей. С точки зрения硬ких ограничений на стороне предложения, дефицит核心ных аппаратных компонентов, таких как высокопроизводительные вычислительные чипы и высокоскоростная память HBM, составляет物理ческую основу этой волны подорожания. Хотя китайские облачные провайдеры в последние годы активно инвестировали в создание отечественной экосистемы вычислений, узкие места в производственных мощностях в области高端ных чипов для обучения и вывода сохраняются в глобальном масштабе. Особенно память HBM, «кровь» больших моделей, имеет высокие технологические барьеры и длительный цикл расширения производства, becoming ключевым短板, сдерживающим释放 вычислительных мощностей.
В настоящее время вычислительные мощности — это уже не просто набор серверов, а精密ная система, состоящая из чипов передового техпроцесса, высокоскоростных сетей互联и высокоскоростной памяти. Дефицит核心ного аппаратного обеспечения приводит к значительному росту предельных затрат на предложение вычислительных мощностей, и облачные провайдеры больше не могут稀释ить затраты за счет простого эффекта масштаба. Этижесткие ограничения на стороне предложения вынуждают отрасль пересмотреть механизм ценообразования на вычислительные мощности. Когда «вычислительная мощность — это сила» становится консенсусом, провайдеры, обладающие стабильными и высокопроизводительными вычислительными мощностями, естественно, получают более сильные переговорные позиции. Повышение цен в этой ситуации фактически является справедливой переоценкой стоимости稀缺ных аппаратных ресурсов и неизбежным результатом передачи压力 затрат от上游 к下游 в цепочке поставок.
В последнее время многие мои друзья из технологических компаний, особенно CTO,普遍 жалуются, что цены на чипы памяти и серверы сейчас действительно недоступны, и борьба за вычислительные мощности мгновенно превращается в борьбу за затраты, и это才是最值得关注的地方.
В-третьих, отраслевая логика ценообразования «объем в обмен на цену» претерпела фундаментальные изменения. Оглядываясь на десятилетнюю историю развития облачной индустрии, мы легко обнаруживаем порочный круг: разрушительная ценовая война. В борьбе за долю рынка крупные производители пускали в ход «ценовые топоры», что не только сжимало жизненное пространство конкурентов, но и极大地 сжимало собственные profit margins. В некоторые периоды цены на облачные услуги甚至 были ниже их operational costs, наблюдался типичный феномен «внутреннего卷» (involution). Такая модель «объем в обмен на цену» могла быть эффективна в эпоху мобильного интернета, потому что тогда предельные затраты стремились к нулю, и пути монетизации трафика были清晰ны.
Однако наступление эпохи ИИ полностью打破эту логику. Теперь вычислительные мощности — это уже не дешевый универсальный товар, а дорогое специализированное средство производства. Если продолжать придерживаться стратегии низких цен, облачные провайдеры не смогут покрыть高昂ные затраты на закупку GPU и электроэнергию, не говоря уже о持续ных巨额ных инвестициях в НИОКР для итерации моделей. Здоровое развитие отрасли должно основываться на разумной прибыли. Только когда цена вернется к стоимости, предприятия будут иметь возможности для воспроизводства и инноваций.
Коллективное повышение цен технологическими гигантами фактически является一种 «коллективным возвращением к рациональности» в отрасли. Это знаменует собой то, что китайский рынок облачных вычислений прощается с «деньговым» эпохой «subsidies» и вступает в эпоху ценностной конкуренции, где核心ными являются техническая мощь и качество обслуживания. Это чрезвычайно благоприятно для построения здоровой экосистемы всей отрасли, оно смещает фокус конкуренции с «кто дешевле» на «кто стабильнее, кто умнее, кто лучше решает проблемы», что, несомненно, является положительным сигналом модернизации отрасли.
В-четвертых,兴起 экономика токенов, многоуровневое ценообразование станет нормой. Раньше центры обработки данных рассматривались как «склады» для хранения данных, их ценность в основном заключалась в аренде空间 и хранении данных. В эпоху ИИ центры обработки данных превратились в «фабрики», производящие интеллект, их核心ным продуктом являются высокоценные токены. Это изменение роли直接 породило новую логику ценообразования. В будущем услуги ИИ больше не будут использовать традиционные модели оплаты по包年包月 или по объему, а будут использовать многоуровневое ценообразование на основе таких параметров, как吞吐量 токенов, скорость отклика, сложность вывода и т.д.
Такая精确ная стратегия ценообразования позволяет более точно соответствовать потребностям в вычислительных мощностях в различных сценариях, заставляя задачи с высокими требованиями к реальному времени и высокой сложностью платить более высокую溢价, а задачи пакетной обработки в автономном режиме享受ть более низкую стоимость. Это не только инновация бизнес-модели, но и极大ое повышение эффективности распределения ресурсов. С помощью ценового рычага отрасль будет направлять вычислительные ресурсы в те области, которые создают наибольшую社会ную ценность, избегая错配 и потерь ресурсов.
Именно в такой ситуации многие компании甚至 напрямую используют объем предоставляемых токенов в качестве全新的ного福利 для сотрудников. Конечно, мы一直 обсуждаем, являются ли токены средством производства или компенсацией и福利 сотрудников, но несомненно, что в нынешнюю эпоху токены стали важным узким местом для вычислительных мощностей, сдерживающим развитие ИИ-компаний. Более того, мой друг пожаловался мне, что ранее в этом году технологический гигант, в котором он работает, требовал от всех сотрудников использовать Lobster, свои цифровые двойники, но в результате огромного потребления недавно было введено ограничение потока.
В конечном счете, перед лицом日益 дорогих вычислительных ресурсов, каково будущее ИИ Lobster? Сможем ли мы still позволить себе его использовать?
Статья из WeChat Official Account «Jianghan Vision Observation», автор: Jianghan Vision Observation













