"Меня не слишком волнует, каков общий объем токенов, и не слишком волнует общий объем доходов". На конференции Huawei Cloud INSPIRE для создателей 5 июня, председатель совета директоров Huawei и CEO Huawei Cloud Чжоу Юэфэн впервые с момента вступления в должность дал интервью журналистам, четко и ясно обозначив текущие стратегические приоритеты Huawei Cloud.
Это редкое заявление для текущего китайского рынка AI-облаков.
За последние полгода облачные провайдеры, такие как Alibaba Cloud и Volcano Engine, постоянно подчеркивали повестку AI-облака, используя дневной объем вызовов токенов и масштаб доходов от MaaS в качестве новых точек роста. Даже крупные модельные компании, такие как Moon Dark Side, DeepSeek, Zhipu и другие, снижали и снижали цены на инференс. Ключевыми словами для всей отрасли стали объем вызовов моделей и масштаб.
Huawei Cloud выбрал другой способ входа на эту переполненную арену. Huawei Cloud выпустил самую плотную с прошлого года серию новинок, ориентированных на ИИ: AI-вычислительный кластер Lingqu AICS, AMS Agentic (хранилище памяти), движок унифицированного планирования CCE Volcano Next, базовую платформу автономной безопасности AgentSphere, а также ModelArts Next, корпоративную платформу агентов AgentArts (открытая версия openJiuwen), и представил новую парадигму "Agentic Infra".
Чжоу Юэфэн определил для Huawei Cloud KPI не как количество токенов, а как "действительно ли каждый токен повышает производительность". В период, когда поставки локализованных вычислений ограничены, а бизнес-модели все еще переосмысливаются, Huawei Cloud выводит себя из "борьбы за второе место в AI-облаке".
Не соревноваться в масштабе токенов
Чжоу Юэфэн на встрече редко ответил прямо на вопрос о различиях с Alibaba Cloud и Volcano Engine. Он сказал, что Huawei Cloud отличается от других облачных компаний по трем причинам.
Во-первых, отличается путь вычислительных мощностей. Huawei Cloud использует полностью локализованное аппаратное и программное обеспечение: Ascend, Kunpeng, CANN, Euler и т.д. Этот путь более тернист, потому что у Huawei нет возможности использовать чужие вычислительные мощности — он может только превратить локализацию в отраслевое решение.
Следовательно, Huawei Cloud должен создать вторую вычислительную плоскость, предоставляя альтернативный экологический выбор помимо доминирующего в мире пути вычислений, состоящего из NVIDIA + основные публичные облака. Huawei Cloud не может и не собирается использовать "интернациональное" железо, чтобы сравнивать масштаб вычислений с конкурентами. Чжоу Юэфэн сказал: "Я не хочу сравнивать доходы, масштабы, кто второй или третий с другими облачными компаниями, в этом нет смысла".
Во-вторых, отличается коммерческий фокус. Облачные провайдеры интернет-сектора естественным образом зависят от C2C-трафика и экосистемы разработчиков, тогда как Huawei Cloud делает основную ставку на государственные предприятия и отрасли, важные для народного хозяйства. Например, гибридное облако Huawei уже много лет занимает первое место по доле рынка среди государственных органов, финансовых учреждений и центральных государственных предприятий, обслуживая более 5500 клиентов по всему миру.
Чжоу Юэфэн отметил, что скорость итерации моделей и вычислительных мощностей слишком высока, и вполне возможно, что после развертывания они уже устареют. Поэтому он рекомендует государственным и корпоративным клиентам не строить собственные кластеры на десятки тысяч карт, а использовать локальные данные + удаленные публичные облачные AI-вычисления / модельные сервисы в сочетании с технологиями конфиденциального инференса, конфиденциального обучения и конфиденциальных вычислений, чтобы достичь баланса между суверенитетом данных и совместным использованием вычислительных мощностей. По сути, это передача выгод от итераций публичного облака тем клиентам, которые не могут полностью перейти на публичное облако.
В-третьих, отличается подход к экосистеме. Huawei Cloud продвигает открытый исходный код весьма последовательно: Ascend CANN, операционная система Euler, планировщик CCE Volcano, инструментарий ModelArts — все с открытым исходным кодом; ядро открытой версии openJiuwen платформы агентов AgentArts более чем на 90% совпадает с коммерческой версией.
На конференции также была запущена инициатива "Сотни моделей, тысячи форм, облако объединяет для победы" совместно с более чем 20 ведущими модельными компаниями, включая Zhipu, DeepSeek, MiniMax, Kimi, Jieyue Xingchen, Baidu, Meituan LongCat, iFlytek Spark и другие.
Когда возможности и поставки локализованных вычислений все еще ограничены, чем больше расширять экосистему и чем больше моделей предлагать, тем устойчивее будет вторая вычислительная плоскость.
Agentic Infra: перемещение поля битвы с продажи токенов на продажу производительности
Если путь вычислительных мощностей определяет, "против чего" не выступает Huawei Cloud, то Agentic Infra определяет, "за что" он хочет бороться.
Чжоу Юэфэн высказал суждение об эволюции индустрии ИИ: четыре года назад ИИ заключался в покупке вычислительных карт, три года назад — в обучении больших моделей, в этом году — в использовании агентов. Вычислительные мощности и модели отходят на задний план, агенты выходят на передний.
Фокус конкуренции в AI-облаке смещается с пропускной способности токенов на то, смогут ли агенты реально работать на предприятиях.
Матрица продуктов Huawei Cloud также перестроена в соответствии с этим суждением. "Четыре компонента" Agentic Infra — эффективная фабрика токенов, непрерывное обучение, унифицированное планирование, безопасность и автономия — каждый соответствует инженерным проблемам, с которыми неизбежно сталкивается предприятие при развертывании агентов.
AICS Lingqu снижает задержку токенов в кластере на 100 000 карт до менее 10 мс; AMS использует прямой доступ NPU к CMS для создания петабайтного пространства памяти, решая проблему долговременной памяти агентов для длительных задач; CCE Volcano Next повышает утилизацию ресурсов более чем на 30% за счет общего пула для обучения и инференса; AgentSphere использует облегченные песочницы для запуска за 100 мс и создания сотен тысяч экземпляров в минуту.
ModelArts Next переосмысливает подход к MaaS: его маршрутизатор моделей поддерживает три стратегии — приоритет стоимости, приоритет эффективности и сбалансированную, уже интегрировал более 15 моделей SOTA, точность планирования превышает 95%, а стоимость вызовов снижается в среднем на 20%.
Но настоящей дифференцированной ставкой Huawei Cloud являются отраслевые зоны. На этой конференции Huawei Cloud единовременно запустил четыре "фабрики мечты отраслевого ИИ": умное здравоохранение, воплощенный интеллект, интеллектуальное производство и научные вычисления.
В зоне умного здравоохранения, совместно с Шанхайской больницей Жуйцзинь, создана большая модель RuiPath; более 20 больниц уровня 3А, городских и уездных больниц, таких как Ханьдань, Жуйань, Цяньсинань, Уань, централизованно разместились в ней. Это означает, что такие способности, как патологическая диагностика, высоко зависимые от экспертного опыта, впервые выводятся в виде "облачного сервиса" для масштабного использования уездными больницами.
В зоне воплощенного интеллекта представлена первая в мире сквозная платформа разработки воплощенного интеллекта CloudRobo, целью которой является удовлетворение потребностей в полном наборе инструментов для более чем 300 китайских стартапов в области воплощенного интеллекта.
Чжоу Юэфэн заявил, что здравоохранение и финансы — это отрасли с самой зрелой цифровизацией и самыми богатыми данными в Китае. "Если ИИ не сможет развиться в этих отраслях, в других будет еще сложнее". А в этих областях мерило ценности ИИ должно быть не DAU и количество токенов, а доля предотвращенных финансовых рисков, повышение эффективности кредитования, вероятность получения точного диагноза пациентами в отдаленных районах.
Соединив эти нити, стратегический контур Huawei Cloud становится ясным: использовать полностью локализованные вычисления + экосистему с открытым исходным кодом в качестве основы, покрывать государственные и корпоративные сектора с помощью гибридного облака + конфиденциальных вычислений, перемещать конкуренцию с "продажи токенов" на "продажу производительности" с помощью Agentic Infra + отраслевых зон.
Этот путь гораздо медленнее, чем погоня за доходами от MaaS, и по нему сложнее демонстрировать красивые данные в годовом исчислении, но он позволяет обойти самую ожесточенную ценовую красную акваторию текущего AI-облака и делает ставку на еще не оцененный рынок: кто займет позицию базовой инфраструктуры, когда агенты действительно войдут в индустрию.
На треке AI-облака Huawei Cloud может использовать только другое решение. Чжоу Юэфэн подвел итог: "У меня нет возможности построить кремниевую черноземную почву из интернациональных компонентов". Пока другие облачные провайдеры сравнивают, у кого выше соотношение цена/качество токенов, Huawei Cloud стремится к тому, сможет ли эта система локализованных вычислений удовлетворить реальные потребности китайской индустриальной сферы в будущем. (Автор статьи | Чжан Шуай, редактор | Ян Линь)








