Автор: Сюй Чао
Противоречие между спросом и предложением на инфраструктуру искусственного интеллекта обостряется между ведущими мировыми технологическими компаниями. По словам информированных источников, примерно в марте этого года Google сообщил Meta, что не может удовлетворить все ее потребности в вычислительных мощностях для Gemini, и ввел лимиты использования для этой гигантской социальной сети — даже крупнейшему в мире поставщику услуг ИИ трудно справиться с обрушившимся спросом на вычислительные ресурсы.
Как сообщает Financial Times, эти ограничения до сих пор не сняты, что привело к сбоям и задержкам в нескольких внутренних проектах ИИ Meta. Под влиянием этого Meta потребовала от сотрудников повысить эффективность использования вычислительных мощностей для ИИ и начала внедрять более бережное использование AI token внутри компании. Google и Meta отказались от комментариев по этому поводу.
Эта ситуация вынудила Google ускорить расширение мощностей. Ранее в этом месяце Google подписал с компанией SpaceX Илона Маска соглашение об аренде вычислительных мощностей на сумму 920 миллионов долларов в месяц. Генеральный директор Google Сандар Пичаи признал на конференции по итогам первого квартала: «В последнее время мы действительно сталкиваемся с ограничениями по вычислительным мощностям, если бы мы могли удовлетворить спрос, доходы от облачного бизнеса были бы выше».
Meta не является исключением. По словам нескольких информированных источников, другие корпоративные клиенты Google также сталкиваются с ограничениями различной степени, причем Meta, из-за исключительно масштабного спроса, пострадала больше всего. Этот инцидент отражает взрывной рост нагрузки на ИИ-инференцию (вывод), который стал одним из самых больших вызовов для всей отрасли.
Дефицит вычислительных мощностей сохраняет давление, крупные клиенты страдают в первую очередь
Несмотря на то, что крупные технологические компании уже вложили сотни миллиардов долларов в чипы, центры обработки данных и энергоснабжение, предложение вычислительных мощностей для ИИ по-прежнему не поспевает за темпами роста спроса.
Выручка облачного бизнеса Google в первом квартале впервые превысила 20 миллиардов долларов, объем подписанных, но еще не выполненных облачных контрактов почти удвоился по сравнению с предыдущим кварталом и превысил 460 миллиардов долларов. Пичаи ясно дал понять, что ограничения по вычислительным мощностям сохранятся в ближайшей перспективе.
На этом фоне удар, полученный Meta, особенно заметен. По словам информированных источников, именно высокий спрос со стороны крупных корпоративных клиентов, таких как Meta, напрямую подтолкнул Google к ускоренному поиску внешних источников вычислительных мощностей. По мере того как компании массово внедряют чат-ботов, программируемых помощников и ИИ-агентов, нагрузка на инференцию — то есть вычислительные мощности, потребляемые для выполнения задач обученной моделью в реальных приложениях — становится ключевым узким местом отрасли.
Внутренние проекты Meta сталкиваются с препятствиями, ускоряется переход на собственные модели
Meta широко использует Gemini внутри компании, включая модерацию безопасности платформы (в том числе выявление мошеннического контента, удаление вредоносной информации), чат-ботов для поддержки клиентов и рекламы, а также для части внутренних рабочих процессов и разработки кода, параллельно используя другие модели, такие как Claude от Anthropic.
По словам информированных источников, Meta изначально выбрала Gemini, потому что она превосходила собственную открытую модель компании Llama. Однако по мере ужесточения ограничений на вычислительные мощности Meta ускоряет миграцию на собственные модели. Несколько источников сообщают, что Meta недавно начала приоритизировать продвижение своей новой модели Muse Spark, которая, как считается, по производительности уже может конкурировать с Gemini и поможет снизить зависимость от внешних моделей.
Генеральный директор Meta Марк Цукерберг ранее продолжал увеличивать инвестиции в таланты и инфраструктуру ИИ, стремясь создать то, что он называет «личным сверхразумом». В отличие от Google, у Meta нет облачного бизнеса, компания ускоряет строительство собственной системы центров обработки данных и пообещала инвестировать в общей сложности 6000 миллиардов долларов в США к 2028 году.
Google расширяет мощности через SpaceX, отрасль ищет выход
Сталкиваясь с давлением на вычислительные мощности, Google в этом месяце подписал соглашение об аренде мощностей с SpaceX на сумму 920 миллионов долларов в месяц, чтобы восполнить дефицит инфраструктуры. Лаборатория ИИ Anthropic также достигла аналогичного соглашения со SpaceX в прошлом месяце.
То, что Google принял ограничительные меры в отношении Meta, предоставило редкую возможность заглянуть извне в реальное давление, с которым сталкивается ведущий мировой поставщик услуг ИИ при распределении вычислительных мощностей. В настоящее время узкое место в инфраструктуре всей индустрии ИИ распространяется от этапа обучения (тренировки) к этапу инференции (вывода), и разрешение противоречий между спросом и предложением по-прежнему зависит от реализации нового раунда крупномасштабных капиталовложений.





