Google начинает продавать TPU: крупные компании стремятся производить «дешёвые токены» с помощью AI-чипов

marsbitОпубликовано 2026-06-24Обновлено 2026-06-24

Введение

Google начала продавать свои собственные чипы TPU, предназначенные для обработки вычислений искусственного интеллекта. Раньше эти чипы были доступны только через облачные сервисы компании, но теперь их можно приобрести напрямую для собственных центров обработки данных. TPU оптимизированы для матричных операций, лежащих в основе современных больших языковых моделей, что позволяет повысить эффективность и снизить стоимость вычислений. Этот шаг Google представляет собой вызов доминированию Nvidia на рынке AI-чипов. Хотя Nvidia обладает сильной экосистемой (CUDA), Google предлагает готовые комплексные решения, ориентированные на эффективность и снижение стоимости обработки, особенно на этапе инференса (вывода моделей). Автор статьи сравнивает это с переходом от «премиального топлива» к более доступному, что критически важно для массового внедрения ИИ, где стоимость «токенов» становится ключевым фактором. Тенденция показывает, что вычисления ИИ становятся базовым ресурсом, подобным электричеству. В этой новой реальности побеждает не обязательно тот, у кого самые мощные чипы, а тот, кто может предложить наиболее оптимальную по цене и эффективности систему. Аналогичную стратегию развивают и крупные облачные провайдеры, такие как Huawei Cloud и Alibaba Cloud, создавая собственные полные экосистемы на базе своих чипов. Конкуренция на рынке ИИ-инфраструктуры смещается от «битвы чипов» к «битве систем».

Недавно Google объявил о начале прямых продаж сторонним центрам обработки данных и клиентам своих собственных чипов TPU, а также сопутствующего оборудования для AI-вычислений. Будучи «секретным оружием» Google в области AI, TPU раньше можно было арендовать только через облачные центры данных, и в индустрии долгое время считалось, что Google не будет продавать эти чипы, пока в июне этого года не пришла эта хорошая новость.

Тогда возникает вопрос: что такое «TPU»? Полное название — «Tensor Processing Unit (тензорный процессор)». В отличие от CPU и GPU, он представляет собой чип, специально разработанный для «матричных и тензорных математических операций» в AI-вычислениях, способный с чрезвычайно высокой эффективностью обрабатывать соответствующие вычисления.

Звучит как вспомогательный чип? Однако это не так, потому что современные технологии больших AI-моделей по своей сути представляют собой сложные математические операции над огромными объёмами данных (в основном, матричное умножение). Поэтому Google сделал следующее: объединил тысячи TPU в суперкомпьютерные кластеры, а затем, используя CPU-хосты для распределения задач (разделения задач, преобразования данных), создал центры AI-вычислений с чрезвычайно высокой эффективностью.

Источник: Google

Именно поэтому Gemini может с более низкой стоимостью подписки и более высокими лимитами использования агрессивно отвоёвывать пользовательскую базу у таких компаний, как OpenAI. Даже если рассматривать только цену токена, Gemini является одним из представителей зарубежных AI-продуктов с относительно низкой ценой на флагманские модели, при этом цена на основные модели близка к ценам китайских производителей, таких как DeepSeek.

Более того, TPU также лучше справляются с обработкой огромного количества вычислительных запросов от обычных пользователей, что можно считать «профильным» для будущей AI-экосистемы, поэтому сторонние компании давно присматривались к этим чипам. После анонса планов продаж Google также объявил о соглашении на 50 миллиардов долларов о совместном строительстве крупного центра обработки данных с известной частной инвестиционной компанией Blackstone, предварительная мощность которого составит 500 мегаватт.

LeiTech (ID: leitech) предполагает, что после этого сообщения к Google наверняка обратится множество компаний с запросами о ценах или сотрудничестве, особенно тех, кто хочет построить собственные центры обработки данных. В этот момент кто-то может подумать, что Amazon должно волноваться, ведь это явный перехват бизнеса облачных услуг. На самом деле, нет, сейчас больше всего головной боли, вероятно, достанется Nvidia.

Google нанёс Nvidia удар «под дых»?

Сначала LeiTech хочет задать вопрос: почему Nvidia стала одной из самых важных компаний в эпоху AI? Если ваш ответ — просто «GPU обладает высокой вычислительной мощностью», то вы правы лишь наполовину.

Настоящая сила Nvidia заключается в том, что она уже давно не просто продаёт GPU. CUDA, NVLink, DGX, сеть InfiniBand, библиотеки AI-программного обеспечения, экосистема разработчиков, партнёры по серверам, адаптация для облачных провайдеров — всё это вместе составляет «защитный ров» Nvidia.

Поэтому, когда вы покупаете вычислительную карту Nvidia и запускаете её, вы покупаете не просто карту, а целую, уже проверенную индустрией AI-экосистему. Для большинства компаний экосистема CUDA от Nvidia позволяет им не «изобретать велосипед», экономя много усилий и средств.

Вот почему многие AI-компании, зная, что GPU от Nvidia очень дорогие, всё равно вынуждены их использовать. Потому что в период взрывного роста AI «стоимость» можно игнорировать, единственным критерием является возможность опередить конкурента или быстрее догнать его. Но по мере того, как большие модели AI входят в фазу распространения, всем нужно уже не только «скорость»; перед лицом огромной пользовательской базы эффективность и соотношение цены и качества становятся новыми приоритетами.

Google, очевидно, также увидел это, поэтому они сделали ставку на TPU и упаковали его в комплексное решение. Чипы в этом решении предназначены не для того, чтобы превзойти Nvidia по производительности вычислений, а для того, чтобы упаковать многолетний опыт Google в области чипов, центров обработки данных, сетей, хранения, планирования и обучения моделей в облачные услуги, которые предприятия могут напрямую приобретать.

Это и есть то, что Google действительно «перенял» у Nvidia — он учится не продавать чипы, а продавать системы и экосистемы, превращая ряд аппаратных средств в «производительные силы», которые клиенты могут использовать. Это имеет немалую привлекательность для тех предприятий, которые хотят держать центр обработки данных в своих руках.

Тогда, Nvidia должно запаниковать? Не обязательно, но головная боль точно будет, ведь хотя флагманские вычислительные карты приносят прибыль, компании не могут вечно находиться в состоянии «покупать столько, сколько есть», а постепенно будут обращать внимание на другие, более экономичные чипы. В этот момент решение Google с TPU неизбежно окажет давление на эту часть рынка Nvidia.

Однако для всей AI-индустрии Nvidia по-прежнему остаётся наиболее признанным универсальным стандартом на рынке AI-вычислений, и положение экосистемы CUDA не так легко поколебать одним-двумя поколениями чипов. Особенно на этапе обучения больших моделей многие команды уже накопили огромный опыт работы с системой Nvidia, и резкий переход на другую платформу сопряжён с немалым риском.

Например, DeepSeek недавно анонсировал, что его новая модель может быть обучена на чипах Huawei Ascend, и это стало возможным только после глубокого сотрудничества Huawei и DeepSeek и нескольких итераций версий.

Источник: Ascend

Но с точки зрения Google, на самом деле не нужно заменять Nvidia во всех сценариях, достаточно привлечь часть корпоративных клиентов и доказать, что их эффективность выше, чем у других вычислительных экосистем, и тогда они уже смогут отрезать себе кусок пирога на рынке AI-инфраструктуры.

Особенно на этапе логического вывода (inference) серверы с TPU от Google явно имеют преимущество. Все знают, что токены, когда их начинают реально использовать, расходуются не медленнее, чем открытый шлюз для воды. Сначала Uber сжёг годовой бюджет за четыре месяца, таинственная компания потратила 500 миллионов долларов на токены за месяц, затем даже щедрая Microsoft ограничила права сотрудников, приказав им использовать свои собственные вычислительные мощности.

Можно сказать, что по мере того, как AI всё чаще используется в различных областях, наверняка будет появляться больше примеров, доказывающих, что стоимость токенов является ключевым фактором будущей конкуренции в AI. Потому что у кого стоимость токенов ниже, тот сможет внедрить AI в большее количество бизнес-направлений, чтобы захватывать пользователей и рынки.

Вычислительные мощности становятся базовым ресурсом, у облачных провайдеров появляются возможности

LeiTech считает, что аналогия одного пользователя в сети очень удачна: обучение модели похоже на покупку автомобиля, а услуги логического вывода — на ежедневно сжигаемый бензин. Даже богатые семьи не могут постоянно заправлять все машины 98-м бензином; вычислительные мощности, предоставляемые Google, похожи на 92-й: хотя мощности немного не хватает, машина всё равно едет, работа делается, и при этом дешевле.

Недавно LeiTech уже писал статью, в которой упоминалось, что сейчас в индустрии есть консенсус: AI-вычислительные мощности становятся всё больше похожи на базовые ресурсы, такие как электричество, вода, широкополосный интернет.

И для пользователей им не нужно знать, как производятся «вычислительные мощности», но они будут заботиться о цене на них, как о счетах за коммунальные услуги. Этот «пользователь» может быть как частным лицом, так и предприятием, городом или даже страной.

Поэтому на будущем AI-рынке Nvidia по-прежнему будет очень важна, потому что без высокопроизводительных чипов ни о чём не может быть и речи. Но когда потребность в вычислительных мощностях станет долгосрочным, стабильным и масштабируемым базовым ресурсом, право голоса, наоборот, постепенно перейдёт к провайдерам облачных услуг.

Вот почему облачные провайдеры, такие как Google, Microsoft, Amazon, Alibaba Cloud, Huawei Cloud, больше не удовлетворяются ролью просто «перепродавцов» GPU-вычислений от Nvidia, а все занимаются построением собственных вычислительных экосистем. Это, конечно, не означает, что они не будут продолжать закупать GPU Nvidia, потому что рынок нуждается, клиенты нуждаются, и это также может принести хороший доход.

Источник: LeiTech

Но в то же время их истинный фокус развития обязательно сместится на свои собственные экосистемы, и это то, чего Nvidia должна больше всего опасаться. Ведь нынешняя рыночная капитализация Nvidia во многом рассчитывается исходя из её положения как «базовой основы AI». Как только Nvidia потеряет контроль над рынком не топовых вычислительных карт, она может постепенно вернуться к положению пятилетней давности на рынке игровых видеокарт: хотя и лидер, но не незаменимая.

На самом деле, если мы вернём взгляд на Китай, подобные изменения уже появились. Раньше, когда мы говорили о китайских AI-вычислительных картах, фокус часто был на сравнении производительности вычислений, обсуждении, насколько производительность одной карты отстаёт от топовых вычислительных карт.

Этот вопрос, безусловно, важен, но если смотреть только на производительность самого чипа, упускается другой ключевой момент: китайские облачные провайдеры также превращают чипы, кластеры, облачные платформы, сервисы моделей и отраслевые решения в целостную AI-производственную систему, и это является самой основной конкурентоспособностью китайского AI.

Это говорит не LeiTech, а сами ключевые облачные провайдеры, такие как Huawei Cloud, Alibaba Cloud. Например, облачные услуги Huawei Ascend. Хотя чипы Ascend по-прежнему часто оказываются в центре внимания, сегодня Huawei уже предоставляет вокруг вычислений Ascend облачные инструментальные цепочки, суперузловые кластеры, миграцию моделей, оптимизацию обучения и логического вывода, а также возможности внедрения в отрасли.

Источник: Weibo

Более того, Huawei также продвигает эту вычислительную экосистему для большего числа китайских AI-компаний. Помимо упомянутого ранее DeepSeek, есть также ведущие производители больших AI-моделей, такие как Baidu, iFlytek, Zhipu, MiniMax. Можно сказать, что Huawei постепенно построила свою собственную вычислительную экосистему, и теперь ей остаётся привлечь больше партнёров на борт, а затем с более низкой ценой токенов завоёвывать рынок.

Alibaba Cloud делает то же самое. В мае этого года они выпустили AI-чип для обучения и вывода Zhenwu M890, а до этого Zhenwu 810E уже давно массово развёрнут на интеллектуальной вычислительной платформе Lingjun от Alibaba Cloud. На саммите Alibaba Cloud в этом году компания прямо объявила, что совокупный объём поставок AI-чипов серии Zhenwu от Pingtouge достиг 560 000 штук, а годовой доход перешагнул отметку в 10 миллиардов юаней.

Можно сказать, что в обучении у Nvidia китайские облачные провайдеры не только идут быстрее, но и начали раньше.

Самые мощные вычисления? Нет, миру нужны «оптимальные вычисления»

Конечно, Nvidia не потеряет своё ключевое положение в эпоху AI только из-за того, что Google начал продавать TPU.

По крайней мере, в течение длительного времени GPU, CUDA и экосистема разработчиков по-прежнему останутся стандартом, который нельзя обойти во всей AI-индустрии. Особенно в сценариях обучения больших моделей, высокопроизводительных вычислений и разработки универсального AI, Nvidia остаётся наиболее зрелым и признанным индустрией выбором на данный момент.

Но проблема в том, что рынок AI-вычислений вступает в следующую фазу.

Раньше все боролись за то, «чей чип мощнее», а теперь предприятия по-настоящему начинают заботиться о том, «кто может сделать вычисления дешевле». В этот момент преимущества облачных провайдеров, таких как Google, Huawei Cloud, Alibaba Cloud, начинают проявляться: у них есть огромное количество частных и корпоративных клиентов, данные, приложения и сценарии, и они также лучше умеют упаковывать различное аппаратное обеспечение в систему производительности, которую можно использовать напрямую.

Другими словами, в эпоху AI действительно дефицитны уже не только сами чипы, а системная способность превращать чипы в производительные силы.

Когда вычисления становятся всё больше похожи на базовые ресурсы, такие как вода, электричество, широкополосный интернет, победившая компания не обязательно будет тем производителем, у которого самая высокая производительность одной карты, а тем, кто сможет с более низкой стоимостью и более высокой эффективностью постоянно поставлять AI-вычисления клиентам.

Поэтому, с точки зрения LeiTech, начало продаж TPU от Google — это сигнал, напоминающий всей отрасли: конкуренция в AI-инфраструктуре — это уже не только битва чипов, но и битва систем.

Эта статья взята из официального аккаунта WeChat «LeiTech», автор: LeiTech

Связанные с этим вопросы

QЧто такое TPU и чем он отличается от CPU и GPU?

ATPU (Tensor Processing Unit, Тензорный процессор) — это специализированный процессор, разработанный Google для выполнения матричных и тензорных математических операций, которые лежат в основе вычислений для ИИ-моделей. В отличие от CPU (центральных процессоров) и GPU (графических процессоров), TPU оптимизирован для максимальной эффективности именно в задачах ИИ.

QПочему Google начал продавать свои TPU третьим сторонам?

AGoogle начал продавать TPU напрямую клиентам и центрам обработки данных, чтобы предоставить предприятиям возможность создавать собственные высокоэффективные и экономичные вычислительные мощности для ИИ. Это позволяет клиентам снижать стоимость генерации токенов (token) и повышать конкурентоспособность своих ИИ-сервисов.

QКак решение Google повлияет на позиции Nvidia на рынке ИИ-чипов?

AРешение Google представляет серьёзную конкуренцию для Nvidia, особенно на рынке более бюджетных решений для инференса (выполнения моделей). Хотя экосистема CUDA от Nvidia остаётся отраслевым стандартом для обучения моделей, TPU Google предлагают альтернативу с акцентом на эффективность и снижение стоимости, что может перетянуть часть клиентов, для которых цена и эффективность стали приоритетом.

QКакие китайские компании развивают аналогичные стратегии в области ИИ-чипов?

AКитайские технологические гиганты, такие как Huawei и Alibaba Cloud, также активно развивают собственные экосистемы ИИ-чипов. Huawei продвигает чипы Ascend и облачные сервисы на их основе, сотрудничая с компаниями вроде DeepSeek. Alibaba Cloud через свою дочернюю компанию T-Head выпустила серию чипов Zhenwu, которые уже используются в её облачных платформах, стремясь создать целостные и конкурентоспособные ИИ-решения.

QКак, согласно статье, изменилась природа конкуренции на рынке ИИ-вычислений?

AКонкуренция сместилась с простой гонки за максимальную производительность отдельного чипа («самая мощная вычисления») к системной конкуренции за создание наиболее эффективных и экономичных комплексных решений («оптимальные вычисления»). Побеждать будут те, кто сможет, подобно поставщикам коммунальных услуг, предлагать ИИ-вычисления как надёжный, масштабируемый и дешёвый базовый ресурс.

Похожее

Разгорается дискуссия о налоге на стейкинг Ethereum в связи с предложением о перенаправлении доходов валидаторов

Новое предложение на форуме Ethereum Research вызвало дебаты о налогообложении стейкинга. Предложение «Redirected Validator Revenue» описывает механизм, позволяющий валидаторам направлять часть своего дохода на финансирование общественных благ в экосистеме Ethereum, таких как исследования, инфраструктура и инструменты для разработчиков. Критики называют эту идею «налогом на стейкинг», поскольку она потенциально затрагивает вознаграждения валидаторов, обеспечивающих безопасность сети. Они опасаются, что это может политизировать процесс валидации и создать давление вокруг распределения средств. Сторонники же утверждают, что Ethereum необходимы устойчивые модели долгосрочного финансирования. Важно отметить, что предложение находится на ранней стадии обсуждения и не является частью консенсус-правил Ethereum. Путь от идеи до реализации протокола долог и неопределен. Тем не менее, дебаты затрагивают ключевые вопросы экономики стейкинга, что делает эту тему важной для наблюдения со стороны инвесторов и участников сети.

bitcoinist17 мин. назад

Разгорается дискуссия о налоге на стейкинг Ethereum в связи с предложением о перенаправлении доходов валидаторов

bitcoinist17 мин. назад

Основатель IOSG: Эфириуму не нужна очередная технологическая вера, ему нужен компромисс по-масочному

Автор, основатель IOSG, утверждает, что Ethereum не нуждается в очередной волне технологической веры, а скорее в "компромиссе по-масковски". Ключевая проблема Ethereum, по мнению автора, заключается не в технической дорожной карте, а в отсутствии четкого, ориентированного на реальный мир коммерческого направления и лидера, готового активно участвовать в бизнес-реалиях, подобно Илону Маску. Создание ETH Labs группой бывших ключевых исследователей Фонда Ethereum (EF) при финансировании крупных держателей ETH, таких как BitMine, SharpLink и Lubin, рассматривается как шаг, предпринятый экосистемой в ответ на пробел, оставленный самим EF. Это свидетельствует о растущем недоверии рынка к подходу "недеяния" и чрезмерной децентрализации. Внутренние проблемы EF, включая утечку талантов, являются более серьезной угрозой, чем стратегические вопросы. Новая модель с множеством независимых узлов, таких как ETH Labs, ставит сложную задачу сохранения единства направления без центрального координатора. Автор считает, что подлинная сплоченность может возникнуть только на основе общей ценности ETH как актива и, что критически важно, наличия убедительного нарратива о применении в реальном мире, который понятен и привлекателен для всех участников. Автор подчеркивает, что главная угроза для Ethereum исходит не от других блокчейнов, таких как Solana, а от миграции внимания и талантов в сферу ИИ. У Ethereum есть лишь 12-18 месяцев, чтобы ответить на этот вызов. Для этого требуется не улучшение инфраструктуры, а сфокусированность на реальных приложениях и лидер, который, подобно Маску, готов "испачкать руки". Идеализм Виталика Бутерина должен теперь воплотиться в практическое, решительное участие, так как время на раздумья истекает.

marsbit59 мин. назад

Основатель IOSG: Эфириуму не нужна очередная технологическая вера, ему нужен компромисс по-масочному

marsbit59 мин. назад

JD.com и бывший технический директор Open AI Мира Мурати сделали ставку на одну и ту же нишу в сфере ИИ

Технологический гигант JD.com представил JoyAI-VL-Interaction — первую в мире полностью открытую модель визуально-языкового взаимодействия, работающую в реальном времени. В отличие от традиционных «пошаговых» ИИ, ожидающих запросов пользователя, эта модель способна автономно анализировать непрерывный видеопоток, самостоятельно определяя, когда нужно реагировать, молчать или делегировать сложные задачи фоновым моделям. Эта разработка отражает растущую отраслевую тенденцию: переход ИИ от пассивной обработки информации к активному участию в физическом мире, от «предсказания следующего токена» к «предсказанию следующего физического состояния». Аналогичное направление — «интерактивные модели» — одновременно исследует Thinking Machines Lab под руководством Миры Мурати, что подтверждает его перспективность. Ключевое преимущество JD.com — доступ к уникальным данным из реальных физических операций в сферах ритейла, логистики и промышленности. Модель, имеющая 8 млрд параметров, достаточно легка для развертывания на оборудовании уровня видеокарты NVIDIA 3090. Она открыта полностью, включая код, модели и наборы данных, чтобы ускорить разработку приложений для ухода за пожилыми людьми, помощи слабовидящим, спортивных трансляций, инспекции объектов и робототехники. Этот шаг является частью более масштабной стратегии JD.com по созданию инфраструктуры для «воплощенного интеллекта» и укреплению позиций в качестве центра управления физическим миром.

marsbit1 ч. назад

JD.com и бывший технический директор Open AI Мира Мурати сделали ставку на одну и ту же нишу в сфере ИИ

marsbit1 ч. назад

Не спешите подавать заявки: Сравнительный обзор восьми основных путей получения статуса в Гонконге на 2026 год

Недавно Гонконг внес коррективы в свою политику привлечения талантов. В настоящее время существует восемь основных способов получения статуса резидента: программа для высококвалифицированных специалистов (TTPS), программа для талантов (QMAS), новый поток для технических специалистов (TP Stream), программа профессионального образования и карьеры (VPAS) и другие. В статье кратко изложена ключевая логика, требования к работодателям, а также преимущества и недостатки каждой из этих восьми программ. Вся информация представлена в виде наглядной сравнительной таблицы, которая, по мнению автора, поможет сэкономить на услугах посредников. Автор напоминает, что за точной и актуальной информацией следует обращаться к официальным источникам Управления иммиграции Гонконга.

marsbit1 ч. назад

Не спешите подавать заявки: Сравнительный обзор восьми основных путей получения статуса в Гонконге на 2026 год

marsbit1 ч. назад

Обзор отчета: Полупроводниковый сектор вырос на 155%, Бернштейн утверждает, что акции NVDA и AVGO "абсурдно дешевы"

Обзор отчетов: Акции полупроводникового сектора выросли на 155%, но Bernstein считает, что NVDA и AVGO «смехотворно дешевы». По данным квартального обзора полупроводниковой отрасли от Bernstein от 23 июня, основным драйвером роста стал ИИ, а фундаментальные показатели сильны. Однако оценка и загруженность сектора достигли исторических максимумов. Индекс SOX за год вырос на 155,6%, а прибыль на акцию увеличилась на 75%, что указывает на реальный рост, а не на пузырь. Внутри сектора наблюдается сильная дивергенция. Память выросла на 500%, а GPU — лишь на 115%. Несмотря на высокие общие оценки, Bernstein рекомендует NVDA и AVGO («опережать рынок»), считая их «смехотворно дешевыми» по сравнению с их ключевой ролью в цепочке поставок ИИ. Прогнозируется, что доходы NVDA от чипов Blackwell к 2027 году могут достичь $1 трлн. Рейтинг AMD повышен до «опережать рынок» благодаря перспективам в сфере ИИ и CPU. QCOM сохраняет рейтинг «вровень с рынком» из-за давления на бизнес смартфонов. Оборудование для производства чипов (AMAT, LRCX, KLAC) остается в фаворитах, в то время как аналоговые чипы (ADI, TXN) выглядят дорого. Ключевые риски — высокая загруженность сектора и растущий уровень запасов, что создает угрозу снижения цен в случае ослабления спроса. Таким образом, Bernstein занимает избирательную позицию: выбор конкретных акций сейчас важнее общего тренда рынка.

marsbit2 ч. назад

Обзор отчета: Полупроводниковый сектор вырос на 155%, Бернштейн утверждает, что акции NVDA и AVGO "абсурдно дешевы"

marsbit2 ч. назад

Торговля

Спот
Фьючерсы
活动图片