Google начинает продавать TPU: крупные компании стремятся производить «дешёвые токены» с помощью AI-чипов

marsbitОпубликовано 2026-06-24Обновлено 2026-06-24

Введение

Google начала продавать свои собственные чипы TPU, предназначенные для обработки вычислений искусственного интеллекта. Раньше эти чипы были доступны только через облачные сервисы компании, но теперь их можно приобрести напрямую для собственных центров обработки данных. TPU оптимизированы для матричных операций, лежащих в основе современных больших языковых моделей, что позволяет повысить эффективность и снизить стоимость вычислений. Этот шаг Google представляет собой вызов доминированию Nvidia на рынке AI-чипов. Хотя Nvidia обладает сильной экосистемой (CUDA), Google предлагает готовые комплексные решения, ориентированные на эффективность и снижение стоимости обработки, особенно на этапе инференса (вывода моделей). Автор статьи сравнивает это с переходом от «премиального топлива» к более доступному, что критически важно для массового внедрения ИИ, где стоимость «токенов» становится ключевым фактором. Тенденция показывает, что вычисления ИИ становятся базовым ресурсом, подобным электричеству. В этой новой реальности побеждает не обязательно тот, у кого самые мощные чипы, а тот, кто может предложить наиболее оптимальную по цене и эффективности систему. Аналогичную стратегию развивают и крупные облачные провайдеры, такие как Huawei Cloud и Alibaba Cloud, создавая собственные полные экосистемы на базе своих чипов. Конкуренция на рынке ИИ-инфраструктуры смещается от «битвы чипов» к «битве систем».

Недавно Google объявил о начале прямых продаж сторонним центрам обработки данных и клиентам своих собственных чипов TPU, а также сопутствующего оборудования для AI-вычислений. Будучи «секретным оружием» Google в области AI, TPU раньше можно было арендовать только через облачные центры данных, и в индустрии долгое время считалось, что Google не будет продавать эти чипы, пока в июне этого года не пришла эта хорошая новость.

Тогда возникает вопрос: что такое «TPU»? Полное название — «Tensor Processing Unit (тензорный процессор)». В отличие от CPU и GPU, он представляет собой чип, специально разработанный для «матричных и тензорных математических операций» в AI-вычислениях, способный с чрезвычайно высокой эффективностью обрабатывать соответствующие вычисления.

Звучит как вспомогательный чип? Однако это не так, потому что современные технологии больших AI-моделей по своей сути представляют собой сложные математические операции над огромными объёмами данных (в основном, матричное умножение). Поэтому Google сделал следующее: объединил тысячи TPU в суперкомпьютерные кластеры, а затем, используя CPU-хосты для распределения задач (разделения задач, преобразования данных), создал центры AI-вычислений с чрезвычайно высокой эффективностью.

Источник: Google

Именно поэтому Gemini может с более низкой стоимостью подписки и более высокими лимитами использования агрессивно отвоёвывать пользовательскую базу у таких компаний, как OpenAI. Даже если рассматривать только цену токена, Gemini является одним из представителей зарубежных AI-продуктов с относительно низкой ценой на флагманские модели, при этом цена на основные модели близка к ценам китайских производителей, таких как DeepSeek.

Более того, TPU также лучше справляются с обработкой огромного количества вычислительных запросов от обычных пользователей, что можно считать «профильным» для будущей AI-экосистемы, поэтому сторонние компании давно присматривались к этим чипам. После анонса планов продаж Google также объявил о соглашении на 50 миллиардов долларов о совместном строительстве крупного центра обработки данных с известной частной инвестиционной компанией Blackstone, предварительная мощность которого составит 500 мегаватт.

LeiTech (ID: leitech) предполагает, что после этого сообщения к Google наверняка обратится множество компаний с запросами о ценах или сотрудничестве, особенно тех, кто хочет построить собственные центры обработки данных. В этот момент кто-то может подумать, что Amazon должно волноваться, ведь это явный перехват бизнеса облачных услуг. На самом деле, нет, сейчас больше всего головной боли, вероятно, достанется Nvidia.

Google нанёс Nvidia удар «под дых»?

Сначала LeiTech хочет задать вопрос: почему Nvidia стала одной из самых важных компаний в эпоху AI? Если ваш ответ — просто «GPU обладает высокой вычислительной мощностью», то вы правы лишь наполовину.

Настоящая сила Nvidia заключается в том, что она уже давно не просто продаёт GPU. CUDA, NVLink, DGX, сеть InfiniBand, библиотеки AI-программного обеспечения, экосистема разработчиков, партнёры по серверам, адаптация для облачных провайдеров — всё это вместе составляет «защитный ров» Nvidia.

Поэтому, когда вы покупаете вычислительную карту Nvidia и запускаете её, вы покупаете не просто карту, а целую, уже проверенную индустрией AI-экосистему. Для большинства компаний экосистема CUDA от Nvidia позволяет им не «изобретать велосипед», экономя много усилий и средств.

Вот почему многие AI-компании, зная, что GPU от Nvidia очень дорогие, всё равно вынуждены их использовать. Потому что в период взрывного роста AI «стоимость» можно игнорировать, единственным критерием является возможность опередить конкурента или быстрее догнать его. Но по мере того, как большие модели AI входят в фазу распространения, всем нужно уже не только «скорость»; перед лицом огромной пользовательской базы эффективность и соотношение цены и качества становятся новыми приоритетами.

Google, очевидно, также увидел это, поэтому они сделали ставку на TPU и упаковали его в комплексное решение. Чипы в этом решении предназначены не для того, чтобы превзойти Nvidia по производительности вычислений, а для того, чтобы упаковать многолетний опыт Google в области чипов, центров обработки данных, сетей, хранения, планирования и обучения моделей в облачные услуги, которые предприятия могут напрямую приобретать.

Это и есть то, что Google действительно «перенял» у Nvidia — он учится не продавать чипы, а продавать системы и экосистемы, превращая ряд аппаратных средств в «производительные силы», которые клиенты могут использовать. Это имеет немалую привлекательность для тех предприятий, которые хотят держать центр обработки данных в своих руках.

Тогда, Nvidia должно запаниковать? Не обязательно, но головная боль точно будет, ведь хотя флагманские вычислительные карты приносят прибыль, компании не могут вечно находиться в состоянии «покупать столько, сколько есть», а постепенно будут обращать внимание на другие, более экономичные чипы. В этот момент решение Google с TPU неизбежно окажет давление на эту часть рынка Nvidia.

Однако для всей AI-индустрии Nvidia по-прежнему остаётся наиболее признанным универсальным стандартом на рынке AI-вычислений, и положение экосистемы CUDA не так легко поколебать одним-двумя поколениями чипов. Особенно на этапе обучения больших моделей многие команды уже накопили огромный опыт работы с системой Nvidia, и резкий переход на другую платформу сопряжён с немалым риском.

Например, DeepSeek недавно анонсировал, что его новая модель может быть обучена на чипах Huawei Ascend, и это стало возможным только после глубокого сотрудничества Huawei и DeepSeek и нескольких итераций версий.

Источник: Ascend

Но с точки зрения Google, на самом деле не нужно заменять Nvidia во всех сценариях, достаточно привлечь часть корпоративных клиентов и доказать, что их эффективность выше, чем у других вычислительных экосистем, и тогда они уже смогут отрезать себе кусок пирога на рынке AI-инфраструктуры.

Особенно на этапе логического вывода (inference) серверы с TPU от Google явно имеют преимущество. Все знают, что токены, когда их начинают реально использовать, расходуются не медленнее, чем открытый шлюз для воды. Сначала Uber сжёг годовой бюджет за четыре месяца, таинственная компания потратила 500 миллионов долларов на токены за месяц, затем даже щедрая Microsoft ограничила права сотрудников, приказав им использовать свои собственные вычислительные мощности.

Можно сказать, что по мере того, как AI всё чаще используется в различных областях, наверняка будет появляться больше примеров, доказывающих, что стоимость токенов является ключевым фактором будущей конкуренции в AI. Потому что у кого стоимость токенов ниже, тот сможет внедрить AI в большее количество бизнес-направлений, чтобы захватывать пользователей и рынки.

Вычислительные мощности становятся базовым ресурсом, у облачных провайдеров появляются возможности

LeiTech считает, что аналогия одного пользователя в сети очень удачна: обучение модели похоже на покупку автомобиля, а услуги логического вывода — на ежедневно сжигаемый бензин. Даже богатые семьи не могут постоянно заправлять все машины 98-м бензином; вычислительные мощности, предоставляемые Google, похожи на 92-й: хотя мощности немного не хватает, машина всё равно едет, работа делается, и при этом дешевле.

Недавно LeiTech уже писал статью, в которой упоминалось, что сейчас в индустрии есть консенсус: AI-вычислительные мощности становятся всё больше похожи на базовые ресурсы, такие как электричество, вода, широкополосный интернет.

И для пользователей им не нужно знать, как производятся «вычислительные мощности», но они будут заботиться о цене на них, как о счетах за коммунальные услуги. Этот «пользователь» может быть как частным лицом, так и предприятием, городом или даже страной.

Поэтому на будущем AI-рынке Nvidia по-прежнему будет очень важна, потому что без высокопроизводительных чипов ни о чём не может быть и речи. Но когда потребность в вычислительных мощностях станет долгосрочным, стабильным и масштабируемым базовым ресурсом, право голоса, наоборот, постепенно перейдёт к провайдерам облачных услуг.

Вот почему облачные провайдеры, такие как Google, Microsoft, Amazon, Alibaba Cloud, Huawei Cloud, больше не удовлетворяются ролью просто «перепродавцов» GPU-вычислений от Nvidia, а все занимаются построением собственных вычислительных экосистем. Это, конечно, не означает, что они не будут продолжать закупать GPU Nvidia, потому что рынок нуждается, клиенты нуждаются, и это также может принести хороший доход.

Источник: LeiTech

Но в то же время их истинный фокус развития обязательно сместится на свои собственные экосистемы, и это то, чего Nvidia должна больше всего опасаться. Ведь нынешняя рыночная капитализация Nvidia во многом рассчитывается исходя из её положения как «базовой основы AI». Как только Nvidia потеряет контроль над рынком не топовых вычислительных карт, она может постепенно вернуться к положению пятилетней давности на рынке игровых видеокарт: хотя и лидер, но не незаменимая.

На самом деле, если мы вернём взгляд на Китай, подобные изменения уже появились. Раньше, когда мы говорили о китайских AI-вычислительных картах, фокус часто был на сравнении производительности вычислений, обсуждении, насколько производительность одной карты отстаёт от топовых вычислительных карт.

Этот вопрос, безусловно, важен, но если смотреть только на производительность самого чипа, упускается другой ключевой момент: китайские облачные провайдеры также превращают чипы, кластеры, облачные платформы, сервисы моделей и отраслевые решения в целостную AI-производственную систему, и это является самой основной конкурентоспособностью китайского AI.

Это говорит не LeiTech, а сами ключевые облачные провайдеры, такие как Huawei Cloud, Alibaba Cloud. Например, облачные услуги Huawei Ascend. Хотя чипы Ascend по-прежнему часто оказываются в центре внимания, сегодня Huawei уже предоставляет вокруг вычислений Ascend облачные инструментальные цепочки, суперузловые кластеры, миграцию моделей, оптимизацию обучения и логического вывода, а также возможности внедрения в отрасли.

Источник: Weibo

Более того, Huawei также продвигает эту вычислительную экосистему для большего числа китайских AI-компаний. Помимо упомянутого ранее DeepSeek, есть также ведущие производители больших AI-моделей, такие как Baidu, iFlytek, Zhipu, MiniMax. Можно сказать, что Huawei постепенно построила свою собственную вычислительную экосистему, и теперь ей остаётся привлечь больше партнёров на борт, а затем с более низкой ценой токенов завоёвывать рынок.

Alibaba Cloud делает то же самое. В мае этого года они выпустили AI-чип для обучения и вывода Zhenwu M890, а до этого Zhenwu 810E уже давно массово развёрнут на интеллектуальной вычислительной платформе Lingjun от Alibaba Cloud. На саммите Alibaba Cloud в этом году компания прямо объявила, что совокупный объём поставок AI-чипов серии Zhenwu от Pingtouge достиг 560 000 штук, а годовой доход перешагнул отметку в 10 миллиардов юаней.

Можно сказать, что в обучении у Nvidia китайские облачные провайдеры не только идут быстрее, но и начали раньше.

Самые мощные вычисления? Нет, миру нужны «оптимальные вычисления»

Конечно, Nvidia не потеряет своё ключевое положение в эпоху AI только из-за того, что Google начал продавать TPU.

По крайней мере, в течение длительного времени GPU, CUDA и экосистема разработчиков по-прежнему останутся стандартом, который нельзя обойти во всей AI-индустрии. Особенно в сценариях обучения больших моделей, высокопроизводительных вычислений и разработки универсального AI, Nvidia остаётся наиболее зрелым и признанным индустрией выбором на данный момент.

Но проблема в том, что рынок AI-вычислений вступает в следующую фазу.

Раньше все боролись за то, «чей чип мощнее», а теперь предприятия по-настоящему начинают заботиться о том, «кто может сделать вычисления дешевле». В этот момент преимущества облачных провайдеров, таких как Google, Huawei Cloud, Alibaba Cloud, начинают проявляться: у них есть огромное количество частных и корпоративных клиентов, данные, приложения и сценарии, и они также лучше умеют упаковывать различное аппаратное обеспечение в систему производительности, которую можно использовать напрямую.

Другими словами, в эпоху AI действительно дефицитны уже не только сами чипы, а системная способность превращать чипы в производительные силы.

Когда вычисления становятся всё больше похожи на базовые ресурсы, такие как вода, электричество, широкополосный интернет, победившая компания не обязательно будет тем производителем, у которого самая высокая производительность одной карты, а тем, кто сможет с более низкой стоимостью и более высокой эффективностью постоянно поставлять AI-вычисления клиентам.

Поэтому, с точки зрения LeiTech, начало продаж TPU от Google — это сигнал, напоминающий всей отрасли: конкуренция в AI-инфраструктуре — это уже не только битва чипов, но и битва систем.

Эта статья взята из официального аккаунта WeChat «LeiTech», автор: LeiTech

Связанные с этим вопросы

QЧто такое TPU и чем он отличается от CPU и GPU?

ATPU (Tensor Processing Unit, Тензорный процессор) — это специализированный процессор, разработанный Google для выполнения матричных и тензорных математических операций, которые лежат в основе вычислений для ИИ-моделей. В отличие от CPU (центральных процессоров) и GPU (графических процессоров), TPU оптимизирован для максимальной эффективности именно в задачах ИИ.

QПочему Google начал продавать свои TPU третьим сторонам?

AGoogle начал продавать TPU напрямую клиентам и центрам обработки данных, чтобы предоставить предприятиям возможность создавать собственные высокоэффективные и экономичные вычислительные мощности для ИИ. Это позволяет клиентам снижать стоимость генерации токенов (token) и повышать конкурентоспособность своих ИИ-сервисов.

QКак решение Google повлияет на позиции Nvidia на рынке ИИ-чипов?

AРешение Google представляет серьёзную конкуренцию для Nvidia, особенно на рынке более бюджетных решений для инференса (выполнения моделей). Хотя экосистема CUDA от Nvidia остаётся отраслевым стандартом для обучения моделей, TPU Google предлагают альтернативу с акцентом на эффективность и снижение стоимости, что может перетянуть часть клиентов, для которых цена и эффективность стали приоритетом.

QКакие китайские компании развивают аналогичные стратегии в области ИИ-чипов?

AКитайские технологические гиганты, такие как Huawei и Alibaba Cloud, также активно развивают собственные экосистемы ИИ-чипов. Huawei продвигает чипы Ascend и облачные сервисы на их основе, сотрудничая с компаниями вроде DeepSeek. Alibaba Cloud через свою дочернюю компанию T-Head выпустила серию чипов Zhenwu, которые уже используются в её облачных платформах, стремясь создать целостные и конкурентоспособные ИИ-решения.

QКак, согласно статье, изменилась природа конкуренции на рынке ИИ-вычислений?

AКонкуренция сместилась с простой гонки за максимальную производительность отдельного чипа («самая мощная вычисления») к системной конкуренции за создание наиболее эффективных и экономичных комплексных решений («оптимальные вычисления»). Побеждать будут те, кто сможет, подобно поставщикам коммунальных услуг, предлагать ИИ-вычисления как надёжный, масштабируемый и дешёвый базовый ресурс.

Похожее

a16z: В эпоху ИИ борьба компаний за таланты начинается с наименования должностей

В статье a16z обсуждается стратегическая важность присвоения названий должностям в эпоху ИИ как инструмента привлечения талантов и формирования организационного нарратива. На примере Palantir, которая ввела термин FDE (forward-deployed engineer), показывается, как переименование роли, связанной с внедрением решений на стороне клиента, позволило переосмыслить её ценность — с периферийной поддержки на ключевую компетенцию, связывающую продукт с реальными бизнес-процессами. Автор вводит понятие «арбитража названий должностей» (title arbitrage): когда организация первой даёт имя новой важной компетенции, она получает преимущество в привлечении специалистов и захвате рыночного восприятия. Название должности — это организационный язык, который сигнализирует о статусе, полномочиях и признании ценности работы. В контексте ИИ это особенно актуально: трансформация приводит к появлению новых высокоэффективных ролей (например, legal engineer или GTM engineer), которые сочетают знание предметной области с навыками автоматизации. Успешное именование таких ролей легитимизирует их внутри компаний-клиентов и создает ментальную связь с продуктом, который эти роли поддерживает. Ключевой вывод: для B2B-компаний в сфере ИИ создание новых названий должностей — это часть стратегии, помогающая не только привлекать таланты, но и переосмысливать границы между продуктом и сервисом, где внедренческие команды становятся частью цикла обучения продукта. Однако переименование должно отражать реальные изменения в содержании работы и организационной структуре, а не быть простой инфляцией титулов.

marsbit29 мин. назад

a16z: В эпоху ИИ борьба компаний за таланты начинается с наименования должностей

marsbit29 мин. назад

CBRS опубликовала первую отчетность после выхода на биржу: выручка удвоилась, но прогноз по валовой марже резко упал, выполнение крупного заказа OpenAI затягивается

Cerebras (CBRS) представила первый отчет после IPO: выручка за первый квартал выросла на 92%, достигнув $191,3 млн, что превысило ожидания. Однако руководство резко снизило прогноз по валовой марже во втором квартале до 36-38% из-за нехватки мощностей ЦОД, что привело к падению акций на 10%. Компания переходит от продажи чипов к предоставлению вычислительных мощностей как услуги (облако), что меняет структуру доходов. Основные драйверы роста — долгосрочные контракты с OpenAI (свыше $200 млрд) и партнерство с AWS, однако их реализация растянута во времени. Высокая концентрация выручки сохраняется: в 2025 финансовом году 86% поступлений пришлось на две связанные организации из ОАЭ. Аналитики видят потенциал в преимуществе Cerebras в скорости обработки запросов ИИ (инференс), но скептики указывают на риски для маржи, конкуренцию с NVIDIA и оговорки о досрочном снятии блокировки акций.

marsbit30 мин. назад

CBRS опубликовала первую отчетность после выхода на биржу: выручка удвоилась, но прогноз по валовой марже резко упал, выполнение крупного заказа OpenAI затягивается

marsbit30 мин. назад

Интервью с CEO Strategy: После продажи биткойна, сможет ли STRC восстановиться?

Интервью с CEO Strategy Фонгом Ле о продаже 32 биткоинов: рынок отреагировал волатильно, но это часть долгосрочной стратегии. Ле подчеркивает, что краткосрочные колебания — это «машина для голосования», тогда как долгосрочная ценность — «машина для взвешивания». Продажа была небольшим тестом ликвидности и внутренних процессов, а не реакцией на опасения «спирали смерти» в DeFi (менее 10% STRC находится в протоколах). Компания, крупнейший корпоративный холдер биткоинов, сохраняет множество вариантов финансирования, включая стратегию «ничего не делать». Ле выражает непоколебимую веру в базовую ценность биткоина. Он также обсуждает роль ИИ в создании продукта STRC и будущее, где триллионы автономных агентов могут использовать биткоин. Отвечая на вопрос о восстановлении цены STRC до $100, он уверен, что пополнение резервов и начало выплаты дивидендов 30 июня помогут стабилизировать цену.

marsbit1 ч. назад

Интервью с CEO Strategy: После продажи биткойна, сможет ли STRC восстановиться?

marsbit1 ч. назад

Разгорается дискуссия о налоге на стейкинг Ethereum в связи с предложением о перенаправлении доходов валидаторов

Новое предложение на форуме Ethereum Research вызвало дебаты о налогообложении стейкинга. Предложение «Redirected Validator Revenue» описывает механизм, позволяющий валидаторам направлять часть своего дохода на финансирование общественных благ в экосистеме Ethereum, таких как исследования, инфраструктура и инструменты для разработчиков. Критики называют эту идею «налогом на стейкинг», поскольку она потенциально затрагивает вознаграждения валидаторов, обеспечивающих безопасность сети. Они опасаются, что это может политизировать процесс валидации и создать давление вокруг распределения средств. Сторонники же утверждают, что Ethereum необходимы устойчивые модели долгосрочного финансирования. Важно отметить, что предложение находится на ранней стадии обсуждения и не является частью консенсус-правил Ethereum. Путь от идеи до реализации протокола долог и неопределен. Тем не менее, дебаты затрагивают ключевые вопросы экономики стейкинга, что делает эту тему важной для наблюдения со стороны инвесторов и участников сети.

bitcoinist1 ч. назад

Разгорается дискуссия о налоге на стейкинг Ethereum в связи с предложением о перенаправлении доходов валидаторов

bitcoinist1 ч. назад

Основатель IOSG: Эфириуму не нужна очередная технологическая вера, ему нужен компромисс по-масочному

Автор, основатель IOSG, утверждает, что Ethereum не нуждается в очередной волне технологической веры, а скорее в "компромиссе по-масковски". Ключевая проблема Ethereum, по мнению автора, заключается не в технической дорожной карте, а в отсутствии четкого, ориентированного на реальный мир коммерческого направления и лидера, готового активно участвовать в бизнес-реалиях, подобно Илону Маску. Создание ETH Labs группой бывших ключевых исследователей Фонда Ethereum (EF) при финансировании крупных держателей ETH, таких как BitMine, SharpLink и Lubin, рассматривается как шаг, предпринятый экосистемой в ответ на пробел, оставленный самим EF. Это свидетельствует о растущем недоверии рынка к подходу "недеяния" и чрезмерной децентрализации. Внутренние проблемы EF, включая утечку талантов, являются более серьезной угрозой, чем стратегические вопросы. Новая модель с множеством независимых узлов, таких как ETH Labs, ставит сложную задачу сохранения единства направления без центрального координатора. Автор считает, что подлинная сплоченность может возникнуть только на основе общей ценности ETH как актива и, что критически важно, наличия убедительного нарратива о применении в реальном мире, который понятен и привлекателен для всех участников. Автор подчеркивает, что главная угроза для Ethereum исходит не от других блокчейнов, таких как Solana, а от миграции внимания и талантов в сферу ИИ. У Ethereum есть лишь 12-18 месяцев, чтобы ответить на этот вызов. Для этого требуется не улучшение инфраструктуры, а сфокусированность на реальных приложениях и лидер, который, подобно Маску, готов "испачкать руки". Идеализм Виталика Бутерина должен теперь воплотиться в практическое, решительное участие, так как время на раздумья истекает.

marsbit2 ч. назад

Основатель IOSG: Эфириуму не нужна очередная технологическая вера, ему нужен компромисс по-масочному