OpenAI наконец-то занялась разработкой чипов.
Увидев эту новость, многие первым делом подумали: у Nvidia проблемы.
Но я вижу как раз обратное.
Главное значение первого чипа Jalapeño не в том, что он нацелен прямо на Nvidia.
Это первый раз, когда OpenAI публично признаёт, что не хочет ограничиваться ролью компании по разработке моделей.
Она хочет контролировать весь процесс производства интеллекта.
От моделей до чипов. От дата-центров до энергии. От обучения до вывода. От производства токенов до их продажи.
Jalapeño внешне — это чип, но по сути больше похож на дорожную карту.
OpenAI наконец-то выложила свои амбиции на стол.
I. Разрыв в моделях сокращается, разрыв в вычислениях увеличивается
С момента взрывного роста больших моделей почти всё внимание индустрии ИИ было приковано к моделям.
Выход GPT-4 потряс индустрию, за ним подтянулись Claude, Gemini, DeepSeek снизил стоимость, Meta открыла исходный код. Каждый релиз все следят за одним и тем же набором показателей: параметры, рейтинги, способность к коду, математические способности, длинный контекст, мультимодальность.
Модели, конечно, важны. Но уже происходит изменение: окно лидерства в моделях сокращается. Сегодня только вышла новая модель, а через несколько месяцев её догонят сообщество open-source, конкуренты, облачные провайдеры. Разрыв в возможностях всё ещё есть, но ему всё труднее стать долгосрочным барьером.
То, что действительно создаёт разрыв, смещается на более низкий уровень. Поставки вычислительных мощностей, стоимость вывода, пропускная способность систем, возможности сети, строительство дата-центров, доступ к энергии. Это не так эффектно, как выпуск моделей, и не вызывает мгновенного резонанса. Но именно это определяет, сможет ли компания ИИ бежать долгую дистанцию.
Недавно Дженсен Хуан сказал одну фразу: системы Nvidia могут быть не самыми дешёвыми в закупке, но они генерируют самые дешёвые токены, обеспечивают самую высокую пропускную способность токенов и, в конечном счёте, приносят самый высокий доход.
Слова Хуана очень прямые. Индустрия постоянно жалуется, что Nvidia дорога. Хуан не стал оправдываться в цене закупки, а перевёл вопрос в другое измерение: смотрите не на то, сколько денег вы тратите на машины, а на стоимость производства каждого токена.
Это новая бухгалтерская книга эпохи ИИ. Серверы и GPU — не конечная единица, токен — конечная.
И OpenAI как раз находится в самом центре этой проблемы.
ChatGPT ежедневно обрабатывает огромное количество запросов, Codex потребляет ещё больше шагов вывода, а впереди — агенты, генерация видео, робототехника, длинные цепочки рассуждений. Чем полезнее модель, тем больше потребление токенов. Чем успешнее продукт, тем больше счёт за вывод.
Жестокая правда в том, что чем больше у OpenAI пользователей, тем больше зарабатывает Nvidia. Чем мощнее продукты OpenAI, тем тяжелее бремя расходов на базовые вычисления.
Если за каждый токен приходится платить налог внешней аппаратной платформе, OpenAI сложно будет построить полноценный защитный ров. У неё может быть самая сильная модель, супер-вход, экосистема разработчиков. Но самая ключевая стоимость производства всегда будет зажата в чужих руках.
В этом и заключается суть Jalapeño. OpenAI начинает строить свои собственные фабрики по производству токенов.
II. GPT начинает проектировать GPT
Деталь, которую проще всего недооценить в чипе Jalapeño, — это 9 месяцев на запуск производства (tape-out).
Цикл традиционных проектов высокопроизводительных ASIC обычно составляет от 18 до 36 месяцев. С передовыми техпроцессами ещё сложнее: архитектура, верификация, физическая реализация, упаковка, программный стек, отладка — проблема на любом этапе быстро увеличивает стоимость. OpenAI и Broadcom сократили цикл до 9 месяцев.
Это нельзя понимать так, что индустрия чипов вдруг стала проще. OpenAI не появилась с готовой полупроводниковой производственной цепочкой. У Broadcom богатый опыт в разработке заказных чипов и сетевой инфраструктуры, Celestica отвечает за платы, стойки и системную инженерию.
Настоящий вклад OpenAI — это нечто более редкое: она знает, как будущие модели будут работать.
Многие чипмейкеры, создающие ускорители ИИ, сталкиваются со сложностью угадывания нагрузки. Архитектура моделей меняется, способы вывода меняются, режимы обслуживания меняются. Как только чип ушёл в производство, в физическом мире нет такой возможности отката, как в мире программного обеспечения.
OpenAI не должна полностью полагаться на догадки. Ежедневно запуская ChatGPT, Codex и API, она знает, какие ядра используются чаще всего, какие перемещения данных в памяти наиболее расточительны, какие сетевые узкие места сильнее всего влияют на эффективность кластера, какие задержки напрямую вредят пользовательскому опыту. Она также знает, как будущие продукты с агентами будут потреблять ресурсы вывода.
Раньше этот опыт был просто знаниями внутренней инженерии, теперь он заложен в архитектуру чипа.
В официальном пресс-релизе OpenAI есть ключевая фраза: OpenAI использовала собственные модели для ускорения части процессов проектирования и оптимизации. Также говорится, что модели, предоставляемые пользователям, также помогают улучшать инфраструктуру для запуска будущих моделей.
GPT начинает участвовать в проектировании машин для следующего поколения GPT.
Последние несколько десятилетий цепочка в мире чипов была такой: сначала проектируют чип, чип запускает программное обеспечение, ПО запускает ИИ. Теперь цепочка начинает движение в обратном направлении: ИИ помогает людям проектировать чипы, которые затем запускают следующий ИИ.
Как только этот цикл замыкается, 9 месяцев могут быть лишь началом. В будущем это могут быть 6 месяцев, 3 месяца или даже более интенсивные итерации.
У индустрии чипов раньше был свой ритм, у индустрии моделей — свой. Первый медленный, второй быстрый. Jalapeño сближает эти два ритма.
Если этот шаг окажется успешным, маховик OpenAI станет пугающим. Лучшие модели помогают проектировать лучшие чипы, лучшие чипы снижают стоимость запуска следующего поколения моделей, более низкая стоимость поддерживает больше пользователей и продуктов, больше пользователей и продуктов приносят больше данных о реальной нагрузке, и эти данные, в свою очередь, определяют следующий чип.
Вот какой цикл действительно нужен OpenAI.
III. Снижение налога на вывод, контроль денежного потока
Jalapeño — не обучающий чип, он ориентирован на вывод больших языковых моделей (LLM inference). Это ключевой момент.
Обучение похоже на строительство авианосца. Огромные разовые вложения, требуется исключительная универсальность, постоянная адаптация к новым моделям, архитектурам, экспериментам. Рынок обучения по-прежнему сильно зависит от Nvidia, и не только от GPU, а от всей платформы: CUDA, сеть, системы, программные библиотеки, экосистема разработчиков.
Вывод больше похож на парк такси. Бегает каждый день, каждый час, каждую минуту. Каждый раз, когда пользователь задаёт вопрос, API отвечает, агент делает шаг вперёд, происходит вывод. Здесь важнее низкая задержка, низкая стоимость, высокая пропускная способность, высокая утилизация.
Обучение сжигает крупные деньги этапами, вывод — ежедневный денежный поток.
Это также самая головная боль для компаний ИИ, вышедших на стадию коммерциализации. Обучить GPT один раз дорого, но вывод происходит каждый день. Эпоха агентов только усугубит эту проблему: одна задача может включать десятки или даже сотни вызовов модели. Длинный контекст, цепочечные рассуждения, мультимодальная генерация, выполнение кода — всё это продолжает увеличивать потребление токенов.
Jalapeño нацелен именно на этот налог на вывод. Он больше похож на собственный TPU от OpenAI. Google, Amazon, Meta, Microsoft прошли схожий путь: если нагрузка достаточно велика, разработка собственного ASIC имеет экономический смысл с точки зрения стоимости и эффективности.
Сейчас у OpenAI есть для этого условия: реальные запросы, продуктовый план, команда по моделям, такие индустриальные партнёры, как Broadcom, и огромное давление из-за стоимости.
Jalapeño не нужно продавать на сторону, чтобы доказать свою ценность. Если он делает ответы ChatGPT дешевле, ускоряет работу Codex, повышает маржинальность API, — он уже имеет смысл.
OpenAI также упоминает, что Jalapeño уменьшит передачу данных, сбалансирует вычислительные ресурсы, память и сетевые ресурсы, повысив фактическую утилизацию до значений, близких к теоретическому пику. Вычислительные мощности часто дороги из-за того, что используются не в полную силу: GPU ждут сеть, перемещения данных в памяти замедляют вычисления, плохое планирование вызывает простой, — все эти потери в итоге превращаются в счета за электричество и капитальные затраты.
Цена закупки — это только первый слой, эффективность системы — окончательный счёт.
IV. OpenAI всё больше похожа на Apple
Многие воспримут Jalapeño как вызов OpenAI компании Nvidia, но я думаю, что OpenAI не хочет стать следующей Nvidia, а скорее учится у Apple.
Самое сильное в Apple никогда не было в какой-то одной точке. iPhone мощный, iOS мощная, чипы серий A и M мощные, App Store мощный. Но то, что действительно трудно преодолеть у Apple, — это то, что все эти вещи помещены в один замкнутый цикл.
Чипы оптимизированы под систему, система оптимизирована под приложения, пользовательский опыт приложений, в свою очередь, определяет следующий чип. Этот замкнутый цикл позволяет Apple создавать опыт, который другим очень трудно повторить при тех же ограничениях батареи, объёма, теплоотвода.
OpenAI строит нечто подобное. Модель — это интеллектуальное ядро, ChatGPT — супер-вход, Codex — инструмент разработки, API — уровень распространения экосистемы, Jalapeño — собственный чип, дата-центр — фабрика ИИ.
Генеральный директор OpenAI Сэм Альтман последние два года постоянно говорит о чипах, энергии, термоядерном синтезе, дата-центрах. Теперь становится ясно, что это вовсе не погоня за концепциями. Он больше не планирует OpenAI как стартап в области ИИ.
Если Nvidia продаёт лопаты, то OpenAI хочет владеть рудником.
Nvidia хочет быть поставщиком заводского оборудования для всех компаний ИИ, продавать GPU, сети, системы, программную экосистему, решения для фабрик ИИ. Идеальный клиент — любая компания, которой нужно производить токены.
OpenAI хочет построить для себя собственный завод и продавать не оборудование, а конечный произведённый интеллект.
В краткосрочной перспективе OpenAI не может обойтись без Nvidia. Обучение и универсальные вычисления по-прежнему требуют платформы GPU, и Jalapeño вряд ли быстро покроет все нагрузки. Скорее всего, он сначала внедрится в наиболее предсказуемые, масштабные сценарии вывода с наивысшей отдачей от оптимизации для OpenAI.
В долгосрочной перспективе трещина уже появилась. Когда компания, занимающаяся моделями, начинает иметь собственную дорожную карту чипов, клиенты Nvidia перестают быть просто клиентами. Они тоже станут игроками другого типа на рынке инфраструктуры ИИ.
За пределами полосы
За последние двадцать лет самым важным активом в интернете был трафик. Кто владеет пользователями, тот владеет ценностью.
Сегодня в эпоху ИИ появляются новые закономерности.
Модели всё больше похожи на трафик, а вычисления — на землю.
Модели будут итеративно улучшаться, продукты меняться, рейтинги постоянно обновляться. Но те фабрики, которые производят интеллект, — чипы, сети, дата-центры, энергия — будут всё больше концентрироваться в руках небольшого числа игроков.
То, что GPT начал проектировать GPT, выглядит как просто один запуск производства (tape-out).
Но то, что он действительно провозглашает, это:
OpenAI больше не хочет быть самой умной компанией, она хочет быть компанией, контролирующей производство интеллекта.
Эта статья из WeChat официального аккаунта:版面之外, автор: 画画
Эта статья из WeChat официального аккаунта:版面之外, автор: 画画, иллюстрация: AI-generated






