GPT设计GPT

marsbitОпубликовано 2026-06-25Обновлено 2026-06-25

Введение

OpenAI推出其首款自研芯片Jalapeño，这标志着公司不再满足于仅做一家模型公司，而是开始控制智能生产的全链条。当前，模型能力的领先窗口正在缩短，真正的长期壁垒已转向底层基础设施——算力、推理成本与能源效率。Jalapeño是一款面向大模型推理的芯片，旨在降低OpenAI自身产品的Token生成成本，尤其是日常的推理开销。该芯片仅用九个月完成流片，其关键在于OpenAI将运行ChatGPT等产品的实际负载经验融入了芯片设计，甚至利用AI辅助优化设计流程，形成了“AI设计芯片，芯片运行下一代AI”的闭环。这不仅能提升系统效率、削减“推理税”，还可能加速迭代，形成强大的业务飞轮。此举并非简单挑战英伟达，而是效仿苹果构建软硬一体闭环的战略。OpenAI正整合模型、产品、API、芯片与数据中心，目标是成为控制智能生产的“矿山”，直接出售智能本身，而非依赖外部算力平台。这预示着AI行业的竞争核心正从模型本身，转向拥有计算工厂与全栈控制力的少数玩家。

OpenAI终于做芯片了。

很多人看到这条新闻,第一反应是:英伟达麻烦了。

但我看到的恰恰相反。

首款芯片Jalapeño最重要的意义,并非直奔着英伟达而来。

这是OpenAI第一次公开承认,自己不满足于做一家模型公司了。

它想控制的,是生产智能的整个过程。

从模型,到芯片。从数据中心,到能源。从训练,到推理。从生产Token,到销售Token。

Jalapeño表面是一颗芯片,实际上更像一张路线图。

OpenAI终于把自己的野心摆到了桌面上。

一、模型差距在缩小,计算差距在扩大

自从大模型爆发以来,AI行业几乎所有注意力都在模型。

GPT-4出来行业被震一次,Claude追上来,Gemini追上来,DeepSeek把性价比打出来,Meta推开源。每次发布大家盯着同一组东西:参数、榜单、代码能力、数学能力、长上下文、多模态。

模型当然重要。但一个变化已经出现,模型领先的窗口正在变短。今天一个模型刚发布,几个月后开源社区、竞争对手、云厂商就会跟上。能力差距仍然存在,但越来越难独立构成长期壁垒。

真正拉开差距的东西,开始往更底层走。算力供应、推理成本、系统吞吐、网络能力、数据中心建设、能源获取。没有模型发布那么好看,也不会立刻刷屏。但它们决定一家AI公司能不能长期跑下去。

黄仁勋最近说了一句话:英伟达系统也许不是采购价格最低的,但能生成成本最低的Token、最高的Token吞吐量,最终带来最高收入。

老黄这段话很直接。行业一直抱怨英伟达贵,黄仁勋没在采购价上辩解,而是把问题换到另一个维度:别看买机器花多少钱,要看每个Token的生产成本。

这就是AI时代新的账本。服务器和GPU不是最终单位,Token才是。

OpenAI恰好站在这个问题最中心。

ChatGPT每天处理海量请求,Codex要消耗更多推理步骤,未来还有Agent、视频生成、机器人、长推理链。模型越有用,Token消耗越大。产品越成功,推理账单越厚。

残酷的地方在这里,OpenAI用户越多,英伟达越赚钱。OpenAI产品越强,底层算力税越重。

如果每一个Token都要经过外部硬件平台收一道税,OpenAI就很难拥有完整的护城河。它可以有最强模型,有超级入口,有开发者生态。但最核心的生产成本始终卡在别人手里。

Jalapeño的本质就在这里。OpenAI开始自己造Token工厂。

二、GPT开始设计GPT

Jalapeño这款芯片最容易被低估的细节,是九个月流片。

传统高性能ASIC项目,周期通常18个月到36个月。先进工艺更麻烦,架构、验证、物理实现、封装、软件栈、调试,任何一环出问题成本迅速放大。OpenAI和博通把周期压到了九个月。

这不能理解成芯片行业突然变简单。OpenAI没有凭空长出一条半导体产业链。博通在定制芯片和网络基础设施上经验深厚,Celestica负责板卡、机架和系统工程。

OpenAI真正贡献的是更稀缺的东西,它知道未来模型要怎么跑。

很多芯片公司做AI加速器,难点在于猜负载。模型结构会变,推理方式会变,服务模式会变。芯片一旦流片,物理世界没有软件世界那么好回滚。

OpenAI不用完全靠猜。每天运行ChatGPT、Codex和API,知道哪些内核最常用,哪些内存搬运最浪费,哪些网络瓶颈最影响集群效率,哪些延迟会直接伤害产品体验。它还知道未来Agent产品会怎么消耗推理资源。

这些经验以前只是后台工程知识,现在被写进芯片架构。

在OpenAI的官方新闻稿里有一句话很关键:OpenAI使用自己的模型加速了部分设计和优化流程。还说,提供给用户的模型也在帮助改进运行未来模型的基础设施。

GPT开始参与设计下一代GPT的机器。

过去几十年芯片的链条是,先设计芯片,芯片运行软件,软件运行AI。现在链条开始回头,AI帮助人类设计芯片,芯片再运行下一代AI。

一旦这个闭环成立,九个月可能只是开始。未来可能是六个月、三个月,甚至更密集的迭代。

芯片行业过去有自己的节奏,模型行业有自己的节奏。前者慢后者快。Jalapeño把两个节奏往一起拉。

这一步如果走通,OpenAI的飞轮会变得很吓人。更好的模型帮助设计更好的芯片,更好的芯片降低下一代模型运行成本,更低成本支撑更多用户和产品,更多用户和产品带来更多真实负载数据,这些数据再反过来定义下一代芯片。

这才是OpenAI真正想要的循环。

三、削减推理税,控制现金流

Jalapeño不是训练芯片,它面向的是大语言模型推理。这点很关键。

训练像造航母。一次投入巨大,需要极强的通用能力,需要不断适配新模型新架构新实验。训练市场仍然高度依赖英伟达,不只是GPU,而是CUDA、网络、系统、软件库、开发者生态整套平台。

推理更像出租车队。每天跑,每小时跑,每分钟跑。用户每提一个问题,API每响应一次,Agent每推进一步,都要发生推理。它更在意低延迟、低成本、高吞吐、高利用率。

训练烧阶段性大钱,推理烧日常现金流。

这也是AI公司走到商业化阶段后最头疼的问题。GPT训练一次很贵,但推理每天都在发生。Agent时代会继续放大这个问题,一次任务可能包含几十次甚至几百次模型调用。长上下文、链式推理、多模态生成、代码执行,都在继续推高Token消耗。

Jalapeño瞄准的就是这笔推理税。它更像OpenAI自己的TPU。Google、亚马逊、Meta、微软都走过类似路线,只要负载足够大,自研ASIC就有高性价比的经济意义。

OpenAI现在具备这个条件。有真实请求、有产品路线、有模型团队、有博通这样的产业伙伴,还有巨大的成本压力。

Jalapeño不需要对外出售也能证明价值。只要它让ChatGPT回答更便宜、让Codex跑得更快、让API毛利更高,它就有意义。

OpenAI还提到,Jalapeño会减少数据传输,平衡计算、内存和网络资源,让实际利用率更接近理论峰值。算力贵很多时候贵在没被充分用起来,GPU等待网络,内存搬运拖慢计算,调度不佳造成空转,所有浪费最后都变成电费和资本开支。

采购价只是第一层,系统效率才是最后的账。

四、OpenAI越来越像苹果

很多人会把Jalapeño理解成OpenAI挑战英伟达,但我觉得OpenAI并不想成为下一家英伟达,更像是在学苹果。

苹果最厉害的地方从来不是某一个单点。iPhone强,iOS强,A系列和M系列芯片强,App Store强。但苹果真正难打的地方,是这些东西被放在同一个闭环里。

芯片为系统优化,系统为应用优化,应用体验再反过来定义下一代芯片。这套闭环让苹果可以在同样电池、同样体积、同样散热约束下,做出别人很难复制的体验。

OpenAI正在搭类似的东西。模型是智能内核,ChatGPT是超级入口,Codex是开发工具,API是生态分发层,Jalapeño是自研芯片,数据中心是AI工厂。

OpenAI CEO Altman这两年反复谈芯片、能源、核聚变、数据中心,现在看可能压根不是在追概念,他已经不再用AI创业公司的方式规划OpenAI了。

如果说英伟达卖铲子,那么OpenAI想拥有矿山。

英伟达要做所有AI公司的工厂设备供应商,卖GPU、卖网络、卖系统、卖软件生态、卖AI工厂方案,理想客户是每一个需要生产Token的公司。

OpenAI想给自己建一套工厂,卖的不是设备,是最终生成出来的智能。

短期看,OpenAI离不开英伟达。训练和通用计算仍然需要GPU平台,Jalapeño也不可能很快覆盖全部负载。它大概率先进入OpenAI最确定、规模最大、优化收益最高的推理场景。

长期看,裂缝已经出现。当模型公司开始拥有自己的芯片路线图,英伟达的客户就不再只是客户。它们也会成为AI基础设施的另一类玩家。

版面之外的话

过去二十年,互联网最重要的资产是流量。谁掌握用户,谁掌握价值。

今天,AI时代正在出现新的规律。

模型越来越像流量,而计算越来越像土地。

模型会迭代,产品会变化,排行榜会不断刷新。但那些生产智能的工厂,芯片、网络、数据中心、能源,会越来越集中在少数玩家手里。

GPT开始设计GPT,看起来只是一次流片。

但它真正宣告的事情是:

OpenAI已经不满足于成为最聪明的公司,它想成为控制智能生产的公司。

本文来自微信公众号:版面之外,作者:画画

本文来自微信公众号:版面之外,作者:画画,题图来自:AI生成

Трендовые криптовалюты

CitreaCTR

wrapped stUSDTWSTUSDT

Velodrome FinanceVELODROME

BrevisBREV

ZRX（0X）ZRX

PancakeSwapCAKE

Связанные с этим вопросы

QOpenAI设计首款芯片Jalapeño最重要的意义是什么？

A最重要的意义并非直接挑战英伟达，而是标志着OpenAI不再满足于只做一家模型公司，它开始寻求控制生产智能的整个过程，从模型、芯片到数据中心和能源，构建完整的‘智能生产’闭环。

Q文章中提到AI行业的新账本是什么？它与传统视角有何不同？

A新的账本单位是‘Token’，而非服务器或GPU的采购价格。核心在于评估每个Token的生产成本、吞吐量和最终带来的收入，而不是仅仅关注硬件本身的购买成本。这反映了AI时代价值评估从硬件资产向智能产出的转变。

Q为什么说Jalapeño芯片的九个月流片周期非常关键？这背后体现了OpenAI什么优势？

A九个月的流片周期远快于传统高性能ASIC项目（通常18-36个月）。这体现了OpenAI的关键优势：它拥有运行海量真实AI负载（如ChatGPT）的经验，能精准预测未来模型的运行需求，从而高效指导芯片设计。它甚至用自身模型加速了部分芯片设计流程。

Q文章将OpenAI的自研芯片策略类比为哪家科技公司的模式？这种模式的核心是什么？

A文章将OpenAI的策略类比为苹果公司的模式。这种模式的核心在于构建软硬一体的闭环：芯片为系统和应用优化，极致的应用体验又反过来定义下一代芯片。OpenAI正试图整合模型（内核）、产品（入口）、API（生态）和自研芯片，形成类似的、难以复制的综合优势。

Q根据文章观点，在AI时代，‘模型’和‘计算’分别被比作什么？这预示着行业竞争焦点将如何演变？

A模型被比作会不断迭代变化的‘流量’，而计算（芯片、数据中心、能源等）被比作固定的‘土地’。这预示着行业竞争焦点将从单一的模型能力比拼，转向对底层智能生产基础设施（即‘土地’）的控制和拥有，后者将构成更长期、更稳固的壁垒。

Похожее

Маркировка Cardano как "призрачной цепи" опровергнута? Почему 34 dApps ADA не раскрывают полной картины

Термин «ghost chain» («цепь-призрак») относится к блокчейну с минимальной активностью и развитием. Хотя Cardano (ADA) обвиняют в этом из-за малого количества dApps (34 против 442 у Solana и 1564 у Ethereum) и значительно более низких показателей транзакций и пользователей, статья объясняет это архитектурными особенностями. Cardano использует модель EUTXO и механизмы батчинга (объединения транзакций), которые повышают детерминизм и безопасность, но при этом статистика «недооценивает» реальную активность в сети. При этом разработка на Cardano остается интенсивной. Автор приходит к выводу, что, несмотря на разрыв в метриках с другими ведущими блокчейнами (Ethereum, Solana, Tron), лишь одно это не является достаточным основанием для ярлыка «ghost chain», так как Cardano занимает свою нишу, делая акцент на научно обоснованный подход, безопасность и соответствие требованиям институциональных клиентов.

ambcrypto6 мин. назад

Маркировка Cardano как "призрачной цепи" опровергнута? Почему 34 dApps ADA не раскрывают полной картины

ambcrypto6 мин. назад

Запас Ethereum у Bitmine достиг $9,8 млрд: «Лучшие годы для криптовалют еще впереди»

Криптокомпания Bitmine Immersion Technologies увеличила свои запасы Ethereum (ETH) на 27 084 монеты за последнюю неделю. Теперь в её казне находится 5 700 040 ETH, что составляет 4,7% от общего предложения Ethereum и оценивается примерно в 9,01 млрд долларов по цене 1569 долларов за монету. Это произошло на фоне падения цены ETH и оттока средств из ETF-фондов Ethereum в июне. Несмотря на слабые рыночные условия и критику в адрес аналогичной стратегии накопления биткоинов компанией MicroStrategy, Bitmine продолжает агрессивно покупать ETH. Председатель Bitmine Том Ли считает, что текущая волатильность отчасти связана с «оконной отделкой» перед концом квартала, и выражает уверенность в будущем крипторынка. Компания подчеркивает свою устойчивость, отмечая ежегодный доход от стейкинга в размере около 211 млн долларов, наличие 555 млн долларов денежных средств и ликвидных ценных бумаг, а также включение в индекс Russell 1000. Ли заявил, что лучшие годы для криптовалют ещё впереди, и ожидает, что токенизация и прогресс в области искусственного интеллекта подстегнут спрос на блокчейн и децентрализованные криптоактивы.

ambcrypto1 ч. назад

Запас Ethereum у Bitmine достиг $9,8 млрд: «Лучшие годы для криптовалют еще впереди»

ambcrypto1 ч. назад

Claude и Codex, которыми вы пользуетесь каждый день, теперь нельзя использовать свободно внутри Meta

В мае Meta ввела внутренние ограничения на использование своих инженерами AI-инструментов Claude Code и Codex от Anthropic и OpenAI, несмотря на то, что является одним из крупнейших клиентов этих сервисов. Причина — не недостатки, а, наоборот, чрезмерная эффективность этих моделей. Компания разрабатывает собственного AI-ассистента для программирования MetaCode (ранее DevMate). Основная проблема, которую пытается решить Meta, — избежать «дистилляции знаний». Если данные, задачи или критерии оценки для обучения MetaCode будут созданы с помощью внешних моделей, то её собственный AI может начать копировать поведение и «знания» конкурентов, а не развивать оригинальные способности. Это стирает грань между независимо выработанными и заимствованными компетенциями. Внутренние правила запрещают использовать Claude или Codex для: 1. Генерации тестовых задач для MetaCode. 2. Поиска багов в исходном коде или анализа того, «что тестировать». 3. Размещения любого сгенерированного ими контента в среде, доступной для обучаемой модели. Разрешено применять эти инструменты только для вспомогательных задач, таких как настройка рабочих процессов или организация кода, при условии обязательной проверки человеком каждого результата. Эта ситуация отражает широкую отраслевую дилемму. Юридически «дистилляция» — использование выходных данных одной модели для обучения другой — в США не запрещена, но часто нарушает условия обслуживания компаний-разработчиков (как у OpenAI и Anthropic). Это создаёт значительные риски. Кроме того, переход на собственные решения поможет Meta сократить огромные расходы на внешние AI-сервисы, исчисляемые миллиардами долларов. Таким образом, Meta пытается балансировать, получая пользу от передовых внешних инструментов, но изолируя от них ключевые процессы разработки собственного AI. Этот кейс поднимает фундаментальный вопрос эпохи AI: когда системы помогают создавать себе подобных, всё сложнее определить, кому на самом деле принадлежат «знания» и способности итогового продукта.

marsbit1 ч. назад

Claude и Codex, которыми вы пользуетесь каждый день, теперь нельзя использовать свободно внутри Meta

marsbit1 ч. назад

Почему сегодня нам нужен подход к контенту на основе ИИ?

Недавно проект ИИ-анимации Amazon «Punky Duck» был остановлен из-за этических споров, что отражает дилемму ИИ в создании контента. Несмотря на быстрый рост ИИ-контента (например, полноценные фильмы к 2026 году и популярные короткие видео), его проникновение в традиционную киноиндустрию вызывает опасения по поводу замены человеческого творчества и утраты уникальных ценностей. В статье подчёркивается, что человеческое творчество обладает незаменимыми качествами: инновационность, трудозатраты и эмоциональная связь, основанная на личном опыте. В отличие от этого, ИИ лучше подходит для производства «культурного фастфуда» — короткого, шаблонного контента для развлечения, но не для глубокого художественного высказывания. Однако бесконтрольное развитие ИИ-контента несёт риски: удешевление производства может вытеснить авторов-людей, взрывной рост объёмов ведёт к снижению общего качества и «мусорному» контенту, а высокая скорость генерации усложняет контроль за соблюдением авторских прав и этических норм. Для регулирования этих процессов необходима новая концепция — «мировоззрение в отношении ИИ-контента», основанное на четырёх принципах: ИИ должен расширять, а не сужать пространство для человеческого творчества; уважать и защищать результаты труда людей, а не присваивать их; человек должен сохранять ведущую роль и нести ответственность в творческом процессе; процессы создания ИИ-контента должны быть прозрачными и понятными для пользователей и регуляторов. Ключевой вывод: в эпоху ИИ человек должен оставаться «рулевым» технологий. Цель — не безудержный технический прогресс, а гармоничное сосуществование, где технологии служат усилению человеческого творчества, защите культурных ценностей и обеспечению этичного развития контент-индустрии.

marsbit2 ч. назад

Почему сегодня нам нужен подход к контенту на основе ИИ?

marsbit2 ч. назад

Планка отозвали? Отец квантовой теории споткнулся об алгоритм

В цифровой базе Springer обнаружены две статьи Макса Планка, опубликованные в 1940 и 1942 годах в журнале *Die Naturwissenschaften*, помеченные как «отозванные» («retracted»). Расследование показало, что отзыв не связан с научной ошибкой или недобросовестностью, а является следствием автоматической обработки устаревшими алгоритмами платформы. Вероятно, системы распознали легитимные для той эпохи практики — переиздание речи в разных форматах или использование одинаковых заголовков в дискуссии — как «нарушение авторских прав» или «повторную публикацию» по современным нормам. В результате тексты статей на платформе заменены пустыми страницами, и для доступа к оригиналам необходимо обращаться к сторонним архивам, например, Internet Archive. Этот случай иллюстрирует проблему некритичного применения современных издательских и юридических стандартов к историческим научным материалам в процессе их оцифровки. Автоматизированные системы управления метаданными могут искажать контекст и ограничивать доступ к наследию, что особенно опасно в эпоху ИИ, когда алгоритмы формируют знание на основе подобных «отфильтрованных» данных. Инцидент ставит важные вопросы о сохранении целостности научной памяти в цифровую эпоху, контроле платформ над историческими архивами и рисках утраты контекста при обработке информации машинами.

marsbit2 ч. назад

Планка отозвали? Отец квантовой теории споткнулся об алгоритм

marsbit2 ч. назад

Торговля

Спот

Обсуждения

Добро пожаловать в Сообщество HTX. Здесь вы сможете быть в курсе последних новостей о развитии платформы и получить доступ к профессиональной аналитической информации о рынке. Мнения пользователей о цене на PEOPLE (PEOPLE) представлены ниже.

GPT设计GPT

Введение

Трендовые криптовалюты

Связанные с этим вопросы

Похожее

Маркировка Cardano как "призрачной цепи" опровергнута? Почему 34 dApps ADA не раскрывают полной картины

Запас Ethereum у Bitmine достиг $9,8 млрд: «Лучшие годы для криптовалют еще впереди»

Claude и Codex, которыми вы пользуетесь каждый день, теперь нельзя использовать свободно внутри Meta

Почему сегодня нам нужен подход к контенту на основе ИИ?

Планка отозвали? Отец квантовой теории споткнулся об алгоритм

Торговля

Популярные статьи

Как купить PEOPLE

Обсуждения

Топ вопросы

Популярные категории

Популярные теги