GPT设计GPT

marsbitPublié le 2026-06-25Dernière mise à jour le 2026-06-25

Résumé

OpenAI推出其首款自研芯片Jalapeño,这标志着公司不再满足于仅做一家模型公司,而是开始控制智能生产的全链条。当前,模型能力的领先窗口正在缩短,真正的长期壁垒已转向底层基础设施——算力、推理成本与能源效率。Jalapeño是一款面向大模型推理的芯片,旨在降低OpenAI自身产品的Token生成成本,尤其是日常的推理开销。 该芯片仅用九个月完成流片,其关键在于OpenAI将运行ChatGPT等产品的实际负载经验融入了芯片设计,甚至利用AI辅助优化设计流程,形成了“AI设计芯片,芯片运行下一代AI”的闭环。这不仅能提升系统效率、削减“推理税”,还可能加速迭代,形成强大的业务飞轮。 此举并非简单挑战英伟达,而是效仿苹果构建软硬一体闭环的战略。OpenAI正整合模型、产品、API、芯片与数据中心,目标是成为控制智能生产的“矿山”,直接出售智能本身,而非依赖外部算力平台。这预示着AI行业的竞争核心正从模型本身,转向拥有计算工厂与全栈控制力的少数玩家。

OpenAI终于做芯片了。

很多人看到这条新闻,第一反应是:英伟达麻烦了。

但我看到的恰恰相反。

首款芯片Jalapeño最重要的意义,并非直奔着英伟达而来。

这是OpenAI第一次公开承认,自己不满足于做一家模型公司了。

它想控制的,是生产智能的整个过程。

从模型,到芯片。从数据中心,到能源。从训练,到推理。从生产Token,到销售Token。

Jalapeño表面是一颗芯片,实际上更像一张路线图。

OpenAI终于把自己的野心摆到了桌面上。

一、模型差距在缩小,计算差距在扩大

自从大模型爆发以来,AI行业几乎所有注意力都在模型。

GPT-4出来行业被震一次,Claude追上来,Gemini追上来,DeepSeek把性价比打出来,Meta推开源。每次发布大家盯着同一组东西:参数、榜单、代码能力、数学能力、长上下文、多模态。

模型当然重要。但一个变化已经出现,模型领先的窗口正在变短。今天一个模型刚发布,几个月后开源社区、竞争对手、云厂商就会跟上。能力差距仍然存在,但越来越难独立构成长期壁垒。

真正拉开差距的东西,开始往更底层走。算力供应、推理成本、系统吞吐、网络能力、数据中心建设、能源获取。没有模型发布那么好看,也不会立刻刷屏。但它们决定一家AI公司能不能长期跑下去。

黄仁勋最近说了一句话:英伟达系统也许不是采购价格最低的,但能生成成本最低的Token、最高的Token吞吐量,最终带来最高收入。

老黄这段话很直接。行业一直抱怨英伟达贵,黄仁勋没在采购价上辩解,而是把问题换到另一个维度:别看买机器花多少钱,要看每个Token的生产成本。

这就是AI时代新的账本。服务器和GPU不是最终单位,Token才是。

OpenAI恰好站在这个问题最中心。

ChatGPT每天处理海量请求,Codex要消耗更多推理步骤,未来还有Agent、视频生成、机器人、长推理链。模型越有用,Token消耗越大。产品越成功,推理账单越厚。

残酷的地方在这里,OpenAI用户越多,英伟达越赚钱。OpenAI产品越强,底层算力税越重。

如果每一个Token都要经过外部硬件平台收一道税,OpenAI就很难拥有完整的护城河。它可以有最强模型,有超级入口,有开发者生态。但最核心的生产成本始终卡在别人手里。

Jalapeño的本质就在这里。OpenAI开始自己造Token工厂。

二、GPT开始设计GPT

Jalapeño这款芯片最容易被低估的细节,是九个月流片。

传统高性能ASIC项目,周期通常18个月到36个月。先进工艺更麻烦,架构、验证、物理实现、封装、软件栈、调试,任何一环出问题成本迅速放大。OpenAI和博通把周期压到了九个月。

这不能理解成芯片行业突然变简单。OpenAI没有凭空长出一条半导体产业链。博通在定制芯片和网络基础设施上经验深厚,Celestica负责板卡、机架和系统工程。

OpenAI真正贡献的是更稀缺的东西,它知道未来模型要怎么跑。

很多芯片公司做AI加速器,难点在于猜负载。模型结构会变,推理方式会变,服务模式会变。芯片一旦流片,物理世界没有软件世界那么好回滚。

OpenAI不用完全靠猜。每天运行ChatGPT、Codex和API,知道哪些内核最常用,哪些内存搬运最浪费,哪些网络瓶颈最影响集群效率,哪些延迟会直接伤害产品体验。它还知道未来Agent产品会怎么消耗推理资源。

这些经验以前只是后台工程知识,现在被写进芯片架构。

在OpenAI的官方新闻稿里有一句话很关键:OpenAI使用自己的模型加速了部分设计和优化流程。还说,提供给用户的模型也在帮助改进运行未来模型的基础设施。

GPT开始参与设计下一代GPT的机器。

过去几十年芯片的链条是,先设计芯片,芯片运行软件,软件运行AI。现在链条开始回头,AI帮助人类设计芯片,芯片再运行下一代AI。

一旦这个闭环成立,九个月可能只是开始。未来可能是六个月、三个月,甚至更密集的迭代。

芯片行业过去有自己的节奏,模型行业有自己的节奏。前者慢后者快。Jalapeño把两个节奏往一起拉。

这一步如果走通,OpenAI的飞轮会变得很吓人。更好的模型帮助设计更好的芯片,更好的芯片降低下一代模型运行成本,更低成本支撑更多用户和产品,更多用户和产品带来更多真实负载数据,这些数据再反过来定义下一代芯片。

这才是OpenAI真正想要的循环。

三、削减推理税,控制现金流

Jalapeño不是训练芯片,它面向的是大语言模型推理。这点很关键。

训练像造航母。一次投入巨大,需要极强的通用能力,需要不断适配新模型新架构新实验。训练市场仍然高度依赖英伟达,不只是GPU,而是CUDA、网络、系统、软件库、开发者生态整套平台。

推理更像出租车队。每天跑,每小时跑,每分钟跑。用户每提一个问题,API每响应一次,Agent每推进一步,都要发生推理。它更在意低延迟、低成本、高吞吐、高利用率。

训练烧阶段性大钱,推理烧日常现金流。

这也是AI公司走到商业化阶段后最头疼的问题。GPT训练一次很贵,但推理每天都在发生。Agent时代会继续放大这个问题,一次任务可能包含几十次甚至几百次模型调用。长上下文、链式推理、多模态生成、代码执行,都在继续推高Token消耗。

Jalapeño瞄准的就是这笔推理税。它更像OpenAI自己的TPU。Google、亚马逊、Meta、微软都走过类似路线,只要负载足够大,自研ASIC就有高性价比的经济意义。

OpenAI现在具备这个条件。有真实请求、有产品路线、有模型团队、有博通这样的产业伙伴,还有巨大的成本压力。

Jalapeño不需要对外出售也能证明价值。只要它让ChatGPT回答更便宜、让Codex跑得更快、让API毛利更高,它就有意义。

OpenAI还提到,Jalapeño会减少数据传输,平衡计算、内存和网络资源,让实际利用率更接近理论峰值。算力贵很多时候贵在没被充分用起来,GPU等待网络,内存搬运拖慢计算,调度不佳造成空转,所有浪费最后都变成电费和资本开支。

采购价只是第一层,系统效率才是最后的账。

四、OpenAI越来越像苹果

很多人会把Jalapeño理解成OpenAI挑战英伟达,但我觉得OpenAI并不想成为下一家英伟达,更像是在学苹果。

苹果最厉害的地方从来不是某一个单点。iPhone强,iOS强,A系列和M系列芯片强,App Store强。但苹果真正难打的地方,是这些东西被放在同一个闭环里。

芯片为系统优化,系统为应用优化,应用体验再反过来定义下一代芯片。这套闭环让苹果可以在同样电池、同样体积、同样散热约束下,做出别人很难复制的体验。

OpenAI正在搭类似的东西。模型是智能内核,ChatGPT是超级入口,Codex是开发工具,API是生态分发层,Jalapeño是自研芯片,数据中心是AI工厂。

OpenAI CEO Altman这两年反复谈芯片、能源、核聚变、数据中心,现在看可能压根不是在追概念,他已经不再用AI创业公司的方式规划OpenAI了。

如果说英伟达卖铲子,那么OpenAI想拥有矿山。

英伟达要做所有AI公司的工厂设备供应商,卖GPU、卖网络、卖系统、卖软件生态、卖AI工厂方案,理想客户是每一个需要生产Token的公司。

OpenAI想给自己建一套工厂,卖的不是设备,是最终生成出来的智能。

短期看,OpenAI离不开英伟达。训练和通用计算仍然需要GPU平台,Jalapeño也不可能很快覆盖全部负载。它大概率先进入OpenAI最确定、规模最大、优化收益最高的推理场景。

长期看,裂缝已经出现。当模型公司开始拥有自己的芯片路线图,英伟达的客户就不再只是客户。它们也会成为AI基础设施的另一类玩家。

版面之外的话

过去二十年,互联网最重要的资产是流量。谁掌握用户,谁掌握价值。

今天,AI时代正在出现新的规律。

模型越来越像流量,而计算越来越像土地。

模型会迭代,产品会变化,排行榜会不断刷新。但那些生产智能的工厂,芯片、网络、数据中心、能源,会越来越集中在少数玩家手里。

GPT开始设计GPT,看起来只是一次流片。

但它真正宣告的事情是:

OpenAI已经不满足于成为最聪明的公司,它想成为控制智能生产的公司。

本文来自微信公众号:版面之外,作者:画画

本文来自微信公众号:版面之外,作者:画画,题图来自:AI生成

Cryptos en tendance

Questions liées

QOpenAI设计首款芯片Jalapeño最重要的意义是什么?

A最重要的意义并非直接挑战英伟达,而是标志着OpenAI不再满足于只做一家模型公司,它开始寻求控制生产智能的整个过程,从模型、芯片到数据中心和能源,构建完整的‘智能生产’闭环。

Q文章中提到AI行业的新账本是什么?它与传统视角有何不同?

A新的账本单位是‘Token’,而非服务器或GPU的采购价格。核心在于评估每个Token的生产成本、吞吐量和最终带来的收入,而不是仅仅关注硬件本身的购买成本。这反映了AI时代价值评估从硬件资产向智能产出的转变。

Q为什么说Jalapeño芯片的九个月流片周期非常关键?这背后体现了OpenAI什么优势?

A九个月的流片周期远快于传统高性能ASIC项目(通常18-36个月)。这体现了OpenAI的关键优势:它拥有运行海量真实AI负载(如ChatGPT)的经验,能精准预测未来模型的运行需求,从而高效指导芯片设计。它甚至用自身模型加速了部分芯片设计流程。

Q文章将OpenAI的自研芯片策略类比为哪家科技公司的模式?这种模式的核心是什么?

A文章将OpenAI的策略类比为苹果公司的模式。这种模式的核心在于构建软硬一体的闭环:芯片为系统和应用优化,极致的应用体验又反过来定义下一代芯片。OpenAI正试图整合模型(内核)、产品(入口)、API(生态)和自研芯片,形成类似的、难以复制的综合优势。

Q根据文章观点,在AI时代,‘模型’和‘计算’分别被比作什么?这预示着行业竞争焦点将如何演变?

A模型被比作会不断迭代变化的‘流量’,而计算(芯片、数据中心、能源等)被比作固定的‘土地’。这预示着行业竞争焦点将从单一的模型能力比拼,转向对底层智能生产基础设施(即‘土地’)的控制和拥有,后者将构成更长期、更稳固的壁垒。

Lectures associées

Le label 'chaîne fantôme' de Cardano démystifié ? Pourquoi les 34 dApps d'ADA ne racontent pas toute l'histoire

L'article traite de l'étiquette de "chaîne fantôme" parfois attribuée à Cardano (ADA) en raison de son activité on-chain et de son nombre d'applications décentralisées (dApps) nettement inférieurs à ceux de ses principaux concurrents comme Ethereum et Solana. L'auteur définit d'abord une "chaîne fantôme" comme une blockchain techniquement opérationnelle mais avec très peu d'activité et de développement. Il passe ensuite en revue les forces des principales blockchains de couche 1 : Ethereum pour la DeFi, XRP pour les règlements transfrontaliers, Solana pour le débit, Tron pour les transferts USDT et Bitcoin comme réserve de valeur. Concernant Cardano, l'article reconnaît des signes de faiblesse : la fermeture de l'explorateur TapTools, des avertissements sur la possible disparition de projets et seulement 34 dApps. Cependant, il souligne que son activité de développement reste forte. L'explication principale avancée pour justifier le faible nombre de transactions et d'utilisateurs actifs est le modèle technique unique de Cardano, l'EUTXO (Extended Unspent Transaction Output), qui regroupe (batch) les transactions. Cette fonctionnalité, bien qu'avantageuse pour la sécurité et la détermination, sous-estime l'activité réelle sur la chaîne. La conclusion est que si Cardano affiche des métriques d'activité bien inférieures, son modèle technique spécifique et son approche méthodique axée sur la sécurité et la durabilité l'empêchent d'être simplement catalogué comme une "chaîne fantôme". Chaque blockchain sacrifie certains aspects du trilemme (décentralisation, sécurité, évolutivité) pour se spécialiser dans un créneau.

ambcryptoIl y a 4 mins

Le label 'chaîne fantôme' de Cardano démystifié ? Pourquoi les 34 dApps d'ADA ne racontent pas toute l'histoire

ambcryptoIl y a 4 mins

UK FCA dévoile son livre de règles pour les cryptomonnaies : Approche basée sur les risques débutant en octobre 2027

Le régulateur financier britannique (FCA) a dévoilé un nouveau cadre réglementaire pour le secteur de la cryptomonnaie, qui entrera en vigueur en octobre 2027. Plutôt qu’une approche uniforme, cette réglementation adopte une méthode basée sur les risques : les entreprises devront détenir des capitaux proportionnés à leur exposition au risque et réaliser leurs propres tests de résistance annuels. Les petites structures et celles présentant moins de risques bénéficieront d’obligations de déclaration allégées pour réduire leurs coûts de conformité. La FCA supervisera les évaluations des entreprises sans imposer de règles identiques à toutes, dans le but de renforcer la confiance sur le marché et d’attirer 3 à 4 millions d’utilisateurs supplémentaires au Royaume-Uni. Concernant les stablecoins, le cadre maintient des protections pour les consommateurs – comme la détention des réserves sous un trust légal – tout en assouplissant certaines exigences. Les émetteurs jugés systémiques pourraient toutefois faire face à une surveillance renforcée. Cette initiative vise à offrir une clarté réglementaire tout en tenant compte des spécificités du secteur, bien que certains acteurs alertent sur les risques d’appliquer des règles conçues pour la finance traditionnelle à des infrastructures décentralisées.

ambcryptoIl y a 1 h

UK FCA dévoile son livre de règles pour les cryptomonnaies : Approche basée sur les risques débutant en octobre 2027

ambcryptoIl y a 1 h

Les outils que vous utilisez tous les jours, Claude et Codex, sont maintenant limités en interne chez Meta

Meta, l'un des plus grands clients de Claude Code et Codex, a imposé en mai des restrictions internes à l'utilisation de ces assistants de programmation IA, malgré leur utilisation intensive. Ces limites, toujours en vigueur, visent à prévenir le "piège de la distillation", où les sorties des modèles concurrents pourraient contaminer les données d'entraînement et d'évaluation de MetaCode, l'assistant IA maison en développement. L'objectif est de protéger l'intégrité du processus d'apprentissage de MetaCode. Les directives interdisent spécifiquement d'utiliser Claude ou Codex pour générer des tests, corriger des bogues ou évaluer des performances, car cela impliquerait que MetaCode apprenne les "compétences" ou les standards de jugement de ses concurrents. Seules les tâches auxiliaires comme l'organisation du code sont autorisées, sous supervision humaine stricte. Cette démarche reflète une préoccupation industrielle plus large : lorsqu'une IA est utilisée pour en créer une autre, la frontière entre les capacétés développées indépendamment et celles dérivées d'un modèle concurrent devient floue. Meta cherche ainsi à éviter tout risque contractuel et à réduire sa dépendance et ses coûts face à des outils externes onéreux, tout en naviguant sur la ligne fine entre bénéficier de technologies avancées et préserver l'autonomie de son propre développement IA.

marsbitIl y a 1 h

Les outils que vous utilisez tous les jours, Claude et Codex, sont maintenant limités en interne chez Meta

marsbitIl y a 1 h

Planck a-t-il été rétracté ? Le père de la mécanique quantique trébuche sur un algorithme

Une récente découverte a révélé que deux articles du physicien légendaire Max Planck, publiés en 1940 et 1942 dans la revue allemande *Die Naturwissenschaften*, étaient marqués comme « retirés » (retracted) sur la plateforme numérique de Springer. Cette situation étonnante n'est pas due à une fraude ou une erreur scientifique, mais semble être le résultat d'un traitement automatique inapproprié par des algorithmes de l'éditeur. Les articles en question, de nature plutôt philosophique, s'inscrivaient dans les pratiques de diffusion courantes de l'époque, comme la republication d'un discours sous différents formats. Cependant, les systèmes modernes de gestion des droits d'auteur et de détection de duplication les ont probablement identifiés à tort comme des cas de « republication non autorisée » ou de violation de copyright. Conséquence frappante : sur le site de Springer, les textes originaux ont été remplacés par des pages vides, rendant les documents inaccessibles via cette source officielle. Cet incident met en lumière les risques de distorsion historique lorsque les archives scientifiques du passé sont traitées par les infrastructures numériques et les règles commerciales contemporaines. Il soulève des questions cruciales sur la préservation fidèle de la mémoire scientifique à l'ère du numérique et de l'IA, où de tels marquages erronés pourraient être perpétués et amplifiés par les futurs systèmes d'information.

marsbitIl y a 2 h

Planck a-t-il été rétracté ? Le père de la mécanique quantique trébuche sur un algorithme

marsbitIl y a 2 h

Trading

Spot

Articles tendance

Comment acheter PEOPLE

Bienvenue sur HTX.com ! Nous vous permettons d'acheter ConstitutionDAO (PEOPLE) de manière simple et pratique. Suivez notre guide étape par étape pour commencer votre parcours crypto.Étape 1 : Création de votre compte HTXUtilisez votre adresse e-mail ou votre numéro de téléphone pour ouvrir un compte sur HTX gratuitement. L'inscription se fait en toute simplicité et débloque toutes les fonctionnalités.Créer mon compteÉtape 2 : Choix du mode de paiement (rubrique Acheter des cryptosCarte de crédit/débit : utilisez votre carte Visa ou Mastercard pour acheter instantanément ConstitutionDAO (PEOPLE).Solde :utilisez les fonds du solde de votre compte HTX pour trader en toute simplicité.Prestataire tiers :pour accroître la commodité d'utilisation, nous avons ajouté des modes de paiement populaires tels que Google Pay et Apple Pay.P2P :tradez directement avec d'autres utilisateurs sur HTX.OTC (de gré à gré) : nous offrons des services personnalisés et des taux de change compétitifs aux traders.Étape 3 : stockage de vos ConstitutionDAO (PEOPLE)Après avoir acheté vos ConstitutionDAO (PEOPLE), stockez-les sur votre compte HTX. Vous pouvez également les envoyer ailleurs via un transfert sur la blockchain ou les utiliser pour trader d'autres cryptos.Étape 4 : tradez des ConstitutionDAO (PEOPLE)Tradez facilement ConstitutionDAO (PEOPLE) sur le marché Spot de HTX. Il vous suffit d'accéder à votre compte, de sélectionner la paire de trading, d'exécuter vos trades et de les suivre en temps réel. Nous offrons une expérience conviviale aux débutants comme aux traders chevronnés.

574 vues totalesPublié le 2024.12.12Mis à jour le 2026.06.02

Comment acheter PEOPLE

Discussions

Bienvenue dans la Communauté HTX. Ici, vous pouvez vous tenir informé(e) des derniers développements de la plateforme et accéder à des analyses de marché professionnelles. Les opinions des utilisateurs sur le prix de PEOPLE (PEOPLE) sont présentées ci-dessous.

活动图片