GPT conçoit GPT

marsbit發佈於 2026-06-25更新於 2026-06-25

文章摘要

OpenAI a dévoilé son premier puce, Jalapeño, destinée à l'inférence des grands modèles linguistiques. Ce mouvement ne vise pas principalement à concurrencer Nvidia, mais marque une étape stratégique où OpenAI cherche à maîtriser l'ensemble du processus de production de l'intelligence artificielle, des modèles aux puces, en passant par les centres de données et l'énergie. Alors que l'écart entre les modèles se réduit, le vrai fossé se creuse au niveau de la puissance de calcul, des coûts d'inférence et de l'efficacité système. Chaque jeton (Token) généré représente un coût, et OpenAI, avec ses produits à forte demande comme ChatGPT, supporte une « taxe de calcul » importante sur le matériel externe. Jalapeño est conçu pour réduire cette « taxe d'inférence » en optimisant les coûts opérationnels quotidiens. Un détail crucial est le cycle de conception de seulement neuf mois, accéléré par l'utilisation par OpenAI de ses propres modèles d'IA pour aider à concevoir et optimiser la puce. Cela crée un cycle vertueux : de meilleurs modèles conçoivent de meilleures puces, qui réduisent le coût d'exécution des modèles futurs, permettant plus d'utilisateurs et de données pour affiner les prochaines générations de puces. OpenAI ne cherche pas à devenir un fournisseur de matériel comme Nvidia. Son approche s'apparente plutôt à celle d'Apple : construire un écosystème fermé et intégré où les modèles, les produits (ChatGPT, API), les puces et les infrastructures sont optimisés conjointem...

OpenAI se lance enfin dans les puces.

En voyant cette nouvelle, la première réaction de beaucoup est : Nvidia est dans l'embarras.

Mais ce que je vois, c'est exactement l'inverse.

La signification la plus importante de la première puce, Jalapeño, n'est pas de s'en prendre directement à Nvidia.

C'est la première fois qu'OpenAI reconnaît publiquement qu'il n'est pas satisfait d'être simplement une entreprise de modèles.

Il veut contrôler l'ensemble du processus de production de l'intelligence.

Du modèle, à la puce. Du centre de données, à l'énergie. De l'entraînement, à l'inférence. De la production de Token, à la vente de Token.

Jalapeño est en surface une puce, mais en réalité, il ressemble plus à une feuille de route.

OpenAI a enfin mis ses ambitions sur la table.

I. L'écart des modèles se réduit, l'écart de calcul s'élargit

Depuis l'explosion des grands modèles, presque toute l'attention de l'industrie de l'IA s'est portée sur les modèles.

L'arrivée de GPT-4 a secoué l'industrie une fois, puis Claude a rattrapé son retard, Gemini l'a rattrapé, DeepSeek a proposé un meilleur rapport qualité-prix, Meta a promu l'open source. À chaque sortie, tout le monde regarde le même ensemble de choses : paramètres, classements, capacités en code, capacités mathématiques, contexte long, multimodalité.

Le modèle est bien sûr important. Mais un changement est apparu : la fenêtre de leadership des modèles se raccourcit. Aujourd'hui, un modèle vient à peine de sortir, et quelques mois plus tard, la communauté open source, les concurrents, les fournisseurs de cloud le rattrapent. Un écart de capacités existe toujours, mais il devient de plus en plus difficile de constituer à lui seul une barrière à long terme.

Ce qui crée vraiment l'écart commence à descendre vers des couches plus profondes. L'approvisionnement en puissance de calcul, le coût de l'inférence, le débit du système, la capacité réseau, la construction de centres de données, l'accès à l'énergie. C'est moins spectaculaire qu'une sortie de modèle et ne fera pas immédiatement le buzz. Mais ils déterminent si une entreprise d'IA peut tenir sur la durée.

Jensen Huang a récemment dit ceci : le système Nvidia n'est peut-être pas le moins cher à l'achat, mais il peut générer le Token au coût le plus bas, le plus haut débit de Token, et finalement générer les revenus les plus élevés.

La déclaration de Jensen est très directe. L'industrie se plaint depuis toujours que Nvidia est cher. Jensen Huang ne se justifie pas sur le prix d'achat, mais place le problème sur une autre dimension : ne regardez pas combien vous dépensez pour acheter les machines, regardez le coût de production de chaque Token.

C'est le nouveau livre de comptes de l'ère de l'IA. Les serveurs et les GPU ne sont pas l'unité finale, le Token l'est.

OpenAI se trouve justement au centre de ce problème.

ChatGPT traite des quantités massives de requêtes chaque jour, Codex consomme encore plus d'étapes d'inférence, et à l'avenir, il y aura les Agents, la génération vidéo, les robots, les chaînes de raisonnement longues. Plus le modèle est utile, plus la consommation de Token est grande. Plus le produit est réussi, plus la facture d'inférence est lourde.

L'endroit cruel est ici : plus OpenAI a d'utilisateurs, plus Nvidia gagne d'argent. Plus le produit d'OpenAI est puissant, plus la taxe de calcul sous-jacente est lourde.

Si chaque Token doit passer par une plateforme matérielle externe qui prélève une taxe, OpenAI aura du mal à posséder un avantage compétitif complet. Il peut avoir le modèle le plus fort, le super portail d'entrée, l'écosystème de développeurs. Mais le coût de production le plus fondamental reste toujours entre les mains d'autrui.

C'est l'essence de Jalapeño. OpenAI commence à construire sa propre usine de Tokens.

II. GPT commence à concevoir GPT

Le détail le plus sous-estimé de la puce Jalapeño est son cycle de fabrication de neuf mois.

Les projets d'ASIC haute performance traditionnels ont généralement un cycle de 18 à 36 mois. Les processus avancés sont encore plus problématiques : architecture, vérification, implémentation physique, packaging, pile logicielle, débogage. Si un problème survient à n'importe quelle étape, le coût augmente rapidement. OpenAI et Broadcom ont réduit le cycle à neuf mois.

Cela ne doit pas être compris comme une soudaine simplification de l'industrie des semi-conducteurs. OpenAI n'a pas fait apparaître une chaîne d'approvisionnement en semi-conducteurs de nulle part. Broadcom a une expérience approfondie dans les puces sur mesure et l'infrastructure réseau, Celestica s'occupe des cartes, des baies et de l'ingénierie système.

La véritable contribution d'OpenAI est quelque chose de plus rare : il sait comment les futurs modèles vont fonctionner.

De nombreuses sociétés de semi-conducteurs fabriquent des accélérateurs d'IA. La difficulté est de deviner la charge de travail. La structure des modèles va changer, la manière de raisonner va changer, les modes de service vont changer. Une fois la puce fabriquée, le monde physique n'offre pas la même facilité de retour en arrière que le monde logiciel.

OpenAI n'a pas besoin de deviner complètement. En exécutant ChatGPT, Codex et l'API quotidiennement, il sait quels noyaux sont les plus utilisés, quels transferts de mémoire sont les plus gaspilleurs, quels goulots d'étranglement réseau affectent le plus l'efficacité du cluster, quels délais nuisent directement à l'expérience produit. Il sait aussi comment les futurs produits de type Agent vont consommer les ressources d'inférence.

Cette expérience n'était auparavant qu'une connaissance d'ingénierie en arrière-plan. Maintenant, elle est écrite dans l'architecture de la puce.

Dans le communiqué de presse officiel d'OpenAI, une phrase est cruciale : OpenAI a utilisé ses propres modèles pour accélérer une partie du processus de conception et d'optimisation. Il est également dit que les modèles fournis aux utilisateurs aident également à améliorer l'infrastructure qui exécutera les futurs modèles.

GPT commence à participer à la conception de la machine de la prochaine génération de GPT.

Au cours des dernières décennies, la chaîne des puces était la suivante : concevoir d'abord la puce, la puce exécute le logiciel, le logiciel exécute l'IA. Maintenant, la chaîne commence à revenir en arrière : l'IA aide l'humain à concevoir la puce, la puce exécute la prochaine génération d'IA.

Une fois cette boucle fermée établie, neuf mois ne sont peut-être qu'un début. À l'avenir, cela pourrait être six mois, trois mois, voire des itérations encore plus rapprochées.

L'industrie des semi-conducteurs avait son propre rythme, l'industrie des modèles avait son propre rythme. Le premier est lent, le second rapide. Jalapeño rapproche ces deux rythmes.

Si cette étape est franchie, la roue d'inertie d'OpenAI deviendra effrayante. De meilleurs modèles aident à concevoir de meilleures puces, de meilleures puces réduisent le coût d'exécution de la prochaine génération de modèles, des coûts plus bas soutiennent davantage d'utilisateurs et de produits, plus d'utilisateurs et de produits génèrent plus de données de charge de travail réelles, ces données définissent à leur tour la prochaine génération de puces.

C'est le véritable cycle qu'OpenAI veut.

III. Réduire la taxe d'inférence, contrôler les flux de trésorerie

Jalapeño n'est pas une puce d'entraînement, elle est destinée à l'inférence des grands modèles de langage. Ce point est crucial.

L'entraînement, c'est comme construire un porte-avions. Un investissement unique est énorme, nécessite une capacité de généralisation extrêmement forte, doit s'adapter constamment à de nouveaux modèles, architectures et expériences. Le marché de l'entraînement dépend encore fortement de Nvidia, pas seulement des GPU, mais de l'ensemble de la plateforme : CUDA, réseau, système, bibliothèques logicielles, écosystème de développeurs.

L'inférence ressemble plus à une flotte de taxis. Elle tourne tous les jours, toutes les heures, toutes les minutes. Chaque fois qu'un utilisateur pose une question, que l'API répond, qu'un Agent progresse d'un pas, une inférence se produit. Elle se soucie davantage de la faible latence, du faible coût, du haut débit, du haut taux d'utilisation.

L'entraînement brûle de grosses sommes d'argent ponctuelles, l'inférence brûle les flux de trésorerie quotidiens.

C'est aussi le problème le plus épineux pour les entreprises d'IA arrivées au stade de la commercialisation. L'entraînement de GPT coûte cher une fois, mais l'inférence se produit tous les jours. L'ère des Agents va continuer à amplifier ce problème, une seule tâche peut contenir des dizaines, voire des centaines d'appels au modèle. Le contexte long, le raisonnement en chaîne, la génération multimodale, l'exécution de code continuent de pousser à la hausse la consommation de Token.

Jalapeño vise précisément cette taxe d'inférence. Il ressemble plus au TPU propre d'OpenAI. Google, Amazon, Meta, Microsoft ont tous suivi des voies similaires. Dès que la charge de travail est suffisamment importante, les ASIC développés en interne prennent un sens économique en termes de rapport qualité-prix.

OpenAI a maintenant ces conditions. Il a des requêtes réelles, une feuille de route produit, une équipe de modèles, des partenaires industriels comme Broadcom, et une énorme pression sur les coûts.

Jalapeño n'a pas besoin d'être vendu à l'extérieur pour prouver sa valeur. S'il permet à ChatGPT de répondre moins cher, à Codex de fonctionner plus vite, à l'API d'avoir une marge bénéficiaire plus élevée, alors il a un sens.

OpenAI mentionne également que Jalapeño réduira le transfert de données, équilibrera les ressources de calcul, de mémoire et de réseau, rapprochant ainsi le taux d'utilisation réel du pic théorique. La puissance de calcul est chère souvent parce qu'elle n'est pas pleinement utilisée : le GPU attend le réseau, les transferts de mémoire ralentissent le calcul, une mauvaise planification crée du temps mort, tous ces gaspillages finissent par se transformer en factures d'électricité et dépenses en capital.

Le prix d'achat n'est que la première couche, l'efficacité du système est le compte final.

IV. OpenAI ressemble de plus en plus à Apple

Beaucoup interpréteront Jalapeño comme un défi d'OpenAI envers Nvidia, mais je pense qu'OpenAI ne veut pas devenir le prochain Nvidia, il s'inspire plutôt d'Apple.

La force d'Apple n'a jamais résidé dans un point unique. L'iPhone est fort, iOS est fort, les puces de la série A et M sont fortes, l'App Store est fort. Mais l'endroit où Apple est vraiment difficile à battre, c'est que toutes ces choses sont placées dans la même boucle fermée.

La puce est optimisée pour le système, le système est optimisé pour les applications, l'expérience des applications définit à son tour la prochaine génération de puces. Cette boucle fermée permet à Apple de créer, sous les mêmes contraintes de batterie, de volume et de dissipation thermique, une expérience difficile à reproduire par d'autres.

OpenAI est en train de construire quelque chose de similaire. Le modèle est le noyau d'intelligence, ChatGPT est le super portail d'entrée, Codex est l'outil de développement, l'API est la couche de distribution de l'écosystème, Jalapeño est la puce développée en interne, le centre de données est l'usine d'IA.

Le PDG d'OpenAI, Altman, a beaucoup parlé ces deux dernières années de puces, d'énergie, de fusion nucléaire, de centres de données. Maintenant, on peut voir qu'il ne poursuit peut-être pas simplement des concepts, il ne planifie plus OpenAI comme une startup d'IA.

Si Nvidia vend des pelles, alors OpenAI veut posséder la mine.

Nvidia veut être le fournisseur d'équipements d'usine pour toutes les entreprises d'IA, vendre des GPU, des réseaux, des systèmes, un écosystème logiciel, des solutions d'usines d'IA. Le client idéal est chaque entreprise qui a besoin de produire des Tokens.

OpenAI veut se construire sa propre usine, ne vend pas les équipements, mais l'intelligence finalement générée.

À court terme, OpenAI ne peut pas se passer de Nvidia. L'entraînement et le calcul général ont toujours besoin de la plateforme GPU, et Jalapeño ne pourra pas couvrir rapidement toutes les charges de travail. Il entrera probablement d'abord dans les scénarios d'inférence les plus certains, les plus importants en taille et offrant le plus grand bénéfice d'optimisation pour OpenAI.

À long terme, une fissure est apparue. Lorsque les entreprises de modèles commencent à avoir leur propre feuille de route pour les puces, les clients de Nvidia ne sont plus seulement des clients. Ils deviennent également un autre type de joueur dans l'infrastructure d'IA.

Paroles hors de la page

Au cours des vingt dernières années, l'actif le plus important d'Internet était le trafic. Celui qui contrôlait les utilisateurs contrôlait la valeur.

Aujourd'hui, une nouvelle règle émerge dans l'ère de l'IA.

Les modèles ressemblent de plus en plus au trafic, et le calcul ressemble de plus en plus à la terre.

Les modèles vont itérer, les produits vont changer, les classements vont être constamment rafraîchis. Mais ces usines de production d'intelligence, les puces, le réseau, les centres de données, l'énergie, vont se concentrer de plus en plus entre les mains de quelques acteurs.

Le fait que GPT commence à concevoir GPT semble n'être qu'une fabrication de puce.

Mais ce qu'il annonce vraiment, c'est :

OpenAI n'est plus satisfait d'être l'entreprise la plus intelligente, il veut devenir l'entreprise qui contrôle la production d'intelligence.

Cet article provient du compte public WeChat :Hors de la page, Auteur : Huahua

Cet article provient du compte public WeChat :Hors de la page, Auteur : Huahua, Image du titre : générée par IA

你可能也喜歡

狗狗币未平仓合约徘徊在9.59亿美元左右，交易者等待复苏信号

狗狗币（DOGE）衍生品未平仓合约维持在约9.59亿美元，这一数据出现在周末交易相对清淡的时期。未平仓合约本身并不直接预示价格方向，它仅表明市场中存在大量持仓。要判断这些持仓是支撑复苏还是带来风险，交易者需结合价格走势、资金费率、成交量及清算水平进行分析。目前，这一数据说明狗狗币的衍生品市场仍然活跃。狗狗币作为受市场情绪和散户风险偏好影响较大的资产，高未平仓合约在价格疲软时可能加剧波动，而在价格上涨时则可能放大涨幅。关键的复苏信号取决于DOGE能否在衍生品兴趣之外，吸引真正的现货买盘。杠杆可以加速价格变动，但无法替代实际需求。总而言之，狗狗币尚未给出明确的复苏信号，但衍生品市场的参与度依然较高。这意味着接下来的价格确认动作可能比表面上的平静更为重要。投资者应将其视为一个需要密切监控的信号，并等待价格、资金流及整体市场行为的后续确认。

bitcoinist39 分鐘前

bitcoinist39 分鐘前

格兰特·卡多恩将比特币持仓增至2700枚——为何是现在？

Grant Cardone旗下的Cardone Capital在市场低迷期增持比特币，持仓量增至约2700枚BTC，平均购买价格为59,000美元。尽管没有公开文件独立证实这一持仓规模，但按当前价格计算其价值约1.59亿美元。此次买入发生在比特币价格处于近期波动区间低位、年内已下跌约32%的背景下，Cardone视其为积累机会。与此同时，最大企业持仓者MicroStrategy（持有约847,363枚BTC）却改变了策略，首次正式授权可出售最多12.5亿美元的比特币以筹措资金，这打破了其长期“永不卖出”的承诺。六月，美国现货比特币ETF遭遇创纪录的净流出，约40.6亿美元被赎回，加剧了市场抛压。技术分析显示，比特币周线图上的布林带下轨（绿色线）目前提供了支撑，该位置历史上曾多次引发价格反弹，暗示市场可能正在接近阶段性底部。

ambcrypto1 小時前

ambcrypto1 小時前

AI 时代，比特币还剩什么呢？

作者认为，在AI时代，信息生成成本趋近于零，导致真实与虚假内容难以辨别，“可验证性”变得稀缺。与此对比，比特币虽然因能耗高被诟病，但其本质是消耗能源来确保账本历史的不可篡改，从而提供一种不依赖任何中心化信任、仅靠数学与全网节点即可验证的机制。文章将AI比作降低“创造”成本的现代印刷机，而区块链（如比特币）则像降低“验证”成本的复式记账法。两者并非竞争关系：AI负责高效生成内容，区块链负责为数字资产与记录提供去中心化的验证基础。因此，比特币可被视为一台“制造可验证性的机器”。在AI生成内容泛滥的未来，独立验证的事实可能成为新的价值所在。

链捕手1 小時前

链捕手1 小時前

Bitmine以太坊储备增至98亿美元："加密货币最好的年份尚未到来"

比特浸入科技（Bitmine Immersion Technologies）近期再次成为头条，其在一周内增持了27,084枚以太坊（ETH）。这使得其以太坊总持有量达到5,700,040枚，按每枚1,569美元计算，价值约90.1亿美元，占以太坊总供应量的4.7%。此次增持发生在以太坊价格从约1780美元下跌至1578.54美元（撰稿时）的一周内。同时，根据SoSo Value数据，以太坊ETF在整个六月大部分时间出现资金外流，总额达5.0139亿美元。针对疲软的市场状况，比特浸入科技董事长汤姆·李（Tom Lee）表示，近期市场对加密货币投资者颇具挑战，并指出临近季度末的“粉饰橱窗”行为导致投资者减持过去三个月表现不佳的资产是常见现象。此外，迈克尔·赛勒（Michael Saylor）的公司Strategy正面临持续审查，据报道其持有约140亿美元未实现亏损，而其普通股和优先股价格均跌破100美元水平，引发加密社区部分人士建议其停止扩张比特币持仓。由于比特浸入科技常被称为“以太坊的Strategy”，市场担忧其持续的以太坊积累行为可能面临类似困境与批评。目前上市公司共持有价值约749.4亿美元的比特币和114.8亿美元的以太坊，Strategy是最大的比特币持仓上市公司。然而，目前这些担忧仅是推测。比特浸入科技并非单纯积累以太坊，其每年质押收入估计达2.11亿美元，同时持有5.55亿美元现金及等价物以及488万枚质押的ETH。该公司还于6月26日被纳入罗素1000大型股指数。汤姆·李强调，公司计划稳步增长至2026年，并认为市场正开启新一轮牛市周期，代币化和人工智能的快速进展将推动区块链和去中心化加密领域的指数级需求增长。最终摘要： * 新增持后，比特浸入科技持有5,700,040枚ETH，价值约90.1亿美元。 * 尽管以太坊价格疲软、ETF资金外流且Strategy面临批评，比特浸入科技仍持续购入以太坊。

ambcrypto3 小時前

ambcrypto3 小時前

英国FCA公布加密资产监管规则手册：基于风险的方法将于2027年10月启动

英国金融行为监管局公布新的加密货币监管框架，采取风险为本方法而非“一刀切”规则，将于2027年10月生效。新规要求加密公司持有充足资本覆盖潜在损失，具体金额将根据其风险状况浮动，较小或风险较低的公司可减少信息披露负担以节省合规成本。企业需自行评估资产负债表风险并进行年度压力测试，以确定所需资本水平，FCA将审核评估结果但不强加统一规则。此举旨在提升市场信心，吸引额外300-400万英国用户使用加密货币。针对稳定币，FCA保留了基本框架但简化了部分合规要求，例如取消储备构成预测估算，同时强化消费者保护，要求储备资产置于法定信托下并允许最多5%的流通稳定币作为储备。大型系统性发行机构可能面临更严监管。监管机构强调新规为加密行业提供了明确性与稳健基础，但也有市场人士提醒，监管虽可增强保护、减少欺诈，但无法完全消除风险。FCA将于下月开始提供许可申请前支持会议，以协助企业适应新规。

ambcrypto3 小時前

ambcrypto3 小時前

交易

現貨

GPT conçoit GPT

文章摘要

熱門幣種推薦

相關問答

你可能也喜歡

狗狗币未平仓合约徘徊在9.59亿美元左右，交易者等待复苏信号

格兰特·卡多恩将比特币持仓增至2700枚——为何是现在？

AI 时代，比特币还剩什么呢？

Bitmine以太坊储备增至98亿美元："加密货币最好的年份尚未到来"

英国FCA公布加密资产监管规则手册：基于风险的方法将于2027年10月启动

交易

熱門文章

如何購買PEOPLE

相關討論

熱門問答

熱門分類

熱門標籤