OpenAI et Anthropic se lancent dans la conception de puces : au-delà des coûts, c'est la maîtrise du calcul qui compte

marsbitPublié le 2026-07-03Dernière mise à jour le 2026-07-03

Résumé

OpenAI et Anthropic s'engagent dans le développement de puces IA sur mesure, visant à reprendre le contrôle de leurs infrastructures de calcul. Si Anthropic négocie avec Samsung pour une puce personnalisée et explore la conception interne, OpenAI collabore déjà avec Broadcom et TSMC, visant un déploiement en 2026. Cette tendance dépasse la simple réduction des coûts. Elle répond à un besoin crucial de maîtrise de la puissance de calcul, de réduction de la dépendance envers des fournisseurs comme NVIDIA, et surtout, d'optimisation conjointe de la logiciellle et du matériel. En concevant des puces adaptées à l'architecture spécifique de leurs modèles (comme GPT-4 ou Claude), ces entreprises cherchent à améliorer radicalement l'efficacité, la vitesse et l'économie de leurs systèmes. Bien que les GPU restent incontournables à court terme en raison de leur écosystème, ces puces maison offriront une alternative stratégique, notamment pour l'inférence. Cette course à l'"autonomie en matière de calcul" rejoint les initiatives similaires de Google, Amazon, Meta et Microsoft, transformant la compétition dans l'IA, qui devient de plus en plus une intégration verticale complète.

Selon un rapport du The Information publié jeudi, Anthropic serait en discussion avec Samsung pour des puces d'intelligence artificielle sur mesure et aurait débuté les premières phases de développement de sa propre puce IA. Si cette puce serveur personnalisée entre finalement en production, cela marquerait une étape importante pour l'autonomie matérielle de l'entreprise derrière Claude.

Cette démarche est vue comme un signal qu'Anthropic suit les traces d'OpenAI.

OpenAI a précédemment avancé son projet de puce IA personnalisée et collabore avec des partenaires en conception et fabrication de semi-conducteurs, cherchant à construire une infrastructure de calcul plus indépendante et efficace pour des produits comme ChatGPT. Les deux entreprises pointent vers la même tendance : les sociétés de grands modèles passent d'une compétition purement algorithmique à une compétition intégrée logiciel-matériel.

L'impact sur le marché se fera d'abord sentir sur trois fronts : le pouvoir de négociation des fournisseurs externes de GPU comme Nvidia, les opportunités pour les fonderies comme Samsung sur les commandes de puces IA, et le rythme futur des levées de fonds et des introductions en bourse des startups de l'IA.

Selon un rapport de Barron's, des analystes de Deutsche Bank ont récemment suggéré qu'OpenAI et Anthropic ne devraient pas trop retarder leur IPO, l'une des raisons étant le besoin d'importants capitaux à long terme pour les puces maison et l'infrastructure de calcul.

Les puces maison sont d'abord une question de contrôle du calcul

Actuellement, l'entraînement et l'exécution de grands modèles nécessitent d'importantes ressources de calcul haute performance. Le marché du calcul IA dépend fortement de l'architecture GPU de Nvidia, et la tension entre l'offre et la demande maintient les coûts d'entraînement et d'inférence à un niveau élevé. Pour les entreprises de modèles comme OpenAI et Anthropic, les puces ne sont plus un simple poste d'achat, mais un moyen de production essentiel.

La demande pour le modèle Claude d'Anthropic a considérablement augmenté en 2026. TradingKey rapporte que des cadres d'Anthropic ont précédemment révélé que les revenus annualisés de l'entreprise dépassaient 300 milliards de dollars, contre environ 90 milliards de dollars fin 2025. Cette expansion des activités pousse la demande en capacité de calcul à augmenter rapidement et amplifie l'impact des incertitudes sur l'approvisionnement externe en puces sur les opérations de l'entreprise.

Anthropic dépend encore de multiples solutions de puces tierces, notamment les TPU conçues par Google (filiale d'Alphabet) et les puces maison d'Amazon. Les rapports indiquent qu'Anthropic a également conclu des accords d'approvisionnement à long terme en TPU avec Google et Broadcom, liés à son précédent engagement d'investir 500 milliards de dollars dans l'infrastructure de calcul américaine.

Cela signifie que développer ses propres puces n'équivaut pas à se libérer complètement des fournisseurs externes. Un objectif plus réaliste est de maîtriser les capacités de conception clés, de créer des options technologiques de secours et d'améliorer sa position dans les futures négociations commerciales.

Le coût n'est que l'entrée, la synergie logiciel-matériel est la clé

La raison la plus directe de développer ses propres puces est de réduire les coûts. En utilisant des ASIC personnalisées, les entreprises d'IA peuvent optimiser les flux de calcul autour de leur propre architecture de modèle, réduisant les modules inutiles dans les puces généralistes, améliorant ainsi l'efficacité énergétique. Si la puce d'Anthropic est fabriquée et déployée avec succès, les rapports suggèrent qu'elle pourrait réduire significativement le coût des appels API et influencer la structure des prix sur le marché des applications d'IA d'entreprise.

Mais le coût n'est pas la seule variable. Dylan Patel, fondateur de SemiAnalysis, souligne dans un entretien que le plus grand potentiel d'amélioration de l'efficacité de l'IA ne vient pas seulement de puces plus rapides, mais de la conception conjointe entre le modèle, les kernels et le silicium. Il estime qu'une optimisation à un seul niveau peut apporter un gain de performance double, mais qu'une optimisation multi-niveaux pourrait offrir des gains bien supérieurs à une simple multiplication.

Cela explique pourquoi OpenAI et Anthropic s'engagent plus profondément dans le matériel. L'architecture d'un modèle ne s'adapte pas naturellement à toutes les puces. Dylan Patel affirme que les modèles d'OpenAI sont plus clairsemés, tandis que ceux d'Anthropic sont relativement plus denses. Les deux présentent des différences significatives dans la taille des unités de multiplication matricielle, la structure du mécanisme d'attention, la forme des couches d'experts, etc. Cela pousse naturellement les deux entreprises vers des orientations matérielles différentes. "En réalité, selon la direction du développement des modèles d'OpenAI, utiliser des TPU pourrait être une décision désastreuse pour eux ; et selon la direction des modèles d'Anthropic et de Google, s'entraîner sur des GPU pourrait être tout aussi désastreux pour eux", dit-il.

En d'autres termes, développer sa propre puce ne consiste pas simplement à remplacer les GPU de Nvidia par des puces maison. Le véritable objectif est de permettre au modèle, dès sa conception, de s'adapter au matériel sous-jacent, améliorant ainsi la vitesse d'inférence, la consommation d'énergie, le débit et l'économie unitaire.

Pas un remplacement immédiat pour Nvidia, mais un contrepoids à long terme

Le développement d'une puce IA maison, de la conception et R&D à la fabrication, la validation et le déploiement final, prend généralement de 18 à 24 mois. Même si Anthropic parvient à un accord avec Samsung, sa puce maison ne pourra probablement pas remplacer substantiellement l'offre de calcul existante à court terme.

OpenAI est plus avancé. TradingKey rapporte qu'OpenAI a choisi de collaborer avec Broadcom et TSMC, prévoyant de déployer sa première puce d'inférence au second semestre 2026. Comparé à Anthropic, OpenAI est plus proactif et plus près de la phase de déploiement sur la voie des puces personnalisées.

La démarche des entreprises de grands modèles vers des puces maison vise effectivement à réduire la dépendance envers des fournisseurs comme Nvidia. Mais cela ne signifie pas que la position de Nvidia sera rapidement érodée. Dylan Patel souligne dans l'entretien que les GPU de Nvidia conservent l'avantage de la polyvalence, de nombreux modèles et l'écosystème open source étant optimisés pour les GPU. Il mentionne également que le prétendu fossé CUDA n'est pas seulement CUDA lui-même, mais que de nombreux modèles et logiciels en aval sont déjà adaptés à l'architecture matérielle de Nvidia. Si la structure des experts, les dimensions cachées et les modes de communication d'un modèle sont mieux adaptés aux GPU, alors même si d'autres puces présentent des avantages, la migration ne serait pas nécessairement simple.

Par conséquent, les puces maison ressemblent plus à l'établissement d'une deuxième voie. OpenAI et Anthropic pourraient continuer à utiliser diverses ressources de calcul comme les GPU, TPU, Trainium, tout en utilisant leurs ASIC maison pour des charges de travail plus spécifiques, stables et à haute fréquence, en particulier pour l'inférence.

La course à l'« autonomie en calcul » est lancée dans toute l'industrie

La logique commune derrière les puces maison d'OpenAI et d'Anthropic peut se résumer en trois points : réduire les coûts de calcul à long terme, diminuer la dépendance aux fournisseurs externes, et améliorer l'efficacité des modèles grâce à la synergie logiciel-matériel.

Le troisième point est probablement le plus crucial. Alors que les entreprises de modèles grandissent, le calcul généraliste ne peut pas pleinement satisfaire les besoins d'architectures différenciées. Les puces maison permettent aux entreprises de placer la conception du modèle, le logiciel système et le silicium sous-jacent dans un même cadre d'optimisation.

Mais la direction est claire : la compétition entre grands modèles évolue de « qui a le meilleur modèle » vers « qui contrôle le mieux le calcul, le financement et la pile matérielle ». C'est aussi la véritable raison pour laquelle OpenAI et Anthropic se tournent vers les puces maison.

L'exploration d'Anthropic n'est pas un cas isolé. De la série TPU de Google développée depuis plus d'une décennie, à la série Trainium d'Amazon axée sur l'entraînement, en passant par la série MTIA de Meta pour l'inférence et la série Maia que Microsoft continue de développer, les grandes entreprises technologiques se sont toutes engagées en profondeur sur la voie des puces maison.

Pour Samsung, si elle parvient à obtenir le contrat de fabrication de la puce d'Anthropic, cela donnerait un coup de pouce important à l'influence de sa division de fonderie dans le domaine de l'IA. Samsung est actuellement en concurrence acharnée avec des fabricants comme TSMC pour les clients en procédés avancés. Attirer un client IA à fort potentiel de croissance comme Anthropic contribuerait à élargir son empreinte dans le domaine des semi-conducteurs pour l'IA.

Cet article provient du compte WeChat officiel : Wall Street News , auteur : Zhao Ying

Questions liées

QQuelles sont les principales raisons pour lesquelles OpenAI et Anthropic développent leurs propres puces IA ?

ALes principales raisons sont le contrôle de la puissance de calcul, la réduction des coûts à long terme et, surtout, l'amélioration de l'efficacité grâce à la co-conception logiciel-matériel. Cela leur permet de mieux adapter l'architecture de leurs modèles au matériel sous-jacent, d'améliorer les performances et de réduire la dépendance vis-à-vis de fournisseurs externes comme Nvidia.

QComment le développement de puces par Anthropic et OpenAI affecte-t-il Nvidia ?

AIl ne s'agit pas d'un remplacement immédiat, mais plutôt d'un contrepoids à long terme. Nvidia conserve ses avantages en matière de polyvalence et d'un écosystème logiciel (CUDA) bien établi. Les puces maison des entreprises d'IA seront probablement utilisées pour des charges de travail spécifiques et stables, comme l'inférence, tandis qu'elles continueront à utiliser des GPU pour d'autres tâches.

QQuels sont les partenaires mentionnés pour le développement des puces sur mesure d'OpenAI et d'Anthropic ?

AOpenAI travaille avec Broadcom et TSMC (Taiwan Semiconductor Manufacturing Company) pour ses puces, avec un déploiement prévu fin 2026. Anthropic est en pourparlers avec Samsung pour la fabrication et a également des accords d'approvisionnement à long terme avec Google (pour les TPU) et Broadcom.

QQuel est l'argument de Dylan Patel concernant l'optimisation de l'efficacité de l'IA ?

ADylan Patel souligne que les plus grandes améliorations d'efficacité ne viennent pas seulement de puces plus rapides, mais de la co-conception entre le modèle, le noyau logiciel et le silicium. Une optimisation conjointe sur ces différentes couches peut produire des gains bien supérieurs à la simple somme des améliorations individuelles.

QQuelle est la tendance plus large dans l'industrie des grands modèles de langage, illustrée par ces initiatives de puces ?

ALa tendance est un passage d'une concurrence purement algorithmique ('quel modèle est le plus performant') à une concurrence intégrée logiciel-matériel. Le contrôle de la pile technologique complète - incluant la puissance de calcul, le financement et le matériel - devient un enjeu stratégique crucial, comme le montrent également les initiatives de Google (TPU), Amazon (Trainium), Meta (MTIA) et Microsoft (Maia).

Lectures associées

Une baleine parie 70 millions de dollars sur la reprise du Bitcoin et du Solana – Les craintes de hausse de la Fed vont-elles tout gâcher ?

Un baleine a considérablement augmenté ses positions longues sur Bitcoin et Solana le 2 juillet, engageant plus de 70 millions de dollars. Ce mouvement a été motivé par un rapport sur l'emploi américain plus faible que prévu, qui a alimenté un rallye de soulèvement dans les marchés à risque en atténuant temporairement les craintes de hausse des taux de la Fed. La position initiale a généré un profit non réalisé d'environ 9,2 millions de dollars. Cependant, la perspective monétaire reste incertaine. Si les probabilités d'une nouvelle hausse des taux ont chuté, le marché anticipe surtout un maintien des taux actuels. La publication des procès-verbaux de la FOMC la semaine prochaine pourrait provoquer une nouvelle volatilité. Par ailleurs, la position courte de la baleine sur Hyperliquid (HYPE) subit déjà des pertes significatives. Pour Bitcoin, la résistance se situe autour de 62 300$ et 65 000$ pour une reprise durable, tandis qu'un important volume de positions courtes pourrait créer les conditions d'un squeeze. Sur Solana, les « smart money » ont augmenté leurs achats de 129%. En définitive, la pérennité de la reprise des cryptomonnaies dépendra de la communication et des décisions à venir de la Fed.

ambcryptoIl y a 33 mins

Une baleine parie 70 millions de dollars sur la reprise du Bitcoin et du Solana – Les craintes de hausse de la Fed vont-elles tout gâcher ?

ambcryptoIl y a 33 mins

Les règles cryptographiques ne sont "pas une faveur", affirme la SEC, mais la loi CLARITY attend toujours

Le président de la SEC, Paul Atkins, a défendu la modernisation des règles cryptomonnaies par l'administration Trump, affirmant qu'une réglementation claire n'est pas une "faveur" mais une nécessité pour des marchés fonctionnels. Malgré les guides publiés par la SEC pour clarifier la classification des actifs et les ETF, cette guidance, n'étant pas une loi, reste susceptible de contestations judiciaires. Une solution durable dépendrait de l'adoption du projet de loi CLARITY Act, qui définirait la structure du marché. Cependant, bien qu'ayant franchi une étape en commission, le texte n'est toujours pas programmé pour un vote au Sénat. Face à l'entrée en vigueur du cadre MiCA dans l'UE, des groupes de pression exhortent les sénateurs américains à voter rapidement, avertissant que l'absence de règles claires pousse l'innovation à s'expatrier.

ambcryptoIl y a 1 h

Les règles cryptographiques ne sont "pas une faveur", affirme la SEC, mais la loi CLARITY attend toujours

ambcryptoIl y a 1 h

Un sentiment baissier s'intensifie à l'expiration d'options Bitcoin et Ethereum d'une valeur de 2,13 milliards de dollars

Le marché des cryptomonnaies a connu une session cruciale le 3 juillet avec l'expiration d'options sur Bitcoin et Ethereum pour une valeur nominale combinée de 2,13 milliards de dollars. Environ 31 000 options Bitcoin (1,9 milliard de dollars) ont expiré avec un ratio put/call de 0,70 et un point de douleur maximal à 61 000$. Parallèlement, 135 000 options Ethereum (230 millions de dollars) ont expiré avec un ratio put/call de 1,29 et un niveau de douleur maximal de 1 650$. Le ratio put/call élevé d'Ethereum, supérieur à 1, indique un nombre plus important d'options de vente (put), reflétant une attitude défensive des traders qui se couvrent contre d'éventuelles baisses ou restent prudents. Les positions d'expiration restent concentrées près des niveaux clés d'exposition Gamma (GEX), autour de 60 000$ pour le Bitcoin et 1 700$ pour l'Ethereum. Si le Bitcoin a réussi à retrouver le seuil psychologique de 60 000$, le sentiment de marché demeure mitigé. Les analystes débattent pour savoir si la récente reprise marque le début d'un rebond durable. Au-delà des options, l'attention se porte également sur les marchés financiers traditionnels et les actifs tokenisés. Les données suggèrent que les traders abordent le troisième trimestre avec prudence. Malgré le regain du Bitcoin, le positionnement défensif sur l'Ethereum et l'activité de couverture montrent que de nombreux participants se préparent à une volatilité accrue plutôt qu'à une franche hausse. Au moment de l'analyse, le Bitcoin se négociait autour de 61 932$ et l'Ethereum vers 1 738$.

TheNewsCryptoIl y a 2 h

Un sentiment baissier s'intensifie à l'expiration d'options Bitcoin et Ethereum d'une valeur de 2,13 milliards de dollars

TheNewsCryptoIl y a 2 h

DeepSeek accélère le traitement local des grands modèles sur puces Apple, une amélioration de 60%

La technologie DSpark de DeepSeek, initialement conçue pour les GPU de centres de données, a été adaptée pour les puces Apple par l'ingénieur Abdur Rahim. Cette version native, nommée mlx-dspark, accélère considérablement l'exécution de modèles de langage sur Mac. En utilisant un petit modèle "ébauche" pour générer des tokens candidats que le modèle principal vérifie ensuite par lot, mlx-dspark augmente la vitesse de génération de Gemma-4 12B et Qwen3-4B d'environ 1,6 et 1,4 fois respectivement sur un M4 Pro. L'innovation de Rahim réside dans la préservation de la sortie exacte du modèle original, même avec un décodage par échantillonnage, et non pas seulement avec un décodage glouton. Le projet intègre également DFlash, une autre technique de décodage spéculatif qui génère des blocs de tokens en parallèle. DFlash excelle dans les tâches de code et de mathématiques (accélération ~2,1x), tandis que DSpark, avec sa tête Markovienne, reste plus efficace pour le chat général. La version mlx-dspark v0.0.3 permet désormais de choisir entre les deux méthodes au sein d'un même package. Ce portage démontre l'optimisation efficace des LLMs pour le matériel Apple, en combinant accélération significative, précision des sorties et flexibilité méthodologique.

marsbitIl y a 2 h

DeepSeek accélère le traitement local des grands modèles sur puces Apple, une amélioration de 60%

marsbitIl y a 2 h

Commentaire piquant｜Pourquoi le célèbre « Tech Lead » a liquidé ses bitcoins ? Voici le « petit génie des investissements » !

En résumé : Un ex-responsable technique de Google et Meta a révélé avoir subi des pertes importantes sur le Bitcoin, qu'il a dû vendre après une chute de 12 000 à 6 000 dollars, en raison d'un effet de levier excessif. Il critique la volatilité du Bitcoin, attiré par l'attention plutôt que par les fondamentaux, et souligne les risques comme la concentration du code et la concurrence de l'IA. Parallèlement, une image humoristique sur Reddit oppose Michael Saylor, promoteur acharné du Bitcoin, aux petits investisseurs, reflétant les différences d'approche. Enfin, le rapport financier de Donald Trump montre qu'il a gagné 14 milliards de dollars dans le crypto en un an. Cependant, le « Trump Coin », qu'il a soutenu, a chuté de 97%, entraînant de lourdes pertes pour de nombreux investisseurs, suscitant des critiques sur son rôle dans le marché. La semaine illustre ainsi les risques de levier, les clivages dans la communauté et l'influence des personnalités publiques sur les actifs cryptographiques.

Foresight NewsIl y a 2 h

Commentaire piquant｜Pourquoi le célèbre « Tech Lead » a liquidé ses bitcoins ? Voici le « petit génie des investissements » !