À la table de jeu de Nvidia, le dernier joueur pioche ses cartes. En l’espace d’un mois, Anthropic a d’abord recruté Clive Chan, un vétéran de la conception de puces chez OpenAI, puis discuté avec Samsung pour le 2 nm. Avec déjà en main les cartes Trainium, TPU et GPU Nvidia, pourquoi s’obstiner à constituer une quatrième carte ?
Le géant de l’IA, le plus habile du monde à « louer des puces », tend la main vers la voie la plus coûteuse : celle de la conception.
À l’instant, The Information révèle : Anthropic a lancé les travaux préliminaires pour sa propre puce d’IA et discute d’une potentielle collaboration de fabrication avec Samsung Electronics.

Selon des sources informées, les options envisagées incluent le procédé 2 nm et l’emballage avancé de Samsung.
Le 2 nm est l’un des procédés les plus avancés actuellement ; à taille égale, plus de transistors peuvent y être intégrés, permettant des performances plus rapides et plus économes en énergie. L’emballage avancé, quant à lui, revient à « assembler » le processeur et la mémoire haute vitesse ; plus ils sont proches, plus le transfert de données est rapide, réduisant ainsi le temps perdu par la puce en attente des données.

En juillet 2024, Samsung a annoncé fournir à l’entreprise japonaise d’IA Preferred Networks une solution clé en main combinant le procédé 2 nm GAA et un emballage 2,5D. Ce combo est précisément l’option qu’Anthropic envisage. (Source : Samsung officiel)
Ces deux éléments sont les atouts les plus convoités dans la course actuelle aux puces d’IA.
Ce qui est intriguant, c’est que, seulement trois mois plus tôt, Anthropic soulignait encore dans son blog officiel que les AWS Trainium, Google TPU et GPU Nvidia restaient au cœur de sa stratégie de puissance de calcul.
« Multi-plateforme, ne pas miser sur un seul matériel », c’était sa marque de fabrique la distinguant d’OpenAI et xAI : ces derniers sont profondément liés à Nvidia, tandis qu’Anthropic répartit l’entraînement et l’inférence sur les trois cartes susmentionnées.
Aujourd’hui, elle veut aussi sa propre puce.
S’apprête-t-elle à briser de ses propres mains sa règle ?
Trois sources directes informées du projet affirment que cette puce n’a même pas encore de « forme définie » : ce qu’elle doit faire, ses performances, comment l’intégrer dans les serveurs et les clusters, Anthropic est encore en train d’y réfléchir.
Des entreprises de conception de puces ont été consultées, mais le projet n’est pas encore entré dans les phases détaillées de conception, de test et de fabrication.
La réponse officielle d’Anthropic est également sans faille — les AWS Trainium, Google TPU et GPU Nvidia « resteront au cœur de la stratégie d’extension de la puissance de calcul de l’entreprise », les détails du plan étant refusés.
Mais deux actions révèlent déjà clairement l’intention.
La première est le recrutement.
Le mois dernier, Anthropic a débauché Clive Chan, un membre précoce de l’équipe de puces sur mesure d’OpenAI. Des postes d’ingénieurs en puces ont également été publiés.

Clive Chan, deuxième ingénieur hardware de l’équipe de puces sur mesure d’OpenAI, a participé au projet de supercalculateur Dojo de Tesla. Il a rejoint Anthropic en juin de cette année.
La seconde est la préparation.
En avril de cette année, Reuters rapportait déjà qu’Anthropic envisageait de concevoir ses propres puces pour faire face aux pénuries. Entre « envisager » et « contacter un fondeur », moins de trois mois se sont écoulés.
À la table des géants de l’IA, Google, Amazon, Meta et Microsoft ont déjà dévoilé leurs puces maison. OpenAI a aussi entraîné Broadcom dans la partie.
En regardant autour, parmi les principaux joueurs qui n’ont pas encore montré leurs cartes, il ne reste pratiquement qu’Anthropic lui-même.
La quatrième carte poussée par la facture
Pour comprendre pourquoi Anthropic conçoit des puces, regardez d’abord sa courbe de revenus.
Fin 2025, son chiffre d’affaires annualisé (run-rate revenue) était d’environ 9 milliards de dollars.
En avril 2026, il dépassait 30 milliards. Fin mai, plus de 47 milliards. En cinq mois, multiplié par plus de cinq.
Il y a deux ans, on n’aurait pas osé imaginer une telle courbe de croissance.
Les revenus montent en flèche, mais la facture de puissance de calcul grimpe encore plus vite.
Anthropic l’a reconnu dans son annonce d’avril : cette vitesse de croissance exerce une « pression inévitable » sur les infrastructures.
C’est pourquoi ces derniers mois, l’expansion de la puissance de calcul de cette entreprise a été frénétique :
Avril : signature d’une capacité de plusieurs gigawatts pour la prochaine génération de TPU avec Google et Broadcom, déploiement progressif à partir de 2027 ;

Blog officiel d’Anthropic : annonce le 6 avril de l’extension de la collaboration avec Google et Broadcom pour obtenir plusieurs gigawatts de puissance de calcul TPU de nouvelle génération.
Mai : annonce officielle d’un financement de série H de 65 milliards de dollars, valorisation post-investissement de 965 milliards de dollars. Dans le même temps, signature d’un accord avec Amazon pour une nouvelle capacité maximale de 5 gigawatts, et obtention de la puissance de calcul GPU de Colossus 1 et Colossus 2 auprès de SpaceX.
Amazon reste à ce jour son principal partenaire cloud et d’entraînement, le projet Rainier progressant toujours.
Selon The Information, elle négocierait même l’utilisation des puces de Microsoft, ainsi que des puces d’inférence de la start-up britannique Fractile.
Comptez : la liste des fournisseurs de puces d’Anthropic en compte déjà cinq.
C’est intéressant : une entreprise dont les sources de puissance de calcul sont extrêmement diversifiées, dont la courbe de revenus est presque verticale, et qui vient de recevoir 65 milliards de dollars en caisse, pourquoi se lancerait-elle encore dans la conception de puces ?
La réponse en deux mots : l’échelle.
Les modèles de pointe fonctionnent sur des clusters de dizaines de milliers de processeurs. À cette échelle, même une amélioration d’efficacité de quelques pourcentages permet d’économiser des milliards de dollars en espèces sonnantes et trébuchantes.
Plus une entreprise brûle d’argent, plus elle a de motivation pour optimiser au maximum l’efficacité de chaque watt et de chaque puce.
Outre le calcul de la puissance, il y a un point crucial : le levier de négociation.
Lorsque toutes les entreprises d’IA se disputent les processeurs, les salles serveurs et l’électricité, aussi nombreuses que soient les puces louées, le pouvoir de négociation reste entre les mains des autres.
Avoir sa propre puce sur la table change la donne lors des négociations tarifaires avec les autres fournisseurs.
Ainsi, la conception maison est la quatrième carte poussée par l’anxiété de la facture et du pouvoir de négociation.
Cette démarche d’Anthropic ne vise pas à remplacer qui que ce soit, mais à rapprocher un peu plus vers elle la courbe des coûts et l’initiative de la chaîne d’approvisionnement.
La voie qu’OpenAI a parcourue il y a trois ans
Cette voie, OpenAI l’a déjà explorée.
En 2024, OpenAI s’est tourné vers Broadcom pour commencer à concevoir sa propre puce.
En octobre 2025, les deux parties ont annoncé collaborer pour déployer 10 GW d’accélérateurs d’IA sur mesure — soit approximativement la capacité installée de dix centrales nucléaires. Le déploiement était prévu pour démarrer au second semestre 2026, avec achèvement d’ici fin 2029.
Le mois dernier, le premier produit, Jalapeño, a été dévoilé. Il s’agit d’une puce spécialement conçue pour l’inférence de grands modèles.

Le PDG d’OpenAI, Sam Altman, et le PDG de Broadcom, Hock Tan, tiennent une plaque commémorative de tranche de silicium Jalapeño, sur laquelle est gravé : Puissions-nous nous étendre de manière lisse, exponentielle et sans encombre vers l’AGI. (Source : OpenAI)
Le développement de cette puce, de la conception initiale à la production des premiers échantillons, n’a pris que 9 mois. Les deux parties affirment qu’il s’agit du cycle de développement d’ASIC le plus rapide de l’histoire des semi-conducteurs hautes performances. Il est intéressant de noter qu’une partie de la conception et de l’optimisation a été accélérée grâce aux propres modèles d’OpenAI.
Regardez, la boucle vertueuse est en marche : utiliser l’IA pour concevoir des puces qui exécutent l’IA.
Les tests précoces divulgués par OpenAI montrent que les performances par watt de Jalapeño dépasseront largement les niveaux les plus avancés actuels.
Le président d’OpenAI, Greg Brockman, a souligné cette logique : le monde évolue vers une « économie pilotée par la puissance de calcul », et la conception de puces maison fait partie d’une stratégie d’infrastructure full-stack visant à rendre la puissance de calcul plus abondante, l’IA plus rapide, plus fiable et moins chère.
Altman a même déclaré : « Une intelligence si bon marché qu’elle ne nécessite plus de mesure est à portée de main. »
Mais n’oubliez pas le coût temporel. Du recrutement de l’équipe à la révélation de la puce, OpenAI a mis environ trois ans.
Et la position actuelle d’Anthropic est précisément le point de départ d’OpenAI il y a trois ans : les personnes viennent d’arriver, les spécifications ne sont pas fixées, les discussions avec le fondeur sont en cours.
Si on remonte plus loin, les TPU de Google et les Trainium d’Amazon fonctionnent depuis des années, Meta et Microsoft ont également leurs propres plans.
Parmi les principaux acteurs, on ne compte plus guère ceux qui n’ont pas encore leur propre puce.
Qui peut renverser la table de Nvidia
Bien qu’elle ait décidé de se lancer dans la conception de puces, Anthropic souligne qu’Amazon reste son principal partenaire cloud et d’entraînement, et que les Google TPU et GPU Nvidia resteront au cœur de la stratégie d’extension de sa puissance de calcul.
Plus on a de cartes, mieux c’est, n’en abandonner aucune, c’est la tactique constante d’Anthropic.
Mais il y a un chiffre qui mérite attention.
Selon les estimations de The Information, malgré la frénésie des financements et des activités de conception sur le marché des puces d’inférence, la part de marché de Nvidia n’a pas baissé ces dernières années, elle a même augmenté, atteignant aujourd’hui environ 74 %.
Jensen Huang a déclaré que l’exécution de l’inférence sur les puces Nvidia est plus efficace que toute solution alternative.

Lors du GTC 2026, Jensen Huang a présenté côte à côte le GPU Rubin et le LPU Groq 3. La bande passante SRAM de ce dernier atteint 1200 To/s, soit 55 fois celle du premier. L’inférence est précisément le territoire que Nvidia défend le plus farouchement. (Source : Nvidia)
Depuis des années qu’on parle de puces maison, Google, Amazon, Meta, Microsoft s’y sont tous mis. Sur le papier, Nvidia, dont la part de marché aurait dû être grignotée, est en réalité devenu plus fort.
Cela montre précisément que les puces maison ne visent pas le présent de Nvidia, mais son propre avenir.
Alors, comment interpréter ce pas d’Anthropic ?
Pour elle-même, c’est un atout à long terme supplémentaire sur la table multi-fournisseurs, échangeant pouvoir de négociation et efficacité.
Le recrutement de Clive Chan montre qu’elle construit sérieusement ses capacités. Mais le projet en est encore à ses débuts. De la définition des besoins à la production des échantillons, à la fabrication en série, au déploiement en clusters, il reste le fossé le plus cruel de l’industrie des semi-conducteurs.
À l’ère précédente, les entreprises de puces déterminaient la forme du calcul, et les éditeurs de logiciels se développaient dessus.
À l’ère de l’IA, les entreprises qui créent les modèles commencent à définir à leur tour les puces. La structure de pouvoir de la pyramide de la puissance de calcul est en train d’être réécrite depuis le sommet.
Samsung pourra-t-il vraiment obtenir ce contrat, Anthropic poussera-t-elle cette puce jusqu’à la production de masse, il n’y a pas de réponse pour l’instant.
La seule certitude est que, sur le champ de bataille des puces représentant les 26 % en dehors des 74 % de Nvidia, Anthropic entre en jeu avec un chiffre d’affaires annualisé de 47 milliards de dollars et une valorisation de 965 milliards de dollars.
Ce n’est que lorsque « l’intelligence sera si bon marché qu’elle ne nécessitera plus de mesure » que l’intelligence super-puissante pourra sortir des salles serveurs des géants et devenir un produit de consommation quotidienne accessible à tous.
Références :
https://www.theinformation.com/articles/anthropic-talks-samsung-manufacture-custom-ai-chip?rc=epv9gi
https://x.com/itsclivetime/status/2063356118525792542https://www.anthropic.com/news/google-broadcom-partnership-compute
Cet article provient du compte WeChat officiel « 新智元 », auteur : ASI启示录





