Anthropic se révèle concevoir des puces, recrute un vétéran d'OpenAI et discute secrètement avec Samsung pour le 2 nm

marsbitPublié le 2026-07-03Dernière mise à jour le 2026-07-03

Résumé

Anthropic entame le développement de sa propre puce IA. Selon The Information, la startup a démarré des travaux préliminaires et discute d'un éventuel partenariat de fabrication avec Samsung, notamment sur des processus de 2 nm et des technologies d'emballage avancées. Cette décision marque un virage stratégique pour Anthropic, qui s'appuyait jusqu'ici sur une stratégie diversifiée combinant puces AWS Trainium, Google TPU et NVIDIA GPU. La recrutement de Clive Chan, un ancien ingénieur hardware d'OpenAI ayant participé aux puces maison de ce dernier, ainsi que l'ouverture de postes pour ingénieurs en conception de puces, confirment la volonté d'Anthropic de bâtir une expertise interne. Cette démarche s'explique principalement par l'explosion de la facture de calcul, alors que ses revenus annuels sont passés de 90 milliards de dollars fin 2025 à plus de 470 milliards en mai 2026. Développer sa propre puce vise à optimiser les coûts et l'efficacité énergétique à très grande échelle, et à renforcer son pouvoir de négociation face à ses fournisseurs, sans pour autant abandonner ses partenariats existants. Anthropic suit ainsi la voie déjà empruntée par d'autres géants comme OpenAI, Google, Amazon, Meta et Microsoft. Cependant, malgré la multiplication des puces maison, NVIDIA domine toujours le marché des puces d'inférence avec environ 74% de part de marché. L'objectif pour Anthropic n'est donc pas de remplacer NVIDIA à court terme, mais de sécuriser son avenir en prenant le c...

À la table de jeu de Nvidia, le dernier joueur pioche ses cartes. En l’espace d’un mois, Anthropic a d’abord recruté Clive Chan, un vétéran de la conception de puces chez OpenAI, puis discuté avec Samsung pour le 2 nm. Avec déjà en main les cartes Trainium, TPU et GPU Nvidia, pourquoi s’obstiner à constituer une quatrième carte ?

Le géant de l’IA, le plus habile du monde à « louer des puces », tend la main vers la voie la plus coûteuse : celle de la conception.

À l’instant, The Information révèle : Anthropic a lancé les travaux préliminaires pour sa propre puce d’IA et discute d’une potentielle collaboration de fabrication avec Samsung Electronics.

Selon des sources informées, les options envisagées incluent le procédé 2 nm et l’emballage avancé de Samsung.

Le 2 nm est l’un des procédés les plus avancés actuellement ; à taille égale, plus de transistors peuvent y être intégrés, permettant des performances plus rapides et plus économes en énergie. L’emballage avancé, quant à lui, revient à « assembler » le processeur et la mémoire haute vitesse ; plus ils sont proches, plus le transfert de données est rapide, réduisant ainsi le temps perdu par la puce en attente des données.

En juillet 2024, Samsung a annoncé fournir à l’entreprise japonaise d’IA Preferred Networks une solution clé en main combinant le procédé 2 nm GAA et un emballage 2,5D. Ce combo est précisément l’option qu’Anthropic envisage. (Source : Samsung officiel)

Ces deux éléments sont les atouts les plus convoités dans la course actuelle aux puces d’IA.

Ce qui est intriguant, c’est que, seulement trois mois plus tôt, Anthropic soulignait encore dans son blog officiel que les AWS Trainium, Google TPU et GPU Nvidia restaient au cœur de sa stratégie de puissance de calcul.

« Multi-plateforme, ne pas miser sur un seul matériel », c’était sa marque de fabrique la distinguant d’OpenAI et xAI : ces derniers sont profondément liés à Nvidia, tandis qu’Anthropic répartit l’entraînement et l’inférence sur les trois cartes susmentionnées.

Aujourd’hui, elle veut aussi sa propre puce.

S’apprête-t-elle à briser de ses propres mains sa règle ?

Trois sources directes informées du projet affirment que cette puce n’a même pas encore de « forme définie » : ce qu’elle doit faire, ses performances, comment l’intégrer dans les serveurs et les clusters, Anthropic est encore en train d’y réfléchir.

Des entreprises de conception de puces ont été consultées, mais le projet n’est pas encore entré dans les phases détaillées de conception, de test et de fabrication.

La réponse officielle d’Anthropic est également sans faille — les AWS Trainium, Google TPU et GPU Nvidia « resteront au cœur de la stratégie d’extension de la puissance de calcul de l’entreprise », les détails du plan étant refusés.

Mais deux actions révèlent déjà clairement l’intention.

La première est le recrutement.

Le mois dernier, Anthropic a débauché Clive Chan, un membre précoce de l’équipe de puces sur mesure d’OpenAI. Des postes d’ingénieurs en puces ont également été publiés.

Clive Chan, deuxième ingénieur hardware de l’équipe de puces sur mesure d’OpenAI, a participé au projet de supercalculateur Dojo de Tesla. Il a rejoint Anthropic en juin de cette année.

La seconde est la préparation.

En avril de cette année, Reuters rapportait déjà qu’Anthropic envisageait de concevoir ses propres puces pour faire face aux pénuries. Entre « envisager » et « contacter un fondeur », moins de trois mois se sont écoulés.

À la table des géants de l’IA, Google, Amazon, Meta et Microsoft ont déjà dévoilé leurs puces maison. OpenAI a aussi entraîné Broadcom dans la partie.

En regardant autour, parmi les principaux joueurs qui n’ont pas encore montré leurs cartes, il ne reste pratiquement qu’Anthropic lui-même.

La quatrième carte poussée par la facture

Pour comprendre pourquoi Anthropic conçoit des puces, regardez d’abord sa courbe de revenus.

Fin 2025, son chiffre d’affaires annualisé (run-rate revenue) était d’environ 9 milliards de dollars.

En avril 2026, il dépassait 30 milliards. Fin mai, plus de 47 milliards. En cinq mois, multiplié par plus de cinq.

Il y a deux ans, on n’aurait pas osé imaginer une telle courbe de croissance.

Les revenus montent en flèche, mais la facture de puissance de calcul grimpe encore plus vite.

Anthropic l’a reconnu dans son annonce d’avril : cette vitesse de croissance exerce une « pression inévitable » sur les infrastructures.

C’est pourquoi ces derniers mois, l’expansion de la puissance de calcul de cette entreprise a été frénétique :

Avril : signature d’une capacité de plusieurs gigawatts pour la prochaine génération de TPU avec Google et Broadcom, déploiement progressif à partir de 2027 ;

Blog officiel d’Anthropic : annonce le 6 avril de l’extension de la collaboration avec Google et Broadcom pour obtenir plusieurs gigawatts de puissance de calcul TPU de nouvelle génération.

Mai : annonce officielle d’un financement de série H de 65 milliards de dollars, valorisation post-investissement de 965 milliards de dollars. Dans le même temps, signature d’un accord avec Amazon pour une nouvelle capacité maximale de 5 gigawatts, et obtention de la puissance de calcul GPU de Colossus 1 et Colossus 2 auprès de SpaceX.

Amazon reste à ce jour son principal partenaire cloud et d’entraînement, le projet Rainier progressant toujours.

Selon The Information, elle négocierait même l’utilisation des puces de Microsoft, ainsi que des puces d’inférence de la start-up britannique Fractile.

Comptez : la liste des fournisseurs de puces d’Anthropic en compte déjà cinq.

C’est intéressant : une entreprise dont les sources de puissance de calcul sont extrêmement diversifiées, dont la courbe de revenus est presque verticale, et qui vient de recevoir 65 milliards de dollars en caisse, pourquoi se lancerait-elle encore dans la conception de puces ?

La réponse en deux mots : l’échelle.

Les modèles de pointe fonctionnent sur des clusters de dizaines de milliers de processeurs. À cette échelle, même une amélioration d’efficacité de quelques pourcentages permet d’économiser des milliards de dollars en espèces sonnantes et trébuchantes.

Plus une entreprise brûle d’argent, plus elle a de motivation pour optimiser au maximum l’efficacité de chaque watt et de chaque puce.

Outre le calcul de la puissance, il y a un point crucial : le levier de négociation.

Lorsque toutes les entreprises d’IA se disputent les processeurs, les salles serveurs et l’électricité, aussi nombreuses que soient les puces louées, le pouvoir de négociation reste entre les mains des autres.

Avoir sa propre puce sur la table change la donne lors des négociations tarifaires avec les autres fournisseurs.

Ainsi, la conception maison est la quatrième carte poussée par l’anxiété de la facture et du pouvoir de négociation.

Cette démarche d’Anthropic ne vise pas à remplacer qui que ce soit, mais à rapprocher un peu plus vers elle la courbe des coûts et l’initiative de la chaîne d’approvisionnement.

La voie qu’OpenAI a parcourue il y a trois ans

Cette voie, OpenAI l’a déjà explorée.

En 2024, OpenAI s’est tourné vers Broadcom pour commencer à concevoir sa propre puce.

En octobre 2025, les deux parties ont annoncé collaborer pour déployer 10 GW d’accélérateurs d’IA sur mesure — soit approximativement la capacité installée de dix centrales nucléaires. Le déploiement était prévu pour démarrer au second semestre 2026, avec achèvement d’ici fin 2029.

Le mois dernier, le premier produit, Jalapeño, a été dévoilé. Il s’agit d’une puce spécialement conçue pour l’inférence de grands modèles.

Le PDG d’OpenAI, Sam Altman, et le PDG de Broadcom, Hock Tan, tiennent une plaque commémorative de tranche de silicium Jalapeño, sur laquelle est gravé : Puissions-nous nous étendre de manière lisse, exponentielle et sans encombre vers l’AGI. (Source : OpenAI)

Le développement de cette puce, de la conception initiale à la production des premiers échantillons, n’a pris que 9 mois. Les deux parties affirment qu’il s’agit du cycle de développement d’ASIC le plus rapide de l’histoire des semi-conducteurs hautes performances. Il est intéressant de noter qu’une partie de la conception et de l’optimisation a été accélérée grâce aux propres modèles d’OpenAI.

Regardez, la boucle vertueuse est en marche : utiliser l’IA pour concevoir des puces qui exécutent l’IA.

Les tests précoces divulgués par OpenAI montrent que les performances par watt de Jalapeño dépasseront largement les niveaux les plus avancés actuels.

Le président d’OpenAI, Greg Brockman, a souligné cette logique : le monde évolue vers une « économie pilotée par la puissance de calcul », et la conception de puces maison fait partie d’une stratégie d’infrastructure full-stack visant à rendre la puissance de calcul plus abondante, l’IA plus rapide, plus fiable et moins chère.

Altman a même déclaré : « Une intelligence si bon marché qu’elle ne nécessite plus de mesure est à portée de main. »

Mais n’oubliez pas le coût temporel. Du recrutement de l’équipe à la révélation de la puce, OpenAI a mis environ trois ans.

Et la position actuelle d’Anthropic est précisément le point de départ d’OpenAI il y a trois ans : les personnes viennent d’arriver, les spécifications ne sont pas fixées, les discussions avec le fondeur sont en cours.

Si on remonte plus loin, les TPU de Google et les Trainium d’Amazon fonctionnent depuis des années, Meta et Microsoft ont également leurs propres plans.

Parmi les principaux acteurs, on ne compte plus guère ceux qui n’ont pas encore leur propre puce.

Qui peut renverser la table de Nvidia

Bien qu’elle ait décidé de se lancer dans la conception de puces, Anthropic souligne qu’Amazon reste son principal partenaire cloud et d’entraînement, et que les Google TPU et GPU Nvidia resteront au cœur de la stratégie d’extension de sa puissance de calcul.

Plus on a de cartes, mieux c’est, n’en abandonner aucune, c’est la tactique constante d’Anthropic.

Mais il y a un chiffre qui mérite attention.

Selon les estimations de The Information, malgré la frénésie des financements et des activités de conception sur le marché des puces d’inférence, la part de marché de Nvidia n’a pas baissé ces dernières années, elle a même augmenté, atteignant aujourd’hui environ 74 %.

Jensen Huang a déclaré que l’exécution de l’inférence sur les puces Nvidia est plus efficace que toute solution alternative.

Lors du GTC 2026, Jensen Huang a présenté côte à côte le GPU Rubin et le LPU Groq 3. La bande passante SRAM de ce dernier atteint 1200 To/s, soit 55 fois celle du premier. L’inférence est précisément le territoire que Nvidia défend le plus farouchement. (Source : Nvidia)

Depuis des années qu’on parle de puces maison, Google, Amazon, Meta, Microsoft s’y sont tous mis. Sur le papier, Nvidia, dont la part de marché aurait dû être grignotée, est en réalité devenu plus fort.

Cela montre précisément que les puces maison ne visent pas le présent de Nvidia, mais son propre avenir.

Alors, comment interpréter ce pas d’Anthropic ?

Pour elle-même, c’est un atout à long terme supplémentaire sur la table multi-fournisseurs, échangeant pouvoir de négociation et efficacité.

Le recrutement de Clive Chan montre qu’elle construit sérieusement ses capacités. Mais le projet en est encore à ses débuts. De la définition des besoins à la production des échantillons, à la fabrication en série, au déploiement en clusters, il reste le fossé le plus cruel de l’industrie des semi-conducteurs.

À l’ère précédente, les entreprises de puces déterminaient la forme du calcul, et les éditeurs de logiciels se développaient dessus.

À l’ère de l’IA, les entreprises qui créent les modèles commencent à définir à leur tour les puces. La structure de pouvoir de la pyramide de la puissance de calcul est en train d’être réécrite depuis le sommet.

Samsung pourra-t-il vraiment obtenir ce contrat, Anthropic poussera-t-elle cette puce jusqu’à la production de masse, il n’y a pas de réponse pour l’instant.

La seule certitude est que, sur le champ de bataille des puces représentant les 26 % en dehors des 74 % de Nvidia, Anthropic entre en jeu avec un chiffre d’affaires annualisé de 47 milliards de dollars et une valorisation de 965 milliards de dollars.

Ce n’est que lorsque « l’intelligence sera si bon marché qu’elle ne nécessitera plus de mesure » que l’intelligence super-puissante pourra sortir des salles serveurs des géants et devenir un produit de consommation quotidienne accessible à tous.

Références :

https://www.theinformation.com/articles/anthropic-talks-samsung-manufacture-custom-ai-chip?rc=epv9gi

https://x.com/itsclivetime/status/2063356118525792542https://www.anthropic.com/news/google-broadcom-partnership-compute

Cet article provient du compte WeChat officiel « 新智元 », auteur : ASI启示录

Questions liées

QQuelle est la principale raison pour laquelle Anthropic envisage de concevoir ses propres puces IA, selon l'article ?

ALa principale raison est la combinaison de la pression des coûts de calcul liés à sa croissance exponentielle (revenus annuels multipliés par cinq en cinq mois) et du désir d'obtenir plus de pouvoir de négociation et de contrôle sur sa chaîne d'approvisionnement, afin d'optimiser l'efficacité à très grande échelle.

QQuelles sont les deux actions concrètes mentionnées dans l'article qui indiquent qu'Anthropic est sérieux dans sa démarche de conception de puce ?

ALes deux actions concrètes sont : 1) Le recrutement de Clive Chan, un ancien ingénieur de l'équipe de puces sur mesure d'OpenAI et ancien membre du projet Dojo de Tesla. 2) Des discussions avancées avec Samsung pour une fabrication potentielle en processus 2nm et avec un emballage avancé.

QComment l'article décrit-il la stratégie habituelle d'Anthropic en matière d'approvisionnement en puissance de calcul, et comment le projet de puce personnalisée s'y intègre-t-il ?

ALa stratégie habituelle d'Anthropic est décrite comme 'multi-plateformes, sans miser sur un seul matériel', s'appuyant sur un mélange de puces AWS Trainium, Google TPU et NVIDIA GPU. Le projet de puce personnalisée ne vise pas à remplacer ces fournisseurs, mais à ajouter une quatrième option pour améliorer l'efficacité, réduire les coûts et renforcer son pouvoir de négociation, tout en conservant son approche diversifiée.

QQuel parallèle l'article établit-il entre la démarche d'Anthropic et celle d'OpenAI dans le domaine des puces ?

AL'article établit un parallèle en indiquant qu'Anthropic se trouve actuellement au point de départ où OpenAI se situait il y a trois ans : recrutement d'ingénieurs, définition des spécifications et recherche d'un fondeur. Il cite l'exemple de la puce de raisonnement Jalapeño d'OpenAI, développée avec Broadcom, pour montrer le chemin déjà parcouru par un concurrent et le temps nécessaire pour atteindre la production.

QSelon l'article, quel est l'impact actuel des nombreuses initiatives de puces personnalisées des géants de la tech sur la domination de NVIDIA ?

AL'article souligne que malgré les nombreuses initiatives de puces personnalisées (Google, Amazon, Meta, Microsoft, OpenAI), la part de marché de NVIDIA sur le marché des puces de raisonnement n'a pas diminué mais a augmenté pour atteindre environ 74%. Cela indique que ces puces personnalisées visent principalement à sécuriser l'avenir et l'efficacité des entreprises qui les conçoivent, plutôt qu'à remplacer immédiatement NVIDIA à grande échelle.

Lectures associées

Les sociétés sud-coréennes qui suivent la stratégie d'accumulation de cryptomonnaies, du marché haussier à la délistage ?

Alors que le KOSPI (indice principal sud-coréen) a presque doublé depuis début 2025, plusieurs sociétés cotées au KOSDAQ, notamment celles ayant adopté la stratégie "DAT" (acheter du Bitcoin avec les fonds levés en bourse), risquent désormais la radiation. Une réforme des règles de cotation, entrée en vigueur le 1er juillet, a durci les critères de maintien, en relevant notamment le seuil de capitalisation boursière à 200 milliards de wons (environ 1,3 million de dollars). Les entreprises DAT, inspirées de MicroStrategy, sont particulièrement vulnérables car leur modèle dépend fortement de la hausse du prix des cryptomonnaies. Or, le bitcoin a chuté depuis ses sommets de mi-2025, passant d'environ 120 000 $ à la zone des 50 000 $, forçant ces sociétés à enregistrer d'importantes pertes comptables. De plus, le marché KOSDAQ lui-même est en difficulté, affichant une baisse d'environ 10% en 2025 tandis que les investisseurs se tournent vers les grandes valeurs du KOSPI. La conjonction de la baisse des cryptomonnaies, de la faiblesse du KOSDAQ et du renforcement réglementaire met en péril la survie boursière de ces entreprises. Les mécanismes habituels de défense, comme les regroupements d'actions, sont désormais limités par les nouvelles règles. Si certaines sociétés comme BitPlanet dépassent encore le seuil actuel, elles pourraient être menacées lors du prochain relèvement à 300 milliards de wons prévu en janvier 2026.

marsbitIl y a 1 mins

Les sociétés sud-coréennes qui suivent la stratégie d'accumulation de cryptomonnaies, du marché haussier à la délistage ?

marsbitIl y a 1 mins

Bitcoin face au « monstre de l'inflation » : la Fed dans l'ombre, à quand le retour du marché haussier ?

Le bitcoin a récemment rebondi au-dessus de 60 000 dollars après avoir touché un plus bas. Sa performance annuelle reste cependant en baisse de plus de 50%, sous la pression des politiques monétaires américaines. Le dernier rapport sur l'emploi aux États-Unis a montré des créations d'emplois inférieures aux attentes, mais une baisse du taux de chômage à 4,2% et une accélération de la croissance des salaires à 3,5% en glissement annuel. Pour certains analystes, comme Nic Puckrin de Coin Bureau, cette pression salariale alimente l'inflation et pourrait maintenir les perspectives de hausse des taux de la Fed jusqu'en 2026. D'autres, comme Stephen Coltman de 21Shares, y voient au contraire une base pour un assouplissement monétaire de la Fed plus tard dans l'année, ce qui serait favorable aux actifs comme le bitcoin. Les attentes du marché oscillent, avec une probabilité perçue de 82% que les taux restent stables lors de la prochaine réunion. Simon-Peter Massabni de XS.com souligne que la trajectoire du bitcoin dépendra de la sensibilité aux données économiques américaines, des flux des ETF institutionnels, des développements géopolitiques et surtout des anticipations sur les taux de la Fed. Tant que l'incertitude persiste, la volatilité devrait continuer, faisant de la politique monétaire américaine un facteur décisif pour l'avenir du bitcoin.

Foresight NewsIl y a 19 mins

Bitcoin face au « monstre de l'inflation » : la Fed dans l'ombre, à quand le retour du marché haussier ?

Foresight NewsIl y a 19 mins

Compte à rebours de la loi CLARITY : 25 jours. Si elle n'est pas adoptée avant la trêve parlementaire d'août, quel sera l'impact sur le marché des cryptomonnaies ?

Le projet de loi CLARITY, visant à établir un cadre réglementaire clair pour les crypto-actifs aux États-Unis, est confronté à un calendrier serré. Il doit être adopté par le Sénat avant la pause parlementaire du 10 août, nécessitant 60 voix et la résolution de derniers obstacles politiques et liés à l'application de la loi. Les négociations sur des clauses éthiques et de protection des développeurs ont ralenti sa progression. Si le texte n'est pas voté à temps, sa probabilité d'adoption en 2026 chuterait, prolongeant l'incertitude réglementaire. Le marché a déjà commencé à réagir, avec des sorties record des ETF Bitcoin en juin. Les actifs comme le XRP, qui bénéficierait d'une classification définitive comme marchandise, pourraient perdre leur prime réglementaire. Le Bitcoin et l'Ethereum, déjà classés comme marchandises par des agences, seraient moins directement affectés, mais l'innovation DeFi resterait freinée. Les scénarios possibles sont : une adoption avant août, entraînant un rebond des cours ; un report en 2027, prolongeant l'attentisme des investisseurs ; ou un échec nécessitant une nouvelle procédure au prochain Congrès. Malgré les obstacles, le simple fait que le projet soit discuté au Sénat montre une avancée significative vers la clarification du paysage crypto aux États-Unis.

Odaily星球日报Il y a 38 mins

Compte à rebours de la loi CLARITY : 25 jours. Si elle n'est pas adoptée avant la trêve parlementaire d'août, quel sera l'impact sur le marché des cryptomonnaies ?

Odaily星球日报Il y a 38 mins

Trading

Spot
活动图片