Selon un rapport du The Information publié jeudi, Anthropic serait en discussion avec Samsung pour des puces d'intelligence artificielle sur mesure et aurait débuté les premières phases de développement de sa propre puce IA. Si cette puce serveur personnalisée entre finalement en production, cela marquerait une étape importante pour l'autonomie matérielle de l'entreprise derrière Claude.
Cette démarche est vue comme un signal qu'Anthropic suit les traces d'OpenAI.
OpenAI a précédemment avancé son projet de puce IA personnalisée et collabore avec des partenaires en conception et fabrication de semi-conducteurs, cherchant à construire une infrastructure de calcul plus indépendante et efficace pour des produits comme ChatGPT. Les deux entreprises pointent vers la même tendance : les sociétés de grands modèles passent d'une compétition purement algorithmique à une compétition intégrée logiciel-matériel.
L'impact sur le marché se fera d'abord sentir sur trois fronts : le pouvoir de négociation des fournisseurs externes de GPU comme Nvidia, les opportunités pour les fonderies comme Samsung sur les commandes de puces IA, et le rythme futur des levées de fonds et des introductions en bourse des startups de l'IA.
Selon un rapport de Barron's, des analystes de Deutsche Bank ont récemment suggéré qu'OpenAI et Anthropic ne devraient pas trop retarder leur IPO, l'une des raisons étant le besoin d'importants capitaux à long terme pour les puces maison et l'infrastructure de calcul.
Les puces maison sont d'abord une question de contrôle du calcul
Actuellement, l'entraînement et l'exécution de grands modèles nécessitent d'importantes ressources de calcul haute performance. Le marché du calcul IA dépend fortement de l'architecture GPU de Nvidia, et la tension entre l'offre et la demande maintient les coûts d'entraînement et d'inférence à un niveau élevé. Pour les entreprises de modèles comme OpenAI et Anthropic, les puces ne sont plus un simple poste d'achat, mais un moyen de production essentiel.
La demande pour le modèle Claude d'Anthropic a considérablement augmenté en 2026. TradingKey rapporte que des cadres d'Anthropic ont précédemment révélé que les revenus annualisés de l'entreprise dépassaient 300 milliards de dollars, contre environ 90 milliards de dollars fin 2025. Cette expansion des activités pousse la demande en capacité de calcul à augmenter rapidement et amplifie l'impact des incertitudes sur l'approvisionnement externe en puces sur les opérations de l'entreprise.
Anthropic dépend encore de multiples solutions de puces tierces, notamment les TPU conçues par Google (filiale d'Alphabet) et les puces maison d'Amazon. Les rapports indiquent qu'Anthropic a également conclu des accords d'approvisionnement à long terme en TPU avec Google et Broadcom, liés à son précédent engagement d'investir 500 milliards de dollars dans l'infrastructure de calcul américaine.
Cela signifie que développer ses propres puces n'équivaut pas à se libérer complètement des fournisseurs externes. Un objectif plus réaliste est de maîtriser les capacités de conception clés, de créer des options technologiques de secours et d'améliorer sa position dans les futures négociations commerciales.
Le coût n'est que l'entrée, la synergie logiciel-matériel est la clé
La raison la plus directe de développer ses propres puces est de réduire les coûts. En utilisant des ASIC personnalisées, les entreprises d'IA peuvent optimiser les flux de calcul autour de leur propre architecture de modèle, réduisant les modules inutiles dans les puces généralistes, améliorant ainsi l'efficacité énergétique. Si la puce d'Anthropic est fabriquée et déployée avec succès, les rapports suggèrent qu'elle pourrait réduire significativement le coût des appels API et influencer la structure des prix sur le marché des applications d'IA d'entreprise.
Mais le coût n'est pas la seule variable. Dylan Patel, fondateur de SemiAnalysis, souligne dans un entretien que le plus grand potentiel d'amélioration de l'efficacité de l'IA ne vient pas seulement de puces plus rapides, mais de la conception conjointe entre le modèle, les kernels et le silicium. Il estime qu'une optimisation à un seul niveau peut apporter un gain de performance double, mais qu'une optimisation multi-niveaux pourrait offrir des gains bien supérieurs à une simple multiplication.
Cela explique pourquoi OpenAI et Anthropic s'engagent plus profondément dans le matériel. L'architecture d'un modèle ne s'adapte pas naturellement à toutes les puces. Dylan Patel affirme que les modèles d'OpenAI sont plus clairsemés, tandis que ceux d'Anthropic sont relativement plus denses. Les deux présentent des différences significatives dans la taille des unités de multiplication matricielle, la structure du mécanisme d'attention, la forme des couches d'experts, etc. Cela pousse naturellement les deux entreprises vers des orientations matérielles différentes. "En réalité, selon la direction du développement des modèles d'OpenAI, utiliser des TPU pourrait être une décision désastreuse pour eux ; et selon la direction des modèles d'Anthropic et de Google, s'entraîner sur des GPU pourrait être tout aussi désastreux pour eux", dit-il.
En d'autres termes, développer sa propre puce ne consiste pas simplement à remplacer les GPU de Nvidia par des puces maison. Le véritable objectif est de permettre au modèle, dès sa conception, de s'adapter au matériel sous-jacent, améliorant ainsi la vitesse d'inférence, la consommation d'énergie, le débit et l'économie unitaire.
Pas un remplacement immédiat pour Nvidia, mais un contrepoids à long terme
Le développement d'une puce IA maison, de la conception et R&D à la fabrication, la validation et le déploiement final, prend généralement de 18 à 24 mois. Même si Anthropic parvient à un accord avec Samsung, sa puce maison ne pourra probablement pas remplacer substantiellement l'offre de calcul existante à court terme.
OpenAI est plus avancé. TradingKey rapporte qu'OpenAI a choisi de collaborer avec Broadcom et TSMC, prévoyant de déployer sa première puce d'inférence au second semestre 2026. Comparé à Anthropic, OpenAI est plus proactif et plus près de la phase de déploiement sur la voie des puces personnalisées.
La démarche des entreprises de grands modèles vers des puces maison vise effectivement à réduire la dépendance envers des fournisseurs comme Nvidia. Mais cela ne signifie pas que la position de Nvidia sera rapidement érodée. Dylan Patel souligne dans l'entretien que les GPU de Nvidia conservent l'avantage de la polyvalence, de nombreux modèles et l'écosystème open source étant optimisés pour les GPU. Il mentionne également que le prétendu fossé CUDA n'est pas seulement CUDA lui-même, mais que de nombreux modèles et logiciels en aval sont déjà adaptés à l'architecture matérielle de Nvidia. Si la structure des experts, les dimensions cachées et les modes de communication d'un modèle sont mieux adaptés aux GPU, alors même si d'autres puces présentent des avantages, la migration ne serait pas nécessairement simple.
Par conséquent, les puces maison ressemblent plus à l'établissement d'une deuxième voie. OpenAI et Anthropic pourraient continuer à utiliser diverses ressources de calcul comme les GPU, TPU, Trainium, tout en utilisant leurs ASIC maison pour des charges de travail plus spécifiques, stables et à haute fréquence, en particulier pour l'inférence.
La course à l'« autonomie en calcul » est lancée dans toute l'industrie
La logique commune derrière les puces maison d'OpenAI et d'Anthropic peut se résumer en trois points : réduire les coûts de calcul à long terme, diminuer la dépendance aux fournisseurs externes, et améliorer l'efficacité des modèles grâce à la synergie logiciel-matériel.
Le troisième point est probablement le plus crucial. Alors que les entreprises de modèles grandissent, le calcul généraliste ne peut pas pleinement satisfaire les besoins d'architectures différenciées. Les puces maison permettent aux entreprises de placer la conception du modèle, le logiciel système et le silicium sous-jacent dans un même cadre d'optimisation.
Mais la direction est claire : la compétition entre grands modèles évolue de « qui a le meilleur modèle » vers « qui contrôle le mieux le calcul, le financement et la pile matérielle ». C'est aussi la véritable raison pour laquelle OpenAI et Anthropic se tournent vers les puces maison.
L'exploration d'Anthropic n'est pas un cas isolé. De la série TPU de Google développée depuis plus d'une décennie, à la série Trainium d'Amazon axée sur l'entraînement, en passant par la série MTIA de Meta pour l'inférence et la série Maia que Microsoft continue de développer, les grandes entreprises technologiques se sont toutes engagées en profondeur sur la voie des puces maison.
Pour Samsung, si elle parvient à obtenir le contrat de fabrication de la puce d'Anthropic, cela donnerait un coup de pouce important à l'influence de sa division de fonderie dans le domaine de l'IA. Samsung est actuellement en concurrence acharnée avec des fabricants comme TSMC pour les clients en procédés avancés. Attirer un client IA à fort potentiel de croissance comme Anthropic contribuerait à élargir son empreinte dans le domaine des semi-conducteurs pour l'IA.
Cet article provient du compte WeChat officiel : Wall Street News , auteur : Zhao Ying





