Le monde entier convoite les affaires de Nvidia.
Selon les résultats financiers du quatrième trimestre de l'exercice 2026 (clos fin janvier 2026) publiés par Nvidia, sa marge brute GAAP atteignait 75,2 %, une véritable machine à imprimer de l'argent, capacité largement due au pouvoir de fixation des prix découlant de sa position dominante sur le marché des puces d'IA.
Presque tous les grands modèles de langage fonctionnent sur les puces de calcul de Nvidia, soutenant sa capitalisation boursière avoisinant les 5 000 milliards de dollars.
Mais précisément pour cette raison, presque toutes les grandes entreprises d'IA tentent, ouvertement ou discrètement, de s'extraire de la cage de Nvidia, ne voulant pas lui confier leur destin. Le récent DeepSeek V4, selon son rapport technique, a très probablement été entraîné sur des puces Nvidia, mais est en cours d'adaptation pour l'inférence sur les puces Ascend de Huawei. De plus, il est indiqué qu'après la commercialisation de l'Ascend 950 au second semestre, le prix par token de la version Pro sera considérablement réduit. Outre Huawei Ascend, des fabricants de puces chinois comme Tianshu Zhixin et Cambricon ont également affirmé prendre en charge le nouveau modèle DeepSeek V4.
Aux États-Unis, le fief de Nvidia, Google a développé ses propres puces de calcul TPU (Unité de traitement tensoriel). En avril 2026, le TPU en était à sa huitième génération, formant une gamme complète de puces pour l'entraînement et l'inférence. Meta a également dévoilé en mars sa feuille de route pour ses puces IA sur mesure, prévoyant le déploiement de quatre nouveaux produits de la série MTIA d'ici fin 2027, adaptés aux besoins de calcul internes pour l'IA, tout en maintenant une collaboration à grande échelle avec Nvidia et AMD pour construire un système d'approvisionnement en calcul à double voie « interne + externalisé ».
Oui, pour le moment, aucune entreprise d'IA ne peut se passer de Nvidia, mais Jensen Huang (le PDG de Nvidia) sent tout de même la menace. Lors d'un récent podcast, Huang a estimé que la loi de Moore touchait à sa fin, c'est-à-dire que l'ère où les performances des puces doublaient chaque année était révolue. Aujourd'hui, l'avantage des puces les plus avancées ne constitue pas un avantage concurrentiel éternel, mais un avantage relatif avec une fenêtre temporelle. Une fois que la finesse de gravure approchera les limites physiques, la difficulté pour les suiveurs de rattraper leur retard diminuera.
Huang a déclaré que les restrictions à l'exportation des puces de calcul vers la Chine ralentiraient effectivement le développement de l'IA chinoise à court terme, mais qu'à long terme, cela ne ferait que forcer la Chine à former sa propre chaîne écologique. Ce qu'il n'a pas approfondi, c'est que actuellement, seules les entreprises d'IA chinoises s'engagent résolument dans l'open source, et sont adoptées par de nombreuses entreprises et startups. Si de plus en plus de modèles open source fonctionnent sur des puces de calcul fabriquées en Chine, alors même si Nvidia restera probablement leader du marché, il ne sera plus le seul.
En réalité, même sans la menace des grands modèles open source chinois et des puces de calcul, la concurrence marché inciterait probablement le marché des puces de calcul à évoluer vers une structure de duopole, plutôt que de laisser Nvidia dominer seul.
Il est intéressant de noter que, parmi tous, OpenAI, qui dépend énormément de Nvidia, est paradoxalement celle qui le « poignarde dans le dos » le plus activement.
01
Le 17 avril, heure locale, le fabricant américain de puces IA Cerebras a officiellement déposé une demande d'introduction en bourse (IPO) auprès de la SEC américaine, visant à lever 3 milliards de dollars pour une valorisation de 35 milliards de dollars.
Après avoir retiré sa précédente demande d'IPO en octobre 2025, ce challenger de Nvidia, dont le principal argument de vente est sa « puce à l'échelle d'une galette de silicium » (wafer-scale), a relancé son offensive vers l'IPO en seulement six mois, réussissant à porter la valorisation de l'entreprise de 8,1 à 35 milliards de dollars.
Le point central de cette flambée de valorisation est un accord de coopération avec OpenAI d'une valeur totale de plus de 20 milliards de dollars.
Selon l'accord, OpenAI s'engage à utiliser les grappes de serveurs alimentées par les puces Cerebras au cours des trois prochaines années, Cerebras déploiera quant à lui 750 mégawatts de puissance de calcul pour cette dernière, avec un achèvement prévu d'ici 2028. De plus, OpenAI fournira environ 1 milliard de dollars à Cerebras pour l'aider à développer ses centres de données et obtiendra environ 10 % de bons de souscription d'actions (warrants).
De toute évidence, OpenAI n'est plus un simple client, mais un créancier, et potentiellement un futur actionnaire majoritaire. Le choix de relancer l'IPO à ce moment est très probablement une décision conjointe des deux entreprises.
Le même jour où Cerebras a déposé ses documents pour l'IPO, trois cadres clés d'OpenAI, dont Bill Peebles, le responsable de Sora, ont annoncé leur départ. Parallèlement, le projet « Stargate », d'une valeur de 500 milliards de dollars et considéré comme une étape clé des infrastructures IA américaines, est actuellement dans un désordre total, avec des progrès lents dans la coordination interne et le financement.
Selon des informations divulguées par les revenus d'OpenAI en 2025 s'élevaient à 13,1 milliards de dollars, pour une perte nette atteignant 8 milliards de dollars, avec une prévision de pertes s'envolant à 25 milliards de dollars cette année. Sous la pression de pertes colossales, OpenAI a même dû se couper un bras en abandonnant Sora, son produit de génération vidéo très populaire.
Des analyses indiquent que le coût quotidien de calcul de Sora était d'environ 15 millions de dollars, le coût d'une vidéo de 10 secondes en haute précision étant d'environ 33 dollars. Pendant la période d'exploitation de Sora, les revenus totaux payés par les utilisateurs n'ont été que de 2,1 millions de dollars.
En ces temps agités, Altman (le PDG d'OpenAI) sait parfaitement que une dépendance excessive envers Nvidia deviendrait le point faible le plus important d'OpenAI.
Précédemment, OpenAI a successivement annoncé une collaboration avec Broadcom pour développer des puces sur mesure, l'adoption de la nouvelle puce MI450 d'AMD, envoyant des signaux clairs à l'externe – ne plus vouloir travailler pour Nvidia. C'est dans ce contexte que Cerebras est devenu un pari crucial dans la stratégie de « dé-Nvidiarisation » d'OpenAI.
Bien que peu connu, Cerebras présente des caractéristiques uniques parmi les fabricants de puces.
Presque tous les géants de la conception de puces suivent la voie de la « découpe des galettes de silicium pour créer de petites puces », Cerebras s'est concentré sur le « mur de la mémoire » (memory wall) rencontré lorsque les données sont déplacées entre les puces, adoptant ainsi une approche technologique plus radicale de puce unique.
Le produit phare de Cerebras est le moteur à l'échelle d'une galette de silicium (wafer-scale) WSE-3, fabriqué à partir d'une unique galette de silicium de 300 mm. Comme le calcul, le stockage et l'interconnexion sont tous sur une seule puce, la latence de transmission des données est réduite de 90 % par rapport aux grappes de GPU, s'adaptant particulièrement bien à l'inférence des grands modèles de langage à faible latence.
Dans les scénarios d'inférence, l'architecture wafer-scale pourrait réduire le coût par token de 80 %.
Le responsable du département des infrastructures de calcul d'OpenAI a déclaré que Cerebras avait ajouté une solution dédiée d'inférence à faible latence à la plateforme, permettant non seulement aux utilisateurs d'obtenir des temps de réponse plus rapides, mais aussi de poser les bases pour étendre les technologies d'IA en temps réel à un public plus large.
Plus important encore, la voie indépendante de la HBM (High Bandwidth Memory) empruntée par Cerebras pourrait briser le quasi-monopole de Nvidia sur l'industrie des puces, rendant l'offre de puissance de calcul plus diversifiée.
Tout cela touche parfaitement les points les plus sensibles d'OpenAI, rendant la collaboration entre les deux naturelle.
Outre OpenAI, Cerebras a également conclu un accord avec AWS en mars, les CS-3 seront déployés dans les data centers d'Amazon, intégrant le système d'infrastructure des principales plateformes cloud hyperscale.
02
« Ce qui est le plus excitant dans cette industrie à itération rapide, c'est que les algorithmes deviennent constamment plus rapides, plus précis et plus efficaces – c'est précisément pour cette raison que je ne veux pas me tourner vers ces industries traditionnelles qui ne changent pas d'un iota en neuf ans. »
Que Cerebras en arrive là est étroitement lié à son fondateur, Andrew Feldman.
Contrairement aux fondateurs typiques de sociétés de puces, souvent ingénieurs, Feldman est diplômé de Stanford avec des licences en économie, sciences politiques et un MBA. Dès le début de sa carrière, il a continuellement accumulé de l'expérience dans les domaines du produit et du marketing, ce parcours lui donnant un flair naturel pour les modèles économiques viables.
Avec l'accumulation de l'expérience, Feldman est progressivement passé du statut d'employé à celui d'entrepreneur en série.
Et tous les entrepreneurs en série ont une caractéristique très marquée – vouloir gagner, à tout prix. Ces personnes ne sont pas simplement « compétitives » ordinaires, mais considèrent la « victoire » comme essentielle à leur existence, au même titre que respirer. Ils choisissent généralement de parier dans les « zones inexplorées » du consensus sectoriel, misant tout sur des directions que la majorité estime « inutiles » ou « impossibles ». En d'autres termes, leur « propension à parier » est assez forte.
En 2007, Feldman a fondé SeaMicro, une société de serveurs.
« Aujourd'hui, les grands processeurs sont utilisés comme si nous conduisions la navette spatiale pour aller faire des courses. En réalité, j'ai juste besoin de conduire une Prius. »
SeaMicro a abandonné l'approche traditionnelle de serveurs « bourrés de composants », supprimant tous les composants sauf le CPU, la mémoire et une ASIC sur mesure, offrant « plus de cœurs » aux entreprises Internet spécialisées ayant besoin de charges de travail à « scale-out ». L'entreprise a été rachetée par AMD en 2012 pour 355 millions de dollars.
Bien que l'activité de micro-serveurs ait progressivement disparu après son intégration chez AMD, cette expérience a permis à Feldman d'accumuler une fortune et de renforcer sa méthodologie entrepreneuriale : aux moments de changement de génération, utiliser une conception matérielle « anti-mainstream » pour pénétrer des niches de marché non couvertes par les géants.
Selon les conventions du secteur, le taux de rendement des puces diminue avec l'augmentation de leur surface. Alors que les entreprises de puces suivaient toutes la voie de Nvidia, Feldman a décidé, avec une réflexion très « non conventionnelle », de créer directement une puce entière de la taille d'une assiette.
En 2015, Feldman et son associé technique Gary Lauterbach ont cofondé Cerebras, ramenant avec eux plusieurs anciens collègues de SeaMicro. Cerebras est resté dans l'ombre pendant quatre longues années, jusqu'à la publication de la première génération WSE-1 en août 2019.
Pendant cette période de R&D discrète, Feldman a parié sur deux choses : d'une part, que la technologie de packaging à l'échelle du wafer de TSMC mûrirait progressivement, et d'autre part, que la taille des modèles d'IA deviendrait si grande que le mur de la mémoire des GPU deviendrait un goulot d'étranglement fatal.
Au regard du développement actuel, son pari a été gagnant.
De 2019 à 2024, Cerebras a sorti une nouvelle génération tous les deux ans, la finesse de gravure passant de 16 nm à 7 nm puis à 5 nm, le nombre de transistors passant de 1,2 billion à 4 billions. Parallèlement, Feldman a commencé à prospecter activement de grands clients. En 2023, il s'est rendu à Abu Dhabi pour conclure un accord avec G42.
Cerebras et G42 ont collaboré pour entraîner le modèle de langage le plus avancé dans le domaine arabe, créant conjointement le réseau Condor Galaxy composé de neuf supercalculateurs interconnectés. Cette collaboration étroite avec cette entreprise du Moyen-Orient a également déclenché un examen de sécurité nationale de Cerebras par le Comité américain sur l'investissement étranger (CFIUS), mais Feldman s'en moque – l'examen prouve sa valeur.
« Si vous ne travaillez que 38 heures par semaine et que vous voulez encore défier un gorille de 800 livres comme Nvidia ? Pas question. Vous avez besoin de chaque minute de veille. »
Feldman a été interrogé lors d'un entretien sur son opinion concernant « l'équilibre entre vie professionnelle et vie privée », il a donné une réponse négative assez radicale. Il ne cache pas son ambition de lancer un défi à Nvidia.
Se référant à la croissance centuple de Nvidia sur dix ans, Feldman nourrit des attentes assez optimistes quant aux perspectives de Cerebras : développer des traitements pour des millions de patients dans les 3 à 5 prochaines années ; fournir une puissance de calcul d'inférence pour des applications qui n'existent pas encore ; permettre au grand public d'utiliser la technologie de l'entreprise sans même s'en rendre compte.
03
La course à l'IPO de Cerebras fait face à des controverses incessantes, les optimistes espérant assister à la naissance d'un second Nvidia, tandis que les pessimistes remettent en question la stabilité de ses performances.
D'après les informations financières officielles divulguées, les revenus de Cerebras sont passés de 24,6 millions de dollars en 2022 à 510 millions de dollars en 2025, avec un taux de croissance annuel composé (TCAC) de 175 % sur quatre ans. Point particulièrement notable, le bénéfice net GAAP de 2025 s'élevait à 238 millions de dollars, renversant la tendance de la perte nette de 482 millions de dollars en 2024.
Mais une analyse plus approfondie révèle que la rentabilité GAAP est due à un gain comptable non monétaire de 363 millions de dollars, gain résultant en réalité d'une opération comptable consistant à retirer du bilan les passifs liés à G42 suite à l'examen de sécurité américain. Excluant cet élément non récurrent, la perte nette non GAAP réelle était de 75,7 millions de dollars.
En d'autres termes, le « retour à la rentabilité » de Cerebras est un jeu comptable.
En 2023 et 2024, G42 a contribué respectivement à 83 % et 87 % du chiffre d'affaires total de Cerebras. Alors que les conflits géopolitiques s'aggravent, le risque lié à la dépendance envers un client unique du Moyen-Orient est préoccupant. Après tout, le retrait de la première tentative d'IPO de Cerebras était en partie dû à l'examen de sécurité nationale.
Selon le prospectus, la grande majorité des 24,6 milliards de dollars d'obligations restantes à exécuter dépend de l'accord de 20 milliards de dollars signé avec OpenAI. En d'autres termes, les revenus anticipés de Cerebras reposent presque entièrement sur l'engagement à long terme d'OpenAI, et non sur une base clientèle large et diversifiée.
La concrétisation de cette commande « stimulante » dépend du destin même d'OpenAI. Lorsque la stabilité du plus grand client est elle-même scrutée de près par le marché, combien de ce « chèque en bois » sera honoré, Feldman lui-même ne pourrait probablement pas le garantir.
La comparaison avec Nvidia montre encore mieux les faiblesses de Cerebras.
Avant l'explosion de l'industrie de l'IA, Nvidia avait déjà établi une clientèle diversifiée dans plusieurs domaines comme le gaming, la visualisation professionnelle, les data centers, aucun client unique ne représentant plus de 10 % de ses revenus. Nvidia, au cours de son évolution sur plus de vingt ans, s'est profondément liée à des millions de développeurs, chaque itération de produit découlant des besoins d'expansion de son écosystème interne, avec une feuille de route de développement produit très claire. L'écosystème de Cerebras en est à un stade très précoce, il s'agit encore d'une percée ponctuelle dans le scénario de l'inférence, et il reste un long chemin à parcourir avant de devenir une véritable entreprise plateforme.
Même sans l'apparition soudaine de ChatGPT, Nvidia était une entreprise de qualité aux revenus stables et aux bénéfices solides. Mais sans la commande de 20 milliards de dollars d'OpenAI, Cerebras n'aurait probablement même pas la possibilité de viser une IPO.
En décembre 2025, Nvidia a conclu un accord de coopération spécial d'une valeur d'environ 20 milliards de dollars en cash avec Groq, un concurrent de Cerebras. Nvidia a obtenu une licence perpétuelle non exclusive de l'architecture d'inférence LPU de Groq et de la stack technologique complète de conception de puces.
L'entrée en scène de Jensen Huang signifie que la valeur de l'architecture dédiée à l'inférence à faible latence de Cerebras est reconnue par un géant de l'industrie, mais elle augmente aussi considérablement la pression concurrentielle sur Cerebras.
En pratique, l'introduction de Cerebras par OpenAI n'est pas pour remplacer, mais pour servir de « poisson-chat » (élément stimulateur), augmenter le pouvoir de négociation et diversifier les risques de la chaîne d'approvisionnement.
Selon des informations, les systèmes basés sur les puces Groq de Nvidia devraient sortir au second semestre 2026. Si Altman se retournait et parvenait à un accord avec Huang, Cerebras pourrait facilement devenir la victime sacrificielle.
Dans la course aux puces IA, un marché de milliers de milliards de dollars, une concurrence diversifiée est sans aucun doute bénéfique pour le développement à long terme de l'écosystème sectoriel. Mais les marchés financiers ne manquent jamais de histoires de création de richesse et de battage médiatique, Cerebras devra encore surmonter de multiples épreuves pour concrétiser véritablement sa valeur technologique et commerciale.
Le joli titre de « challenger de Nvidia » pourrait bien n'être qu'une bulle éphémère.
Mais comme le révèle le « paradoxe de Jevons », le progrès technologique améliore l'efficacité d'utilisation des ressources, réduit le coût unitaire de production, et comme les gens peuvent se le permettre et l'utilisent davantage, cela conduit反而 à une augmentation de la consommation totale de ressources. Alors que l'IA pénètre plus largement tous les aspects de la vie, dans un avenir prévisible, la demande en puissance de calcul continuera de croître rapidement.
Ce super marché de centaines de milliards, voire de milliers de milliards de dollars, ne concerne pas seulement l'économie, mais aussi la sécurité géopolitique. Personne ne veut remettre les clés de son destin aux mains de Nvidia seule.
Mais il est évident que, ne serait-ce que par amour-propre, Jensen Huang ne rendra pas facilement les clés.
Cet article provient du compte WeChat « 最话FunTalk » (ID : iFuntalker), auteur : He Yiran, éditeur : Liu Yuxiang







