Jensen Huang est Satoshi Nakamoto

marsbitXuất bản vào 2026-03-19Cập nhật gần nhất vào 2026-03-19

Tóm tắt

L'article explore les parallèles entre Jensen Huang, PDG de NVIDIA, et le mystérieux créateur du Bitcoin, Satoshi Nakamoto. Tous deux ont défini une économie basée sur les "tokens", mais avec des objectifs fondamentalement différents. Nakamoto a créé le token crypto comme une marchandise numérique rare, dont la valeur repose sur la croyance et la spéculation. En revanche, Huang présente le token d'IA comme une commodité productive, consommée instantanément pour alimenter l'inférence et le raisonnement des modèles. Sa valeur est immédiate et utilitaire, comme l'électricité. Lors de la GTC 2026, Huang a détaillé une véritable "économie du token", segmentant le marché en différents niveaux de prix et de performances. Alors que la rareté du Bitcoin est artificielle (limitée par le code), celle des tokens d'IA est physique, contrainte par les lois de la thermodynamique, la puissance électrique et la surface des data centers. La conclusion est claire : le token crypto est un actif spéculatif à thésauriser, tandis que le token d'IA est une ressource utilitaire à consommer. Huang n'est pas qu'un vendeur de matériel ; il est l'architecte des règles du jeu de la nouvelle économie de l'IA, là où Nakamoto a disparu après avoir lancé la sienne.

Auteur : Luo Yihang

En janvier 2009, un anonyme a inventé quelque chose appelé "token". Vous y investissez de la puissance de calcul, obtenez des tokens, et ces tokens circulent, sont évalués et échangés dans un réseau de consensus. Toute l'économie cryptographique est née de là. Plus de dix ans plus tard, les gens débattent encore de la valeur de ces tokens.

En mars 2025, un homme en veste de cuir a redéfini un autre type de token. Vous investissez de la puissance de calcul, produisez des tokens, et ces tokens sont immédiatement consommés dans un processus de raisonnement et d'inférence IA : pour penser, raisonner, écrire du code, prendre des décisions. Toute l'économie de l'IA s'accélère ainsi. Personne ne discute de la valeur de ce type de token, car vous venez d'en utiliser des millions ce matin même.

Deux types de tokens, un même nom, une même structure sous-jacente : de la puissance de calcul entre, quelque chose de valeur sort.

En mars 2026, assis dans la salle du NVIDIA GTC, j'ai écouté le discours principal de Jensen Huang, presque sans promotion commerciale. Oui, il a présenté Vera Rubin, un produit combinant CPU et GPU. Mais cette fois, il n'a pas parlé des paramètres des puces, ni de la finesse de gravure. Il a parlé d'une économie complète autour de la production, de la tarification et de la consommation des tokens :

Quel modèle correspond à quelle vitesse de token ; quelle vitesse de token correspond à quelle fourchette de prix ; quelle fourchette de prix nécessite quel niveau de matériel pour être soutenue.

Il a même préparé pour les PDG et décideurs présents dans la salle, qui tiennent les cordons de la bourse des entreprises, un plan de répartition de la puissance de calcul des centres de données : 25 % pour le niveau gratuit, 25 % pour le milieu de gamme, 25 % pour le haut de gamme, 25 % pour le niveau premium.

Oui, cette fois il n'a pas vendu un groupe de GPU spécifique, comme il l'avait fait avec Blackwell il y a deux ans. Mais cette fois, il vendait quelque chose de plus grand. Après deux heures, j'ai senti que ce qu'il voulait surtout dire était : Bienvenue pour consommer des tokens, et seule l'usine de Nvidia peut les produire.

À ce moment, j'ai réalisé que cet homme, et la personne anonyme qui a miné le premier token il y a 17 ans, faisaient structurellement exactement la même chose.

La même règle de transformation

L'anonyme utilisant le pseudonyme "Satoshi Nakamoto" a écrit en 2008 un livre blanc de neuf pages, concevant un ensemble de règles : investir de la puissance de calcul, accomplir une preuve de travail (Proof of Work), obtenir une récompense sous forme de crypto token.

La subtilité de ces règles réside dans le fait qu'elles ne nécessitent que chacun accepte ces règles pour devenir automatiquement participant de cette économie. Ces règles sont justes, après tout, elles ont rassemblé tant de personnes pleines de tromperies.

Et Jensen Huang, sur la scène du GTC 2026, a fait une chose structurellement identique.

Il a montré un graphique illustrant la relation et la tension entre l'efficacité de l'inférence et la consommation de tokens : l'axe Y représente le débit (nombre de tokens produits par mégawatt), l'axe X représente l'interactivité (la vitesse perçue par utilisateur pour chaque token). Puis, il a indiqué cinq niveaux de prix sous l'axe X : Gratuit utilisant Qwen 3, 0$/million de tokens ; Moyen utilisant Kimi K2.5, 3$/million de tokens ; Élevé utilisant GPT MoE, 6$/million de tokens ; Premium utilisant GPT MoE 400K context, 45$/million de tokens ; et Ultra, 150$/million de tokens.

Ce graphique pourrait presque servir de couverture au "livre blanc" de l'économie des tokens de Jensen Huang.

Satoshi Nakamoto a défini "ce qu'est un calcul de valeur" – réaliser une collision de hachage SHA-256 a de la valeur. Et Jensen Huang a défini "ce qu'est un raisonnement de valeur" – produire des tokens pour un scénario spécifique à une vitesse spécifique sous une contrainte de puissance donnée a de la valeur.

Ni Satoshi Nakamoto ni Jensen Huang ne produisent directement des tokens ; ils définissent tous deux les règles de production des tokens et les mécanismes de tarification.

Une phrase prononcée par Huang sur scène pourrait presque être écrite dans le résumé du livre blanc sur l'économie des tokens –

Les tokens sont la nouvelle matière première, et comme toutes les matières premières, une fois qu'elle atteint un point d'inflexion, une fois qu'elle devient mature, elle se segmentera en différentes parties.

Le token est la nouvelle matière première. Les matières premières, une fois matures, se segmentent naturellement. Il ne décrit pas la situation actuelle, il anticipe une structure de marché, puis positionne précisément sa gamme de produits matériels sur chaque couche de cette structure.

Les deux processus de production de tokens ont même une symétrie sémantique : le minage s'appelle mining, l'inférence s'appelle inference.

L'essence du minage et de l'inférence est de transformer l'électricité en argent. Les mineurs dépensent de l'électricité pour miner des crypto tokens, puis les vendent ; les modèles d'inférence et les Agents IA dépensent de l'électricité pour produire des tokens IA, puis les vendent aux développeurs au prix du million. Les intermédiaires diffèrent, mais les deux extrémités sont identiques : à gauche le compteur électrique, à droite les revenus.

Deux écritures de la rareté

La décision de conception la plus importante de Satoshi Nakamoto n'était pas le Proof of Work, mais le plafond de 21 millions de bitcoins. Il a utilisé le code pour créer une rareté artificielle – peu importe le nombre de mineurs qui affluent, le nombre total de bitcoins ne dépassera jamais 21 millions. Cette rareté est l'ancre de valeur de toute l'économie cryptographique.

Et Jensen Huang, utilisant les lois de la physique, a créé une rareté naturelle. Il a dit :

"Vous devez toujours construire un centre de données d'un gigawatt. Vous devez toujours construire une usine d'un gigawatt, et cette usine d'un gigawatt amortie sur 15 ans... coûte environ 40 milliards de dollars même quand vous n'y mettez rien. C'est 40 milliards de dollars. Vous feriez mieux de vous assurer de mettre le meilleur système informatique là-dedans pour avoir le meilleur coût par token."

Un centre de données de 1GW ne deviendra jamais 2GW. Ce n'est pas une limitation du code, c'est la loi de la physique.

Le terrain, l'électricité, le refroidissement – chacun a une limite physique. La quantité de tokens que cette usine, construite pour 40 milliards de dollars, peut produire au cours de sa durée de vie de 15 ans dépend entièrement de l'architecture de calcul que vous y placez.

La rareté de Satoshi Nakamoto peut être forkée. Si vous n'aimez pas le plafond de 21 millions, fork une nouvelle chaîne, changez-le pour 200 millions, appelez-la Ether ou n'importe quoi d'autre, comme vous voulez, et publiez un autre livre blanc au passage. Et les gens l'ont fait, avec enthousiasme.

Et la rareté créée par Huang ne peut pas être forkée. Après tout, vous ne pouvez pas forker la deuxième loi de la thermodynamique, vous ne pouvez pas forker la capacité du réseau électrique d'une ville, vous ne pouvez pas forker la surface physique d'un terrain.

Mais que ce soit Satoshi Nakamoto ou Jensen Huang, la rareté qu'ils ont créée a conduit au même résultat : une course aux armements matériels.

L'histoire du minage est : CPU→GPU→FPGA→ASIC. Chaque génération de matériel spécialisé rend la précédente obsolète. Et l'histoire de l'entraînement et de l'inférence IA répète cela : Hopper→Blackwell→Vera Rubin→Groq LPU. Matériel généraliste au début, matériel spécialisé pour conclure. Le Groq LPU présenté par Huang au GTC cette année, ce processeur à flux de données déterministe publié après l'acquisition de Groq. Compilation statique, ordonnancement par le compilateur, pas d'ordonnancement dynamique, 500 Mo de SRAM sur puce – son architecture philosophique est l'ASIC du domaine de l'inférence. Ne fait qu'une chose, mais la fait à la perfection.

Il est intéressant de noter : le GPU a joué un rôle clé dans les deux vagues.

Vers 2013, les mineurs ont découvert que le GPU était plus adapté que le CPU pour miner les crypto tokens, les cartes graphiques NVIDIA ont été vendues à rupture de stock. 10 ans plus tard, les chercheurs ont découvert que le GPU est le meilleur outil pour entraîner et inférer les modèles IA, les cartes NVIDIA pour centres de données sont à nouveau vendues à rupture de stock. Le GPU, en tant que catégorie de processeur, a servi deux générations d'économie de tokens.

La différence est que la première fois, NVIDIA en a bénéficié passivement, puis c'est tout. Et la deuxième fois, alors que le champ de bataille principal de la consommation de calcul IA passait de la préformation à l'inférence, NVIDIA a rapidement saisi l'opportunité de concevoir activement tout le jeu, devenant le rédacteur des règles du jeu de l'IA.

Les pelles les plus rentables du monde

Pendant la ruée vers l'or, ce ne sont pas les chercheurs d'or qui gagnent le plus d'argent, c'est le vendeur de pelles Levi Strauss. Pendant la ruée vers le minage, ce ne sont pas les mineurs qui gagnent le plus d'argent, ce sont les fabricants de matériel de minage comme Bitmain et Wu Jihan. Dans la vague de préformation et d'inférence IA, ce ne sont pas les modèles de base et les Agents qui gagnent le plus d'argent, c'est le vendeur de GPU, NVIDIA.

Mais soyons honnêtes, le rôle de Bitmain et de NVIDIA dans leurs industries respectives n'est plus comparable.

Bitmain ne vendait que des mineurs, et NVIDIA était même un fournisseur de Bitmain. Vous achetiez un mineur, quelle pièce miner, dans quelle pool, à quel prix vendre, tout cela n'avait rien à voir avec Bitmain. C'était un fournisseur de matériel pur, gagnant un profit ponctuel sur l'équipement.

NVIDIA est différent. Il ne vend pas seulement du matériel, maintenant, surtout depuis l'explosion de l'IA côté inférence en 2025, il définit profondément ce qui devrait être miné avec ce GPU, comment tarifer le token, à qui vendre le token, comment répartir la puissance de calcul dans le centre de données... Tout cela est dans les PPT du discours de Huang : il divise le marché en cinq niveaux, chaque niveau correspondant à quel modèle, longueur de contexte, vitesse d'interaction et prix... NVIDIA a standardisé, formaté le futur marché piloté par l'inférence IA.

Vers 2018, la puissance de calcul mondiale était concentrée dans quelques grandes pools – F2Pool, Antpool, BTC.com – elles se faisaient concurrence pour les parts de calcul, mais la source des mineurs était hautement concentrée chez Bitmain.

Tout comme NVIDIA aujourd'hui, 60 % des revenus proviennent des "hyperscalers" en concurrence, comme AWS, Azure, GCP, Oracle, CoreWeave, et 40 % proviennent de projets IA natifs dispersés, de projets d'IA souveraine et de clients entreprises. Les grandes "pools" contribuent majoritairement aux revenus, les petits "mineurs" apportent résilience et diversification.

La structure des deux écosystèmes est exactement la même. Mais Bitmain a ensuite rencontré des concurrents – des mineurs comme MicroBT, Innosilicon, Canaan ont grignoté ses parts. Le mineur est une conception ASIC relativement simple, les suiveurs ont une chance. Et ébranler NVIDIA semble devenir de plus en plus difficile : 20 ans d'écosystème CUDA, une base installée de centaines de millions de GPU, la technologie d'interconnexion NVLink de sixième génération, l'architecture d'inférence découplée après l'intégration de Groq – la complexité technologique et les barrières écosystémiques de NVIDIA rendent la plupart des outils de compétition inefficaces.

Cela pourrait durer 20 ans.

La divergence fondamentale des deux tokens

Ce qui distingue fondamentalement les crypto tokens des tokens d'entraînement et d'inférence IA, ce sont les motivations et la psychologie des utilisateurs.

La demande de crypto token est spéculative. Personne n'"a besoin" de Bitcoin pour accomplir son travail. Tous les livres blancs affirmant que les jetons blockchain peuvent vous aider à résoudre des problèmes sont écrits par des escrocs. Vous détenez des cryptos parce que vous croyez qu'à l'avenir, quelqu'un vous les achètera à un prix plus élevé. La valeur du Bitcoin provient d'une prophétie auto-réalisatrice : suffisamment de gens croient qu'il a de la valeur, alors il a de la valeur. C'est une économie de la croyance.

Et la demande de token IA est productive. Nestlé a besoin de tokens pour prendre des décisions de supply chain – ses données de supply chain passent d'un rafraîchissement toutes les 15 minutes à toutes les 3 minutes, réduisant les coûts de 83%, cette valeur peut être directement reportée sur le P&L. 100% des ingénieurs de NVIDIA ont déjà besoin de tokens pour écrire du code au lieu de le faire manuellement ; les équipes de recherche ont besoin de tokens pour faire de la recherche. Vous n'avez pas besoin de croire que le token a de la valeur, vous avez juste à l'utiliser, la valeur se prouve d'elle-même dans l'usage.

C'est la différence la plus essentielle entre les deux tokens. Le crypto token est produit pour être détenu et échangé – sa valeur réside dans le non-usage. Le token IA est produit pour être consommé immédiatement – sa valeur réside dans le moment où il est utilisé.

L'un est de l'or numérique, qui prend de la valeur en étant thésaurisé ; l'autre est de l'électricité numérique, produite pour être brûlée.

Cette différence détermine : l'économie du token IA ne se bullera pas comme l'économie du crypto token. Le Bitcoin monte et descend fortement, car le prix d'un actif spéculatif est piloté par l'émotion. Mais le prix du token est piloté par le volume d'usage et le coût de production, tant que l'IA reste utile – tant que les gens utilisent encore Claude Code pour écrire du code, ChatGPT pour rédiger des rapports, des Agents pour exécuter des processus métier, la demande de tokens ne s'effondrera pas. Elle ne repose pas sur la croyance, mais sur l'indispensabilité.

En 2008, le livre blanc Bitcoin devait longuement argumenter pourquoi un système de cash électronique décentralisé avait de la valeur. 17 ans plus tard, les gens en débattent encore.

En 2026, l'économie des tokens n'a suscité aucun débat, elle est même devenue un consensus sans avoir besoin d'être argumentée. Lorsque Huang a déclaré sur la scène du GTC "les tokens sont la nouvelle matière première", personne n'a contesté. Car chaque personne assise dans la salle avait consommé des millions de tokens ce matin même avec Claude Code ou ChatGPT. Ils n'avaient pas besoin d'être convaincus que le token a de la valeur – leur relevé de carte de crédit l'avait déjà prouvé.

En ce sens, Huang est vraiment le double de Satoshi Nakamoto, ce double qui est resté pour monopoliser la production de mineurs, définir les scénarios d'usage et les normes d'utilisation des tokens, et organiser chaque année un show au SAP Center de San Jose pour montrer à quel point la prochaine génération de "mineurs" supportant l'entraînement et l'inférence IA est puissante.

Satoshi Nakamoto avait le charme d'une retenue désireuse, il concevait les règles, les confiait au code, puis disparaissait. C'est la romance du cypherpunk. Et Huang est plus homme d'affaires que tout scientifique, il conçoit les règles, les entretient lui-même, ajoute constamment des briques pour consolider son avantage concurrentiel.

Ce token que vous voyiez autrefois parce que vous croyiez, maintenant vous le voyez sans avoir besoin de croire. C'est le suivant après le watt, l'ampère, le bit.

Câu hỏi Liên quan

QQui est comparé à Satoshi Nakamoto dans l'article et pourquoi ?

AL'article compare Jensen Huang, PDG de NVIDIA, à Satoshi Nakamoto. La raison principale est que tous deux ont défini des règles économiques fondamentales pour la production et la valorisation de tokens, bien que dans des domaines différents : les crypto-monnaies pour Nakamoto et l'IA pour Huang.

QQuelle est la différence fondamentale entre les tokens de crypto-monnaie et les tokens d'IA selon l'article ?

ALa différence fondamentale est que la valeur des tokens de crypto-monnaie repose sur la spéculation et la croyance (une économie de la foi), tandis que la valeur des tokens d'IA est immédiate et utilitaire, car ils sont consommés pour générer de la productivité (comme écrire du code ou prendre des décisions).

QComment Jensen Huang a-t-il défini l'économie des tokens d'IA lors du GTC 2026 ?

ALors du GTC 2026, Jensen Huang a présenté un cadre économique qui segmentait le marché des tokens d'IA en différents niveaux de prix et de performances, en fonction de la vitesse de traitement, du modèle utilisé et du coût par million de tokens. Il a également proposé une répartition type de la puissance de calcul dans les data centers.

QQuel est la source de la rareté créée par Huang, par opposition à celle créée par Nakamoto ?

ASatoshi Nakamoto a créé une rareté artificielle via le code en limitant le nombre de bitcoins à 21 millions. Jensen Huang crée une rareté naturelle et physique, dictée par les lois de la thermodynamique, les contraintes des réseaux électriques et la disponibilité limitée des terrains pour construire des data centers.

QQuel rôle le GPU a-t-il joué dans les deux économies de tokens évoquées ?

ALe GPU a joué un rôle clé dans les deux vagues économiques. Il a d'abord été utilisé par les mineurs de crypto-monnaies car plus efficace que le CPU pour le minage'. Aujourd'hui, il est essentiel pour l'entraînement et l'inférence des modèles d'IA, faisant de NVIDIA un acteur dominant.

Nội dung Liên quan

Khối tài sản của Elon Musk vượt qua vốn hóa thị trường Bitcoin: Trò chơi tài sản bùng nổ của SpaceX

Elon Musk đã vượt qua vốn hóa thị trường của Bitcoin, với tài sản cá nhân ước đạt 1,32 nghìn tỷ USD so với 1,29 nghìn tỷ USD của Bitcoin. Điều này chủ yếu nhờ vào đà tăng mạnh của SpaceX sau khi lên sàn, với giá cổ phiếu tăng hơn 50% trong tuần đầu, đưa vốn hóa lên khoảng 2,7 nghìn tỷ USD. Sự kiện này phản ánh sự dịch chuyển vốn đầu cơ từ thị trường tiền mã hóa sang SpaceX, được một số người ví như "cổ phiếu meme trị giá 2 nghìn tỷ USD". Làn sóng mua vào mạnh mẽ đến từ các nhà đầu tư bán lẻ, đặc biệt là ở Hàn Quốc, cùng với giao dịch sôi động cho các quỹ ETF có đòn bẩy liên kết với SpaceX. Tuy nhiên, định giá cao của SpaceX đi kèm với những câu hỏi về cơ bản. Công ty báo lỗi gần 50 tỷ USD vào năm 2025 và tiếp tục thua lỗ trong quý I/2026. Định giá hiện tại phần lớn dựa trên lời hứa của Musk về doanh thu 1 nghìn tỷ USD vào năm 2030 và tiềm năng từ Starlink, AI và hệ sinh thái công nghệ của ông. Mốc so sánh này cho thấy trọng tâm ưa thích rủi ro của thị trường hiện nay: giao dịch đầu cơ lớn nhất không còn là tiền mã hóa, mà có thể là một công ty hàng không vũ trụ đang được định giá cho tương lai xa.

marsbit19 phút trước

Khối tài sản của Elon Musk vượt qua vốn hóa thị trường Bitcoin: Trò chơi tài sản bùng nổ của SpaceX

marsbit19 phút trước

a16z: Ngành Công nghiệp Crypto Bước Vào Thời Đại 'Cho Tôi Xem Bằng Chứng'

Ngành công nghiệp tiền mã hóa đang bước vào kỷ nguyên "show me", nơi các dự án cần cung cấp bằng chứng cụ thể hơn là chỉ những lời hứa và tầm nhìn xa. Sau những vụ bê bối và sự giám sát ngày càng chặt chẽ, cộng đồng và các nhà đầu tư trở nên hoài nghi hơn với những câu chuyện kể đơn thuần. Sự gia nhập của các tổ chức tài chính truyền thống lớn như BlackRock, Fidelity và JPMorgan với các sản phẩm thực tế đã nâng cao tiêu chuẩn cho một "dự án đáng tin cậy". Bài viết nhấn mạnh rằng logic truyền thông đang thay đổi. Thay vì chỉ nói "chúng tôi đang xây dựng tương lai của thanh toán", một dự án thuyết phục cần phải chứng minh: "Chúng tôi đã rút ngắn thời gian chuyển tiền xuyên biên giới từ ba ngày xuống còn bốn phút, và đã có doanh nghiệp thực sự sử dụng." Cái gọi là "chồng bằng chứng" giờ đây bao gồm dữ liệu chính xác (khối lượng giao dịch chính thức, người dùng hoạt động, doanh thu), các đối tác thực sự có thể xác minh công khai và sự phù hợp thị trường sản phẩm được chứng minh bởi người dùng tự nhiên. Điều này đặt ra áp lực nhưng cũng tạo cơ hội cho các nhà xây dựng. Ngưỡng truyền thông cao hơn sẽ loại bỏ nhiều dự án chỉ dựa trên bao bì khái niệm, đồng thời giúp những đội ngũ có sản phẩm, dữ liệu và người dùng thực sự dễ được nhận ra hơn. Tầm nhìn vẫn quan trọng, nhưng nó phải được hỗ trợ bởi những thành quả hiện tại. Trong kỷ nguyên mới này, chiến lược truyền thông hiệu quả phải được thiết kế để trưng ra bằng chứng, chứ không còn là hứa hẹn về chúng.

marsbit22 phút trước

a16z: Ngành Công nghiệp Crypto Bước Vào Thời Đại 'Cho Tôi Xem Bằng Chứng'

marsbit22 phút trước

Tin Nóng, Người Đồng Phụ Trách Gemini Của Google Bị OpenAI Tuyển Dụng

Ngày 19/6, nhà nghiên cứu Noam Shazeer của Google DeepMind, đồng lãnh đạo dự án Gemini, chính thức gia nhập OpenAI với vai trò Trưởng nhóm nghiên cứu kiến trúc. Ông sẽ phụ trách khám phá kiến trúc thế hệ AI mới và thúc đẩy sự phát triển tiếp theo của kiến trúc Transformer. Shazeer là một nhân vật huyền thoại, một trong những tác giả chính của bài báo năm 2017 "Attention Is All You Need", đặt nền móng cho kiến trúc Transformer - cốt lõi của các mô hình lớn hiện đại như GPT, Gemini, Claude. Trước đó, ông từng rời Google để đồng sáng lập Character.AI vào năm 2021. Năm 2024, Google đã ký một thỏa thuận trị giá khoảng 27 tỷ USD để đưa Shazeer và một phần đội ngũ trở lại DeepMind, nơi ông trở thành đồng lãnh đạo Gemini. Việc chuyển sang OpenAI của Shazeer được xem là một tổn thất lớn đối với Google và là một bước tăng cường quan trọng cho OpenAI trong cuộc cạnh tranh khốc liệt với Anthropic. Nhiệm vụ của ông tại OpenAI là nghiên cứu hướng đi mới cho kiến trúc AI sau thời đại Transformer. Sự kiện này phản ánh cuộc chiến tranh giành nhân tài cấp cao ngày càng gay gắt giữa các gã khổng lồ AI.

marsbit46 phút trước

Tin Nóng, Người Đồng Phụ Trách Gemini Của Google Bị OpenAI Tuyển Dụng

marsbit46 phút trước

Mất 10 năm, cuối cùng Sam Altman cũng có được người mà ông muốn

Sau 2 năm trở lại Google với thỏa thuận trị giá 2,7 tỷ USD, Noam Shazeer - một trong những tác giả của kiến trúc Transformer mang tính bước ngoặt - đã chính thức rời công ty để gia nhập OpenAI. Trong thông báo trên X, Shazeer bày tỏ lòng tự hào về những gì đã xây dựng tại Google nhưng cũng bày tỏ sự hào hứng khi được hợp tác với đội ngũ tại OpenAI. CEO Sam Altman của OpenAI tiết lộ rằng ông đã muốn làm việc cùng Shazeer từ khi thành lập công ty, và phải mất 10 năm mới có được cơ hội này. Shazeer sẽ đảm nhận vị trí Trưởng nhóm Nghiên cứu Kiến trúc tại OpenAI. Mark Chen, Trưởng bộ phận Nghiên cứu của OpenAI, nhấn mạnh những đóng góp to lớn của Shazeer trong các lĩnh vực như Transformer, mô hình hỗn hợp chuyên gia (MoE) và giải mã hiệu quả, đồng thời tin tưởng vào tầm nhìn của ông về phát triển AGI an toàn. Việc Shazeer, từng là đồng lãnh đạo kỹ thuật của dự án Gemini tại Google, chuyển sang đối thủ cạnh tranh trực tiếp được coi là một tổn thất nhân sự lớn đối với Google. Nhiều ý kiến trong cộng đồng cho rằng điều này có thể ảnh hưởng đến nỗ lực phát triển Gemini, trong khi một số khác coi đây là một "thỏa thuận mua lại" cực kỳ có lợi cho OpenAI. Sự kiện này làm nổi bật cuộc chiến tranh giành nhân tài khốc liệt trong ngành AI.

marsbit51 phút trước

Mất 10 năm, cuối cùng Sam Altman cũng có được người mà ông muốn

marsbit51 phút trước

Thu Nhập 13 Tỷ USD, Chi 17.2 Tỷ USD Cho Microsoft: Sự Thật Về Số Tiền Khổng Lồ Đang Đốt Cháy Trong Ngành AI Qua Bộ Sổ Sách Rò Rỉ Của OpenAI

Vào tháng 6/2026, một tài liệu tài chính bị rò rỉ của OpenAI cho thấy công ty đạt doanh thu 13,07 tỷ USD vào năm 2025 nhưng cũng chịu lỗ hoạt động 20,92 tỷ USD, tương đương chi 1,6 USD cho mỗi USD kiếm được. Chi phí chủ yếu đến từ R&D (19,18 tỷ USD, gồm 10,59 tỷ USD trả cho Microsoft) và chi phí tính toán suy luận (7,5 tỷ USD). Một gánh nặng cấu trúc lớn là khoản thanh toán 17,2 tỷ USD cho Microsoft, chiếm 50,5% tổng chi phí. Đây không phải là hiện tượng cá biệt. XAI của Elon Musk báo lỗ hoạt động 6,4 tỷ USD so với doanh thu 3,2 tỷ USD năm 2025. Anthropic tuy tăng trưởng doanh thu nhanh (ARR 47 tỷ USD vào 5/2026) nhưng cũng chịu áp lực chi phí suy luận cao, với tỷ suất lãi gộp chỉ 40%. Cả ba công ty hàng đầu này cùng chịu lỗ hoạt động tổng cộng hơn 30 tỷ USD năm 2025, cho thấy mô hình "đốt tiền đổi quy mô" là phổ biến. Với 9 tỷ người dùng hoạt động hàng tuần, ChatGPT có tỷ lệ chuyển đổi sang trả phí chỉ khoảng 5,6% (50 triệu người). Áp lực biến đổi người dùng miễn phí thành doanh thu ngày càng lớn khi chi phí suy luận tăng. Trong khi Anthropic tập trung vào định giá cao cho doanh nghiệp, OpenAI vẫn duy trì mô hình đăng ký phổ thông 20 USD/tháng. Tương lai của ngành phụ thuộc vào việc giảm mạnh chi phí biên, thông qua chip chuyên dụng hoặc đổi mới kiến trúc, để thoát khỏi vòng xoáy lỗ hiện tại.

marsbit1 giờ trước