Nvidia Poised for Record Sales as AI Demand Kicks In

WSJPublié le 2023-05-25Dernière mise à jour le 2023-05-25

Résumé

The graphics-chip giant gives a strong outlook, driven by growing appetite for generative AI technology

Chip giant Nvidia is starting to capitalize on the craze for language-generating artificial intelligence, projecting a more than 64% jump in sales as the company rushes to get more processors in customer hands to satisfy booming interest in the technology.

A new generation of advanced Nvidia chips for AI calculations in data centers is in production, Nvidia CEO Jensen Huang said, and “we are significantly increasing our supply to meet surging demand for them.”

The company forecast a record $11 billion in sales for the current quarter, far above the $7.2 billion Wall Street was expecting and what would be the highest quarterly total ever for the company.

“This demand has extended our data center visibility out a few quarters and we have procured substantially higher supply for the second-half of the year,” Chief Financial Officer Colette Kress said on an earnings call.

Nvidia’s shares, which have more than doubled in value this year, surged more than 28% in after-market trading to reach an all-time high. The rise puts Nvidia, the U.S.’s largest chip-supplier by market value, close to becoming the world’s first $1 trillion chip company.

Demand for computing power that drives language-generating tools such as OpenAI’s ChatGPT is opening a huge new revenue opportunity for the company and others. It has spurred an arms race between tech giants to offer advanced AI features to their customers. Microsoft, which has invested in OpenAI, has been adding the technology to its Bing search engine and business software products. Google has introduced its own advanced AI tools. Facebook parent Meta Platforms also has been working on the technology. Nvidia’s chips are essential in creating these kinds of tools, analysts say, and building just one such AI system can require thousands of Nvidia’s computing engines.

Huang said the company was well-prepared to benefit from the AI opportunity because it was starting to produce a new wave of advanced equipment for data centers when the explosion of interest began last year. “I call it the iPhone moment,” he said, referring to the shift toward smartphones that Apple capitalized on by releasing its advanced handset about 16 years ago. “All the technology came together and helped everybody realize what an amazing product that can be and what capabilities it can have.”

Nvidia doesn’t manufacture its own chips, but farms out production to contract chip-makers including the world’s largest, Taiwan Semiconductor Manufacturing Co. TSMC’s shares, which trade in New York and Taiwan, rose by 7% after-hours in the wake of Nvidia’s results.

Nvidia may be the leading provider of AI chips, but Huang said the battle to supply chips to satisfy demand is fierce. “We have competition from every direction,” he said, from established semiconductor companies to startups.

Nvidia on Wednesday said revenue fell 13% to $7.2 billion in its last fiscal quarter, topping forecasts from analysts surveyed by FactSet. Net profit rose 26% to $2 billion. The sales retreat was driven by a sharp decline in the graphics chips business for videogamers, who pulled back after the pandemic eased and are only beginning to resume buying.

Huang said operators of big data centers are retooling their computing infrastructure to better address the opportunities offered by AI, creating surging demand for its chips.

“A trillion dollars of installed global data center infrastructure will transition from general purpose to accelerated computing as companies race to apply generative AI into every product, service and business process,” he said.

Nvidia’s data center revenue rose to $4.28 billion in its latest quarter, a record, which Kress said reflected strong demand from consumer internet companies and cloud-computing companies.

Nvidia has said it is working on generative AI with Amazon.com, Microsoft and Alphabet’s Google unit, and is partnering with cloud-computing companies to help make generative AI available to smaller businesses. The company on Tuesday said it was adding its AI software to Microsoft’s Azure cloud-computing service, allowing corporate customers to tap in to its chips and software to speed up large generative AI systems.

Nvidia has its roots in graphics-processing chips for videogamers, but has diversified its customer base rapidly in recent years. Engineers found the chips to be well-suited to AI tasks and cryptocurrency mining, which led to an explosion of new sources of demand.

The company has tried to capitalize on that shift by making specialized chips for those markets. Its AI chips have helped its data center division surpass its gaming division in revenues over the past few quarters, a major break from the past. The company has recently begun to roll out a new generation of AI chips for data centers that promise a substantial performance upgrade, and many customers have had to wait for them amid red-hot demand.

The company’s gaming division fell by 38% to $2.2 billion in the latest quarter, which Kress attributed to the macroeconomic slowdown and Nvidia limiting shipments so customers run through existing inventories of chips.

Amid the growth in AI-related sales, new U.S. regulations seeking to hamstring China’s AI industry limited the sale of Nvidia chips there. Nvidia has developed versions of its chips that don’t exceed performance thresholds, but the company said last year that the curbs could cost it up to $400 million in quarterly sales.

Lectures associées

Huang Renxun : Les prompts sont en train de devenir obsolètes, les loops sont le nouveau paradigme

Prompt passe, place aux loops. Tel est le nouveau paradigme souligné par des figures comme Jensen Huang. Le concept de "loop" (boucle) désigne la conception de systèmes où l'IA exécute des tâches de manière autonome : elle définit ses propres instructions, vérifie les résultats, et réitère jusqu'à réussite ou épuisement du budget, sans intervention humaine constante. Contrairement à un agent simple qui nécessite une instruction à chaque étape, un système avec loop fonctionne en continu. Des produits comme Claude Code et OpenAI Codex l'ont déjà implémenté via des fonctionnalités comme `/goal` ou des automations, où un modèle écrit le code et un autre, indépendant, le valide. Pour construire une loop efficace, il faut : 1) s'assurer que la tâche est répétitive, automatisable et dans les limites budgétaires ; 2) commencer par une loop simple avec un déclencheur, une compétence, un fichier d'état et un contrôle ; 3) séparer clairement l'écriture et la validation du code ; 4) éviter les pièges comme l'absence de conditions d'arrêt ou la gestion de tâches nécessitant un jugement humain. Cette évolution s'inscrit dans une progression : après l'ingénierie des prompts (2023-2024), puis du contexte (2024-2025) et du "harnais" (environnement d'exécution, 2025-2026), l'ingénierie des loops représente la dernière étape, où le contrôle humain passe de la micro-gestion à la conception de systèmes autonomes. Des travaux académiques comme ReAct (2022) ont jeté les bases de ce principe de boucle réflexive. Bien que prometteuse, cette approche nécessite prudence quant aux coûts et à la préservation d'une compréhension humaine des systèmes automatisés.

marsbitIl y a 11 mins

Huang Renxun : Les prompts sont en train de devenir obsolètes, les loops sont le nouveau paradigme

marsbitIl y a 11 mins

GPT conçoit GPT

OpenAI a dévoilé son premier puce, Jalapeño, destinée à l'inférence des grands modèles linguistiques. Ce mouvement ne vise pas principalement à concurrencer Nvidia, mais marque une étape stratégique où OpenAI cherche à maîtriser l'ensemble du processus de production de l'intelligence artificielle, des modèles aux puces, en passant par les centres de données et l'énergie. Alors que l'écart entre les modèles se réduit, le vrai fossé se creuse au niveau de la puissance de calcul, des coûts d'inférence et de l'efficacité système. Chaque jeton (Token) généré représente un coût, et OpenAI, avec ses produits à forte demande comme ChatGPT, supporte une « taxe de calcul » importante sur le matériel externe. Jalapeño est conçu pour réduire cette « taxe d'inférence » en optimisant les coûts opérationnels quotidiens. Un détail crucial est le cycle de conception de seulement neuf mois, accéléré par l'utilisation par OpenAI de ses propres modèles d'IA pour aider à concevoir et optimiser la puce. Cela crée un cycle vertueux : de meilleurs modèles conçoivent de meilleures puces, qui réduisent le coût d'exécution des modèles futurs, permettant plus d'utilisateurs et de données pour affiner les prochaines générations de puces. OpenAI ne cherche pas à devenir un fournisseur de matériel comme Nvidia. Son approche s'apparente plutôt à celle d'Apple : construire un écosystème fermé et intégré où les modèles, les produits (ChatGPT, API), les puces et les infrastructures sont optimisés conjointement pour contrôler l'ensemble de la chaîne de valeur de l'IA. À long terme, cela pourrait repositionner les entreprises de modèles en tant que joueurs majeurs de l'infrastructure IA, aux côtés des fournisseurs de matériel traditionnels.

marsbitIl y a 37 mins

GPT conçoit GPT

marsbitIl y a 37 mins

Le directeur exécutif intérimaire de l'Ethereum Foundation s'exprime : Quelle est notre mission ?

Le directeur exécutif intérimaire de l'Ethereum Foundation (EF) définit la mission de l'organisation : garantir qu'Ethereum reste une infrastructure véritablement sans autorisation, résistante à la censure, privée, sécurisée et ouverte, soutenant la coordination souveraine à grande échelle. L'EF n'existe pas pour sa propre importance, sa popularité ou pour soutenir des applications spécifiques. Son rôle central est d'éliminer les faiblesses et les risques d'extraction, de contrôle par des cartels ou des États, et de surveillance. Cela implique de renforcer toutes les couches : le protocole, l'accès, les utilisateurs et les institutions. L'EF mènera par l'exemple en adoptant les paiements en ETH. Les priorités clés incluent : * **Lutte contre le MEV nuisible** : Un enjeu central pour préserver la neutralité. L'EF se concentrera sur la réduction des barrières à la construction de blocs, la garantie de l'inclusion et l'exploration de solutions ouvertes pour le flux d'ordres. * **Confidentialité** : Essentielle pour éviter une plateforme de surveillance. La vie privée inconditionnelle doit précéder toute divulgation sélective. * **Staking** : Doit rester sans autorisation, privé et diversifié pour éviter la concentration des risques. * **Interfaces d'accès** : Doivent maximiser l'autonomie des utilisateurs, pas compromettre les valeurs fondamentales pour une adoption facile. L'EF vise aussi à saisir des opportunités comme faire d'Ethereum la première infrastructure anti-quantique, un "argent numérique" privé, une plateforme pour des agents IA souverains, et une base pour une extension scalable qui préserve l'autonomie. Concernant les départs récents, l'EF les traite avec respect et discrétion, sans commentaires publics sur les cas individuels. Elle gère également le spin-off de certaines activités. Le financement externe sera accordé uniquement si le travail est crucial, aligné sur la mission de l'EF, et ne crée pas de dépendances ou de risques d'appropriation indue. L'EF n'est pas neutre sur la direction d'Ethereum. Elle est engagée à construire un système de neutralité crédible et collaborera avec tous ceux qui partagent cet objectif fondamental.

marsbitIl y a 1 h

Le directeur exécutif intérimaire de l'Ethereum Foundation s'exprime : Quelle est notre mission ?

marsbitIl y a 1 h

La directrice exécutive intérimaire de l'Ethereum Foundation prend la parole : Quelle est notre mission ?

L'auteur, directeur exécutif conjoint par intérim de l'Ethereum Foundation (EF), définit la mission claire de l'EF : garantir qu'Ethereum reste une infrastructure véritablement sans permission et souveraine, résistante à la censure, libre, ouverte, privée et sécurisée. L'article souligne ce que l'EF n'est pas : elle ne cherche pas sa propre importance, à plaire aux spéculateurs ou à promouvoir chaque application. L'EF se concentre sur l'élimination des vulnérabilités. Elle doit renforcer Ethereum aux niveaux du protocole, de l'accès, de l'utilisateur et institutionnel. Les priorités incluent : migrer les salaires de l'EF vers l'ETH, lutter contre les MEV (Maximal Extractable Value) nuisibles pour préserver la neutralité, rendre la confidentialité par défaut essentielle, garantir un jalonnement (staking) sans permission et diversifié, et sécuriser les interfaces d'accès pour l'autonomie des utilisateurs. L'EF doit aussi saisir des opportunités : devenir la première infrastructure mondiale résistante aux attaques quantiques, créer une pile de protocole entièrement vérifiable et sans extraction de données, faire d'Ethereum une monnaie numérique privée et digne, soutenir les portefeuilles personnels avec agents IA, et permettre une adoption institutionnelle sans compromettre les valeurs fondamentales. Concernant les départs, l'EF traite les questions de personnel avec respect et discrétion, sans débats publics, reconnaissant le droit aux désaccords et aux forks. Enfin, l'EF rationalise ses activités. Certains travaux seront externalisés via des sociétés dérivées (spin-offs). Le financement externe sera accordé uniquement si le travail est crucial pour la mission de l'EF, réduit la dépendance et évite la capture, et non par convenance ou amitié. L'EF est résolue à soutenir les caractéristiques fondamentales d'Ethereum (CROP : sans permission, résistant à la censure, ouvert, privé) pour en faire une infrastructure neutre et durable.

链捕手Il y a 1 h

La directrice exécutive intérimaire de l'Ethereum Foundation prend la parole : Quelle est notre mission ?

链捕手Il y a 1 h

Trading

Spot
Futures
活动图片