Nvidia Poised for Record Sales as AI Demand Kicks In

WSJPublicado a 2023-05-25Actualizado a 2023-05-25

Resumen

The graphics-chip giant gives a strong outlook, driven by growing appetite for generative AI technology

Chip giant Nvidia is starting to capitalize on the craze for language-generating artificial intelligence, projecting a more than 64% jump in sales as the company rushes to get more processors in customer hands to satisfy booming interest in the technology.

A new generation of advanced Nvidia chips for AI calculations in data centers is in production, Nvidia CEO Jensen Huang said, and “we are significantly increasing our supply to meet surging demand for them.”

The company forecast a record $11 billion in sales for the current quarter, far above the $7.2 billion Wall Street was expecting and what would be the highest quarterly total ever for the company.

“This demand has extended our data center visibility out a few quarters and we have procured substantially higher supply for the second-half of the year,” Chief Financial Officer Colette Kress said on an earnings call.

Nvidia’s shares, which have more than doubled in value this year, surged more than 28% in after-market trading to reach an all-time high. The rise puts Nvidia, the U.S.’s largest chip-supplier by market value, close to becoming the world’s first $1 trillion chip company.

Demand for computing power that drives language-generating tools such as OpenAI’s ChatGPT is opening a huge new revenue opportunity for the company and others. It has spurred an arms race between tech giants to offer advanced AI features to their customers. Microsoft, which has invested in OpenAI, has been adding the technology to its Bing search engine and business software products. Google has introduced its own advanced AI tools. Facebook parent Meta Platforms also has been working on the technology. Nvidia’s chips are essential in creating these kinds of tools, analysts say, and building just one such AI system can require thousands of Nvidia’s computing engines.

Huang said the company was well-prepared to benefit from the AI opportunity because it was starting to produce a new wave of advanced equipment for data centers when the explosion of interest began last year. “I call it the iPhone moment,” he said, referring to the shift toward smartphones that Apple capitalized on by releasing its advanced handset about 16 years ago. “All the technology came together and helped everybody realize what an amazing product that can be and what capabilities it can have.”

Nvidia doesn’t manufacture its own chips, but farms out production to contract chip-makers including the world’s largest, Taiwan Semiconductor Manufacturing Co. TSMC’s shares, which trade in New York and Taiwan, rose by 7% after-hours in the wake of Nvidia’s results.

Nvidia may be the leading provider of AI chips, but Huang said the battle to supply chips to satisfy demand is fierce. “We have competition from every direction,” he said, from established semiconductor companies to startups.

Nvidia on Wednesday said revenue fell 13% to $7.2 billion in its last fiscal quarter, topping forecasts from analysts surveyed by FactSet. Net profit rose 26% to $2 billion. The sales retreat was driven by a sharp decline in the graphics chips business for videogamers, who pulled back after the pandemic eased and are only beginning to resume buying.

Huang said operators of big data centers are retooling their computing infrastructure to better address the opportunities offered by AI, creating surging demand for its chips.

“A trillion dollars of installed global data center infrastructure will transition from general purpose to accelerated computing as companies race to apply generative AI into every product, service and business process,” he said.

Nvidia’s data center revenue rose to $4.28 billion in its latest quarter, a record, which Kress said reflected strong demand from consumer internet companies and cloud-computing companies.

Nvidia has said it is working on generative AI with Amazon.com, Microsoft and Alphabet’s Google unit, and is partnering with cloud-computing companies to help make generative AI available to smaller businesses. The company on Tuesday said it was adding its AI software to Microsoft’s Azure cloud-computing service, allowing corporate customers to tap in to its chips and software to speed up large generative AI systems.

Nvidia has its roots in graphics-processing chips for videogamers, but has diversified its customer base rapidly in recent years. Engineers found the chips to be well-suited to AI tasks and cryptocurrency mining, which led to an explosion of new sources of demand.

The company has tried to capitalize on that shift by making specialized chips for those markets. Its AI chips have helped its data center division surpass its gaming division in revenues over the past few quarters, a major break from the past. The company has recently begun to roll out a new generation of AI chips for data centers that promise a substantial performance upgrade, and many customers have had to wait for them amid red-hot demand.

The company’s gaming division fell by 38% to $2.2 billion in the latest quarter, which Kress attributed to the macroeconomic slowdown and Nvidia limiting shipments so customers run through existing inventories of chips.

Amid the growth in AI-related sales, new U.S. regulations seeking to hamstring China’s AI industry limited the sale of Nvidia chips there. Nvidia has developed versions of its chips that don’t exceed performance thresholds, but the company said last year that the curbs could cost it up to $400 million in quarterly sales.

Lecturas Relacionadas

Huang Renxun: El Prompt está quedando obsoleto, Loop es el nuevo paradigma

En el mundo de la IA, se está produciendo un cambio de paradigma: el "prompt" (instrucción directa) pierde relevancia frente al "loop" (bucle o ciclo). Según expertos como Jensen Huang (fundador de NVIDIA), Peter, Boris Cherny (creador de Claude Code) y Andrew Ng, la nueva tarea clave no es escribir prompts detallados, sino diseñar y gestionar loops. ¿Qué es un loop? Es un sistema automatizado donde la IA recibe un objetivo general, ejecuta tareas, las verifica automáticamente y, si no cumple los criterios, reintenta de forma independiente hasta completarlo o alcanzar un límite. Esto libera al humano de supervisar cada paso, transformándolo de "instructor" a "diseñador de reglas". Un loop no es lo mismo que un agente de IA: el agente ejecuta, mientras que el loop es el mecanismo que orquesta y automatiza su trabajo continuo sin intervención constante. Productos como Claude Code y OpenAI Codex ya implementan esta idea. Claude Code ofrece funciones como `/goal` (ejecución orientada a objetivos) y `/schedule` (tareas programadas), utilizando modelos separados para generar código (modelo principal) y para validarlo (modelo más pequeño como Haiku), asegurando una verificación objetiva. Codex emplea una "línea de ensamblaje automatizada" con múltiples subagentes que trabajan en paralelo. Boris Cherny describe cómo dirige cientos de pequeños agentes en loops automatizados que manejan desde issues de GitHub hasta fallos en CI, interviniendo solo en casos excepcionales. Para implementar loops efectivos, se recomienda: 1) Evaluar si la tarea es repetitiva, verificable automáticamente, con presupuesto de tokens viable y con herramientas adecuadas. 2) Comenzar con un loop mínimo viable (disparador, habilidad/Skill, archivo de estado STATE.md y compuerta/Gate de verificación). 3) Separar siempre la generación de código de su validación, usando agentes o modelos independientes para evitar sesgos. 4) Evitar errores comunes: establecer condiciones de parada claras (límites de tokens, iteraciones), persistir el estado en archivos, asignar solo tareas con criterios objetivos verificables por máquina (como corrección de Lint) y revisar los cambios (diffs) para mantener la comprensión del código. 5) Medir el éxito por el "costo promedio por modificación aceptada"; una tasa de aceptación inferior al 50% indica ineficiencia. Este enfoque representa la evolución natural en la ingeniería de IA: desde el "Prompt Engineering" (2023-2024, enfocado en redactar instrucciones), pasando por el "Context Engineering" (2024-2025, organizar la información de fondo), luego el "Harness Engineering" (2025-2026, crear entornos de ejecución con herramientas), hasta el actual "Loop Engineering". El nivel de control humano asciende desde frases específicas hacia el diseño de sistemas autónomos. Conceptos académicos como el marco ReAct (Reason+Act, 2022) de Shunyu Yao, que integra razonamiento y acción en un ciclo, sentaron las bases teóricas. A pesar del entusiasmo, expertos como Addy Osmani (Google) advierten sobre la etapa temprana de esta tecnología y los costos de tokens. Andrej Karpathy subraya una reflexión crucial: aunque la IA puede externalizar la ejecución, la comprensión profunda del problema sigue siendo responsabilidad humana. El loop marca un paso hacia una automatización más autónoma, pero su adopción requiere cuidado y criterio.

marsbitHace 11 min(s)

Huang Renxun: El Prompt está quedando obsoleto, Loop es el nuevo paradigma

marsbitHace 11 min(s)

GPT diseña GPT

OpenAI ha presentado su primer chip, Jalapeño, un cambio estratégico que va más allá de competir con Nvidia. La empresa busca controlar todo el proceso de producción de inteligencia artificial, desde los modelos hasta el hardware, la energía y los centros de datos. La brecha entre modelos líderes se está reduciendo, mientras que la ventaja competitiva se desplaza a capas más profundas: suministro de computación, costes de inferencia y eficiencia de sistemas. Cada token generado implica un costo, y OpenAI, con productos de gran consumo como ChatGPT, necesita reducir esta "tasa de inferencia" para fortalecer su rentabilidad y defensa competitiva a largo plazo. Jalapeño, un chip ASIC optimizado para inferencia de modelos de lenguaje, fue desarrollado en solo nueve meses con Broadcom. Este plazo résubevela la ventaja clave de OpenAI: utiliza su propio conocimiento interno sobre cómo se ejecutan sus modelos masivos en producción para guiar el diseño del hardware. Esencialmente, GPT ayuda a diseñar las máquinas que ejecutarán la próxima generación de GPT, creando un ciclo de retroalimentación potente. El enfoque en la inferencia es crucial porque, a diferencia del entrenamiento (una inversión puntual enorme), la inferencia consume el flujo de caja diario. Al optimizarla, OpenAI reduce costes operativos fundamentales para su escalabilidad comercial, especialmente con futuros agentes de IA que realizarán cadenas largas de razonamiento. Este movimiento refleja una ambición mayor: OpenAI no quiere ser solo un proveedor de modelos, sino construir un ecosistema integrado al estilo de Apple, donde el software, el hardware y la infraestructura se optimizan mutuamente en un ciclo cerrado. A corto plazo depende de Nvidia, pero al trazar su propia hoja de ruta de chips, emerge como un nuevo tipo de actor en la infraestructura de IA. En resumen, OpenAI ya no aspira solo a crear la inteligencia más avanzada, sino a controlar los medios completos de su producción.

marsbitHace 37 min(s)

GPT diseña GPT

marsbitHace 37 min(s)

La directora ejecutiva interina de la Fundación Ethereum alza la voz: ¿Cuál es nuestra misión?

El director interino de la Ethereum Foundation (EF), Aerugo, define la misión de la fundación: garantizar que Ethereum sea y siga siendo una infraestructura verdaderamente sin permiso, resistente a la censura, privada y segura, y que permita la coordinación a gran escala respetando la soberanía individual. El artículo detalla en qué **no** se centrará la EF: popularidad, atraer a grandes instituciones financieras o satisfacer a especuladores a corto plazo. Su propósito es **eliminar vulnerabilidades** en capas clave del ecosistema: * **Proceso de transacciones/MEV**: Combatir la extracción dañina de MEV, evitar monopolios en la construcción de bloques y garantizar la ejecución neutral. * **Privacidad**: Es fundamental. Un libro mayor público sin privacidad por defecto se convierte en una plataforma de vigilancia. * **Staking**: Debe ser accesible, privado y diverso para evitar puntos centralizados de control. * **Interfaces de acceso**: Facilitar que los usuarios (individuales e institucionales) interactúen con Ethereum de forma autónoma y resistente a la coerción. La EF también debe **aprovechar oportunidades**, como convertir a Ethereum en: * La primera infraestructura global resistente a ataques cuánticos. * Efectivo digital privado y una plataforma para la coordinación privada. * La base para carteras personales con agentes de IA controlados por el usuario. * Una opción competitiva y sin custodia para casos de uso institucional. Respecto a los cambios internos, el artículo confirma salidas de personal por ajustes estratégicos o de rol, pidiendo respeto y evitando el debate público sobre casos individuales. También anuncia que algunos trabajos se externalizarán en "empresas derivadas" (spin-offs). La EF solo financiará proyectos externos si son cruciales para su misión, evitando apoyar trabajos que se desvíen de sus principios fundamentales. La postura final es clara: La EF no es neutral respecto a la dirección de Ethereum. Su compromiso es con los principios de infraestructura sin permiso y neutral que respete la soberanía, y colaborará con quienes compartan este objetivo.

marsbitHace 1 hora(s)

La directora ejecutiva interina de la Fundación Ethereum alza la voz: ¿Cuál es nuestra misión?

marsbitHace 1 hora(s)

Habla el Director Ejecutivo Interino de la Fundación Ethereum: ¿Cuál es nuestra misión?

La Fundación Ethereum (EF) reafirma su misión fundamental: garantizar que Ethereum siga siendo una infraestructura verdaderamente sin permisos, resistente a la censura, de código abierto, privada y segura, que soporte la coordinación soberana a escala. La EF no existe para buscar popularidad, atraer a especuladores a corto plazo o promover cada aplicación. Su papel es fortalecer las defensas de Ethereum en todas las capas (protocolo, acceso, usuario, instituciones) para prevenir la extracción, el control por parte de cárteles o estados, y las herramientas de vigilancia. Esto implica abordar puntos débiles como el flujo de transacciones (MEV dañino), la privacidad (imprescindible por defecto), el staking (infraestructura de riesgo del protocolo) y las interfaces de acceso (para preservar la autonomía del usuario). La EF también actuará internamente, adoptando ETH y stablecoins nativas para pagos, alineándose con el sistema que busca mejorar. Paralelamente, la EF debe aprovechar oportunidades clave: preparar a Ethereum para ser resistente a la computación cuántica, lograr una pila de protocolo completamente autoverificable y privada, establecer a Ethereum como efectivo digital privado y digno, integrar agentes de IA en carteras personales soberanas, y demostrar que la infraestructura neutral puede manejar la coordinación a escala institucional de manera competitiva. Finalmente, la EF aborda cambios internos y proyectos derivados ("spinoffs"). Algunas salidas de personal son ajustes estratégicos o naturales. Los proyectos que dejan la EF serán evaluados para financiación externa basándose estrictamente en su alineación con la misión central: proteger y expandir la autonomía soberana dentro del ecosistema Ethereum, sin crear dependencias o desviar recursos de las prioridades fundamentales.

链捕手Hace 1 hora(s)

Habla el Director Ejecutivo Interino de la Fundación Ethereum: ¿Cuál es nuestra misión?

链捕手Hace 1 hora(s)

Trading

Spot
Futuros
活动图片