Nvidia Poised for Record Sales as AI Demand Kicks In

WSJDipublikasikan tanggal 2023-05-25Terakhir diperbarui pada 2023-05-25

Abstrak

The graphics-chip giant gives a strong outlook, driven by growing appetite for generative AI technology

Chip giant Nvidia is starting to capitalize on the craze for language-generating artificial intelligence, projecting a more than 64% jump in sales as the company rushes to get more processors in customer hands to satisfy booming interest in the technology.

A new generation of advanced Nvidia chips for AI calculations in data centers is in production, Nvidia CEO Jensen Huang said, and “we are significantly increasing our supply to meet surging demand for them.”

The company forecast a record $11 billion in sales for the current quarter, far above the $7.2 billion Wall Street was expecting and what would be the highest quarterly total ever for the company.

“This demand has extended our data center visibility out a few quarters and we have procured substantially higher supply for the second-half of the year,” Chief Financial Officer Colette Kress said on an earnings call.

Nvidia’s shares, which have more than doubled in value this year, surged more than 28% in after-market trading to reach an all-time high. The rise puts Nvidia, the U.S.’s largest chip-supplier by market value, close to becoming the world’s first $1 trillion chip company.

Demand for computing power that drives language-generating tools such as OpenAI’s ChatGPT is opening a huge new revenue opportunity for the company and others. It has spurred an arms race between tech giants to offer advanced AI features to their customers. Microsoft, which has invested in OpenAI, has been adding the technology to its Bing search engine and business software products. Google has introduced its own advanced AI tools. Facebook parent Meta Platforms also has been working on the technology. Nvidia’s chips are essential in creating these kinds of tools, analysts say, and building just one such AI system can require thousands of Nvidia’s computing engines.

Huang said the company was well-prepared to benefit from the AI opportunity because it was starting to produce a new wave of advanced equipment for data centers when the explosion of interest began last year. “I call it the iPhone moment,” he said, referring to the shift toward smartphones that Apple capitalized on by releasing its advanced handset about 16 years ago. “All the technology came together and helped everybody realize what an amazing product that can be and what capabilities it can have.”

Nvidia doesn’t manufacture its own chips, but farms out production to contract chip-makers including the world’s largest, Taiwan Semiconductor Manufacturing Co. TSMC’s shares, which trade in New York and Taiwan, rose by 7% after-hours in the wake of Nvidia’s results.

Nvidia may be the leading provider of AI chips, but Huang said the battle to supply chips to satisfy demand is fierce. “We have competition from every direction,” he said, from established semiconductor companies to startups.

Nvidia on Wednesday said revenue fell 13% to $7.2 billion in its last fiscal quarter, topping forecasts from analysts surveyed by FactSet. Net profit rose 26% to $2 billion. The sales retreat was driven by a sharp decline in the graphics chips business for videogamers, who pulled back after the pandemic eased and are only beginning to resume buying.

Huang said operators of big data centers are retooling their computing infrastructure to better address the opportunities offered by AI, creating surging demand for its chips.

“A trillion dollars of installed global data center infrastructure will transition from general purpose to accelerated computing as companies race to apply generative AI into every product, service and business process,” he said.

Nvidia’s data center revenue rose to $4.28 billion in its latest quarter, a record, which Kress said reflected strong demand from consumer internet companies and cloud-computing companies.

Nvidia has said it is working on generative AI with Amazon.com, Microsoft and Alphabet’s Google unit, and is partnering with cloud-computing companies to help make generative AI available to smaller businesses. The company on Tuesday said it was adding its AI software to Microsoft’s Azure cloud-computing service, allowing corporate customers to tap in to its chips and software to speed up large generative AI systems.

Nvidia has its roots in graphics-processing chips for videogamers, but has diversified its customer base rapidly in recent years. Engineers found the chips to be well-suited to AI tasks and cryptocurrency mining, which led to an explosion of new sources of demand.

The company has tried to capitalize on that shift by making specialized chips for those markets. Its AI chips have helped its data center division surpass its gaming division in revenues over the past few quarters, a major break from the past. The company has recently begun to roll out a new generation of AI chips for data centers that promise a substantial performance upgrade, and many customers have had to wait for them amid red-hot demand.

The company’s gaming division fell by 38% to $2.2 billion in the latest quarter, which Kress attributed to the macroeconomic slowdown and Nvidia limiting shipments so customers run through existing inventories of chips.

Amid the growth in AI-related sales, new U.S. regulations seeking to hamstring China’s AI industry limited the sale of Nvidia chips there. Nvidia has developed versions of its chips that don’t exceed performance thresholds, but the company said last year that the curbs could cost it up to $400 million in quarterly sales.

Bacaan Terkait

Huang Renxun: Prompt Sudah Usang, Loop adalah Paradigma Baru

**Ringkasan:** **Prompt Sudah Ketinggalan Zaman, Loop adalah Paradigma Baru.** Menurut Huang Renxun (Jensen Huang), pendiri NVIDIA, tugas utama di era AI sekarang bukan lagi menulis perintah (prompt), tetapi **menulis dan mengelola loop (siklus).** **Apa itu Loop?** Loop adalah sistem di mana Anda mendefinisikan suatu tujuan, dan AI menjalankannya secara mandiri—memeriksa hasil, memperbaiki kesalahan, dan mengulangi proses tersebut hingga tugas selesai atau mencapai batas tertentu. Manusia beralih peran dari "pemberi perintah" menjadi **"perancang aturan" atau "arsitek sistem."** **Loop vs. Agent:** Agent adalah "pekerja" yang menjalankan tugas. Loop adalah **mekanisme pengelolaan** yang memungkinkan Agent bekerja terus-menerus tanpa pengawasan manusia. Agent dengan loop menjadi sistem yang dapat berjalan otomatis. **Contoh Penerapan:** Produk seperti Claude Code (dengan fitur /loop, /goal, /schedule) dan OpenAI Codex telah menerapkan konsep ini. Mereka membagi tugas kompleks ke beberapa Agent yang berjalan paralel di lingkungan terisolasi, dengan model terpisah untuk menulis kode dan memvalidasi hasil, memastikan objektivitas. **Bagaimana Memulai Loop?** 1. **Uji Kelayakan:** Pastikan tugas berulang, dapat divalidasi otomatis, dan anggaran token mencukupi. 2. **Mulai dari Loop Minimal:** Bangun sistem dengan pemicu otomatis, keterampilan (skill), file status (STATE.md), dan "gerbang" validasi (seperti pengujian). 3. **Pisahkan Pemeriksa dan Pelaksana:** Gunakan model atau Agent berbeda untuk menulis kode dan memeriksa/mengujinya. Ini kunci untuk kualitas. 4. **Hindari Jebakan Umum:** Tetapkan batas pengulangan dan token, simpan status, hindari tugas yang membutuhkan pertimbangan manusia, dan tetap tinjau perubahan kode (diff). 5. **Ukur Efektivitas:** Metrik utama adalah **biaya rata-rata per perubahan yang diterima.** **Evolusi Paradigma:** Perkembangan AI menunjukkan pergeseran berkelanjutan: 1. **Prompt Engineering** (2023-2024): Fokus pada cara menulis perintah. 2. **Context Engineering** (2024-2025): Fokus pada informasi dan latar belakang yang diberikan ke AI. 3. **Harness Engineering** (2025-2026): Fokus pada lingkungan eksekusi dimana AI dapat menggunakan alat dan sumber daya. 4. **Loop Engineering** (sekarang): Fokus pada merancang sistem siklus otomatis yang berjalan mandiri. Konsep loop memiliki akar akademis, seperti dalam framework **ReAct** (Reasoning + Acting) yang dikembangkan oleh Yao Shunyu dkk., yang menggabungkan penalaran dan tindakan dalam sebuah siklus. **Catatan Penting:** Meskipun menjanjikan, teknologi ini masih awal. Perlu kehati-hatian terhadap biaya token dan kompleksitas. Seperti dikutip Andrej Karpathy, **"Anda dapat mengalihdayakan pemikiran Anda, tetapi Anda tidak dapat mengalihdayakan pemahaman Anda."** Pemahaman mendalam tentang masalah tetap berada di tangan manusia.

marsbit12m yang lalu

Huang Renxun: Prompt Sudah Usang, Loop adalah Paradigma Baru

marsbit12m yang lalu

GPT Merancang GPT

OpenAI akhirnya merilis chip pertamanya, Jalapeño. Meski banyak yang menganggapnya sebagai tantangan bagi Nvidia, inti dari langkah ini justru adalah pengakuan terbuka OpenAI bahwa mereka tidak puas hanya menjadi perusahaan model AI. Mereka ingin mengontrol seluruh proses produksi kecerdasan, dari model, chip, hingga pusat data dan energi. Perbedaan kemampuan model semakin menyempit, namun kesenjangan dalam komputasi justru melebar. Dalam era AI, satuan biaya terpenting bukan lagi harga server atau GPU, melainkan biaya produksi setiap Token. Sebagai penyedia layanan seperti ChatGPT dan API, OpenAI menghadapi kenyataan bahwa semakin sukses produk mereka, semakin besar "pajak inferensi" yang harus dibayarkan ke penyedia hardware eksternal. Jalapeño adalah upaya membangun "pabrik Token" sendiri untuk mengurangi ketergantungan ini. Yang menarik, siklus pengembangan chip Jalapeño hanya sembilan bulan, jauh lebih cepat dari standar industri. Kunci percepatan ini adalah pengetahuan OpenAI tentang beban kerja model nyata. Mereka bahkan menggunakan model AI mereka sendiri untuk mempercepat bagian proses desain dan optimasi chip. Ini menciptakan siklus umpan balik: model yang lebih baik membantu mendesain chip yang lebih baik, yang kemudian menurunkan biaya menjalankan model generasi berikutnya. Jalapeño difokuskan untuk inferensi, bukan pelatihan. Inferensi adalah pengeluaran tunai harian yang masif, terutama dengan berkembangnya Agent dan tugas-tugas rantai panjang. Dengan mengurangi "pajak inferensi" ini, OpenAI dapat meningkatkan margin keuntungan layanannya. Strategi OpenAI semakin mirip dengan Apple: membangun ekosistem tertutup yang terintegrasi, dari model (perangkat lunak intelijen), antarmuka seperti ChatGPT, hingga chip dan infrastruktur fisik. Mereka tidak ingin menjual "sekop" (seperti Nvidia), tetapi memiliki "tambang" dan menjual "kecerdasan" yang dihasilkannya. Pada akhirnya, artikel ini menyimpulkan bahwa aset terpenting di era AI sedang bergeser. Model akan terus berubah seperti "aliran traffic," tetapi infrastruktur produksi—chip, jaringan, pusat data, energi—akan menjadi "tanah" yang dikuasai oleh sedikit pemain. Dengan Jalapeño, OpenAI menyatakan ambisinya: tidak hanya menjadi perusahaan paling cerdas, tetapi mengontrol produksi kecerdasan itu sendiri.

marsbit38m yang lalu

GPT Merancang GPT

marsbit38m yang lalu

Direktur Eksekutif Sementara Yayasan Ethereum Bicara: Apa Misi Kami?

**Misi Ethereum Foundation (EF): Memperkuat Otonomi dan Ketahanan Ethereum** Ethereum Foundation (EF) secara resmi mendefinisikan misinya: memastikan Ethereum tetap sebagai infrastruktur *permissionless* yang menjamin kedaulatan diri—tahan sensor, terbuka, pribadi, dan aman. Ini adalah jawaban final atas pertanyaan tentang tujuan EF. **Apa yang BUKAN Tujuan EF:** EF bukan untuk kepentingan jangka pendek, popularitas, menyenangkan spekulan, atau menciptakan lembaga keuangan besar yang baru. **Inti Tindakan EF: Mengatasi Kelemahan** EF berfokus memperkuat Ethereum di semua lapisan (protokol, akses, pengguna, kelembagaan) untuk mencegah eksploitasi, kontrol kartel, atau pengawasan otoritatif. Tindakan konkret meliputi: 1. **EF Memimpin dengan Contoh:** Beralih ke gaji dan transaksi dalam ETH/stablecoin asli Ethereum untuk merasakan tekanan produk secara langsung. 2. **Melawan MEV Berbahaya:** Melindungi netralitas Ethereum dengan memerangi *Maximum Extractable Value* (MEV) yang merusak di alur transaksi, mencegah monopoli pembangun blok, dan meningkatkan transparansi. 3. **Prioritas Privasi:** Privasi default yang kuat adalah kebutuhan mutlak. Buku besar publik tanpa privasi adalah platform pengawasan. Ethereum harus menawarkan privasi tanpa syarat terlebih dahulu. 4. **Staking sebagai Infrastruktur:** Staking bukan sekadar produk hasil. EF akan mendukung desain agar staking tetap *permissionless*, terdesentralisasi, dan pribadi, mencegah konsentrasi risiko. 5. **Antarmuka Akses yang Otonom:** Fokusnya adalah membuat pengguna (individu & institusi) lebih mandiri dan kurang rentan terhadap paksaan, bukan mengorbankan nilai inti Ethereum untuk adopsi. **Memanfaatkan Peluang:** EF juga akan membangun masa depan dengan mengejar peluang seperti: * Menjadi infrastruktur global pertama yang tahan serangan kuantum. * Menciptakan tumpukan protokol yang sepenuhnya terverifikasi dan otonom tanpa celah. * Menjadikan Ethereum sebagai "uang digital biasa" yang pribadi dan bermartabat. * Mengintegrasikan agen AI dengan dompet pribadi yang dijalankan pengguna, mempertahankan kedaulatan atas aset dan model. * Membuktikan bahwa infrastruktur netral dapat menangani koordinasi skala besar secara kompetitif untuk aplikasi institusional. * Skalabilitas yang mempertahankan jaminan otonomi. **Tata Kelola Internal:** Artikel juga menyentuh perubahan internal EF, termasuk kepergian beberapa staf dan spin-off proyek tertentu, yang dilakukan untuk menyelaraskan kembali organisasi dengan misi intinya. EF akan mendanai pekerjaan eksternal hanya jika sangat penting dan selaras dengan misi memperkuat otonomi Ethereum, bukan untuk sekadar melanjutkan proyek atau menjaga hubungan. Kesimpulannya, EF berkomitmen penuh untuk membangun Ethereum sebagai infrastruktur netral yang tangguh dan berumur panjang, yang mampu mendukung koordinasi otonom dalam skala besar untuk peradaban masa depan.

marsbit1j yang lalu

Direktur Eksekutif Sementara Yayasan Ethereum Bicara: Apa Misi Kami?

marsbit1j yang lalu

Trading

Spot
Futures
活动图片