OpenAI akhirnya membuat chip.
Banyak orang melihat berita ini, reaksi pertama mereka adalah: NVIDIA dalam masalah.
Tapi yang saya lihat justru sebaliknya.
Makna terpenting dari chip pertama Jalapeño bukanlah langsung menargetkan NVIDIA.
Ini adalah pertama kalinya OpenAI secara terbuka mengakui bahwa mereka tidak puas hanya menjadi perusahaan model.
Yang ingin mereka kendalikan adalah seluruh proses produksi kecerdasan.
Dari model, hingga chip. Dari pusat data, hingga energi. Dari pelatihan, hingga inferensi. Dari memproduksi Token, hingga menjual Token.
Jalapeño secara permukaan adalah sebuah chip, tetapi sebenarnya lebih mirip peta jalan.
OpenAI akhirnya meletakkan ambisinya di atas meja.
I. Jarak Model Mengecil, Jarak Komputasi Melebar
Sejak ledakan model besar, hampir semua perhatian industri AI ada di model.
GPT-4 keluar, industri diguncang sekali, Claude menyusul, Gemini menyusul, DeepSeek menurunkan harga, Meta membuka sumber terbuka. Setiap rilis, semua orang melihat sekumpulan hal yang sama: parameter, peringkat, kemampuan kode, kemampuan matematika, konteks panjang, multimodal.
Model tentu penting. Tapi satu perubahan sudah muncul, jendela keunggulan model semakin pendek. Hari ini sebuah model baru dirilis, beberapa bulan kemudian komunitas sumber terbuka, pesaing, penyedia cloud akan menyusul. Kesenjangan kemampuan masih ada, tetapi semakin sulit membentuk penghalang jangka panjang secara independen.
Yang benar-benar melebarkan jarak, mulai bergerak ke lapisan yang lebih mendasar. Pasokan daya komputasi, biaya inferensi, throughput sistem, kemampuan jaringan, pembangunan pusat data, perolehan energi. Tidak seindah rilis model, juga tidak langsung menjadi viral. Tapi mereka menentukan apakah sebuah perusahaan AI bisa terus berjalan dalam jangka panjang.
Jensen Huang baru-baru ini berkata: Sistem NVIDIA mungkin bukan yang termurah dalam pembelian, tetapi dapat menghasilkan biaya per Token terendah, throughput Token tertinggi, dan akhirnya membawa pendapatan tertinggi.
Kata-kata Jensen ini sangat langsung. Industri selalu mengeluh NVIDIA mahal, Jensen tidak membela harga pembelian, tetapi mengubah masalah ke dimensi lain: jangan lihat berapa banyak uang yang dikeluarkan untuk membeli mesin, lihat biaya produksi setiap Token.
Inilah buku keuangan baru era AI. Server dan GPU bukan unit akhir, Token-lah unitnya.
OpenAI kebetulan berada di pusat masalah ini.
ChatGPT setiap hari memproses banyak sekali permintaan, Codex mengonsumsi lebih banyak langkah inferensi, di masa depan masih ada Agent, pembuatan video, robotika, rantai inferensi panjang. Semakin berguna modelnya, semakin besar konsumsi Token. Semakin sukses produknya, semakin tebal tagihan inferensi.
Kekejaman ada di sini, semakin banyak pengguna OpenAI, semakin banyak NVIDIA untung. Semakin kuat produk OpenAI, semakin berat pajak daya komputasi di lapisan dasar.
Jika setiap Token harus melewati platform perangkat keras eksternal dan dikenai pajak, OpenAI sulit memiliki parit pertahanan yang utuh. Mereka bisa punya model terkuat, pintu masuk super, ekosistem pengembang. Tapi biaya produksi inti selalu terhalang di tangan orang lain.
Inti Jalapeño ada di sini. OpenAI mulai membangun pabrik Token sendiri.
II. GPT Mulai Merancang GPT
Detail chip Jalapeño yang paling mudah diremehkan adalah waktu fabrikasi (tape-out) sembilan bulan.
Proyek ASIC kinerja tinggi tradisional, siklusnya biasanya 18 bulan hingga 36 bulan. Proses canggih lebih merepotkan, arsitektur, verifikasi, implementasi fisik, pengemasan, software stack, debug, masalah di bagian mana pun akan dengan cepat meningkatkan biaya. OpenAI dan Broadcom memampatkan siklus menjadi sembilan bulan.
Ini tidak bisa dipahami sebagai industri chip tiba-tiba menjadi sederhana. OpenAI tidak tiba-tiba menumbuhkan rantai industri semikonduktor. Broadcom memiliki pengalaman mendalam dalam chip kustom dan infrastruktur jaringan, Celestica bertanggung jawab atas kartu, rak, dan rekayasa sistem.
Kontribusi OpenAI yang sebenarnya adalah hal yang lebih langka: mereka tahu bagaimana model masa depan akan berjalan.
Banyak perusahaan chip membuat akselerator AI, kesulitannya adalah menebak beban kerja. Struktur model akan berubah, cara inferensi akan berubah, mode layanan akan berubah. Setelah chip diproduksi (tape-out), dunia fisik tidak mudah untuk dikembalikan seperti dunia perangkat lunak.
OpenAI tidak perlu sepenuhnya mengandalkan tebakan. Setiap hari menjalankan ChatGPT, Codex, dan API, mereka tahu kernel mana yang paling sering digunakan, transfer memori mana yang paling boros, hambatan jaringan mana yang paling mempengaruhi efisiensi kluster, latensi mana yang langsung merusak pengalaman produk. Mereka juga tahu bagaimana produk Agent di masa depan akan mengonsumsi sumber daya inferensi.
Pengalaman ini sebelumnya hanya pengetahuan rekayasa di belakang layar, sekarang tertulis dalam arsitektur chip.
Dalam siaran pers resmi OpenAI ada satu kalimat kunci: OpenAI menggunakan modelnya sendiri untuk mempercepat bagian dari proses desain dan optimisasi. Juga dikatakan, model yang diberikan kepada pengguna juga membantu meningkatkan infrastruktur yang akan menjalankan model di masa depan.
GPT mulai terlibat dalam merancang mesin untuk GPT generasi berikutnya.
Rantai chip selama beberapa dekade terakhir adalah, pertama-tama mendesain chip, chip menjalankan perangkat lunak, perangkat lunak menjalankan AI. Sekarang rantai mulai berbalik, AI membantu manusia mendesain chip, chip kemudian menjalankan AI generasi berikutnya.
Begitu lingkaran tertutup ini terbentuk, sembilan bulan mungkin baru permulaan. Di masa depan mungkin enam bulan, tiga bulan, atau bahkan iterasi yang lebih padat.
Industri chip sebelumnya memiliki ritmenya sendiri, industri model memiliki ritmenya sendiri. Yang pertama lambat, yang kedua cepat. Jalapeño menarik kedua ritme ini bersama.
Langkah ini jika berhasil, roda gila (flywheel) OpenAI akan menjadi sangat menakutkan. Model yang lebih baik membantu merancang chip yang lebih baik, chip yang lebih baik menurunkan biaya operasi model generasi berikutnya, biaya yang lebih rendah mendukung lebih banyak pengguna dan produk, lebih banyak pengguna dan produk membawa lebih banyak data beban kerja nyata, data ini kemudian berbalik mendefinisikan chip generasi berikutnya.
Inilah siklus yang benar-benar diinginkan OpenAI.
III. Mengurangi Pajak Inferensi, Mengendalikan Arus Kas
Jalapeño bukanlah chip pelatihan, ia ditujukan untuk inferensi model bahasa besar. Ini poin yang sangat krusial.
Pelatihan seperti membangun kapal induk. Satu kali investasi besar, membutuhkan kemampuan umum yang sangat kuat, perlu terus beradaptasi dengan model baru, arsitektur baru, eksperimen baru. Pasar pelatihan masih sangat bergantung pada NVIDIA, bukan hanya GPU, tetapi seluruh platform CUDA, jaringan, sistem, pustaka perangkat lunak, ekosistem pengembang.
Inferensi lebih mirip armada taksi. Berjalan setiap hari, setiap jam, setiap menit. Setiap kali pengguna mengajukan pertanyaan, API merespons sekali, Agent melangkah maju, inferensi harus terjadi. Ini lebih memperhatikan latensi rendah, biaya rendah, throughput tinggi, utilisasi tinggi.
Pelatihan membakar uang besar secara bertahap, inferensi membakar arus kas harian.
Ini juga masalah paling menyakitkan bagi perusahaan AI setelah mencapai tahap komersialisasi. Pelatihan GPT sekali sangat mahal, tetapi inferensi terjadi setiap hari. Era Agent akan terus memperbesar masalah ini, satu tugas mungkin berisi puluhan bahkan ratusan panggilan model. Konteks panjang, inferensi berantai, generasi multimodal, eksekusi kode, semua terus mendorong konsumsi Token naik.
Jalapeño membidik pajak inferensi ini. Ini lebih mirip TPU-nya sendiri OpenAI. Google, Amazon, Meta, Microsoft semua telah melalui jalur serupa, selama beban kerja cukup besar, ASIC buatan sendiri memiliki nilai ekonomis dengan rasio harga-kinerja tinggi.
OpenAI sekarang memiliki kondisi ini. Ada permintaan nyata, ada roadmap produk, ada tim model, ada mitra industri seperti Broadcom, dan juga tekanan biaya yang sangat besar.
Jalapeño tidak perlu dijual ke luar untuk membuktikan nilainya. Selama ini membuat ChatGPT menjawab lebih murah, membuat Codex berjalan lebih cepat, membuat API margin laba lebih tinggi, ini sudah bermakna.
OpenAI juga menyebutkan, Jalapeño akan mengurangi transfer data, menyeimbangkan sumber daya komputasi, memori, dan jaringan, sehingga utilisasi aktual lebih mendekati puncak teoretis. Daya komputasi mahal sering kali mahal karena tidak digunakan sepenuhnya, GPU menunggu jaringan, transfer memori memperlambat komputasi, penjadwalan yang buruk menyebabkan idle, semua pemborosan akhirnya menjadi biaya listrik dan pengeluaran modal.
Harga pembelian hanya lapisan pertama, efisiensi sistem adalah perhitungan akhir.
IV. OpenAI Semakin Mirip Apple
Banyak orang akan memahami Jalapeño sebagai OpenAI menantang NVIDIA, tapi saya rasa OpenAI tidak ingin menjadi NVIDIA berikutnya, lebih mirip sedang belajar dari Apple.
Yang paling hebat dari Apple tidak pernah hanya satu titik tertentu. iPhone kuat, iOS kuat, chip seri A dan M kuat, App Store kuat. Tapi tempat yang benar-benar sulit ditandingi Apple adalah semua hal ini ditempatkan dalam satu lingkaran tertutup yang sama.
Chip dioptimalkan untuk sistem, sistem dioptimalkan untuk aplikasi, pengalaman aplikasi kemudian mendefinisikan chip generasi berikutnya. Lingkaran tertutup ini memungkinkan Apple dalam batasan baterai, volume, dan pendinginan yang sama, dapat membuat pengalaman yang sulit ditiru orang lain.
OpenAI sedang membangun sesuatu yang serupa. Model adalah inti kecerdasan, ChatGPT adalah pintu masuk super, Codex adalah alat pengembang, API adalah lapisan distribusi ekosistem, Jalapeño adalah chip buatan sendiri, pusat data adalah pabrik AI.
CEO OpenAI Altman dua tahun terakhir berulang kali membicarakan chip, energi, fusi nuklir, pusat data, sekarang terlihat mungkin sama sekali bukan mengejar konsep, dia tidak lagi merencanakan OpenAI dengan cara perusahaan rintisan AI.
Jika dikatakan NVIDIA menjual sekop, maka OpenAI ingin memiliki tambang.
NVIDIA ingin menjadi pemasok peralatan pabrik untuk semua perusahaan AI, menjual GPU, jaringan, sistem, ekosistem perangkat lunak, solusi pabrik AI, klien ideal adalah setiap perusahaan yang perlu memproduksi Token.
OpenAI ingin membangun satu set pabrik untuk diri mereka sendiri, yang dijual bukan peralatan, melainkan kecerdasan yang akhirnya dihasilkan.
Dalam jangka pendek, OpenAI tidak bisa lepas dari NVIDIA. Pelatihan dan komputasi umum masih membutuhkan platform GPU, Jalapeño juga tidak mungkin cepat mencakup semua beban kerja. Kemungkinan besar mereka akan masuk terlebih dahulu ke skenario inferensi OpenAI yang paling pasti, terbesar, dan dengan pengembalian optimalisasi tertinggi.
Dalam jangka panjang, retakan sudah muncul. Ketika perusahaan model mulai memiliki roadmap chip mereka sendiri, klien NVIDIA tidak lagi hanya klien. Mereka juga akan menjadi pemain lain di infrastruktur AI.
Kata-kata di Luar Halaman
Dua puluh tahun terakhir, aset terpenting internet adalah lalu lintas (traffic). Siapa yang menguasai pengguna, dialah yang menguasai nilai.
Hari ini, era AI sedang menunjukkan hukum baru.
Model semakin mirip lalu lintas, sedangkan komputasi semakin mirip tanah.
Model akan berulang, produk akan berubah, papan peringkat akan terus diperbarui. Tapi pabrik-pabrik yang memproduksi kecerdasan, chip, jaringan, pusat data, energi, akan semakin terkonsentrasi di tangan sedikit pemain.
GPT mulai merancang GPT, tampaknya hanya satu kali tape-out.
Tapi hal yang benar-benar diumumkannya adalah:
OpenAI sudah tidak puas hanya menjadi perusahaan terpintar, mereka ingin menjadi perusahaan yang mengendalikan produksi kecerdasan.
Artikel ini berasal dari akun WeChat: 版面之外, Penulis: 画画
Artikel ini berasal dari akun WeChat: 版面之外, Penulis: 画画, Gambar judul dari: AI generatif






