GPT Merancang GPT

marsbit發佈於 2026-06-25更新於 2026-06-25

文章摘要

OpenAI akhirnya merilis chip pertamanya, Jalapeño. Meski banyak yang menganggapnya sebagai tantangan bagi Nvidia, inti dari langkah ini justru adalah pengakuan terbuka OpenAI bahwa mereka tidak puas hanya menjadi perusahaan model AI. Mereka ingin mengontrol seluruh proses produksi kecerdasan, dari model, chip, hingga pusat data dan energi. Perbedaan kemampuan model semakin menyempit, namun kesenjangan dalam komputasi justru melebar. Dalam era AI, satuan biaya terpenting bukan lagi harga server atau GPU, melainkan biaya produksi setiap Token. Sebagai penyedia layanan seperti ChatGPT dan API, OpenAI menghadapi kenyataan bahwa semakin sukses produk mereka, semakin besar "pajak inferensi" yang harus dibayarkan ke penyedia hardware eksternal. Jalapeño adalah upaya membangun "pabrik Token" sendiri untuk mengurangi ketergantungan ini. Yang menarik, siklus pengembangan chip Jalapeño hanya sembilan bulan, jauh lebih cepat dari standar industri. Kunci percepatan ini adalah pengetahuan OpenAI tentang beban kerja model nyata. Mereka bahkan menggunakan model AI mereka sendiri untuk mempercepat bagian proses desain dan optimasi chip. Ini menciptakan siklus umpan balik: model yang lebih baik membantu mendesain chip yang lebih baik, yang kemudian menurunkan biaya menjalankan model generasi berikutnya. Jalapeño difokuskan untuk inferensi, bukan pelatihan. Inferensi adalah pengeluaran tunai harian yang masif, terutama dengan berkembangnya Agent dan tugas-tugas rantai panjang. Dengan mengura...

OpenAI akhirnya membuat chip.

Banyak orang melihat berita ini, reaksi pertama mereka adalah: NVIDIA dalam masalah.

Tapi yang saya lihat justru sebaliknya.

Makna terpenting dari chip pertama Jalapeño bukanlah langsung menargetkan NVIDIA.

Ini adalah pertama kalinya OpenAI secara terbuka mengakui bahwa mereka tidak puas hanya menjadi perusahaan model.

Yang ingin mereka kendalikan adalah seluruh proses produksi kecerdasan.

Dari model, hingga chip. Dari pusat data, hingga energi. Dari pelatihan, hingga inferensi. Dari memproduksi Token, hingga menjual Token.

Jalapeño secara permukaan adalah sebuah chip, tetapi sebenarnya lebih mirip peta jalan.

OpenAI akhirnya meletakkan ambisinya di atas meja.

I. Jarak Model Mengecil, Jarak Komputasi Melebar

Sejak ledakan model besar, hampir semua perhatian industri AI ada di model.

GPT-4 keluar, industri diguncang sekali, Claude menyusul, Gemini menyusul, DeepSeek menurunkan harga, Meta membuka sumber terbuka. Setiap rilis, semua orang melihat sekumpulan hal yang sama: parameter, peringkat, kemampuan kode, kemampuan matematika, konteks panjang, multimodal.

Model tentu penting. Tapi satu perubahan sudah muncul, jendela keunggulan model semakin pendek. Hari ini sebuah model baru dirilis, beberapa bulan kemudian komunitas sumber terbuka, pesaing, penyedia cloud akan menyusul. Kesenjangan kemampuan masih ada, tetapi semakin sulit membentuk penghalang jangka panjang secara independen.

Yang benar-benar melebarkan jarak, mulai bergerak ke lapisan yang lebih mendasar. Pasokan daya komputasi, biaya inferensi, throughput sistem, kemampuan jaringan, pembangunan pusat data, perolehan energi. Tidak seindah rilis model, juga tidak langsung menjadi viral. Tapi mereka menentukan apakah sebuah perusahaan AI bisa terus berjalan dalam jangka panjang.

Jensen Huang baru-baru ini berkata: Sistem NVIDIA mungkin bukan yang termurah dalam pembelian, tetapi dapat menghasilkan biaya per Token terendah, throughput Token tertinggi, dan akhirnya membawa pendapatan tertinggi.

Kata-kata Jensen ini sangat langsung. Industri selalu mengeluh NVIDIA mahal, Jensen tidak membela harga pembelian, tetapi mengubah masalah ke dimensi lain: jangan lihat berapa banyak uang yang dikeluarkan untuk membeli mesin, lihat biaya produksi setiap Token.

Inilah buku keuangan baru era AI. Server dan GPU bukan unit akhir, Token-lah unitnya.

OpenAI kebetulan berada di pusat masalah ini.

ChatGPT setiap hari memproses banyak sekali permintaan, Codex mengonsumsi lebih banyak langkah inferensi, di masa depan masih ada Agent, pembuatan video, robotika, rantai inferensi panjang. Semakin berguna modelnya, semakin besar konsumsi Token. Semakin sukses produknya, semakin tebal tagihan inferensi.

Kekejaman ada di sini, semakin banyak pengguna OpenAI, semakin banyak NVIDIA untung. Semakin kuat produk OpenAI, semakin berat pajak daya komputasi di lapisan dasar.

Jika setiap Token harus melewati platform perangkat keras eksternal dan dikenai pajak, OpenAI sulit memiliki parit pertahanan yang utuh. Mereka bisa punya model terkuat, pintu masuk super, ekosistem pengembang. Tapi biaya produksi inti selalu terhalang di tangan orang lain.

Inti Jalapeño ada di sini. OpenAI mulai membangun pabrik Token sendiri.

II. GPT Mulai Merancang GPT

Detail chip Jalapeño yang paling mudah diremehkan adalah waktu fabrikasi (tape-out) sembilan bulan.

Proyek ASIC kinerja tinggi tradisional, siklusnya biasanya 18 bulan hingga 36 bulan. Proses canggih lebih merepotkan, arsitektur, verifikasi, implementasi fisik, pengemasan, software stack, debug, masalah di bagian mana pun akan dengan cepat meningkatkan biaya. OpenAI dan Broadcom memampatkan siklus menjadi sembilan bulan.

Ini tidak bisa dipahami sebagai industri chip tiba-tiba menjadi sederhana. OpenAI tidak tiba-tiba menumbuhkan rantai industri semikonduktor. Broadcom memiliki pengalaman mendalam dalam chip kustom dan infrastruktur jaringan, Celestica bertanggung jawab atas kartu, rak, dan rekayasa sistem.

Kontribusi OpenAI yang sebenarnya adalah hal yang lebih langka: mereka tahu bagaimana model masa depan akan berjalan.

Banyak perusahaan chip membuat akselerator AI, kesulitannya adalah menebak beban kerja. Struktur model akan berubah, cara inferensi akan berubah, mode layanan akan berubah. Setelah chip diproduksi (tape-out), dunia fisik tidak mudah untuk dikembalikan seperti dunia perangkat lunak.

OpenAI tidak perlu sepenuhnya mengandalkan tebakan. Setiap hari menjalankan ChatGPT, Codex, dan API, mereka tahu kernel mana yang paling sering digunakan, transfer memori mana yang paling boros, hambatan jaringan mana yang paling mempengaruhi efisiensi kluster, latensi mana yang langsung merusak pengalaman produk. Mereka juga tahu bagaimana produk Agent di masa depan akan mengonsumsi sumber daya inferensi.

Pengalaman ini sebelumnya hanya pengetahuan rekayasa di belakang layar, sekarang tertulis dalam arsitektur chip.

Dalam siaran pers resmi OpenAI ada satu kalimat kunci: OpenAI menggunakan modelnya sendiri untuk mempercepat bagian dari proses desain dan optimisasi. Juga dikatakan, model yang diberikan kepada pengguna juga membantu meningkatkan infrastruktur yang akan menjalankan model di masa depan.

GPT mulai terlibat dalam merancang mesin untuk GPT generasi berikutnya.

Rantai chip selama beberapa dekade terakhir adalah, pertama-tama mendesain chip, chip menjalankan perangkat lunak, perangkat lunak menjalankan AI. Sekarang rantai mulai berbalik, AI membantu manusia mendesain chip, chip kemudian menjalankan AI generasi berikutnya.

Begitu lingkaran tertutup ini terbentuk, sembilan bulan mungkin baru permulaan. Di masa depan mungkin enam bulan, tiga bulan, atau bahkan iterasi yang lebih padat.

Industri chip sebelumnya memiliki ritmenya sendiri, industri model memiliki ritmenya sendiri. Yang pertama lambat, yang kedua cepat. Jalapeño menarik kedua ritme ini bersama.

Langkah ini jika berhasil, roda gila (flywheel) OpenAI akan menjadi sangat menakutkan. Model yang lebih baik membantu merancang chip yang lebih baik, chip yang lebih baik menurunkan biaya operasi model generasi berikutnya, biaya yang lebih rendah mendukung lebih banyak pengguna dan produk, lebih banyak pengguna dan produk membawa lebih banyak data beban kerja nyata, data ini kemudian berbalik mendefinisikan chip generasi berikutnya.

Inilah siklus yang benar-benar diinginkan OpenAI.

III. Mengurangi Pajak Inferensi, Mengendalikan Arus Kas

Jalapeño bukanlah chip pelatihan, ia ditujukan untuk inferensi model bahasa besar. Ini poin yang sangat krusial.

Pelatihan seperti membangun kapal induk. Satu kali investasi besar, membutuhkan kemampuan umum yang sangat kuat, perlu terus beradaptasi dengan model baru, arsitektur baru, eksperimen baru. Pasar pelatihan masih sangat bergantung pada NVIDIA, bukan hanya GPU, tetapi seluruh platform CUDA, jaringan, sistem, pustaka perangkat lunak, ekosistem pengembang.

Inferensi lebih mirip armada taksi. Berjalan setiap hari, setiap jam, setiap menit. Setiap kali pengguna mengajukan pertanyaan, API merespons sekali, Agent melangkah maju, inferensi harus terjadi. Ini lebih memperhatikan latensi rendah, biaya rendah, throughput tinggi, utilisasi tinggi.

Pelatihan membakar uang besar secara bertahap, inferensi membakar arus kas harian.

Ini juga masalah paling menyakitkan bagi perusahaan AI setelah mencapai tahap komersialisasi. Pelatihan GPT sekali sangat mahal, tetapi inferensi terjadi setiap hari. Era Agent akan terus memperbesar masalah ini, satu tugas mungkin berisi puluhan bahkan ratusan panggilan model. Konteks panjang, inferensi berantai, generasi multimodal, eksekusi kode, semua terus mendorong konsumsi Token naik.

Jalapeño membidik pajak inferensi ini. Ini lebih mirip TPU-nya sendiri OpenAI. Google, Amazon, Meta, Microsoft semua telah melalui jalur serupa, selama beban kerja cukup besar, ASIC buatan sendiri memiliki nilai ekonomis dengan rasio harga-kinerja tinggi.

OpenAI sekarang memiliki kondisi ini. Ada permintaan nyata, ada roadmap produk, ada tim model, ada mitra industri seperti Broadcom, dan juga tekanan biaya yang sangat besar.

Jalapeño tidak perlu dijual ke luar untuk membuktikan nilainya. Selama ini membuat ChatGPT menjawab lebih murah, membuat Codex berjalan lebih cepat, membuat API margin laba lebih tinggi, ini sudah bermakna.

OpenAI juga menyebutkan, Jalapeño akan mengurangi transfer data, menyeimbangkan sumber daya komputasi, memori, dan jaringan, sehingga utilisasi aktual lebih mendekati puncak teoretis. Daya komputasi mahal sering kali mahal karena tidak digunakan sepenuhnya, GPU menunggu jaringan, transfer memori memperlambat komputasi, penjadwalan yang buruk menyebabkan idle, semua pemborosan akhirnya menjadi biaya listrik dan pengeluaran modal.

Harga pembelian hanya lapisan pertama, efisiensi sistem adalah perhitungan akhir.

IV. OpenAI Semakin Mirip Apple

Banyak orang akan memahami Jalapeño sebagai OpenAI menantang NVIDIA, tapi saya rasa OpenAI tidak ingin menjadi NVIDIA berikutnya, lebih mirip sedang belajar dari Apple.

Yang paling hebat dari Apple tidak pernah hanya satu titik tertentu. iPhone kuat, iOS kuat, chip seri A dan M kuat, App Store kuat. Tapi tempat yang benar-benar sulit ditandingi Apple adalah semua hal ini ditempatkan dalam satu lingkaran tertutup yang sama.

Chip dioptimalkan untuk sistem, sistem dioptimalkan untuk aplikasi, pengalaman aplikasi kemudian mendefinisikan chip generasi berikutnya. Lingkaran tertutup ini memungkinkan Apple dalam batasan baterai, volume, dan pendinginan yang sama, dapat membuat pengalaman yang sulit ditiru orang lain.

OpenAI sedang membangun sesuatu yang serupa. Model adalah inti kecerdasan, ChatGPT adalah pintu masuk super, Codex adalah alat pengembang, API adalah lapisan distribusi ekosistem, Jalapeño adalah chip buatan sendiri, pusat data adalah pabrik AI.

CEO OpenAI Altman dua tahun terakhir berulang kali membicarakan chip, energi, fusi nuklir, pusat data, sekarang terlihat mungkin sama sekali bukan mengejar konsep, dia tidak lagi merencanakan OpenAI dengan cara perusahaan rintisan AI.

Jika dikatakan NVIDIA menjual sekop, maka OpenAI ingin memiliki tambang.

NVIDIA ingin menjadi pemasok peralatan pabrik untuk semua perusahaan AI, menjual GPU, jaringan, sistem, ekosistem perangkat lunak, solusi pabrik AI, klien ideal adalah setiap perusahaan yang perlu memproduksi Token.

OpenAI ingin membangun satu set pabrik untuk diri mereka sendiri, yang dijual bukan peralatan, melainkan kecerdasan yang akhirnya dihasilkan.

Dalam jangka pendek, OpenAI tidak bisa lepas dari NVIDIA. Pelatihan dan komputasi umum masih membutuhkan platform GPU, Jalapeño juga tidak mungkin cepat mencakup semua beban kerja. Kemungkinan besar mereka akan masuk terlebih dahulu ke skenario inferensi OpenAI yang paling pasti, terbesar, dan dengan pengembalian optimalisasi tertinggi.

Dalam jangka panjang, retakan sudah muncul. Ketika perusahaan model mulai memiliki roadmap chip mereka sendiri, klien NVIDIA tidak lagi hanya klien. Mereka juga akan menjadi pemain lain di infrastruktur AI.

Kata-kata di Luar Halaman

Dua puluh tahun terakhir, aset terpenting internet adalah lalu lintas (traffic). Siapa yang menguasai pengguna, dialah yang menguasai nilai.

Hari ini, era AI sedang menunjukkan hukum baru.

Model semakin mirip lalu lintas, sedangkan komputasi semakin mirip tanah.

Model akan berulang, produk akan berubah, papan peringkat akan terus diperbarui. Tapi pabrik-pabrik yang memproduksi kecerdasan, chip, jaringan, pusat data, energi, akan semakin terkonsentrasi di tangan sedikit pemain.

GPT mulai merancang GPT, tampaknya hanya satu kali tape-out.

Tapi hal yang benar-benar diumumkannya adalah:

OpenAI sudah tidak puas hanya menjadi perusahaan terpintar, mereka ingin menjadi perusahaan yang mengendalikan produksi kecerdasan.

Artikel ini berasal dari akun WeChat: 版面之外, Penulis: 画画

Artikel ini berasal dari akun WeChat: 版面之外, Penulis: 画画, Gambar judul dari: AI generatif

熱門幣種推薦

相關問答

QApa arti penting utama chip pertama OpenAI yang bernama Jalapeño menurut artikel ini?

AArti penting utama chip Jalapeño bukanlah menantang Nvidia secara langsung, melainkan sebagai tanda pertama bahwa OpenAI tidak puas hanya menjadi perusahaan model. Ini adalah langkah untuk mengendalikan seluruh proses produksi kecerdasan, dari model, chip, pusat data, hingga energi. Jalapeño adalah peta jalan ambisi OpenAI.

QMengapa OpenAI merasa perlu merancang chipnya sendiri (Jalapeño) untuk inferensi?

AOpenAI perlu merancang chip sendiri untuk mengurangi 'pajak inferensi'—biaya produksi Token harian yang menjadi beban arus kas. Dengan beban kerja inferensi yang besar dari produk seperti ChatGPT dan API, chip khusus (ASIC) seperti Jalapeño dapat meningkatkan efisiensi sistem, menurunkan biaya per Token, dan meningkatkan margin keuntungan, sehingga memperkuat daya saing jangka panjang.

QBagaimana artikel menggambarkan peran AI (GPT) dalam proses desain chip Jalapeño?

AArtikel menyebutkan bahwa OpenAI menggunakan model AI-nya sendiri untuk mempercepat bagian dari proses desain dan optimasi chip. Ini berarti GPT membantu merancang mesin yang akan menjalankan generasi GPT berikutnya, menciptakan siklus umpan balik di mana AI mendesain perangkat keras untuk AI generasi mendatang, berpotensi sangat mempercepat iterasi pengembangan chip.

QMenurut artikel, mengapa perbedaan dalam komputasi (seperti pasokan daya komputasi, biaya) menjadi lebih penting daripada perbedaan model di era AI saat ini?

AKarena jendela keunggulan model semakin pendek; kemampuan model dapat dengan cepat dikejar oleh pesaing atau komunitas open source. Namun, faktor dasar seperti pasokan daya komputasi, biaya inferensi, dan efisiensi sistem menentukan apakah sebuah perusahaan AI dapat bertahan dalam jangka panjang. Biaya produksi Token menjadi pembukuan baru yang kritis.

QDengan meluncurkan Jalapeño, perusahaan seperti apakah yang ingin dibentuk oleh OpenAI menurut analisis artikel ini?

AOpenAI ingin menjadi perusahaan yang mirip dengan Apple—membangun ekosistem tertutup yang terintegrasi penuh. Mereka mengintegrasikan model (otak), produk seperti ChatGPT (pintu masuk), API (lapisan distribusi), chip khusus (Jalapeño), dan pusat data. Tujuannya adalah mengendalikan seluruh rantai produksi kecerdasan dan menjual 'kecerdasan' itu sendiri, bukan sekadar menjual peralatan (seperti Nvidia).

你可能也喜歡

Bitmine以太坊储备增至98亿美元:"加密货币最好的年份尚未到来"

比特浸入科技(Bitmine Immersion Technologies)近期再次成为头条,其在一周内增持了27,084枚以太坊(ETH)。这使得其以太坊总持有量达到5,700,040枚,按每枚1,569美元计算,价值约90.1亿美元,占以太坊总供应量的4.7%。此次增持发生在以太坊价格从约1780美元下跌至1578.54美元(撰稿时)的一周内。同时,根据SoSo Value数据,以太坊ETF在整个六月大部分时间出现资金外流,总额达5.0139亿美元。 针对疲软的市场状况,比特浸入科技董事长汤姆·李(Tom Lee)表示,近期市场对加密货币投资者颇具挑战,并指出临近季度末的“粉饰橱窗”行为导致投资者减持过去三个月表现不佳的资产是常见现象。此外,迈克尔·赛勒(Michael Saylor)的公司Strategy正面临持续审查,据报道其持有约140亿美元未实现亏损,而其普通股和优先股价格均跌破100美元水平,引发加密社区部分人士建议其停止扩张比特币持仓。 由于比特浸入科技常被称为“以太坊的Strategy”,市场担忧其持续的以太坊积累行为可能面临类似困境与批评。目前上市公司共持有价值约749.4亿美元的比特币和114.8亿美元的以太坊,Strategy是最大的比特币持仓上市公司。 然而,目前这些担忧仅是推测。比特浸入科技并非单纯积累以太坊,其每年质押收入估计达2.11亿美元,同时持有5.55亿美元现金及等价物以及488万枚质押的ETH。该公司还于6月26日被纳入罗素1000大型股指数。汤姆·李强调,公司计划稳步增长至2026年,并认为市场正开启新一轮牛市周期,代币化和人工智能的快速进展将推动区块链和去中心化加密领域的指数级需求增长。 最终摘要: * 新增持后,比特浸入科技持有5,700,040枚ETH,价值约90.1亿美元。 * 尽管以太坊价格疲软、ETF资金外流且Strategy面临批评,比特浸入科技仍持续购入以太坊。

ambcrypto3 小時前

Bitmine以太坊储备增至98亿美元:"加密货币最好的年份尚未到来"

ambcrypto3 小時前

交易

現貨

熱門文章

如何購買PEOPLE

歡迎來到HTX.com!在這裡,購買ConstitutionDAO (PEOPLE)變得簡單而便捷。跟隨我們的逐步指南,放心開始您的加密貨幣之旅。第一步:創建您的HTX帳戶使用您的 Email、手機號碼在HTX註冊一個免費帳戶。體驗無憂的註冊過程並解鎖所有平台功能。立即註冊第二步:前往買幣頁面,選擇您的支付方式信用卡/金融卡購買:使用您的Visa或Mastercard即時購買ConstitutionDAO (PEOPLE)。餘額購買:使用您HTX帳戶餘額中的資金進行無縫交易。第三方購買:探索諸如Google Pay或Apple Pay等流行支付方式以增加便利性。C2C購買:在HTX平台上直接與其他用戶交易。HTX 場外交易 (OTC) 購買:為大量交易者提供個性化服務和競爭性匯率。第三步:存儲您的ConstitutionDAO (PEOPLE)購買ConstitutionDAO (PEOPLE)後,將其存儲在您的HTX帳戶中。您也可以透過區塊鏈轉帳將其發送到其他地址或者用於交易其他加密貨幣。第四步:交易ConstitutionDAO (PEOPLE)在HTX的現貨市場輕鬆交易ConstitutionDAO (PEOPLE)。前往您的帳戶,選擇交易對,執行交易,並即時監控。HTX為初學者和經驗豐富的交易者提供了友好的用戶體驗。

831 人學過發佈於 2024.12.12更新於 2026.06.02

如何購買PEOPLE

相關討論

歡迎來到 HTX 社群。在這裡,您可以了解最新的平台發展動態並獲得專業的市場意見。 以下是用戶對 PEOPLE (PEOPLE)幣價的意見。

活动图片