GPT Merancang GPT

marsbit發佈於 2026-06-25更新於 2026-06-25

文章摘要

OpenAI akhirnya merilis chip pertamanya, Jalapeño. Meski banyak yang menganggapnya sebagai tantangan bagi Nvidia, inti dari langkah ini justru adalah pengakuan terbuka OpenAI bahwa mereka tidak puas hanya menjadi perusahaan model AI. Mereka ingin mengontrol seluruh proses produksi kecerdasan, dari model, chip, hingga pusat data dan energi. Perbedaan kemampuan model semakin menyempit, namun kesenjangan dalam komputasi justru melebar. Dalam era AI, satuan biaya terpenting bukan lagi harga server atau GPU, melainkan biaya produksi setiap Token. Sebagai penyedia layanan seperti ChatGPT dan API, OpenAI menghadapi kenyataan bahwa semakin sukses produk mereka, semakin besar "pajak inferensi" yang harus dibayarkan ke penyedia hardware eksternal. Jalapeño adalah upaya membangun "pabrik Token" sendiri untuk mengurangi ketergantungan ini. Yang menarik, siklus pengembangan chip Jalapeño hanya sembilan bulan, jauh lebih cepat dari standar industri. Kunci percepatan ini adalah pengetahuan OpenAI tentang beban kerja model nyata. Mereka bahkan menggunakan model AI mereka sendiri untuk mempercepat bagian proses desain dan optimasi chip. Ini menciptakan siklus umpan balik: model yang lebih baik membantu mendesain chip yang lebih baik, yang kemudian menurunkan biaya menjalankan model generasi berikutnya. Jalapeño difokuskan untuk inferensi, bukan pelatihan. Inferensi adalah pengeluaran tunai harian yang masif, terutama dengan berkembangnya Agent dan tugas-tugas rantai panjang. Dengan mengura...

OpenAI akhirnya membuat chip.

Banyak orang melihat berita ini, reaksi pertama mereka adalah: NVIDIA dalam masalah.

Tapi yang saya lihat justru sebaliknya.

Makna terpenting dari chip pertama Jalapeño bukanlah langsung menargetkan NVIDIA.

Ini adalah pertama kalinya OpenAI secara terbuka mengakui bahwa mereka tidak puas hanya menjadi perusahaan model.

Yang ingin mereka kendalikan adalah seluruh proses produksi kecerdasan.

Dari model, hingga chip. Dari pusat data, hingga energi. Dari pelatihan, hingga inferensi. Dari memproduksi Token, hingga menjual Token.

Jalapeño secara permukaan adalah sebuah chip, tetapi sebenarnya lebih mirip peta jalan.

OpenAI akhirnya meletakkan ambisinya di atas meja.

I. Jarak Model Mengecil, Jarak Komputasi Melebar

Sejak ledakan model besar, hampir semua perhatian industri AI ada di model.

GPT-4 keluar, industri diguncang sekali, Claude menyusul, Gemini menyusul, DeepSeek menurunkan harga, Meta membuka sumber terbuka. Setiap rilis, semua orang melihat sekumpulan hal yang sama: parameter, peringkat, kemampuan kode, kemampuan matematika, konteks panjang, multimodal.

Model tentu penting. Tapi satu perubahan sudah muncul, jendela keunggulan model semakin pendek. Hari ini sebuah model baru dirilis, beberapa bulan kemudian komunitas sumber terbuka, pesaing, penyedia cloud akan menyusul. Kesenjangan kemampuan masih ada, tetapi semakin sulit membentuk penghalang jangka panjang secara independen.

Yang benar-benar melebarkan jarak, mulai bergerak ke lapisan yang lebih mendasar. Pasokan daya komputasi, biaya inferensi, throughput sistem, kemampuan jaringan, pembangunan pusat data, perolehan energi. Tidak seindah rilis model, juga tidak langsung menjadi viral. Tapi mereka menentukan apakah sebuah perusahaan AI bisa terus berjalan dalam jangka panjang.

Jensen Huang baru-baru ini berkata: Sistem NVIDIA mungkin bukan yang termurah dalam pembelian, tetapi dapat menghasilkan biaya per Token terendah, throughput Token tertinggi, dan akhirnya membawa pendapatan tertinggi.

Kata-kata Jensen ini sangat langsung. Industri selalu mengeluh NVIDIA mahal, Jensen tidak membela harga pembelian, tetapi mengubah masalah ke dimensi lain: jangan lihat berapa banyak uang yang dikeluarkan untuk membeli mesin, lihat biaya produksi setiap Token.

Inilah buku keuangan baru era AI. Server dan GPU bukan unit akhir, Token-lah unitnya.

OpenAI kebetulan berada di pusat masalah ini.

ChatGPT setiap hari memproses banyak sekali permintaan, Codex mengonsumsi lebih banyak langkah inferensi, di masa depan masih ada Agent, pembuatan video, robotika, rantai inferensi panjang. Semakin berguna modelnya, semakin besar konsumsi Token. Semakin sukses produknya, semakin tebal tagihan inferensi.

Kekejaman ada di sini, semakin banyak pengguna OpenAI, semakin banyak NVIDIA untung. Semakin kuat produk OpenAI, semakin berat pajak daya komputasi di lapisan dasar.

Jika setiap Token harus melewati platform perangkat keras eksternal dan dikenai pajak, OpenAI sulit memiliki parit pertahanan yang utuh. Mereka bisa punya model terkuat, pintu masuk super, ekosistem pengembang. Tapi biaya produksi inti selalu terhalang di tangan orang lain.

Inti Jalapeño ada di sini. OpenAI mulai membangun pabrik Token sendiri.

II. GPT Mulai Merancang GPT

Detail chip Jalapeño yang paling mudah diremehkan adalah waktu fabrikasi (tape-out) sembilan bulan.

Proyek ASIC kinerja tinggi tradisional, siklusnya biasanya 18 bulan hingga 36 bulan. Proses canggih lebih merepotkan, arsitektur, verifikasi, implementasi fisik, pengemasan, software stack, debug, masalah di bagian mana pun akan dengan cepat meningkatkan biaya. OpenAI dan Broadcom memampatkan siklus menjadi sembilan bulan.

Ini tidak bisa dipahami sebagai industri chip tiba-tiba menjadi sederhana. OpenAI tidak tiba-tiba menumbuhkan rantai industri semikonduktor. Broadcom memiliki pengalaman mendalam dalam chip kustom dan infrastruktur jaringan, Celestica bertanggung jawab atas kartu, rak, dan rekayasa sistem.

Kontribusi OpenAI yang sebenarnya adalah hal yang lebih langka: mereka tahu bagaimana model masa depan akan berjalan.

Banyak perusahaan chip membuat akselerator AI, kesulitannya adalah menebak beban kerja. Struktur model akan berubah, cara inferensi akan berubah, mode layanan akan berubah. Setelah chip diproduksi (tape-out), dunia fisik tidak mudah untuk dikembalikan seperti dunia perangkat lunak.

OpenAI tidak perlu sepenuhnya mengandalkan tebakan. Setiap hari menjalankan ChatGPT, Codex, dan API, mereka tahu kernel mana yang paling sering digunakan, transfer memori mana yang paling boros, hambatan jaringan mana yang paling mempengaruhi efisiensi kluster, latensi mana yang langsung merusak pengalaman produk. Mereka juga tahu bagaimana produk Agent di masa depan akan mengonsumsi sumber daya inferensi.

Pengalaman ini sebelumnya hanya pengetahuan rekayasa di belakang layar, sekarang tertulis dalam arsitektur chip.

Dalam siaran pers resmi OpenAI ada satu kalimat kunci: OpenAI menggunakan modelnya sendiri untuk mempercepat bagian dari proses desain dan optimisasi. Juga dikatakan, model yang diberikan kepada pengguna juga membantu meningkatkan infrastruktur yang akan menjalankan model di masa depan.

GPT mulai terlibat dalam merancang mesin untuk GPT generasi berikutnya.

Rantai chip selama beberapa dekade terakhir adalah, pertama-tama mendesain chip, chip menjalankan perangkat lunak, perangkat lunak menjalankan AI. Sekarang rantai mulai berbalik, AI membantu manusia mendesain chip, chip kemudian menjalankan AI generasi berikutnya.

Begitu lingkaran tertutup ini terbentuk, sembilan bulan mungkin baru permulaan. Di masa depan mungkin enam bulan, tiga bulan, atau bahkan iterasi yang lebih padat.

Industri chip sebelumnya memiliki ritmenya sendiri, industri model memiliki ritmenya sendiri. Yang pertama lambat, yang kedua cepat. Jalapeño menarik kedua ritme ini bersama.

Langkah ini jika berhasil, roda gila (flywheel) OpenAI akan menjadi sangat menakutkan. Model yang lebih baik membantu merancang chip yang lebih baik, chip yang lebih baik menurunkan biaya operasi model generasi berikutnya, biaya yang lebih rendah mendukung lebih banyak pengguna dan produk, lebih banyak pengguna dan produk membawa lebih banyak data beban kerja nyata, data ini kemudian berbalik mendefinisikan chip generasi berikutnya.

Inilah siklus yang benar-benar diinginkan OpenAI.

III. Mengurangi Pajak Inferensi, Mengendalikan Arus Kas

Jalapeño bukanlah chip pelatihan, ia ditujukan untuk inferensi model bahasa besar. Ini poin yang sangat krusial.

Pelatihan seperti membangun kapal induk. Satu kali investasi besar, membutuhkan kemampuan umum yang sangat kuat, perlu terus beradaptasi dengan model baru, arsitektur baru, eksperimen baru. Pasar pelatihan masih sangat bergantung pada NVIDIA, bukan hanya GPU, tetapi seluruh platform CUDA, jaringan, sistem, pustaka perangkat lunak, ekosistem pengembang.

Inferensi lebih mirip armada taksi. Berjalan setiap hari, setiap jam, setiap menit. Setiap kali pengguna mengajukan pertanyaan, API merespons sekali, Agent melangkah maju, inferensi harus terjadi. Ini lebih memperhatikan latensi rendah, biaya rendah, throughput tinggi, utilisasi tinggi.

Pelatihan membakar uang besar secara bertahap, inferensi membakar arus kas harian.

Ini juga masalah paling menyakitkan bagi perusahaan AI setelah mencapai tahap komersialisasi. Pelatihan GPT sekali sangat mahal, tetapi inferensi terjadi setiap hari. Era Agent akan terus memperbesar masalah ini, satu tugas mungkin berisi puluhan bahkan ratusan panggilan model. Konteks panjang, inferensi berantai, generasi multimodal, eksekusi kode, semua terus mendorong konsumsi Token naik.

Jalapeño membidik pajak inferensi ini. Ini lebih mirip TPU-nya sendiri OpenAI. Google, Amazon, Meta, Microsoft semua telah melalui jalur serupa, selama beban kerja cukup besar, ASIC buatan sendiri memiliki nilai ekonomis dengan rasio harga-kinerja tinggi.

OpenAI sekarang memiliki kondisi ini. Ada permintaan nyata, ada roadmap produk, ada tim model, ada mitra industri seperti Broadcom, dan juga tekanan biaya yang sangat besar.

Jalapeño tidak perlu dijual ke luar untuk membuktikan nilainya. Selama ini membuat ChatGPT menjawab lebih murah, membuat Codex berjalan lebih cepat, membuat API margin laba lebih tinggi, ini sudah bermakna.

OpenAI juga menyebutkan, Jalapeño akan mengurangi transfer data, menyeimbangkan sumber daya komputasi, memori, dan jaringan, sehingga utilisasi aktual lebih mendekati puncak teoretis. Daya komputasi mahal sering kali mahal karena tidak digunakan sepenuhnya, GPU menunggu jaringan, transfer memori memperlambat komputasi, penjadwalan yang buruk menyebabkan idle, semua pemborosan akhirnya menjadi biaya listrik dan pengeluaran modal.

Harga pembelian hanya lapisan pertama, efisiensi sistem adalah perhitungan akhir.

IV. OpenAI Semakin Mirip Apple

Banyak orang akan memahami Jalapeño sebagai OpenAI menantang NVIDIA, tapi saya rasa OpenAI tidak ingin menjadi NVIDIA berikutnya, lebih mirip sedang belajar dari Apple.

Yang paling hebat dari Apple tidak pernah hanya satu titik tertentu. iPhone kuat, iOS kuat, chip seri A dan M kuat, App Store kuat. Tapi tempat yang benar-benar sulit ditandingi Apple adalah semua hal ini ditempatkan dalam satu lingkaran tertutup yang sama.

Chip dioptimalkan untuk sistem, sistem dioptimalkan untuk aplikasi, pengalaman aplikasi kemudian mendefinisikan chip generasi berikutnya. Lingkaran tertutup ini memungkinkan Apple dalam batasan baterai, volume, dan pendinginan yang sama, dapat membuat pengalaman yang sulit ditiru orang lain.

OpenAI sedang membangun sesuatu yang serupa. Model adalah inti kecerdasan, ChatGPT adalah pintu masuk super, Codex adalah alat pengembang, API adalah lapisan distribusi ekosistem, Jalapeño adalah chip buatan sendiri, pusat data adalah pabrik AI.

CEO OpenAI Altman dua tahun terakhir berulang kali membicarakan chip, energi, fusi nuklir, pusat data, sekarang terlihat mungkin sama sekali bukan mengejar konsep, dia tidak lagi merencanakan OpenAI dengan cara perusahaan rintisan AI.

Jika dikatakan NVIDIA menjual sekop, maka OpenAI ingin memiliki tambang.

NVIDIA ingin menjadi pemasok peralatan pabrik untuk semua perusahaan AI, menjual GPU, jaringan, sistem, ekosistem perangkat lunak, solusi pabrik AI, klien ideal adalah setiap perusahaan yang perlu memproduksi Token.

OpenAI ingin membangun satu set pabrik untuk diri mereka sendiri, yang dijual bukan peralatan, melainkan kecerdasan yang akhirnya dihasilkan.

Dalam jangka pendek, OpenAI tidak bisa lepas dari NVIDIA. Pelatihan dan komputasi umum masih membutuhkan platform GPU, Jalapeño juga tidak mungkin cepat mencakup semua beban kerja. Kemungkinan besar mereka akan masuk terlebih dahulu ke skenario inferensi OpenAI yang paling pasti, terbesar, dan dengan pengembalian optimalisasi tertinggi.

Dalam jangka panjang, retakan sudah muncul. Ketika perusahaan model mulai memiliki roadmap chip mereka sendiri, klien NVIDIA tidak lagi hanya klien. Mereka juga akan menjadi pemain lain di infrastruktur AI.

Kata-kata di Luar Halaman

Dua puluh tahun terakhir, aset terpenting internet adalah lalu lintas (traffic). Siapa yang menguasai pengguna, dialah yang menguasai nilai.

Hari ini, era AI sedang menunjukkan hukum baru.

Model semakin mirip lalu lintas, sedangkan komputasi semakin mirip tanah.

Model akan berulang, produk akan berubah, papan peringkat akan terus diperbarui. Tapi pabrik-pabrik yang memproduksi kecerdasan, chip, jaringan, pusat data, energi, akan semakin terkonsentrasi di tangan sedikit pemain.

GPT mulai merancang GPT, tampaknya hanya satu kali tape-out.

Tapi hal yang benar-benar diumumkannya adalah:

OpenAI sudah tidak puas hanya menjadi perusahaan terpintar, mereka ingin menjadi perusahaan yang mengendalikan produksi kecerdasan.

Artikel ini berasal dari akun WeChat: 版面之外, Penulis: 画画

Artikel ini berasal dari akun WeChat: 版面之外, Penulis: 画画, Gambar judul dari: AI generatif

你可能也喜歡

狗狗币未平仓合约徘徊在9.59亿美元左右，交易者等待复苏信号

狗狗币（DOGE）衍生品未平仓合约维持在约9.59亿美元，这一数据出现在周末交易相对清淡的时期。未平仓合约本身并不直接预示价格方向，它仅表明市场中存在大量持仓。要判断这些持仓是支撑复苏还是带来风险，交易者需结合价格走势、资金费率、成交量及清算水平进行分析。目前，这一数据说明狗狗币的衍生品市场仍然活跃。狗狗币作为受市场情绪和散户风险偏好影响较大的资产，高未平仓合约在价格疲软时可能加剧波动，而在价格上涨时则可能放大涨幅。关键的复苏信号取决于DOGE能否在衍生品兴趣之外，吸引真正的现货买盘。杠杆可以加速价格变动，但无法替代实际需求。总而言之，狗狗币尚未给出明确的复苏信号，但衍生品市场的参与度依然较高。这意味着接下来的价格确认动作可能比表面上的平静更为重要。投资者应将其视为一个需要密切监控的信号，并等待价格、资金流及整体市场行为的后续确认。

bitcoinist45 分鐘前

bitcoinist45 分鐘前

格兰特·卡多恩将比特币持仓增至2700枚——为何是现在？

Grant Cardone旗下的Cardone Capital在市场低迷期增持比特币，持仓量增至约2700枚BTC，平均购买价格为59,000美元。尽管没有公开文件独立证实这一持仓规模，但按当前价格计算其价值约1.59亿美元。此次买入发生在比特币价格处于近期波动区间低位、年内已下跌约32%的背景下，Cardone视其为积累机会。与此同时，最大企业持仓者MicroStrategy（持有约847,363枚BTC）却改变了策略，首次正式授权可出售最多12.5亿美元的比特币以筹措资金，这打破了其长期“永不卖出”的承诺。六月，美国现货比特币ETF遭遇创纪录的净流出，约40.6亿美元被赎回，加剧了市场抛压。技术分析显示，比特币周线图上的布林带下轨（绿色线）目前提供了支撑，该位置历史上曾多次引发价格反弹，暗示市场可能正在接近阶段性底部。

ambcrypto1 小時前

ambcrypto1 小時前

AI 时代，比特币还剩什么呢？

作者认为，在AI时代，信息生成成本趋近于零，导致真实与虚假内容难以辨别，“可验证性”变得稀缺。与此对比，比特币虽然因能耗高被诟病，但其本质是消耗能源来确保账本历史的不可篡改，从而提供一种不依赖任何中心化信任、仅靠数学与全网节点即可验证的机制。文章将AI比作降低“创造”成本的现代印刷机，而区块链（如比特币）则像降低“验证”成本的复式记账法。两者并非竞争关系：AI负责高效生成内容，区块链负责为数字资产与记录提供去中心化的验证基础。因此，比特币可被视为一台“制造可验证性的机器”。在AI生成内容泛滥的未来，独立验证的事实可能成为新的价值所在。

链捕手1 小時前

链捕手1 小時前

Bitmine以太坊储备增至98亿美元："加密货币最好的年份尚未到来"

比特浸入科技（Bitmine Immersion Technologies）近期再次成为头条，其在一周内增持了27,084枚以太坊（ETH）。这使得其以太坊总持有量达到5,700,040枚，按每枚1,569美元计算，价值约90.1亿美元，占以太坊总供应量的4.7%。此次增持发生在以太坊价格从约1780美元下跌至1578.54美元（撰稿时）的一周内。同时，根据SoSo Value数据，以太坊ETF在整个六月大部分时间出现资金外流，总额达5.0139亿美元。针对疲软的市场状况，比特浸入科技董事长汤姆·李（Tom Lee）表示，近期市场对加密货币投资者颇具挑战，并指出临近季度末的“粉饰橱窗”行为导致投资者减持过去三个月表现不佳的资产是常见现象。此外，迈克尔·赛勒（Michael Saylor）的公司Strategy正面临持续审查，据报道其持有约140亿美元未实现亏损，而其普通股和优先股价格均跌破100美元水平，引发加密社区部分人士建议其停止扩张比特币持仓。由于比特浸入科技常被称为“以太坊的Strategy”，市场担忧其持续的以太坊积累行为可能面临类似困境与批评。目前上市公司共持有价值约749.4亿美元的比特币和114.8亿美元的以太坊，Strategy是最大的比特币持仓上市公司。然而，目前这些担忧仅是推测。比特浸入科技并非单纯积累以太坊，其每年质押收入估计达2.11亿美元，同时持有5.55亿美元现金及等价物以及488万枚质押的ETH。该公司还于6月26日被纳入罗素1000大型股指数。汤姆·李强调，公司计划稳步增长至2026年，并认为市场正开启新一轮牛市周期，代币化和人工智能的快速进展将推动区块链和去中心化加密领域的指数级需求增长。最终摘要： * 新增持后，比特浸入科技持有5,700,040枚ETH，价值约90.1亿美元。 * 尽管以太坊价格疲软、ETF资金外流且Strategy面临批评，比特浸入科技仍持续购入以太坊。

ambcrypto3 小時前

ambcrypto3 小時前

英国FCA公布加密资产监管规则手册：基于风险的方法将于2027年10月启动

英国金融行为监管局公布新的加密货币监管框架，采取风险为本方法而非“一刀切”规则，将于2027年10月生效。新规要求加密公司持有充足资本覆盖潜在损失，具体金额将根据其风险状况浮动，较小或风险较低的公司可减少信息披露负担以节省合规成本。企业需自行评估资产负债表风险并进行年度压力测试，以确定所需资本水平，FCA将审核评估结果但不强加统一规则。此举旨在提升市场信心，吸引额外300-400万英国用户使用加密货币。针对稳定币，FCA保留了基本框架但简化了部分合规要求，例如取消储备构成预测估算，同时强化消费者保护，要求储备资产置于法定信托下并允许最多5%的流通稳定币作为储备。大型系统性发行机构可能面临更严监管。监管机构强调新规为加密行业提供了明确性与稳健基础，但也有市场人士提醒，监管虽可增强保护、减少欺诈，但无法完全消除风险。FCA将于下月开始提供许可申请前支持会议，以协助企业适应新规。

ambcrypto4 小時前

ambcrypto4 小時前

交易

現貨

GPT Merancang GPT

文章摘要

熱門幣種推薦

相關問答

你可能也喜歡

狗狗币未平仓合约徘徊在9.59亿美元左右，交易者等待复苏信号

格兰特·卡多恩将比特币持仓增至2700枚——为何是现在？

AI 时代，比特币还剩什么呢？

Bitmine以太坊储备增至98亿美元："加密货币最好的年份尚未到来"

英国FCA公布加密资产监管规则手册：基于风险的方法将于2027年10月启动

交易

熱門文章

如何購買PEOPLE

相關討論

熱門問答

熱門分類

熱門標籤