GPT Merancang GPT

marsbitPublicado em 2026-06-25Última atualização em 2026-06-25

Resumo

OpenAI akhirnya merilis chip pertamanya, Jalapeño. Meski banyak yang menganggapnya sebagai tantangan bagi Nvidia, inti dari langkah ini justru adalah pengakuan terbuka OpenAI bahwa mereka tidak puas hanya menjadi perusahaan model AI. Mereka ingin mengontrol seluruh proses produksi kecerdasan, dari model, chip, hingga pusat data dan energi. Perbedaan kemampuan model semakin menyempit, namun kesenjangan dalam komputasi justru melebar. Dalam era AI, satuan biaya terpenting bukan lagi harga server atau GPU, melainkan biaya produksi setiap Token. Sebagai penyedia layanan seperti ChatGPT dan API, OpenAI menghadapi kenyataan bahwa semakin sukses produk mereka, semakin besar "pajak inferensi" yang harus dibayarkan ke penyedia hardware eksternal. Jalapeño adalah upaya membangun "pabrik Token" sendiri untuk mengurangi ketergantungan ini. Yang menarik, siklus pengembangan chip Jalapeño hanya sembilan bulan, jauh lebih cepat dari standar industri. Kunci percepatan ini adalah pengetahuan OpenAI tentang beban kerja model nyata. Mereka bahkan menggunakan model AI mereka sendiri untuk mempercepat bagian proses desain dan optimasi chip. Ini menciptakan siklus umpan balik: model yang lebih baik membantu mendesain chip yang lebih baik, yang kemudian menurunkan biaya menjalankan model generasi berikutnya. Jalapeño difokuskan untuk inferensi, bukan pelatihan. Inferensi adalah pengeluaran tunai harian yang masif, terutama dengan berkembangnya Agent dan tugas-tugas rantai panjang. Dengan mengura...

OpenAI akhirnya membuat chip.

Banyak orang melihat berita ini, reaksi pertama mereka adalah: NVIDIA dalam masalah.

Tapi yang saya lihat justru sebaliknya.

Makna terpenting dari chip pertama Jalapeño bukanlah langsung menargetkan NVIDIA.

Ini adalah pertama kalinya OpenAI secara terbuka mengakui bahwa mereka tidak puas hanya menjadi perusahaan model.

Yang ingin mereka kendalikan adalah seluruh proses produksi kecerdasan.

Dari model, hingga chip. Dari pusat data, hingga energi. Dari pelatihan, hingga inferensi. Dari memproduksi Token, hingga menjual Token.

Jalapeño secara permukaan adalah sebuah chip, tetapi sebenarnya lebih mirip peta jalan.

OpenAI akhirnya meletakkan ambisinya di atas meja.

I. Jarak Model Mengecil, Jarak Komputasi Melebar

Sejak ledakan model besar, hampir semua perhatian industri AI ada di model.

GPT-4 keluar, industri diguncang sekali, Claude menyusul, Gemini menyusul, DeepSeek menurunkan harga, Meta membuka sumber terbuka. Setiap rilis, semua orang melihat sekumpulan hal yang sama: parameter, peringkat, kemampuan kode, kemampuan matematika, konteks panjang, multimodal.

Model tentu penting. Tapi satu perubahan sudah muncul, jendela keunggulan model semakin pendek. Hari ini sebuah model baru dirilis, beberapa bulan kemudian komunitas sumber terbuka, pesaing, penyedia cloud akan menyusul. Kesenjangan kemampuan masih ada, tetapi semakin sulit membentuk penghalang jangka panjang secara independen.

Yang benar-benar melebarkan jarak, mulai bergerak ke lapisan yang lebih mendasar. Pasokan daya komputasi, biaya inferensi, throughput sistem, kemampuan jaringan, pembangunan pusat data, perolehan energi. Tidak seindah rilis model, juga tidak langsung menjadi viral. Tapi mereka menentukan apakah sebuah perusahaan AI bisa terus berjalan dalam jangka panjang.

Jensen Huang baru-baru ini berkata: Sistem NVIDIA mungkin bukan yang termurah dalam pembelian, tetapi dapat menghasilkan biaya per Token terendah, throughput Token tertinggi, dan akhirnya membawa pendapatan tertinggi.

Kata-kata Jensen ini sangat langsung. Industri selalu mengeluh NVIDIA mahal, Jensen tidak membela harga pembelian, tetapi mengubah masalah ke dimensi lain: jangan lihat berapa banyak uang yang dikeluarkan untuk membeli mesin, lihat biaya produksi setiap Token.

Inilah buku keuangan baru era AI. Server dan GPU bukan unit akhir, Token-lah unitnya.

OpenAI kebetulan berada di pusat masalah ini.

ChatGPT setiap hari memproses banyak sekali permintaan, Codex mengonsumsi lebih banyak langkah inferensi, di masa depan masih ada Agent, pembuatan video, robotika, rantai inferensi panjang. Semakin berguna modelnya, semakin besar konsumsi Token. Semakin sukses produknya, semakin tebal tagihan inferensi.

Kekejaman ada di sini, semakin banyak pengguna OpenAI, semakin banyak NVIDIA untung. Semakin kuat produk OpenAI, semakin berat pajak daya komputasi di lapisan dasar.

Jika setiap Token harus melewati platform perangkat keras eksternal dan dikenai pajak, OpenAI sulit memiliki parit pertahanan yang utuh. Mereka bisa punya model terkuat, pintu masuk super, ekosistem pengembang. Tapi biaya produksi inti selalu terhalang di tangan orang lain.

Inti Jalapeño ada di sini. OpenAI mulai membangun pabrik Token sendiri.

II. GPT Mulai Merancang GPT

Detail chip Jalapeño yang paling mudah diremehkan adalah waktu fabrikasi (tape-out) sembilan bulan.

Proyek ASIC kinerja tinggi tradisional, siklusnya biasanya 18 bulan hingga 36 bulan. Proses canggih lebih merepotkan, arsitektur, verifikasi, implementasi fisik, pengemasan, software stack, debug, masalah di bagian mana pun akan dengan cepat meningkatkan biaya. OpenAI dan Broadcom memampatkan siklus menjadi sembilan bulan.

Ini tidak bisa dipahami sebagai industri chip tiba-tiba menjadi sederhana. OpenAI tidak tiba-tiba menumbuhkan rantai industri semikonduktor. Broadcom memiliki pengalaman mendalam dalam chip kustom dan infrastruktur jaringan, Celestica bertanggung jawab atas kartu, rak, dan rekayasa sistem.

Kontribusi OpenAI yang sebenarnya adalah hal yang lebih langka: mereka tahu bagaimana model masa depan akan berjalan.

Banyak perusahaan chip membuat akselerator AI, kesulitannya adalah menebak beban kerja. Struktur model akan berubah, cara inferensi akan berubah, mode layanan akan berubah. Setelah chip diproduksi (tape-out), dunia fisik tidak mudah untuk dikembalikan seperti dunia perangkat lunak.

OpenAI tidak perlu sepenuhnya mengandalkan tebakan. Setiap hari menjalankan ChatGPT, Codex, dan API, mereka tahu kernel mana yang paling sering digunakan, transfer memori mana yang paling boros, hambatan jaringan mana yang paling mempengaruhi efisiensi kluster, latensi mana yang langsung merusak pengalaman produk. Mereka juga tahu bagaimana produk Agent di masa depan akan mengonsumsi sumber daya inferensi.

Pengalaman ini sebelumnya hanya pengetahuan rekayasa di belakang layar, sekarang tertulis dalam arsitektur chip.

Dalam siaran pers resmi OpenAI ada satu kalimat kunci: OpenAI menggunakan modelnya sendiri untuk mempercepat bagian dari proses desain dan optimisasi. Juga dikatakan, model yang diberikan kepada pengguna juga membantu meningkatkan infrastruktur yang akan menjalankan model di masa depan.

GPT mulai terlibat dalam merancang mesin untuk GPT generasi berikutnya.

Rantai chip selama beberapa dekade terakhir adalah, pertama-tama mendesain chip, chip menjalankan perangkat lunak, perangkat lunak menjalankan AI. Sekarang rantai mulai berbalik, AI membantu manusia mendesain chip, chip kemudian menjalankan AI generasi berikutnya.

Begitu lingkaran tertutup ini terbentuk, sembilan bulan mungkin baru permulaan. Di masa depan mungkin enam bulan, tiga bulan, atau bahkan iterasi yang lebih padat.

Industri chip sebelumnya memiliki ritmenya sendiri, industri model memiliki ritmenya sendiri. Yang pertama lambat, yang kedua cepat. Jalapeño menarik kedua ritme ini bersama.

Langkah ini jika berhasil, roda gila (flywheel) OpenAI akan menjadi sangat menakutkan. Model yang lebih baik membantu merancang chip yang lebih baik, chip yang lebih baik menurunkan biaya operasi model generasi berikutnya, biaya yang lebih rendah mendukung lebih banyak pengguna dan produk, lebih banyak pengguna dan produk membawa lebih banyak data beban kerja nyata, data ini kemudian berbalik mendefinisikan chip generasi berikutnya.

Inilah siklus yang benar-benar diinginkan OpenAI.

III. Mengurangi Pajak Inferensi, Mengendalikan Arus Kas

Jalapeño bukanlah chip pelatihan, ia ditujukan untuk inferensi model bahasa besar. Ini poin yang sangat krusial.

Pelatihan seperti membangun kapal induk. Satu kali investasi besar, membutuhkan kemampuan umum yang sangat kuat, perlu terus beradaptasi dengan model baru, arsitektur baru, eksperimen baru. Pasar pelatihan masih sangat bergantung pada NVIDIA, bukan hanya GPU, tetapi seluruh platform CUDA, jaringan, sistem, pustaka perangkat lunak, ekosistem pengembang.

Inferensi lebih mirip armada taksi. Berjalan setiap hari, setiap jam, setiap menit. Setiap kali pengguna mengajukan pertanyaan, API merespons sekali, Agent melangkah maju, inferensi harus terjadi. Ini lebih memperhatikan latensi rendah, biaya rendah, throughput tinggi, utilisasi tinggi.

Pelatihan membakar uang besar secara bertahap, inferensi membakar arus kas harian.

Ini juga masalah paling menyakitkan bagi perusahaan AI setelah mencapai tahap komersialisasi. Pelatihan GPT sekali sangat mahal, tetapi inferensi terjadi setiap hari. Era Agent akan terus memperbesar masalah ini, satu tugas mungkin berisi puluhan bahkan ratusan panggilan model. Konteks panjang, inferensi berantai, generasi multimodal, eksekusi kode, semua terus mendorong konsumsi Token naik.

Jalapeño membidik pajak inferensi ini. Ini lebih mirip TPU-nya sendiri OpenAI. Google, Amazon, Meta, Microsoft semua telah melalui jalur serupa, selama beban kerja cukup besar, ASIC buatan sendiri memiliki nilai ekonomis dengan rasio harga-kinerja tinggi.

OpenAI sekarang memiliki kondisi ini. Ada permintaan nyata, ada roadmap produk, ada tim model, ada mitra industri seperti Broadcom, dan juga tekanan biaya yang sangat besar.

Jalapeño tidak perlu dijual ke luar untuk membuktikan nilainya. Selama ini membuat ChatGPT menjawab lebih murah, membuat Codex berjalan lebih cepat, membuat API margin laba lebih tinggi, ini sudah bermakna.

OpenAI juga menyebutkan, Jalapeño akan mengurangi transfer data, menyeimbangkan sumber daya komputasi, memori, dan jaringan, sehingga utilisasi aktual lebih mendekati puncak teoretis. Daya komputasi mahal sering kali mahal karena tidak digunakan sepenuhnya, GPU menunggu jaringan, transfer memori memperlambat komputasi, penjadwalan yang buruk menyebabkan idle, semua pemborosan akhirnya menjadi biaya listrik dan pengeluaran modal.

Harga pembelian hanya lapisan pertama, efisiensi sistem adalah perhitungan akhir.

IV. OpenAI Semakin Mirip Apple

Banyak orang akan memahami Jalapeño sebagai OpenAI menantang NVIDIA, tapi saya rasa OpenAI tidak ingin menjadi NVIDIA berikutnya, lebih mirip sedang belajar dari Apple.

Yang paling hebat dari Apple tidak pernah hanya satu titik tertentu. iPhone kuat, iOS kuat, chip seri A dan M kuat, App Store kuat. Tapi tempat yang benar-benar sulit ditandingi Apple adalah semua hal ini ditempatkan dalam satu lingkaran tertutup yang sama.

Chip dioptimalkan untuk sistem, sistem dioptimalkan untuk aplikasi, pengalaman aplikasi kemudian mendefinisikan chip generasi berikutnya. Lingkaran tertutup ini memungkinkan Apple dalam batasan baterai, volume, dan pendinginan yang sama, dapat membuat pengalaman yang sulit ditiru orang lain.

OpenAI sedang membangun sesuatu yang serupa. Model adalah inti kecerdasan, ChatGPT adalah pintu masuk super, Codex adalah alat pengembang, API adalah lapisan distribusi ekosistem, Jalapeño adalah chip buatan sendiri, pusat data adalah pabrik AI.

CEO OpenAI Altman dua tahun terakhir berulang kali membicarakan chip, energi, fusi nuklir, pusat data, sekarang terlihat mungkin sama sekali bukan mengejar konsep, dia tidak lagi merencanakan OpenAI dengan cara perusahaan rintisan AI.

Jika dikatakan NVIDIA menjual sekop, maka OpenAI ingin memiliki tambang.

NVIDIA ingin menjadi pemasok peralatan pabrik untuk semua perusahaan AI, menjual GPU, jaringan, sistem, ekosistem perangkat lunak, solusi pabrik AI, klien ideal adalah setiap perusahaan yang perlu memproduksi Token.

OpenAI ingin membangun satu set pabrik untuk diri mereka sendiri, yang dijual bukan peralatan, melainkan kecerdasan yang akhirnya dihasilkan.

Dalam jangka pendek, OpenAI tidak bisa lepas dari NVIDIA. Pelatihan dan komputasi umum masih membutuhkan platform GPU, Jalapeño juga tidak mungkin cepat mencakup semua beban kerja. Kemungkinan besar mereka akan masuk terlebih dahulu ke skenario inferensi OpenAI yang paling pasti, terbesar, dan dengan pengembalian optimalisasi tertinggi.

Dalam jangka panjang, retakan sudah muncul. Ketika perusahaan model mulai memiliki roadmap chip mereka sendiri, klien NVIDIA tidak lagi hanya klien. Mereka juga akan menjadi pemain lain di infrastruktur AI.

Kata-kata di Luar Halaman

Dua puluh tahun terakhir, aset terpenting internet adalah lalu lintas (traffic). Siapa yang menguasai pengguna, dialah yang menguasai nilai.

Hari ini, era AI sedang menunjukkan hukum baru.

Model semakin mirip lalu lintas, sedangkan komputasi semakin mirip tanah.

Model akan berulang, produk akan berubah, papan peringkat akan terus diperbarui. Tapi pabrik-pabrik yang memproduksi kecerdasan, chip, jaringan, pusat data, energi, akan semakin terkonsentrasi di tangan sedikit pemain.

GPT mulai merancang GPT, tampaknya hanya satu kali tape-out.

Tapi hal yang benar-benar diumumkannya adalah:

OpenAI sudah tidak puas hanya menjadi perusahaan terpintar, mereka ingin menjadi perusahaan yang mengendalikan produksi kecerdasan.

Artikel ini berasal dari akun WeChat: 版面之外, Penulis: 画画

Artikel ini berasal dari akun WeChat: 版面之外, Penulis: 画画, Gambar judul dari: AI generatif

Criptomoedas em alta

Perguntas relacionadas

QApa arti penting utama chip pertama OpenAI yang bernama Jalapeño menurut artikel ini?

AArti penting utama chip Jalapeño bukanlah menantang Nvidia secara langsung, melainkan sebagai tanda pertama bahwa OpenAI tidak puas hanya menjadi perusahaan model. Ini adalah langkah untuk mengendalikan seluruh proses produksi kecerdasan, dari model, chip, pusat data, hingga energi. Jalapeño adalah peta jalan ambisi OpenAI.

QMengapa OpenAI merasa perlu merancang chipnya sendiri (Jalapeño) untuk inferensi?

AOpenAI perlu merancang chip sendiri untuk mengurangi 'pajak inferensi'—biaya produksi Token harian yang menjadi beban arus kas. Dengan beban kerja inferensi yang besar dari produk seperti ChatGPT dan API, chip khusus (ASIC) seperti Jalapeño dapat meningkatkan efisiensi sistem, menurunkan biaya per Token, dan meningkatkan margin keuntungan, sehingga memperkuat daya saing jangka panjang.

QBagaimana artikel menggambarkan peran AI (GPT) dalam proses desain chip Jalapeño?

AArtikel menyebutkan bahwa OpenAI menggunakan model AI-nya sendiri untuk mempercepat bagian dari proses desain dan optimasi chip. Ini berarti GPT membantu merancang mesin yang akan menjalankan generasi GPT berikutnya, menciptakan siklus umpan balik di mana AI mendesain perangkat keras untuk AI generasi mendatang, berpotensi sangat mempercepat iterasi pengembangan chip.

QMenurut artikel, mengapa perbedaan dalam komputasi (seperti pasokan daya komputasi, biaya) menjadi lebih penting daripada perbedaan model di era AI saat ini?

AKarena jendela keunggulan model semakin pendek; kemampuan model dapat dengan cepat dikejar oleh pesaing atau komunitas open source. Namun, faktor dasar seperti pasokan daya komputasi, biaya inferensi, dan efisiensi sistem menentukan apakah sebuah perusahaan AI dapat bertahan dalam jangka panjang. Biaya produksi Token menjadi pembukuan baru yang kritis.

QDengan meluncurkan Jalapeño, perusahaan seperti apakah yang ingin dibentuk oleh OpenAI menurut analisis artikel ini?

AOpenAI ingin menjadi perusahaan yang mirip dengan Apple—membangun ekosistem tertutup yang terintegrasi penuh. Mereka mengintegrasikan model (otak), produk seperti ChatGPT (pintu masuk), API (lapisan distribusi), chip khusus (Jalapeño), dan pusat data. Tujuannya adalah mengendalikan seluruh rantai produksi kecerdasan dan menjual 'kecerdasan' itu sendiri, bukan sekadar menjual peralatan (seperti Nvidia).

Leituras Relacionadas

In the AI Era, What's Left for Bitcoin?

As Bitcoin falls below $60,000, the author reflects on the relationship between AI and Bitcoin, seeing them as two sides of the same coin. In the AI era, the cost of generating content has plummeted, making fake text, images, and videos increasingly easy and cheap to produce. This has led to a fundamental shift: while AI dramatically lowers the cost of information production, it also undermines trust and authenticity online. What becomes truly valuable is not more content, but the ability to verify what is real—"verifiability." This perspective offers a new lens for Bitcoin. Its massive energy consumption, often criticized as wasteful, is reinterpreted. While AI burns energy to enhance "capability" and efficiency, Bitcoin burns energy to produce "verifiability." Its purpose is not to be trusted but to enable a system where no trust in intermediaries—banks, platforms, or developers—is needed. Every transaction and the entire ledger's history is secured by cryptography and a decentralized network of nodes, making it independently verifiable. AI cannot forge a transaction on the Bitcoin network because the system is designed for proof, not generation. The author draws a historical parallel to the Renaissance: the printing press drastically reduced the cost of copying knowledge, while double-entry bookkeeping reduced the cost of trust in commerce. Today, AI is the new printing press, reducing content creation costs to near zero. Blockchain, and Bitcoin as its pioneer, may be the modern equivalent of double-entry bookkeeping—a foundational technology for verifying digital asset ownership and historical records without centralized authorities. Thus, AI and blockchain are not competitors. AI lowers the cost of creation; blockchain lowers the cost of verification. In an age where AI can generate anything, true scarcity may lie not in more content, but in independently verifiable facts. Whether the market will reprice Bitcoin accordingly remains uncertain, but its core value proposition as a "machine for producing verifiability" becomes strikingly relevant.

marsbitHá 1h

In the AI Era, What's Left for Bitcoin?

marsbitHá 1h

In the Age of AI, What's Left for Bitcoin?

Author: Sevclub, Seven Research Amid Bitcoin's recent drop below $60k, the author reflects on a growing sense that AI and Bitcoin are two sides of the same coin. Today, encountering any content triggers a new default question: "Was this made by AI?" The cost of generating convincing text, images, and video is now negligible. While the internet lowered information *distribution* costs, AI is crashing information *production* costs to near zero. The consequence is a flood of content where truth and falsehood are increasingly indistinguishable. In this environment, what becomes truly valuable is not more information, but the ability to verify what is real—"verifiability." This reframes the common criticism that Bitcoin "wastes electricity." AI consumes power to produce "capability" (e.g., more powerful models). Bitcoin consumes power to produce something else: "verifiability." Bitcoin's core purpose isn't about belief or trust in any institution, developer, or even its creator. It's about enabling independent verification. Every bitcoin's origin, every transaction, and the integrity of the entire ledger are secured by mathematics, cryptography, and a global network of nodes. AI can fabricate convincing media, but it cannot falsify a transaction on the Bitcoin network. The expended energy makes篡改历史 (tampering with history) prohibitively expensive, purchasing a globally verifiable ledger. The author draws a historical parallel to the Renaissance. The printing press drastically reduced the cost of copying knowledge, while double-entry bookkeeping reduced the cost of trust in commerce—one enabled creation, the other verification. Today, AI is the new printing press, driving content production costs toward zero. The question becomes: what is this era's "double-entry bookkeeping"? Blockchain appears to be the leading candidate. It doesn't verify which news is true or which image is real, but it provides a foundational layer for independently verifying asset ownership and historical records in the digital realm without centralized authorities. Therefore, AI and blockchain are not in competition. AI lowers the cost of *generation*. Blockchain (and Bitcoin as a prime example) lowers the cost of *verification*. One creates, the other proves. Whether Bitcoin ultimately succeeds remains uncertain, facing potential challenges from quantum computing, regulation, and technical evolution. However, the author now sees it less as a "machine for making bitcoin" and more as a "machine for making verifiability." In an age where AI can generate anything, true scarcity may no longer be "more content," but "more independently verifiable facts." Whether the market will price this accordingly is a separate question.

链捕手Há 1h

In the Age of AI, What's Left for Bitcoin?

链捕手Há 1h

Trading

Spot

Artigos em Destaque

Como comprar PEOPLE

Bem-vindo à HTX.com!Tornámos a compra de ConstitutionDAO (PEOPLE) simples e conveniente.Segue o nosso guia passo a passo para iniciar a tua jornada no mundo das criptos.Passo 1: cria a tua conta HTXUtiliza o teu e-mail ou número de telefone para te inscreveres numa conta gratuita na HTX.Desfruta de um processo de inscrição sem complicações e desbloqueia todas as funcionalidades.Obter a minha contaPasso 2: vai para Comprar Cripto e escolhe o teu método de pagamentoCartão de crédito/débito: usa o teu visa ou mastercard para comprar ConstitutionDAO (PEOPLE) instantaneamente.Saldo: usa os fundos da tua conta HTX para transacionar sem problemas.Terceiros: adicionamos métodos de pagamento populares, como Google Pay e Apple Pay, para aumentar a conveniência.P2P: transaciona diretamente com outros utilizadores na HTX.Mercado de balcão (OTC): oferecemos serviços personalizados e taxas de câmbio competitivas para os traders.Passo 3: armazena teu ConstitutionDAO (PEOPLE)Depois de comprar o teu ConstitutionDAO (PEOPLE), armazena-o na tua conta HTX.Alternativamente, podes enviá-lo para outro lugar através de transferência blockchain ou usá-lo para transacionar outras criptomoedas.Passo 4: transaciona ConstitutionDAO (PEOPLE)Transaciona facilmente ConstitutionDAO (PEOPLE) no mercado à vista da HTX.Acede simplesmente à tua conta, seleciona o teu par de trading, executa as tuas transações e monitoriza em tempo real.Oferecemos uma experiência de fácil utilização tanto para principiantes como para traders experientes.

499 Visualizações TotaisPublicado em {updateTime}Atualizado em 2026.06.02

Como comprar PEOPLE

Discussões

Bem-vindo à Comunidade HTX. Aqui, pode manter-se informado sobre os mais recentes desenvolvimentos da plataforma e obter acesso a análises profissionais de mercado. As opiniões dos utilizadores sobre o preço de PEOPLE (PEOPLE) são apresentadas abaixo.

活动图片