Dari Infrastruktur Listrik ke Ekonomi Token: "Kue Tujuh Lapis" Rantai Industri AI

marsbitDipublikasikan tanggal 2026-05-26Terakhir diperbarui pada 2026-05-26

Abstrak

Dalam dua tahun terakhir, industri AI difokuskan pada "perang model besar" dengan peningkatan parameter, biaya pelatihan, dan kluster GPU. Menjelang 2026, logika penggerak berubah: permintaan inferensi AI yang masif, didorong oleh miliaran AI Agent, akan menjadi konsumen utama komputasi. Industri bergeser dari "era model" ke "era industri Token," di mana produksi, distribusi, penjadwalan, dan konsumsi Token menjadi inti. Artikel ini mengusulkan kerangka "kue tujuh lapis" untuk ekonomi AI berbasis Token: 1. **Listrik**: Dasar energi. 2. **AIDC**: Pabrik Token. 3. **GPU**: Peralatan produksi Token. 4. **LLM**: Mesin produksi Token. 5. **Distribusi Token**: "Jaringan listrik" era AI. 6. **Optimasi & Penjadwalan Cerdas Token**: Otak era AI. 7. **AI Agent**: Terminal konsumen Token. Meski berkembang pesat, rantai ini masih terfragmentasi. Hambatan seperti ketersediaan listrik, penjadwalan yang tidak efisien, biaya inferensi tinggi, dan kurangnya kolaborasi node tepi membatasi potensi penuh. Ekosistem AI hanya akan matang dan memasuki "era adopsi massal" ketika ketujuh lapisan ini terintegrasi dan beroperasi secara sinergis, menciptakan jaringan infrastruktur cerdas global yang berkelanjutan untuk produksi, distribusi, dan konsumsi Token.

Dalam dua tahun terakhir, narasi tahap awal industri AI terutama berpusat pada "perang model besar" yang dimulai oleh berbagai perusahaan besar. Jumlah parameter berkembang dari ratusan miliar menuju triliunan, biaya pelatihan naik dari puluhan juta dolar AS menjadi ratusan juta dolar AS, kluster GPU berkembang dari ribuan kartu menjadi puluhan ribu kartu. Semua orang membahas model siapa yang lebih kuat, siapa yang lebih mendekati AGI, seolah-olah garis akhir persaingan AI ditentukan oleh performa model besar itu sendiri.

Dan sekarang, memasuki tahun 2026, logika penggerak industri AI telah berubah. Laporan terbaru JPMorgan berpendapat, yang benar-benar akan mendorong ekspansi berkelanjutan infrastruktur AI di masa depan, bukan lagi pelatihan model, melainkan permintaan inferensi AI yang masif. Yang akan mengonsumsi daya komputasi paling banyak di masa depan, tidak lagi hanya melatih model besar, melainkan miliaran AI Agent yang tersebar di seluruh dunia. Setiap panggilan, setiap interaksi, setiap eksekusi tugas, pada dasarnya mengonsumsi Token. Industri AI sedang beralih dari "zaman model", masuk ke "zaman industri Token".

Karena yang benar-benar menggerakkan dunia AI di masa depan, bukan hanya model itu sendiri, melainkan sistem produksi, distribusi, penjadwalan, dan konsumsi yang terbentuk di sekitar Token. Terutama setelah AI Agent mulai muncul dalam skala besar, bagaimana Token dihasilkan secara real-time, didistribusikan lintas wilayah, dijadwalkan secara dinamis, dan dikonsumsi secara efisien, akan menjadi masalah inti baru bagi seluruh industri AI.

Seperti yang diungkapkan Huang Renxun (Jensen Huang) baru-baru ini, AI bukanlah industri perangkat lunak yang sederhana, melainkan sistem infrastruktur seperti listrik dan internet. Dalam arsitektur "Kue Lima Lapis"-nya, industri AI dibagi menjadi lima struktur lapisan: energi, chip, infrastruktur, model, dan aplikasi. Seiring industri AI perlahan-lahan beralih dari "zaman pelatihan" ke "zaman inferensi", GoodVision AI lebih cenderung memahami seluruh rantai ekonomi industri AI sebagai "struktur kue tujuh lapis" yang berputar di sekitar Token:

Lapisan Pertama: Listrik – Fondasi Energi Zaman AI
Lapisan Kedua: AIDC – Pabrik Token
Lapisan Ketiga: GPU – Perangkat Produksi Token
Lapisan Keempat: LLM – Mesin Produksi Token
Lapisan Kelima: Distribusi Token – "Jaringan Listrik" Zaman AI
Lapisan Keenam: Optimisasi & Penjadwalan Cerdas Token – Otak Zaman AI
Lapisan Ketujuh: AI Agent – Terminal Konsumen Token

Dari energi, GPU, ke AIDC, node edge, hingga inferensi model dan penjadwalan cerdas, industri AI sedang membentuk sistem "industri Token" yang belum pernah ada sebelumnya.

Tetapi pada tahap ini, sistem ini masih jauh dari matang.

Ada yang memiliki GPU tercanggih, tetapi terbatas oleh energi; ada yang membangun AIDC yang besar, tetapi kekurangan penjadwalan yang efisien; ada yang mengembangkan AI Agent yang kuat, tetapi menghadapi biaya inferensi dan latensi yang tinggi; ada yang menguasai node edge, tetapi tidak dapat membentuk jaringan yang terkoordinasi secara terpadu. Meskipun seluruh rantai industri berkembang pesat, masih terdapat banyak celah, redundansi, dan hambatan efisiensi antar lapisan.

Dan hanya ketika ketujuh lapisan infrastruktur ini benar-benar terhubung, berkolaborasi, dan bersinergi, industri AI akan benar-benar beralih dari "zaman alat" saat ini, menuju "zaman adopsi massal" milik dunia kecerdasan.

Kue Lapis Pertama: Listrik – Energi Zaman AI

Revolusi Industri memperebutkan batubara dan minyak, era internet memperebutkan lalu lintas dan server, sedangkan era AI, perang paling mendasar kembali ke energi.

Karena AI pada akhirnya mengonsumsi listrik. Konsumsi listrik sebuah pusat data AI besar telah mendekati sebuah kota menengah. Pusat data AI (AIDC) baru yang dibangun di seluruh dunia, menghadapi masalah yang sama: GPU bisa dibeli, lahan bisa dibangun, tetapi pasokan listrik tidak bisa mengikuti, penjadwalan jaringan listrik juga tidak bisa mengikuti.

Inilah sebabnya, semakin banyak perusahaan AI mulai memperhatikan kembali infrastruktur energi. Pada GTC 2026, Huang Renxun bahkan mendefinisikan pusat data masa depan sebagai "pabrik Token". Hulu dari pabrik ini akan melahirkan industri energi super.

Di pasar Tiongkok, perusahaan-perusahaan seperti China Yangtze Power, China National Nuclear Corporation, China General Nuclear Power Group, China Three Gorges Renewables, Longyuan Power, dan Huadian New Energy, masing-masing mewakili arah inti energi seperti tenaga air, nuklir, angin, dan fotovoltaik. Di antaranya, nuklir dan tenaga air, dengan kemampuan penyediaan listrik yang stabil, menjadi sumber energi dasar terpenting untuk AIDC; sementara tenaga angin dan fotovoltaik diuntungkan oleh peningkatan permintaan industri AI akan listrik hijau dan kebutuhan ESG. Seiring dengan promosi "Computing from the East to the West" (konsep distribusi komputasi) dan pembangunan pusat data AI berskala besar, hubungan sinergis antara basis energi baru dan pusat komputasi sedang diperkuat dengan cepat.

Di pasar AS, raksasa energi tradisional seperti NextEra Energy, Dominion Energy, Duke Energy, Southern Co., dan Exelon juga diuntungkan oleh ekspansi pusat data AI. Di antaranya, NextEra adalah pemimpin listrik hijau di Amerika Utara; Dominion menguasai sumber daya transmisi inti "koridor pusat data" di Virginia Utara; Exelon, dengan kemampuan penyediaan listrik stabil dari tenaga nuklir, menjadi penerima manfaat penting dari kebutuhan "listrik stabil tinggi sepanjang waktu" di era AI. Secara keseluruhan, industri listrik global sedang berevolusi dari utilitas publik tradisional, menjadi lapisan sumber daya inti di era infrastruktur AI.

Secara keseluruhan, pola persaingan di lapisan ini sedang berubah dari "persaingan harga listrik" perusahaan energi tradisional, menjadi "persaingan hak penguncian listrik" antara pusat data AI, penyedia cloud, dan perusahaan energi di hilir. Siapa yang dapat mengunci energi jangka panjang, stabil, dan berbiaya rendah, dialah yang menguasai naga pertama produksi Token.

Kue Lapis Kedua: AIDC – Pabrik Bahan Baku Token

GPU tunggal tidak berarti, yang benar-benar penting adalah kluster berskala. Maka muncullah AIDC.

Ini seperti pabrik baja, pembangkit listrik, dan pabrik jalur perakitan di era industri, yang mengonsentrasikan ribuan GPU menjadi kemampuan produksi Token yang stabil. Tetapi masalah pabrik juga mulai muncul: siklus pembangunan AIDC tradisional seringkali memakan waktu 18 hingga 36 bulan, bahkan perlu lebih lama untuk perluasan jaringan listrik. Ketika permintaan AI tumbuh secara eksponensial, kecepatan pembangunan IDC era lama tidak dapat memenuhi ekonomi Token yang baru.

Di pasar saham AS, Equinix adalah salah satu operator pusat data terkemuka di dunia, dengan lebih dari 240 pusat data di lebih dari 30 negara. Keunggulan intinya bukan hanya jumlah ruang server, melainkan kemampuan konektivitas global dan sumber daya jaringan latensi rendah, sehingga menjadi simpul infrastruktur penting untuk penempatan daya komputasi AI.

Digital Realty, melalui PlatformDIGITAL, masuk ke infrastruktur AI, dengan pelanggan termasuk penyedia layanan cloud besar dan lembaga keuangan.

Di pasar Tiongkok, RunZe Technology adalah operator AIDC paling tipikal di pasar saham A. Bisnis utamanya telah berevolusi dari IDC tradisional menjadi pusat daya komputasi AI, dengan daya saing inti terletak pada ruang server berskala besar, sumber daya listrik, dan kemampuan operasional AIDC. Perusahaan seperti OFly Data, 21Vianet, masing-masing terus berekspansi ke arah pusat data regional, infrastruktur cloud, dan penyediaan daya komputasi AI. Sugon lebih condong ke kerjasama di bidang pemerintahan, perusahaan, dan penelitian dalam bisnis AIDC.

Sementara itu, pemain lain berasal dari "transformasi tambang". Perusahaan seperti CoreWeave, IREN, Applied Digital, Cipher Mining, sebelumnya banyak terkait dengan penambangan kripto, tetapi dengan lonjakan permintaan GPU AI, mereka dengan cepat beralih ke infrastruktur daya komputasi AI. IREN mengusung model "listrik hijau + daya komputasi AI", membangun pusat data GPU berdensitas tinggi dengan energi terbarukan. Applied Digital dan Cipher Mining juga bertransformasi dari tambang tradisional ke infrastruktur komputasi kinerja tinggi AI.

Selain itu, AI Factory yang terdesentralisasi, lebih kecil, dan modular mulai menjadi tren baru. Seperti era internet yang beralih dari mainframe ke cloud computing, daya komputasi AI perlu menyebar dari node pusat super besar ke node edge regional.

Oleh karena itu, GoodVision AI memilih jalur lain: membangun AI Factory yang lebih ringan, modular, dan dapat direplikasi dengan cepat. Dibandingkan dengan AIDC besar tradisional, GoodVision AI lebih menekankan kemampuan penempatan regional, efisiensi kluster GPU berdensitas tinggi, serta sinergi terpadu energi dan daya komputasi.

Logika intinya bukan membangun satu pusat data super besar tunggal, melainkan dengan cepat menempatkan node AI Factory di wilayah berpenduduk padat di seluruh dunia, biasanya berupa ruang server daya komputasi inferensi kecil 2-4MW. Model ini tidak hanya dapat lebih cepat mengakses sumber daya energi lokal, tetapi juga lebih cocok dengan tren permintaan inferensi AI yang menyebar ke sisi edge di masa depan.

Jika AIDC tradisional lebih menyerupai pabrik baja besar era industri, maka yang dibangun GoodVision AI lebih menyerupai "pabrik Token regional" era AI – lebih ringan, lebih fleksibel, lebih dekat dengan pengguna, dan lebih cocok untuk arah pengembangan jaringan inferensi terdistribusi global di masa depan.

Kue Lapis Ketiga: GPU – Perangkat Produksi Token

Jika listrik adalah energi, maka GPU adalah perangkat produksi. Pada tahun-tahun awal ledakan AI, GPU terutama melayani pelatihan; tetapi di masa depan, permintaan yang lebih besar berasal dari inferensi. Karena pelatihan hanya dimiliki oleh sedikit perusahaan puncak, sedangkan inferensi akan meresap ke setiap aplikasi, setiap perangkat, setiap terminal. Robot memerlukan inferensi, mengemudi otomatis memerlukan inferensi, kacamata AI memerlukan inferensi, bahkan kolaborasi antar setiap AI Agent di masa depan, juga mengonsumsi Token secara real-time.

NVIDIA saat ini masih menjadi inti absolut industri chip AI global. Produk GPU seperti H100, B200, Blackwell, hampir mendefinisikan standar pelatihan dan inferensi AI global saat ini. Yang lebih penting, NVIDIA tidak hanya menjual chip, tetapi juga membangun ekosistem lengkap melalui sistem perangkat lunak dan perangkat keras seperti CUDA, TensorRT, DGX, HGX, sehingga pesaingnya tidak hanya perlu menantang kinerja GPU, tetapi juga seluruh ekosistem perangkat lunak AI.

AMD adalah pesaing GPU utama saat ini, dengan produk inti termasuk MI300X dan GPU AI lainnya. Dibandingkan NVIDIA, AMD lebih menekankan ekosistem terbuka dan platform perangkat lunak ROCm, berharap dapat menarik pengembang AI dan pelanggan perusahaan dengan cara yang lebih terbuka.

Broadcom dan Marvell mewakili jalur lain – ASIC dan interkoneksi berkecepatan tinggi. Seiring skenario inferensi AI semakin kompleks, semakin banyak perusahaan mulai mencoba chip ASIC khusus untuk mendapatkan rasio efisiensi energi yang lebih tinggi dan biaya yang lebih rendah.

Intel, melalui server CPU dan kartu akselerasi AI Gaudi, masuk ke pasar AI, berharap dapat menggunakan kembali ekosistem CPU-nya untuk berpartisipasi dalam persaingan infrastruktur AI.

Di pasar Tiongkok, Cambricon adalah salah satu perusahaan chip AI domestik yang paling representatif, mempromosikan seri chip AI Siyuan (Thinker), dan membangun kerangka kerja AI sendiri Neuware. Hygon memiliki lisensi arsitektur AMD Zen, fokus pada pasar DCU dan inferensi AI.

Perusahaan GPU domestik seperti Moore Threads, Enflame Technology, MetaX, Biren Technology, mewakili arah "pengganti domestik" chip AI Tiongkok. Mereka umumnya menekankan kompatibilitas dengan ekosistem CUDA, dan mencoba membangun kluster GPU domestik.

Dari ekosistem CUDA ke memori HBM, hingga Tensor Core, inti dari seluruh industri AI sebenarnya adalah terus meningkatkan "efisiensi menghasilkan Token per unit waktu". Pada saat yang sama, GPU serta infrastruktur di belakangnya seperti server, modul optik, pendinginan cair, switch, juga erat kaitannya dengan efisiensi produksi Token.

Hal-hal ini tidak seterang NVIDIA, OpenAI, atau perusahaan aplikasi AI, tetapi mereka menentukan apakah dunia AI benar-benar dapat beroperasi. Sama seperti Revolusi Industri yang tidak hanya membutuhkan mesin uap, tetapi juga rel kereta api, jaringan listrik, dan pelabuhan. Revolusi AI juga bukan hanya revolusi perangkat lunak. Ini adalah peningkatan rantai industri global yang mencakup energi, chip, jaringan, cloud computing, dan infrastruktur.

Vertiv adalah pemimpin global UPS dan manajemen daya pusat data, menyediakan sistem catu daya, distribusi daya rak, dan pendingin presisi untuk pusat data.

Envicool adalah pemimpin pendinginan cair dan sistem pengontrol suhu di pasar saham A, dengan pelanggan termasuk perusahaan internet besar seperti BAT. Seiring daya GPU semakin tinggi, pendinginan cair menjadi standar penting untuk AIDC.

Perusahaan seperti Hangzhou Sineva Electric, Kehua Data, KSTAR, memiliki posisi penting di bidang UPS, sistem catu daya, dan pasokan listrik IDC.

Dalam arah jaringan dan modul optik, perusahaan seperti InnoLight, Eoptolink, Tianfu Communications, diuntungkan oleh lonjakan permintaan komunikasi berkecepatan tinggi internal kluster AI.

Sedangkan di arah server rakitan lengkap, perusahaan seperti Dell, HPE, Supermicro, Lenovo, Inspur Information, bertanggung jawab atas perakitan dan pengiriman server AI berskala besar.

Lapisan ini meskipun tidak langsung berhadapan dengan pengguna akhir, menentukan apakah infrastruktur AI benar-benar dapat beroperasi dengan stabil. Pendinginan cair, UPS, modul optik, switch, penyimpanan energi, dan server rakitan lengkap, seperti rel kereta api, jaringan listrik, dan pelabuhan di era industri, menjadi bisnis "penjual sekop" sejati di dunia AI.

Kue Lapis Keempat: LLM – Mesin Produksi Token

LLM (Model Bahasa Besar) menentukan bagaimana Token dipahami, dihasilkan, dan diorganisir. Dua tahun terakhir, perusahaan seperti OpenAI, Anthropic, Google, Meta, xAI, DeepSeek memicu "kompetisi model besar" global. Jumlah parameter berkembang dari ratusan miliar ke triliunan, kemampuan model juga berkembang dari generasi teks, menjadi multimodal, penalaran, kode, kolaborasi Agent, dan memori jangka panjang.

Tetapi seiring industri berkembang, pasar juga mulai menyadari: yang benar-benar penting di masa depan, tidak lagi "siapa yang memiliki model terbesar", melainkan siapa yang dapat terus menjalankan model dengan biaya lebih rendah dan efisiensi lebih tinggi. Karena model itu sendiri tidak langsung menciptakan nilai, yang benar-benar menciptakan nilai adalah proses inferensi setelah model dipanggil berulang kali.

Ini juga berarti, LLM sedang berevolusi dari "menunjukkan kemampuan model" di masa lalu, menjadi "mesin produksi Token" di dunia AI.

Model sumber tertutup dan terbuka seperti OpenAI, Anthropic, Google Gemini, Meta Llama, sedang memperebutkan pintu masuk ekosistem AI masa depan; sementara pemain baru seperti DeepSeek, dengan cara biaya lebih rendah dan efisiensi inferensi lebih tinggi, mulai membentuk kembali pola persaingan industri. Persaingan di lapisan LLM sekarang, juga perlahan tidak lagi hanya mengejar persaingan jumlah parameter, standar penilaian perlahan beralih ke perbandingan beberapa dimensi:


Biaya Token
Efisiensi Inferensi
Kemampuan Konteks
Kolaborasi Multi-Agent
Memori Jangka Panjang
Kemampuan Kolaborasi Model dan Infrastruktur

Karena yang benar-benar penting di era AI, tidak hanya seberapa "cerdas" model besar itu, tetapi apakah model dapat dijalankan secara berkelanjutan, berskala besar, dan berbiaya rendah di seluruh dunia. GoodVision AI di lapisan ini juga memiliki solusi optimasinya sendiri: melalui kerjasama dengan vendor model besar, menempatkan model besar di ruang server AI Factory, mewujudkan transisi dari bisnis penyewaan daya komputasi tradisional ke penyediaan layanan Token langsung; tidak hanya dapat meningkatkan margin keuntungan bisnis, tetapi pengalaman pengguna juga lebih ramah.

Kue Lapis Kelima: Distribusi Token – "Jaringan Listrik" Era AI

Setelah AIDC dibangun, masalah berikutnya muncul: bagaimana daya komputasi ini digunakan oleh seluruh dunia?

Maka, platform penyewaan daya komputasi mulai muncul. Mereka seperti "sistem jaringan listrik" era AI, membagi, mendistribusikan, dan menyewakan sumber daya GPU yang awalnya terpusat sesuai kebutuhan kepada pengembang, perusahaan, dan aplikasi AI.

AWS, Azure, Google Cloud, Alibaba Cloud, Tencent Cloud tetap menjadi pemain terkuat di lapisan ini. Mereka memiliki infrastruktur cloud computing terbesar di dunia, dan sedang secara bertahap memasukkan sumber daya GPU AI ke dalam sistem IaaS mereka sendiri.

Namun pada saat yang sama, sekelompok "cloud asli AI" mulai bangkit dengan cepat. Perusahaan seperti CoreWeave, Nebius, Nscale, secara khusus membangun platform cloud GPU di sekitar kebutuhan pelatihan dan inferensi AI. Dibandingkan dengan vendor cloud tradisional, mereka lebih fleksibel, lebih fokus pada tugas AI, dan lebih ahli dalam mengoptimalkan kluster GPU.

CoreWeave saat ini adalah salah satu perusahaan paling representatif di NeoCloud. Awalnya fokus pada penambangan Ethereum, kemudian sepenuhnya beralih ke layanan cloud GPU AI, dan saat ini telah menjadi perusahaan infrastruktur AI yang didukung secara khusus oleh NVIDIA.

Platform cloud ringan seperti DigitalOcean, Vultr, menargetkan pengembang kecil dan menengah serta perusahaan startup, menekankan penyebaran cepat dan layanan GPU berbiaya rendah.

Di pasar Tiongkok, selain raksasa, perusahaan seperti UCloud, Kingsoft Cloud, 21Vianet, semuanya adalah pemasok utama di pasar cloud GPU dan penyewaan daya komputasi AI. Pola persaingan di lapisan ini sangat mirip dengan jaringan listrik awal: bagaimana mendistribusikan daya komputasi yang tersebar secara efisien.

Kue Lapis Keenam: Optimisasi & Penjadwalan Cerdas Token – Otak Era AI

Ini mungkin lapisan "kue" yang paling diremehkan tetapi paling kritis. Setelah penggunaan AI Agent meledak, semua orang menyadari, tidak semua tugas layak memanggil model besar termahal. Banyak tugas sederhana dapat diselesaikan oleh model lokal; banyak tugas real-time lebih cocok untuk inferensi edge; banyak tugas privasi bahkan tidak dapat diunggah ke cloud. Setelah masalah "apakah ada daya komputasi", muncul masalah lain, yaitu "bagaimana menggunakan daya komputasi dengan lebih cerdas".

Seiring permintaan Token tumbuh secara eksponensial, "membiarkan model yang sesuai, pada daya komputasi yang sesuai, menangani tugas yang sesuai." adalah kunci untuk menggunakan Token secara wajar dan efisien. Inilah salah satu arah yang sedang diperjuangkan GoodVision AI selain menempatkan pabrik Token AI.

Seperti sistem listrik hari ini: beberapa permintaan berasal dari jaringan listrik besar; beberapa permintaan berasal dari tenaga surya atap. Dan yang benar-benar penting, adalah lapisan tengah "sistem penjadwalan cerdas" itu.

AI di masa depan juga akan memiliki struktur yang sama: tugas sederhana diselesaikan oleh model kecil lokal, tugas kompleks memanggil model besar cloud, tugas privasi tinggi diproses di sisi edge, tugas konkurensi tinggi, dijadwalkan secara dinamis melalui hybrid cloud.

Selain GoodVision AI, perusahaan seperti QingCloud, Lambda, OpenRouter, Fireworks AI, juga adalah yang terbaik dalam optimisasi dan penjadwalan cerdas Token.

Dan lapisan "kue" ini dengan dua lapisan "kue" sebelumnya – AIDC dan penyewaan daya komputasi, memiliki pemain yang tumpang tindih tinggi. Ketika sumber daya GPU, node regional, dan skala tugas inferensi terus meluas, hanya "memiliki daya komputasi" sudah tidak cukup untuk membangun hambatan jangka panjang. Semakin banyak operator AIDC dan platform cloud GPU mulai menyadari, yang benar-benar menentukan efisiensi dan margin keuntungan di masa depan, bukan hanya jumlah GPU, melainkan bagaimana menjadwalkan model, daya komputasi, dan aliran Token secara dinamis.

Oleh karena itu, banyak platform yang awalnya menempatkan AIDC dan cloud GPU, juga mulai memperluas ke "lapisan penjadwalan cerdas". Misalnya, perusahaan di pasar Tiongkok seperti UCloud, 21Vianet, Sugon, semua sedang mencoba menggabungkan fasilitas cloud GPU mereka, sumber daya multi-cloud, dan kemampuan penjadwalan inferensi, perlahan-lahan beralih dari "menjual daya komputasi", menjadi "mengoptimalkan daya komputasi".

Kue Lapis Ketujuh: Model & Agent – Konsumen Token

Lapisan ini meskipun paling dekat dengan pengguna dan paling mudah mendapatkan lalu lintas, persaingannya juga paling ketat. Pada GTC 2026, Huang Renxun mengemukakan pandangan ini: di masa depan, setiap perusahaan akan menjadi "produsen Token dan konsumen Token".

Sebuah AI Agent, mungkin secara bersamaan memanggil banyak model, banyak alat, banyak API, dan terus melakukan inferensi, perencanaan, dan eksekusi. Ini berarti, jumlah Token yang dikonsumsi AI di masa depan akan jauh melampaui skala percakapan manusia dengan AI saat ini. Beberapa pengguna berat AI saat ini, yang membangun sendiri sistem multi-Agent konkuren dan saling memanggil, mengonsumsi 1 miliar Token per hari bukanlah hal yang luar biasa.

Di masa depan, bukan 1 miliar orang yang menggunakan AI, melainkan 10 miliar, bahkan 100 miliar AI Agent bekerja bersamaan, saling memanggil. Dan hambatan sebenarnya juga akan bergeser dari "kemampuan model", menjadi "efisiensi penjadwalan Token".

Raksasa teknologi tentu saja tidak perlu dikatakan lagi, Microsoft, Google, Meta, Amazon dll. sedang menanamkan kemampuan AI ke dalam semua produk mereka melalui sistem perkantoran, pencarian, jejaring sosial, dan layanan cloud.

Perusahaan perangkat lunak perusahaan seperti Adobe, Salesforce, ServiceNow, Palantir, dengan cepat memajukan AI Agent tingkat perusahaan dan alur kerja otomatisasi. Pada saat yang sama, Hugging Face sedang menjadi "Github" era AI. Ini bukan hanya komunitas model, tetapi juga infrastruktur penting ekosistem pengembangan AI global.

Di pasar Tiongkok, perusahaan seperti iFLYTEK, Kunlun Tech, 360 Security Technology, Kingsoft Office, SenseTime, sedang membangun tata letak di sekitar asisten AI, perkantoran AI, dan AI Agent.

Ketika "Kue Tujuh Lapis" Benar-benar Terbentuk, Dunia AI Baru Akan Benar-benar Dimulai

Industri AI hari ini, sebenarnya masih berada dalam sistem infrastruktur yang belum sepenuhnya matang.

Ada yang memiliki GPU tercanggih, tetapi terbatas oleh energi; ada yang membangun AIDC yang besar, tetapi kekurangan penjadwalan yang efisien; ada yang mengembangkan model dan Agent yang kuat, tetapi menghadapi biaya inferensi dan latensi yang tinggi; ada yang menguasai node edge, tetapi tidak dapat membentuk jaringan yang terkoordinasi secara terpadu.

Dari listrik, AIDC, GPU, ke LLM, distribusi Token, penjadwalan cerdas, dan AI Agent, seluruh rantai industri AI meskipun sedang berkembang pesat, masih terdapat banyak celah, redundansi, dan hambatan efisiensi antar lapisan.

Dan hanya ketika "kue tujuh lapis" ini benar-benar dibangun lengkap, dan mulai beroperasi secara sinergis dan efisien, industri AI akan benar-benar beralih dari "zaman alat" saat ini, masuk ke "zaman adopsi massal" milik dunia kecerdasan.

Dunia AI di masa depan, tidak lagi hanya beberapa raksasa teknologi melatih model besar, melainkan miliaran AI Agent terus online, terus berkolaborasi, terus memanggil daya komputasi dan Token. Setiap percakapan, setiap inferensi, setiap panggilan alat, setiap eksekusi tugas otomatis, di belakangnya sesuai dengan operasi sinergis energi, GPU, jaringan, sistem penjadwalan, dan node inferensi.

Dan ini juga berarti, industri AI sedang berevolusi dari "logika perangkat lunak" di masa lalu, menjadi sistem industri super yang mencakup energi, chip, cloud computing, jaringan edge, dan penjadwalan cerdas.

Sama seperti Revolusi Industri yang tidak hanya membutuhkan mesin uap, tetapi juga rel kereta api, jaringan listrik, dan pelabuhan; Revolusi Internet tidak hanya membutuhkan PC, tetapi juga serat optik, pusat data, dan cloud computing. Tanda kematangan sejati Revolusi AI, juga bukan hanya satu aplikasi populer, melainkan pembentukan "jaringan infrastruktur cerdas" yang dapat terus memproduksi, mendistribusikan, menjadwalkan, dan mengonsumsi Token secara global.

Dan ketika ketujuh lapisan infrastruktur ini akhirnya benar-benar terhubung, logika persaingan industri AI juga akan direkonstruksi sepenuhnya. Perusahaan terpenting di masa depan, mungkin tidak lagi hanya perusahaan yang memiliki model terbesar, melainkan perusahaan yang dapat menghubungkan energi, daya komputasi, jaringan, model, dan aliran Token.































Pertanyaan Terkait

QApa yang dimaksud dengan 'Token' dalam konteks artikel tentang AI?

ADalam konteks artikel ini, 'Token' mengacu pada unit dasar komputasi atau permintaan yang dikonsumsi oleh model AI selama melakukan proses inferensi. Setiap kali AI Agent dipanggil, berinteraksi, atau menjalankan tugas, itu akan menggunakan Token. Industri AI sedang beralih dari fokus pada pelatihan model besar ke era produksi dan konsumsi Token yang masif.

QMenurut artikel, apa tujuh lapisan 'kue' dalam ekonomi industri AI yang berpusat pada Token?

ATujuh lapisan tersebut adalah: 1. Listrik (dasar energi), 2. AIDC (Pabrik Token), 3. GPU (Peralatan produksi Token), 4. LLM (Mesin produksi Token), 5. Distribusi Token ('Jaringan listrik' era AI), 6. Optimasi dan Penjadwalan Cerdas Token (Otak era AI), 7. AI Agent (Konsumsi Token).

QMengapa listrik dianggap sebagai lapisan paling dasar dalam infrastruktur AI?

AListrik dianggap sebagai lapisan paling dasar karena AI pada akhirnya mengonsumsi listrik dalam jumlah sangat besar. Pusat data AI (AIDC) besar dapat mengonsumsi daya setara dengan kota menengah. Ketersediaan dan stabilitas pasokan listrik menjadi faktor penentu untuk menjalankan pabrik 'Token' atau kluster GPU skala besar, sehingga persaingan untuk mengamankan energi jangka panjang yang stabil dan murah menjadi sangat krusial.

QApa perbedaan utama antara AIDC tradisional dan konsep 'AI Factory' yang diusulkan oleh GoodVision AI?

AAIDC tradisional cenderung seperti pabrik baja besar di era industri—dibangun dalam skala sangat besar dengan siklus konstruksi panjang (18-36 bulan). Sebaliknya, 'AI Factory' ala GoodVision AI lebih ringan, modular, dan dapat direplikasi dengan cepat. AI Factory ini biasanya berupa node komputasi inferensi kecil (2-4MW) yang ditempatkan di dekat daerah berpenduduk padat, memungkinkan penyebaran regional yang lebih cepat, efisiensi energi yang lebih baik, dan lebih cocok untuk kebutuhan inferensi AI di masa depan yang akan terdistribusi ke sisi edge.

QMenurut artikel, mengapa lapisan 'Optimasi dan Penjadwalan Cerdas Token' sangat penting untuk masa depan AI?

ALapisan ini penting karena dengan meledaknya penggunaan AI Agent, tidak semua tugas memerlukan model AI terbesar dan termahal. Tugas sederhana dapat ditangani model lokal, tugas real-time cocok untuk inferensi edge, dan tugas sensitif privasi tidak boleh dikirim ke cloud. Lapisan penjadwalan cerdas berfungsi seperti 'otak' yang menentukan model mana, di perangkat keras mana, untuk menangani tugas apa. Ini memastikan Token digunakan secara efisien dan optimal, mengurangi biaya dan latensi, yang sangat penting untuk skala adopsi AI yang masal di masa depan.

Bacaan Terkait

Ali "Menaruh Barang", Byte "Berlatih Ilmu"

Dalam satu minggu terakhir Mei, dua raksasa teknologi China, Alibaba dan ByteDance, memamerkan dua pendekatan berbeda dalam strategi AI mereka. Alibaba, sebagai perusahaan publik, fokus pada integrasi AI untuk monetisasi langsung. Mereka menghubungkan model Qwen dengan platform e-commerce seperti Taobao, menciptakan fitur seperti "pencocokan harga AI" dan "pakaian virtual AI". Melalui protokol ACT, mereka membangun infrastruktur untuk transaksi berbasis agen AI. Pendapatan eksternal Alibaba Cloud tumbuh 40%, menunjukkan model bisnis "MaaS" (Model-as-a-Service) mereka yang berhasil. Namun, pendekatan ini mungkin mengorbankan penelitian mendasar untuk keunggulan jangka pendek. Sebaliknya, ByteDance, yang masih swasta, berinvestasi besar dalam penelitian AI jangka panjang. Departemen Seed mereka, dengan anggaran belanja modal (capex) yang meningkat pesat, bertujuan "menjelajahi batas atas kecerdasan". Mereka merilis model pembuatan video Seedance 2.0 yang memimpin peringkat global dan mempublikasikan penelitian mendalam tentang "model dunia". Perusahaan ini memberikan kebebasan bagi tim risetnya tanpa tekanan kuartalan dari pasar modal. Perbedaan kunci ini lebih disebabkan oleh status kepemilikan daripada filosofi semata. Sebagai perusahaan publik, Alibaba terikat pada harapan ROI jangka pendek investor. ByteDance, yang belum IPO, memiliki kemewahan untuk berfokus pada terobosan teknologi jangka panjang. Analisis menyimpulkan bahwa jalan strategis AI sebuah perusahaan di China sangat ditentukan oleh apakah perusahaan tersebut terdaftar di bursa atau tidak, yang membentuk pilihan antara "menjual AI" dan "membuat AI".

marsbit8m yang lalu

Ali "Menaruh Barang", Byte "Berlatih Ilmu"

marsbit8m yang lalu

Mengapa Lebih Banyak AI Agent Belum Tentu Berarti Produktivitas yang Lebih Tinggi?

**Mengapa Lebih Banyak AI Agent Tidak Sama dengan Produktivitas Lebih Tinggi?** Meskipun teknologi memungkinkan kita meluncurkan banyak AI Agent dengan mudah dan murah, produktivitas nyata tidak serta-merta meningkat. Ini karena munculnya konsep "Pajak Orkestrasi"—biaya tersembunyi untuk mengelola, menilai, dan menggabungkan hasil kerja semua Agent tersebut. Pekerjaan ini harus kembali ke satu sumber daya serial yang tidak dapat diduplikasi: perhatian dan penilaian manusia. **Manusia adalah 'GIL' dalam Sistem.** Seperti Global Interpreter Lock (GIL) dalam Python, semua Agent dapat berjalan paralel, tetapi untuk keputusan penting (seperti tinjauan arsitektur, kode, atau penyelesaian konflik), mereka harus "mengambil kunci" dari Anda—sang pengembang. Hukum Amdahl berlaku: percepatan maksimum dari paralelisasi dibatasi oleh bagian kerja yang harus tetap serial, yaitu kapasitas penilaian manusia. Menambah Agent hanya membuat antrian tinjauan lebih panjang, memperbesar beban konteks, dan menyebabkan kelelahan kognitif. **Kelelahan dan Utang Tersembunyi.** Banyaknya Agent yang aktif memberi ilusi produktivitas tinggi, tetapi rasa sibuk itu tidak sama dengan hasil berkualitas. Jika Anda "menyerah secara kognitif" dan tidak meninjau hasil dengan benar, Anda menumpuk utang teknis dan utang kognitif—masalah yang akan muncul nanti. Pajak orkestrasi harus dibayar, baik secara sadar melalui proses yang terencana, atau diam-diam melalui penurunan kualitas. **Solusi: Kelola Perhatian Seperti Sistem Produksi.** Kuncinya adalah merancang alur kerja dengan menghormati batas perhatian manusia sebagai sumber daya langka: 1. **Kontrol Jumlah Agent:** Sesuaikan jumlah Agent dengan kemampuan *review* Anda, bukan dengan apa yang UI izinkan. Batasi ke angka rendah. 2. **Klasifikasi Tugas:** Pisahkan tugas independen (cocok untuk Agent paralel) dari tugas kompleks yang membutuhkan penilaian mendalam (kerjakan secara serial). 3. **Tinjau Secara Berkelompok (*Batch Review*):** Kurangi biaya alih konteks dengan meninjau hasil beberapa Agent sekaligus. 4. **Gunakan Waktu Serial untuk Penilaian:** Fokuskan perhatian hanya pada bagian yang memerlukan penilaian manusia. Biarkan Agent menangani bagian yang dapat diverifikasi otomatis (seperti tes). 5. **Lindungi Waktu Fokus Anda:** Kadang, tindakan paling produktif adalah berhenti mengoordinasi banyak Agent dan fokus pada satu masalah inti. Kemampuan sebenarnya di era AI bukanlah menjalankan banyak Agent, tetapi merancang sistem yang secara sadar mengelilingi dan melindungi kapasitas penilaian serial manusia—sumber daya paling berharga dalam proses pengembangan.

marsbit1j yang lalu

Mengapa Lebih Banyak AI Agent Belum Tentu Berarti Produktivitas yang Lebih Tinggi?

marsbit1j yang lalu

Tiga Tahun Kemudian: Meninjau Kembali Penilaian Saya terhadap ChatGPT di Tahun 2023

Tiga tahun kemudian, pada Mei 2026, penulis meninjau kembali 20 prediksi tentang ChatGPT yang dibuatnya pada Maret 2023, menggunakan AI untuk mengevaluasi akurasinya berdasarkan data terbaru. Secara keseluruhan, arah dan mekanisme prediksi banyak yang tepat. Yang paling akurat adalah tentang RAG sebagai arsitektur standar, LUI (Antarmuka Pengguna Bahasa Alami) sebagai lapisan interaksi baru, munculnya "jaringan robot" (protokol untuk agen AI), dan kemampuan China mengejar ketertinggalan model AI besar. Prediksi bahwa ChatGPT bukan AGI namun langkah besar, tidak menyebabkan gelombang pengangguran massal, serta sifat uji Turing yang hanya mengukur persepsi juga pada dasarnya benar. Namun, prediksi dengan angka spesifik atau pernyataan mutlak sering meleset. Klaim bahwa GPT-4 memiliki 100 triliun parameter sepenuhnya salah. Pernyataan bahwa LLM "tidak mungkin" mengerjakan matematika murni terbantahkan dengan model penalaran yang memenangkan medali emas IMO. Estimasi biaya pelatihan model hanya $5-10 miliar juga jauh dari kenyataan, yang kini mencapai miliaran dolar untuk model terdepan. Beberapa prediksi keliru tentang distribusi dampak, seperti bahwa nilai akan berpindah ke lapisan aplikasi (nyatanya, penyedia chip seperti NVIDIA paling untung), atau bahwa AI akan "menghindari" masalah hak cipta (justru menimbulkan gugatan besar). Kesimpulan utama adalah: dalam memprediksi teknologi yang cepat berubah, mengidentifikasi arah dan mekanisme umumnya lebih bisa diandalkan daripada memberikan angka pasti atau pernyataan mutlak. Prediksi cenderung terlalu optimis tentang kecepatan perubahan jangka pendek, tetapi meremehkan besarnya perubahan jangka panjang. Penting juga untuk mempertimbangkan distribusi dampak, bukan hanya kesimpulan agregat. Pernyataan yang disertai batasan dan keraguan justru lebih tahan uji waktu. Beberapa pertanyaan mendasar masih belum terjawab setelah tiga tahun. Tinjauan ini berfungsi sebagai pelajaran untuk membuat prediksi yang lebih baik di tiga tahun mendatang.

marsbit8j yang lalu

Tiga Tahun Kemudian: Meninjau Kembali Penilaian Saya terhadap ChatGPT di Tahun 2023

marsbit8j yang lalu

Tiga Tahun Kemudian: Menilik Kembali Penilaian Saya terhadap ChatGPT pada 2023

Tiga tahun kemudian: Meninjau Kembali 20 Prediksi ChatGPT Saya pada 2023 Pada Maret 2023, penulis Wang Jianshuo membuat 20 prediksi intuitif tentang ChatGPT dan AI masa depan. Kini, di Mei 2026, sebuah sistem AI yang terdiri dari 41 agen menganalisis prediksi-prediksi tersebut berdasarkan data terkini. Hasilnya menunjukkan pola menarik. **Yang Terbukti Benar (Secara Umum):** * **RAG dan Arsitektur Pencarian (✅):** Solusi utama untuk pengetahuan dan halusinasi adalah dengan menambahkan "contekan" (RAG), bukan mengubah model. Arsitektur pencarian + LLM kini menjadi standar. * **LUI sebagai Benua Baru (🟢):** Antarmuka Pengguna Bahasa Alami (LUI) adalah lapisan interaksi baru yang besar, melahirkan industri agen dan protokol seperti MCP. * **Jaringan Robot dan Sistem Pengalamatan Baru (🟢):** Agen akan berkomunikasi otomatis dengan bahasa alami. Protokol seperti MCP dan ANP sedang mewujudkannya. * **Model Besar Tiongkok (🟢):** Model-model seperti DeepSeek dan Qwen telah mengejar ketertinggalan performa, meski dengan investasi lebih kecil. * **Tidak Ada Kesadaran, Tes Turing Hanya Ukur Penampilan (🟢):** AI tidak memiliki kesadaran. Tes Turing hanya mengukur ilusi kesadaran. * **Prediksi Lain yang Benar:** ChatGPT bukan AGI, tapi lompatan besar; gelombang pengangguran besar tidak terjadi; tahun besar untuk startup; momen "browser 1994" telah tiba. **Yang Kurang Tepat atau Salah:** * **Parameter GPT-4 (❌):** Prediksi 100 triliun parameter salah. Estimasi terbaru sekitar 1,8 triliun. * **Matematika di LLM (🟡):** Diagnosis bahwa matematika adalah kelemahan intrinsik dan memerlukan alat bantu benar. Namun, pernyataan "tidak mungkin" ditingkatkan terbukti salah, karena model kini bisa memenangkan medali emas Olimpiade Matematika Internasional (IMO). * **Penangkapan Nilai (🟡):** Aplikasi memang berkembang pesat, tetapi nilai terbesar justru ditangkap oleh lapisan komputasi (seperti Nvidia), bukan oleh pembuat model. * **Hak Cipta (🟡):** Konten AI sulit didaftarkan hak cipta, tetapi tidak serta-mata "menghindari" pelanggaran. Gugatan dan penyelesaian besar (misalnya, Anthropic $1,5 miliar) membuktikan risikonya. * **Biaya Model (🟡):** Prediksi "perang lokal" dengan biaya $5-10 miliar untuk model canggih terbukti salah. Biaya pelatihan model terdepan (seperti GPT-5) jauh lebih tinggi, sementara biaya kloning model terbuka justru bisa lebih murah. **Pola dan Pelajaran:** 1. **Arah dan mekanisme lebih dapat diandalkan daripada angka pasti dan pernyataan mutlak.** 2. **Cenderung terlalu optimis untuk jangka pendek (kecepatan), tetapi terlalu konservatif untuk jangka panjang (skala/dampak).** 3. **Kesalahan sering terjadi pada distribusi, bukan pada total.** Contoh: Tidak ada gelombang pengangguran masif, tetapi dampak berat dirasakan oleh lulusan baru. 4. **Pernyataan yang disertai batasan dan ruang ketidakpastian justru lebih tahan uji waktu.** 5. **Beberapa pertanyaan mendasar masih belum terjawab setelah tiga tahun.** Kesimpulannya, prediksi tentang arah besar dan mekanisme cenderung akurat, sementara prediksi spesifik tentang angka, kecepatan, dan distribusi dampak lebih sering meleset. Latihan ini lebih merupakan pelajaran dalam kerendahan hati dan penilaian yang bernuansa daripada sekadar penghitungan skor.

链捕手10j yang lalu

Tiga Tahun Kemudian: Menilik Kembali Penilaian Saya terhadap ChatGPT pada 2023

链捕手10j yang lalu

Trading

Spot
Futures

Artikel Populer

Cara Membeli LAYER

Selamat datang di HTX.com! Kami telah membuat pembelian Solayer (LAYER) menjadi mudah dan nyaman. Ikuti panduan langkah demi langkah kami untuk memulai perjalanan kripto Anda.Langkah 1: Buat Akun HTX AndaGunakan alamat email atau nomor ponsel Anda untuk mendaftar akun gratis di HTX. Rasakan perjalanan pendaftaran yang mudah dan buka semua fitur.Dapatkan Akun SayaLangkah 2: Buka Beli Kripto, lalu Pilih Metode Pembayaran AndaKartu Kredit/Debit: Gunakan Visa atau Mastercard Anda untuk membeli Solayer (LAYER) secara instan.Saldo: Gunakan dana dari saldo akun HTX Anda untuk melakukan trading dengan lancar.Pihak Ketiga: Kami telah menambahkan metode pembayaran populer seperti Google Pay dan Apple Pay untuk meningkatkan kenyamanan.P2P: Lakukan trading langsung dengan pengguna lain di HTX.Over-the-Counter (OTC): Kami menawarkan layanan yang dibuat khusus dan kurs yang kompetitif bagi para trader.Langkah 3: Simpan Solayer (LAYER) AndaSetelah melakukan pembelian, simpan Solayer (LAYER) di akun HTX Anda. Selain itu, Anda dapat mengirimkannya ke tempat lain melalui transfer blockchain atau menggunakannya untuk memperdagangkan mata uang kripto lainnya.Langkah 4: Lakukan trading Solayer (LAYER)Lakukan trading Solayer (LAYER) dengan mudah di pasar spot HTX. Cukup akses akun Anda, pilih pasangan perdagangan, jalankan trading, lalu pantau secara real-time. Kami menawarkan pengalaman yang ramah pengguna baik untuk pemula maupun trader berpengalaman.

771 Total TayanganDipublikasikan pada 2025.02.11Diperbarui pada 2025.03.21

Cara Membeli LAYER

Diskusi

Selamat datang di Komunitas HTX. Di sini, Anda bisa terus mendapatkan informasi terbaru tentang perkembangan platform terkini dan mendapatkan akses ke wawasan pasar profesional. Pendapat pengguna mengenai harga LAYER (LAYER) disajikan di bawah ini.

活动图片