Dari Infrastruktur Listrik ke Ekonomi Token: "Kue Tujuh Lapis" Rantai Industri AI

marsbitPublié le 2026-05-26Dernière mise à jour le 2026-05-26

Résumé

Dalam dua tahun terakhir, industri AI difokuskan pada "perang model besar" dengan peningkatan parameter, biaya pelatihan, dan kluster GPU. Menjelang 2026, logika penggerak berubah: permintaan inferensi AI yang masif, didorong oleh miliaran AI Agent, akan menjadi konsumen utama komputasi. Industri bergeser dari "era model" ke "era industri Token," di mana produksi, distribusi, penjadwalan, dan konsumsi Token menjadi inti. Artikel ini mengusulkan kerangka "kue tujuh lapis" untuk ekonomi AI berbasis Token: 1. **Listrik**: Dasar energi. 2. **AIDC**: Pabrik Token. 3. **GPU**: Peralatan produksi Token. 4. **LLM**: Mesin produksi Token. 5. **Distribusi Token**: "Jaringan listrik" era AI. 6. **Optimasi & Penjadwalan Cerdas Token**: Otak era AI. 7. **AI Agent**: Terminal konsumen Token. Meski berkembang pesat, rantai ini masih terfragmentasi. Hambatan seperti ketersediaan listrik, penjadwalan yang tidak efisien, biaya inferensi tinggi, dan kurangnya kolaborasi node tepi membatasi potensi penuh. Ekosistem AI hanya akan matang dan memasuki "era adopsi massal" ketika ketujuh lapisan ini terintegrasi dan beroperasi secara sinergis, menciptakan jaringan infrastruktur cerdas global yang berkelanjutan untuk produksi, distribusi, dan konsumsi Token.

Dalam dua tahun terakhir, narasi tahap awal industri AI terutama berpusat pada "perang model besar" yang dimulai oleh berbagai perusahaan besar. Jumlah parameter berkembang dari ratusan miliar menuju triliunan, biaya pelatihan naik dari puluhan juta dolar AS menjadi ratusan juta dolar AS, kluster GPU berkembang dari ribuan kartu menjadi puluhan ribu kartu. Semua orang membahas model siapa yang lebih kuat, siapa yang lebih mendekati AGI, seolah-olah garis akhir persaingan AI ditentukan oleh performa model besar itu sendiri.

Dan sekarang, memasuki tahun 2026, logika penggerak industri AI telah berubah. Laporan terbaru JPMorgan berpendapat, yang benar-benar akan mendorong ekspansi berkelanjutan infrastruktur AI di masa depan, bukan lagi pelatihan model, melainkan permintaan inferensi AI yang masif. Yang akan mengonsumsi daya komputasi paling banyak di masa depan, tidak lagi hanya melatih model besar, melainkan miliaran AI Agent yang tersebar di seluruh dunia. Setiap panggilan, setiap interaksi, setiap eksekusi tugas, pada dasarnya mengonsumsi Token. Industri AI sedang beralih dari "zaman model", masuk ke "zaman industri Token".

Karena yang benar-benar menggerakkan dunia AI di masa depan, bukan hanya model itu sendiri, melainkan sistem produksi, distribusi, penjadwalan, dan konsumsi yang terbentuk di sekitar Token. Terutama setelah AI Agent mulai muncul dalam skala besar, bagaimana Token dihasilkan secara real-time, didistribusikan lintas wilayah, dijadwalkan secara dinamis, dan dikonsumsi secara efisien, akan menjadi masalah inti baru bagi seluruh industri AI.

Seperti yang diungkapkan Huang Renxun (Jensen Huang) baru-baru ini, AI bukanlah industri perangkat lunak yang sederhana, melainkan sistem infrastruktur seperti listrik dan internet. Dalam arsitektur "Kue Lima Lapis"-nya, industri AI dibagi menjadi lima struktur lapisan: energi, chip, infrastruktur, model, dan aplikasi. Seiring industri AI perlahan-lahan beralih dari "zaman pelatihan" ke "zaman inferensi", GoodVision AI lebih cenderung memahami seluruh rantai ekonomi industri AI sebagai "struktur kue tujuh lapis" yang berputar di sekitar Token:

Lapisan Pertama: Listrik – Fondasi Energi Zaman AI
Lapisan Kedua: AIDC – Pabrik Token
Lapisan Ketiga: GPU – Perangkat Produksi Token
Lapisan Keempat: LLM – Mesin Produksi Token
Lapisan Kelima: Distribusi Token – "Jaringan Listrik" Zaman AI
Lapisan Keenam: Optimisasi & Penjadwalan Cerdas Token – Otak Zaman AI
Lapisan Ketujuh: AI Agent – Terminal Konsumen Token

Dari energi, GPU, ke AIDC, node edge, hingga inferensi model dan penjadwalan cerdas, industri AI sedang membentuk sistem "industri Token" yang belum pernah ada sebelumnya.

Tetapi pada tahap ini, sistem ini masih jauh dari matang.

Ada yang memiliki GPU tercanggih, tetapi terbatas oleh energi; ada yang membangun AIDC yang besar, tetapi kekurangan penjadwalan yang efisien; ada yang mengembangkan AI Agent yang kuat, tetapi menghadapi biaya inferensi dan latensi yang tinggi; ada yang menguasai node edge, tetapi tidak dapat membentuk jaringan yang terkoordinasi secara terpadu. Meskipun seluruh rantai industri berkembang pesat, masih terdapat banyak celah, redundansi, dan hambatan efisiensi antar lapisan.

Dan hanya ketika ketujuh lapisan infrastruktur ini benar-benar terhubung, berkolaborasi, dan bersinergi, industri AI akan benar-benar beralih dari "zaman alat" saat ini, menuju "zaman adopsi massal" milik dunia kecerdasan.

Kue Lapis Pertama: Listrik – Energi Zaman AI

Revolusi Industri memperebutkan batubara dan minyak, era internet memperebutkan lalu lintas dan server, sedangkan era AI, perang paling mendasar kembali ke energi.

Karena AI pada akhirnya mengonsumsi listrik. Konsumsi listrik sebuah pusat data AI besar telah mendekati sebuah kota menengah. Pusat data AI (AIDC) baru yang dibangun di seluruh dunia, menghadapi masalah yang sama: GPU bisa dibeli, lahan bisa dibangun, tetapi pasokan listrik tidak bisa mengikuti, penjadwalan jaringan listrik juga tidak bisa mengikuti.

Inilah sebabnya, semakin banyak perusahaan AI mulai memperhatikan kembali infrastruktur energi. Pada GTC 2026, Huang Renxun bahkan mendefinisikan pusat data masa depan sebagai "pabrik Token". Hulu dari pabrik ini akan melahirkan industri energi super.

Di pasar Tiongkok, perusahaan-perusahaan seperti China Yangtze Power, China National Nuclear Corporation, China General Nuclear Power Group, China Three Gorges Renewables, Longyuan Power, dan Huadian New Energy, masing-masing mewakili arah inti energi seperti tenaga air, nuklir, angin, dan fotovoltaik. Di antaranya, nuklir dan tenaga air, dengan kemampuan penyediaan listrik yang stabil, menjadi sumber energi dasar terpenting untuk AIDC; sementara tenaga angin dan fotovoltaik diuntungkan oleh peningkatan permintaan industri AI akan listrik hijau dan kebutuhan ESG. Seiring dengan promosi "Computing from the East to the West" (konsep distribusi komputasi) dan pembangunan pusat data AI berskala besar, hubungan sinergis antara basis energi baru dan pusat komputasi sedang diperkuat dengan cepat.

Di pasar AS, raksasa energi tradisional seperti NextEra Energy, Dominion Energy, Duke Energy, Southern Co., dan Exelon juga diuntungkan oleh ekspansi pusat data AI. Di antaranya, NextEra adalah pemimpin listrik hijau di Amerika Utara; Dominion menguasai sumber daya transmisi inti "koridor pusat data" di Virginia Utara; Exelon, dengan kemampuan penyediaan listrik stabil dari tenaga nuklir, menjadi penerima manfaat penting dari kebutuhan "listrik stabil tinggi sepanjang waktu" di era AI. Secara keseluruhan, industri listrik global sedang berevolusi dari utilitas publik tradisional, menjadi lapisan sumber daya inti di era infrastruktur AI.

Secara keseluruhan, pola persaingan di lapisan ini sedang berubah dari "persaingan harga listrik" perusahaan energi tradisional, menjadi "persaingan hak penguncian listrik" antara pusat data AI, penyedia cloud, dan perusahaan energi di hilir. Siapa yang dapat mengunci energi jangka panjang, stabil, dan berbiaya rendah, dialah yang menguasai naga pertama produksi Token.

Kue Lapis Kedua: AIDC – Pabrik Bahan Baku Token

GPU tunggal tidak berarti, yang benar-benar penting adalah kluster berskala. Maka muncullah AIDC.

Ini seperti pabrik baja, pembangkit listrik, dan pabrik jalur perakitan di era industri, yang mengonsentrasikan ribuan GPU menjadi kemampuan produksi Token yang stabil. Tetapi masalah pabrik juga mulai muncul: siklus pembangunan AIDC tradisional seringkali memakan waktu 18 hingga 36 bulan, bahkan perlu lebih lama untuk perluasan jaringan listrik. Ketika permintaan AI tumbuh secara eksponensial, kecepatan pembangunan IDC era lama tidak dapat memenuhi ekonomi Token yang baru.

Di pasar saham AS, Equinix adalah salah satu operator pusat data terkemuka di dunia, dengan lebih dari 240 pusat data di lebih dari 30 negara. Keunggulan intinya bukan hanya jumlah ruang server, melainkan kemampuan konektivitas global dan sumber daya jaringan latensi rendah, sehingga menjadi simpul infrastruktur penting untuk penempatan daya komputasi AI.

Digital Realty, melalui PlatformDIGITAL, masuk ke infrastruktur AI, dengan pelanggan termasuk penyedia layanan cloud besar dan lembaga keuangan.

Di pasar Tiongkok, RunZe Technology adalah operator AIDC paling tipikal di pasar saham A. Bisnis utamanya telah berevolusi dari IDC tradisional menjadi pusat daya komputasi AI, dengan daya saing inti terletak pada ruang server berskala besar, sumber daya listrik, dan kemampuan operasional AIDC. Perusahaan seperti OFly Data, 21Vianet, masing-masing terus berekspansi ke arah pusat data regional, infrastruktur cloud, dan penyediaan daya komputasi AI. Sugon lebih condong ke kerjasama di bidang pemerintahan, perusahaan, dan penelitian dalam bisnis AIDC.

Sementara itu, pemain lain berasal dari "transformasi tambang". Perusahaan seperti CoreWeave, IREN, Applied Digital, Cipher Mining, sebelumnya banyak terkait dengan penambangan kripto, tetapi dengan lonjakan permintaan GPU AI, mereka dengan cepat beralih ke infrastruktur daya komputasi AI. IREN mengusung model "listrik hijau + daya komputasi AI", membangun pusat data GPU berdensitas tinggi dengan energi terbarukan. Applied Digital dan Cipher Mining juga bertransformasi dari tambang tradisional ke infrastruktur komputasi kinerja tinggi AI.

Selain itu, AI Factory yang terdesentralisasi, lebih kecil, dan modular mulai menjadi tren baru. Seperti era internet yang beralih dari mainframe ke cloud computing, daya komputasi AI perlu menyebar dari node pusat super besar ke node edge regional.

Oleh karena itu, GoodVision AI memilih jalur lain: membangun AI Factory yang lebih ringan, modular, dan dapat direplikasi dengan cepat. Dibandingkan dengan AIDC besar tradisional, GoodVision AI lebih menekankan kemampuan penempatan regional, efisiensi kluster GPU berdensitas tinggi, serta sinergi terpadu energi dan daya komputasi.

Logika intinya bukan membangun satu pusat data super besar tunggal, melainkan dengan cepat menempatkan node AI Factory di wilayah berpenduduk padat di seluruh dunia, biasanya berupa ruang server daya komputasi inferensi kecil 2-4MW. Model ini tidak hanya dapat lebih cepat mengakses sumber daya energi lokal, tetapi juga lebih cocok dengan tren permintaan inferensi AI yang menyebar ke sisi edge di masa depan.

Jika AIDC tradisional lebih menyerupai pabrik baja besar era industri, maka yang dibangun GoodVision AI lebih menyerupai "pabrik Token regional" era AI – lebih ringan, lebih fleksibel, lebih dekat dengan pengguna, dan lebih cocok untuk arah pengembangan jaringan inferensi terdistribusi global di masa depan.

Kue Lapis Ketiga: GPU – Perangkat Produksi Token

Jika listrik adalah energi, maka GPU adalah perangkat produksi. Pada tahun-tahun awal ledakan AI, GPU terutama melayani pelatihan; tetapi di masa depan, permintaan yang lebih besar berasal dari inferensi. Karena pelatihan hanya dimiliki oleh sedikit perusahaan puncak, sedangkan inferensi akan meresap ke setiap aplikasi, setiap perangkat, setiap terminal. Robot memerlukan inferensi, mengemudi otomatis memerlukan inferensi, kacamata AI memerlukan inferensi, bahkan kolaborasi antar setiap AI Agent di masa depan, juga mengonsumsi Token secara real-time.

NVIDIA saat ini masih menjadi inti absolut industri chip AI global. Produk GPU seperti H100, B200, Blackwell, hampir mendefinisikan standar pelatihan dan inferensi AI global saat ini. Yang lebih penting, NVIDIA tidak hanya menjual chip, tetapi juga membangun ekosistem lengkap melalui sistem perangkat lunak dan perangkat keras seperti CUDA, TensorRT, DGX, HGX, sehingga pesaingnya tidak hanya perlu menantang kinerja GPU, tetapi juga seluruh ekosistem perangkat lunak AI.

AMD adalah pesaing GPU utama saat ini, dengan produk inti termasuk MI300X dan GPU AI lainnya. Dibandingkan NVIDIA, AMD lebih menekankan ekosistem terbuka dan platform perangkat lunak ROCm, berharap dapat menarik pengembang AI dan pelanggan perusahaan dengan cara yang lebih terbuka.

Broadcom dan Marvell mewakili jalur lain – ASIC dan interkoneksi berkecepatan tinggi. Seiring skenario inferensi AI semakin kompleks, semakin banyak perusahaan mulai mencoba chip ASIC khusus untuk mendapatkan rasio efisiensi energi yang lebih tinggi dan biaya yang lebih rendah.

Intel, melalui server CPU dan kartu akselerasi AI Gaudi, masuk ke pasar AI, berharap dapat menggunakan kembali ekosistem CPU-nya untuk berpartisipasi dalam persaingan infrastruktur AI.

Di pasar Tiongkok, Cambricon adalah salah satu perusahaan chip AI domestik yang paling representatif, mempromosikan seri chip AI Siyuan (Thinker), dan membangun kerangka kerja AI sendiri Neuware. Hygon memiliki lisensi arsitektur AMD Zen, fokus pada pasar DCU dan inferensi AI.

Perusahaan GPU domestik seperti Moore Threads, Enflame Technology, MetaX, Biren Technology, mewakili arah "pengganti domestik" chip AI Tiongkok. Mereka umumnya menekankan kompatibilitas dengan ekosistem CUDA, dan mencoba membangun kluster GPU domestik.

Dari ekosistem CUDA ke memori HBM, hingga Tensor Core, inti dari seluruh industri AI sebenarnya adalah terus meningkatkan "efisiensi menghasilkan Token per unit waktu". Pada saat yang sama, GPU serta infrastruktur di belakangnya seperti server, modul optik, pendinginan cair, switch, juga erat kaitannya dengan efisiensi produksi Token.

Hal-hal ini tidak seterang NVIDIA, OpenAI, atau perusahaan aplikasi AI, tetapi mereka menentukan apakah dunia AI benar-benar dapat beroperasi. Sama seperti Revolusi Industri yang tidak hanya membutuhkan mesin uap, tetapi juga rel kereta api, jaringan listrik, dan pelabuhan. Revolusi AI juga bukan hanya revolusi perangkat lunak. Ini adalah peningkatan rantai industri global yang mencakup energi, chip, jaringan, cloud computing, dan infrastruktur.

Vertiv adalah pemimpin global UPS dan manajemen daya pusat data, menyediakan sistem catu daya, distribusi daya rak, dan pendingin presisi untuk pusat data.

Envicool adalah pemimpin pendinginan cair dan sistem pengontrol suhu di pasar saham A, dengan pelanggan termasuk perusahaan internet besar seperti BAT. Seiring daya GPU semakin tinggi, pendinginan cair menjadi standar penting untuk AIDC.

Perusahaan seperti Hangzhou Sineva Electric, Kehua Data, KSTAR, memiliki posisi penting di bidang UPS, sistem catu daya, dan pasokan listrik IDC.

Dalam arah jaringan dan modul optik, perusahaan seperti InnoLight, Eoptolink, Tianfu Communications, diuntungkan oleh lonjakan permintaan komunikasi berkecepatan tinggi internal kluster AI.

Sedangkan di arah server rakitan lengkap, perusahaan seperti Dell, HPE, Supermicro, Lenovo, Inspur Information, bertanggung jawab atas perakitan dan pengiriman server AI berskala besar.

Lapisan ini meskipun tidak langsung berhadapan dengan pengguna akhir, menentukan apakah infrastruktur AI benar-benar dapat beroperasi dengan stabil. Pendinginan cair, UPS, modul optik, switch, penyimpanan energi, dan server rakitan lengkap, seperti rel kereta api, jaringan listrik, dan pelabuhan di era industri, menjadi bisnis "penjual sekop" sejati di dunia AI.

Kue Lapis Keempat: LLM – Mesin Produksi Token

LLM (Model Bahasa Besar) menentukan bagaimana Token dipahami, dihasilkan, dan diorganisir. Dua tahun terakhir, perusahaan seperti OpenAI, Anthropic, Google, Meta, xAI, DeepSeek memicu "kompetisi model besar" global. Jumlah parameter berkembang dari ratusan miliar ke triliunan, kemampuan model juga berkembang dari generasi teks, menjadi multimodal, penalaran, kode, kolaborasi Agent, dan memori jangka panjang.

Tetapi seiring industri berkembang, pasar juga mulai menyadari: yang benar-benar penting di masa depan, tidak lagi "siapa yang memiliki model terbesar", melainkan siapa yang dapat terus menjalankan model dengan biaya lebih rendah dan efisiensi lebih tinggi. Karena model itu sendiri tidak langsung menciptakan nilai, yang benar-benar menciptakan nilai adalah proses inferensi setelah model dipanggil berulang kali.

Ini juga berarti, LLM sedang berevolusi dari "menunjukkan kemampuan model" di masa lalu, menjadi "mesin produksi Token" di dunia AI.

Model sumber tertutup dan terbuka seperti OpenAI, Anthropic, Google Gemini, Meta Llama, sedang memperebutkan pintu masuk ekosistem AI masa depan; sementara pemain baru seperti DeepSeek, dengan cara biaya lebih rendah dan efisiensi inferensi lebih tinggi, mulai membentuk kembali pola persaingan industri. Persaingan di lapisan LLM sekarang, juga perlahan tidak lagi hanya mengejar persaingan jumlah parameter, standar penilaian perlahan beralih ke perbandingan beberapa dimensi:

Biaya Token
Efisiensi Inferensi
Kemampuan Konteks
Kolaborasi Multi-Agent
Memori Jangka Panjang
Kemampuan Kolaborasi Model dan Infrastruktur

Karena yang benar-benar penting di era AI, tidak hanya seberapa "cerdas" model besar itu, tetapi apakah model dapat dijalankan secara berkelanjutan, berskala besar, dan berbiaya rendah di seluruh dunia. GoodVision AI di lapisan ini juga memiliki solusi optimasinya sendiri: melalui kerjasama dengan vendor model besar, menempatkan model besar di ruang server AI Factory, mewujudkan transisi dari bisnis penyewaan daya komputasi tradisional ke penyediaan layanan Token langsung; tidak hanya dapat meningkatkan margin keuntungan bisnis, tetapi pengalaman pengguna juga lebih ramah.

Kue Lapis Kelima: Distribusi Token – "Jaringan Listrik" Era AI

Setelah AIDC dibangun, masalah berikutnya muncul: bagaimana daya komputasi ini digunakan oleh seluruh dunia?

Maka, platform penyewaan daya komputasi mulai muncul. Mereka seperti "sistem jaringan listrik" era AI, membagi, mendistribusikan, dan menyewakan sumber daya GPU yang awalnya terpusat sesuai kebutuhan kepada pengembang, perusahaan, dan aplikasi AI.

AWS, Azure, Google Cloud, Alibaba Cloud, Tencent Cloud tetap menjadi pemain terkuat di lapisan ini. Mereka memiliki infrastruktur cloud computing terbesar di dunia, dan sedang secara bertahap memasukkan sumber daya GPU AI ke dalam sistem IaaS mereka sendiri.

Namun pada saat yang sama, sekelompok "cloud asli AI" mulai bangkit dengan cepat. Perusahaan seperti CoreWeave, Nebius, Nscale, secara khusus membangun platform cloud GPU di sekitar kebutuhan pelatihan dan inferensi AI. Dibandingkan dengan vendor cloud tradisional, mereka lebih fleksibel, lebih fokus pada tugas AI, dan lebih ahli dalam mengoptimalkan kluster GPU.

CoreWeave saat ini adalah salah satu perusahaan paling representatif di NeoCloud. Awalnya fokus pada penambangan Ethereum, kemudian sepenuhnya beralih ke layanan cloud GPU AI, dan saat ini telah menjadi perusahaan infrastruktur AI yang didukung secara khusus oleh NVIDIA.

Platform cloud ringan seperti DigitalOcean, Vultr, menargetkan pengembang kecil dan menengah serta perusahaan startup, menekankan penyebaran cepat dan layanan GPU berbiaya rendah.

Di pasar Tiongkok, selain raksasa, perusahaan seperti UCloud, Kingsoft Cloud, 21Vianet, semuanya adalah pemasok utama di pasar cloud GPU dan penyewaan daya komputasi AI. Pola persaingan di lapisan ini sangat mirip dengan jaringan listrik awal: bagaimana mendistribusikan daya komputasi yang tersebar secara efisien.

Kue Lapis Keenam: Optimisasi & Penjadwalan Cerdas Token – Otak Era AI

Ini mungkin lapisan "kue" yang paling diremehkan tetapi paling kritis. Setelah penggunaan AI Agent meledak, semua orang menyadari, tidak semua tugas layak memanggil model besar termahal. Banyak tugas sederhana dapat diselesaikan oleh model lokal; banyak tugas real-time lebih cocok untuk inferensi edge; banyak tugas privasi bahkan tidak dapat diunggah ke cloud. Setelah masalah "apakah ada daya komputasi", muncul masalah lain, yaitu "bagaimana menggunakan daya komputasi dengan lebih cerdas".

Seiring permintaan Token tumbuh secara eksponensial, "membiarkan model yang sesuai, pada daya komputasi yang sesuai, menangani tugas yang sesuai." adalah kunci untuk menggunakan Token secara wajar dan efisien. Inilah salah satu arah yang sedang diperjuangkan GoodVision AI selain menempatkan pabrik Token AI.

Seperti sistem listrik hari ini: beberapa permintaan berasal dari jaringan listrik besar; beberapa permintaan berasal dari tenaga surya atap. Dan yang benar-benar penting, adalah lapisan tengah "sistem penjadwalan cerdas" itu.

AI di masa depan juga akan memiliki struktur yang sama: tugas sederhana diselesaikan oleh model kecil lokal, tugas kompleks memanggil model besar cloud, tugas privasi tinggi diproses di sisi edge, tugas konkurensi tinggi, dijadwalkan secara dinamis melalui hybrid cloud.

Selain GoodVision AI, perusahaan seperti QingCloud, Lambda, OpenRouter, Fireworks AI, juga adalah yang terbaik dalam optimisasi dan penjadwalan cerdas Token.

Dan lapisan "kue" ini dengan dua lapisan "kue" sebelumnya – AIDC dan penyewaan daya komputasi, memiliki pemain yang tumpang tindih tinggi. Ketika sumber daya GPU, node regional, dan skala tugas inferensi terus meluas, hanya "memiliki daya komputasi" sudah tidak cukup untuk membangun hambatan jangka panjang. Semakin banyak operator AIDC dan platform cloud GPU mulai menyadari, yang benar-benar menentukan efisiensi dan margin keuntungan di masa depan, bukan hanya jumlah GPU, melainkan bagaimana menjadwalkan model, daya komputasi, dan aliran Token secara dinamis.

Oleh karena itu, banyak platform yang awalnya menempatkan AIDC dan cloud GPU, juga mulai memperluas ke "lapisan penjadwalan cerdas". Misalnya, perusahaan di pasar Tiongkok seperti UCloud, 21Vianet, Sugon, semua sedang mencoba menggabungkan fasilitas cloud GPU mereka, sumber daya multi-cloud, dan kemampuan penjadwalan inferensi, perlahan-lahan beralih dari "menjual daya komputasi", menjadi "mengoptimalkan daya komputasi".

Kue Lapis Ketujuh: Model & Agent – Konsumen Token

Lapisan ini meskipun paling dekat dengan pengguna dan paling mudah mendapatkan lalu lintas, persaingannya juga paling ketat. Pada GTC 2026, Huang Renxun mengemukakan pandangan ini: di masa depan, setiap perusahaan akan menjadi "produsen Token dan konsumen Token".

Sebuah AI Agent, mungkin secara bersamaan memanggil banyak model, banyak alat, banyak API, dan terus melakukan inferensi, perencanaan, dan eksekusi. Ini berarti, jumlah Token yang dikonsumsi AI di masa depan akan jauh melampaui skala percakapan manusia dengan AI saat ini. Beberapa pengguna berat AI saat ini, yang membangun sendiri sistem multi-Agent konkuren dan saling memanggil, mengonsumsi 1 miliar Token per hari bukanlah hal yang luar biasa.

Di masa depan, bukan 1 miliar orang yang menggunakan AI, melainkan 10 miliar, bahkan 100 miliar AI Agent bekerja bersamaan, saling memanggil. Dan hambatan sebenarnya juga akan bergeser dari "kemampuan model", menjadi "efisiensi penjadwalan Token".

Raksasa teknologi tentu saja tidak perlu dikatakan lagi, Microsoft, Google, Meta, Amazon dll. sedang menanamkan kemampuan AI ke dalam semua produk mereka melalui sistem perkantoran, pencarian, jejaring sosial, dan layanan cloud.

Perusahaan perangkat lunak perusahaan seperti Adobe, Salesforce, ServiceNow, Palantir, dengan cepat memajukan AI Agent tingkat perusahaan dan alur kerja otomatisasi. Pada saat yang sama, Hugging Face sedang menjadi "Github" era AI. Ini bukan hanya komunitas model, tetapi juga infrastruktur penting ekosistem pengembangan AI global.

Di pasar Tiongkok, perusahaan seperti iFLYTEK, Kunlun Tech, 360 Security Technology, Kingsoft Office, SenseTime, sedang membangun tata letak di sekitar asisten AI, perkantoran AI, dan AI Agent.

Ketika "Kue Tujuh Lapis" Benar-benar Terbentuk, Dunia AI Baru Akan Benar-benar Dimulai

Industri AI hari ini, sebenarnya masih berada dalam sistem infrastruktur yang belum sepenuhnya matang.

Ada yang memiliki GPU tercanggih, tetapi terbatas oleh energi; ada yang membangun AIDC yang besar, tetapi kekurangan penjadwalan yang efisien; ada yang mengembangkan model dan Agent yang kuat, tetapi menghadapi biaya inferensi dan latensi yang tinggi; ada yang menguasai node edge, tetapi tidak dapat membentuk jaringan yang terkoordinasi secara terpadu.

Dari listrik, AIDC, GPU, ke LLM, distribusi Token, penjadwalan cerdas, dan AI Agent, seluruh rantai industri AI meskipun sedang berkembang pesat, masih terdapat banyak celah, redundansi, dan hambatan efisiensi antar lapisan.

Dan hanya ketika "kue tujuh lapis" ini benar-benar dibangun lengkap, dan mulai beroperasi secara sinergis dan efisien, industri AI akan benar-benar beralih dari "zaman alat" saat ini, masuk ke "zaman adopsi massal" milik dunia kecerdasan.

Dunia AI di masa depan, tidak lagi hanya beberapa raksasa teknologi melatih model besar, melainkan miliaran AI Agent terus online, terus berkolaborasi, terus memanggil daya komputasi dan Token. Setiap percakapan, setiap inferensi, setiap panggilan alat, setiap eksekusi tugas otomatis, di belakangnya sesuai dengan operasi sinergis energi, GPU, jaringan, sistem penjadwalan, dan node inferensi.

Dan ini juga berarti, industri AI sedang berevolusi dari "logika perangkat lunak" di masa lalu, menjadi sistem industri super yang mencakup energi, chip, cloud computing, jaringan edge, dan penjadwalan cerdas.

Sama seperti Revolusi Industri yang tidak hanya membutuhkan mesin uap, tetapi juga rel kereta api, jaringan listrik, dan pelabuhan; Revolusi Internet tidak hanya membutuhkan PC, tetapi juga serat optik, pusat data, dan cloud computing. Tanda kematangan sejati Revolusi AI, juga bukan hanya satu aplikasi populer, melainkan pembentukan "jaringan infrastruktur cerdas" yang dapat terus memproduksi, mendistribusikan, menjadwalkan, dan mengonsumsi Token secara global.

Dan ketika ketujuh lapisan infrastruktur ini akhirnya benar-benar terhubung, logika persaingan industri AI juga akan direkonstruksi sepenuhnya. Perusahaan terpenting di masa depan, mungkin tidak lagi hanya perusahaan yang memiliki model terbesar, melainkan perusahaan yang dapat menghubungkan energi, daya komputasi, jaringan, model, dan aliran Token.

Questions liées

QApa yang dimaksud dengan 'Token' dalam konteks artikel tentang AI?

ADalam konteks artikel ini, 'Token' mengacu pada unit dasar komputasi atau permintaan yang dikonsumsi oleh model AI selama melakukan proses inferensi. Setiap kali AI Agent dipanggil, berinteraksi, atau menjalankan tugas, itu akan menggunakan Token. Industri AI sedang beralih dari fokus pada pelatihan model besar ke era produksi dan konsumsi Token yang masif.

QMenurut artikel, apa tujuh lapisan 'kue' dalam ekonomi industri AI yang berpusat pada Token?

ATujuh lapisan tersebut adalah: 1. Listrik (dasar energi), 2. AIDC (Pabrik Token), 3. GPU (Peralatan produksi Token), 4. LLM (Mesin produksi Token), 5. Distribusi Token ('Jaringan listrik' era AI), 6. Optimasi dan Penjadwalan Cerdas Token (Otak era AI), 7. AI Agent (Konsumsi Token).

QMengapa listrik dianggap sebagai lapisan paling dasar dalam infrastruktur AI?

AListrik dianggap sebagai lapisan paling dasar karena AI pada akhirnya mengonsumsi listrik dalam jumlah sangat besar. Pusat data AI (AIDC) besar dapat mengonsumsi daya setara dengan kota menengah. Ketersediaan dan stabilitas pasokan listrik menjadi faktor penentu untuk menjalankan pabrik 'Token' atau kluster GPU skala besar, sehingga persaingan untuk mengamankan energi jangka panjang yang stabil dan murah menjadi sangat krusial.

QApa perbedaan utama antara AIDC tradisional dan konsep 'AI Factory' yang diusulkan oleh GoodVision AI?

AAIDC tradisional cenderung seperti pabrik baja besar di era industri—dibangun dalam skala sangat besar dengan siklus konstruksi panjang (18-36 bulan). Sebaliknya, 'AI Factory' ala GoodVision AI lebih ringan, modular, dan dapat direplikasi dengan cepat. AI Factory ini biasanya berupa node komputasi inferensi kecil (2-4MW) yang ditempatkan di dekat daerah berpenduduk padat, memungkinkan penyebaran regional yang lebih cepat, efisiensi energi yang lebih baik, dan lebih cocok untuk kebutuhan inferensi AI di masa depan yang akan terdistribusi ke sisi edge.

QMenurut artikel, mengapa lapisan 'Optimasi dan Penjadwalan Cerdas Token' sangat penting untuk masa depan AI?

ALapisan ini penting karena dengan meledaknya penggunaan AI Agent, tidak semua tugas memerlukan model AI terbesar dan termahal. Tugas sederhana dapat ditangani model lokal, tugas real-time cocok untuk inferensi edge, dan tugas sensitif privasi tidak boleh dikirim ke cloud. Lapisan penjadwalan cerdas berfungsi seperti 'otak' yang menentukan model mana, di perangkat keras mana, untuk menangani tugas apa. Ini memastikan Token digunakan secara efisien dan optimal, mengurangi biaya dan latensi, yang sangat penting untuk skala adopsi AI yang masal di masa depan.

Lectures associées

Zcash subit un effondrement historique alors que des milliards s'évaporent de sa valorisation boursière

Le marché des cryptomonnaies a été secoué par un effondrement dramatique du prix du Zcash, l'actif numérique axé sur la confidentialité perdant plus de la moitié de sa valeur en 24 heures. Cette chute a éliminé des milliards de dollars de sa capitalisation boursière. Le déclin pourrait être lié à la peur entourant une vulnérabilité récemment révélée affectant l'infrastructure de confidentialité du réseau. Un chercheur a identifié un bug permettant potentiellement de créer de faux ZEC, bien que celui-ci ait été corrigé. Le problème fondamental est que la conception privée de Zcash rend impossible la vérification de l'intégrité de l'offre totale, contrairement au Bitcoin. Cette situation souligne le compromis entre confidentialité et transparence. L'équipe de développement souligne que des chercheurs de classe mondiale travaillent constamment à renforcer le réseau, considérant la découverte de cette vulnérabilité comme un signe positif de ce processus de sécurisation actif. Une mise à niveau du réseau est envisagée pour permettre la vérification de l'offre totale et restaurer la confiance.

bitcoinistIl y a 23 mins

Zcash subit un effondrement historique alors que des milliards s'évaporent de sa valorisation boursière

bitcoinistIl y a 23 mins

La narration du BTC en tant qu'« or numérique » a-t-elle échoué ?

**Résumé en français :** L'article aborde la récente chute brutale du Bitcoin (plus de 50% depuis son pic de 2025) pour explorer la solidité de son récit de "l'or numérique". L'auteur développe trois points principaux. **1. La nature de l'actif Bitcoin :** Il est présenté comme une catégorie d'actif nouvelle et potentiellement supérieure à l'or physique en raison de son plafond fixe (21 millions), de sa facilité de transfert et de sa traçabilité sur la blockchain. L'auteur souligne son stade encore précoce (taux de pénétration ~3-4%), similaire à Internet dans les années 2000, ce qui explique une volatilité extrême. **2. Comprendre la correction actuelle :** Cette chute est interprétée comme une vente cyclique prévisible post-halving (2024), amplifiée par un "grand transfert" historique. L'arrivée des ETF a permis aux investisseurs institutionnels d'entrer, incitant les premiers détenteurs (miners, early adopters) à réaliser leurs bénéfices. L'auteur note que l'amplitude des baisses historiques diminue (93% → ~50%), signe d'une maturation et d'une diversification des détenteurs. **3. Perspective à long terme :** Le potentiel est évalué par rapport à la capitalisation boursière de l'or (~20 000 Md$). Même si le Bitcoin n'en captait que 30 à 50%, sa valorisation actuelle (~1 400 Md$) laisse une marge de hausse significative. Le véritable risque n'est pas la disparition du Bitcoin, mais une mauvaise gestion de portefeuille (effet de levier, allocation excessive) ou un manque de conviction qui empêcherait de supporter les fortes volatilités. **Conclusion :** L'auteur compare cette phase à la chute d'Amazon après la bulle internet. La question n'est pas de savoir si le Bitcoin va augmenter, mais si l'investisseur a la structure et la conviction pour survivre aux turbulences. La divergence actuelle entre la performance de l'or et celle du Bitcoin refléterait moins un échec du récit qu'une période nécessaire de transition et de consolidation vers un actif de placement mature.

marsbitIl y a 47 mins

La narration du BTC en tant qu'« or numérique » a-t-elle échoué ?

marsbitIl y a 47 mins

Le récit du Bitcoin en tant qu'« or numérique » a-t-il échoué ?

L'auteur Jason propose un cadre de réflexion sur le bitcoin, en abordant trois points essentiels. Il voit le bitcoin comme un nouvel actif, une forme de « digital gold » supérieur sur le long terme : offre fixe à 21 millions d'unités, transferabilité facile et vérifiabilité totale via la blockchain. Comparant sa pénétration actuelle (3-4%) à celle d'internet ou du e-commerce à leurs débuts, il souligne son potentiel de croissance, tout en rappelant sa très grande volatilité inhérente à ce stade précoce. Concernant la récente forte baisse (de 126 000 $ à environ 61 000 $), il l'interprète comme une vente cyclique attendue après le pic post-réduction de moitié (« halving ») de 2024, et surtout comme un « grand transfert » historique des premiers détenteurs vers les nouveaux investisseurs institutionnels via les ETF. Il note que l'amplitude des corrections historiques diminue (de -93% en 2011 à -50% actuellement), signe d'une maturité croissante de l'actif. Sur le long terme, en comparant la capitalisation du bitcoin (environ 7% de celle de l'or), il estime que son potentiel de hausse reste important si le récit d'« or numérique » se réalise, même partiellement. Il met cependant en garde : le risque principal n'est pas que le bitcoin échoue, mais une mauvaise gestion du portefeuille (position trop importante, effet de levier) ou un manque de compréhension profonde de l'actif, qui pourraient forcer une sortie prématurée lors des fortes corrections. La clé, comme pour Amazon après l'éclatement de la bulle internet, est de « survivre » assez longtemps pour bénéficier de la tendance à long terme.

链捕手Il y a 58 mins

Le récit du Bitcoin en tant qu'« or numérique » a-t-il échoué ?

链捕手Il y a 58 mins

Du code à la cognition : un guide de dix mille mots sur l'évolution du cerveau robotique

Auteur: Matt White, CTO AI mondial de la Linux Foundation. Compilé par: Felix, PANews. Cette longue exploration retrace l'évolution de l'intelligence des robots, des systèmes classiques codés à la main aux approches modernes fondées sur l'IA. **L'ère pré-LLM** était dominée par une pile logicielle modulaire (perception, estimation d'état, planification, contrôle) et des arbres de comportement, prévisible mais peu adaptable. **L'apprentissage automatique** a ensuite révolutionné la perception (réseaux neuronaux) et le contrôle (apprentissage par renforcement, imitation), mais chaque compétence restait étroite et spécifique. **L'avènement des LLM** a introduit un planificateur en langage naturel, capable de décomposer une instruction en séquences d'actions atomiques exécutées par des contrôleurs existants (ex: SayCan de Google). Le saut suivant fut les **modèles Vision-Langage-Action (VLA)**, comme RT-2 de DeepMind ou OpenVLA. Ces réseaux de neurones unifiés fusionnent flux visuel et instruction linguistique pour générer directement des commandes motrices, couplant raisonnement et action. Les architectures les plus performantes, comme le GR00T de NVIDIA ou Helix de Figure AI, adoptent une **stratégie à "deux cerveaux"** : un système 2 lent (VLA, ~7-9 Hz) pour la réflexion et un système 1 rapide (~200 Hz) pour l'exécution réactive, avec parfois un système 0 réflexe pour l'équilibre. Les calculs critiques s'exécutent localement (ex: sur module NVIDIA Jetson) pour la latence et la fiabilité. **L'essor des modèles open-source** (OpenVLA, GR00T N1.7, π0) est crucial, permettant aux startups de raffiner des bases pré-entraînées avec leurs propres données, accélérant le développement et favorisant l'audit de sécurité. Cependant, des défis persistent : récupération après erreur, efficacité des données, généralisation entre corps robotiques, planification à long terme et raisonnement physique/spatial. C'est là qu'interviennent les **modèles du monde (World Models)**, comme NVIDIA Cosmos ou Meta V-JEPA 2. Ces réseaux prédisent les conséquences futures d'une action (simulant une vidéo). Ils permettent au robot d'évaluer mentalement plusieurs scénarios avant d'agir, améliorant la reprise, la généralisation et la planification. Différentes approches architecturales coexistent (diffusion de pixels, JEPA, modèles à actions latentes). L'acquisition de **données** (téléopération) reste un gouffre clé. La simulation (Isaac Sim) permet un entraînement massif. Les coûts matériels chutent rapidement (ex: robots humanoïdes à ~2500$). Les modes de défaillance des robots pilotés par LLM peuvent être étranges, nécessitant des contraintes de sécurité. En conclusion, l'intelligence robotique migre progressivement du code des ingénieurs vers des modèles apprenant le monde lui-même. Nous en sommes à une phase de progression constante (analogue à GPT-2 pour l'IA physique), promettant à terme des robots bien plus généraux et adaptatifs. La question évolue de "que peuvent-ils faire ?" vers "que devrions-nous leur faire faire ?".

marsbitIl y a 1 h

Du code à la cognition : un guide de dix mille mots sur l'évolution du cerveau robotique

marsbitIl y a 1 h

La bulle de l'IA est en train d'éclater

Le titre "La bulle de l'IA est en train d'éclater" reflète les discussions actuelles sur une potentielle surévaluation du secteur. Des figures comme Ray Dalio de Bridgewater évoquent une bulle "relativement élevée", tandis que Jensen Huang de NVIDIA souligne le potentiel de croissance de la demande en capacité de calcul. L'article compare cette situation à la bulle Internet des années 2000. Bien que celle-ci ait provoqué un krach, les infrastructures construites à l'époque (câbles sous-marins, réseaux) ont ensuite permis l'émergence de géants comme Amazon, Netflix ou le cloud. De même, les investissements massifs actuels dans l'infrastructure AI (data centers, refroidissement, énergie), estimés à 5 300 milliards de dollars d'ici 2030, pourraient jeter les bases d'une transformation durable. Un paradoxe clé est observé : le coût de l'intelligence artificielle s'effondre (baisse de >99,7% du coût par token entre 2023 et 2025), mais les dépenses des entreprises en cloud AI ont triplé. Ceci s'explique par la "Paradoxe de Jevons" appliquée à l'IA : une efficacité accrue et un coût réduit déclenchent une explosion de la demande et de nouveaux cas d'usage (agents autonomes, RAG, multimodale), intégrant l'IA dans tous les secteurs. La bulle se dégonfle déjà au niveau des startups sans réelle innovation. Le marché entre dans une phase de maturation où la valeur migre des dépenses d'investissement (CapEx) vers les applications qui optimisent les dépenses opérationnelles (OpEx). La consolidation est inévitable, éliminant les acteurs superficiels. En conclusion, comme pour Internet, une correction du marché est probable, mais elle nettoiera le terrain. Les investissements en infrastructure et la baisse radicale du coût de l'"intelligence" préparent l'avènement d'une ère où l'IA+ sera omniprésente, transformant fondamentalement tous les secteurs industriels. La bulle spéculative passera, mais l'élan de la productivité sous-jacente, lui, est bien réel.

链捕手Il y a 1 h

Trading

Spot

Futures

Articles tendance

Comment acheter LAYER

Bienvenue sur HTX.com ! Nous vous permettons d'acheter Solayer (LAYER) de manière simple et pratique. Suivez notre guide étape par étape pour commencer votre parcours crypto.Étape 1 : Création de votre compte HTXUtilisez votre adresse e-mail ou votre numéro de téléphone pour ouvrir un compte sur HTX gratuitement. L'inscription se fait en toute simplicité et débloque toutes les fonctionnalités.Créer mon compteÉtape 2 : Choix du mode de paiement (rubrique Acheter des cryptosCarte de crédit/débit : utilisez votre carte Visa ou Mastercard pour acheter instantanément Solayer (LAYER).Solde ：utilisez les fonds du solde de votre compte HTX pour trader en toute simplicité.Prestataire tiers ：pour accroître la commodité d'utilisation, nous avons ajouté des modes de paiement populaires tels que Google Pay et Apple Pay.P2P ：tradez directement avec d'autres utilisateurs sur HTX.OTC (de gré à gré) : nous offrons des services personnalisés et des taux de change compétitifs aux traders.Étape 3 : stockage de vos Solayer (LAYER)Après avoir acheté vos Solayer (LAYER), stockez-les sur votre compte HTX. Vous pouvez également les envoyer ailleurs via un transfert sur la blockchain ou les utiliser pour trader d'autres cryptos.Étape 4 : tradez des Solayer (LAYER)Tradez facilement Solayer (LAYER) sur le marché Spot de HTX. Il vous suffit d'accéder à votre compte, de sélectionner la paire de trading, d'exécuter vos trades et de les suivre en temps réel. Nous offrons une expérience conviviale aux débutants comme aux traders chevronnés.

346 vues totalesPublié le 2025.02.11Mis à jour le 2026.06.02

Discussions

Bienvenue dans la Communauté HTX. Ici, vous pouvez vous tenir informé(e) des derniers développements de la plateforme et accéder à des analyses de marché professionnelles. Les opinions des utilisateurs sur le prix de LAYER (LAYER) sont présentées ci-dessous.