Dari Infrastruktur Listrik ke Ekonomi Token: "Kue Tujuh Lapis" Rantai Industri AI

marsbit发布于2026-05-26更新于2026-05-26

文章摘要

Dalam dua tahun terakhir, industri AI difokuskan pada "perang model besar" dengan peningkatan parameter, biaya pelatihan, dan kluster GPU. Menjelang 2026, logika penggerak berubah: permintaan inferensi AI yang masif, didorong oleh miliaran AI Agent, akan menjadi konsumen utama komputasi. Industri bergeser dari "era model" ke "era industri Token," di mana produksi, distribusi, penjadwalan, dan konsumsi Token menjadi inti. Artikel ini mengusulkan kerangka "kue tujuh lapis" untuk ekonomi AI berbasis Token: 1. **Listrik**: Dasar energi. 2. **AIDC**: Pabrik Token. 3. **GPU**: Peralatan produksi Token. 4. **LLM**: Mesin produksi Token. 5. **Distribusi Token**: "Jaringan listrik" era AI. 6. **Optimasi & Penjadwalan Cerdas Token**: Otak era AI. 7. **AI Agent**: Terminal konsumen Token. Meski berkembang pesat, rantai ini masih terfragmentasi. Hambatan seperti ketersediaan listrik, penjadwalan yang tidak efisien, biaya inferensi tinggi, dan kurangnya kolaborasi node tepi membatasi potensi penuh. Ekosistem AI hanya akan matang dan memasuki "era adopsi massal" ketika ketujuh lapisan ini terintegrasi dan beroperasi secara sinergis, menciptakan jaringan infrastruktur cerdas global yang berkelanjutan untuk produksi, distribusi, dan konsumsi Token.

Dalam dua tahun terakhir, narasi tahap awal industri AI terutama berpusat pada "perang model besar" yang dimulai oleh berbagai perusahaan besar. Jumlah parameter berkembang dari ratusan miliar menuju triliunan, biaya pelatihan naik dari puluhan juta dolar AS menjadi ratusan juta dolar AS, kluster GPU berkembang dari ribuan kartu menjadi puluhan ribu kartu. Semua orang membahas model siapa yang lebih kuat, siapa yang lebih mendekati AGI, seolah-olah garis akhir persaingan AI ditentukan oleh performa model besar itu sendiri.

Dan sekarang, memasuki tahun 2026, logika penggerak industri AI telah berubah. Laporan terbaru JPMorgan berpendapat, yang benar-benar akan mendorong ekspansi berkelanjutan infrastruktur AI di masa depan, bukan lagi pelatihan model, melainkan permintaan inferensi AI yang masif. Yang akan mengonsumsi daya komputasi paling banyak di masa depan, tidak lagi hanya melatih model besar, melainkan miliaran AI Agent yang tersebar di seluruh dunia. Setiap panggilan, setiap interaksi, setiap eksekusi tugas, pada dasarnya mengonsumsi Token. Industri AI sedang beralih dari "zaman model", masuk ke "zaman industri Token".

Karena yang benar-benar menggerakkan dunia AI di masa depan, bukan hanya model itu sendiri, melainkan sistem produksi, distribusi, penjadwalan, dan konsumsi yang terbentuk di sekitar Token. Terutama setelah AI Agent mulai muncul dalam skala besar, bagaimana Token dihasilkan secara real-time, didistribusikan lintas wilayah, dijadwalkan secara dinamis, dan dikonsumsi secara efisien, akan menjadi masalah inti baru bagi seluruh industri AI.

Seperti yang diungkapkan Huang Renxun (Jensen Huang) baru-baru ini, AI bukanlah industri perangkat lunak yang sederhana, melainkan sistem infrastruktur seperti listrik dan internet. Dalam arsitektur "Kue Lima Lapis"-nya, industri AI dibagi menjadi lima struktur lapisan: energi, chip, infrastruktur, model, dan aplikasi. Seiring industri AI perlahan-lahan beralih dari "zaman pelatihan" ke "zaman inferensi", GoodVision AI lebih cenderung memahami seluruh rantai ekonomi industri AI sebagai "struktur kue tujuh lapis" yang berputar di sekitar Token:

Lapisan Pertama: Listrik – Fondasi Energi Zaman AI
Lapisan Kedua: AIDC – Pabrik Token
Lapisan Ketiga: GPU – Perangkat Produksi Token
Lapisan Keempat: LLM – Mesin Produksi Token
Lapisan Kelima: Distribusi Token – "Jaringan Listrik" Zaman AI
Lapisan Keenam: Optimisasi & Penjadwalan Cerdas Token – Otak Zaman AI
Lapisan Ketujuh: AI Agent – Terminal Konsumen Token

Dari energi, GPU, ke AIDC, node edge, hingga inferensi model dan penjadwalan cerdas, industri AI sedang membentuk sistem "industri Token" yang belum pernah ada sebelumnya.

Tetapi pada tahap ini, sistem ini masih jauh dari matang.

Ada yang memiliki GPU tercanggih, tetapi terbatas oleh energi; ada yang membangun AIDC yang besar, tetapi kekurangan penjadwalan yang efisien; ada yang mengembangkan AI Agent yang kuat, tetapi menghadapi biaya inferensi dan latensi yang tinggi; ada yang menguasai node edge, tetapi tidak dapat membentuk jaringan yang terkoordinasi secara terpadu. Meskipun seluruh rantai industri berkembang pesat, masih terdapat banyak celah, redundansi, dan hambatan efisiensi antar lapisan.

Dan hanya ketika ketujuh lapisan infrastruktur ini benar-benar terhubung, berkolaborasi, dan bersinergi, industri AI akan benar-benar beralih dari "zaman alat" saat ini, menuju "zaman adopsi massal" milik dunia kecerdasan.

Kue Lapis Pertama: Listrik – Energi Zaman AI

Revolusi Industri memperebutkan batubara dan minyak, era internet memperebutkan lalu lintas dan server, sedangkan era AI, perang paling mendasar kembali ke energi.

Karena AI pada akhirnya mengonsumsi listrik. Konsumsi listrik sebuah pusat data AI besar telah mendekati sebuah kota menengah. Pusat data AI (AIDC) baru yang dibangun di seluruh dunia, menghadapi masalah yang sama: GPU bisa dibeli, lahan bisa dibangun, tetapi pasokan listrik tidak bisa mengikuti, penjadwalan jaringan listrik juga tidak bisa mengikuti.

Inilah sebabnya, semakin banyak perusahaan AI mulai memperhatikan kembali infrastruktur energi. Pada GTC 2026, Huang Renxun bahkan mendefinisikan pusat data masa depan sebagai "pabrik Token". Hulu dari pabrik ini akan melahirkan industri energi super.

Di pasar Tiongkok, perusahaan-perusahaan seperti China Yangtze Power, China National Nuclear Corporation, China General Nuclear Power Group, China Three Gorges Renewables, Longyuan Power, dan Huadian New Energy, masing-masing mewakili arah inti energi seperti tenaga air, nuklir, angin, dan fotovoltaik. Di antaranya, nuklir dan tenaga air, dengan kemampuan penyediaan listrik yang stabil, menjadi sumber energi dasar terpenting untuk AIDC; sementara tenaga angin dan fotovoltaik diuntungkan oleh peningkatan permintaan industri AI akan listrik hijau dan kebutuhan ESG. Seiring dengan promosi "Computing from the East to the West" (konsep distribusi komputasi) dan pembangunan pusat data AI berskala besar, hubungan sinergis antara basis energi baru dan pusat komputasi sedang diperkuat dengan cepat.

Di pasar AS, raksasa energi tradisional seperti NextEra Energy, Dominion Energy, Duke Energy, Southern Co., dan Exelon juga diuntungkan oleh ekspansi pusat data AI. Di antaranya, NextEra adalah pemimpin listrik hijau di Amerika Utara; Dominion menguasai sumber daya transmisi inti "koridor pusat data" di Virginia Utara; Exelon, dengan kemampuan penyediaan listrik stabil dari tenaga nuklir, menjadi penerima manfaat penting dari kebutuhan "listrik stabil tinggi sepanjang waktu" di era AI. Secara keseluruhan, industri listrik global sedang berevolusi dari utilitas publik tradisional, menjadi lapisan sumber daya inti di era infrastruktur AI.

Secara keseluruhan, pola persaingan di lapisan ini sedang berubah dari "persaingan harga listrik" perusahaan energi tradisional, menjadi "persaingan hak penguncian listrik" antara pusat data AI, penyedia cloud, dan perusahaan energi di hilir. Siapa yang dapat mengunci energi jangka panjang, stabil, dan berbiaya rendah, dialah yang menguasai naga pertama produksi Token.

Kue Lapis Kedua: AIDC – Pabrik Bahan Baku Token

GPU tunggal tidak berarti, yang benar-benar penting adalah kluster berskala. Maka muncullah AIDC.

Ini seperti pabrik baja, pembangkit listrik, dan pabrik jalur perakitan di era industri, yang mengonsentrasikan ribuan GPU menjadi kemampuan produksi Token yang stabil. Tetapi masalah pabrik juga mulai muncul: siklus pembangunan AIDC tradisional seringkali memakan waktu 18 hingga 36 bulan, bahkan perlu lebih lama untuk perluasan jaringan listrik. Ketika permintaan AI tumbuh secara eksponensial, kecepatan pembangunan IDC era lama tidak dapat memenuhi ekonomi Token yang baru.

Di pasar saham AS, Equinix adalah salah satu operator pusat data terkemuka di dunia, dengan lebih dari 240 pusat data di lebih dari 30 negara. Keunggulan intinya bukan hanya jumlah ruang server, melainkan kemampuan konektivitas global dan sumber daya jaringan latensi rendah, sehingga menjadi simpul infrastruktur penting untuk penempatan daya komputasi AI.

Digital Realty, melalui PlatformDIGITAL, masuk ke infrastruktur AI, dengan pelanggan termasuk penyedia layanan cloud besar dan lembaga keuangan.

Di pasar Tiongkok, RunZe Technology adalah operator AIDC paling tipikal di pasar saham A. Bisnis utamanya telah berevolusi dari IDC tradisional menjadi pusat daya komputasi AI, dengan daya saing inti terletak pada ruang server berskala besar, sumber daya listrik, dan kemampuan operasional AIDC. Perusahaan seperti OFly Data, 21Vianet, masing-masing terus berekspansi ke arah pusat data regional, infrastruktur cloud, dan penyediaan daya komputasi AI. Sugon lebih condong ke kerjasama di bidang pemerintahan, perusahaan, dan penelitian dalam bisnis AIDC.

Sementara itu, pemain lain berasal dari "transformasi tambang". Perusahaan seperti CoreWeave, IREN, Applied Digital, Cipher Mining, sebelumnya banyak terkait dengan penambangan kripto, tetapi dengan lonjakan permintaan GPU AI, mereka dengan cepat beralih ke infrastruktur daya komputasi AI. IREN mengusung model "listrik hijau + daya komputasi AI", membangun pusat data GPU berdensitas tinggi dengan energi terbarukan. Applied Digital dan Cipher Mining juga bertransformasi dari tambang tradisional ke infrastruktur komputasi kinerja tinggi AI.

Selain itu, AI Factory yang terdesentralisasi, lebih kecil, dan modular mulai menjadi tren baru. Seperti era internet yang beralih dari mainframe ke cloud computing, daya komputasi AI perlu menyebar dari node pusat super besar ke node edge regional.

Oleh karena itu, GoodVision AI memilih jalur lain: membangun AI Factory yang lebih ringan, modular, dan dapat direplikasi dengan cepat. Dibandingkan dengan AIDC besar tradisional, GoodVision AI lebih menekankan kemampuan penempatan regional, efisiensi kluster GPU berdensitas tinggi, serta sinergi terpadu energi dan daya komputasi.

Logika intinya bukan membangun satu pusat data super besar tunggal, melainkan dengan cepat menempatkan node AI Factory di wilayah berpenduduk padat di seluruh dunia, biasanya berupa ruang server daya komputasi inferensi kecil 2-4MW. Model ini tidak hanya dapat lebih cepat mengakses sumber daya energi lokal, tetapi juga lebih cocok dengan tren permintaan inferensi AI yang menyebar ke sisi edge di masa depan.

Jika AIDC tradisional lebih menyerupai pabrik baja besar era industri, maka yang dibangun GoodVision AI lebih menyerupai "pabrik Token regional" era AI – lebih ringan, lebih fleksibel, lebih dekat dengan pengguna, dan lebih cocok untuk arah pengembangan jaringan inferensi terdistribusi global di masa depan.

Kue Lapis Ketiga: GPU – Perangkat Produksi Token

Jika listrik adalah energi, maka GPU adalah perangkat produksi. Pada tahun-tahun awal ledakan AI, GPU terutama melayani pelatihan; tetapi di masa depan, permintaan yang lebih besar berasal dari inferensi. Karena pelatihan hanya dimiliki oleh sedikit perusahaan puncak, sedangkan inferensi akan meresap ke setiap aplikasi, setiap perangkat, setiap terminal. Robot memerlukan inferensi, mengemudi otomatis memerlukan inferensi, kacamata AI memerlukan inferensi, bahkan kolaborasi antar setiap AI Agent di masa depan, juga mengonsumsi Token secara real-time.

NVIDIA saat ini masih menjadi inti absolut industri chip AI global. Produk GPU seperti H100, B200, Blackwell, hampir mendefinisikan standar pelatihan dan inferensi AI global saat ini. Yang lebih penting, NVIDIA tidak hanya menjual chip, tetapi juga membangun ekosistem lengkap melalui sistem perangkat lunak dan perangkat keras seperti CUDA, TensorRT, DGX, HGX, sehingga pesaingnya tidak hanya perlu menantang kinerja GPU, tetapi juga seluruh ekosistem perangkat lunak AI.

AMD adalah pesaing GPU utama saat ini, dengan produk inti termasuk MI300X dan GPU AI lainnya. Dibandingkan NVIDIA, AMD lebih menekankan ekosistem terbuka dan platform perangkat lunak ROCm, berharap dapat menarik pengembang AI dan pelanggan perusahaan dengan cara yang lebih terbuka.

Broadcom dan Marvell mewakili jalur lain – ASIC dan interkoneksi berkecepatan tinggi. Seiring skenario inferensi AI semakin kompleks, semakin banyak perusahaan mulai mencoba chip ASIC khusus untuk mendapatkan rasio efisiensi energi yang lebih tinggi dan biaya yang lebih rendah.

Intel, melalui server CPU dan kartu akselerasi AI Gaudi, masuk ke pasar AI, berharap dapat menggunakan kembali ekosistem CPU-nya untuk berpartisipasi dalam persaingan infrastruktur AI.

Di pasar Tiongkok, Cambricon adalah salah satu perusahaan chip AI domestik yang paling representatif, mempromosikan seri chip AI Siyuan (Thinker), dan membangun kerangka kerja AI sendiri Neuware. Hygon memiliki lisensi arsitektur AMD Zen, fokus pada pasar DCU dan inferensi AI.

Perusahaan GPU domestik seperti Moore Threads, Enflame Technology, MetaX, Biren Technology, mewakili arah "pengganti domestik" chip AI Tiongkok. Mereka umumnya menekankan kompatibilitas dengan ekosistem CUDA, dan mencoba membangun kluster GPU domestik.

Dari ekosistem CUDA ke memori HBM, hingga Tensor Core, inti dari seluruh industri AI sebenarnya adalah terus meningkatkan "efisiensi menghasilkan Token per unit waktu". Pada saat yang sama, GPU serta infrastruktur di belakangnya seperti server, modul optik, pendinginan cair, switch, juga erat kaitannya dengan efisiensi produksi Token.

Hal-hal ini tidak seterang NVIDIA, OpenAI, atau perusahaan aplikasi AI, tetapi mereka menentukan apakah dunia AI benar-benar dapat beroperasi. Sama seperti Revolusi Industri yang tidak hanya membutuhkan mesin uap, tetapi juga rel kereta api, jaringan listrik, dan pelabuhan. Revolusi AI juga bukan hanya revolusi perangkat lunak. Ini adalah peningkatan rantai industri global yang mencakup energi, chip, jaringan, cloud computing, dan infrastruktur.

Vertiv adalah pemimpin global UPS dan manajemen daya pusat data, menyediakan sistem catu daya, distribusi daya rak, dan pendingin presisi untuk pusat data.

Envicool adalah pemimpin pendinginan cair dan sistem pengontrol suhu di pasar saham A, dengan pelanggan termasuk perusahaan internet besar seperti BAT. Seiring daya GPU semakin tinggi, pendinginan cair menjadi standar penting untuk AIDC.

Perusahaan seperti Hangzhou Sineva Electric, Kehua Data, KSTAR, memiliki posisi penting di bidang UPS, sistem catu daya, dan pasokan listrik IDC.

Dalam arah jaringan dan modul optik, perusahaan seperti InnoLight, Eoptolink, Tianfu Communications, diuntungkan oleh lonjakan permintaan komunikasi berkecepatan tinggi internal kluster AI.

Sedangkan di arah server rakitan lengkap, perusahaan seperti Dell, HPE, Supermicro, Lenovo, Inspur Information, bertanggung jawab atas perakitan dan pengiriman server AI berskala besar.

Lapisan ini meskipun tidak langsung berhadapan dengan pengguna akhir, menentukan apakah infrastruktur AI benar-benar dapat beroperasi dengan stabil. Pendinginan cair, UPS, modul optik, switch, penyimpanan energi, dan server rakitan lengkap, seperti rel kereta api, jaringan listrik, dan pelabuhan di era industri, menjadi bisnis "penjual sekop" sejati di dunia AI.

Kue Lapis Keempat: LLM – Mesin Produksi Token

LLM (Model Bahasa Besar) menentukan bagaimana Token dipahami, dihasilkan, dan diorganisir. Dua tahun terakhir, perusahaan seperti OpenAI, Anthropic, Google, Meta, xAI, DeepSeek memicu "kompetisi model besar" global. Jumlah parameter berkembang dari ratusan miliar ke triliunan, kemampuan model juga berkembang dari generasi teks, menjadi multimodal, penalaran, kode, kolaborasi Agent, dan memori jangka panjang.

Tetapi seiring industri berkembang, pasar juga mulai menyadari: yang benar-benar penting di masa depan, tidak lagi "siapa yang memiliki model terbesar", melainkan siapa yang dapat terus menjalankan model dengan biaya lebih rendah dan efisiensi lebih tinggi. Karena model itu sendiri tidak langsung menciptakan nilai, yang benar-benar menciptakan nilai adalah proses inferensi setelah model dipanggil berulang kali.

Ini juga berarti, LLM sedang berevolusi dari "menunjukkan kemampuan model" di masa lalu, menjadi "mesin produksi Token" di dunia AI.

Model sumber tertutup dan terbuka seperti OpenAI, Anthropic, Google Gemini, Meta Llama, sedang memperebutkan pintu masuk ekosistem AI masa depan; sementara pemain baru seperti DeepSeek, dengan cara biaya lebih rendah dan efisiensi inferensi lebih tinggi, mulai membentuk kembali pola persaingan industri. Persaingan di lapisan LLM sekarang, juga perlahan tidak lagi hanya mengejar persaingan jumlah parameter, standar penilaian perlahan beralih ke perbandingan beberapa dimensi:


Biaya Token
Efisiensi Inferensi
Kemampuan Konteks
Kolaborasi Multi-Agent
Memori Jangka Panjang
Kemampuan Kolaborasi Model dan Infrastruktur

Karena yang benar-benar penting di era AI, tidak hanya seberapa "cerdas" model besar itu, tetapi apakah model dapat dijalankan secara berkelanjutan, berskala besar, dan berbiaya rendah di seluruh dunia. GoodVision AI di lapisan ini juga memiliki solusi optimasinya sendiri: melalui kerjasama dengan vendor model besar, menempatkan model besar di ruang server AI Factory, mewujudkan transisi dari bisnis penyewaan daya komputasi tradisional ke penyediaan layanan Token langsung; tidak hanya dapat meningkatkan margin keuntungan bisnis, tetapi pengalaman pengguna juga lebih ramah.

Kue Lapis Kelima: Distribusi Token – "Jaringan Listrik" Era AI

Setelah AIDC dibangun, masalah berikutnya muncul: bagaimana daya komputasi ini digunakan oleh seluruh dunia?

Maka, platform penyewaan daya komputasi mulai muncul. Mereka seperti "sistem jaringan listrik" era AI, membagi, mendistribusikan, dan menyewakan sumber daya GPU yang awalnya terpusat sesuai kebutuhan kepada pengembang, perusahaan, dan aplikasi AI.

AWS, Azure, Google Cloud, Alibaba Cloud, Tencent Cloud tetap menjadi pemain terkuat di lapisan ini. Mereka memiliki infrastruktur cloud computing terbesar di dunia, dan sedang secara bertahap memasukkan sumber daya GPU AI ke dalam sistem IaaS mereka sendiri.

Namun pada saat yang sama, sekelompok "cloud asli AI" mulai bangkit dengan cepat. Perusahaan seperti CoreWeave, Nebius, Nscale, secara khusus membangun platform cloud GPU di sekitar kebutuhan pelatihan dan inferensi AI. Dibandingkan dengan vendor cloud tradisional, mereka lebih fleksibel, lebih fokus pada tugas AI, dan lebih ahli dalam mengoptimalkan kluster GPU.

CoreWeave saat ini adalah salah satu perusahaan paling representatif di NeoCloud. Awalnya fokus pada penambangan Ethereum, kemudian sepenuhnya beralih ke layanan cloud GPU AI, dan saat ini telah menjadi perusahaan infrastruktur AI yang didukung secara khusus oleh NVIDIA.

Platform cloud ringan seperti DigitalOcean, Vultr, menargetkan pengembang kecil dan menengah serta perusahaan startup, menekankan penyebaran cepat dan layanan GPU berbiaya rendah.

Di pasar Tiongkok, selain raksasa, perusahaan seperti UCloud, Kingsoft Cloud, 21Vianet, semuanya adalah pemasok utama di pasar cloud GPU dan penyewaan daya komputasi AI. Pola persaingan di lapisan ini sangat mirip dengan jaringan listrik awal: bagaimana mendistribusikan daya komputasi yang tersebar secara efisien.

Kue Lapis Keenam: Optimisasi & Penjadwalan Cerdas Token – Otak Era AI

Ini mungkin lapisan "kue" yang paling diremehkan tetapi paling kritis. Setelah penggunaan AI Agent meledak, semua orang menyadari, tidak semua tugas layak memanggil model besar termahal. Banyak tugas sederhana dapat diselesaikan oleh model lokal; banyak tugas real-time lebih cocok untuk inferensi edge; banyak tugas privasi bahkan tidak dapat diunggah ke cloud. Setelah masalah "apakah ada daya komputasi", muncul masalah lain, yaitu "bagaimana menggunakan daya komputasi dengan lebih cerdas".

Seiring permintaan Token tumbuh secara eksponensial, "membiarkan model yang sesuai, pada daya komputasi yang sesuai, menangani tugas yang sesuai." adalah kunci untuk menggunakan Token secara wajar dan efisien. Inilah salah satu arah yang sedang diperjuangkan GoodVision AI selain menempatkan pabrik Token AI.

Seperti sistem listrik hari ini: beberapa permintaan berasal dari jaringan listrik besar; beberapa permintaan berasal dari tenaga surya atap. Dan yang benar-benar penting, adalah lapisan tengah "sistem penjadwalan cerdas" itu.

AI di masa depan juga akan memiliki struktur yang sama: tugas sederhana diselesaikan oleh model kecil lokal, tugas kompleks memanggil model besar cloud, tugas privasi tinggi diproses di sisi edge, tugas konkurensi tinggi, dijadwalkan secara dinamis melalui hybrid cloud.

Selain GoodVision AI, perusahaan seperti QingCloud, Lambda, OpenRouter, Fireworks AI, juga adalah yang terbaik dalam optimisasi dan penjadwalan cerdas Token.

Dan lapisan "kue" ini dengan dua lapisan "kue" sebelumnya – AIDC dan penyewaan daya komputasi, memiliki pemain yang tumpang tindih tinggi. Ketika sumber daya GPU, node regional, dan skala tugas inferensi terus meluas, hanya "memiliki daya komputasi" sudah tidak cukup untuk membangun hambatan jangka panjang. Semakin banyak operator AIDC dan platform cloud GPU mulai menyadari, yang benar-benar menentukan efisiensi dan margin keuntungan di masa depan, bukan hanya jumlah GPU, melainkan bagaimana menjadwalkan model, daya komputasi, dan aliran Token secara dinamis.

Oleh karena itu, banyak platform yang awalnya menempatkan AIDC dan cloud GPU, juga mulai memperluas ke "lapisan penjadwalan cerdas". Misalnya, perusahaan di pasar Tiongkok seperti UCloud, 21Vianet, Sugon, semua sedang mencoba menggabungkan fasilitas cloud GPU mereka, sumber daya multi-cloud, dan kemampuan penjadwalan inferensi, perlahan-lahan beralih dari "menjual daya komputasi", menjadi "mengoptimalkan daya komputasi".

Kue Lapis Ketujuh: Model & Agent – Konsumen Token

Lapisan ini meskipun paling dekat dengan pengguna dan paling mudah mendapatkan lalu lintas, persaingannya juga paling ketat. Pada GTC 2026, Huang Renxun mengemukakan pandangan ini: di masa depan, setiap perusahaan akan menjadi "produsen Token dan konsumen Token".

Sebuah AI Agent, mungkin secara bersamaan memanggil banyak model, banyak alat, banyak API, dan terus melakukan inferensi, perencanaan, dan eksekusi. Ini berarti, jumlah Token yang dikonsumsi AI di masa depan akan jauh melampaui skala percakapan manusia dengan AI saat ini. Beberapa pengguna berat AI saat ini, yang membangun sendiri sistem multi-Agent konkuren dan saling memanggil, mengonsumsi 1 miliar Token per hari bukanlah hal yang luar biasa.

Di masa depan, bukan 1 miliar orang yang menggunakan AI, melainkan 10 miliar, bahkan 100 miliar AI Agent bekerja bersamaan, saling memanggil. Dan hambatan sebenarnya juga akan bergeser dari "kemampuan model", menjadi "efisiensi penjadwalan Token".

Raksasa teknologi tentu saja tidak perlu dikatakan lagi, Microsoft, Google, Meta, Amazon dll. sedang menanamkan kemampuan AI ke dalam semua produk mereka melalui sistem perkantoran, pencarian, jejaring sosial, dan layanan cloud.

Perusahaan perangkat lunak perusahaan seperti Adobe, Salesforce, ServiceNow, Palantir, dengan cepat memajukan AI Agent tingkat perusahaan dan alur kerja otomatisasi. Pada saat yang sama, Hugging Face sedang menjadi "Github" era AI. Ini bukan hanya komunitas model, tetapi juga infrastruktur penting ekosistem pengembangan AI global.

Di pasar Tiongkok, perusahaan seperti iFLYTEK, Kunlun Tech, 360 Security Technology, Kingsoft Office, SenseTime, sedang membangun tata letak di sekitar asisten AI, perkantoran AI, dan AI Agent.

Ketika "Kue Tujuh Lapis" Benar-benar Terbentuk, Dunia AI Baru Akan Benar-benar Dimulai

Industri AI hari ini, sebenarnya masih berada dalam sistem infrastruktur yang belum sepenuhnya matang.

Ada yang memiliki GPU tercanggih, tetapi terbatas oleh energi; ada yang membangun AIDC yang besar, tetapi kekurangan penjadwalan yang efisien; ada yang mengembangkan model dan Agent yang kuat, tetapi menghadapi biaya inferensi dan latensi yang tinggi; ada yang menguasai node edge, tetapi tidak dapat membentuk jaringan yang terkoordinasi secara terpadu.

Dari listrik, AIDC, GPU, ke LLM, distribusi Token, penjadwalan cerdas, dan AI Agent, seluruh rantai industri AI meskipun sedang berkembang pesat, masih terdapat banyak celah, redundansi, dan hambatan efisiensi antar lapisan.

Dan hanya ketika "kue tujuh lapis" ini benar-benar dibangun lengkap, dan mulai beroperasi secara sinergis dan efisien, industri AI akan benar-benar beralih dari "zaman alat" saat ini, masuk ke "zaman adopsi massal" milik dunia kecerdasan.

Dunia AI di masa depan, tidak lagi hanya beberapa raksasa teknologi melatih model besar, melainkan miliaran AI Agent terus online, terus berkolaborasi, terus memanggil daya komputasi dan Token. Setiap percakapan, setiap inferensi, setiap panggilan alat, setiap eksekusi tugas otomatis, di belakangnya sesuai dengan operasi sinergis energi, GPU, jaringan, sistem penjadwalan, dan node inferensi.

Dan ini juga berarti, industri AI sedang berevolusi dari "logika perangkat lunak" di masa lalu, menjadi sistem industri super yang mencakup energi, chip, cloud computing, jaringan edge, dan penjadwalan cerdas.

Sama seperti Revolusi Industri yang tidak hanya membutuhkan mesin uap, tetapi juga rel kereta api, jaringan listrik, dan pelabuhan; Revolusi Internet tidak hanya membutuhkan PC, tetapi juga serat optik, pusat data, dan cloud computing. Tanda kematangan sejati Revolusi AI, juga bukan hanya satu aplikasi populer, melainkan pembentukan "jaringan infrastruktur cerdas" yang dapat terus memproduksi, mendistribusikan, menjadwalkan, dan mengonsumsi Token secara global.

Dan ketika ketujuh lapisan infrastruktur ini akhirnya benar-benar terhubung, logika persaingan industri AI juga akan direkonstruksi sepenuhnya. Perusahaan terpenting di masa depan, mungkin tidak lagi hanya perusahaan yang memiliki model terbesar, melainkan perusahaan yang dapat menghubungkan energi, daya komputasi, jaringan, model, dan aliran Token.































相关问答

QApa yang dimaksud dengan 'Token' dalam konteks artikel tentang AI?

ADalam konteks artikel ini, 'Token' mengacu pada unit dasar komputasi atau permintaan yang dikonsumsi oleh model AI selama melakukan proses inferensi. Setiap kali AI Agent dipanggil, berinteraksi, atau menjalankan tugas, itu akan menggunakan Token. Industri AI sedang beralih dari fokus pada pelatihan model besar ke era produksi dan konsumsi Token yang masif.

QMenurut artikel, apa tujuh lapisan 'kue' dalam ekonomi industri AI yang berpusat pada Token?

ATujuh lapisan tersebut adalah: 1. Listrik (dasar energi), 2. AIDC (Pabrik Token), 3. GPU (Peralatan produksi Token), 4. LLM (Mesin produksi Token), 5. Distribusi Token ('Jaringan listrik' era AI), 6. Optimasi dan Penjadwalan Cerdas Token (Otak era AI), 7. AI Agent (Konsumsi Token).

QMengapa listrik dianggap sebagai lapisan paling dasar dalam infrastruktur AI?

AListrik dianggap sebagai lapisan paling dasar karena AI pada akhirnya mengonsumsi listrik dalam jumlah sangat besar. Pusat data AI (AIDC) besar dapat mengonsumsi daya setara dengan kota menengah. Ketersediaan dan stabilitas pasokan listrik menjadi faktor penentu untuk menjalankan pabrik 'Token' atau kluster GPU skala besar, sehingga persaingan untuk mengamankan energi jangka panjang yang stabil dan murah menjadi sangat krusial.

QApa perbedaan utama antara AIDC tradisional dan konsep 'AI Factory' yang diusulkan oleh GoodVision AI?

AAIDC tradisional cenderung seperti pabrik baja besar di era industri—dibangun dalam skala sangat besar dengan siklus konstruksi panjang (18-36 bulan). Sebaliknya, 'AI Factory' ala GoodVision AI lebih ringan, modular, dan dapat direplikasi dengan cepat. AI Factory ini biasanya berupa node komputasi inferensi kecil (2-4MW) yang ditempatkan di dekat daerah berpenduduk padat, memungkinkan penyebaran regional yang lebih cepat, efisiensi energi yang lebih baik, dan lebih cocok untuk kebutuhan inferensi AI di masa depan yang akan terdistribusi ke sisi edge.

QMenurut artikel, mengapa lapisan 'Optimasi dan Penjadwalan Cerdas Token' sangat penting untuk masa depan AI?

ALapisan ini penting karena dengan meledaknya penggunaan AI Agent, tidak semua tugas memerlukan model AI terbesar dan termahal. Tugas sederhana dapat ditangani model lokal, tugas real-time cocok untuk inferensi edge, dan tugas sensitif privasi tidak boleh dikirim ke cloud. Lapisan penjadwalan cerdas berfungsi seperti 'otak' yang menentukan model mana, di perangkat keras mana, untuk menangani tugas apa. Ini memastikan Token digunakan secara efisien dan optimal, mengurangi biaya dan latensi, yang sangat penting untuk skala adopsi AI yang masal di masa depan.

你可能也喜欢

BTC“数字黄金”的叙事是不是失败了?

这篇文章从三个核心问题探讨了比特币的现状与未来,强调提供的是思考框架而非投资建议。 **如何看待比特币资产?** 作者认为比特币是一种全新的、更优秀的“黄金”资产。其优势在于总量恒定、转移便捷、交易可审计。尽管早期与灰色地带关联,但合规化是趋势。目前全球数字货币渗透率仅3%-4%,类比互联网和电商的早期阶段,意味着比特币仍处于发展初期,潜力巨大但波动性也极高。 **如何理解本轮下跌?** 比特币自2025年10月高点(近12.6万美元)持续下跌,2026年2月一度跌破6.1万美元,单日跌幅达15%,随后又快速反弹。这被解读为遵循四年减半周期的共识性获利了结。特别之处在于,美国比特币ETF的批准引入了机构资金,也促使早期低成本持有者(如矿工和信仰者)进行大规模“换手”,这是资产迈向主流化的必经过程。历史数据显示,比特币历次大跌的幅度在收窄(从93%到当前的约50%),表明资产正在成熟,波动率逐步下降,但高波动仍是其获取超额回报的固有特征。 **长期如何看待发展?** 长期价值可对标黄金。当前比特币市值仅为黄金市值的约7%,若“数字黄金”叙事实现一半,上行空间依然显著。但作者提醒,短期市场脆弱,换手可能未完,底部无法预测。真正的风险并非资产归零(概率较低),而在于错误的仓位管理(如All-in或加杠杆)以及对资产缺乏深刻理解。投资者必须计算并承受潜在的最大回撤(例如从已跌50%的位置再跌50%),才能存活至长期价值兑现。 文章最后以亚马逊在互联网泡沫后暴涨为例,指出关键不在于比特币未来是否上涨,而在于投资者能否通过理性的仓位管理和深度认知,扛过剧烈波动存活到那一天。文末提问引导读者反思:当前黄金涨、比特币跌的局面,究竟意味着“数字黄金”叙事失败,还是资产进化过程中的换手阵痛?这取决于每个人对比特币最底层的信仰。

marsbit52分钟前

BTC“数字黄金”的叙事是不是失败了?

marsbit52分钟前

BTC“数字黄金”的叙事是不是失败了?

标题:BTC“数字黄金”的叙事是不是失败了? 作者:@wuk_Bitcoin 本文从三个核心问题出发,探讨比特币的现状与未来。 **如何看待比特币?** 作者认为比特币是一种全新的、更优秀的“黄金”类资产。其优势在于:总量恒定(2100万枚);资产可转移性极强,在全球不确定性时代具备溢价;所有交易链上可审计,透明度高。反驳了比特币主要用于灰色地带的过时观点,指出其正走向合规。目前全球数字货币渗透率仅约3%-4%,类比互联网和电商早期,意味着该资产类别仍处早期,潜力与巨大波动并存。 **如何理解本轮下跌?** 比特币自2025年10月高点(近12.6万美元)持续下跌,2026年2月初曾单日暴跌15%,跌破6.1万美元。这被视为遵循其四年减半周期的规律性回调,是长期持有者在周期高点锁定利润的结果。本轮下跌的特殊性在于:美国比特币ETF的批准引入了大量机构新资金,但也促使成本极低的早期持有者(矿工、OG)进行历史性抛售,即从“早期信仰者”向“长期配置机构”的换手过程。历史数据显示,比特币历次大回撤的跌幅在逐步收窄(从93%到目前的约50%),表明资产在成熟,波动率在下降,但高波动仍是获取超额回报的代价。 **长期怎么看?** 若将比特币视为“数字黄金”,其当前总市值(约1.4万亿美元)仅为黄金总市值(约20万亿美元)的7%。即使该叙事仅部分实现,上行空间依然可观。但作者强调短期风险:换手可能未结束,市场脆弱,不排除进一步下跌。真正的风险不在于资产归零(概率极低),而在于错误的仓位管理(如All-in、加杠杆)和对资产缺乏深度理解,这可能导致投资者无法承受巨大波动而提前被迫出局。 **最后对比** 作者以亚马逊在互联网泡沫破裂后股价跌95%又最终上涨42倍为例,指出关键在于“活着等到那一天”。对于比特币,核心同样是能否通过理性仓位管理活到其价值兑现之时。文末提问:当黄金大涨而比特币大跌,这究竟是“数字黄金”叙事的失败,还是资产进化过程中的阵痛?答案取决于每个人对比特币最底层的信仰。

链捕手1小时前

BTC“数字黄金”的叙事是不是失败了?

链捕手1小时前

从代码到认知:机器人大脑进化的万字指南

本文概述了机器人大脑从传统代码控制到现代人工智能模型驱动的演进历程。文章首先回顾了前大型语言模型(LLM)时代,机器人依赖手工编码的模块化技术栈(感知、状态估计、规划、控制)和行为树,虽稳定但泛化能力差。随后,深度学习改进了感知,强化学习和模仿学习进入了控制层,但策略仍较为狭窄。 ChatGPT的出现带来了转折。LLM最初被用作自然语言编译器,将指令转化为机器人可执行的原子技能序列(如谷歌的SayCan)。但更重要的突破是视觉-语言-动作模型(VLA),例如谷歌的RT-2和开源的OpenVLA,它能将视觉、语言信息融合,直接输出动作指令,实现了推理与行动的耦合。 目前最先进的系统采用“双脑”架构(如Figure AI的Helix、NVIDIA GR00T):一个慢速、参数多的“系统2”负责高层次推理和规划;一个快速、小巧的“系统1”负责高频动作生成。其下还可能有一个“系统0”反射层处理平衡等底层控制。出于延迟和可靠性考虑,安全关键的控制回路通常在机器人本地(如NVIDIA Jetson模块)运行,而对话界面和集群学习等任务可交由云端。 开源模型(如OpenVLA、GR00T、π0)降低了行业门槛,让初创公司能在其基础上用自有数据微调。然而,当前VLA机器人仍存在任务中途恢复能力弱、样本效率低、缺乏物理常识和长期规划能力等局限。 这催生了下一代方向:世界模型。这类模型(如NVIDIA Cosmos、Meta V-JEPA)能根据当前状态和动作预测未来结果,让机器人在行动前进行模拟和评估,从而改善恢复能力、泛化能力和长期规划。架构上主要分为像素级视频扩散、联合嵌入预测架构(JEPA)和潜在动作世界模型等流派。 文章最后指出,数据采集(特别是远程操作数据)是核心竞争力,仿真训练至关重要,机器人成本正在迅速下降。当前物理AI的发展阶段大约相当于“GPT-2时代”,虽未完全自主,但正通过架构的持续演进(从代码到感知、规划、策略,最终到世界模型),朝着更通用、更强大的方向稳步前进。

marsbit1小时前

从代码到认知:机器人大脑进化的万字指南

marsbit1小时前

AI 泡沫正在破裂

近期市场剧烈波动,“AI泡沫论”甚嚣尘上。桥水达利欧认为AI市场存在“相对较高”的泡沫,而英伟达黄仁勋则强调AI算力需求才刚刚开始。两者观点看似矛盾,实则揭示了技术革命初期的典型特征:市场因高估短期影响而产生泡沫,却往往低估其长期颠覆性力量。 回顾2000年互联网泡沫,纳指暴跌78%,超5万亿美元财富蒸发,大量公司破产。然而,泡沫破裂后留下的廉价电信基础设施(如海底光缆),却成为日后流媒体、云计算乃至移动互联网崛起的基石。这符合“阿玛拉定律”:人们高估技术的短期影响,低估其长期影响。泡沫是创新必须缴纳的“智商税”,其破裂能淘汰投机者,沉淀下坚固的基础设施,滋养真正伟大的公司。 当前AI行业同样呈现巨大的“投入-产出”不对称:2026年,五大云服务商的AI基础设施资本开支预计达6900亿美元,而头部纯AI厂商的总收入预计不超过400亿美元。但深层逻辑正在演变:AI推理成本在两年内暴跌超过99.7%,接近零的边际成本解锁了海量长尾需求,驱动企业AI支出翻倍增长。这印证了“杰文斯悖论”——效率提升导致总消耗量指数级上升。如今,各行业关心的已非“是否用AI”,而是如何更有效地整合AI。 市场已进入“幻灭的低谷”前夕,缺乏护城河的套壳公司正批量死亡,这是市场的自我净化。与此同时,价值转移正在发生:1. 从资本开支(CapEx,如硬件)向运营开支(OpEx,如解决垂直行业痛点的应用)转移;2. 高估值正被高速增长的业绩逐步消化。AI已深入制造业(缩短研发周期)、金融(微秒级定价)、法律、医疗等专业领域,成为实质性的生产力工具。 历史总在重演“创造性毁灭”。当下近7000亿美元的基建投资短期内无法全部转化为利润,市场洗牌不可避免。但洗牌之后,廉价的算力与高度优化的算法将赋能千行百业。正如互联网泡沫后我们迎来了数字时代,AI泡沫的喧嚣过后,我们将不可逆转地迈向一个所有行业都由AI深度赋能的智能全盛时代。泡沫终会破裂,但底层先进生产力的势能,没有水分。

链捕手1小时前

AI 泡沫正在破裂

链捕手1小时前

交易

现货
合约

热门文章

如何购买LAYER

欢迎来到HTX.com!我们已经让购买Solayer(LAYER)变得简单而便捷。跟随我们的逐步指南,放心开始您的加密货币之旅。第一步:创建您的HTX账户使用您的电子邮件、手机号码注册一个免费账户在HTX上。体验无忧的注册过程并解锁所有平台功能。立即注册第二步:前往买币页面,选择您的支付方式信用卡/借记卡购买:使用您的Visa或Mastercard即时购买Solayer(LAYER)。余额购买:使用您HTX账户余额中的资金进行无缝交易。第三方购买:探索诸如Google Pay或Apple Pay等流行支付方法以增加便利性。C2C购买:在HTX平台上直接与其他用户交易。HTX场外交易台(OTC)购买:为大量交易者提供个性化服务和竞争性汇率。第三步:存储您的Solayer(LAYER)购买完您的Solayer(LAYER)后,将其存储在您的HTX账户钱包中。您也可以通过区块链转账将其发送到其他地方或者用于交易其他加密货币。第四步:交易Solayer(LAYER)在HTX的现货市场轻松交易Solayer(LAYER)。访问您的账户,选择您的交易对,执行您的交易,并实时监控。HTX为初学者和经验丰富的交易者提供了友好的用户体验。

831人学过发布于 2025.02.11更新于 2026.06.02

如何购买LAYER

相关讨论

欢迎来到HTX社区。在这里,您可以了解最新的平台发展动态并获得专业的市场意见。以下是用户对LAYER(LAYER)币价的意见。

活动图片