Melampaui 'Tembok Memori', Revolusi Tingkat Wafer dan Rute Kekuatan Komputasi di Era Inferensi AI

marsbitDipublikasikan tanggal 2026-06-05Terakhir diperbarui pada 2026-06-05

Abstrak

Pada tahun 2026, titik balik global AI muncul: belanja modal *inference* penyedia awan melebihi *training*, menandai pergeseran dari "membuat" ke "menggunakan" model besar. Hambatan utama bergeser dari daya komputasi ke "dinding memori"—bottleneck dalam memindahkan data (seperti berat model dan KV Cache) antara DRAM dan GPU, yang menyebabkan konsumsi energi tinggi dan penundaan. Arsitektur alternatif seperti Cerebras menawarkan solusi radikal melalui Wafer-Scale Engine (WSE). Daripada memotong wafer, Cerebras menggunakannya utuh sebagai satu chip raksasa (WSE-3), menampung 44GB SRAM *on-chip* dengan bandwidth 21 PB/detik—ribuan kali lebih cepat dari HBM tradisional. Ini memungkinkan aliran berat model dari memori eksternal (MemoryX) ke chip dengan latency sangat rendah, meningkatkan kecepatan *token* inferensi hingga 1,5–5x dibandingkan GPU seperti NVIDIA B200. Selain itu, daya interkoneksinya jauh lebih efisien (0,15 pJ/bit vs 10 pJ/bit GPU). Namun, pendekatan ini menghadapi tantangan: skala SRAM terhambat batas fisik, memerlukan sistem pendingin khusus, bandwidth I/O eksternal terbatas, dan ekosistem perangkat lunaknya yang kurang umum. Sementara itu, raksasa teknologi merespons dengan tiga jalur: chip ASIC khusus inferensi (seperti Microsoft Maia), kemasan *wafer-scale* yang semakin umum (misal, TSMC SoW), serta eksplorasi interkoneksi optik. Tekanan komersial juga besar bagi Cerebras, yang kini harus membangun pusat data skala besar untuk memenuhi pesanan. Intinya, tid...

Tahun 2026, perkembangan AI global mencapai titik balik bersejarah—pengeluaran modal inferensi oleh vendor awan berskala ultra-besar, untuk pertama kalinya dalam sejarah, melampaui pengeluaran modal pelatihan. Titik fokus industri bergeser dari "membangun model besar" ke "menggunakan model besar", struktur permintaan daya komputasi mengalami perubahan fundamental.

Di era pelatihan, kontradiksi inti daya komputasi adalah "presisi ganda floating point dan skala klaster"; sementara memasuki era inferensi, kontradiksi inti berubah menjadi "bandwidth memori dan latensi komunikasi".

Hambatan inferensi model besar tidak lagi hanya komputasi, melainkan perpindahan data—bobot model, nilai aktivasi perantara, dan KV Cache perlu sering berinteraksi antara DRAM di luar chip (seperti HBM) dan GPU. Semakin besar modelnya, konsumsi energi dan penundaan akibat pemindahan data semakin tinggi, akhirnya jauh melampaui konsumsi energi komputasi itu sendiri, sehingga membentuk "tembok memori".

GPU NVIDIA membangun benteng kokoh dengan CUDA dan NVLink, tetapi tetap tidak dapat menghindari idle GPU akibat hambatan bandwidth.

Perusahaan model besar domestik, Zhipu AI, melakukan eksperimen sederhana: dalam klaster inferensi 512 kartu, GPU, model, dan kode tetap sama, hanya mengganti bandwidth jaringan maksimum dari 200GB/S menjadi 400GB/S, throughput inferensi langsung naik 10%, latensi keluaran token pertama turun 19%—alasannya sederhana, hanya dengan memperlebar jalan, mobil bisa berjalan lebih cepat.

Namun, arsitektur non-GPU seperti yang diwakili Cerebras, tampaknya sedang merobek celah di tembok memori.

Perbandingan Ukuran Chip Cerebras WSE-3 dan GPU NVIDIA B200

Esensi Cerebras: Mesin Komputasi Near-Memory Berbasis SRAM

Cerebras Systems didirikan oleh Andrew Feldman dan lainnya di Silicon Valley, tim pendiri awalnya berasal dari sebuah server mikro hemat daya bernama SeaMicro. Perusahaan ini kemudian diakuisisi oleh AMD, dan setelah itu:

2015, tim pendiri menetapkan jalur "komputasi tingkat wafer";

2016, menyelesaikan pendaftaran dan pendanaan Seri A, memasuki fase pengembangan tersembunyi;

2019, merilis produk pertama, chip WSE-1 dan sistem CS-1, berbasis proses TSMC 16nm;

2021, merilis produk generasi kedua, berbasis proses TSMC 7nm;

2024, merilis produk generasi ketiga (WSE-3 / CS-3), berbasis proses TSMC 5nm, chip dan sistem diproduksi di AS, merupakan sistem chip murni buatan AS.

Konfigurasi Sistem CS-3, berisi 1 chip WSE-3

Filosofi arsitektur Wafer-Scale Engine (WSE) Cerebras sederhana, kasar, tetapi langsung mengenai titik permasalahan: Memanfaatkan pembesaran ekstrem ruang fisik untuk mendapatkan kompresi ekstrem terhadap latensi pemindahan data.

Chip biasa memotong satu wafer menjadi banyak chip kecil, misalnya GPU NVIDIA mengikuti pendekatan ini. Cerebras sebaliknya: tidak dipotong, wafer utuh secara langsung dijadikan satu chip super besar, disebut Wafer-Scale Engine, WSE.

Chip tradisional memotong wafer berdiameter 300mm menjadi ratusan chip kecil; sedangkan Cerebras memilih mempertahankan seluruh wafer sebagai satu chip utuh. WSE-3 terbaru memiliki 4 triliun transistor, 900 ribu inti AI, setiap inti dilengkapi dengan SRAM lokal 48KB, sehingga total SRAM dalam chip mencapai 44GB, menyediakan bandwidth memori dalam chip (on‐chip memory bandwidth) 21PB/detik dan bandwidth jaringan (fabric bandwidth) 214Pb/detik, ini adalah ribuan kali lipat bandwidth HBM tradisional.

Bandwidth memori Cerebras WSE adalah 2625 kali chip kemasan NVIDIA B200, menghancurkan hambatan bandwidth memori dalam skenario inferensi model besar.

Dalam arsitektur Cerebras, bobot model tidak pernah disimpan di SRAM, melainkan di penyimpanan luar chip MemoryX, dan ditransfer lapis demi lapis ke chip besar. Cara implementasinya adalah memisahkan penyimpanan bobot model jaringan saraf dengan unit komputasi.

Semua bobot model disimpan secara eksternal di modul ekspansi memori MemoryX, bobot yang diperlukan untuk setiap lapisan komputasi jaringan akan ditransfer lapis demi lapis sesuai kebutuhan ke sistem CS-3. Bobot disimpan di DRAM dan flash memori MEMORY X, dan ditransmisikan ke sistem CS-3 dengan kecepatan bandwidth penuh. Bobot-bobot ini tidak disimpan di sistem CS-3, bahkan tidak disimpan dalam cache sementara, CS-3 mengandalkan mekanisme aliran data inti untuk menyelesaikan komputasi.

Cerebras, dengan arsitektur tingkat wafer, menunjukkan keunggulan luar biasa dalam inferensi LLM yang dibatasi oleh bandwidth memori. Saat menghasilkan token per token, bobot ditransmisikan lapis demi lapis dari luar chip MemoryX ke CS-3 secara streaming, saat menjalankan model yang berbeda, kecepatan token adalah 1,5 - 5 kali NVIDIA B200.

GPU NVIDIA DGX B200 versus chip Cerebras CS-3, perbandingan kecepatan token saat menjalankan model besar yang berbeda

Keunggulan intinya terletak pada: SRAM dalam chip CS-3 sebesar 44GB menyediakan bandwidth super tinggi 21 PB/detik (2625 kali B200) dan interkoneksi 214 Pb/detik, membuat transmisi aliran bobot terbebas dari batasan antarmuka HBM. Oleh karena itu, performanya sangat menonjol pada TTFT (Time To First Token, waktu dari permintaan dikirim hingga model mengembalikan token pertama), konteks panjang, dan beban kerja agen.

Meskipun bobot ditempatkan di luar MemoryX dan dimuat lapis demi lapis sesuai kebutuhan dan tidak di-cache di dalam chip, CS-3 mengandalkan mekanisme aliran data inti untuk menyelesaikan komputasi presisi penuh FP16 tanpa kehilangan di SRAM; dengan penskalaan performa linier, juga melepaskan total throughput yang luar biasa di bawah inferensi konkurensi multi-pengguna.

Selain bandwidth, ada juga keunggulan konsumsi daya. Baru-baru ini, dalam pidato Chairman Zhongji Xu Chuang, Liu Sheng juga menyebutkan, persyaratan pelanggan untuk modul optik adalah 1 pJ/bit, sedangkan saat ini adalah 10 pJ/bit. Dalam chip Cerebras, konsumsi daya interkoneksi hanya 0,15 pJ/bit, sedangkan konsumsi daya interkoneksi GPU saat ini adalah 10 pJ/bit.

Perbandingan bandwidth dan konsumsi daya arsitektur interkoneksi Cerebras dan GPU

Dapat dilihat, jika arsitektur chip besar tingkat wafer Cerebras menjadi arus utama inferensi atau bahkan pelatihan AI, mungkin akan menghambat dan mengubah secara signifikan volume pengiriman modul optik tradisional dan CPO (Co-Packaged Optics). Logika intinya adalah: permintaan tinggi untuk modul optik dan CPO pada dasarnya adalah untuk mengatasi hambatan bandwidth "interkoneksi antar chip" dan "interkoneksi antar node" dalam klaster GPU; sedangkan arsitektur Cerebras justru menyelesaikan masalah dengan "menghilangkan interkoneksi terdistribusi".

Intuisi Terbalik: "Kecacatan" Sejati dan Palsu pada Chip Besar Tingkat Wafer

Inti dari chip selalu terletak pada Trade Off (seni pertukaran). Cerebras, demi bandwidth ekstrem SRAM dalam chip, juga membawa beberapa masalah.

Hasil produksi rendah?

Justru sebaliknya, ukuran inti AI tunggal dikurangi menjadi 0,05 milimeter persegi (1% dari ukuran inti komputasi tunggal H100), sehingga hasil produksi justru lebih tinggi. Melalui routing di dalam chip, inti yang cacat dapat dimatikan dan dilewati, sehingga toleransi cacat meningkat 100 kali lipat dibandingkan dengan prosesor multi-inti tradisional. Sebenarnya seluruh chip memiliki 1 juta inti AI, tetapi dengan mempertimbangkan hasil produksi, diumumkan ke publik adalah 900 ribu inti AI.

Hanya ahli dalam inferensi, tidak ahli dalam pelatihan?

Dalam beberapa tahun sejak Cerebras didirikan, pelatihan adalah topik utama, sehingga perusahaan selalu melakukan banyak pekerjaan seputar pelatihan, hanya saja setelah permintaan inferensi meledak, orang-orang menemukan keunggulannya dalam inferensi lebih jelas.

Faktanya, komputasi terdistribusi yang disederhanakan juga membawa serangkaian keunggulan seperti penurunan kompleksitas kode dan penurunan overhead komunikasi.

Melatih model dengan parameter 175 miliar pada 4000 GPU biasanya membutuhkan sekitar 20.000 baris kode pelatihan terdistribusi.

Cerebras mencapai pelatihan setara dengan 565 baris kode—seluruh model dapat dipasang di wafer, dan tidak perlu menangani kompleksitas paralelisme data.

Penskalaan SRAM sudah mati, keunggulan inti menghadapi batas fisik.

Produk generasi ketiga berbasis proses TSMC 5nm, kapasitas SRAM-nya hanya meningkat 10% dibandingkan produk generasi kedua berbasis proses TSMC 7nm, setelah proses 5nm, luas sel SRAM hampir tidak lagi menyusut seiring kemajuan proses.

Ini berarti Cerebras tidak dapat lagi meningkatkan keunggulan intinya (kapasitas SRAM) secara signifikan dengan meng-upgrade proses TSMC (seperti dari 5nm ke 3nm) seperti dulu.

Dibatasi oleh ukuran wafer, kemampuan pendinginan, dan biaya produksi, sumber daya penyimpanan seperti SRAM dalam chip sulit diperluas secara linier bersamaan dengan inti komputasi, rasio sumber daya menghadapi hambatan. Ini hampir memblokir jalan evolusinya.

Spesifikasi teknis tiga generasi produk Cerebras

Tiga penderitaan: pendinginan, proses, dan ekosistem.

Seluruh wafer memusatkan panas, kerapatan aliran panas tinggi, harus mengandalkan ruang server kustom dan sistem pendingin cair khusus. Selain itu, keumuman ekosistem berarti pelanggan harus beradaptasi dengan software stack kustomnya, kompatibilitasnya lemah dengan kerangka kerja pemrograman umum seperti CUDA, biaya porting dan adaptasi perangkat lunak tinggi.

Bandwidth luar chip rendah, menjadi "pulau terisolasi" dalam ekspansi.

Karena keterbatasan desain fisik tingkat wafer, jumlah pin I/O yang dapat dikeluarkan di tepi WSE sangat terbatas, mengakibatkan bandwidth I/O-nya hanya 150GB/s. Dibandingkan dengan bandwidth dua arah NVLink NVIDIA yang mencapai 1,8TB/s, ini seperti siput. Ini berarti WSE sangat sulit untuk diperluas ke luar dengan kecepatan tinggi. Meskipun interkoneksi SwarmX Cerebras cukup baik dalam kombinasi multi-sistem, di hadapan model super besar yang membutuhkan interkoneksi kecepatan tinggi multi-chip, bandwidth luar chip yang sangat rendah menjadi belenggu fisik struktural.

Persaingan Jalur: Pengembangan Mandiri Perusahaan Besar, Berapa Lama Lagi Masa Jendela Cerebras?

Cara perusahaan besar menyelesaikan "inferensi membutuhkan bandwidth lebih tinggi + latensi lebih rendah" tidak hanya satu jalan wafer-scale, mereka sedang melalui tiga jalur paralel untuk mengepung keuntungan teknologi perusahaan rintisan.

1. Chip ASIC Pengembangan Mandiri

Google TPU v8 telah terpecah menjadi versi training-specific dan inference-specific; AWS Trainium 4 sedang dalam perjalanan; Microsoft Maia telah digunakan di dalam Azure, dibangun berdasarkan proses TSMC 3nm, inti tensor FP8/FP4 asli, sistem memori yang didesain ulang, dilengkapi HBM3e 216GB, SRAM dalam chip 272MB; bahkan Anthropic mulai mengevaluasi chip inferensi pengembangan mandiri.

Probabilitas jalur ini sangat tinggi, ini akan langsung menyebabkan TAM (Total Addressable Market) "pembelian inferensi pihak ketiga" pada tahun 2028, terkompresi 10% hingga 25%.

2. Generalisasi Proses pada Jalur Packaging Standar

Ini adalah serangan dimensi langsung terhadap Cerebras.

SoW (System-on-Wafer) TSMC telah dibuka luas ke pelanggan, interposer CoWoS 9.5x juga akan diluncurkan pada tahun 2027.

Apa yang dilakukan kedua produk ini—menyatukan beberapa die pada tingkat wafer—pada dasarnya adalah membuat proses fisik Cerebras menjadi umum dan terjangkau.

NVIDIA Vera Rubin akan memasuki ekosistem ini pada paruh kedua tahun 2026.

Cross-reticle stitching yang dilakukan sendiri oleh Cerebras meskipun eksklusif, tetapi masa jendela eksklusifnya paling lama hanya 2 hingga 3 tahun, setelah tahun 2027 - 2028, hambatan prosesnya akan diencerkan oleh kemasan canggih TSMC.

3. Terobosan Interkoneksi Optik/Komputasi Optik

Interkoneksi dan tembok memori chip elektronik telah mencapai batas, bandwidth tinggi, latensi rendah, dan zero crosstalk foton adalah solusi akhir.

Jalur optik yang diwakili oleh Lumentum sedang bangkit. Keunggulan terbesar wafer-scale adalah komputasi dalam chip, tetapi model pasti akan semakin besar, interkoneksi kecepatan tinggi di atas wafer scale adalah kebutuhan mutlak.

Dengan matangnya CPO (Co-Packaged Optics) dan Optical Interconnects, sangat mungkin di masa depan kita melihat I/O optik langsung dimasukkan ke wafer WSE, memecahkan belenggu interkoneksi listrik; dan NVIDIA juga mungkin mengakuisisi perusahaan dengan keunggulan arsitektur tertentu seperti LPU (contohnya Groq), menggabungkan interkoneksi optik, mengembangkan sistem tingkat wafer yang kompatibel dengan perangkat lunak super-node NV yang ada.

Berlari di Tepi Jurang: Bisnis dan Pengiriman Cerebras

Saat ini Cerebras sedang menghadapi perlombaan di tepi jurang yang dipaksa oleh pesanan besar-besaran.

Transaksi dengan pelanggan besar seperti OpenAI memaksa Cerebras bertransformasi dari perusahaan chip menjadi penyedia layanan cloud baru. Ia tidak lagi hanya menjual perangkat keras, tetapi perlu mengunci dan membangun fasilitas dan daya pusat data dalam jumlah besar dalam waktu singkat.

Berdasarkan persyaratan kontrak, Cerebras perlu mengirimkan kapasitas pusat data 250MW setiap tahun pada periode 2026 - 2028. Namun, sistem tingkat wafer memiliki persyaratan ruang server yang sangat tinggi, tidak dapat langsung dimasukkan ke IDC berpendingin udara tradisional. Saat ini, persiapan kapasitas pusat data Cerebras sudah jelas tertinggal dari persyaratan kontrak.

Dari fabrikasi wafer hingga pembangunan pabrik, dari persetujuan daya hingga penerapan sistem pendingin, ini adalah lumpur aset berat dan siklus panjang.

Penutup: Ke Kiri atau Ke Kanan?

Kembali ke proposisi awal, ketika titik balik daya komputasi inferensi telah tiba, inti arsitektur daya komputasi selalu terletak pada pertukaran.

Tidak ada yang mutlak benar atau salah, hanya solusi relatif optimal di bawah beban kerja terpenting. Beban kerja sebenarnya sudah berubah.

Cerebras ke kiri, memilih optimasi fisik ekstrem, menggunakan seluruh wafer dan SRAM dalam jumlah besar untuk mendapatkan latensi sangat rendah pada tugas tunggal, ini tak tertandingi untuk skenario yang sangat sensitif terhadap latensi token pertama.

NVIDIA ke kanan, memilih mempertahankan keumuman, menggunakan HBM + NVLink + throughput klaster super besar, menghadapi ribuan perubahan beban kerja, tidak berubah menghadapi perubahan.

Angin bertiup kencang, awan bergulung, jalan di depan belum jelas. Justru ketidakpastian ganda teknologi dan bisnis inilah yang mengandung kemungkinan disruptif. Dalam arus deras daya komputasi menuju AGI, sekarang masih terlalu dini untuk menarik kesimpulan—karena tidak pasti, ada peluang.

Artikel ini berasal dari akun WeChat publik "Garlic Kernel Machinery Research Institute", penulis: Pili Youxia

Kripto yang Sedang Tren

CitreaCTR

wrapped stUSDTWSTUSDT

Velodrome FinanceVELODROME

BrevisBREV

ZRX（0X）ZRX

PancakeSwapCAKE

Pertanyaan Terkait

QApa yang dimaksud dengan 'dinding memori' (memory wall) dalam konteks komputasi AI, dan mengapa hal ini menjadi masalah kritis di era inferensi?

A'Dinding memori' (memory wall) mengacu pada hambatan kinerja dalam komputasi AI di mana energi dan latensi yang diperlukan untuk memindahkan data (seperti bobot model, nilai aktivasi, dan KV Cache) antara DRAM eksternal (misalnya, HBM) dan GPU jauh melebihi energi yang digunakan untuk komputasi itu sendiri. Ini menjadi masalah kritis di era inferensi karena beban kerja inferensi model besar sangat bergantung pada bandwidth memori dan latensi komunikasi, bukan hanya daya komputasi. Semboyan (idle) GPU sering terjadi karena keterbatasan bandwidth ini.

QBagaimana arsitektur Wafer-Scale Engine (WSE) dari Cerebras mengatasi masalah 'dinding memori' dalam inferensi AI?

AArsitektur Wafer-Scale Engine (WSE) Cerebras mengatasi 'dinding memori' dengan menggunakan hampir seluruh wafer silikon sebagai satu chip raksasa (WSE). Chip ini memiliki SRAM on-chip yang sangat besar (44GB pada WSE-3) yang menyediakan bandwidth memori on-chip yang sangat tinggi (21 PB/s), ribuan kali lebih cepat dari HBM tradisional. Dengan pendekatan ini, kebutuhan untuk sering memindahkan data ke dan dari memori eksternal berkurang drastis, sehingga mengurangi latensi dan konsumsi energi terkait perpindahan data.

QApa saja keunggulan utama chip Cerebras CS-3 (berbasis WSE-3) dibandingkan dengan GPU tradisional seperti NVIDIA B200 dalam beban kerja inferensi model besar?

AKeunggulan utama Cerebras CS-3 dibandingkan GPU seperti NVIDIA B200 meliputi: 1) Bandwidth memori on-chip yang jauh lebih tinggi (21 PB/s vs ~8 TB/s pada B200), 2) Latensi interkoneksi on-chip yang sangat rendah dengan konsumsi daya hanya 0.15 pJ/bit (vs ~10 pJ/bit pada GPU), 3) Kinerja token yang lebih cepat untuk inferensi, berkisar 1.5 hingga 5 kali lebih cepat tergantung model, 4) Kode pelatihan yang jauh lebih sederhana karena tidak memerlukan paralelisme data yang kompleks seperti pada kluster GPU.

QApa tantangan dan keterbatasan utama yang dihadapi oleh pendekatan chip skala wafer (wafer-scale) seperti yang digunakan Cerebras?

ATantangan dan keterbatasan utama pendekatan wafer-scale meliputi: 1) Skalabilitas SRAM yang terbatas karena kepadatan SRAM hampir tidak menyusut lagi di node proses di bawah 5nm, 2) Masalah dissipasi panas yang tinggi pada wafer utuh, memerlukan sistem pendingin cair khusus dan fasilitas data center yang dirancang khusus, 3) Bandwidth I/O eksternal yang relatif rendah (~150 GB/s) membatasi ekspansi multi-sistem, 4) Ekosistem perangkat lunak yang kurang umum (non-CUDA) meningkatkan biaya adaptasi, dan 5) Ancaman dari proses packaging canggih (seperti SoW dari TSMC) yang dapat mendemokratisasi teknologi serupa.

QStrategi apa yang ditempuh perusahaan teknologi besar (seperti Google, AWS, Microsoft) untuk mengatasi kebutuhan inferensi AI, dan bagaimana hal ini memengaruhi lanskap persaingan?

APerusahaan teknologi besar mengejar tiga jalur strategis utama: 1) Mengembangkan ASIC khusus inferensi (seperti Google TPU v8 Inference, Microsoft Maia, AWS Trainium/Inferentia) untuk efisiensi dan kontrol yang lebih besar, 2) Memanfaatkan kemajuan dalam teknologi packaging canggih (seperti TSMC's System-on-Wafer) untuk membuat sistem yang mirip wafer-scale dengan lebih mudah, 3) Mengeksplorasi interkoneksi dan komputasi fotonik (optical) untuk mengatasi batasan interkoneksi listrik. Strategi-strategi ini berpotensi mengurangi ketergantungan pada vendor pihak ketiga seperti Cerebras dan mempersempit jendela peluang kompetitifnya.

Bacaan Terkait

Perusahaan Charles Schwab Menghitung dan Mengungkap Nilai Wajar Bitcoin (BTC)! Berikut Seharusnya Nilainya!

Perusahaan Charles Schwab, melalui kepala penelitian kriptonya Jim Ferraioli, mengungkap perhitungan nilai wajar Bitcoin (BTC) sekitar $95.000. Penilaian ini didasarkan pada biaya produksi penambangan Bitcoin, bukan pada sentimen pasar jangka pendek. Ferraioli menjelaskan bahwa penambang paling efisien menghasilkan satu BTC dengan biaya sekitar $60.000, sementara untuk penambang yang kurang efisien, biayanya bisa mencapai $95.000. Ia menyamakan hal ini dengan pasar komoditas tradisional, di mana biaya produksi merupakan indikator penting untuk menilai nilai wajar aset. Tingkat biaya $60.000 juga disebutkan sebagai tingkat dukungan fundamental yang penting untuk BTC, yang kebetulan bertepatan dengan rata-rata pergerakan 200-mingguannya. Meskipun demikian, Ferraioli menekankan bahwa angka $95.000 adalah perkiraan berbasis data ekonomi dan bukan target harga, serta menyatakan tidak dapat memprediksi apakah BTC akan mencapai level tersebut dalam enam bulan ke depan.

cryptonews.ru6m yang lalu

Perusahaan Charles Schwab Menghitung dan Mengungkap Nilai Wajar Bitcoin (BTC)! Berikut Seharusnya Nilainya!

cryptonews.ru6m yang lalu

Utopia Kripto Telah Runtuh? Industri Menghadapi Titik Balik Setelah Demam Mereda

Saat ini, banyak yang memandang industri kripto hanya sebagai saluran untuk kelebihan likuiditas. Banyak pekerja yang hengkang karena imbalan finansial tidak memenuhi ekspektasi yang dibangun dalam satu dekade terakhir. Kebangkrutan saat ini menandai berakhirnya suatu era. Kemakmuran 2021 terbukti ilusi, mirip puncak ekspektasi dalam Siklus Hype Gartner. Saat ini adalah momen pencerahan yang memaksa kita kembali ke prinsip pertama: menilai ulang nilai token, memperkuat keamanan protokol DeFi, dan mencari kasus penggunaan nyata. Industri ini terjebak dalam siklus spekulasi berulang. Aliran modal besar menjadikannya "solusi" yang mencari masalah. Dasar demam keuangan ini adalah kemampuan token diperdagangkan sejak dini, yang berujung pada gelembung. Pada 2024, industri memilih "panen" daripada "eksplorasi." Insentif mendorong keuntungan jangka pendek. Serangan hacker DeFi baru-baru ini adalah sinyal perlunya rekayasa ulang, termasuk model token. Rasa ingin tahu, bukan keuntungan, yang mendorong penemuan sejati. Hilangnya ilusi juga mencerminkan pergeseran budaya: kita tidak lagi di tahap awal. Bagi pembangun dan investor yang baik, ini adalah tantangan. Menggunakan kurva adopsi teknologi, titik terendah hilangnya ilusi berada di tengah, sekaligus titik balik dalam teori Carlota Perez. Tantangan intinya tetap: membangun kembali keuangan dari nol. Ini sulit dan membutuhkan iterasi serta kegagalan. Kita kembali ke titik awal, tetapi upaya sebelumnya tidak sia-sia. Peluang investasi asimetris masih ada. Risiko sebenarnya adalah membuang yang baik bersama yang buruk. Mengenai modal ventura kripto, klaim "VC kripto mati" tidak akurat. VC secara umum sedang krisis. Periode imbal hasil tinggi 2016-2021 adalah pengecualian. Pasar yang belum matang dibanjiri modal, memuncak pada 2021, diikuti periode pembersihan. Ada pembalikan ideologi: budaya cypherpunk asal Bitcoin kini mendekati Wall Street dan regulator. Ini adalah ciri siklus gelembung. Industri telah meninggalkan utopia kripto. Alih-alih revolusi, industri diserap oleh sistem yang ada. Menurut teori Perez, visi utopis sesuai dengan fase penyebaran awal. Titik hilangnya ilusi adalah titik balik menuju fase penyebaran yang masuk akal. Kripto bukan lagi perbatasan, melainkan bisnis. Proyek baru saat ini umumnya masuk lima kategori: stablecoin, pasar prediksi, aset tokenisasi/RWA, kontrak berjangka, serta AI dan agen cerdas. Pada tingkat tertentu, kripto "memakan" fintech, atau fintech mengasimilasi kripto. Ini jauh dari revolusi DeFi yang dibayangkan. Industri perlu menemukan aplikasi andalan di luar stablecoin dalam batas regulasi. Dua pandangan tampak bertentangan: kripto mengubah cara dasar menyimpan dan mentransfer nilai, dan kripto menjadi jalur bisnis yang mengikuti aturan keuangan yang ada. Rekonsiliasinya: kripto mungkin meresap ke kehidupan sehari-hari dengan cara yang tak terlihat. Perubahan terdalam jarang datang dengan teriakan "kapitalisasi triliunan". Mereka tertanam diam-diam dalam sistem dan kesadaran publik. Dalam kesulitan, industri kripto justru lebih kreatif. Mereka yang benar-benar penasaran akan membangun kembali. Masih banyak yang harus dibangun dan diperjuangkan.

marsbit8m yang lalu

Utopia Kripto Telah Runtuh? Industri Menghadapi Titik Balik Setelah Demam Mereda

marsbit8m yang lalu

Menjual Token atau Menjual Hasil: Beberapa Paradoks dalam Model Bisnis AI

**Paradoks Bisnis AI: Menjual Token vs Hasil, dan Ke Mana Keuntungan Mengalir?** Industri AI tumbuh cepat, namun di balik data pendapatan dan panggilan API yang melonjak, terdapat paradoks struktural yang menentukan siapa yang benar-benar menghasilkan keuntungan. **1. Paradoks Biaya: Token Semakin Murah, Tagihan Semakin Besar** Harga token AI turun drastis, tetapi total pengeluaran perusahaan justru meledak. Mirip "Paradoks Jevons", efisiensi malah mendorong konsumsi lebih besar. Harga rendah membuka tugas-tugas baru yang sebelumnya tidak ekonomis, dan penggunaan *agent* yang berjalan 24 jam meningkatkan volume puluhan kali lipat. Fokus bergeser dari menghemat harga per token menjadi mengoptimalkan **efisiensi tugas** dan **restrukturisasi proses** untuk benar-benar meningkatkan produktivitas. **2. Paradoks Lapisan: "Aplikasi adalah Raja" vs "Aplikasi Sudah Mati"** Modal lebih banyak mengalir ke infrastruktur (chip) dan model dasar, bukan lapisan aplikasi. Dalam tumpukan industri AI, lapisan chip mengambil porsi pendapatan dan margin laba terbesar. Aplikasi yang hanya "membungkus" kemampuan model akan mudah tergantikan. Peluang startup ada pada aplikasi yang **mendalam pada konteks spesifik**, memiliki data privat, atau menguasai alur kerja dan saluran distribusi, sehingga menjadi sulit diganti meski model dasar semakin canggih. **3. Paradoks Tanggung Jawab: Keuntungan Mengikuti Distribusi Tanggung Jawab** Pertumbuhan pendapatan yang tinggi tidak menjamin profitabilitas. Perusahaan seperti Anthropic menunjukkan margin yang kuat, sementara yang lain masih berjuang. Perbedaannya terletak pada **kesanggupan dan kemampuan mempertanggungjawabkan hasil**. Menjual berdasarkan token bersaing untuk anggaran IT. Menjual berdasarkan **hasil yang terukur dan dijamin** (misalnya, tiket layanan terselesaikan) dapat mengambil alih anggaran sumber daya manusia, yang lebih besar dan memberikan ruang harga premium. Keuntungan akan mengalir ke perusahaan yang berani dan mampu bertanggung jawab atas hasil di bidang-bidang kompleks seperti hukum atau medis. **4. Paradoks Sumber Terbuka vs Tertutup: Terbuka Menang Traffic, Tertutup Menang Pendapatan** Model *open-source* mendominasi penggunaan, namun perusahaan besar masih lebih banyak membelanjakan untuk model *closed-source* (89% dari anggaran). Alasannya adalah **keandalan, dukungan, kepatuhan regulasi, dan akuntabilitas**. Kecerdasan yang "cukup baik" semakin menjadi komoditas. Model *open-source* sering menjadi strategi untuk menarik pengembang atau mendorong penggunaan layanan cloud. Sementara itu, model *closed-source* terdepan mempertahankan premiumnya. Pola hybrid menjadi umum: *open-source* untuk eksperimen, *closed-source* untuk tugas inti. **Kesimpulan:** Nilai dan keuntungan dalam AI tidak lagi terdistribusi merata. Kecerdasan menjadi komoditas yang murah, sementara keuntungan terkonsentrasi pada: (1) penyedia infrastruktur (terutama chip), (2) penyedia model *closed-source* terdepan, dan (3) penyedia aplikasi atau layanan yang memiliki **konteks domain mendalam, kemampuan integrasi proses, dan kesanggupan bertanggung jawab atas hasil yang terukur**.

marsbit17m yang lalu

Menjual Token atau Menjual Hasil: Beberapa Paradoks dalam Model Bisnis AI

marsbit17m yang lalu

Lei Jun Cuan 7 Miliar Hanya dalam Sehari dari IPO Changxin Technology? Pejabat Xiaomi Beri Respons

Pada 28 Juli, Changxin Technology, pemimpin dalam industri DRAM lokal, mencetak rekor sejarah di pasar saham A pada hari pertama pencatatannya di pasar STAR, dengan volume perdagangan harian melampaui 1 triliun yuan. Perusahaan ini mendapatkan keuntungan besar bagi pemegang saham strategisnya, termasuk pendiri Xiaomi Lei Jun. Melalui anak perusahaannya, Wuhan 1810 Enterprise Management Co., Ltd., Xiaomi dialokasikan 18,2448 juta saham dengan investasi sekitar 158 juta yuan. Berdasarkan data perusahaan, penghitungan menunjukkan bahwa posisi ini membawa keuntungan tidak terealisasi sekitar 717 juta yuan bagi Lei Jun pada hari pertama. Namun, Xu Jieyun, asisten khusus ketua dewan dan wakil manajer departemen strategi dan pemasaran Xiaomi Group, menanggapi, "Teman-teman bisa menikmatinya sebagai hiburan, jangan dianggap serius. Ini sebenarnya adalah investasi perusahaan, entitas anak perusahaan tidak bisa disamakan dengan kekayaan pribadi." Alibaba dan Nio juga mendapatkan keuntungan dari investasi di Changxin Technology. Alibaba memegang hampir 5% saham melalui dua entitas dengan investasi kumulatif 7,6 miliar yuan, menghasilkan keuntungan tidak terealisasi lebih dari 160 miliar yuan. Nio, melalui penempatan strategis, juga mendapatkan keuntungan tidak terealisasi sekitar 740 juta yuan. Changxin Technology berkantor pusat di Hefei, Anhui, dan merupakan produsen DRAM terbesar di China dan keempat terbesar di dunia. Keberhasilannya di pasar saham telah memberikan keuntungan signifikan bagi pemerintah daerah Hefei, bank-bank besar, dan perusahaan asuransi, dengan peningkatan nilai aset masing-masing mencapai triliunan yuan dan ratusan miliar yuan. Namun, ada perusahaan seperti Country Garden yang terpaksa melepas sahamnya sebelum IPO karena tekanan likuiditas, sehingga kehilangan potensi keuntungan hampir 50 miliar yuan. Penting untuk dicatat bahwa saham yang dialokasikan memiliki periode penguncian, sehingga semua keuntungan tidak terealisasi yang disebutkan di atas hanya perhitungan statis, dan keuntungan akhir akan dipengaruhi oleh fluktuasi harga saham di masa depan. Karyawan Changxin Technology menyatakan bahwa mereka lebih memperhatikan apakah gaji dan tunjangan mereka akan berubah di masa depan.

marsbit18m yang lalu

Lei Jun Cuan 7 Miliar Hanya dalam Sehari dari IPO Changxin Technology? Pejabat Xiaomi Beri Respons

marsbit18m yang lalu

Bursa Efek Tokyo Mendesak 270 Perusahaan untuk Menurunkan Ambang Masuk bagi Investor Ritel

Bursa Saham Tokyo telah meminta 270 perusahaan yang terdaftar di bursa untuk mempertimbangkan pemecahan saham. Langkah ini bertujuan menurunkan harga minimum pembelian saham bagi investor ritel. Saat ini, banyak saham di bursa tersebut diperdagangkan dalam lot 100 lembar dengan harga minimal sekitar 500.000 yen (sekitar $3.050) per lot. Investor individu menginginkan harga investasi yang lebih rendah, di kisaran 100.000 yen per lot. Untuk memfasilitasi investasi skala kecil ini, Bursa Tokyo telah membentuk Kelompok Kerja Promosi Investasi Kecil yang akan mulai bersidang pada Oktober guna merancang langkah-langkah konkret. Data menunjukkan, dari 276 perusahaan yang memecah saham dalam setahun terakhir hingga 30 Juni, sekitar 70% menargetkan harga lot ratusan ribu yen. Sebelum pemecahan, 45% perusahaan dalam grup itu memiliki lot seharga 500.000 yen atau lebih. Setelah pemecahan, angkanya turun drastis menjadi hanya 2%. Secara keseluruhan, 762 perusahaan telah memutuskan untuk melakukan stock split sejak permintaan serupa dari Bursa Tokyo pada Oktober 2022. Beberapa perusahaan, seperti Tokyo Electron dan Organo, sudah menjadwalkan pemecahan saham pada 1 Oktober mendatang, yang akan secara signifikan menurunkan harga per lot saham mereka.

cryptonews.ru28m yang lalu

Bursa Efek Tokyo Mendesak 270 Perusahaan untuk Menurunkan Ambang Masuk bagi Investor Ritel

cryptonews.ru28m yang lalu

Trading

Spot

Artikel Populer

Cara Membeli ERA

Selamat datang di HTX.com! Kami telah membuat pembelian Caldera (ERA) menjadi mudah dan nyaman. Ikuti panduan langkah demi langkah kami untuk memulai perjalanan kripto Anda.Langkah 1: Buat Akun HTX AndaGunakan alamat email atau nomor ponsel Anda untuk mendaftar akun gratis di HTX. Rasakan perjalanan pendaftaran yang mudah dan buka semua fitur.Dapatkan Akun SayaLangkah 2: Buka Beli Kripto, lalu Pilih Metode Pembayaran AndaKartu Kredit/Debit: Gunakan Visa atau Mastercard Anda untuk membeli Caldera (ERA) secara instan.Saldo: Gunakan dana dari saldo akun HTX Anda untuk melakukan trading dengan lancar.Pihak Ketiga: Kami telah menambahkan metode pembayaran populer seperti Google Pay dan Apple Pay untuk meningkatkan kenyamanan.P2P: Lakukan trading langsung dengan pengguna lain di HTX.Over-the-Counter (OTC): Kami menawarkan layanan yang dibuat khusus dan kurs yang kompetitif bagi para trader.Langkah 3: Simpan Caldera (ERA) AndaSetelah melakukan pembelian, simpan Caldera (ERA) di akun HTX Anda. Selain itu, Anda dapat mengirimkannya ke tempat lain melalui transfer blockchain atau menggunakannya untuk memperdagangkan mata uang kripto lainnya.Langkah 4: Lakukan trading Caldera (ERA)Lakukan trading Caldera (ERA) dengan mudah di pasar spot HTX. Cukup akses akun Anda, pilih pasangan perdagangan, jalankan trading, lalu pantau secara real-time. Kami menawarkan pengalaman yang ramah pengguna baik untuk pemula maupun trader berpengalaman.

1.1k Total TayanganDipublikasikan pada 2025.07.17Diperbarui pada 2026.06.02

Diskusi

Selamat datang di Komunitas HTX. Di sini, Anda bisa terus mendapatkan informasi terbaru tentang perkembangan platform terkini dan mendapatkan akses ke wawasan pasar profesional. Pendapat pengguna mengenai harga ERA (ERA) disajikan di bawah ini.