# Artikel Terkait Arsitektur

Pusat Berita HTX menyediakan artikel terbaru dan analisis mendalam mengenai "Arsitektur", mencakup tren pasar, pembaruan proyek, perkembangan teknologi, dan kebijakan regulasi di industri kripto.

Mengapa Zhipu AI Bisa Meroket Hampir 30% dalam Satu Hari?

Hari ini, saham "Glodon" (02513.HK), yang dijuluki "saham model besar global pertama", melonjak hampir 30%. Pemicu utamanya adalah peluncuran API "GLM-5.1-highspeed" yang menawarkan kecepatan generasi hingga 400 token per detik, mencatat rekor baru untuk API model besar. Kecepatan ini sangat penting karena pergeseran paradigma dari AI chatbot ke era Agen (Agent), di mana tugas kompleks memerlukan puluhan hingga ratusan panggilan model. Setiap penghematan latensi akan terakumulasi dan secara signifikan memengaruhi efisiensi keseluruhan. Pencapaian 400 token/detik ini kira-kira 3-5 kali lebih cepat dari rata-rata industri (OpenAI GPT-4o: 100-150, Claude Sonnet: 80-120) dan dicapai tanpa mengorbankan kemampuan model inti. Lonjakan performa ini didukung oleh tiga inovasi teknis: 1. **TileRT**: Mesin inferensi yang mengkompilasi seluruh model menjadi pipeline kontinu, menghilangkan overhead start/stop antar operator dan menerapkan "Warp Specialization" untuk paralelisasi optimal dalam GPU. 2. **Strategi Paralel Heterogen untuk MLA (Multi-head Latent Attention)**: Mengatasi tantangan komputasi sparse dalam mekanisme perhatian MLA dengan menugaskan GPU berbeda untuk tugas "pengindeksan" dan "komputasi padat", meminimalkan sinkronisasi. 3. **Arsitektur Jaringan ZCube**: Mengganti topologi jaringan standar ROFT (Fat-Tree) dengan desain datar tanpa lapisan Spine. Desain ini menciptakan "jalur tunggal optimal" antara GPU mana pun, secara fundamental menghilangkan kemacetan jaringan. Hasilnya, pada perangkat keras yang sama, ZCube meningkatkan throughput cluster sebesar 15% (setara dengan peningkatan kapasitas gratis), mengurangi latensi ekor sebesar 40,6% (meningkatkan stabilitas), dan memotong biaya perangkat jaringan hingga sepertiga. Secara jangka panjang, inovasi perangkat lunak ini berpotensi mengikis dominasi NVIDIA di ekosistem jaringan (seperti InfiniBand) dan membuka jalan bagi integrasi yang lebih mudah dengan chip AI domestik seperti Huawei Ascend.

marsbitKemarin 01:26

Mengapa Zhipu AI Bisa Meroket Hampir 30% dalam Satu Hari?

marsbitKemarin 01:26

Sepuluh Tahun Bertaruh pada Cerebras: Bagaimana "Chip AI Skala Wafer" Melantai di Nasdaq

**Ringkasan: Sepuluh Tahun Bertaruh pada Cerebras – Bagaimana Chip AI Tingkat Wafer Mencapai Nasdaq** Pada 14 Mei, Cerebras Systems resmi melantai di Nasdaq (CBRS), dengan harga saham naik 68% di hari pertama, menjadi salah satu IPO perangkat keras AI paling diperhatikan sejak 2026. Artikel ini ditulis oleh Steve Vassallo, investor awal Cerebras, yang merefleksikan kemitraan 19 tahun dengan pendiri Andrew Feldman, dari SeaMicro hingga Cerebras. Kisahnya bukan sekadar tentang investasi, tetapi tentang bagaimana sebuah perusahaan perangkat keras mutakhir berani merekonstruksi arsitektur komputasi AI dari dasar selama masa ketika GPU dianggap sebagai jawaban default. Ketika GPU mendominasi pelatihan AI, tim Cerebras – Andrew Feldman, Gary Lauterbach, Sean Lie, Michael James, dan Jean-Philippe Fricker – melihat batasan mendasar: hambatan bandwidth memori, bukan sekadar kekuatan komputasi mentah. Mereka memilih jalur yang berlawanan dengan arus industri: merancang chip tingkat wafer (wafer-scale) yang 58 kali lebih besar dari chip terbesar saat itu, secara efektif menciptakan ulang setiap aspek sistem komputasi modern mulai dari semikonduktor, daya, pendinginan, hingga perangkat lunak. Perjalanan mereka penuh tantangan teknis ekstrem, termasuk prototipe pertama yang terbakar ("peristiwa termal"). Kesuksesan datang melalui disiplin, ketekunan, dan kepercayaan yang dibangun dalam hubungan jangka panjang dan non-transaksional antara pendiri dan investor. Andrew Feldman digerakkan oleh ambisi untuk menciptakan lompatan 1000x, bukan peningkatan bertahap. Latar belakangnya yang tumbuh di lingkungan jenius membentuk keyakinannya bahwa kecerdasan sejati berjalan seiring dengan kebaikan. Prinsip ini membentuk budaya timnya, di mana sekitar 100 dari 700 karyawan Cerebras telah mengikutinya melalui berbagai perusahaan. Dari term sheet pertama yang diserahkan secara simbolis dengan melompati pagar halaman belakang pada 2016, hingga IPO pada 2026, Cerebras membuktikan bahwa revolusi komputasi AI tidak hanya tentang menumpuk lebih banyak GPU, tetapi juga tentang keberanian untuk membayangkan ulang arsitektur komputasi itu sendiri. Mereka adalah "David" yang mengalahkan "Goliath" dengan berinovasi di tempat dan cara yang tidak terduga oleh raksasa industri.

marsbit05/15 04:00

Sepuluh Tahun Bertaruh pada Cerebras: Bagaimana "Chip AI Skala Wafer" Melantai di Nasdaq

marsbit05/15 04:00

Ant Digital Technology Pertama Kali Mengusulkan Arsitektur Baru Ekonomi Agen Cerdas, Meliputi Empat Aspek: Identitas, Pembayaran, Manajemen Risiko, dan Kepatuhan

Ant Digital Technologies (Ant Digital) memperkenalkan arsitektur ekonomi agen cerdas "4R Full-Stack" pada Web3 Festival Hong Kong. Arsitektur ini mencakup empat lapisan: Agentic Runtime, Payment Rails, Agent Registry, dan Root Infrastructure, yang bertujuan menyediakan infrastruktur teknis untuk identitas, pembayaran, manajemen risiko, dan kepatuhan bagi agen AI. CTO Ant Digital, Yan Ying, menyoroti empat celah dalam ekonomi agen cerdas saat ini: kelemahan logis dalam eksekusi, kurangnya identitas tepercaya untuk AI, hambatan transaksi karena sistem pembayaran yang dirancang untuk manusia, dan risiko kolaborasi antar agen yang tidak dikenal. Solusinya memerlukan desain ulang infrastruktur dasar. Lapisan Agentic Runtime menampilkan DTClaw dengan model keamanan CARLI untuk mengontrol perilaku agen. Payment Rails membangun saluran pembayaran on-chain yang aman dan transparan, mendukung transaksi mikro cepat dan multiaset. Agent Registry menggunakan DID dan standar ERC-8004 untuk identitas on-chain, sementara Root Infrastructure memanfaatkan Jovay Layer2 dan ZKVM untuk konfirmasi cepat dan kepercayaan komputasi. Yan Ying menekankan bahwa AI kini memasuki era ekonomi agen dengan kemampuan memiliki aset dan bertransaksi. Arsitektur 4R dibangun berdasarkan pengalaman Ant Digital dalam keamanan finansial, komputasi privasi, blockchain, dan kepatuhan.

marsbit04/20 09:26

Ant Digital Technology Pertama Kali Mengusulkan Arsitektur Baru Ekonomi Agen Cerdas, Meliputi Empat Aspek: Identitas, Pembayaran, Manajemen Risiko, dan Kepatuhan

marsbit04/20 09:26

活动图片