# Artikel Terkait Alat Tukar

Pusat Berita HTX menyediakan artikel terbaru dan analisis mendalam mengenai "Alat Tukar", mencakup tren pasar, pembaruan proyek, perkembangan teknologi, dan kebijakan regulasi di industri kripto.

NVIDIA Merilis MoE Baru: Tambah Satu Baris 'import', Kecepatan Fine-tuning Meningkat 3.7x

Dengan hanya menambahkan satu baris import, NeMo AutoModel NVIDIA mempercepat fine-tuning model MoE hingga 3,7 kali lipat dan mengurangi penggunaan memori GPU sebesar 29%-32%. Solusi ini kompatibel dengan API Hugging Face Transformers v5, sehingga tidak perlu mengubah kode secara signifikan. Teknologi utamanya mencakup Expert Parallelism (EP) untuk mendistribusikan bobot ahli ke beberapa GPU, DeepEP untuk menggabungkan komputasi dan komunikasi, serta TransformerEngine untuk mempercepat operasi inti. Dalam pengujian pada model Qwen3-30B-A3B dan Nemotron 3 Nano 30B-A3B, throughput pelatihan meningkat 3,4-3,7 kali. Untuk model skala besar seperti Nemotron 3 Ultra 550B, solusi ini tetap dapat dijalankan tanpa kehabisan memori. Kode dan panduan telah tersedia open-source di GitHub NVIDIA.

marsbit06/26 07:30

NVIDIA Merilis MoE Baru: Tambah Satu Baris 'import', Kecepatan Fine-tuning Meningkat 3.7x

marsbit06/26 07:30

Setelah 10 Tahun Menunggu, Akhirnya Altman Mendapatkan Orang yang Diinginkannya

Setelah dua tahun kembali ke Google dengan nilai akuisisi senilai $27 miliar, legenda AI Noam Shazeer mengumumkan kepergiannya untuk bergabung dengan OpenAI. Shazeer, salah satu penulis utama makalah revolusioner "Attention Is All You Need" yang melahirkan arsitektur Transformer, dikonfirmasi akan menjabat sebagai Kepala Penelitian Arsitektur di OpenAI. CEO OpenAI Sam Altman menyambut kabar ini dengan menyatakan bahwa Shazeer telah menjadi salah satu orang yang paling ingin diajak kerjasama sejak awal pendirian OpenAI, sebuah proses yang memakan waktu 10 tahun. Para peneliti utama OpenAI juga menyambut hangat, menyoroti kontribusi mendalam Shazeer dalam Transformer, MoE (Mixture of Experts), dan decoding efisien yang membentuk perkembangan AI modern. Shazeer, salah satu karyawan penting awal Google, sebelumnya pernah meninggalkan perusahaan pada 2021 karena kekecewaan terhadap birokrasi dan mendirikan Character.AI. Ia direkrut kembali oleh Google DeepMind pada 2024 dan ditunjuk sebagai salah satu pemimpin teknis proyek inti Gemini. Kepergiannya dalam waktu kurang dari dua tahun dianggap sebagai pukulan signifikan bagi pengembangan Gemini, memicu komentar miring mengenai masa depan model tersebut. Perpindahan Shazeer ini dilihat sebagai kemenangan besar bagi OpenAI dalam perebutan bakat AI.

marsbit06/18 04:17

Setelah 10 Tahun Menunggu, Akhirnya Altman Mendapatkan Orang yang Diinginkannya

marsbit06/18 04:17

Menjalankan MoE di Ponsel? Meta Mengusulkan MobileMoE, iPhone 16 Pro Dipercepat 3,8 Kali Lipat

Meta memperkenalkan MobileMoE, campuran model ahli (MoE) pertama yang dirancang untuk inferensi efisien di smartphone. Mengganti lapisan feed-forward padat dengan MoE, MobileMoE-S/M mencapai akurasi setara atau lebih tinggi dengan hanya 1/2 hingga 1/4 komputasi inferensi model padat dalam 14 tes dasar. Di iPhone 16 Pro, MobileMoE-S mempercepat inferensi hingga 3.8x pada fase input. Model ini dilatih dalam empat tahap: pra-pelatihan, pelatihan menengah, fine-tuning terawasi, dan pelatihan aware-kuantisasi (kuantisasi INT4/INT8). Konfigurasi optimal menggunakan 8 ahli dengan granularitas 8, routing Top-4, dan 1 ahli bersama. Dalam evaluasi, MobileMoE mengungguli model seperti Qwen3.5 2B dan OLMoE-1B-7B dalam skala parameter lebih kecil, terutama unggul dalam tugas kode dan matematika. Setelah kuantisasi INT4, kinerja tetap kompetitif. Di perangkat Samsung Galaxy S25 dan iPhone 16 Pro, MobileMoE menunjukkan peningkatan kecepatan signifikan dan penggunaan memori lebih rendah dibanding baseline. Tantangan ke depan mencakup peningkatan kemampuan penalaran, eksplorasi NPU, dan optimasi memori dinamis untuk routing MoE di perangkat seluler.

marsbit06/01 06:11

Menjalankan MoE di Ponsel? Meta Mengusulkan MobileMoE, iPhone 16 Pro Dipercepat 3,8 Kali Lipat

marsbit06/01 06:11

Jalan DeepSeek Menuju 10 Triliun Dolar AS: Mengungkit Ekosistem Perangkat Keras Bernilai Triliunan dengan Open Source

Artikel ini menganalisis strategi jangka panjang DeepSeek, yang diyakini tidak berfokus pada monetisasi aplikasi langsung seperti langganan atau model multimodal. Sebagai gantinya, tujuan utamanya adalah membentuk ekosistem perangkat keras AI alternatif senilai $10 triliun, yang pada akhirnya akan mendorong valuasi DeepSeek sendiri menjadi $1 triliun. Strategi ini didorong oleh serangkaian inovasi mendalam yang dirancang untuk mengurangi ketergantungan pada komputasi dan memori tinggi (seperti HBM) yang saat ini didominasi oleh teknologi Barat. Inovasi seperti MoE, MLA, DSA, CSA, dan Engram secara signifikan mengkompresi kebutuhan KV Cache (hingga 5.48GB untuk konteks 1 juta token pada DeepSeek V4 vs 60-89GB pada model lain), mengurangi beban pada GPU/ASIC, dan mengalihkan beban ke memori yang lebih terjangkau seperti SSD/NAND (diproduksi YMTC) dan LPDDR (diproduksi CXMT). Dengan menurunkan kebutuhan komputasi puncak dan memanfaatkan memori yang melimpah di China, DeepSeek membuka jalan bagi penggunaan GPU dan ASIC domestik serta vendor baru di Barat. Inovasi seperti TileLang juga bertujuan untuk melemahkan ketergantungan pada ekosistem CUDA. DeepSeek diperkirakan akan membentuk kemitraan strategis dan mendapatkan kepemilikan saham di perusahaan perangkat keras China, mirip dengan cara OpenAI berkolaborasi dengan AMD dan Cerebras, sebagai model monetisasi utamanya alih-alih pendapatan langganan tradisional.

marsbit05/25 13:18

Jalan DeepSeek Menuju 10 Triliun Dolar AS: Mengungkit Ekosistem Perangkat Keras Bernilai Triliunan dengan Open Source

marsbit05/25 13:18

Keterbatasan Komputasi, Apa yang Membuat DeepSeek-V4 Berani Open Source?

DeepSeek meluncurkan model bahasa besar (LLM) terbaru mereka, DeepSeek-V4, dalam versi pratinjau yang juga bersifat open source. Model ini menawarkan kemampuan konteks ultra-panjang hingga 1 juta token, yang sebelumnya hanya tersedia di layanan berbayar perusahaan teknologi besar. Namun, DeepSeek secara terbuka mengakui keterbatasan throughput layanan Pro-nya karena kendala komputasi high-end. V4-Pro, dengan 1.6T parameter total namun hanya mengaktifkan 49B parameter selama inferensi, menunjukkan kinerja kuat dalam tugas-tugas seperti pemrograman dan penalaran. Ini dicapai melalui optimasi arsitektur yang mendalam, termasuk mekanisme perhatian yang disempurnakan dan teknik sparse attention. Sementara itu, versi Flash, dengan 284B parameter total dan hanya 13B parameter yang diaktifkan, dirancang untuk efisiensi. Ini memungkinkan operasi pada perangkat keras komputasi yang lebih terjangkau dan membuka peluang untuk adopsi yang lebih luas oleh pengembang dan bisnis skala menengah. DeepSeek juga berfokus pada adaptasi dengan chip komputasi domestik Tiongkok, seperti Ascend dari Huawei dan Cambricon, meskipun tantangan dalam kinerja dan pasokan perangkat keras tetap ada. Peluncuran ini juga dilihat sebagai respons strategis terhadap persaingan pasar yang ketat dan pergantian personel inti, menunjukkan ketahanan perusahaan dalam melanjutkan inovasi teknis.

marsbit04/26 00:31

Keterbatasan Komputasi, Apa yang Membuat DeepSeek-V4 Berani Open Source?

marsbit04/26 00:31

Nilai Sebenarnya DeepSeek V4 Tidak Terletak pada Parameternya

DeepSeek V4 telah melampaui sekadar perdebatan parameter teknis, dan menunjukkan nilai strategisnya dalam adaptasi komputasi lokal Tiongkok. Model ini berhasil dijalankan secara efisien pada chip domestik seperti Huawei Ascend 910B dan Cambricon, mengatasi tantangan ekosistem perangkat lunak yang masih berkembang. Dengan arsitektur MoE dan mekanisme perhatian hybrid CSA+HCA, V4 mengoptimalkan penggunaan memori dan komputasi, mengurangi beban inferensi pada hardware lokal. Hal ini memungkinkan konteks panjang 1M token diproses dengan biaya lebih rendah, bahkan menawarkan harga yang kompetitif dibandingkan model sejenis. Keberhasilan adaptasi ini membuka jalan bagi perusahaan Tiongkok untuk mengurangi ketergantungan pada NVIDIA, terutama dalam inferensi skala besar—langkah kritis menuju otonomi AI yang berkelanjutan di tengah ketidakpastian pasokan global.

marsbit04/25 08:12

Nilai Sebenarnya DeepSeek V4 Tidak Terletak pada Parameternya

marsbit04/25 08:12

DeepSeek Tidak Hanya Ingin Fokus pada Model Besar Lagi

DeepSeek, perusahaan pengembang model AI asal Tiongkok, baru saja meluncurkan model terbaru mereka, DeepSeek-V4, yang terdiri dari dua varian: V4-Pro (1,6 triliun parameter) dan V4-Flash (284 miliar parameter). Keduanya menggunakan arsitektur MoE (Mixture of Experts) dan mendukung konteks hingga 100 ribu token, dengan harga API yang sangat kompetitif. Yang menarik, DeepSeek secara eksplisit menyatakan bahwa harga yang lebih murah ke depan akan sangat bergantung pada ketersediaan massal kluster komputasi Ascend 950 buatan Huawei, yang dijadwalkan pada paruh kedua tahun ini. Ini menandakan bahwa strategi harga rendah mereka tidak hanya didorong oleh optimasi model, tetapi juga oleh integrasi dengan infrastruktur komputasi domestik. Peluncuran V4 juga terjadi di tengah kabar bahwa DeepSeek sedang merencanakan pendanaan besar (dilaporkan 50 miliar yuan) dan menghadapi tantangan dalam mempertahankan talenta inti. Beberapa peneliti kunci telah hengkang ke perusahaan besar seperti ByteDance dan Tencent. Dengan V4, DeepSeek tidak hanya memperkuat posisinya di papan atas model AI open-source, tetapi juga menunjukkan komitmen untuk mendorong adopsi komputasi domestik, mengurangi ketergantungan pada infrastruktur CUDA NVIDIA. Namun, perusahaan kini menghadapi tekanan yang lebih besar dalam hal pendanaan, retensi talenta, dan komersialisasi, menandai transisi menuju perusahaan infrastruktur AI yang lebih "berat".

marsbit04/25 01:57

DeepSeek Tidak Hanya Ingin Fokus pada Model Besar Lagi

marsbit04/25 01:57

88 Hari Yao Shunyu

Artikel ini menceritakan perjalanan Yao Shunyu dalam 88 hari memimpin transformasi model AI Tencent, Hunyuan. Setelah kritik internal tentang kelambatan dan ketidakefektifan model sebelumnya, Tencent melakukan perubahan drastis. Yao, ilmuwan AI 27 tahun lulusan Princeton dan mantan peneliti OpenAI, ditunjuk memimpin restrukturisasi menyeluruh. Dibawahnya, Tencent membentuk departemen AI Infra dan bahasa model baru, membubarkan AI Lab lama, dan memusatkan semua penelitian AI pada pengembangan Hunyuan. Hasilnya adalah peluncuran Hy3 Preview dalam kurang dari 3 bulan - model MoE dengan 295B parameter yang didesain bersama produk nyata Tencent. Perubahan kunci adalah pergeseran dari sekadar mengejar skor benchmark menjadi fokus pada aplikasi praktis di ekosistem Tencent seperti WeChat, game, dan layanan enterprise. Model ini sudah diuji di produk inti sebelum rilis, menandakan pendekatan "co-design" yang baru. Meski menghadapi persaingan ketat dari Alibaba, DeepSeek, dan lainnya, transformasi organisasi ini menunjukkan komitmen Tencent untuk membangun fondasi AI yang solid, bukan hanya mengejar tren. Intinya: Hunyuan kini fokus pada nilai nyata, bukan sekadar parameter.

marsbit04/23 11:18

marsbit04/23 11:18

Model Besar China: Kali Ini Skenarionya Berbeda

Analisis platform OpenRouter menunjukkan bahwa model AI China, seperti MiMo-V2-Pro (Xiaomi) dan Step 3.5 Flash (StepFun), mendominasi 6 dari 10 besar model yang paling banyak digunakan per April 2026, dengan China unggul dalam volume token sejak Februari 2026. Keberhasilan ini didorong oleh keunggulan harga signifikan—model China 10–60 kali lebih murah daripada model AS seperti GPT-5.4 dan Claude Opus—serta peningkatan kemampuan teknis, terutama dalam tugas pemrograman, di mana kesenjangan dengan model AS kurang dari 1% dalam evaluasi SWE-Bench. Aplikasi agent seperti OpenClaw ("Lobster") yang membutuhkan konsumsi token masif (hingga puluhan ribu per tugas) mempercepat peralihan pengembang global ke model China demi efisiensi biaya. Meski unggul dalam tugas eksekusi, model China masih tertinggal dalam penalaran kompleks dibandingkan model AS. Menanggapi lonjakan permintaan, perusahaan China seperti Zhipu dan Tencent menaikkan harga API (hingga 460%) pada 2026, namun volume penggunaan tetap tumbuh. Pakar menilai China memimpin dalam adopsi aplikasi AI, tetapi perlu inovasi orisinal dalam algoritma dasar. Berbeda dengan industri manufaktur tradisional, model China menunjukkan kemampuan mempertahankan permintaan meski harga naik, mencerminkan peningkatan daya saing dan nilai strategis dalam rantai AI global.

marsbit04/07 11:04

Model Besar China: Kali Ini Skenarionya Berbeda

marsbit04/07 11:04

Gemma 4 Model Besar Sumber Terbuka Google Akan Segera Diumumkan: Jumlah Parameter Naik 4 Kali Lipat

Dalam lanskap model AI open source yang didominasi perusahaan China, Google bersiap meluncurkan Gemma 4, model open source terbaru. CEO DeepMind Demis Hassabis memberikan sinyal peluncuran melalui ikon "empat berlian" di media sosial. Gemma 4 menawarkan peningkatan signifikan: - Skala parameter 120B, empat kali lipat dari generasi sebelumnya - Mengadopsi arsitektur MoE (Mixture of Experts) dengan hanya 15B parameter aktif - Peningkatan kemampuan kontekstual 1-2 kali lipat dan penalaran logika yang lebih dalam Strategi Google berfokus pada: - Menjaga pengaruh di komunitas open source sambil melindungi model closed-source komersial - Fokus pada pengalaman lokal/perangkat untuk bersaing dengan model open source China Kompetisi model open source kini memasuki era "parameter dan efisiensi". Gemma 4 dipandang sebagai penantang serius bagi model open source China, dengan hasil yang akan menjadi fokus komunitas AI global.

marsbit04/02 06:47

Gemma 4 Model Besar Sumber Terbuka Google Akan Segera Diumumkan: Jumlah Parameter Naik 4 Kali Lipat

marsbit04/02 06:47

# Artikel Terkait Alat Tukar

NVIDIA Merilis MoE Baru: Tambah Satu Baris 'import', Kecepatan Fine-tuning Meningkat 3.7x

Setelah 10 Tahun Menunggu, Akhirnya Altman Mendapatkan Orang yang Diinginkannya

Menjalankan MoE di Ponsel? Meta Mengusulkan MobileMoE, iPhone 16 Pro Dipercepat 3,8 Kali Lipat

Jalan DeepSeek Menuju 10 Triliun Dolar AS: Mengungkit Ekosistem Perangkat Keras Bernilai Triliunan dengan Open Source

Keterbatasan Komputasi, Apa yang Membuat DeepSeek-V4 Berani Open Source?

Nilai Sebenarnya DeepSeek V4 Tidak Terletak pada Parameternya

DeepSeek Tidak Hanya Ingin Fokus pada Model Besar Lagi

88 Hari Yao Shunyu

Model Besar China: Kali Ini Skenarionya Berbeda

Gemma 4 Model Besar Sumber Terbuka Google Akan Segera Diumumkan: Jumlah Parameter Naik 4 Kali Lipat

Kategori Populer

Tag Populer