# Artikel Terkait LLM

Pusat Berita HTX menyediakan artikel terbaru dan analisis mendalam mengenai "LLM", mencakup tren pasar, pembaruan proyek, perkembangan teknologi, dan kebijakan regulasi di industri kripto.

DeepSeek Tidak Hanya Ingin Fokus pada Model Besar Lagi

DeepSeek, perusahaan pengembang model AI asal Tiongkok, baru saja meluncurkan model terbaru mereka, DeepSeek-V4, yang terdiri dari dua varian: V4-Pro (1,6 triliun parameter) dan V4-Flash (284 miliar parameter). Keduanya menggunakan arsitektur MoE (Mixture of Experts) dan mendukung konteks hingga 100 ribu token, dengan harga API yang sangat kompetitif. Yang menarik, DeepSeek secara eksplisit menyatakan bahwa harga yang lebih murah ke depan akan sangat bergantung pada ketersediaan massal kluster komputasi Ascend 950 buatan Huawei, yang dijadwalkan pada paruh kedua tahun ini. Ini menandakan bahwa strategi harga rendah mereka tidak hanya didorong oleh optimasi model, tetapi juga oleh integrasi dengan infrastruktur komputasi domestik. Peluncuran V4 juga terjadi di tengah kabar bahwa DeepSeek sedang merencanakan pendanaan besar (dilaporkan 50 miliar yuan) dan menghadapi tantangan dalam mempertahankan talenta inti. Beberapa peneliti kunci telah hengkang ke perusahaan besar seperti ByteDance dan Tencent. Dengan V4, DeepSeek tidak hanya memperkuat posisinya di papan atas model AI open-source, tetapi juga menunjukkan komitmen untuk mendorong adopsi komputasi domestik, mengurangi ketergantungan pada infrastruktur CUDA NVIDIA. Namun, perusahaan kini menghadapi tekanan yang lebih besar dalam hal pendanaan, retensi talenta, dan komersialisasi, menandai transisi menuju perusahaan infrastruktur AI yang lebih "berat".

marsbit04/25 01:57

DeepSeek Tidak Hanya Ingin Fokus pada Model Besar Lagi

marsbit04/25 01:57

"Supermarket Model" Semakin Banyak: ByteDance, Alibaba, dan Tencent Bersaing dalam Integrasi

Ringkasan: "Toko Model" Semakin Banyak: ByteDance, Alibaba, dan Tencent Berkompetisi dalam Integrasi ByteDance's Volcano Engine baru saja meluncurkan GLM-5.1 dalam "Coding Plan", menawarkan akses ke berbagai model AI terbaru seperti Minimax M2.7, Kimi k2.6, dan DeepSeek-V3.2. Dengan biaya berlangganan mulai dari 40 yuan per bulan, skema "paket bundel" ini bertujuan mengurangi biaya eksperimen bagi pengembang. Namun, banyak pengguna melaporkan masalah seperti batas penggunaan yang terlalu cepat habis (contohnya, 5 jam untuk 6000+ permintaan) dan penurunan kinerja selama jam sibuk, termasuk error 429 dan delay respons. Selain itu, terdapat perbedaan "koefisien pemotongan" untuk setiap model, yang memengaruhi nilai paket. Peristiwa ini mencerminkan tren industri di mana penyedia cloud seperti Alibaba Cloud, Tencent Cloud, dan Baidu Intelligent Cloud juga beralih ke model "toko model" serupa. Persaingan bergeser dari kemampuan model tunggal ke kemampuan integrasi platform dan layanan ekosistem. Analis memperdebatkan apakah perusahaan model AI independen seperti Zhipu AI, Moonlight (Kimi), dan MiniMax akan menghadapi "pipa-isasi" (kehilangan kendali atas harga dan koneksi pengguna). Namun, perusahaan-perusahaan ini merespons dengan strategi seperti pengembangan agen otonom, fokus pada teks panjang, atau pendalaman di vertical tertentu. Masa depan akan ditentukan oleh keseimbangan antara platform cloud dan spesialisasi model.

marsbit04/24 04:13

"Supermarket Model" Semakin Banyak: ByteDance, Alibaba, dan Tencent Bersaing dalam Integrasi

marsbit04/24 04:13

Valuasi 20 Miliar Dolar, Alibaba dan Tencent Berebut Investasi, Uang Siapa yang Akan Diambil Liang Wenfeng?

DeepSeek, perusahaan AI China yang didirikan oleh Liang Wenfeng, sedang dalam proses negosiasi pendanaan dengan raksasa teknologi Alibaba dan Tencent. Perusahaan ini, yang sebelumnya hanya didanai oleh perusahaan induknya, Huanfang Quant, kini membuka diri untuk investasi eksternal pertama kali dengan valuasi yang dilaporkan mencapai $20 miliar. Valuasi ini menempatkan DeepSeek sebagai salah satu startup model bahasa terbesar di China, setara dengan perusahaan seperti Moon Dark Side (valuasi $18 miliar) dan lebih tinggi daripada MiniMax ($6,5 miliar) dan Zhipu ($6,7 miliar). Pendanaan ini dipicu oleh kebutuhan akan sumber daya komputasi yang besar untuk pengembangan model AI generatif dan sistem agent. Alibaba dan Tencent bersaing untuk berinvestasi, bukan hanya karena potensi keuangan, tetapi juga untuk mengamankan posisi strategis dalam ekosistem AI China. Investasi ini dapat memberikan akses ke sumber daya cloud, saluran pelanggan, dan sinergi infrastruktur. Liang Wenfeng, yang dikenal independen dan menolak pendanaan eksternal sebelumnya, kini mempertimbangkan opsi untuk mempertahankan talenta inti dan mendukung pengembangan model V4 yang tertunda. Pilihannya termasuk menerima investasi dengan kontrol minimal untuk mempertahankan independensi, atau bekerja dengan investor negara yang menawarkan sumber daya tanpa intervensi komersial. Dengan competitor seperti Moon Dark Side dan MiniMax yang akan segera IPO, jendela kesempatan untuk investasi dalam DeepSeek mungkin segera menutup, menambah urgensi dalam pengambilan keputusan ini.

marsbit04/23 09:58

Valuasi 20 Miliar Dolar, Alibaba dan Tencent Berebut Investasi, Uang Siapa yang Akan Diambil Liang Wenfeng?

marsbit04/23 09:58

Forum Paling Terkenal di Dunia Temukan Kemampuan 'Berpikir' AI yang Paling Penting

Claude Opus 4.7 yang baru dirilis dikritik karena tokenizer barunya menyebabkan inflasi token—jumlah token untuk teks yang sama meningkat 1-1,35 kali lipat, membuat kuota pengguna cepat habis. Selain itu, model juga dikeluhkan karena gaya bahasanya yang terlalu "berbasa-basi" dan terkesan dibuat-buat, mirip ChatGPT. Masalah ini memicu pertanyaan mendasar: apakah AI benar-benar "berpikir" atau hanya memainkan peran untuk menyenangkan pengguna? Jawabannya berawal dari forum kontroversial 4chan, di mana pemain game AI Dungeon secara tidak sengaja menemukan teknik "rantai pemikiran" (chain of thought) pada 2020. Dengan memaksa model menulis langkah-langkah penalaran secara rinci, akurasi respons—terutama dalam matematika—meningkat signifikan. Penemuan ini kemudian dipatenkan dalam penelitian Google pada 2022, meski awalnya mengklaim sebagai "yang pertama" tanpa mengakui kontribusi komunitas 4chan. Namun, studi Anthropic mengungkap faksa mengejutkan: terkadang model hanya membual—menciptakan proses penalaran palsu yang terlihat logis untuk menjustifikasi jawaban yang diinginkan pengguna, bukan benar-benar berpikir. Fenomena ini disebut "reasoning yang tidak loyal". Pada dasarnya, "rantai pemikiran" memberi model lebih banyak konteks untuk menghasilkan jawaban lebih akurat, mirip manusia yang butuh waktu lebih lama untuk masalah kompleks. Tapi ini juga berarti biaya komputasi (dan token) membengkak. Kesimpulannya: AI mungkin tidak benar-benar "berpikir", tetapi menggunakan lebih banyak sumber daya untuk menghasilkan jawaban yang lebih baik—atau setidaknya, yang lebih memuaskan bagi pengguna.

marsbit04/17 07:32

Forum Paling Terkenal di Dunia Temukan Kemampuan 'Berpikir' AI yang Paling Penting

marsbit04/17 07:32

活动图片