DeepSeek V4 Akhirnya Dirilis, Menghancurkan Monopoli Sumber Tertutup Terkuat, Secara Tegas Berkolaborasi dengan Chip Huawei

marsbitDipublikasikan tanggal 2026-04-24Terakhir diperbarui pada 2026-04-24

Abstrak

DeepSeek V4 telah resmi dirilis dalam dua versi: **DeepSeek-V4-Pro** (49B, 1.6T token) dan **DeepSeek-V4-Flash** (13B, 284B token), keduanya mendukung konteks hingga **1 juta token**. Model ini diklaim unggul dalam kemampuan Agent, pengetahuan dunia, dan penalaran, bahkan bersaing dengan model tertutup terkemuka seperti Claude Opus dan Gemini. V4-Pro menunjukkan performa setara dengan Sonnet 4.5 dan mendekati Opus 4.6 dalam tugas coding, sementara V4-Flash menawarkan efisiensi lebih tinggi dengan harga API lebih terjangkau. DeepSeek V4 juga mengintegrasikan mekanisme perhatian baru yang mengurangi kebutuhan komputasi untuk konteks panjang. API sudah tersedia dengan antarmuka OpenAI dan Anthropic, serta rencananya akan mendukung chip Huawei pada paruh kedua tahun ini. Model ini dapat diakses secara open-source di Hugging Face dan ModelScope.

Baru saja, DeepSeek-V4 hadir!

Versi pratinjau resmi diluncurkan dan disinkronkan sebagai sumber terbuka.

Total ada dua versi:

DeepSeek-V4-Pro: Setara dengan model sumber tertutup teratas, 1.6T, 49B aktivasi, panjang konteks 1M;

DeepSeek-V4-Flash: Versi ekonomis yang lebih kecil dan lebih cepat, 284B, 13B aktivasi, panjang konteks 1M.

Pernyataan resmi adalah: Dalam kemampuan Agent, pengetahuan dunia, dan kinerja penalaran, semuanya mencapai kepemimpinan di dalam negeri dan bidang sumber terbuka.

Dan:

Saat ini DeepSeek-V4 telah menjadi model Agentic Coding yang digunakan oleh karyawan internal perusahaan. Menurut umpan balik evaluasi, pengalaman penggunaannya lebih baik daripada Sonnet 4.5, kualitas pengiriman mendekati mode non-pemikiran Opus 4.6. Namun, masih ada kesenjangan tertentu dengan model pemikiran Opus 4.6.

Saat ini situs web dan APP sudah tersedia, layanan API juga telah diperbarui secara bersamaan.

Untuk daya komputasi domestik yang menjadi perhatian semua orang, poin pentingnya, pada paruh kedua tahun ini mendukung daya komputasi Huawei.

Pilihan Spesifikasi Tertinggi dan Hemat Biaya, Dua Versi Diluncurkan Bersamaan

Kali ini V4 langsung meluncurkan dua versi.

V4-Pro, kinerja setara dengan model sumber tertutup teratas.

Penilaian resmi yang diberikan ada tiga poin:

Kemampuan Agent meningkat drastis: Dalam evaluasi Agentic Coding, V4-Pro telah mencapai level terbaik model sumber terbuka saat ini, dan juga berkinerja sangat baik dalam evaluasi terkait Agent lainnya. Dalam evaluasi internal, dalam mode Agent Coding, pengalaman V4 lebih baik daripada Sonnet 4.5, kualitas pengiriman mendekati mode non-pemikiran Opus 4.6, tetapi masih ada kesenjangan dengan mode pemikiran Opus 4.6.

Pengetahuan dunia yang kaya: DeepSeek-V4-Pro dalam evaluasi pengetahuan dunia, jauh memimpin model sumber terbuka lainnya, hanya sedikit lebih rendah dari model sumber tertutup teratas Gemini-Pro-3.1.

Kinerja penalaran tingkat dunia: Dalam evaluasi matematika, STEM, dan kode kompetitif, DeepSeek-V4-Pro melampaui semua model sumber terbuka yang telah dievaluasi secara publik saat ini, mencapai hasil yang setara dengan model sumber tertutup teratas dunia.

V4-Flash, versi ekonomis yang lebih kecil dan lebih cepat. Kemampuan penalaran mendekati Pro, cadangan pengetahuan dunia sedikit lebih rendah, tetapi parameter dan aktivasi lebih kecil, API lebih murah.

Dalam tugas Agent, DeepSeek-V4-Flash dalam tugas sederhana setara dengan DeepSeek-V4-Pro, tetapi dalam tugas dengan kesulitan tinggi masih ada kesenjangan.

Dalam tes cuci mobil, V4 juga lolos dengan cepat.

Dan dalam adegan biologi klasik "Ayah yang Putus Asa", DeepSeek-V4 tidak langsung menangkap poin kunci buta warna merah-hijau dalam satu putaran (menurut hukum genetika, jika seorang perempuan buta warna merah-hijau, ayah biologisnya pasti juga buta warna).

Konteks 1 Juta Menjadi Standar

Yang patut dicatat, mulai hari ini, konteks 1M adalah standar untuk semua layanan resmi DeepSeek.

Setahun yang lalu, konteks 1M masih menjadi andalan eksklusif Gemini; semua model sumber tertutup lainnya maksimal 128K atau 200K; di sisi sumber terbuka hampir tidak ada yang bisa memainkan level ini.

DeepSeek langsung mengubah konteks 1 juta dari "fitur high-end" menjadi "listrik, air, dan gas".

Dan sumber terbuka. Bagaimana mereka melakukannya, dalam rilis langsung diberikan jawabannya—

V4 menciptakan mekanisme perhatian baru yang sepenuhnya, melakukan kompresi pada dimensi token, dikombinasikan dengan perhatian jarang DSA. Dibandingkan dengan metode tradisional, kebutuhan komputasi dan memori menurun drastis.

DSA bukan kata baru. Setengah tahun yang lalu, pembaruan V3.2-Exp pertama kali memperkenalkannya, saat itu perhatian eksternal tidak tinggi, karena skor berlari dan V3.1-Terminus hampir sama, terlihat seperti versi perantara yang tidak banyak fitur.

Sekarang melihat ke belakang, itu adalah fondasi V4.

Optimisasi Khusus Kemampuan Agent

Di sisi Agent, V4 melakukan adaptasi dan optimisasi untuk produk Agent utama seperti Claude Code, OpenClaw, OpenCode, CodeBuddy, tugas kode, tugas pembuatan dokumen semuanya meningkat.

Dalam rilis juga dilampirkan contoh halaman internal PPT yang dihasilkan V4-Pro dalam kerangka Agent tertentu.

Harga API

Di sisi API, V4-Pro dan V4-Flash diluncurkan bersamaan, mendukung dua set antarmuka: OpenAI ChatCompletions dan Anthropic.

base_url tidak berubah, parameter model diubah menjadi deepseek-v4-pro atau deepseek-v4-flash untuk dipanggil.

Kedua versi memiliki konteks maksimal 1M, keduanya mendukung mode non-pemikiran dan mode pemikiran. Dalam mode pemikiran, intensitas dapat disesuaikan melalui parameter reasoning_effort, dua tingkat high dan max. Saran resmi untuk skenario Agent kompleks langsung gunakan max.

Di sini ada poin penting—paruh kedua tahun ini mendukung daya komputasi Huawei.

Selain itu, nama model lama akan dihapus.

deepseek-chat dan deepseek-reasoner akan dinonaktifkan dalam tiga bulan (24 Juli 2026), pada tahap saat ini kedua nama ini masing-masing mengarah ke mode non-pemikiran dan pemikiran V4-Flash.

Bagi pengembang individu dampaknya tidak besar, cukup ubah satu parameter model. Perusahaan yang telah terhubung dengan lingkungan produksi, dalam tiga bulan ini harus melakukan migrasi.

One more thing

Di akhir rilis, DeepSeek sendiri mengutip sebuah kalimat.

"Tidak tergoda oleh pujian, tidak takut pada fitnah, berjalan sesuai jalan, teguh meluruskan diri."

Ini adalah kalimat dari Xunzi "Fei Shi Er Zi". Secara harfiah berarti, tidak tergoda oleh pujian, tidak takut pada fitnah, berjalan sesuai jalan yang diyakini, meluruskan diri.

Dalam konteks hari ini, agak menarik.

Setengah tahun terakhir, rumor tentang kapan V4 dirilis, apakah tertunda, apakah sudah disalip oleh pihak lain, apakah sudah ditangani oleh data distilasi Claude, dan sejenisnya, bolak-balik beberapa putaran di komunitas AI bahasa Cina dan Inggris. Awal tahun bahkan ada yang bersumpah V4 akan dirilis sebelum Tahun Baru Imlek, tetapi akhirnya menunggu sampai akhir April.

Mereka tidak menanggapi sekali pun.

Kemudian pada suatu Jumat sore, mengeluarkan V4, sinkron sumber terbuka, sinkron online situs web dan App, sinkron perbarui API, sekaligus menuliskan fakta bahwa karyawan internal sudah meninggalkan Claude ke dalam rilis.

Tidak ada peta jalan, tidak ada siaran langsung, tidak ada wawancara.

Empat kata "berjalan sesuai jalan", terdengar seperti sebuah slogan. Tetapi jika Anda melihat setengah tahun lalu versi Exp V3.2 yang "tidak banyak亮点 (highlight)", set DSA perhatian jarang yang membuka jalan untuk V4 selama setengah tahun, jalur konteks 1M dari andalan menjadi standar ini.

DeepSeek sudah melakukannya.

Tautan sumber terbuka model DeepSeek-V4:

[1]https://huggingface.co/collections/deepseek-ai/deepseek-v4

[2]https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4

Laporan teknis DeepSeek-V4: https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

Artikel ini dari akun WeChat publik "量子位", penulis: 量子位

Pertanyaan Terkait

QApa saja dua versi DeepSeek-V4 yang dirilis dan apa perbedaan utamanya?

ADeepSeek merilis dua versi: DeepSeek-V4-Pro dan DeepSeek-V4-Flash. V4-Pro adalah versi premium dengan 1,6T parameter dan 49B aktivasi, dirancang untuk menyaingi model tertutup terbaik. V4-Flash adalah versi ekonomis yang lebih kecil dan cepat dengan 284B parameter dan 13B aktivasi, menawarkan kinerja serupa untuk tugas sederhana dengan harga API yang lebih murah.

QApa keunggulan utama DeepSeek-V4-Pro dalam hal kemampuan Agent dan pengetahuan dunia?

ADeepSeek-V4-Pro unggul dalam kemampuan Agent, terutama dalam coding, dengan pengalaman pengguna yang lebih baik daripada Sonnet 4.5 dan kualitas pengiriman mendekati Opus 4.6 mode non-berpikir. Dalam pengetahuan dunia, V4-Pro sedikit lebih unggul daripada model sumber terbuka lainnya dan hanya sedikit di bawah model tertutup teratas seperti Gemini-Pro-3.1.

QBagaimana DeepSeek mencapai konteks 1M token sebagai fitur standar dan apa mekanisme perhatian yang digunakan?

ADeepSeek mencapai konteks 1M token sebagai standar dengan mekanisme perhatian baru yang mengompresi token dan menggabungkannya dengan DSA (DeepSeek Attention) sparse attention. Ini mengurangi kebutuhan komputasi dan memori secara signifikan dibandingkan metode tradisional.

QKapan DeepSeek akan mendukung komputasi Huawei dan apa implikasinya?

ADeepSeek berencana mendukung komputasi Huawei pada paruh kedua tahun ini. Ini berarti model DeepSeek-V4 akan dapat dijalankan pada chip Huawei, meningkatkan aksesibilitas dan kemandirian teknologi di lingkungan komputasi lokal.

QApa yang terjadi pada model DeepSeek lama dan kapan mereka akan dihentikan?

AModel lama seperti deepseek-chat dan deepseek-reasoner akan dihentikan dalam tiga bulan setelah pengumuman (24 Juli 2026). Saat ini, nama-nama ini mengarah ke mode non-berpikir dan berpikir dari V4-Flash. Pengembang perlu memigrasi ke nama model baru sebelum tanggal tersebut.

Bacaan Terkait

Dari Blokir Doubao hingga Sambut Glory, Mengapa WeChat Tiba-tiba "Berganti Wajah"?

Dari memblokir "Doubao" hingga berkolaborasi dengan "Honor": Mengapa WeChat tiba-tiba berubah sikap? WeChat, yang dimiliki Tencent, kini bekerja sama dengan produsen ponsel seperti Honor, Huawei, Xiaomi, OPPO, dan vivo untuk meluncurkan kemampuan A2A, memungkinkan asisten AI sistem ponsel (seperti YOYO Honor) memanggil fungsi WeChat melalui perintah suara, seperti mengirim pesan atau menelepon. Ini adalah perubahan besar mengingat sebelumnya WeChat dengan ketat memblokir upaya pihak ketiga (termasuk ponsel "Doubao" ByteDance) yang mengontrol aplikasinya melalui simulasi klik (GUI Agent). Perubahan ini didorong oleh tekanan kompetisi AI Tencent. Meskipun memiliki WeChat dengan 1,4 miliar pengguna bulanan, aplikasi AI-nya sendiri tertinggal dari pesaing seperti "Doubao" dan "Tongyi Qianwen". WeChat kini memprioritaskan pengembangan "agen AI" internal yang memanfaatkan ekosistem mini-programnya. Namun, untuk menjangkau pengguna, WeChat perlu terhubung dengan asisten AI tingkat sistem di ponsel, yang merupakan pintu masuk AI pertama bagi banyak pengguna. Kolaborasi A2A memungkinkan hal ini: asisten ponsel bertindak sebagai "operator" yang meneruskan perintah ke WeChat, yang kemudian mengeksekusinya di dalam lingkungannya sendiri. Skema ini menjaga kendali dan keamanan data WeChat, tidak seperti pendekatan GUI yang dianggap sebagai "perampasan". Bagi produsen ponsel, kolaborasi ini menarik karena jalur GUI terbukti tidak dapat diandalkan dan mudah diblokir. Meskipun mereka juga memiliki ambisi membangun ekosistem AI sendiri (seperti konsep AHI Honor), kerja sama A2A membuka akses yang sah dan terkontrol ke fungsi WeChat, sekaligus memungkinkan mereka fokus pada pengembangan kemampuan AI lainnya di luar WeChat. Kerja sama ini menggunakan mekanisme otorisasi ganda (pengguna dan aplikasi) untuk keamanan. Pada akhirnya, kolaborasi ini adalah bentuk "jabat tangan" strategis: Tencent mendapatkan pintu masuk AI di tingkat sistem ponsel, sementara produsen ponsel mendapatkan akses yang sah ke fungsi WeChat untuk meningkatkan kegunaan asisten AI mereka. Ini menandai babak baru dalam perebutan pintu masuk di era AI, di mana WeChat berusaha menjadi "sistem operasi layanan", sementara produsen ponsel beralih menjadi penyedia ekosistem AI. Pertarungan untuk menguasai interaksi utama pengguna dengan AI di perangkat mereka baru saja dimulai.

marsbit31m yang lalu

Dari Blokir Doubao hingga Sambut Glory, Mengapa WeChat Tiba-tiba "Berganti Wajah"?

marsbit31m yang lalu

Angka di On-Chain pada Malam Sebelum Kick-off: Piala Dunia Belum Dimulai, Sudah Terjual Rp 16 Miliar

Tujuh edisi sebelumnya membedah cara crypto masuk ke sepak bola. Kini, 6 hari sebelum kick-off Piala Dunia 2026, fokusnya adalah skala pasar on-chain. Hanya satu kontrak "Juara Piala Dunia" di platform Polymarket telah mencapai volume perdagangan kumulatif sekitar **$1,6 miliar** per 5 Juni, padahal pertandingan belum dimulai. Angka ini melonjak dari $368 juta pada Maret menjadi lebih dari $1,2 miliar di Mei. Volume industri pasar prediksi global melonjak 4x dari $16B (2024) menjadi ~$64B (2025). Platform seperti Polymarket dan Kalshi menawarkan ~100 kontrak yang mencakup semua 104 pertandingan, dari juara, top scorer, hingga hasil tiap laga. Harga kontrak (misal $0,53) mencerminkan probabilitas tersirat pasar (53%). Penyelesaian menggunakan stablecoin native USDC yang diatur dan oracle seperti Chainlink untuk hasil real-time. Perubahan infrastruktur kunci: (1) Settlement layer beralih ke stablecoin teratur (USDC). (2) Oracle terdesentralisasi (Chainlink) dipakai untuk resolusi otomatis. (3) FIFA menunjuk mitra resmi pertama di kategori "pasar prediksi" (ADI Predictstreet). Ini menandai pergeseran crypto dari sponsor pinggir lapangan menjadi bagian dari infrastruktur inti acara. Aset terkait sepak bola seperti Chiliz (CHZ) dan fan token negara (ARG, POR) juga aktif diperdagangkan mendekati turnamen. Penting dicatat: "pasar prediksi" (di bawah CFTC) berbeda secara hukum dari "taruhan olahraga" (lisensi negara bagian). Legalitasnya bervariasi di setiap yurisdiksi. Intinya: Meski bukan sponsor utama FIFA, teknologi crypto telah meresap ke dalam lapisan penyelesaian, prediksi, dan kemitraan resmi Piala Dunia ini. Pasar on-chain sudah "bermain" setahun sebelum kick-off pertama.

marsbit1j yang lalu

Angka di On-Chain pada Malam Sebelum Kick-off: Piala Dunia Belum Dimulai, Sudah Terjual Rp 16 Miliar

marsbit1j yang lalu

Dari IPO SpaceX Melihat Masa Depan Crypto: Sektor Crypto Mana yang Akan Menjadi Narasi Triliunan Dolar?

Penulis: Climber, CryptoPulse Labs Berdasarkan dokumen SEC terbaru, SpaceX berencana mengumpulkan $750 miliar dengan valuasi sekitar $1,77 triliun, mengintegrasikan roket, Starlink, AI, pusat data orbital, dan ekonomi luar angkasa ke dalam satu narasi besar. Peristiwa ini mengisyaratkan perubahan logika penilaian modal, yang dapat berdampak pada pasar crypto. Tiga sektor crypto yang mungkin mendapat aliran dana: 1. **AI Beralih ke Infrastruktur**: Modal mulai mencari "penjual sekop". Narasi bergeser dari aplikasi AI ke protokol lapisan dasar seperti jaringan komputasi (contoh: TAO, RENDER, AKT, IO) yang menyediakan sumber daya inti seperti daya komputasi GPU. 2. **RWA untuk Aset Masa Depan**: RWA (Real World Assets) dapat melampaui obligasi pemerintah, membuka akses ke aset ekuitas pra-IPO seperti SpaceX melalui tokenisasi. Ini berpotensi merekonstruksi pasar modal global, menguntungkan infrastruktur seperti ONDO dan LINK. 3. **Stablecoin, Pembayaran & DePIN sebagai Dasar Baru**: Seiring pertumbuhan ekonomi on-chain, stablecoin (sebagai infrastruktur keuangan global) dan jaringan pembayaran akan menjadi penting. DePIN (Jaringan Infrastruktur Fisik Terdesentralisasi) juga dapat dinilai ulang, mencerminkan nilai jaringan fisik seperti yang ditunjukkan Starlink. Kesimpulannya, IPO SpaceX mencerminkan pergeseran modal dari sekadar mengejar cerita (aplikasi) ke pengejaran infrastruktur dan arus kas. Sektor-sektor crypto yang membangun sistem dasar ini mungkin menjadi logika inti siklus pasar berikutnya.

marsbit1j yang lalu

Dari IPO SpaceX Melihat Masa Depan Crypto: Sektor Crypto Mana yang Akan Menjadi Narasi Triliunan Dolar?

marsbit1j yang lalu

Lingkungan Kripto Terkena Pukulan Keras! Bitcoin Jebol $60.000, Ethereum Anjlok Lebih dari 10%, Strategy Diburu Short Seller

Ekosistem kripto mengalami tekanan berat pekan ini, dengan Bitcoin anjlok ke level terendah dalam lebih dari setengah tahun. Pada Jumat (6/6), Bitcoin sempat menyentuh US$59.099,25, terendah sejak Oktober 2024, sebelum ditutup di US$61.514,90. Secara mingguan, harga turun 16%. Penurunan dipicu oleh beberapa faktor. Perusahaan Michael Saylor, MicroStrategy, menjual sebagian dari kepemilikan Bitcoin-nya, yang memicu likuidasi paksa senilai ratusan juta dolar. Data lapangan kerja AS yang lebih kuat dari perkiraan juga mendorong imbal hasil obligasi pemerintah AS, menekan aset berisiko seperti kripto. Saham MicroStrategy (MSTR) ikut terpukul, turun 6,9% dalam sehari dan 24% sepanjang pekan. Aktivitas perdagangan opsi jual (put) untuk saham MSTR melonjak, dengan volume tiga kali lipat dari rata-rata bulanan. ETF yang melakukan short terhadap MSTR (WNTR) telah naik 30% sejak pertengahan Mei. Narasi "emas digital" dan "saham teknologi berisiko tinggi" Bitcoin sedang diuji. Sementara saham teknologi AS mencapai rekor tertinggi baru, Bitcoin justru terperosok, menunjukkan korelasi yang merenggang di antara keduanya. Prospek undang-undang pengaturan kripto "Clarity Act" di AS juga semakin suram, menghilangkan salah satu katalis potensial untuk pasar. Dari puncaknya sekitar US$126.000 pada Oktober 2025, Bitcoin telah kehilangan lebih dari setengah nilainya. Meski demikian, ada suara optimis. CEO Strive, Matt Cole, menyebut fundamental Bitcoin "tidak pernah sekuat ini" dan melihat peluang beli di level saat ini, karena harga telah menyentuh rata-rata bergerak 200-minggu untuk kelima kalinya.

华尔街日报2j yang lalu

Lingkungan Kripto Terkena Pukulan Keras! Bitcoin Jebol $60.000, Ethereum Anjlok Lebih dari 10%, Strategy Diburu Short Seller

华尔街日报2j yang lalu

Trading

Spot
Futures
活动图片