DeepSeek V4 Akhirnya Dirilis, Menghancurkan Monopoli Sumber Tertutup Terkuat, Secara Tegas Berkolaborasi dengan Chip Huawei

marsbitDipublikasikan tanggal 2026-04-24Terakhir diperbarui pada 2026-04-24

Abstrak

DeepSeek V4 telah resmi dirilis dalam dua versi: **DeepSeek-V4-Pro** (49B, 1.6T token) dan **DeepSeek-V4-Flash** (13B, 284B token), keduanya mendukung konteks hingga **1 juta token**. Model ini diklaim unggul dalam kemampuan Agent, pengetahuan dunia, dan penalaran, bahkan bersaing dengan model tertutup terkemuka seperti Claude Opus dan Gemini. V4-Pro menunjukkan performa setara dengan Sonnet 4.5 dan mendekati Opus 4.6 dalam tugas coding, sementara V4-Flash menawarkan efisiensi lebih tinggi dengan harga API lebih terjangkau. DeepSeek V4 juga mengintegrasikan mekanisme perhatian baru yang mengurangi kebutuhan komputasi untuk konteks panjang. API sudah tersedia dengan antarmuka OpenAI dan Anthropic, serta rencananya akan mendukung chip Huawei pada paruh kedua tahun ini. Model ini dapat diakses secara open-source di Hugging Face dan ModelScope.

Baru saja, DeepSeek-V4 hadir!

Versi pratinjau resmi diluncurkan dan disinkronkan sebagai sumber terbuka.

Total ada dua versi:

DeepSeek-V4-Pro: Setara dengan model sumber tertutup teratas, 1.6T, 49B aktivasi, panjang konteks 1M;

DeepSeek-V4-Flash: Versi ekonomis yang lebih kecil dan lebih cepat, 284B, 13B aktivasi, panjang konteks 1M.

Pernyataan resmi adalah: Dalam kemampuan Agent, pengetahuan dunia, dan kinerja penalaran, semuanya mencapai kepemimpinan di dalam negeri dan bidang sumber terbuka.

Dan:

Saat ini DeepSeek-V4 telah menjadi model Agentic Coding yang digunakan oleh karyawan internal perusahaan. Menurut umpan balik evaluasi, pengalaman penggunaannya lebih baik daripada Sonnet 4.5, kualitas pengiriman mendekati mode non-pemikiran Opus 4.6. Namun, masih ada kesenjangan tertentu dengan model pemikiran Opus 4.6.

Saat ini situs web dan APP sudah tersedia, layanan API juga telah diperbarui secara bersamaan.

Untuk daya komputasi domestik yang menjadi perhatian semua orang, poin pentingnya, pada paruh kedua tahun ini mendukung daya komputasi Huawei.

Pilihan Spesifikasi Tertinggi dan Hemat Biaya, Dua Versi Diluncurkan Bersamaan

Kali ini V4 langsung meluncurkan dua versi.

V4-Pro, kinerja setara dengan model sumber tertutup teratas.

Penilaian resmi yang diberikan ada tiga poin:

Kemampuan Agent meningkat drastis: Dalam evaluasi Agentic Coding, V4-Pro telah mencapai level terbaik model sumber terbuka saat ini, dan juga berkinerja sangat baik dalam evaluasi terkait Agent lainnya. Dalam evaluasi internal, dalam mode Agent Coding, pengalaman V4 lebih baik daripada Sonnet 4.5, kualitas pengiriman mendekati mode non-pemikiran Opus 4.6, tetapi masih ada kesenjangan dengan mode pemikiran Opus 4.6.

Pengetahuan dunia yang kaya: DeepSeek-V4-Pro dalam evaluasi pengetahuan dunia, jauh memimpin model sumber terbuka lainnya, hanya sedikit lebih rendah dari model sumber tertutup teratas Gemini-Pro-3.1.

Kinerja penalaran tingkat dunia: Dalam evaluasi matematika, STEM, dan kode kompetitif, DeepSeek-V4-Pro melampaui semua model sumber terbuka yang telah dievaluasi secara publik saat ini, mencapai hasil yang setara dengan model sumber tertutup teratas dunia.

V4-Flash, versi ekonomis yang lebih kecil dan lebih cepat. Kemampuan penalaran mendekati Pro, cadangan pengetahuan dunia sedikit lebih rendah, tetapi parameter dan aktivasi lebih kecil, API lebih murah.

Dalam tugas Agent, DeepSeek-V4-Flash dalam tugas sederhana setara dengan DeepSeek-V4-Pro, tetapi dalam tugas dengan kesulitan tinggi masih ada kesenjangan.

Dalam tes cuci mobil, V4 juga lolos dengan cepat.

Dan dalam adegan biologi klasik "Ayah yang Putus Asa", DeepSeek-V4 tidak langsung menangkap poin kunci buta warna merah-hijau dalam satu putaran (menurut hukum genetika, jika seorang perempuan buta warna merah-hijau, ayah biologisnya pasti juga buta warna).

Konteks 1 Juta Menjadi Standar

Yang patut dicatat, mulai hari ini, konteks 1M adalah standar untuk semua layanan resmi DeepSeek.

Setahun yang lalu, konteks 1M masih menjadi andalan eksklusif Gemini; semua model sumber tertutup lainnya maksimal 128K atau 200K; di sisi sumber terbuka hampir tidak ada yang bisa memainkan level ini.

DeepSeek langsung mengubah konteks 1 juta dari "fitur high-end" menjadi "listrik, air, dan gas".

Dan sumber terbuka. Bagaimana mereka melakukannya, dalam rilis langsung diberikan jawabannya—

V4 menciptakan mekanisme perhatian baru yang sepenuhnya, melakukan kompresi pada dimensi token, dikombinasikan dengan perhatian jarang DSA. Dibandingkan dengan metode tradisional, kebutuhan komputasi dan memori menurun drastis.

DSA bukan kata baru. Setengah tahun yang lalu, pembaruan V3.2-Exp pertama kali memperkenalkannya, saat itu perhatian eksternal tidak tinggi, karena skor berlari dan V3.1-Terminus hampir sama, terlihat seperti versi perantara yang tidak banyak fitur.

Sekarang melihat ke belakang, itu adalah fondasi V4.

Optimisasi Khusus Kemampuan Agent

Di sisi Agent, V4 melakukan adaptasi dan optimisasi untuk produk Agent utama seperti Claude Code, OpenClaw, OpenCode, CodeBuddy, tugas kode, tugas pembuatan dokumen semuanya meningkat.

Dalam rilis juga dilampirkan contoh halaman internal PPT yang dihasilkan V4-Pro dalam kerangka Agent tertentu.

Harga API

Di sisi API, V4-Pro dan V4-Flash diluncurkan bersamaan, mendukung dua set antarmuka: OpenAI ChatCompletions dan Anthropic.

base_url tidak berubah, parameter model diubah menjadi deepseek-v4-pro atau deepseek-v4-flash untuk dipanggil.

Kedua versi memiliki konteks maksimal 1M, keduanya mendukung mode non-pemikiran dan mode pemikiran. Dalam mode pemikiran, intensitas dapat disesuaikan melalui parameter reasoning_effort, dua tingkat high dan max. Saran resmi untuk skenario Agent kompleks langsung gunakan max.

Di sini ada poin penting—paruh kedua tahun ini mendukung daya komputasi Huawei.

Selain itu, nama model lama akan dihapus.

deepseek-chat dan deepseek-reasoner akan dinonaktifkan dalam tiga bulan (24 Juli 2026), pada tahap saat ini kedua nama ini masing-masing mengarah ke mode non-pemikiran dan pemikiran V4-Flash.

Bagi pengembang individu dampaknya tidak besar, cukup ubah satu parameter model. Perusahaan yang telah terhubung dengan lingkungan produksi, dalam tiga bulan ini harus melakukan migrasi.

One more thing

Di akhir rilis, DeepSeek sendiri mengutip sebuah kalimat.

"Tidak tergoda oleh pujian, tidak takut pada fitnah, berjalan sesuai jalan, teguh meluruskan diri."

Ini adalah kalimat dari Xunzi "Fei Shi Er Zi". Secara harfiah berarti, tidak tergoda oleh pujian, tidak takut pada fitnah, berjalan sesuai jalan yang diyakini, meluruskan diri.

Dalam konteks hari ini, agak menarik.

Setengah tahun terakhir, rumor tentang kapan V4 dirilis, apakah tertunda, apakah sudah disalip oleh pihak lain, apakah sudah ditangani oleh data distilasi Claude, dan sejenisnya, bolak-balik beberapa putaran di komunitas AI bahasa Cina dan Inggris. Awal tahun bahkan ada yang bersumpah V4 akan dirilis sebelum Tahun Baru Imlek, tetapi akhirnya menunggu sampai akhir April.

Mereka tidak menanggapi sekali pun.

Kemudian pada suatu Jumat sore, mengeluarkan V4, sinkron sumber terbuka, sinkron online situs web dan App, sinkron perbarui API, sekaligus menuliskan fakta bahwa karyawan internal sudah meninggalkan Claude ke dalam rilis.

Tidak ada peta jalan, tidak ada siaran langsung, tidak ada wawancara.

Empat kata "berjalan sesuai jalan", terdengar seperti sebuah slogan. Tetapi jika Anda melihat setengah tahun lalu versi Exp V3.2 yang "tidak banyak亮点 (highlight)", set DSA perhatian jarang yang membuka jalan untuk V4 selama setengah tahun, jalur konteks 1M dari andalan menjadi standar ini.

DeepSeek sudah melakukannya.

Tautan sumber terbuka model DeepSeek-V4:

[1]https://huggingface.co/collections/deepseek-ai/deepseek-v4

[2]https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4

Laporan teknis DeepSeek-V4: https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

Artikel ini dari akun WeChat publik "量子位", penulis: 量子位

Pertanyaan Terkait

QApa saja dua versi DeepSeek-V4 yang dirilis dan apa perbedaan utamanya?

ADeepSeek merilis dua versi: DeepSeek-V4-Pro dan DeepSeek-V4-Flash. V4-Pro adalah versi premium dengan 1,6T parameter dan 49B aktivasi, dirancang untuk menyaingi model tertutup terbaik. V4-Flash adalah versi ekonomis yang lebih kecil dan cepat dengan 284B parameter dan 13B aktivasi, menawarkan kinerja serupa untuk tugas sederhana dengan harga API yang lebih murah.

QApa keunggulan utama DeepSeek-V4-Pro dalam hal kemampuan Agent dan pengetahuan dunia?

ADeepSeek-V4-Pro unggul dalam kemampuan Agent, terutama dalam coding, dengan pengalaman pengguna yang lebih baik daripada Sonnet 4.5 dan kualitas pengiriman mendekati Opus 4.6 mode non-berpikir. Dalam pengetahuan dunia, V4-Pro sedikit lebih unggul daripada model sumber terbuka lainnya dan hanya sedikit di bawah model tertutup teratas seperti Gemini-Pro-3.1.

QBagaimana DeepSeek mencapai konteks 1M token sebagai fitur standar dan apa mekanisme perhatian yang digunakan?

ADeepSeek mencapai konteks 1M token sebagai standar dengan mekanisme perhatian baru yang mengompresi token dan menggabungkannya dengan DSA (DeepSeek Attention) sparse attention. Ini mengurangi kebutuhan komputasi dan memori secara signifikan dibandingkan metode tradisional.

QKapan DeepSeek akan mendukung komputasi Huawei dan apa implikasinya?

ADeepSeek berencana mendukung komputasi Huawei pada paruh kedua tahun ini. Ini berarti model DeepSeek-V4 akan dapat dijalankan pada chip Huawei, meningkatkan aksesibilitas dan kemandirian teknologi di lingkungan komputasi lokal.

QApa yang terjadi pada model DeepSeek lama dan kapan mereka akan dihentikan?

AModel lama seperti deepseek-chat dan deepseek-reasoner akan dihentikan dalam tiga bulan setelah pengumuman (24 Juli 2026). Saat ini, nama-nama ini mengarah ke mode non-berpikir dan berpikir dari V4-Flash. Pengembang perlu memigrasi ke nama model baru sebelum tanggal tersebut.

Bacaan Terkait

TechFlow Intelijen: Saham Chip Kehilangan Triliunan Dolar dalam Satu Hari, Bitcoin Jatuh di Bawah $60.000, Konflik AS-Iran Meningkat

Teknologi & Keuangan Berguncang: Data Non-Farm AS Hantam Pasar, Ketegangan AS-Iran Meningkat Pasar keuangan global diterpa badai pada hari Jumat. Indeks semiconductor Philadelphia (SOXX) anjlok 10%, menghapus lebih dari satu triliun dolar AS dalam satu hari, dengan saham chip seperti Marvell dan AMD terpuruk. Bitcoin juga jatuh di bawah US$60.000, menyentuh level oversold terparah sejak Maret 2020. Pemicu utama adalah data lapangan kerja AS (non-farm payrolls) Mei yang melonjak menjadi 172 ribu, hampir dua kali lipat dari perkiraan. Ini memadamkan harapan pasar akan pemotongan suku bunga oleh The Fed dan mendorong imbal hasil obligasi AS melonjak. Nasdaq merosot lebih dari 4%. Sementara itu, ketegangan geopolitik memanas. AS mencegat rudal dan drone Iran yang menargetkan Bahrain dan Kuwait, lalu membalas dengan menyerang dua stasiun radar Iran. Selat Hormuz tetap terhambat, meningkatkan risiko gangguan pasokan minyak dan inflasi. Di balik data lapangan kerja yang kuat, para CEO perusahaan konsumen seperti Kraft dan McDonald's memperingatkan bahwa konsumen AS mulai kehabisan tabungan, menimbulkan pertanyaan tentang kekuatan ekonomi riil. Di sektor teknologi, diskusi utama terkait AI. Laporan internal Anthropic memperingatkan tentang kemungkinan "peningkatan diri secara rekursif" (RSI) pada AI. Sementara itu, komunitas pengembang memperdebatkan kode bug yang diperkenalkan oleh Claude ke dalam basis kode rsync, mempertanyakan keandalan alat coding AI. Di sisi lain, DeepSeek V4 Flash mendapat pujian untuk kinerja lokalnya, dan GitHub Copilot kini mendukung endpoint kustom untuk model lokal. Intinya, pasar sedang menyesuaikan harga untuk lingkungan makro yang sulit: tekanan inflasi yang potensial dari geopolitik, kebijakan moneter The Fed yang ketat, dan sinyal yang bertentangan tentang kesehatan ekonomi konsumen AS.

marsbit46m yang lalu

TechFlow Intelijen: Saham Chip Kehilangan Triliunan Dolar dalam Satu Hari, Bitcoin Jatuh di Bawah $60.000, Konflik AS-Iran Meningkat

marsbit46m yang lalu

Saya Butuh Setahun untuk Menyadari Kebenaran yang Menyakitkan tentang Pembayaran Agent

Selama setahun terakhir, penulis berfokus membangun infrastruktur untuk ekonomi *agent*, berinteraksi dengan perusahaan seperti Stripe, Visa, dan startup lainnya. Kesimpulan utamanya: belum ada permintaan riil yang matang, dan startup menghadapi banyak tantangan struktural. **Data Realitas:** Stripe melaporkan sedikit transaksi *agent* aktif. Visa menyebutkan proses KYC yang panjang dan batas pendapatan tinggi untuk token pembayaran *agent*. Analisis Coinbase menunjukkan volume transaksi harian *agent* di blockchain masih sangat kecil, sebagian besar adalah transaksi uji coba. **Tantangan di Berbagai Sektor:** 1. **Agent untuk Merchant (E-commerce):** Pengalaman belanja via chatbot seringkali lebih buruk daripada antarmuka visual tradisional. Kebutuhan merchant saat ini bersifat defensif (optimasi untuk *agent*), bukan karena permintaan konsumen yang nyata. Celah potensial ada pada pembelian rutin (seperti pesan makanan) atau situs dengan UI rumit, tetapi butuh distribusi B2C skala besar yang dikuasai raksasa seperti Amazon. 2. **Agent untuk API:** Developer sudah memiliki metode pembayaran yang mapan (kunci API, saldo prabayar) untuk akses layanan komputasi dan data. Pasar untuk transaksi mikro bersifat *long-tail* namun relatif kecil. Penyedia SaaS besar cenderung mempertahankan model kontrak bisnis mereka. 3. **Agent untuk Agent:** Visi jangka panjang ini masih teoritis dengan volume transaksi nyata yang hampir nihil. Butuh infrastruktur penyelesaian khusus untuk transaksi antar-mesin yang cepat dan kompleks. 4. **Agent untuk Keuangan:** Ini adalah kategori dengan permintaan dan kemauan bayar yang sudah ada. Integrasi AI ke alur kerja keuangan tradisional atau DeFi merupakan evolusi alami, meski persaingan dengan lembaga mapan sangat ketat. **Inti Permasalahan:** Banyak yang membangun infrastruktur pembayaran untuk *agent*, tetapi masalah sebenarnya bukan pada transfer dana. Tantangan utamanya adalah **koordinasi** antara *agent* dan manusia—memverifikasi kerja dan menyelesaikan hasil. Penyelesaian (settlement) dan pembayaran (payment) hanyalah bagian dari masalah koordinasi yang lebih besar. Perusahaan yang memecahkan masalah koordinasi akan mendominasi. Perusahaan besar membangun untuk bertahan dari masa depan transaksi mesin skala besar. Namun, startup harus menemukan pasar yang benar-benar aktif *sekarang*, yang mungkin berada di luar empat kategori utama ini.

marsbit1j yang lalu

Saya Butuh Setahun untuk Menyadari Kebenaran yang Menyakitkan tentang Pembayaran Agent

marsbit1j yang lalu

Butuh Satu Tahun untuk Menyadari Kebenaran Pahit tentang Pembayaran Agent

Selama setahun terakhir, penulis telah membangun infrastruktur untuk ekonomi Agen, berinteraksi dengan perusahaan besar seperti Stripe, Visa, Coinbase, Google, dan puluhan startup. Temuan utamanya adalah bahwa belum ada permintaan nyata untuk pembayaran berbasis Agen, dan startup menghadapi banyak tantangan struktural. Analisis terhadap empat kategori utama menunjukkan: 1. **Agen ke Merchant**: Pengalaman belanja melalui chat seringkali lebih buruk daripada antarmuka e-commerce visual tradisional untuk kebanyakan produk. Permintaan dari merchant saat ini bersifat defensif (AEO) dan bukan kebutuhan mendesak. Pengecualian mungkin ada untuk pembelian rutin seperti pesan makanan, tetapi hambatan distribusi B2C sangat besar. 2. **Agen ke API**: Pengembang sudah memiliki solusi pembayaran yang berfungsi untuk penggunaan API (misalnya, isi ulang saldo). Penyedia SaaS besar cenderung menolak model mikro-pembayaran yang mengganggu bisnis inti mereka. Peluang ada di pasar ekor panjang, tetapi skalanya terbatas. 3. **Agen ke Agen**: Ini adalah visi jangka panjang dengan volume transaksi nyata yang hampir nol saat ini. Jika terwujud, akan membutuhkan infrastruktur penyelesaian khusus yang sangat berbeda dari sistem pembayaran saat ini. 4. **Agen ke Keuangan**: Ini adalah satu-satunya kategori dengan permintaan yang sudah mapan dan pelanggan yang mau membayar, baik untuk otomatisasi alur kerja maupun kemampuan baru. Namun, persaingan dari perusahaan mapan yang sudah memiliki lisensi dan hubungan klien sangat ketat. Kesimpulannya, perusahaan besar membangun infrastruktur pembayaran Agen sebagai taruhan defensif jangka panjang. Namun, bagi startup, peluang nyata saat ini tidak terletak pada lapisan pembayaran itu sendiri. Masalah intinya adalah **koordinasi** antara Agen dan manusia (memverifikasi pekerjaan dan menyelesaikan hasil). Penyelesaian dan pembayaran hanyalah bagian dari puzzle koordinasi yang lebih besar. Perusahaan yang memecahkan masalah koordinasi skala besar akan mendominasi, bukan sebaliknya.

链捕手1j yang lalu

Butuh Satu Tahun untuk Menyadari Kebenaran Pahit tentang Pembayaran Agent

链捕手1j yang lalu

Claude Opus 4.8 Menemukan Bug Senilai 4.5 Miliar Dolar AS, Era AI Sedang Memproduksi Peretas Secara Massal

Seorang peneliti keamanan menemukan bug serius dalam jaringan privasi Zcash (Orchard) yang memungkinkan penciptaan token tanpa batas, menggunakan Claude Opus 4.8. Setelah perbaikan darurat, harga Zcash turun 50%. Peristiwa ini menunjukkan bahwa AI, seperti model Opus yang tersedia umum, membuat penemuan kerentanan menjadi lebih mudah dan murah, bukan hanya model canggih seperti Claude Mythos. AI mendemokratisasikan kemampuan audit keamanan, memungkinkan tim kecil memiliki kemampuan seperti tim besar. Namun, ini membanjiri pemelihara dengan laporan bug berkualitas rendah yang dihasilkan AI, seperti yang dialami curl dan didiskusikan OpenSSF. Ini seperti serangan DDoS pada perhatian manusia. Banyak kerentanan lama (seperti Heartbleed, Baron Samedit) tetap tak terdeteksi selama bertahun-tahun karena biaya penemuan yang tinggi. AI mengubah struktur biaya ini. Namun, sementara AI membuat penemuan dan potensi serangan lebih murah, perbaikan tetap mahal dan membutuhkan keahlian manusia. Industri keamanan siber sudah menghadapi kekurangan tenaga kerja global yang besar (misalnya, defisit 4,8 juta menurut ISC2). Laporan menunjukkan profesional beralih ke analisis ancaman kompleks dan pembuatan strategi. Yang paling dibutuhkan adalah orang yang dapat memahami, menilai, dan memperbaiki kerentanan. Kesimpulannya, AI tidak menghancurkan internet, tetapi mengungkap kerentanan yang sudah ada. Kemampuan menemukan bug menyebar dengan cepat, tetapi tanggung jawab untuk memperbaikinya tidak bertambah sebanding. Keamanan digital bergantung pada upaya terus-menerus oleh manusia untuk mengurangi risiko, dan di era AI, sumber daya manusia yang terampil tetap menjadi aset paling berharga dan langka.

marsbit2j yang lalu

Claude Opus 4.8 Menemukan Bug Senilai 4.5 Miliar Dolar AS, Era AI Sedang Memproduksi Peretas Secara Massal

marsbit2j yang lalu

Trading

Spot
Futures
活动图片