DeepSeek V4 Akhirnya Dirilis, Menghancurkan Monopoli Sumber Tertutup Terkuat, Secara Tegas Berkolaborasi dengan Chip Huawei

marsbitDipublikasikan tanggal 2026-04-24Terakhir diperbarui pada 2026-04-24

Abstrak

DeepSeek V4 telah resmi dirilis dalam dua versi: **DeepSeek-V4-Pro** (49B, 1.6T token) dan **DeepSeek-V4-Flash** (13B, 284B token), keduanya mendukung konteks hingga **1 juta token**. Model ini diklaim unggul dalam kemampuan Agent, pengetahuan dunia, dan penalaran, bahkan bersaing dengan model tertutup terkemuka seperti Claude Opus dan Gemini. V4-Pro menunjukkan performa setara dengan Sonnet 4.5 dan mendekati Opus 4.6 dalam tugas coding, sementara V4-Flash menawarkan efisiensi lebih tinggi dengan harga API lebih terjangkau. DeepSeek V4 juga mengintegrasikan mekanisme perhatian baru yang mengurangi kebutuhan komputasi untuk konteks panjang. API sudah tersedia dengan antarmuka OpenAI dan Anthropic, serta rencananya akan mendukung chip Huawei pada paruh kedua tahun ini. Model ini dapat diakses secara open-source di Hugging Face dan ModelScope.

Baru saja, DeepSeek-V4 hadir!

Versi pratinjau resmi diluncurkan dan disinkronkan sebagai sumber terbuka.

Total ada dua versi:

DeepSeek-V4-Pro: Setara dengan model sumber tertutup teratas, 1.6T, 49B aktivasi, panjang konteks 1M;

DeepSeek-V4-Flash: Versi ekonomis yang lebih kecil dan lebih cepat, 284B, 13B aktivasi, panjang konteks 1M.

Pernyataan resmi adalah: Dalam kemampuan Agent, pengetahuan dunia, dan kinerja penalaran, semuanya mencapai kepemimpinan di dalam negeri dan bidang sumber terbuka.

Dan:

Saat ini DeepSeek-V4 telah menjadi model Agentic Coding yang digunakan oleh karyawan internal perusahaan. Menurut umpan balik evaluasi, pengalaman penggunaannya lebih baik daripada Sonnet 4.5, kualitas pengiriman mendekati mode non-pemikiran Opus 4.6. Namun, masih ada kesenjangan tertentu dengan model pemikiran Opus 4.6.

Saat ini situs web dan APP sudah tersedia, layanan API juga telah diperbarui secara bersamaan.

Untuk daya komputasi domestik yang menjadi perhatian semua orang, poin pentingnya, pada paruh kedua tahun ini mendukung daya komputasi Huawei.

Pilihan Spesifikasi Tertinggi dan Hemat Biaya, Dua Versi Diluncurkan Bersamaan

Kali ini V4 langsung meluncurkan dua versi.

V4-Pro, kinerja setara dengan model sumber tertutup teratas.

Penilaian resmi yang diberikan ada tiga poin:

Kemampuan Agent meningkat drastis: Dalam evaluasi Agentic Coding, V4-Pro telah mencapai level terbaik model sumber terbuka saat ini, dan juga berkinerja sangat baik dalam evaluasi terkait Agent lainnya. Dalam evaluasi internal, dalam mode Agent Coding, pengalaman V4 lebih baik daripada Sonnet 4.5, kualitas pengiriman mendekati mode non-pemikiran Opus 4.6, tetapi masih ada kesenjangan dengan mode pemikiran Opus 4.6.

Pengetahuan dunia yang kaya: DeepSeek-V4-Pro dalam evaluasi pengetahuan dunia, jauh memimpin model sumber terbuka lainnya, hanya sedikit lebih rendah dari model sumber tertutup teratas Gemini-Pro-3.1.

Kinerja penalaran tingkat dunia: Dalam evaluasi matematika, STEM, dan kode kompetitif, DeepSeek-V4-Pro melampaui semua model sumber terbuka yang telah dievaluasi secara publik saat ini, mencapai hasil yang setara dengan model sumber tertutup teratas dunia.

V4-Flash, versi ekonomis yang lebih kecil dan lebih cepat. Kemampuan penalaran mendekati Pro, cadangan pengetahuan dunia sedikit lebih rendah, tetapi parameter dan aktivasi lebih kecil, API lebih murah.

Dalam tugas Agent, DeepSeek-V4-Flash dalam tugas sederhana setara dengan DeepSeek-V4-Pro, tetapi dalam tugas dengan kesulitan tinggi masih ada kesenjangan.

Dalam tes cuci mobil, V4 juga lolos dengan cepat.

Dan dalam adegan biologi klasik "Ayah yang Putus Asa", DeepSeek-V4 tidak langsung menangkap poin kunci buta warna merah-hijau dalam satu putaran (menurut hukum genetika, jika seorang perempuan buta warna merah-hijau, ayah biologisnya pasti juga buta warna).

Konteks 1 Juta Menjadi Standar

Yang patut dicatat, mulai hari ini, konteks 1M adalah standar untuk semua layanan resmi DeepSeek.

Setahun yang lalu, konteks 1M masih menjadi andalan eksklusif Gemini; semua model sumber tertutup lainnya maksimal 128K atau 200K; di sisi sumber terbuka hampir tidak ada yang bisa memainkan level ini.

DeepSeek langsung mengubah konteks 1 juta dari "fitur high-end" menjadi "listrik, air, dan gas".

Dan sumber terbuka. Bagaimana mereka melakukannya, dalam rilis langsung diberikan jawabannya—

V4 menciptakan mekanisme perhatian baru yang sepenuhnya, melakukan kompresi pada dimensi token, dikombinasikan dengan perhatian jarang DSA. Dibandingkan dengan metode tradisional, kebutuhan komputasi dan memori menurun drastis.

DSA bukan kata baru. Setengah tahun yang lalu, pembaruan V3.2-Exp pertama kali memperkenalkannya, saat itu perhatian eksternal tidak tinggi, karena skor berlari dan V3.1-Terminus hampir sama, terlihat seperti versi perantara yang tidak banyak fitur.

Sekarang melihat ke belakang, itu adalah fondasi V4.

Optimisasi Khusus Kemampuan Agent

Di sisi Agent, V4 melakukan adaptasi dan optimisasi untuk produk Agent utama seperti Claude Code, OpenClaw, OpenCode, CodeBuddy, tugas kode, tugas pembuatan dokumen semuanya meningkat.

Dalam rilis juga dilampirkan contoh halaman internal PPT yang dihasilkan V4-Pro dalam kerangka Agent tertentu.

Harga API

Di sisi API, V4-Pro dan V4-Flash diluncurkan bersamaan, mendukung dua set antarmuka: OpenAI ChatCompletions dan Anthropic.

base_url tidak berubah, parameter model diubah menjadi deepseek-v4-pro atau deepseek-v4-flash untuk dipanggil.

Kedua versi memiliki konteks maksimal 1M, keduanya mendukung mode non-pemikiran dan mode pemikiran. Dalam mode pemikiran, intensitas dapat disesuaikan melalui parameter reasoning_effort, dua tingkat high dan max. Saran resmi untuk skenario Agent kompleks langsung gunakan max.

Di sini ada poin penting—paruh kedua tahun ini mendukung daya komputasi Huawei.

Selain itu, nama model lama akan dihapus.

deepseek-chat dan deepseek-reasoner akan dinonaktifkan dalam tiga bulan (24 Juli 2026), pada tahap saat ini kedua nama ini masing-masing mengarah ke mode non-pemikiran dan pemikiran V4-Flash.

Bagi pengembang individu dampaknya tidak besar, cukup ubah satu parameter model. Perusahaan yang telah terhubung dengan lingkungan produksi, dalam tiga bulan ini harus melakukan migrasi.

One more thing

Di akhir rilis, DeepSeek sendiri mengutip sebuah kalimat.

"Tidak tergoda oleh pujian, tidak takut pada fitnah, berjalan sesuai jalan, teguh meluruskan diri."

Ini adalah kalimat dari Xunzi "Fei Shi Er Zi". Secara harfiah berarti, tidak tergoda oleh pujian, tidak takut pada fitnah, berjalan sesuai jalan yang diyakini, meluruskan diri.

Dalam konteks hari ini, agak menarik.

Setengah tahun terakhir, rumor tentang kapan V4 dirilis, apakah tertunda, apakah sudah disalip oleh pihak lain, apakah sudah ditangani oleh data distilasi Claude, dan sejenisnya, bolak-balik beberapa putaran di komunitas AI bahasa Cina dan Inggris. Awal tahun bahkan ada yang bersumpah V4 akan dirilis sebelum Tahun Baru Imlek, tetapi akhirnya menunggu sampai akhir April.

Mereka tidak menanggapi sekali pun.

Kemudian pada suatu Jumat sore, mengeluarkan V4, sinkron sumber terbuka, sinkron online situs web dan App, sinkron perbarui API, sekaligus menuliskan fakta bahwa karyawan internal sudah meninggalkan Claude ke dalam rilis.

Tidak ada peta jalan, tidak ada siaran langsung, tidak ada wawancara.

Empat kata "berjalan sesuai jalan", terdengar seperti sebuah slogan. Tetapi jika Anda melihat setengah tahun lalu versi Exp V3.2 yang "tidak banyak亮点 (highlight)", set DSA perhatian jarang yang membuka jalan untuk V4 selama setengah tahun, jalur konteks 1M dari andalan menjadi standar ini.

DeepSeek sudah melakukannya.

Tautan sumber terbuka model DeepSeek-V4:

[1]https://huggingface.co/collections/deepseek-ai/deepseek-v4

[2]https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4

Laporan teknis DeepSeek-V4: https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

Artikel ini dari akun WeChat publik "量子位", penulis: 量子位

Pertanyaan Terkait

QApa saja dua versi DeepSeek-V4 yang dirilis dan apa perbedaan utamanya?

ADeepSeek merilis dua versi: DeepSeek-V4-Pro dan DeepSeek-V4-Flash. V4-Pro adalah versi premium dengan 1,6T parameter dan 49B aktivasi, dirancang untuk menyaingi model tertutup terbaik. V4-Flash adalah versi ekonomis yang lebih kecil dan cepat dengan 284B parameter dan 13B aktivasi, menawarkan kinerja serupa untuk tugas sederhana dengan harga API yang lebih murah.

QApa keunggulan utama DeepSeek-V4-Pro dalam hal kemampuan Agent dan pengetahuan dunia?

ADeepSeek-V4-Pro unggul dalam kemampuan Agent, terutama dalam coding, dengan pengalaman pengguna yang lebih baik daripada Sonnet 4.5 dan kualitas pengiriman mendekati Opus 4.6 mode non-berpikir. Dalam pengetahuan dunia, V4-Pro sedikit lebih unggul daripada model sumber terbuka lainnya dan hanya sedikit di bawah model tertutup teratas seperti Gemini-Pro-3.1.

QBagaimana DeepSeek mencapai konteks 1M token sebagai fitur standar dan apa mekanisme perhatian yang digunakan?

ADeepSeek mencapai konteks 1M token sebagai standar dengan mekanisme perhatian baru yang mengompresi token dan menggabungkannya dengan DSA (DeepSeek Attention) sparse attention. Ini mengurangi kebutuhan komputasi dan memori secara signifikan dibandingkan metode tradisional.

QKapan DeepSeek akan mendukung komputasi Huawei dan apa implikasinya?

ADeepSeek berencana mendukung komputasi Huawei pada paruh kedua tahun ini. Ini berarti model DeepSeek-V4 akan dapat dijalankan pada chip Huawei, meningkatkan aksesibilitas dan kemandirian teknologi di lingkungan komputasi lokal.

QApa yang terjadi pada model DeepSeek lama dan kapan mereka akan dihentikan?

AModel lama seperti deepseek-chat dan deepseek-reasoner akan dihentikan dalam tiga bulan setelah pengumuman (24 Juli 2026). Saat ini, nama-nama ini mengarah ke mode non-berpikir dan berpikir dari V4-Flash. Pengembang perlu memigrasi ke nama model baru sebelum tanggal tersebut.

Bacaan Terkait

Bitcoin Sudah Capai Dasar, atau Akan Ada "Guncangan"? Bagaimana Situasi XRP?

Platform analisis kripto Santiment membagikan sinyal penting terkait pasar Bitcoin dan altcoin. Analis mereka menyebut penurunan rasio MVRV 365-hari Bitcoin ke -26% menunjukkan kerugian signifikan bagi investor jangka panjang, yang secara historis sering menandai pembentukan titik terendah dan peluang akumulasi jangka panjang. Data blockchain mengungkap perbedaan perilaku: pemilik dompet besar (10-10.000 BTC) terus menambah kepemilikan, sementara investor ritel juga aktif membeli di penurunan harga. Namun, permintaan tinggi dari investor kecil ini kadang berisiko memicu koreksi atau "guncangan" pasar. Pasar altcoin beragam. Ethereum menunjukkan risiko koreksi jangka pendek meski ada pemulihan. Sebaliknya, XRP berada di zona oversold dengan sinyal potensi rebound kuat menengah hingga panjang. Sentimen sosial media meningkat untuk Solana, sementara lebih tenang untuk Cardano. Arah pasar ke depan juga akan dipengaruhi faktor eksternal seperti keputusan suku bunga The Fed dan ketidakpastian regulasi di AS, seperti proses RUU Clarity.

cryptonews.ru10m yang lalu

Bitcoin Sudah Capai Dasar, atau Akan Ada "Guncangan"? Bagaimana Situasi XRP?

cryptonews.ru10m yang lalu

Tersebar Rumor tentang Altcoin: Mantan Karyawan Berbicara Mengenai Hal Ini

Menurut laporan Sandmark, platform meme coin berbasis Solana, Pump.fun, diduga memecat sejumlah karyawan sekitar dua bulan sebelum jadwal unlock token $PUMP mereka. Setidaknya satu mantan karyawan dilaporkan kehilangan hak atas token senilai lebih dari $1 juta karena dipecat sebelum periode vesting. Disebutkan bahwa co-founder Noah Tweeddale menyatakan perusahaan "tumbuh terlalu cepat". Karyawan yang dipecat ditawarkan pesangon, tetapi kerugian utama justru pada hilangnya alokasi token $PUMP sesuai perjanjian yang ditandatangani Juni 2025. Gelombang PHK kedua dilaporkan terjadi pertengahan Juli, dengan total lebih dari 40 orang dipecat dalam dua bulan terakhir. Pendiri Pump.fun belum memberikan komentar. Pump.fun, yang memungkinkan pembuatan meme coin instan, telah mencatat pertumbuhan pesat dengan total pendapatan sekitar $1,3 miliar dan lebih dari 20,8 juta token dibuat. Pendapatan harian platform ini diklaim masih sekitar $1 juta.

cryptonews.ru48m yang lalu

Tersebar Rumor tentang Altcoin: Mantan Karyawan Berbicara Mengenai Hal Ini

cryptonews.ru48m yang lalu

Di Ethereum Terbentuk Antrian Staking Selama 43 Hari: Namun, Menurut Seorang Ahli, Ini Bukan Sinyal Bullish Sejati

Antrian untuk staking di Ethereum telah mencapai waktu tunggu sekitar 43 hari, dengan sekitar 2,5 juta ETH menunggu aktivasi. Lonjakan ini disebabkan oleh peningkatan minat validator, termasuk dari investor institusional. Namun, Thomas Brunner dari Sygnum Bank menyatakan bahwa antrian panjang ini bukanlah sinyal bullish langsung bagi harga ETH. Brunner menjelaskan bahwa antrian tersebut tidak hanya mencerminkan permintaan baru, tetapi juga dipengaruhi oleh mekanisme protokol Ethereum. Setelah pembaruan Dencun, kapasitas aktivasi validator dibatasi sekitar 57.600 ETH per hari, dan batas ini tidak dinaikkan dalam pembaruan Pectra. Pectra memungkinkan validator menambah hingga 2.048 ETH ke akun yang ada, tetapi transaksi tambahan ini tetap masuk ke antrian aktivasi yang sama, sehingga berkontribusi pada penumpukan. Menurutnya, sinyal pasar yang lebih kuat justru adalah antrian penarikan dana yang hampir kosong. Hal ini menunjukkan bahwa validator yang ada mempertahankan posisi mereka, yang mencerminkan kepercayaan terhadap jaringan. Saat ini, sekitar 41,2 juta ETH (33,8% dari total pasokan) telah di-stake. Brunner juga mencatat bahwa meskipun harga ETH melemah, minat institusional terhadap staking tetap kuat karena dianggap sebagai fitur fundamental. Namun, tantangan privasi masih menjadi hambatan besar, karena alamat validator dan transaksi dapat dilacak di blockchain, membuat investor institusi berhati-hati dalam meningkatkan operasi staking mereka.

cryptonews.ru1j yang lalu

Di Ethereum Terbentuk Antrian Staking Selama 43 Hari: Namun, Menurut Seorang Ahli, Ini Bukan Sinyal Bullish Sejati

cryptonews.ru1j yang lalu

Bank Korea Ungkap Hasil Pengujian Deposito Tokenisasi

Bank Korea (BOK) melaporkan hasil uji coba percontohan tokenisasi deposit. Uji coba ini melibatkan 28 bank sentral dan organisasi keuangan internasional. Dari Korea Selatan, bank yang berpartisipasi adalah KB Kookmin Bank, NH NongHyup Bank, Shinhan Bank, Woori Bank, dan Hana Bank. Transaksi dalam uji coba dilakukan secara real-time. Seluruh proses, mulai dari instruksi pembayaran hingga penyelesaian akhir, rata-rata hanya membutuhkan 1 menit 20 detik. Uji coba mencakup 30 transaksi dalam 17 skenario berbeda, termasuk transfer korporat dan antarbank, yang diselesaikan dalam enam mata uang seperti won Korea, dolar AS, dan euro. Nilai total transaksi mencapai sekitar 800.000 franc Swiss (sekitar $995.000). Platform uji coba, termasuk Project Agora, berfungsi dengan stabil meskipun hanya terhubung sebagian dengan infrastruktur perbankan yang ada. Transaksi dengan token deposit berjalan lancar, cepat, dan transparan. BOK juga berhasil menguji transfer internal 20 juta won antara NH NongHyup Bank dan Shinhan Bank, serta transaksi lintas negara antara KB Kookmin Bank dan MUFG Bank Jepang. Bank Korea berencana melanjutkan pengujian pembayaran menggunakan token deposit ini. Sementara itu, otoritas Korea Selatan sebelumnya telah berjanji untuk memperketat regulasi stablecoin berbasis won.

cryptonews.ru2j yang lalu

Bank Korea Ungkap Hasil Pengujian Deposito Tokenisasi

cryptonews.ru2j yang lalu

NKCBFU Membuka Detail Persiapan RUU tentang Kriptocurrency

Kepala Komisi Nasional untuk Sekuritas dan Pasar Modal Ukraina (НКЦБФР), Alexey Semenyuk, mengungkapkan bahwa rancangan undang-undang mengenai regulasi aset virtual di Ukraina telah 90% selesai dan ditargetkan rampung pada Agustus mendatang. Namun, beberapa isu kunci masih belum terselesaikan, termasuk aspek perpajakan dan status hukum aset kripto dalam proses pidana serta eksekusi. Poin-poin yang telah disepakati meliputi pembagian kewenangan regulator, dengan НКЦБФР sebagai regulator utama pasar aset virtual dan daftar tugas yang jelas untuk Bank Nasional. Klasifikasi aset virtual juga telah disetujui sesuai dengan regulasi Eropa MiCA, mencakup token terkait aset, token uang elektronik, dan aset virtual lainnya. Persyaratan perizinan untuk penyedia layanan, aturan prudensial (seperti modal dan penyimpanan aset klien), serta rezim khusus selama keadaan perang telah disepakati. Namun, negosiasi masih berlangsung mengenai detail perpajakan (tarif, dasar pengenaan, waktu kewajiban pajak, periode keringanan) dan status hukum aset virtual dalam konteks hukum pidana dan eksekutif. Masa transisi setelah undang-undang berlaku juga masih dibahas. Proses legislasi ini telah berlangsung selama beberapa tahun. RUU tersebut telah melewati pembacaan pertama di parlemen pada September 2025, namun mengalami banyak amandemen. Otoritas berharap draf final siap pada Agustus, dengan target implementasi per 1 Januari 2027.

cryptonews.ru2j yang lalu

NKCBFU Membuka Detail Persiapan RUU tentang Kriptocurrency

cryptonews.ru2j yang lalu

Trading

Spot

DeepSeek V4 Akhirnya Dirilis, Menghancurkan Monopoli Sumber Tertutup Terkuat, Secara Tegas Berkolaborasi dengan Chip Huawei

Abstrak

Pilihan Spesifikasi Tertinggi dan Hemat Biaya, Dua Versi Diluncurkan Bersamaan

Konteks 1 Juta Menjadi Standar

Optimisasi Khusus Kemampuan Agent

Harga API

One more thing

Pertanyaan Terkait

Bacaan Terkait

Bitcoin Sudah Capai Dasar, atau Akan Ada "Guncangan"? Bagaimana Situasi XRP?

Tersebar Rumor tentang Altcoin: Mantan Karyawan Berbicara Mengenai Hal Ini

Di Ethereum Terbentuk Antrian Staking Selama 43 Hari: Namun, Menurut Seorang Ahli, Ini Bukan Sinyal Bullish Sejati

Bank Korea Ungkap Hasil Pengujian Deposito Tokenisasi

NKCBFU Membuka Detail Persiapan RUU tentang Kriptocurrency

Trading

Kategori Populer

Tag Populer