Oleh | Pabrik Model Dunia
Sekarang internet China hanya menyisakan satu tanda tanya: Apakah DeepSeek V4 akan dirilis atau tidak?
Selama lebih dari setahun terakhir, persaingan model global telah memasuki mode pertarungan sengit.
Raksasa seperti OpenAI, Anthropic, Google pada dasarnya mempertahankan iterasi besar setiap 2-3 bulan bahkan 1 bulan sekali, versi baru dengan cepat diluncurkan ke pasar untuk divalidasi, diiterasi, dan divalidasi lagi.
Sementara DeepSeek dalam 15 bulan terakhir, pembaruan versi besar melambat, V4 berkali-kali ditunda, ritme jelas tertinggal, telah berubah dari pelopor industri menjadi yang tertinggal setengah langkah.
Kecemasan menunggu berubah menjadi pusaran prasangka.
Awal April, beberapa media tiba-tiba menyebarkan kabar: V4 mungkin dirilis dalam beberapa minggu ke depan, tetapi jangan terlalu berharap tinggi pada DeepSeek V4.
Mengapa rilis yang telah lama dinantikan, harus diberikan penanganan dini?
Apa yang sebenarnya terjadi pada DeepSeek selama setahun ini?
Tanggung Jawab Lokalisasi
Kebenaran mungkin tersembunyi dalam sebuah berita yang diabaikan kebanyakan orang.
Januari 2025, laporan Reuters mengungkap sebuah detail: Setelah Deepseek R1 dirilis, departemen terkait mendorong DeepSeek untuk menggunakan prosesor Huawei Ascend, bukan terus menggunakan Nvidia.
Kata "mendorong", dalam konteks saat itu, bobotnya jauh melebihi makna harfiah.
DeepSeek bukan perusahaan startup biasa, ia adalah contoh sukses pertama China AI untuk mematahkan blokade teknologi AS.
Makna simbolis ini, membuat DeepSeek dengan cepat berubah dari perusahaan teknologi menjadi bidak kunci dalam papan catur strategi mandiri dan terkendali negara.
Kemudian, pada bulan Februari, Liang Wenfeng menghadiri pertemuan bisnis swasta yang sangat dinantikan.
Dia diatur duduk di baris pertama, bersama Ma Huateng, Ren Zhengfei, Lei Jun dan lainnya, berdampingan menjadi perwakilan tim nasional produktivitas baru.
Gigi pengarah kebijakan, mulai berputar dari sini.
Menurut laporan media asing, DeepSeek pada awal 2025 memang mencoba menggunakan chip Huawei Ascend 910C untuk melatih model generasi berikutnya.
Tapi prosesnya mengalami banyak kendala teknis: Stabilitas pelatihan tidak cukup, sering crash dalam skenario terdistribusi skala besar, kecepatan komunikasi antar chip tidak memenuhi harapan.
Huawei mengirim tim insinyur ke lokasi kantor DeepSeek untuk memberikan dukungan langsung, akhirnya masih belum bisa menyelesaikan masalah adaptasi tahap pelatihan.
Hasilnya adalah kompromi, DeepSeek pada tahap pelatihan tetap beralih kembali ke GPU Nvidia, chip Ascend hanya digunakan untuk link inferensi.
Ini berarti, setidaknya pada link inti pelatihan ini, DeepSeek menggunakan hampir satu tahun untuk trial and error.
Tapi pekerjaan adaptasi tidak berhenti. Tahun 2026, versi V4 mengeluarkan动向 baru.
Menurut爆料, DeepSeek tidak memberikan izin pengujian terbuka lebih awal kepada Nvidia, malah memprioritaskan versi pra-rilis untuk diadaptasi ke chip Huawei Ascend 950PR generasi baru.
Sekaligus untuk menyebarkan risiko, juga secara bersamaan mengadaptasi chip Cambricon.
Tapi tantangan teknis masih signifikan.
Menurut laporan media, target kali ini adalah menyelesaikan migrasi dari tingkat kode底层, sepenuhnya bermigrasi dari ekosistem CUDA Nvidia ke framework CANN Huawei, mencapai penggantian lokalisasi penuh untuk pelatihan dan inferensi.
Menurut orang yang dekat dengan proyek, inti kesulitan pekerjaan adaptasi terletak pada penyelarasan akurasi, memastikan model output konsisten di bawah ekosistem perangkat keras yang berbeda, ini melibatkan banyak penyesuaian kode底层.
Biaya waktu由此产生.
Saat vendor主流 global mempertahankan ritme iterasi model 2-3 bulan, DeepSeek justru semakin lambat, selama ini mungkin proporsi相当 besar sumber daya teknis diinvestasikan untuk adaptasi chip lokal.
Lagi pula chip lokal dan Nvidia确实存在差距 dalam kinerja generasi, kematangan ekosistem, kelengkapan toolchain, proses adaptasi model memakan waktu巨大.
Ini membentuk perbedaan jelas dengan jalur DeepSeek yang awalnya murni mengejar peningkatan kinerja model.
Hubungan rantai industri层面 juga terjadi secara bersamaan.
Awal 2026, pasar传出 Alibaba, ByteDance, Tencent telah memesan ratusan ribu chip Ascend 950PR ke Huawei.
一种猜测 yang masuk akal adalah: Vendor cloud teratas sedang menunggu hasil verifikasi DeepSeek V4, untuk menilai kegunaan aktual chip lokal dalam pelatihan AI skala besar.
Jika V4 berhasil dijalankan, Huawei 950PR akan berubah dari sampel teknis menjadi produk yang dapat dikomersialkan. Jika tidak memenuhi harapan, setara dengan menjelaskan batas kemampuan chip lokal saat ini untuk industri.
Mempertimbangkan standar Liang Wenfeng yang一贯极高 terhadap rilis model, tidak mencapai harapan绝不发, V4 akhirnya即将亮相,很可能 di sisi inferensi telah lulus uji efek.
Jika真的验证成功, ini akan menjadi langkah kunci DeepSeek bahkan seluruh AI China beralih ke mandiri dan terkendali.
Biaya Transformasi Identitas
DeepSeek secara aktif mengambil tanggung jawab verifikasi ekosistem komputasi lokal, pilihan ini membuatnya lebih seperti perusahaan misi negara, bukan pemain市场化 yang murni mengejar keuntungan.
Tapi biaya transformasi jelas terlihat: Perlambatan ritme jangka pendek, tekanan talenta增大, daya saing暂缓.
Berdasarkan data evaluasi independen dan komunitas多家 pada Maret-April 2026, DeepSeek dalam pengujian patokan pihak ketiga, kemampuan generasi kode telah secara signifikan dilewati oleh seri Claude 4 (Opus 4.6 / Sonnet 4.6).
Kemampuan pemrosesan multimodal DeepSeek juga terutama terbatas pada teks + gambar, jauh tertinggal dari performa Claude dan GPT dalam analisis gambar, penggunaan komputer, dan pemahaman video.
Memasuki 2026, DeepSeek mengalihkan fokus produk ke rekayasa sistem Agent yang lebih menantang.
Berdasarkan umpan balik komunitas saat ini, DeepSeek di bidang Agent kode dan Agent pencarian China已接近梯队 pertama, tetapi dalam kolaborasi多工具, eksekusi tugas长链路 serta ketahanan lingkungan nyata, masih存在明显的差距 rekayasa sistem dengan model顶尖 internasional seperti OpenAI, Google.
差距 ini, belum tentu kemunduran kemampuan teknis, lebih seperti hasil pertimbangan setelah membuat trade-off antara persaingan pasar dan strategi negara.
Biaya层面组织 juga显性.
Sejak paruh kedua 2025, anggota tim inti DeepSeek mulai出现松动.
Menurut konfirmasi晚点LatePost, Wang Bingxuan (penulis inti model besar generasi pertama), Guo Daya (penulis inti R1), Wei Haoran (kepala OCR), Ruan Chong (kepala multimodal)相继离职.
Nama-nama ini di belakangnya, adalah endapan teknis DeepSeek dari V1 ke R1.
Penyebab hilangnya kompleks, tetapi kelemahan relatif sistem remunerasi adalah faktor显性.
Headhunter mengungkap, kondisi yang ditawarkan pesaing adalah "dua sampai tiga kali lipat" DeepSeek, sebagian pabrik besar langsung memberikan paket total delapan digit.
DeepSeek sebagai perusahaan startup yang tidak didanai eksternal (perusahaan induk adalah幻方量化), meskipun remunerasi absolut tidak rendah, tetapi tidak dapat mencocokkan insentif ekuitas dan premium valuasi raksasa市场化 seperti ByteDance, Alibaba, Tencent.
Liang Wenfeng已开始 mendorong pekerjaan valuasi perusahaan,明确 penetapan harga opsi, memberikan更多确定感 kepada tim.
Tapi di latar belakang rekan sejawat seperti智谱, MiniMax上市, harga saham高涨, tekanan untuk mempertahankan talenta顶尖依然不小.
DeepSeek saat ini sedang陷入一种 identitas yang模糊.
Ia仍然需要 dikomersialkan,仍然需要 mempertahankan talenta, tetapi pada saat yang sama juga diberi harapan adaptasi lokalisasi.
Konflik yang dibawa oleh identitas ganda ini, mungkin正是 logika mendalam DeepSeek yang semakin lambat selama setahun ini.
Oleh karena itu, harapan kinerja pasar terhadap V4 juga下调.
Ia belum tentu menjadi model bom yang再次刷屏, tetapi mungkin是一个 tonggak sejarah产业, membuktikan bahwa model前沿 China dapat mencapai tingkat可用 pada ekosistem perangkat keras lokal.
Jawaban V4, untuk arah jangka panjang industri AI China可能更为重要.







