Nilai Sebenarnya DeepSeek V4 Tidak Terletak pada Parameternya

marsbitDipublikasikan tanggal 2026-04-25Terakhir diperbarui pada 2026-04-25

Abstrak

DeepSeek V4 telah melampaui sekadar perdebatan parameter teknis, dan menunjukkan nilai strategisnya dalam adaptasi komputasi lokal Tiongkok. Model ini berhasil dijalankan secara efisien pada chip domestik seperti Huawei Ascend 910B dan Cambricon, mengatasi tantangan ekosistem perangkat lunak yang masih berkembang. Dengan arsitektur MoE dan mekanisme perhatian hybrid CSA+HCA, V4 mengoptimalkan penggunaan memori dan komputasi, mengurangi beban inferensi pada hardware lokal. Hal ini memungkinkan konteks panjang 1M token diproses dengan biaya lebih rendah, bahkan menawarkan harga yang kompetitif dibandingkan model sejenis. Keberhasilan adaptasi ini membuka jalan bagi perusahaan Tiongkok untuk mengurangi ketergantungan pada NVIDIA, terutama dalam inferensi skala besar—langkah kritis menuju otonomi AI yang berkelanjutan di tengah ketidakpastian pasokan global.

Oleh | Pabrik Model Dunia

DeepSeek V4 sekali lagi mengguncang seluruh China.

Skala parameter, panjang konteks, skor benchmark... indikator teknis ini telah dibandingkan berulang kali dalam berbagai laporan.

Tetapi jika hanya berhenti pada data permukaan, kita melewatkan inti strategis terpenting dari peluncuran ini.

Tiga tahun terakhir, model besar China selalu terperangkap dalam realitas yang canggung: pelatihan bergantung pada Nvidia, inferensi juga bergantung pada Nvidia, chip domestik hanya menjadi opsi cadangan.

Begitu Nvidia menghentikan pasokan, seluruh lingkaran model China akan cemas.

Tetapi hari ini, DeepSeek V4 membuktikan dengan kemampuan:

Sebuah model besar tingkat parameter triliunan yang mutakhir, juga dapat berjalan dengan stabil dan efisien pada komputasi domestik.

Makna hal ini telah melampaui indikator teknis model itu sendiri.

Terobosan Lokalisasi

Untuk benar-benar memahami kesulitan adaptasi lokalisasi ini, pertama-tama harus memahami kerajaan chip Nvidia.

Nvidia tidak hanya memiliki chip, tetapi juga ekosistem lengkap yang sangat tertutup:

Di sisi perangkat keras, ada keluarga chip GPU, ditambah NVLink, NVSwitch yang mewujudkan jaringan kecepatan tinggi interkoneksi antar chip;

Di sisi perangkat lunak, CUDA adalah sistem operasi AI yang dibangun dengan hati-hati oleh Nvidia selama belasan tahun.

Ini seperti pabrik yang sangat dioptimalkan, dari operator paling dasar (unit dasar perhitungan model), hingga komputasi paralel, manajemen memori, komunikasi terdistribusi, seluruh rantai disesuaikan khusus untuk GPU Nvidia.

Dengan kata lain, Nvidia tidak hanya menjual mesin, tetapi juga membangun jalan, pompa bensin, bengkel, sistem navigasi.

Hampir semua model besar global tumbuh di ekosistem ini.

Beralih ke komputasi domestik, yang dihadapi adalah situasi yang sama sekali berbeda.

Arsitektur perangkat keras berbeda, cara interkoneksi berbeda, kematangan tumpukan perangkat lunak berbeda, ekosistem alat masih terus mengejar.

DeepSeek ingin beradaptasi dengan chip domestik, sama sekali bukan sekadar mengganti mesin, tetapi seperti mengalihkan mobil balap yang sudah melaju kencang di jalan tol, ke jalan pegunungan yang masih dalam pengerasan.

Sedikit saja ceroboh, akan terjadi guncangan, kehilangan kecepatan, bahkan kendaraan tidak dapat melanjutkan.

Kali ini, DeepSeek V4 tidak memilih untuk hanya mengoptimalkan sepanjang jalur CUDA, tetapi mulai masuk bersamaan ke dalam rantai adaptasi tumpukan perangkat lunak komputasi domestik.

Dari informasi yang terbuka, V4 telah mencapai terobosan berdasarkan chip inferensi domestik, beradaptasi mendalam dengan chip Huawei Ascend 950, Cambricon juga dapat berjalan stabil pada hari peluncuran model, benar-benar mencapai adaptasi Day 0.

Ini berarti, model mutakhir mulai memiliki kemungkinan untuk diimplementasikan dalam sistem chip domestik.

Bagaimana DeepSeek V4 melakukannya?

Langkah pertama, terjadi di lapisan arsitektur model.

V4 tidak memilih untuk memaksakan chip domestik menanggung konteks 1M, tetapi pertama-tama membuat model itu sendiri lebih hemat.

Desain paling kunci dalam laporan teknis resmi, adalah mekanisme perhatian campuran CSA + HCA, serta optimasi konteks panjang seperti kompresi KV Cache.

Sederhananya, inferensi konteks panjang tradisional, adalah membiarkan model setiap kali menjawab pertanyaan, membuka seluruh perpustakaan untuk dibolak-balik, memori, bandwidth dan komputasi akan cepat penuh.

Cara V4, adalah pertama-tama mengindeks ulang, mengompres dan menyaring materi di perpustakaan, hanya memasukkan informasi paling kunci ke dalam rantai komputasi.

Dengan demikian, konteks 1M tidak lagi sepenuhnya bergantung pada kekerasan perangkat keras, tetapi pertama-tama melalui algoritma mengurangi beban komputasi dan memori.

Ini sangat kunci untuk chip domestik.

Jika model sangat bergantung pada bandwidth memori dan pustaka CUDA matang, chip domestik bahkan jika bisa berjalan, sulit untuk berjalan murah, berjalan stabil.

V4 pertama-tama mengurangi beban inferensi, pada dasarnya adalah meringankan tekanan pada komputasi domestik.

Langkah kedua, terjadi di lapisan arsitektur MoE dan parameter aktivasi.

V4-Pro meskipun total parameter mencapai 1,6 triliun, tetapi setiap inferensi hanya mengaktifkan sekitar 49 miliar parameter; V4-Flash total parameter 284 miliar, setiap aktivasi sekitar 13 miliar parameter.

Ini berarti tidak setiap panggilan menarik semua parameter untuk dihitung, tetapi seperti tim ahli besar, tugas datang hanya memanggil ahli terkait yang turun.

Untuk chip domestik, ini juga penting.

Ini mengurangi tekanan komputasi yang harus ditanggung setiap inferensi, juga membuat konteks panjang dan skenario Agent lebih mudah diterima oleh kartu inferensi.

Langkah ketiga, adalah adaptasi di lapisan operator dan Kernel.

Tempat terkuat ekosistem CUDA, adalah banyak komputasi dasar telah dipoles matang oleh Nvidia, banyak komputasi kinerja tinggi dapat langsung dipanggil.

Makna V4 terletak pada, sebagian komputasi kunci ditarik keluar dari kotak hitam Nvidia, menjadi jalur komputasi khusus yang lebih dapat bermigrasi, dapat diadaptasi.

Sedikit lebih通俗, V4 seperti membongkar part paling kunci dalam mesin, memungkinkan Huawei Ascend, Cambricon dan produsen lain menyesuaikan ulang sesuai struktur chip mereka sendiri.

Langkah keempat, adalah kerangka inferensi dan lapisan layanan.

Adaptasi chip domestik jika hanya berhenti pada "menjalankan Demo", tidak banyak makna industri. Yang benar-benar layak diperhatikan, adalah apakah dapat masuk ke sistem layanan yang dapat dipanggil, dapat ditagih.

Menurut pengujian internal, pada Ascend 950PR, kecepatan inferensi V4 meningkat signifikan dibandingkan versi awal, konsumsi energi juga turun jelas, kinerja single-chip dalam skenario presisi rendah tertentu mencapai lebih dari 2 kali lipat khusus H20 Nvidia.

DeepSeek resmi menyebutkan, saat ini V4-Pro terbatas pada komputasi high-end, throughput layanan terbatas, diperkirakan setelah super node Ascend 950 diluncurkan massal paruh kedua tahun ini, harga akan turun besar.

Ini menunjukkan, seiring dengan produksi massal perangkat keras domestik seperti Ascend, throughput dan rasio kinerja-harga V4 di masa depan akan lebih dioptimalkan.

Tetapi perlu dicatat, V4 tidak sepenuhnya menggantikan GPU dan CUDA Nvidia. Pelatihan model mungkin masih tidak dapat lepas dari Nvidia, tetapi inferensi sudah dapat dilokalkan secara bertahap.

Ini sebenarnya adalah jalur komersial yang sangat realistis.

Pelatihan adalah investasi bertahap, latih sekali, sesuaikan sekali, iterasi sekali. Inferensi adalah biaya berkelanjutan, setiap hari jutaan, miliaran panggilan pengguna, setiap kali harus menghabiskan komputasi.

Kepala pembakaran uang sesungguhnya perusahaan model, dalam jangka panjang akan semakin condong ke inferensi. Siapa yang dapat menanggung kebutuhan inferensi lebih murah, lebih stabil, akan mendapatkan keunggulan nyata dalam aplikasi industri.

DeepSeek V4 pertama kali membuat deployment inferensi model mutakhir China, muncul sebuah rute yang tidak mengambil CUDA Nvidia sebagai prasyarat default.

Langkah ini sudah cukup berbobot.

Dampak V4 pada Aplikasi Industri

Jika adaptasi chip domestik menjawab apakah bisa berjalan, maka harga menjawab pertanyaan lebih realistis lain:

Apakah perusahaan mampu menggunakannya?

Kehebatan DeepSeek sebelumnya, justru kemampuannya menekan kemampuan mendekati model mutakhir, ke harga sangat rendah.

Era V3, R1 begitu, V4 tetap begitu.

Perbedaannya, kali ini bukan perang harga dalam jendela konteks biasa, tetapi terus menekan harga dengan prasyarat konteks 1M + kemampuan Agent.

Menurut harga resmi DeepSeek:

Input V4-Flash cache hit 0,2 yuan / juta tokens, input cache miss 1 yuan / juta tokens, output 2 yuan / juta tokens;

Input V4-Pro cache hit 1 yuan / juta tokens, input cache miss 12 yuan / juta tokens, output 24 yuan / juta tokens.

Memasukkannya ke dalam model domestik sejenis:

Dibandingkan dengan Ali Qwen3.6-Plus di tingkat 256K-1M, harga output V4-Pro sekitar setengahnya, V4-Flash lebih rendah.

Dibandingkan dengan Xiaomi MiMo Pro Series di tingkat 256K-1M, V4-Flash dan V4-Pro jelas lebih murah.

Konteks Kimi K2.6 adalah 256K, dibandingkan, konteks V4-Pro lebih panjang, harga lebih rendah; V4-Flash langsung menekan biaya panggilan frekuensi tinggi ke tingkat lain.

Ini sangat berarti untuk aplikasi perusahaan.

Karena konteks 1M, berarti model dapat sekaligus membaca seluruh gudang kode, paket kontrak tebal, prospektus ratusan halaman, notulen rapat jangka panjang, atau status historis yang terakumulasi saat Agent menjalankan tugas terus menerus.

Banyak aplikasi perusahaan sebelumnya mentok di sini, kemampuan model cukup, tetapi konteks tidak cukup; konteks cukup, harga terlalu mahal; harga dapat diterima, kemampuan model tidak cukup stabil.

Misalnya, sebuah perusahaan membuat Agent penelitian investasi, ingin model membaca sekaligus laporan tahunan perusahaan, konferensi telepon laporan keuangan, laporan industri, berita pesaing dan notulen internal.

Ketika konteks hanya 128K atau 256K, sistem sering harus terus mengiris, mengambil, meringkas, informasi hilang dalam kompresi berulang.

Konteks 1M memungkinkan model mempertahankan lebih banyak bahan mentah, mengurangi kelalaian dan putus.

Misalnya lagi Agent kode.

Ini bukan menulis beberapa baris kode sekaligus, tetapi membaca gudang, memahami ketergantungan, memodifikasi file, menjalankan tes, memperbaiki berdasarkan error. Proses ini akan反复 menghabiskan tokens.

Jika setiap langkah sangat mahal, Agent hanya dapat menjadi demo, tetapi jika tokens cukup murah, baru mungkin masuk proses pengembangan nyata.

Ini juga nilai industri V4.

Ini belum tentu model terkuat, tetapi mungkin menjadi model frekuensi tertinggi perusahaan.

DeepSeek sekali lagi membuat AI dari mainan eksklusif pabrik besar少数, menjadi alat produktivitas yang dapat disebarkan secara skala besar oleh ribuan industri.

Nilai Sebenarnya V4

Ketika konteks 1M dengan harga sangat rendah menuju lini depan industri, nilai sebenarnya DeepSeek V4 baru terungkap.

Semua ini, dibangun di atas dasar komputasi domestik yang belum matang.

Menghadapi kesenjangan sistemik ekosistem chip domestik, tim DeepSeek tidak memilih menunggu ekosistem matang baru上线.

Mereka berulang kali menunda jendela peluncuran, menginvestasikan waktu berbulan-bulan, melakukan调试 bersama mendalam dengan mitra seperti Huawei, kesulitan rekayasa seperti ini, jauh melampaui bayangan luar.

Karena itu, V4 mencapai kemampuan inferensi dan Agent mendekati model tertutip顶级 pada komputasi domestik,显得格外不易.

V4 membuktikan dengan自身, bahkan menghadapi kesenjangan bertahap ekosistem perangkat keras, tim China masih dapat melalui investasi rekayasa极致 dan inovasi kolaboratif perangkat lunak-keras, menghasilkan kinerja kompetitif.

Tentu, jarak menuju kematangan penuh masih ada.

Kelengkapan toolchain platform Ascend, stabilitas cluster skala sangat besar, serta optimasi mendalam lebih banyak skenario vertikal, memerlukan usaha bersama各方 industri.

Tetapi kesuksesan V4, telah membentangkan jalur yang dapat ditiru untuk model后续.

Ini menyuntikkan penenang hati untuk otonomi dan kendali seluruh rantai pasokan AI.

Dalam lingkungan eksternal penuh ketidakpastian saat ini, ketahanan yang masih dapat突破 dalam batasan ini, lebih layak dihormati daripada indikator parameter belaka.

"Tidak tergoda oleh pujian, tidak takut pada fitnah, bertindak sesuai jalan, teguh meluruskan diri".

Tulisan dari resmi DeepSeek ini,正是 catatan terbaiknya.

Pertanyaan Terkait

QApa nilai strategis utama dari DeepSeek V4 menurut artikel ini?

ANilai strategis utamanya adalah kemampuan DeepSeek V4 untuk berjalan secara stabil dan efisien pada komputasi buatan dalam negeri, membuktikan bahwa model AI canggih skala triliun parameter tidak harus bergantung pada chip dan ekosistem Nvidia.

QApa saja tantangan teknis utama dalam mengadaptasi model besar ke chip buatan dalam negeri?

ATantangannya meliputi perbedaan arsitektur hardware, metode interkoneksi, kematangan software stack, dan alat-alat ekosistem yang masih dalam tahap pengembangan, mengharuskan adaptasi mendalam di tingkat arsitektur model, operator, kernel, dan framework.

QBagaimana desain arsitektur DeepSeek V4 membantu mengurangi beban komputasi pada chip domestik?

AV4 menggunakan mekanisme perhatian hybrid CSA + HCA dan kompresi KV Cache untuk mengoptimalkan konteks panjang, serta arsitektur MoE yang hanya mengaktifkan sebagian parameter selama inferensi, sehingga mengurangi tekanan pada memori dan bandwidth chip domestik.

QApa implikasi harga rendah DeepSeek V4 untuk aplikasi perusahaan?

AHarga yang rendah untuk konteks 1M token memungkinkan perusahaan menggunakan kemampuan Agent dan pemrosesan dokumen panjang secara terjangkau, membuka pintu untuk penerapan skala besar di berbagai industri seperti penelitian investasi dan pengembangan kode.

QApa arti kesuksesan adaptasi DeepSeek V4 pada komputasi domestik bagi industri AI China?

AKesuksesan ini memberikan keyakinan bagi industri bahwa melalui rekayasa intensif dan inovasi kolaboratif perangkat lunak dan keras, China dapat mencapai kinerja kompetitif bahkan dengan keterbatasan ekosistem hardware, mendorong kemandirian dan ketahanan rantai pasokan AI.

Bacaan Terkait

Setelah GPU dan Penyimpanan: MLCC Sedang Menjadi Perintis Pasar Triliunan Dolar Selanjutnya dalam Kekuatan Komputasi AI

**Ringkasan: MLCC – Pilar Tersembunyi di Balik Revolusi AI** Ketika fokus dunia tertuju pada GPU dan memori dalam perlombaan kekuatan komputasi AI, sebuah komponen kecil namun kritis justru mulai menanjak harganya: **Multilayer Ceramic Capacitor (MLCC)**. Dari komoditas murah, MLCC kini berubah menjadi bahan strategis. **Ledakan Permintaan dari AI dan Kendaraan Listrik:** * **Server AI** adalah penggerak utama. Dibanding server tradisional yang memakai ~2.000 MLCC, server pelatihan 8-GPU butuh 25.000-28.000 unit. Platform generasi baru seperti GB300 NVL72 butuh **440.000 unit**, dan Vera Rubin bisa mencapai **600.000 unit**. * Kebutuhan meledak karena GPU makin bertenaga dengan voltase rendah (<1V) dan arus tinggi (hingga 1.800A). MLCC berfungsi sebagai "penstabil" untuk menjamin daya listrik yang bersih dan stabil untuk chip. * **Kendaraan listrik** dan kendaraan otonom tingkat tinggi menjadi pilar kedua, dengan kebutuhan hingga 15.000-20.000 unit per mobil. **Pasokan Terbatas dengan Hambatan Tinggi:** Sisi pasokan sulit mengimbangi permintaan yang melesat 34% per tahun. Ekspansi kapasitas lambat (~10% per tahun) karena: 1. **Hambatan Teknologi & Modal:** Proses manufaktur sangat kompleks, membutuhkan mesin khusus dan material bubuk keramik mutakhir. Satu lini produksi canggih butuh investasi $3-5 miliar dan waktu 4-5 tahun untuk beroperasi penuh. 2. **Siklus Kualifikasi yang Panjang:** Kualifikasi untuk server AI butuh 12-18 bulan, sedangkan untuk otomotif 2-3 tahun, menciptakan keterikatan yang kuat dengan pemasok yang sudah ada. 3. **Disiplin Produsen:** Belajar dari siklus "boom-and-bust" sebelumnya, produsen utama kini lebih berhati-hati dalam menambah kapasitas untuk menjaga stabilitas harga jangka panjang. **Tiga Raksasa yang Mendominasi Pasar:** Pasar MLCC kelas tinggi dikuasai oleh tiga pemain utama: 1. **Murata (Jepang):** Pemimpin pasar dengan pangsa ~40% secara global dan 45-70% di segmen server AI. Pilihan utama untuk stabilitas dan kepastian. 2. **Samsung Electro-Mechanics (Korea Selatan):** Pemain dengan pertumbuhan dan ekspansi paling agresif, menawarkan potensi apresiasi tertinggi. 3. **Taiyo Yuden (Jepang):** Perusahaan dengan kemurnian eksposur tertinggi terhadap bisnis MLCC (~71% pendapatan), menjadikannya pilihan bagi yang menginginkan eksposur paling langsung ke sektor ini. **Kesimpulan:** MLCC, komponen yang selama ini diabaikan, telah menjadi garda depan dalam revolusi AI. Gabungan dari **permintaan eksponensial** (terutama dari server AI dan EV) dan **pasokan yang kaku** (karena hambatan teknologi dan disiplin industri) menciptakan kondisi untuk siklus super yang diperkirakan bertahan hingga 2030. Saat komputasi menjadi "minyak" era baru, MLCC adalah "pipa" vital yang mengatur setiap tetes listriknya.

marsbit23m yang lalu

Setelah GPU dan Penyimpanan: MLCC Sedang Menjadi Perintis Pasar Triliunan Dolar Selanjutnya dalam Kekuatan Komputasi AI

marsbit23m yang lalu

Baru saja, Claude Mythos 5 Rilis, 50 Juta Baris Kode Selesai dalam 1 Hari

Anthropic secara resmi meluncurkan model AI terkuat mereka, Claude Mythos 5, bersama versi aman bernama Claude Fable 5. Fable 5 tersedia untuk umum namun dilengkapi sistem keamanan yang secara otomatis menurunkan ke model Opus 4.8 jika mendeteksi permintaan berisiko tinggi seperti pembuatan malware atau riset biologi/kimia tertentu. Sementara itu, Mythos 5 yang "versi lengkap" hanya tersedia bagi pengguna terpercaya dengan kemampuan tak terbatas di bidang seperti keamanan siber dan penelitian ilmiah. Secara teknis, Fable 5 menunjukkan kemampuan luar biasa. Dalam pengujian SWE-bench Pro, ia mencetak 80.3%, mengungguli kompetitor. Kasus nyata dari Stripe menunjukkan Fable 5 dapat bermigrasi seluruh basis kode Ruby sebesar 50 juta baris hanya dalam 1 hari, pekerjaan yang biasanya membutuhkan tim engineering dua bulan. Model ini juga unggul dalam pemahaman visual, mampu menyelesaikan permainan Pokemon tanpa alat bantu, dan dalam tugas analisis finansial serta hukum. Di bidang penelitian, Mythos 5 menunjukkan lompatan besar. Model ini dapat menjalankan seluruh alur kerja ahli biologi secara mandiri, merancang senyawa protein, dengan 9 dari 14 desainnya sudah masuk pipeline pengembangan obat nyata. Dalam satu kasus, model kecil yang dilatih mandiri oleh Mythos 5 bahkan mengungguli penelitian terbaru yang diterbitkan di jurnal *Science*. Anthropic juga memperkenalkan perubahan paradigma keamanan, di mana kemampuan dan keamanan dipisahkan melalui sistem "klasifikasi dan penurunan model". Harga API untuk kedua model ini ditetapkan $10 per juta token input dan $50 per juta token output. Pengalaman pengguna awal, seperti dari profesor Ethan Mollick, mengindikasikan pergeseran pola kolaborasi manusia-AI. Pengguna merasa lebih seperti "klien" atau "pemberi kerja" yang memberikan tugas kompleks, sementara AI beroperasi secara mandiri seperti "studio" kecil yang menangani perencanaan dan eksekusi detail, menghasilkan produk akhir yang siap pakai.

marsbit1j yang lalu

Baru saja, Claude Mythos 5 Rilis, 50 Juta Baris Kode Selesai dalam 1 Hari

marsbit1j yang lalu

Yang Pertama Membawa AI OS ke 1,4 Miliar Orang, Ternyata WeChat?

AI WeChat Akhirnya Bergerak. Pada hari yang sama dengan WWDC Apple, WeChat merilis panduan bagi pengembang untuk mengintegrasikan aplikasi mini ke dalam ekosistem AI-nya. Pengembang kini dapat mengizinkan AI WeChat untuk membaca, mengoperasikan, dan memanggil fungsi aplikasi mini mereka. WeChat menawarkan dua mode integrasi: "Mode Otomatis" yang memungkinkan AI menganalisis kode dan halaman aplikasi mini tanpa coding tambahan, dan "Mode Pengembangan" untuk membuat Skill yang dikustomisasi. Langkah ini mengubah seluruh ekosistem WeChat—jutaan aplikasi mini, WeChat Pay, notifikasi layanan—menjadi lapisan eksekusi untuk AI. Dibandingkan dengan pendekatan Apple Siri yang perlu bernegosiasi dengan setiap aplikasi pihak ketiga, arsitektur terpusat WeChat memberinya "sudut pandang Tuhan." Setiap kode aplikasi mini melewati sistem WeChat, memungkinkan analisis otomatis dan penerjemahan menjadi alat yang dapat dipanggil AI. Keunggulan infrastruktur ini tidak dimiliki oleh Apple atau Google. Dengan 1,432 miliar pengguna aktif bulanan dan cakupan layanan harian yang luas melalui aplikasi mini, WeChat berpotensi menjadi sistem operasi yang dioperasikan dengan bahasa alami. Pengguna dapat memberi perintah seperti "pesan tiket kereta untuk besok," dan AI akan menjalankan tugas melalui aplikasi mini yang relevan. Meski tantangan seperti akurasi dan kepercayaan dalam transaksi tetap ada, WeChat telah membangun jaringan layanan yang matang. Pencapaian sejati AI Agent adalah penyelesaian tugas secara "tanpa disadari" oleh pengguna, dan WeChat berada paling dekat untuk mewujudkannya.

marsbit1j yang lalu

Yang Pertama Membawa AI OS ke 1,4 Miliar Orang, Ternyata WeChat?

marsbit1j yang lalu

Apple dengan Kapitalisasi Pasar 4 Triliun Dolar, Mengapa Tak Bisa Menghadirkan Siri yang Cerdas?

Penulis: Hu Shixin, Editor: Ye Jinyan Pada acara WWDC2026, Apple meluncurkan Apple Intelligence dan Siri AI yang diperbarui, menjawab pertanyaan tentang kemampuan AI perusahaan yang tertinggal. Siri AI yang baru didukung oleh teknologi model dasar dari kolaborasi dengan Google (Gemini), tetapi dijalankan pada model Apple sendiri yang dioptimalkan untuk perangkatnya. Siri kini dapat memahami konteks layar, data pribadi, dan menjalankan tugas di berbagai aplikasi, berubah dari asisten suara menjadi pusat operasi sistem. Namun, kemampuan yang ditunjukkan sebagian besar sudah umum di industri, dan fungsinya belum tersedia di UE dan Tiongkok daratan karena regulasi. Peluncuran ini dianggap sebagai upaya Apple untuk mengejar ketertinggalan setelah lambat merespons revolusi AI generatif, yang dipicu oleh kesuksesan ChatGPT. Artikel ini menelusuri "utang AI" Apple di era CEO Tim Cook, termasuk perkembangan Siri yang lambat sejak akuisisi tahun 2010, pergantian kepemimpinan yang sering, dan keterlambatan dalam pengembangan model dasar. Proyek Apple Intelligence sempat tertunda pada 2024 karena masalah stabilitas, mendorong reorganisasi tim dan kolaborasi dengan Google. Analis berpendapat bahwa tujuan utama Apple bukanlah menciptakan model terkuat, melainkan mempertahankan Siri sebagai pintu masuk utama di perangkatnya untuk mengontrol konteks pribadi pengguna dan potensi pendapatan masa depan. Masa depan pertumbuhan Apple bergantung pada kemampuannya membuktikan bahwa AI dapat mendorong siklus pergantian perangkat atau pendapatan layanan baru, sambil mengatasi tantangan pengembangan perangkat keras alternatif seperti kacamata pintar.

marsbit1j yang lalu

Apple dengan Kapitalisasi Pasar 4 Triliun Dolar, Mengapa Tak Bisa Menghadirkan Siri yang Cerdas?

marsbit1j yang lalu

Trading

Spot
Futures
活动图片