Sumber Dalam: DeepSeek Sedang Membentuk Tim Harness, Menyaingi Claude Code

链捕手Dipublikasikan tanggal 2026-05-22Terakhir diperbarui pada 2026-05-22

Abstrak

**DeepSeek Bentuk Tim 'Harness' untuk Hadapi Claude Code** Menurut informasi dari sumber dalam, DeepSeek sedang membentuk tim **Harness** baru yang difokuskan pada pengembangan produk agen kode pintar, dengan target internal menyaingi **Claude Code** dari Anthropic. Hal ini dikonfirmasi oleh peneliti senior DeepSeek, Chen Deli, melalui media sosial. DeepSeek membuka dua posisi kunci: **Manajer Produk Harness** dan **Insinyur Pengembangan Harness**, berpusat di Beijing. Inti dari inisiatif ini tercermin dalam rumus: **Model + Harness = Agent**. Perspektif ini menekankan bahwa model hanyalah fondasi, sementara kemampuan manajemen konteks, pemanggilan alat, perencanaan tugas, pembacaan/penulisan file, modifikasi kode, eksekusi terminal, dan penilaian umpan balik adalah kunci agar agen dapat benar-benar terintegrasi ke dalam alur kerja. DeepSeek, yang sudah lama berinvestasi dalam model kode seperti DeepSeek-Coder, kini berupaya melengkapi "lapisan tengah" yang menghubungkan model dengan alur kerja nyata. Kompetisi di bidang *AI Coding* telah bergeser dari sekadar kemampuan model menjadi perebutan pintu masuk ke alur kerja pengembang. Kehadiran proyek komunitas seperti **DeepSeek-TUI**—agen coding terminal sumber terbuka yang populer—membuktikan bahwa ada permintaan kuat untuk produk semacam Claude Code yang berbasis DeepSeek. Namun, proyek komunitas memiliki keterbatasan dalam hal sinkronisasi dengan evolusi model dan penciptaan umpan balik data pelatihan yang sistematis. D...

Penulis| Wang Bo, Jiazi Guangnian

"Jiazi Guangnian" memperoleh informasi dari sumber dekat DeepSeek bahwa secara internal, DeepSeek sedang mengorganisir sebuah Tim Harness baru, dengan arah produk agen kode, secara internal menyaingi Claude Code yang berada di bawah Anthropic.

Peneliti senior DeepSeek, Chen Deli, juga baru-baru ini mengonfirmasi hal ini melalui media sosial. Dia menyatakan, "DeepSeek sedang mengorganisir sebuah Tim Harness baru untuk melakukan produk dan riset di bidang Harness", dan secara langsung mengungkapkan, "Secara sederhana, ini adalah penyaingan terhadap Claude Code, untuk membuat DeepSeek Code Harness".

Ini bukan perekrutan biasa.

Informasi perekrutan menunjukkan, DeepSeek kali ini membuka dua posisi kunci: Manajer Produk Harness dan Insinyur Pengembangan Harness, dengan lokasi kerja saat ini terbatas di Beijing. Kantor DeepSeek di Beijing terletak di Rongke Information Center, Distrik Haidian, tidak jauh dari Universitas Peking dan Universitas Tsinghua. Dalam narasi resmi, lokasi ini berada di "Jalur Inovasi AI Jingzhang Seratus Tahun", sedangkan dalam narasi informal, lokasi ini juga berada di "Daerah Wang Huiwen" yang sedang hangat dibicarakan belakangan ini.

Definisi Inti: Model + Harness = Agen

Dalam deskripsi posisi, sebuah rumus inti ditempatkan di posisi yang paling menonjol:

Model + Harness = Agent

Kalimat ini hampir dapat dianggap sebagai definisi internal DeepSeek untuk jalur produkisasi tahap berikutnya: model itu sendiri hanyalah fondasi Agen, sedangkan manajemen konteks di luar model, pemanggilan alat, perencanaan tugas, pembacaan dan penulisan file, modifikasi kode, eksekusi terminal, pemulihan umpan balik, dan siklus evaluasi adalah bagian kunci yang memungkinkan Agen benar-benar memasuki alur kerja.

Informasi perekrutan lebih lanjut menulis: "Kami sedang mengubah kemampuan model mutakhir DeepSeek menjadi produk Agen yang terdepan. Semua pekerjaan di luar model itu sendiri termasuk dalam ranah Harness." Selain itu, posisi ini akan terlibat dalam seluruh proses "produk Agen desktop DeepSeek" dan "mendefinisikan pemahaman DeepSeek tentang Harness".

"Jiazi Guangnian" menganalisis, DeepSeek tidak sekadar ingin membuat plugin asisten kode, tetapi melengkapi lapisan perantara yang menghubungkan model dengan alur kerja nyata.

Tahun lalu, industri telah membuktikan: kemampuan kode yang kuat tidak berarti pengembang akan benar-benar menggunakannya; model yang bisa menulis kode tidak berarti bisa terus menyelesaikan tugas rekayasa.

Yang benar-benar mengubah cara kerja pengembang bukan model Claude tunggal, melainkan Claude Code; bukan model GPT tunggal, melainkan Codex; bukan jawaban kode dalam kotak obrolan, melainkan agen rekayasa yang mampu masuk ke terminal, memahami proyek, membaca dan menulis file, menjalankan perintah, memperbaiki kesalahan, mengelola Git, dan memanggil alat.

Yang paling kuat dari DeepSeek sebelumnya adalah model. Sekarang, ia mulai melengkapi lapisan "tangan" di atas model tersebut.

I. Mengapa DeepSeek Menekankan Harness?

Dalam konteks produk AI tradisional, "asisten kode" biasanya berarti dua jenis produk: satu adalah plugin penyelesaian otomatis di IDE, dan yang lainnya adalah tanya jawab kode dalam kotak obrolan.

Tetapi kata yang berulang kali muncul dalam perekrutan DeepSeek kali ini bukan Code Assistant, melainkan Harness.

Harness awalnya dalam konteks rekayasa merujuk pada "test harness" atau "execution framework". Dalam konteks Agen, ia lebih mendekati sistem eksternal yang membuat model benar-benar bertindak. Model bertanggung jawab untuk memahami, menalar, dan menghasilkan, sedangkan Harness bertanggung jawab untuk menghubungkan kemampuan ini ke lingkungan nyata.

Deskripsi posisi menyebutkan, peran ini perlu merencanakan peta jalan produk Harness DeepSeek, menghubungkan peneliti, insinyur, komunitas sumber terbuka, dan pengguna akhir, serta berkomunikasi mendalam dengan peneliti tim pelatihan model untuk mewujudkan evolusi bersama model dan Harness.

Kalimat ini sangat krusial.

Ini menunjukkan bahwa yang ingin dilakukan DeepSeek bukan hanya membungkus model yang ada dengan lapisan luar, tetapi menjadikan produk Agen itu sendiri sebagai bagian dari evolusi model. Di masa lalu, logika produk umum perusahaan model besar adalah: tim riset pertama melatih sebuah model, kemudian tim produk membuat aplikasi berdasarkan kemampuan model. Namun di era Agen, urutan ini mulai berubah. Produk tidak lagi hanya merupakan keluaran kemampuan model, tetapi juga ladang pelatihan kemampuan model.

Kegagalan sebuah Agen kode dalam proyek nyata mungkin bukan masalah interaksi produk, tetapi cara kompresi konteks panjang model yang salah; mungkin bukan masalah rantai pemanggilan alat, tetapi strategi dekomposisi tugas model yang tidak stabil; mungkin juga bukan karena kemampuan kode yang kurang, tetapi kurangnya pemahaman berkelanjutan terhadap batasan rekayasa, umpan balik pengujian, dan niat pengguna.

Oleh karena itu, nilai tim Harness bukan hanya "membuat produk", tetapi menjadikan tugas pengembangan nyata sebagai sumber umpan balik untuk evolusi berkelanjutan model.

II. Mengapa DeepSeek Harus Melengkapi Code Harness?

DeepSeek sudah lama bertaruh pada kemampuan kode. Dari DeepSeek-Coder hingga DeepSeek-Coder-V2, investasi DeepSeek dalam model kode terus ditingkatkan, mendukung peningkatan bahasa, panjang konteks, dan kemampuan tugas kompleks. Masalahnya bukan pada ada tidaknya kemampuan kode, tetapi kemampuan ini sebelumnya lebih banyak berada di lapisan model, belum menjadi produk frekuensi tinggi dalam alur kerja harian pengembang.

Kepopuleran Claude Code membuktikan satu hal: persaingan AI Coding sedang beralih dari persaingan kemampuan model ke persaingan pintu masuk alur kerja pengembang.

Ini juga merupakan pelajaran yang harus dilengkapi DeepSeek sekarang. Yang lebih halus adalah, sebelum DeepSeek resmi turun tangan, komunitas pengembang sudah lebih dulu membuat versi "Claude Code versi DeepSeek".

Sebuah proyek sumber terbuka bernama DeepSeek-TUI sebelumnya menjadi populer di komunitas pengembang. Ini adalah coding agent yang berjalan di terminal, dapat membaca dan menulis file, menjalankan perintah Shell, menjelajahi web, mengelola Git, dan mengoordinasikan sub-agent melalui antarmuka TUI.

Kepopuleran DeepSeek-TUI menunjukkan dua masalah:

  1. Kematangan Dasar Mental: Model DeepSeek dalam mental pengembang sudah memiliki dasar untuk menjadi Agen kode. Jika tidak, komunitas tidak akan secara alami menghasilkan produk seperti Claude Code di sekitarnya.

  2. Kekurangan di Tingkat Resmi: Yang kurang dari DeepSeek bukan perhatian pada model, tetapi Harness resmi.

Di mata pengembang, daya tarik DeepSeek-TUI sangat langsung: biaya rendah, dapat digunakan di dalam negeri, konteks panjang, dan ambang batas penyebaran relatif rendah. Banyak pengembang dalam negeri bukan tidak ingin menggunakan Claude Code, tetapi terbatas oleh harga, stabilitas akses, sistem akun, dan kepatuhan perusahaan.

Tetapi proyek komunitas juga memiliki batasan alami:

  • Sebuah proyek sumber terbuka pihak ketiga, seaktif apa pun, sulit untuk benar-benar menguasai ritme evolusi kemampuan internal model.

  • Dapat beradaptasi di sekitar API, tetapi tidak dapat secara terbalik menentukan bagaimana model dilatih.

  • Dapat melakukan prompt, rantai alat, dan optimasi interaksi, tetapi sulit untuk memasukkan umpan balik tugas nyata dalam jumlah besar secara sistematis ke dalam perbaikan model.

Makna Harness resmi justru ada di sini.

DeepSeek sendiri membuat Code Harness memiliki beberapa keunggulan yang tidak dimiliki proyek komunitas: kolaborasi tim model, hak desain antarmuka, siklus data pelatihan, skenario tugas nyata internal, serta kemampuan operasional jangka panjang terhadap ekosistem pengembang.

Komunitas sumber terbuka sudah lebih dulu menunjukkan jalannya: pengembang memang membutuhkan versi DeepSeek dari Claude Code. Sekarang, DeepSeek akan mengambil alih jalan ini dan menjadikannya produk utama mereka sendiri.

Dan fakta bahwa DeepSeek resmi mulai merekrut orang berarti akhirnya siap turun tangan sendiri.

Chen Deli pada November lalu di World Internet Conference Wuzhen Summit 2025 sudah menyebutkan: "Salah satu keunggulan inti perusahaan kami adalah jangka panjang, berpegang pada garis utama terobosan kecerdasan mutakhir. Dan dalam proses ini, kami juga meninggalkan banyak hal di jalur sampingan, tidak melakukan hal-hal jangka pendek dan cepat di jalur sampingan."

Setelah perang model, perang Agen yang sebenarnya dimulai. Kali ini DeepSeek harus melengkapi lapisan paling kritis antara model dan tindakan—Harness.

DeepSeek sedang memberikan sepasang tangan pada modelnya sendiri.

Pertanyaan Terkait

QApa yang dimaksud dengan 'Harness team' yang sedang dibentuk oleh DeepSeek?

ADeepSeek sedang membentuk tim 'Harness' baru yang fokus pada pengembangan produk agen kode cerdas. Tujuan tim ini adalah untuk menciptakan produk yang dapat bersaing dengan Claude Code dari Anthropic, dengan memperkuat kemampuan model DeepSeek menjadi agen yang dapat terintegrasi dalam alur kerja nyata developer.

QApa perbedaan utama antara 'model' dan 'harness' dalam konteks agen AI menurut artikel ini?

AMenurut artikel, rumus intinya adalah: Model + Harness = Agent. Model berfungsi sebagai fondasi dasar untuk pemahaman dan penalaran, sementara 'harness' adalah sistem eksternal yang menghubungkan kemampuan model ke lingkungan nyata. 'Harness' menangani manajemen konteks, pemanggilan alat, perencanaan tugas, pembacaan/penulisan file, modifikasi kode, eksekusi terminal, dan umpan balik, yang memungkinkan agen benar-benar berfungsi dalam alur kerja.

QMengapa DeepSeek perlu mengembangkan Code Harness sendiri meskipun sudah ada proyek komunitas seperti DeepSeek-TUI?

ADeepSeek perlu mengembangkan Code Harness resmi karena proyek komunitas seperti DeepSeek-TUI memiliki keterbatasan. Proyek komunitas tidak dapat secara langsung memengaruhi evolusi dan pelatihan model internal, sulit membuat umpan balik tugas nyata menjadi bagian dari peningkatan model, serta kurang memiliki kemampuan kolaborasi dengan tim model, hak desain antarmuka, dan operasi ekosistem developer jangka panjang. Harness resmi akan memungkinkan integrasi yang lebih dalam antara produk dan pengembangan model.

QApa saja peran kunci yang dibuka dalam rekrutmen tim Harness DeepSeek?

ADeepSeek membuka dua posisi kunci dalam rekrutmen tim Harness: *Harness Product Manager* dan *Harness R&D Engineer*. Posisi-posisi ini bertanggung jawab untuk merencanakan peta jalan produk, menghubungkan peneliti, insinyur, komunitas open source dengan pengguna, serta berkomunikasi mendalam dengan tim pelatihan model untuk mencapai evolusi bersama antara model dan harness.

QApa yang ditunjukkan oleh kesuksesan Claude Code menurut analisis artikel ini?

AKesuksesan Claude Code menunjukkan bahwa persaingan dalam AI Coding telah bergeser dari sekadar kompetisi kemampuan model menuju persaingan untuk menjadi pintu masuk (*entry point*) ke dalam alur kerja developer. Ini bukan lagi tentang seberapa baik model menulis kode, tetapi tentang seberapa efektif agen tersebut dapat masuk dan menyelesaikan tugas-tugas rekayasa yang berkelanjutan dalam lingkungan pengembangan yang sebenarnya.

Bacaan Terkait

Tiga Tahun Kemudian: Meninjau Kembali Penilaian Saya terhadap ChatGPT di Tahun 2023

Tiga tahun kemudian, pada Mei 2026, penulis meninjau kembali 20 prediksi tentang ChatGPT yang dibuatnya pada Maret 2023, menggunakan AI untuk mengevaluasi akurasinya berdasarkan data terbaru. Secara keseluruhan, arah dan mekanisme prediksi banyak yang tepat. Yang paling akurat adalah tentang RAG sebagai arsitektur standar, LUI (Antarmuka Pengguna Bahasa Alami) sebagai lapisan interaksi baru, munculnya "jaringan robot" (protokol untuk agen AI), dan kemampuan China mengejar ketertinggalan model AI besar. Prediksi bahwa ChatGPT bukan AGI namun langkah besar, tidak menyebabkan gelombang pengangguran massal, serta sifat uji Turing yang hanya mengukur persepsi juga pada dasarnya benar. Namun, prediksi dengan angka spesifik atau pernyataan mutlak sering meleset. Klaim bahwa GPT-4 memiliki 100 triliun parameter sepenuhnya salah. Pernyataan bahwa LLM "tidak mungkin" mengerjakan matematika murni terbantahkan dengan model penalaran yang memenangkan medali emas IMO. Estimasi biaya pelatihan model hanya $5-10 miliar juga jauh dari kenyataan, yang kini mencapai miliaran dolar untuk model terdepan. Beberapa prediksi keliru tentang distribusi dampak, seperti bahwa nilai akan berpindah ke lapisan aplikasi (nyatanya, penyedia chip seperti NVIDIA paling untung), atau bahwa AI akan "menghindari" masalah hak cipta (justru menimbulkan gugatan besar). Kesimpulan utama adalah: dalam memprediksi teknologi yang cepat berubah, mengidentifikasi arah dan mekanisme umumnya lebih bisa diandalkan daripada memberikan angka pasti atau pernyataan mutlak. Prediksi cenderung terlalu optimis tentang kecepatan perubahan jangka pendek, tetapi meremehkan besarnya perubahan jangka panjang. Penting juga untuk mempertimbangkan distribusi dampak, bukan hanya kesimpulan agregat. Pernyataan yang disertai batasan dan keraguan justru lebih tahan uji waktu. Beberapa pertanyaan mendasar masih belum terjawab setelah tiga tahun. Tinjauan ini berfungsi sebagai pelajaran untuk membuat prediksi yang lebih baik di tiga tahun mendatang.

marsbit4j yang lalu

Tiga Tahun Kemudian: Meninjau Kembali Penilaian Saya terhadap ChatGPT di Tahun 2023

marsbit4j yang lalu

Tiga Tahun Kemudian: Menilik Kembali Penilaian Saya terhadap ChatGPT pada 2023

Tiga tahun kemudian: Meninjau Kembali 20 Prediksi ChatGPT Saya pada 2023 Pada Maret 2023, penulis Wang Jianshuo membuat 20 prediksi intuitif tentang ChatGPT dan AI masa depan. Kini, di Mei 2026, sebuah sistem AI yang terdiri dari 41 agen menganalisis prediksi-prediksi tersebut berdasarkan data terkini. Hasilnya menunjukkan pola menarik. **Yang Terbukti Benar (Secara Umum):** * **RAG dan Arsitektur Pencarian (✅):** Solusi utama untuk pengetahuan dan halusinasi adalah dengan menambahkan "contekan" (RAG), bukan mengubah model. Arsitektur pencarian + LLM kini menjadi standar. * **LUI sebagai Benua Baru (🟢):** Antarmuka Pengguna Bahasa Alami (LUI) adalah lapisan interaksi baru yang besar, melahirkan industri agen dan protokol seperti MCP. * **Jaringan Robot dan Sistem Pengalamatan Baru (🟢):** Agen akan berkomunikasi otomatis dengan bahasa alami. Protokol seperti MCP dan ANP sedang mewujudkannya. * **Model Besar Tiongkok (🟢):** Model-model seperti DeepSeek dan Qwen telah mengejar ketertinggalan performa, meski dengan investasi lebih kecil. * **Tidak Ada Kesadaran, Tes Turing Hanya Ukur Penampilan (🟢):** AI tidak memiliki kesadaran. Tes Turing hanya mengukur ilusi kesadaran. * **Prediksi Lain yang Benar:** ChatGPT bukan AGI, tapi lompatan besar; gelombang pengangguran besar tidak terjadi; tahun besar untuk startup; momen "browser 1994" telah tiba. **Yang Kurang Tepat atau Salah:** * **Parameter GPT-4 (❌):** Prediksi 100 triliun parameter salah. Estimasi terbaru sekitar 1,8 triliun. * **Matematika di LLM (🟡):** Diagnosis bahwa matematika adalah kelemahan intrinsik dan memerlukan alat bantu benar. Namun, pernyataan "tidak mungkin" ditingkatkan terbukti salah, karena model kini bisa memenangkan medali emas Olimpiade Matematika Internasional (IMO). * **Penangkapan Nilai (🟡):** Aplikasi memang berkembang pesat, tetapi nilai terbesar justru ditangkap oleh lapisan komputasi (seperti Nvidia), bukan oleh pembuat model. * **Hak Cipta (🟡):** Konten AI sulit didaftarkan hak cipta, tetapi tidak serta-mata "menghindari" pelanggaran. Gugatan dan penyelesaian besar (misalnya, Anthropic $1,5 miliar) membuktikan risikonya. * **Biaya Model (🟡):** Prediksi "perang lokal" dengan biaya $5-10 miliar untuk model canggih terbukti salah. Biaya pelatihan model terdepan (seperti GPT-5) jauh lebih tinggi, sementara biaya kloning model terbuka justru bisa lebih murah. **Pola dan Pelajaran:** 1. **Arah dan mekanisme lebih dapat diandalkan daripada angka pasti dan pernyataan mutlak.** 2. **Cenderung terlalu optimis untuk jangka pendek (kecepatan), tetapi terlalu konservatif untuk jangka panjang (skala/dampak).** 3. **Kesalahan sering terjadi pada distribusi, bukan pada total.** Contoh: Tidak ada gelombang pengangguran masif, tetapi dampak berat dirasakan oleh lulusan baru. 4. **Pernyataan yang disertai batasan dan ruang ketidakpastian justru lebih tahan uji waktu.** 5. **Beberapa pertanyaan mendasar masih belum terjawab setelah tiga tahun.** Kesimpulannya, prediksi tentang arah besar dan mekanisme cenderung akurat, sementara prediksi spesifik tentang angka, kecepatan, dan distribusi dampak lebih sering meleset. Latihan ini lebih merupakan pelajaran dalam kerendahan hati dan penilaian yang bernuansa daripada sekadar penghitungan skor.

链捕手6j yang lalu

Tiga Tahun Kemudian: Menilik Kembali Penilaian Saya terhadap ChatGPT pada 2023

链捕手6j yang lalu

Peringatan Gelembung AI: Investasi AI Merupakan Pengembalian Negatif bagi Kebanyakan Raksasa Teknologi

Peringatan Gelembung AI: Investasi AI Membawa Pengembalian Negatif bagi Sebagian Besar Raksasa Teknologi Demam AI kini memasuki tahap pemeriksaan keuangan. Raksasa cloud seperti Microsoft, Alphabet, Amazon, Meta, dan Oracle berencana menginvestasikan ratusan miliar dolar ke pusat data AI dalam lima tahun ke depan. Namun, analisis terhadap proyeksi pendapatan dan pengeluaran modal (capex) hingga 2030 mengungkap masalah: tingkat pengembalian investasi implisit diperkirakan sangat negatif bagi semua perusahaan kecuali Amazon, bahkan dalam skenario optimis ekstrem. Ini menunjukkan bahwa jika tren saat ini berlanjut, boom AI bisa menjadi salah satu peristiwa perusakan nilai pemegang saham terbesar. Ada dua jalan keluar: pendapatan yang jauh melebihi ekspektasi saat ini, atau pengurangan rencana investasi. Jalan pertama tampaknya mustahil, karena membutuhkan tambahan pendapatan triliunan dolar. Jalan kedua—pemotongan investasi—akan berdampak luas, meruntuhkan harga saham perusahaan-perusahaan teknologi global dan dapat mendorong ekonomi AS ke resesi, mengingat 93% pertumbuhan PDB AS belakangan ini didorong oleh investasi teknologi. IPO perusahaan AI seperti OpenAI dan Anthropic tahun ini bisa menjadi mekanisme transfer risiko, memindahkan ketidakpastian dari pemilik awal kepada investor ritail dan dana pensiun. Sementara euphoria pemasaran mungkin bertahan hingga setelah IPO tahun 2026, tekanan matematika yang tak terelakkan mungkin memaksa raksasa cloud mengumumkan pemotongan investasi pada 2027 atau 2028, mirip dengan jeda tiga tahun antara peringatan "irrational exuberance" Alan Greenspan pada 1996 dan pecahnya gelembung dotcom pada 2000.

marsbit7j yang lalu

Peringatan Gelembung AI: Investasi AI Merupakan Pengembalian Negatif bagi Kebanyakan Raksasa Teknologi

marsbit7j yang lalu

Dari Token ke Tenaga Kerja Mesin: AI Sedang Berubah dari Alat Menjadi 'Pekerja'

Dari Token ke Tenaga Kerja Mesin: AI Berubah dari Alat Menjadi "Pekerja" AI mulai menulis kode, menangani tiket dukungan pelanggan, dan meninjau dokumen hukum. Artikel ini mengusulkan kerangka baru: komersialisasi AI sedang bergerak menuju "pasar tenaga kerja mesin". Dalam pasar ini, token hanyalah unit pengukuran, GPU adalah bahan baku, dan model adalah alat produksi. Objek yang benar-benar ditetapkan harganya dan diperdagangkan adalah kerja ekonomi yang diselesaikan langsung oleh perangkat lunak. Mekanisme penetapan harga AI akan berkembang dari token mentah, kemampuan model yang terstandarisasi, tenaga kerja yang terspesialisasi industri, hingga pasar hasil yang dapat diprogram. Di masa depan, perusahaan mungkin tidak lagi peduli model atau GPU mana yang menyelesaikan suatu tugas, tetapi lebih pada apakah tugas itu diselesaikan dalam batas latensi, akurasi, keandalan, dan biaya yang ditentukan. Implikasinya, dampak AI pada pasar tenaga kerja manusia tidak hanya sekadar penggantian. Saat mesin mengambil alih lebih banyak pekerjaan yang dapat distandardisasi dan diverifikasi, peran manusia mungkin bergeser ke pengawasan, penanggung jawab, manajemen konteks, dan keputusan akhir. Dalam beberapa kasus, penilaian manusia untuk 1% akhir justru menjadi lebih berharga karena dapat membuka kunci 99% otomatisasi skala besar. Pasar AI adalah pasar ekspansif. Ketika biaya kerja turun, permintaan tidak tetap. Jika interaksi dukungan pelanggan menjadi lebih murah, perusahaan dapat menawarkan layanan 24/7, menciptakan pasar interaksi pelanggan yang lebih besar. Persaingan tahap berikutnya di pasar AI mungkin bukan lagi sekadar pertarungan kemampuan model atau perang harga daya komputasi, tetapi tentang siapa yang dapat pertama kali menstandarisasi, memverifikasi, dan menetapkan harga "pekerjaan", akhirnya menjadikan tenaga kerja mesin sebagai faktor produksi baru yang dapat dibeli, diselesaikan, dan diperdagangkan.

marsbit7j yang lalu

Dari Token ke Tenaga Kerja Mesin: AI Sedang Berubah dari Alat Menjadi 'Pekerja'

marsbit7j yang lalu

Diskon 99% untuk MiMo Bukan Hanya Pemasaran! Luo Fuli Membantah Para Pengecam di X

**Ringkasan:** Xiaomi MiMo memotong harga API MiMo-V2.5 hingga **99%**, memicu spekulasi tentang perang harga atau strategi merugi. Luo Fuli, kepala MiMo, merespons dengan mempublikasikan blog teknis 5000 kata yang merinci **enam pilar teknikal** di balik potongan harga besar ini. Intinya, diskon 99% terutama untuk **Input (Cache Hit)** – bagian dimana pengguna membaca ulang konteks historis dalam percakapan panjang. Ini menjadi mungkin karena serangkaian optimasi teknikal yang mengubah biaya komputasi untuk bagian tersebut mendekati nol. **Enam Pilar Teknikal:** 1. **Arsitektur Hybrid SWA:** Menggunakan Sliding Window Attention di sebagian besar lapisan model, mengurangi volume **KVCache** (memori jangka pendek model) hingga **1/7**. 2. **Manajemen KVCache Dua Kolam:** Mengalokasikan memori secara terpisah untuk lapisan SWA dan Full Attention, benar-benar mewujudkan penghematan teoretis 1/7 dan meningkatkan jumlah pengguna yang dapat dilayani secara bersamaan. 3. **Prefix Cache yang Dioptimalkan:** Meningkatkan aturan pencocokan cache untuk arsitektur SWA, menghasilkan **tingkat keberhasilan cache 93-95%** untuk pembacaan ulang. Artinya, sebagian besar permintaan "baca ulang" tidak memerlukan komputasi GPU baru. 4. **Sistem Cache Terdistribusi GCache:** Menyimpan data cache di **SSD bawaan mesin GPU**, menghilangkan biaya penyimpanan cluster khusus dan memperpanjang masa hidup cache. 5. **Sistem Penjadwalan LLM-Router:** Mengarahkan permintaan secara cerdas berdasarkan kesamaan prefix dan panjang konteks, memprioritaskan permintaan yang menggunakan cache, meningkatkan efisiensi dan mengurangi latensi. 6. **Multi-Token Prediction (MTP):** Mengoptimalkan proses generasi output model, mempercepat pembuatan respons dan melengkapi pengurangan biaya di sisi input. **Kesimpulan:** Penurunan harga 99% bukanlah gimmick pemasaran atau strategi merugi, tetapi hasil dari **efisiensi sistemik rekayasa AI** yang telah divalidasi di lingkungan produksi. Rantai optimasi ini secara kumulatif mengurangi biaya komputasi per permintaan hingga lebih dari 95%, memungkinkan penurunan harga ekstrem sambil mempertahankan profitabilitas. Luo Fuli menekankan bahwa ini adalah masalah teknikal yang terwujud, bukan sekadar perang harga.

marsbit9j yang lalu

Diskon 99% untuk MiMo Bukan Hanya Pemasaran! Luo Fuli Membantah Para Pengecam di X

marsbit9j yang lalu

Trading

Spot
Futures
活动图片