# Artikel Terkait Kode

Pusat Berita HTX menyediakan artikel terbaru dan analisis mendalam mengenai "Kode", mencakup tren pasar, pembaruan proyek, perkembangan teknologi, dan kebijakan regulasi di industri kripto.

Tim NVIDIA Membuat Agent Pemrograman Mengambil Alih Eksperimen Robot Nyata, Tingkat Keberhasilan Mencapai 99%

Penelitian otomatis telah melampaui sandbox kode dan memasuki dunia fisik nyata. NVIDIA GEAR Lab, dipimpin Jim Fan, memperkenalkan proyek ENPIRE yang memungkinkan **penelitian otomatis pertama kali diimplementasikan pada perangkat keras robot**. Delapan Codex Agent ditempatkan dalam armada robot dengan alokasi daya komputasi GPU dan anggaran token, diberi tujuan sederhana: menyelesaikan tugas secepatnya, menjaga robot tetap sibuk namun aman, serta tidak menyia-nyiakan daya komputasi. Manusia kemudian mundur dari intervensi. Agent secara mandiri menggerakkan siklus tertutup penuh: mereset ulang skenario, menelusuri literatur, mengimplementasikan ide dan membangun infrastruktur, melatih dan menerapkan strategi, memvalidasi diri, menganalisis log serta memperbaiki kode, beriterasi terus hingga tugas ketangkasan presisi tinggi seperti mengikat kabel, merapikan pin dalam kotak, atau memasang GPU dapat diselesaikan andal di perangkat keras nyata dengan **tingkat keberhasilan 99%**. Sistem ENPIRE terdiri dari empat modul inti yang membentuk loop umpan balik fisik: Environment (EN), Policy Improvement (PI), Rollout (R), dan Evolution (E). Penelitian menemukan bahwa **mereset lingkungan sering kali lebih mudah daripada menyelesaikan tugas itu sendiri**. Peningkatan paralelisme robot (dari sedikit menjadi 8 unit) mempercepat penyelesaian tugas secara signifikan, menunjukkan "hukum penskalaan fisik". Tim juga memperkenalkan metrik baru: Mean Robot Utilization (MRU) dan Mean Token Utilization (MTU), yang mengungkapkan bahwa waktu menganggur robot dan efisiensi konversi token menjadi kemajuan penelitian adalah kendala nyata. Beberapa sistem lab telah mampu beriterasi mandiri semalaman tanpa campur tangan manusia. Tujuan masa depan adalah memungkinkan tim berlibur dengan tenang sementara lab terus berjalan secara otonom. Proyek ENPIRE rencananya akan sepenuhnya sumber terbuka.

marsbitKemarin 00:37

Tim NVIDIA Membuat Agent Pemrograman Mengambil Alih Eksperimen Robot Nyata, Tingkat Keberhasilan Mencapai 99%

marsbitKemarin 00:37

Terbaru! Anthropic Serukan Semua Pihak untuk Hentikan Penelitian AI

**Ringkasan Artikel: Anthropic Serukan Penghentian Penelitian AI** Anthropic baru saja mempublikasikan temuan mengejutkan melalui blog resmi mereka: AI telah memulai proses evolusi mandiri, atau *recursive self-improvement* (RSI). Data internal menunjukkan bahwa model mereka, Claude, kini menulis lebih dari 80% kode yang digunakan di internal Anthropic—lonjakan drastis dari sebelumnya yang hanya berupa angka tunggal. Produktivitas insinyur melonjak delapan kali lipat per kuartal pada 2026 dibandingkan periode 2021-2025, didorong oleh kemampuan coding Claude. Yang lebih mengkhawatirkan adalah peningkatan kualitas dan kreativitasnya. Dalam tugas pemrograman yang kompleks dan terbuka, tingkat keberhasilan Claude naik dari 26% menjadi 76% hanya dalam enam bulan. Claude bahkan kini digunakan untuk mereview kode, berhasil mencegah sepertiga bug yang sebelumnya lolos dari insinyur manusia. Anthropic memperkenalkan metrik baru: "durasi tugas perangkat lunak yang dapat diselesaikan AI secara mandiri." Kemampuan ini berlipat ganda setiap empat bulan. Jika tren berlanjut, pada 2027 AI dapat mengerjakan proyek yang memakan waktu manusia berminggu-minggu. Peran manusia dalam pengembangan AI semakin menyempit, dari penulis kode, reviewer, hingga pelaksana eksperimen. Keunggulan terakhir manusia saat ini mungkin hanya "selera penelitian," namun ini bisa saja segera tersaingi. Anthropic menggarisbawahi tiga kemungkinan masa depan RSI: stagnasi, akselerasi dengan kendali manusia, atau AI yang sepenuhnya mendesain generasi penerusnya sendiri—sebuah skenario yang membawa manfaat besar sekaligus risiko kegagalan *alignment* dan kehilangan kendali. Oleh karena itu, Anthropic secara terbuka menyerukan perlambatan atau bahkan jeda dalam perlombaan pengembangan AI, **asalkan ada mekanisme terverifikasi yang dapat memastikan semua laboratorium AI mematuhinya**. Seruan ini mendapat gema dari OpenAI yang juga mengaku melihat tanda-tanda awal RSI dalam sistem mereka.

marsbit06/05 00:30

Terbaru! Anthropic Serukan Semua Pihak untuk Hentikan Penelitian AI

marsbit06/05 00:30

Sumber Dalam: DeepSeek Sedang Membentuk Tim Harness, Menyaingi Claude Code

**DeepSeek Bentuk Tim 'Harness' untuk Hadapi Claude Code** Menurut informasi dari sumber dalam, DeepSeek sedang membentuk tim **Harness** baru yang difokuskan pada pengembangan produk agen kode pintar, dengan target internal menyaingi **Claude Code** dari Anthropic. Hal ini dikonfirmasi oleh peneliti senior DeepSeek, Chen Deli, melalui media sosial. DeepSeek membuka dua posisi kunci: **Manajer Produk Harness** dan **Insinyur Pengembangan Harness**, berpusat di Beijing. Inti dari inisiatif ini tercermin dalam rumus: **Model + Harness = Agent**. Perspektif ini menekankan bahwa model hanyalah fondasi, sementara kemampuan manajemen konteks, pemanggilan alat, perencanaan tugas, pembacaan/penulisan file, modifikasi kode, eksekusi terminal, dan penilaian umpan balik adalah kunci agar agen dapat benar-benar terintegrasi ke dalam alur kerja. DeepSeek, yang sudah lama berinvestasi dalam model kode seperti DeepSeek-Coder, kini berupaya melengkapi "lapisan tengah" yang menghubungkan model dengan alur kerja nyata. Kompetisi di bidang *AI Coding* telah bergeser dari sekadar kemampuan model menjadi perebutan pintu masuk ke alur kerja pengembang. Kehadiran proyek komunitas seperti **DeepSeek-TUI**—agen coding terminal sumber terbuka yang populer—membuktikan bahwa ada permintaan kuat untuk produk semacam Claude Code yang berbasis DeepSeek. Namun, proyek komunitas memiliki keterbatasan dalam hal sinkronisasi dengan evolusi model dan penciptaan umpan balik data pelatihan yang sistematis. Dengan membangun Harness resmi, DeepSeek bertujuan memanfaatkan keunggulannya dalam kolaborasi tim model, desain antarmuka, siklus data pelatihan, dan operasi ekosistem pengembang untuk menciptakan produk inti yang kompetitif. Langkah ini menandai peralihan DeepSeek dari fokus pada "otak" (model) ke penyediaan "tangan" (Harness) yang memungkinkan modelnya bertindak dalam tugas dunia nyata, memulai babak baru dalam persaingan agen AI.

链捕手05/22 02:19

Sumber Dalam: DeepSeek Sedang Membentuk Tim Harness, Menyaingi Claude Code

链捕手05/22 02:19

活动图片