Tiongkok No.1, Hampir Menyamai OpenAI, “Biara Penyapu” Misterius Melesat ke Peringkat 7 Global
**Ringkasan: "MopMonk" - "Biksu Penyapu" Misterius dari China Masuk 7 Besar Dunia di CyberGym**
Sebuah entitas AI misterius asal China bernama **MopMonk** (dalam bahasa Indonesia: "Biksu Penyapu") tiba-tiba muncul dan menempati peringkat **ketujuh dunia** di papan peringkat benchmark keamanan siber **CyberGym**, yang dibuat oleh UC Berkeley.
Dengan tingkat keberhasilan **73.1%**, skor MopMonk hanya sedikit di belakang raksasa AI seperti OpenAI dan mencetak rekor tertinggi baru untuk tim China di papan peringkat tersebut. Yang membuat heboh adalah tidak adanya informasi tentang tim di baliknya: tidak ada situs web, konferensi pers, atau pengungkapan identitas.
CyberGym dianggap sebagai "Olimpiade" untuk kemampuan keamanan AI, mengevaluasi model dengan 1507 contoh kerentanan nyata dari proyek sumber terbuka besar. Benchmark ini menguji bukan hanya pemahaman, tetapi kemampuan **Agent AI untuk benar-benar mengeksekusi**—yaitu menghasilkan bukti konsep (PoC) yang dapat memicu kerentanan dalam lingkungan tertutup.
MopMonk diketahui menggunakan model dasar **MiniMax M3**, model open-source dari Shanghai yang terkenal dengan kemampuan pemrograman, konteks panjang (1M token), dan multimodalitas. Kunci kesuksesannya diduga terletak pada **kerangka kerja Agent (Harness)** yang dirancang khusus untuk penemuan kerentanan.
Kerangka kerja ini memiliki tiga inti:
1. **Memori Terstruktur untuk Kerentanan:** Menyimpan fakta tugas seperti target, jalur kode, dan kendala untuk percobaan berikutnya.
2. **Eksplorasi Berbasis Memori:** Setiap percobaan baru belajar dari memori sebelumnya, menghindari pengulangan dan meningkatkan efisiensi.
3. **Eksplorasi Paralel Multi-Agent:** Beberapa upaya eksplorasi berbagi memori yang sama, memperluas cakupan investigasi.
Prestasi MopMonk menunjukkan pergeseran penting: dalam tugas keamanan dunia nyata, **kualitas rekayasa Agent (Harness)** yang mengoordinasikan eksekusi sering kali lebih krusial daripada sekadar "menumpuk parameter" pada model dasar.
Meskipun identitasnya masih menjadi misteri, kombinasi nama bernuansa武侠 (cerita silat China), model dasar MiniMax, dan keahlian keamanan yang mendalam mengarah pada spekulasi kuat bahwa ini adalah tim keamanan AI dari China, kemungkinan berbasis di Shanghai.
marsbit1j yang lalu