Seiring kontrak pintar berevolusi dari eksperimen kecil menjadi sistem keuangan utama yang mengelola aset lebih dari $400 miliar, keamanan menjadi semakin kritis.
Tidak seperti perangkat lunak tradisional, sebagian besar program blockchain tidak dapat diubah setelah diterapkan, artinya bahkan kesalahan pengkodean kecil dapat menyebabkan kerugian finansial permanen.
Untuk mengevaluasi bagaimana kecerdasan buatan berkinerja dalam lingkungan berisiko tinggi ini, peneliti dari OpenAI, Paradigm, dan OtterSec mengembangkan EVMbench.
Alih-alih tantangan uji sederhana, alat ini menggunakan 120 kerentanan nyata dari 40 proyek blockchain, membuat evaluasi lebih mendekati kondisi dunia nyata.
Mengenai hal ini, postingan blog OpenAI mencatat,
“Kami mengevaluasi berbagai agen terdepan dan menemukan bahwa mereka mampu menemukan dan mengeksploitasi kerentanan secara end-to-end terhadap instance blockchain yang aktif.”
Selanjutnya ditambahkan,
“Kami merilis kode, tugas, dan peralatan untuk mendukung pengukuran berkelanjutan atas kemampuan ini dan pekerjaan masa depan di bidang keamanan.”
Apakah AI benar-benar membentuk ulang keamanan kontrak pintar?
Sementara AI sangat meningkatkan audit dan perbaikan bug, ia juga dapat mengeksploitasi kelemahan sistem. Untuk mengatasi ini, EVMbench membantu peneliti melacak risiko ini.
Ini juga memandu pengembangan AI yang bertanggung jawab untuk sistem keuangan bernilai tinggi.
Meski demikian, EVMbench menguji agen AI dalam tiga tahap.
Setiap tahap mewakili tingkat kesulitan teknis yang berbeda, mencerminkan tanggung jawab keamanan yang semakin besar.
Komunitas menghargai upaya ini
Menghargai langkah ini, sebuah akun pengguna X mencatat,
“Ini adalah momen penting untuk keamanan kontrak pintar. Lonjakan dari 31,9% menjadi 72,2% keberhasilan eksploitasi hanya dalam 6 bulan menunjukkan agen AI tidak hanya semakin baik dalam membaca kode—mereka menguasai seluruh rantai serangan.”
Menggemakan sentimen serupa, pengguna lain menambahkan,
“Lonjakan 6× dalam keberhasilan eksploitasi adalah kemajuan yang liar, tetapi agak mengkhawatirkan betapa cepatnya keterampilan ofensif berkembang.”
Insiden terkini yang mengguncang
Namun, terlepas dari optimisme seperti itu, sesuatu yang tidak nyata terjadi segera setelah OpenAI meluncurkan EVMbench. Eksploitasi yang melibatkan Claude Opus 4.6 menimbulkan kekhawatiran serius tentang risiko kontrak pintar yang “dikodekan dengan nuansa tertentu” (vibe-coded).
Dalam kasus ini, AI membantu menulis kode Solidity yang rentan yang secara tidak benar menetapkan harga aset cbETH pada $1,12 alih-alih nilai sebenarnya sekitar $2.200, memicu likuidasi dan menyebabkan kerugian hampir $1,78 juta.
Ini menunjukkan bahwa mempercayai AI dengan logika keuangan kritis tanpa tinjauan manusia yang cermat dapat mengubah kesalahan kecil menjadi kerugian besar.
Keterbatasan tetap ada
EVMbench memiliki keterbatasan yang jelas. Ini hanya mencakup 120 kerentanan yang dikurasi dan tidak dapat mengevaluasi masalah yang baru ditemukan.
Mode Deteksi juga menghasilkan positif palsu. Sementara jumlah kecil tugas Patch dan Eksploitasi mencerminkan upaya manual yang berat yang diperlukan untuk membuatnya.
Selain itu, lingkungan yang terisolasi (sandboxed) gagal sepenuhnya mewakili kondisi dunia nyata seperti aktivitas lintas chain, kompleksitas waktu, dan riwayat jaringan jangka panjang.
Tak perlu dikatakan, seiring adopsi blockchain semakin cepat, penyalahgunaannya juga berkembang dengan cepat.
Baru-baru ini, penelitian oleh Group-IB juga menunjukkan bahwa ransomware DeadLock menggunakan kontrak pintar Polygon untuk menyembunyikan infrastruktur server dan menghindari deteksi.
Bersama-sama, perkembangan ini menandakan pergeseran yang mengkhawatirkan di mana kontrak pintar, yang awalnya dirancang untuk meningkatkan transparansi dan kepercayaan, semakin sering dialihfungsikan sebagai alat untuk kejahatan dunia maya.
Ringkasan Akhir
- Alat seperti EVMbench membantu peneliti mengukur kemampuan AI dalam pengaturan keamanan yang realistis.
- Kumpulan data terbatas dan lingkungan terkontrol masih gagal menangkap kompleksitas blockchain dunia nyata.







