Tahun Pertama Penerapan AI, Hanya Bilang Iya, Abai Risiko? Log Pelayaran Pengembangan Perangkat Lunak Sepenuhnya Sumber Terbuka

marsbit发布于2026-06-16更新于2026-06-16

文章摘要

Tahun 2026 disebut sebagai era aplikasi AI. Kode dibuat semakin cepat, namun dengan pengawasan yang semakin sedikit saat diterapkan. Risiko dari kode yang ditulis AI sering kali tersembunyi dalam kode yang tampak benar secara sintaksis dan melewati semua pemeriksaan, tetapi dapat menyebabkan kebocoran data atau kerugian aset. Contoh nyata adalah insiden konfigurasi oracle cbETH Moonwell, di mana kesalahan semantik dalam harga melewati proses pengembangan dan pemeriksaan, mengakibatkan kerugian finansial yang signifikan. Risiko pengkodean AI telah berevolusi dari pelengkap lokal ke agen yang dapat membaca file, mengubah konfigurasi, menginstal dependensi, dan menghasilkan skrip infrastruktur, sehingga menciptakan jalur risiko yang lebih panjang dan sulit dilacak dalam rekayasa perangkat lunak. Untuk mengatasi masalah ini, Narwhal-Lab Universitas Peking meluncurkan proyek sumber terbuka **Narwhal AI Code Risks**. Proyek ini mengumpulkan dan mengkategorikan fragmen informasi risiko yang tersebar ke dalam tiga lapisan: `cases/` (peristiwa nyata), `inferred/` (sinyal awal), dan `scenarios/` (skenario risiko tipikal). Risiko diklasifikasikan menjadi 7 kategori: Rantai Pasok, Kerentanan Tingkat Kode, Konfigurasi Cloud & Infrastruktur, Risiko Agen, Risiko Domain Vertikal, Risiko Kekayaan Intelektual & Kepatuhan, serta Faktor Manusia. Tujuan proyek ini adalah untuk mengubah kasus risiko menjadi pengetahuan yang dapat digunakan kembali, membantu pengembang mengidentifikasi masalah s...

Risiko AI menulis kode tersembunyi dalam kode yang tampak benar, berpotensi memicu kebocoran data atau kerugian aset. Proyek sumber terbuka Narwhal AI Code Risks mengumpulkan kasus nyata, sinyal awal, dan jalur risiko tipikal, membantu pengembang mengidentifikasi potensi masalah lebih awal, menghindari mengulangi kesalahan yang sama.

2026, kode semakin cepat dihasilkan, namun semakin sedikit pemeriksaan saat diterapkan.

Semakin sering, kebutuhan pengguna dimasukkan ke dalam dialog, AI membaca konteks, melengkapi fungsi, menarik dependensi, memperbaiki konfigurasi, lalu secara otomatis membuat pengujian.

Sebelum disadari, sepotong kode sudah berada di repositori, menunggu untuk digabungkan.

Pengguna bahkan telah membentuk kebiasaan baru: biarkan AI menulis dan menjalankannya dulu, jika ada masalah baru diperiksa bagian mana yang perlu diperbaiki.

Tapi di dunia perangkat lunak, hal paling berbahaya seringkali adalah kode yang tampak biasa: sintaks benar, antarmuka legal, pengujian lolos, komentar sempurna.

Namun, kode itu tetap dapat memperkenalkan nama paket yang tidak ada, membuka izin yang terlalu luas, mengekspos database... bahkan membuat Agen yang dapat langsung memanggil alat sistem, melalui injeksi prompt, membawa data sensitif keluar dari sistem internal.

Yang benar-benar berbahaya, bukanlah lampu merah kesalahan menyala. Melainkan ketika semua indikator risiko menunjukkan normal.

Risiko AI menulis kode sebelumnya tersebar di berbagai tempat: sebuah blog keamanan menyembunyikan sebuah kasus, sebuah Issue mencatat sebuah petunjuk. Ketika tim berikutnya menghadapi masalah serupa, mereka perlu kembali menyusun sumber risiko dari awal, dan menghabiskan banyak waktu serta tenaga untuk melakukan pengukuran empiris skala besar pada kode.

Sementara Narwhal-Lab Universitas Peking baru saja membuka sumber Narwhal AI Code Risks yang telah mengatur fragmen informasi tersebut, diklasifikasikan menjadi tiga jenis: peristiwa nyata, sinyal awal, dan jalur risiko tipikal, untuk dilihat oleh para peneliti.

Tautan makalah: https://github.com/Narwhal-Lab/Narwhal-aicode-risks

Saat 28 Pemeriksaan Semua Lolos, Sistem Tetap Menyimpang

Petunjuk pertama adalah sebuah Pull Request yang telah digabungkan, di kolom penanda tangan PR tercantum nama Claude Opus 4.6 dan Copilot, serta empat pengembang manusia. 28 pemeriksaan semua lolos: Tidak ada yang menemukan masalah.

Kemudian, robot likuidasi menghabiskan beberapa menit, mengambil jaminan senilai $1,778,044.83.

Harga cbETH dalam file konfigurasi diatur sebagai rasio konversi dengan ETH, sekitar $1.12, bukan harga aktual yang mendekati $2,200.

Kesalahan semantik harga seperti itu berhasil melewati proses pengembangan, pemeriksaan, dan penggabungan, akhirnya berubah menjadi kerugian nyata dalam sistem keuangan. Inilah bagian paling mencolok dari kecelakaan konfigurasi oracle cbETH Moonwell.

Masalahnya ada pada kode yang tidak memiliki kesalahan sintaks, dan pengembang manusia tidak segera menghentikan proses yang abnormal. Sebaliknya, semuanya tampak lengkap, lancar, ini hanyalah pengiriman rekayasa yang normal.

Tapi justru 'normal' yang mengalir diam-diam inilah yang menjadikannya contoh tipikal insiden keamanan.

Risiko AI Coding terletak pada kenyataan bahwa ia tidak selalu muncul dalam bentuk kesalahan.

Seringkali, ia menyamar dalam wujud jawaban yang benar, dengan tenang memasuki alur rekayasa. Kode dapat berjalan, pemeriksaan dapat lolos, PR dapat digabungkan, tetapi semantik bisnis sudah menyimpang dari dunia nyata.

Dalam proyek berisiko rendah, penyimpangan semantik seperti ini mungkin hanya berupa pengerjaan ulang; namun dalam skenario sensitif seperti keuangan, sistem data perusahaan, hal ini akan langsung mengakibatkan kebocoran data, paparan izin, dan kerugian aset.

Saat AI ikut menulis kode, mengubah konfigurasi, melakukan review, bahkan ikut menandatangani dan masuk ke dalam PR, apakah kita memiliki pemahaman yang cukup tentang bagaimana setiap penyimpangan terjadi?

Sinyal Lampu Hijau, Tidak Menerangi Semua Sudut

AI awal yang membantu menulis kode, sebagian besar hanya berhenti pada pelengkapan lokal. Jika sintaks salah, kompilator akan melaporkan kesalahan, pengujian unit akan gagal, proses CI akan menolaknya.

AI Coding hari ini melangkah lebih jauh sementara pengawasan tertinggal.

Ia dapat membaca file, mengubah konfigurasi, menginstal dependensi, menghasilkan skrip infrastruktur, juga dapat melalui Agen merencanakan sendiri di antara beberapa tugas.

AI tidak lagi hanya duduk di samping menyerahkan alat, ia mulai memasuki rantai yang lebih panjang dalam rekayasa perangkat lunak.

Batas yang awalnya jelas dalam rekayasa perangkat lunak, dihubungkan kembali oleh AI Agent menjadi jalur yang lebih panjang dan lebih sulit dilacak asalnya.

Catatan yang Tersebar, Membutuhkan Log Pelayaran Publik

Insiden keamanan jarang memiliki kesimpulan lengkap sejak awal. Beberapa peristiwa buktinya kuat, dapat dimasukkan sebagai kasus nyata ke dalam direktori; beberapa masih berada pada tahap tangkapan layar komunitas, diskusi peneliti, atau pengungkapan awal, hanya cocok untuk terus diamati; ada juga yang tidak terikat pada satu peristiwa nyata tunggal, tetapi telah membentuk pola yang jelas, cocok untuk digunakan sebagai simulasi awal.

Narwhal AI Code Risks membagi materi menjadi tiga lapisan: `cases/`, `inferred/` dan `scenarios/`.

cases/ mencatat peristiwa nyata yang sudah memiliki sumber publik dan rantai bukti yang mendukung; inferred/ menyimpan sinyal awal yang belum sepenuhnya terbukti, tetapi layak untuk terus dilacak; scenarios/ mengumpulkan skenario tipikal yang sementara tidak terikat pada satu peristiwa tunggal, tetapi jalur risikonya cukup jelas.

Tanpa catatan publik seperti ini, risiko AI Coding mudah berubah menjadi ingatan jangka pendek di internet.

Hari ini orang mengingat nama paket tertentu, besok mendiskusikan paparan data tertentu, beberapa bulan kemudian ditutupi lagi oleh demam alat baru. Ketika masalah serupa muncul lagi, tim masih seperti lalat tanpa kepala terbang masuk ke area pelayaran dengan risiko yang tidak diketahui.

Apa yang dilakukan Narwhal AI Code Risks adalah mengunci fragmen risiko yang tersebar ini, agar orang-orang setelahnya dapat membuka halaman yang sama.

Mengikuti Tujuh Jenis Indeks, Melihat Asal Usul Risiko

Masalah yang dibawa oleh AI menulis kode, tidak hanya ada dalam kode. Ia ada dalam dependensi, dalam izin, dalam pemanggilan alat oleh Agen, lebih lagi dalam cara kepercayaan manusia terhadap output AI.

Narwhal AI Code Risks saat ini membagi risiko menjadi 7 kategori: rantai pasok, kerentanan tingkat kode, konfigurasi cloud dan infrastruktur, risiko agen, risiko domain vertikal, risiko kekayaan intelektual dan kepatuhan, serta faktor manusia.

Dalam risiko rantai pasok, AI mungkin merekomendasikan dependensi yang tidak ada. Dalam kerentanan tingkat kode, AI mungkin menulis kembali masalah traversal jalur, kurangnya validasi input, masalah otorisasi ke dalam kode bisnis. Dalam konfigurasi cloud dan infrastruktur, AI mungkin memberikan izin yang terlalu luas, bucket penyimpanan publik, atau port yang terbuka hanya agar kode dapat berjalan dulu. Risiko Agen lebih kompleks, tidak hanya menghasilkan teks, tetapi mulai mengeksekusi tindakan. Hasil buatan AI sedang menanamkan potensi masalah ke dalam sistem nyata.

Mesin AI Sedang Menyala, dan Log Pelayaran Baru Saja Terbuka

Saat AI selangkah demi selangkah memasuki dunia nyata, pencegahan risiko terkait tidak seharusnya hanya berhenti pada tinjauan ulang setelah kejadian atau diskusi yang tersebar.

Tempat yang benar-benar penting dari Narwhal AI Code Risks adalah mengubah kasus risiko menjadi pengetahuan yang dapat digunakan kembali.

Pengembang dapat menggunakannya untuk mengidentifikasi masalah serupa; peneliti keamanan dapat menggunakannya sebagai basis sampel; vendor alat dapat mengekstrak aturan deteksi dan tolok ukur evaluasi darinya; komunitas sumber terbuka juga dapat terus melengkapi kasus baru, bukti baru, dan tipe risiko baru.

Mesin AI sedang menderu, setiap penyimpangan juga seharusnya meninggalkan koordinat. Risiko tidak pernah hilang karena diabaikan, tetapi pengalaman dapat dicatat dan diteruskan. Yang benar-benar berharga bukanlah menemukan satu kerentanan, tetapi membuat generasi berikutnya tidak perlu lagi menginjak perangkap yang sama.

Apa yang sedang dilakukan Narwhal AI Code Risks adalah meninggalkan log pelayaran sumber terbuka untuk dunia perangkat lunak di tahun pertama penerapan AI.

Referensi:

https://github.com/Narwhal-Lab/Narwhal-aicode-risks

Artikel ini berasal dari akun WeChat "新智元", penulis: LRST

相关问答

QApa itu proyek open-source Narwhal AI Code Risks yang dikembangkan oleh Narwhal-Lab dari Universitas Peking?

ANarwhal AI Code Risks adalah proyek open-source yang mengumpulkan dan mengkategorikan potensi risiko keamanan yang timbul saat menggunakan AI untuk menulis kode. Proyek ini menyediakan catatan kasus nyata, sinyal awal, dan pola risiko tipikal untuk membantu pengembang mengidentifikasi dan menghindari kerentanan sebelum diterapkan.

QMengapa artikel ini menyebut bahwa kode yang terlihat 'normal' justru bisa sangat berbahaya dalam konteks AI Coding?

AKarena risiko dari kode yang ditulis AI sering kali tidak muncul sebagai kesalahan sintaks (error) yang jelas. Kode tersebut mungkin tampak benar secara sintaks, lolos pengujian, dan memiliki dokumentasi yang baik, tetapi dapat mengandung kesalahan semantik (seperti kesalahan konfigurasi harga pada kasus Moonwell), masalah keamanan, atau kerentanan yang baru terlihat ketika sudah menyebabkan kerugian data atau aset.

QBagaimana proyek Narwhal AI Code Risks mengorganisir informasi tentang risiko AI Coding?

AProyek ini mengorganisir informasi ke dalam tiga direktori utama: `cases/` untuk kejadian nyata dengan bukti yang terdokumentasi, `inferred/` untuk sinyal awal atau laporan yang masih perlu dikonfirmasi lebih lanjut, dan `scenarios/` untuk skenario risiko yang memiliki pola jelas meski tidak terikat pada satu kasus spesifik. Selain itu, risiko diklasifikasikan ke dalam 7 kategori seperti risiko rantai pasok, kerentanan tingkat kode, dan risiko agen.

QApa contoh konkret risiko AI Coding yang disebutkan dalam artikel terkait dengan keuangan?

AContoh konkretnya adalah insiden konfigurasi oracle cbETH di Moonwell. AI (Claude Opus 4.6 dan Copilot) bersama pengembang manusia membuat konfigurasi yang salah, menetapkan rasio konversi cbETH ke ETH sebagai nilai dolar (~$1.12), padahal harga sebenarnya sekitar $2,200. Kode ini lolos semua 28 pemeriksaan dan menyebabkan kerugian senilai lebih dari 1,7 juta dolar AS karena sistem menggunakan harga yang salah.

QMenurut artikel, apa manfaat utama dari memiliki 'log pelayaran' open-source seperti Narwhal AI Code Risks untuk dunia pengembangan perangkat lunak?

AManfaat utamanya adalah mengubah insiden dan pengetahuan tentang risiko menjadi aset bersama yang dapat digunakan kembali. Ini memungkinkan pengembang mengenali pola masalah lebih awal, peneliti keamanan memiliki basis data sampel, vendor alat dapat mengembangkan aturan deteksi yang lebih baik, dan komunitas dapat berkontribusi menambah kasus baru. Dengan demikian, kesalahan yang sama tidak perlu terulang, meningkatkan keamanan kolektif dalam era pengembangan perangkat lunak berbasis AI.

你可能也喜欢

XRP Ledger 发布 3.2.0 版本升级并启用 XRPLd 新品牌名

XRP Ledger发布了3.2.0版本,这是对其底层区块链基础设施的一次重要升级。本次更新的核心是将运行网络的软件名称从“rippled”更名为“xrpld”,以更好地反映整个项目生态。 与此前侧重于前端功能的版本不同,3.2.0版本优先进行了后端升级和效率提升,旨在增强网络性能并为未来的扩展做准备。关键改进包括内存优化措施,预计可节省高达40%的服务器内存使用。 此次升级引入了名为“fixCleanup3_2_0”的修改,为单资产金库、借贷协议、权限系统、去中心化交易所、多用途代币和权限域等多个模块带来了安全性增强。开发团队还新增了不变性检查,以确保已删除账户不会在账本上留下不一致的数据,从而加强整个网络的完整性和可靠性。 对于开发者而言,新版本增加了一项重要功能:应用程序无需连接服务器即可检索XRP Ledger协议和服务器定义信息,这将极大便利钱包、区块链浏览器和API等的开发工作。 在可扩展性和稳定性方面,更新包括可配置的区块大小、通过nuDB实现的高效数据库存储,以及将gRPC服务器的TLS/双向TLS支持改为可选,以提升企业用户的性能和连接性。此外,默认对等端口从51235更改为2459,并修复了涉及自动做市商、支付、代币托管、多用途代币、订单簿和RPC等多个方面的问题。出于性能考虑,3.2.0版本暂时禁用了交易不变性检查,但开发团队表示这不会构成安全威胁。

TheNewsCrypto9小时前

XRP Ledger 发布 3.2.0 版本升级并启用 XRPLd 新品牌名

TheNewsCrypto9小时前

交易

现货
合约

热门文章

如何购买S

欢迎来到HTX.com!我们已经让购买Sonic(S)变得简单而便捷。跟随我们的逐步指南,放心开始您的加密货币之旅。第一步:创建您的HTX账户使用您的电子邮件、手机号码注册一个免费账户在HTX上。体验无忧的注册过程并解锁所有平台功能。立即注册第二步:前往买币页面,选择您的支付方式信用卡/借记卡购买:使用您的Visa或Mastercard即时购买Sonic(S)。余额购买:使用您HTX账户余额中的资金进行无缝交易。第三方购买:探索诸如Google Pay或Apple Pay等流行支付方法以增加便利性。C2C购买:在HTX平台上直接与其他用户交易。HTX场外交易台(OTC)购买:为大量交易者提供个性化服务和竞争性汇率。第三步:存储您的Sonic(S)购买完您的Sonic(S)后,将其存储在您的HTX账户钱包中。您也可以通过区块链转账将其发送到其他地方或者用于交易其他加密货币。第四步:交易Sonic(S)在HTX的现货市场轻松交易Sonic(S)。访问您的账户,选择您的交易对,执行您的交易,并实时监控。HTX为初学者和经验丰富的交易者提供了友好的用户体验。

2.6k人学过发布于 2025.01.15更新于 2026.06.02

如何购买S

相关讨论

欢迎来到HTX社区。在这里,您可以了解最新的平台发展动态并获得专业的市场意见。以下是用户对S(S)币价的意见。

活动图片