Khi các hợp đồng thông minh phát triển từ những thử nghiệm nhỏ thành các hệ thống tài chính lớn quản lý hơn 400 tỷ đô la tài sản, bảo mật ngày càng trở nên quan trọng.
Không giống như phần mềm truyền thống, hầu hết các chương trình blockchain không thể thay đổi sau khi triển khai, nghĩa là ngay cả những lỗi mã hóa nhỏ cũng có thể gây ra tổn thất tài chính vĩnh viễn.
Để đánh giá hiệu suất của trí tuệ nhân tạo trong môi trường rủi ro cao này, các nhà nghiên cứu từ OpenAI, Paradigm và OtterSec đã phát triển EVMbench.
Thay vì các thử thách kiểm tra đơn giản, nó sử dụng 120 lỗ hổng thực tế từ 40 dự án blockchain, giúp việc đánh giá gần hơn với điều kiện thực tế.
Nhận xét về điều này, bài đăng trên blog của OpenAI lưu ý,
“Chúng tôi đánh giá một loạt các tác nhân tiên phong và nhận thấy rằng chúng có khả năng phát hiện và khai thác các lỗ hổng từ đầu đến cuối chống lại các phiên bản blockchain trực tiếp.”
Nó tiếp tục bổ sung,
“Chúng tôi phát hành mã, tác vụ và công cụ để hỗ trợ việc đo lường liên tục các khả năng này và công việc trong tương lai về bảo mật.”
AI có thực sự định hình lại bảo mật hợp đồng thông minh?
Trong khi AI cải thiện đáng kể việc kiểm tra và sửa lỗi, nó cũng có thể khai thác các điểm yếu của hệ thống. Để giải quyết vấn đề này, EVMbench giúp các nhà nghiên cứu theo dõi những rủi ro này.
Nó cũng hướng dẫn phát triển AI có trách nhiệm cho các hệ thống tài chính giá trị cao.
Dù vậy, EVMbench kiểm tra các tác nhân AI trong ba giai đoạn.
Mỗi giai đoạn đại diện cho một mức độ khó kỹ thuật khác nhau, phản ánh trách nhiệm bảo mật ngày càng tăng.
Cộng đồng đánh giá cao nỗ lực này
Đánh giá cao động thái này, một tài khoản người dùng X đã lưu ý,
“Đây là một thời điểm bước ngoặt cho bảo mật hợp đồng thông minh. Việc nhảy vọt từ 31,9% lên 72,2% tỷ lệ khai thác thành công chỉ trong 6 tháng cho thấy các tác nhân AI không chỉ giỏi hơn trong việc đọc mã—chúng đang làm chủ toàn bộ chuỗi tấn công.”
Đồng tình với cảm xúc tương tự, một người dùng khác bổ sung,
“Mức tăng gấp 6 lần về thành công khai thác là sự tiến bộ điên rồ, nhưng cũng khá đáng lo ngại về tốc độ mở rộng kỹ năng tấn công.”
Sự cố gần đây gây chấn động
Tuy nhiên, bất chấp sự lạc quan như vậy, điều gì đó không tưởng đã xảy ra ngay sau khi OpenAI ra mắt EVMbench. Một vụ khai thác liên quan đến Claude Opus 4.6 đã làm dấy lên lo ngại nghiêm trọng về rủi ro của các hợp đồng thông minh được “mã hóa theo cảm tính”.
Trong trường hợp này, AI đã giúp viết mã Solidity dễ bị tổn thương, mã này đặt sai giá của tài sản cbETH ở mức 1,12 đô la thay vì giá trị thực khoảng 2.200 đô la, gây ra thanh lý và thiệt hại gần 1,78 triệu đô la.
Điều này cho thấy việc tin tưởng AI với logic tài chính quan trọng mà không có sự xem xét cẩn thận của con người có thể biến những sai lầm nhỏ thành tổn thất lớn.
Hạn chế vẫn còn
EVMbench có những hạn chế rõ ràng. Nó chỉ bao gồm 120 lỗ hổng được tuyển chọn và không thể đánh giá các vấn đề mới được phát hiện.
Chế độ Phát hiện (Detect Mode) cũng tạo ra dương tính giả. Trong khi số lượng ít các tác vụ Sửa lỗi (Patch) và Khai thác (Exploit) phản ánh nỗ lực thủ công đáng kể cần thiết để tạo ra chúng.
Ngoài ra, môi trường sandbox không thể hiện đầy đủ các điều kiện thực tế như hoạt động đa chuỗi, sự phức tạp về thời gian và lịch sử mạng lưới dài hạn.
Không cần phải nói, khi việc áp dụng blockchain tăng tốc, việc sử dụng sai mục đích của nó cũng đang phát triển nhanh chóng.
Gần đây, nghiên cứu của Group-IB cũng cho thấy ransomware DeadLock đang sử dụng các hợp đồng thông minh Polygon để che giấu cơ sở hạ tầng máy chủ và né tránh việc bị phát hiện.
Cùng nhau, những diễn biến này báo hiệu một sự thay đổi đáng lo ngại khi các hợp đồng thông minh, vốn được thiết kế để nâng cao tính minh bạch và tin cậy, ngày càng được sử dụng lại như những công cụ cho tội phạm mạng.
Tóm tắt cuối cùng
- Các công cụ như EVMbench giúp các nhà nghiên cứu đo lường khả năng của AI trong các cài đặt bảo mật thực tế.
- Các bộ dữ liệu hạn chế và môi trường được kiểm soát vẫn không nắm bắt được sự phức tạp của blockchain trong thế giới thực.








