A medida que los contratos inteligentes evolucionan de pequeños experimentos a sistemas financieros importantes que gestionan más de 400.000 millones de dólares en activos, la seguridad se ha vuelto cada vez más crítica.
A diferencia del software tradicional, la mayoría de los programas de blockchain no pueden modificarse después de su implementación, lo que significa que incluso pequeños errores de codificación pueden causar pérdidas financieras permanentes.
Para evaluar cómo se desempeña la inteligencia artificial en este entorno de alto riesgo, investigadores de OpenAI, Paradigm y OtterSec desarrollaron EVMbench.
En lugar de simples desafíos de prueba, utiliza 120 vulnerabilidades reales de 40 proyectos de blockchain, lo que acerca la evaluación a condiciones del mundo real.
Al respecto, la publicación de blog de OpenAI señaló:
“Evaluamos una gama de agentes de frontera y encontramos que son capaces de descubrir y explotar vulnerabilidades de extremo a extremo contra instancias de blockchain en vivo”.
Agregó además:
“Publicamos código, tareas y herramientas para apoyar la medición continua de estas capacidades y el trabajo futuro en seguridad”.
¿Realmente la IA está remodelando la seguridad de los contratos inteligentes?
Si bien la IA mejora enormemente la auditoría y la corrección de errores, también puede explotar las debilidades del sistema. Para resolver esto, EVMbench ayuda a los investigadores a rastrear estos riesgos.
También guía el desarrollo responsable de la IA para sistemas financieros de alto valor.
Dicho esto, EVMbench prueba agentes de IA en tres etapas.
Cada etapa representa un nivel diferente de dificultad técnica, reflejando una creciente responsabilidad de seguridad.
La comunidad aprecia este esfuerzo
Apreciando este movimiento, una cuenta de usuario de X señaló:
“Este es un momento decisivo para la seguridad de los contratos inteligentes. El salto del 31,9% al 72,2% en el éxito de la explotación en solo 6 meses muestra que los agentes de IA no solo están mejorando en la lectura de código, sino que están dominando la cadena de ataque completa”.
Haciendo eco de sentimientos similares, otro usuario agregó:
“El aumento de 6 veces en el éxito de la explotación es un progreso increíble, pero es un poco preocupante lo rápido que están escalando las habilidades ofensivas”.
Incidente reciente que envió ondas de choque
Sin embargo, a pesar de tal optimismo, algo irreal sucedió poco después de que OpenAI lanzara EVMbench. Una explotación que involucró a Claude Opus 4.6 generó serias preocupaciones sobre los riesgos de los contratos inteligentes codificados por “vibraciones”.
En este caso, la IA ayudó a escribir código Solidity vulnerable que estableció incorrectamente el precio del activo cbETH en $1,12 en lugar de su valor real de alrededor de $2.200, lo que provocó liquidaciones y causó pérdidas de casi $1,78 millones.
Esto muestra que confiar en la IA con lógica financiera crítica sin una cuidadosa revisión humana puede convertir pequeños errores en grandes pérdidas.
Las limitaciones persisten
EVMbench tiene limitaciones claras. Incluye solo 120 vulnerabilidades seleccionadas y no puede evaluar problemas recién descubiertos.
El Modo de Detección también produce falsos positivos. Mientras que el pequeño número de tareas de Parche y Explotación refleja el gran esfuerzo manual necesario para crearlas.
Además, el entorno aislado no representa completamente las condiciones del mundo real, como la actividad entre cadenas, las complejidades de tiempo y la historia de la red a largo plazo.
Huelga decir que, a medida que la adopción de blockchain se acelera, su mal uso está evolucionando igual de rápido.
Recientemente, una investigación de Group-IB también mostró que el ransomware DeadLock está utilizando contratos inteligentes de Polygon para ocultar la infraestructura del servidor y evadir la detección.
Juntos, estos desarrollos señalan un cambio preocupante donde los contratos inteligentes, originalmente diseñados para mejorar la transparencia y la confianza, están siendo cada vez más reutilizados como herramientas para el cibercrimen.
Resumen Final
- Herramientas como EVMbench ayudan a los investigadores a medir las capacidades de la IA en entornos de seguridad realistas.
- Los conjuntos de datos limitados y los entornos controlados aún no capturan la complejidad del mundo real de blockchain.







