Sui Foundation ha publicado un análisis post-mortem detallado explicando la causa de la parada de la mainnet que interrumpió el procesamiento de transacciones el 15 de enero. Confirmó que la red se detuvo como medida de seguridad para evitar la finalización de estados inconsistentes.
Según la Fundación, la interrupción duró aproximadamente seis horas. Fue causada por una divergencia interna en el procesamiento del consenso de los validadores.
Durante el incidente, los validadores no pudieron certificar nuevos puntos de control, lo que provocó que los envíos de transacciones agotaran el tiempo de espera mientras la red priorizaba la seguridad.
La divergencia de consenso de Sui activó una parada de seguridad
La Fundación dijo que el incidente se originó por un error de caso extremo en la lógica de confirmación del consenso que afectó cómo se manejaban las transacciones conflictivas bajo ciertas condiciones de recolección de basura.
Como resultado, diferentes validadores derivaron diferentes salidas de consenso e intentaron ejecutar puntos de control candidato incompatibles.
Cuando los validadores detectaron que más de un tercio de la participación estaba firmando por un resumen de punto de control diferente, la certificación de puntos de control se volvió imposible. Los validadores entonces detuvieron el progreso para evitar finalizar un estado inconsistente.
"Este es el modo de fallo previsto para esta clase de problema", dijo la Fundación, señalando que la red está diseñada para detenerse de forma segura en lugar de arriesgarse a bifurcaciones o inconsistencias irreversibles.
No hubo bifurcaciones, reversiones ni pérdida de fondos
Sui enfatizó que la parada no fue causada por congestión de la red, volumen de transacciones o amenazas externas. Durante todo el incidente:
- No ocurrieron bifurcaciones de estado certificadas
- No se revertieron transacciones certificadas
- Los fondos de los usuarios nunca estuvieron en riesgo
- Se preservaron las garantías de seguridad y consistencia de la red
Si bien la ejecución de transacciones se detuvo durante la ventana del incidente, las operaciones de lectura continuaron sirviendo el último estado certificado. Esto aseguró la consistencia de datos para usuarios y aplicaciones.
Mejoras planificadas tras el incidente
La Sui Foundation dijo que está implementando varios cambios para reducir el tiempo de recuperación en caso de problemas similares en el futuro.
Las mejoras planificadas incluyen una detección más rápida de inconsistencias en los puntos de control y herramientas más automatizadas para los operadores para limpiar estados internos divergentes. Además, pruebas expandidas específicas de consenso para reproducir y validar correcciones antes del despliegue.
La Fundación añadió que, si bien la interrupción fue problemática, confirmó que la arquitectura de Sui, centrada en la seguridad, se comportó según lo diseñado.
Reflexiones finales
- La explicación de Sui confirma que la parada de la mainnet fue el resultado de un caso extremo de consenso, con mecanismos de seguridad deteniendo la red para evitar un estado finalizado inconsistente.
- Aunque problemático, el incidente resalta la disyuntiva entre disponibilidad y seguridad a medida que las redes de alto rendimiento empujan los límites de desempeño.






