Año Uno de las Aplicaciones de IA: ¿Solo sabe decir "sí", ignorando los riesgos? El cuaderno de bitácora del desarrollo de software se abre por completo

marsbitОпубликовано 2026-06-16Обновлено 2026-06-16

Введение

El año de la IA aplicada: ¿Solo "sí" y sin considerar riesgos? El diario de navegación del desarrollo de software se abre por completo. El rápido aumento del uso de IA para generar código, con menos supervisión, introduce riesgos ocultos en código aparentemente correcto, lo que puede provocar pérdidas de datos o activos. El proyecto de código abierto **Narwhal AI Code Risks**, de Narwhal-Lab (Universidad de Pekín), recopila casos reales, señales tempranas y rutas de riesgo típicas para ayudar a los desarrolladores a identificar peligros. Un ejemplo claro es el incidente de configuración del oráculo cbETH de Moonwell, donde un error semántico en un precio (1.12 USD en lugar de ~2200 USD) pasó todas las revisiones y causó una pérdida de ~1.78 millones de dólares. El riesgo no siempre se muestra con errores; a menudo, el código funciona pero su semántica es errónea. La IA ya no solo completa código, sino que modifica configuraciones, gestiona dependencias y actúa mediante agentes, creando cadenas de acciones más largas y difíciles de rastrear. Los riesgos se clasifican en 7 categorías: cadena de suministro, vulnerabilidades a nivel de código, configuración de nube/infraestructura, riesgos de agentes, riesgos en dominios verticales, propiedad intelectual/cumplimiento y factores humanos. El proyecto organiza la información en tres niveles: `cases/` (eventos reales verificados), `inferred/` (señales tempranas por confirmar) y `scenarios/` (patrones de riesgo claros). Su objetiv...

Los riesgos de que la IA escriba código se esconden en código aparentemente correcto, pudiendo provocar fugas de datos o pérdida de activos. El proyecto de código abierto Narwhal AI Code Risks ha recopilado casos reales, señales tempranas y rutas de riesgo típicas para ayudar a los desarrolladores a identificar peligros con antelación y evitar cometer los mismos errores.

En 2026, el código se genera a un ritmo cada vez mayor, pero se despliega con cada vez menos revisión.

Cada vez más, los requisitos del usuario se introducen en un cuadro de diálogo, la IA lee el contexto, completa funciones, añade dependencias, ajusta configuraciones y genera pruebas de paso.

Cuando te das cuenta, ya hay un fragmento de código en el repositorio, esperando a ser fusionado.

Los usuarios ya han adquirido el nuevo hábito: primero dejar que la IA lo escriba y lo haga funcionar, y si hay problemas, entonces ver qué hay que cambiar.

Pero en el mundo del software, lo más peligroso suele ser el código que parece anodino: sintácticamente correcto, con interfaces legales, pruebas aprobadas, comentarios perfectos.

Sin embargo, aún puede introducir nombres de paquetes que no existen, abrir permisos excesivos, exponer bases de datos... o incluso permitir que un agente que puede llamar directamente a herramientas del sistema, bajo un ataque de inyección de prompt, saque datos sensibles de un sistema interno.

Lo realmente peligroso no es que se encienda una luz de error, sino que todos los indicadores de riesgo muestren normalidad.

Hasta ahora, los riesgos de que la IA escriba código estaban dispersos por todas partes: un caso escondido en un blog de seguridad, una pista registrada en un Issue. Cuando el siguiente equipo se enfrentaba a un problema similar, tenía que reconstruir desde cero el origen del riesgo y dedicar una enorme cantidad de tiempo y esfuerzo a realizar mediciones empíricas a gran escala del código.

El Narwhal AI Code Risks, recientemente abierto por el Narwhal-Lab de la Universidad de Pekín, ya ha organizado estos fragmentos de información, clasificándolos en tres tipos: eventos reales, señales tempranas y rutas de riesgo típicas, para que los investigadores puedan consultarlos.

Enlace del paper: https://github.com/Narwhal-Lab/Narwhal-aicode-risks

Cuando pasan las 28 comprobaciones, el sistema aún se desvía

La primera pista fue un Pull Request ya fusionado, cuyo campo de autoría mostraba claramente a Claude Opus 4.6 y Copilot, junto con cuatro desarrolladores humanos. Las 28 comprobaciones se aprobaron: nadie detectó el problema.

Luego, un bot de liquidación tardó unos minutos en tomar una garantía valorada en 1,778,044.83 dólares.

El precio de cbETH en el archivo de configuración se estableció en la tasa de conversión con ETH, aproximadamente 1.12 dólares, en lugar de su precio real cercano a los 2,200 dólares.

Así, un error semántico de precio atravesó todo el proceso de desarrollo, revisión y fusión, convirtiéndose finalmente en una pérdida real en el sistema financiero. Este es el aspecto más llamativo del incidente de configuración del oráculo de Moonwell cbETH.

El problema radica en que el código no presentaba errores de sintaxis y los desarrolladores humanos no bloquearon de inmediato el flujo anómalo. Al contrario, parecía completo, fluido, era una entrega de ingeniería normal.

Pero precisamente esta aparente normalidad bajo la superficie lo convierte en un ejemplo típico de incidente de seguridad.

El riesgo de la codificación con IA radica en que no siempre se manifiesta como un error.

Muchas veces, se viste con la apariencia de una respuesta correcta y entra silenciosamente en el flujo de ingeniería. El código funciona, las comprobaciones pasan, el PR se fusiona, pero la semántica del negocio ya se ha desviado del mundo real.

En proyectos de bajo riesgo, esta desviación semántica puede ser solo una reelaboración; pero en escenarios sensibles como finanzas o sistemas de datos empresariales, provocará directamente filtraciones de datos, exposición de permisos y pérdida de activos.

Cuando la IA participa escribiendo código, modificando configuraciones, haciendo revisiones, o incluso firmando conjuntamente en los PR, ¿tenemos la suficiente certeza de saber cómo ocurre cada desviación?

Señales verdes de paso que no iluminan todos los rincones

Al principio, la IA que ayudaba a escribir código se limitaba principalmente a completar fragmentos locales. Si la sintaxis era incorrecta, el compilador mostraba un error, las pruebas unitarias fallaban y el flujo de CI lo rechazaba.

Hoy en día, la codificación con IA va mucho más allá, mientras que la supervisión tarda en llegar.

Puede leer archivos, modificar configuraciones, instalar dependencias, generar scripts de infraestructura, y también, a través de agentes, planificar de forma autónoma entre múltiples tareas.

La IA ya no se limita a estar al lado pasando herramientas; ha comenzado a integrarse en cadenas más largas de la ingeniería de software.

Los límites originalmente claros en la ingeniería de software han sido reconectados por los agentes de IA en rutas más largas y difíciles de rastrear.

Registros dispersos que necesitan un cuaderno de bitácora público

Los incidentes de seguridad rara vez tienen conclusiones completas desde el principio. Algunos tienen pruebas suficientes y pueden entrar en el directorio como casos reales; otros se quedan en capturas de pantalla de la comunidad, discusiones entre investigadores o divulgaciones preliminares, y solo son adecuados para seguir observándolos; otros más no están vinculados a un solo evento real, pero ya han formado un patrón claro, adecuado para realizar simulaciones preventivas.

Narwhal AI Code Risks divide el material en tres capas: `cases/`, `inferred/` y `scenarios/`.

cases/ registra eventos reales con fuentes públicas y una cadena de evidencias que los respalda; inferred/ guarda señales tempranas que aún no están completamente confirmadas, pero que merecen un seguimiento continuo; scenarios/ organiza escenarios típicos que no están vinculados a un solo evento, pero cuya ruta de riesgo es lo suficientemente clara.

Sin un registro público como este, los riesgos de la codificación con IA pueden convertirse fácilmente en recuerdos a corto plazo en internet.

Hoy se recuerda un nombre de paquete, mañana se discute una exposición de datos, y en unos meses queda sepultado por la nueva ola de herramientas. Cuando surge un problema similar de nuevo, el equipo sigue entrando como una mosca ciega en zonas de navegación de riesgo desconocido.

Lo que hace Narwhal AI Code Risks es fijar estos fragmentos dispersos de riesgo, para que quienes vengan después puedan consultar la misma página.

Siguiendo siete tipos de índice, ver el camino del riesgo

Los problemas que trae la escritura de código por IA no están solo en el código. Están en las dependencias, en los permisos, en las llamadas a herramientas de los agentes, y aún más, en la forma en que los humanos confían en la salida de la IA.

Actualmente, Narwhal AI Code Risks divide los riesgos en 7 categorías: cadena de suministro (supply chain), vulnerabilidades a nivel de código, configuración de la nube e infraestructura, riesgos de agentes, riesgos de dominio vertical, riesgos de propiedad intelectual y cumplimiento normativo, y factores humanos.

En los riesgos de cadena de suministro, la IA puede recomendar dependencias que no existen. En las vulnerabilidades a nivel de código, la IA puede volver a introducir en el código de negocio problemas como el recorrido de rutas (path traversal), la falta de validación de entradas o problemas de autorización. En la configuración de la nube y la infraestructura, la IA puede otorgar permisos excesivos, buckets de almacenamiento públicos o puertos expuestos con tal de hacer funcionar el código. Los riesgos de los agentes son aún más complejos, ya que no solo generan texto, sino que comienzan a ejecutar acciones. Los artefactos generados por la IA están sembrando peligros en sistemas reales.

El motor de la IA está encendido, y el cuaderno de bitácora acaba de abrirse

Cuando la IA avanza paso a paso hacia el mundo real, la prevención y gestión de sus riesgos asociados no debería limitarse a análisis posteriores a los hechos o a discusiones dispersas.

Lo realmente importante de Narwhal AI Code Risks es convertir los casos de riesgo en conocimiento reutilizable.

Los desarrolladores pueden usarlo para identificar problemas similares; los investigadores en seguridad pueden tomarlo como una biblioteca de muestras; los fabricantes de herramientas pueden extraer de él reglas de detección y puntos de referencia para evaluaciones; la comunidad de código abierto también puede seguir complementándolo con nuevos casos, nuevas evidencias y nuevos tipos de riesgo.

El motor de la IA está rugiendo, y cada desviación también debería dejar sus coordenadas. El riesgo nunca desaparece por ser ignorado, pero la experiencia puede ser registrada y transmitida. Lo verdaderamente valioso no es descubrir una vulnerabilidad, sino evitar que quienes vengan después tengan que caer en la misma trampa.

Lo que Narwhal AI Code Risks está haciendo es dejar un cuaderno de bitácora de código abierto para el mundo del software en el Año Uno de las Aplicaciones de IA.

Referencias:

https://github.com/Narwhal-Lab/Narwhal-aicode-risks

Este artículo procede del WeChat público "新智元" (New Zhi Yuan), autor: LRST

Связанные с этим вопросы

Q¿Cuál es el propósito principal del proyecto Narwhal AI Code Risks recién publicado?

AEl proyecto Narwhal AI Code Risks tiene como propósito recopilar y organizar casos reales, señales tempranas y rutas típicas de riesgo asociadas al código generado por IA. Sirve como un registro público y de código abierto (un "diario de navegación") para ayudar a los desarrolladores a identificar riesgos ocultos de manera temprana, evitar errores repetidos y convertir la experiencia en conocimiento reutilizable para la comunidad.

QSegún el artículo, ¿por qué el código generado por IA puede ser particularmente peligroso incluso cuando parece correcto?

AEl código generado por IA puede ser peligroso porque a menudo parece sintácticamente correcto, pasa las pruebas y las revisiones, pero puede contener errores semánticos sutiles, como configuraciones incorrectas (ej. precio de un activo), permisos excesivos, dependencias inexistentes o vulnerabilidades de seguridad. El riesgo no se manifiesta como un error de compilación, sino como una desviación funcional que puede causar pérdidas financieras, fugas de datos o exposiciones del sistema en escenarios críticos.

Q¿En qué consistió el incidente real de Moonwell cbETH mencionado como ejemplo en el texto?

AEl incidente de Moonwell cbETH fue un caso real en el que un Pull Request (creado con ayuda de IA como Claude y Copilot) que modificaba un archivo de configuración fue aprobado tras pasar 28 verificaciones. El error consistió en que el precio de cbETH se configuró incorrectamente en aproximadamente 1.12 dólares (la relación de conversión con ETH) en lugar de su valor real cercano a los 2,200 dólares. Este error semántico permitió que un bot de liquidación reclamara garantías por un valor de 1,778,044.83 dólares, demostrando cómo un fallo no sintáctico puede causar grandes pérdidas.

Q¿Cómo clasifica el proyecto Narwhal AI Code Risks los diferentes tipos de materiales o evidencias de riesgo?

AEl proyecto clasifica los materiales en tres categorías principales almacenadas en directorios distintos: 1) `cases/`: registra eventos reales con fuentes públicas y cadenas de evidencia sólidas. 2) `inferred/`: conserva señales tempranas que aún no están completamente confirmadas pero merecen seguimiento. 3) `scenarios/`: recopila escenarios típicos con rutas de riesgo claras, que no están vinculados a un único evento pero son representativos.

Q¿Cuáles son las siete categorías principales de riesgo identificadas por el proyecto Narwhal AI Code Risks?

ALas siete categorías principales de riesgo son: 1) Riesgos en la cadena de suministro (Supply Chain), 2) Vulnerabilidades a nivel de código, 3) Configuración de la nube e infraestructura, 4) Riesgos de Agent (agentes de IA que ejecutan acciones), 5) Riesgos en dominios verticales (como finanzas o salud), 6) Riesgos de propiedad intelectual y cumplimiento normativo, y 7) Factores humanos (como la confianza excesiva en la salida de la IA).

Похожее

Warsh's Debut: Will the FED Chair Who Knows Crypto Best Bring Surprises or Shocks to the Market?

Kevin Warsh, the new Federal Reserve Chairman, prepares for his inaugural press conference amidst a challenging macroeconomic landscape: resurgent inflation, a bond market sell-off, and political pressure from President Trump for rate cuts. Uniquely, Warsh holds indirect investments in over 20 crypto and Web3 entities (e.g., Solana, dYdX), making him the first Fed Chair with disclosed crypto exposure. His stance may combine a hawkish, inflation-focused monetary policy with a crypto-friendly regulatory philosophy that shifts from Powell’s “same risk, same rule” approach toward a framework acknowledging blockchain’s productivity value. Warsh’s leadership could impact crypto markets across three dimensions: a paradigm shift in regulation (potentially accelerating pro-innovation legislation and stable币 rules), a re-pricing of risk premiums based on clearer communication and his view of AI as a structural disinflationary force, and a long-term reallocation of global institutional capital driven by increased legitimacy. Two potential scenarios for the press conference are outlined. A “positive surprise” would involve a dovish-leaning tone on rates coupled with signals of regulatory openness, potentially boosting crypto asset valuations. Conversely, a “negative shock” would see a more hawkish-than-expected stance on inflation and rates, triggering a broad risk-asset selloff that crypto markets would not escape. While ethics rules required Warsh to divest his crypto holdings upon confirmation, his deep understanding of the technology may fundamentally lower policy uncertainty and build a more receptive long-term foundation for digital assets’ integration into the mainstream financial system.

marsbit6 ч. назад

Warsh's Debut: Will the FED Chair Who Knows Crypto Best Bring Surprises or Shocks to the Market?

marsbit6 ч. назад

Торговля

Спот
Фьючерсы

Популярные статьи

Как купить S

Добро пожаловать на HTX.com! Мы сделали приобретение Sonic (S) простым и удобным. Следуйте нашему пошаговому руководству и отправляйтесь в свое крипто-путешествие.Шаг 1: Создайте аккаунт на HTXИспользуйте свой адрес электронной почты или номер телефона, чтобы зарегистрироваться и бесплатно создать аккаунт на HTX. Пройдите удобную регистрацию и откройте для себя весь функционал.Создать аккаунтШаг 2: Перейдите в Купить криптовалюту и выберите свой способ оплатыКредитная/Дебетовая Карта: Используйте свою карту Visa или Mastercard для мгновенной покупки Sonic (S).Баланс: Используйте средства с баланса вашего аккаунта HTX для простой торговли.Третьи Лица: Мы добавили популярные способы оплаты, такие как Google Pay и Apple Pay, для повышения удобства.P2P: Торгуйте напрямую с другими пользователями на HTX.Внебиржевая Торговля (OTC): Мы предлагаем индивидуальные услуги и конкурентоспособные обменные курсы для трейдеров.Шаг 3: Хранение Sonic (S)После приобретения вами Sonic (S) храните их в своем аккаунте на HTX. В качестве альтернативы вы можете отправить их куда-либо с помощью перевода в блокчейне или использовать для торговли с другими криптовалютами.Шаг 4: Торговля Sonic (S)С легкостью торгуйте Sonic (S) на спотовом рынке HTX. Просто зайдите в свой аккаунт, выберите торговую пару, совершайте сделки и следите за ними в режиме реального времени. Мы предлагаем удобный интерфейс как для начинающих, так и для опытных трейдеров.

1.5k просмотров всегоОпубликовано 2025.01.15Обновлено 2026.06.02

Как купить S

Sonic: Обновления под руководством Андре Кронье – новая звезда Layer-1 на фоне спада рынка

Он решает проблемы масштабируемости, совместимости между блокчейнами и стимулов для разработчиков с помощью технологических инноваций.

2.3k просмотров всегоОпубликовано 2025.04.09Обновлено 2025.04.09

Sonic: Обновления под руководством Андре Кронье – новая звезда Layer-1 на фоне спада рынка

HTX Learn: Пройдите обучение по "Sonic" и разделите 1000 USDT

HTX Learn — ваш проводник в мир перспективных проектов, и мы запускаем специальное мероприятие "Учитесь и Зарабатывайте", посвящённое этим проектам. Наше новое направление .

1.8k просмотров всегоОпубликовано 2025.04.10Обновлено 2025.04.10

HTX Learn: Пройдите обучение по "Sonic" и разделите 1000 USDT

Обсуждения

Добро пожаловать в Сообщество HTX. Здесь вы сможете быть в курсе последних новостей о развитии платформы и получить доступ к профессиональной аналитической информации о рынке. Мнения пользователей о цене на S (S) представлены ниже.

活动图片