Année charnière de l'IA appliquée : Se contenter de dire oui en ignorant les risques ? Le journal de bord du développement logiciel devient open source

marsbit发布于2026-06-16更新于2026-06-16

文章摘要

L'ère des applications d'IA est là, mais ses risques se cachent dans un code apparemment correct, menaçant de provoquer des fuites de données ou des pertes financières. Le projet open source **Narwhal AI Code Risks**, issu de l'Université de Pékin, compile ces dangers en un journal de navigation pour le développement logiciel. Il catégorise les incidents en trois niveaux : des **cas réels** (comme l'erreur de configuration d'un oracle Moonwell ayant causé une perte de 1,7 million de dollars), des **signaux précoces** à surveiller, et des **scénarios typiques** de risques. Le danger ne réside pas dans un code erroné, mais dans un code syntaxiquement parfait qui introduit des failles sémantiques, des dépendances inexistantes, des permissions excessives ou des configurations cloud vulnérables. Les agents IA, en enchaînant les actions, complexifient encore la traçabilité. Le projet identifie **7 grandes catégories de risques** : la chaîne d'approvisionnement, les vulnérabilités du code, les configurations cloud/infrastructure, les risques liés aux agents, les risques sectoriels (fintech, santé...), la propriété intellectuelle/conformité, et les facteurs humains. L'objectif est de transformer des expériences dispersées en une connaissance réutilisable, aidant les développeurs à anticiper les pièges, les chercheurs à constituer des bases d'analyse et les éditeurs d'outils à renforcer leurs détections. Il s'agit de créer une mémoire collective pour naviguer de manière plus sûre ...

Les risques de l'IA qui écrit du code se cachent dans du code apparemment correct, pouvant entraîner des fuites de données ou des pertes d'actifs. Le projet open source Narwhal AI Code Risks recense des cas réels, des signaux précoces et des schémas de risques typiques, aidant les développeurs à identifier les dangers potentiels à l'avance et à éviter de répéter les mêmes erreurs.

2026, le code est généré à un rythme de plus en plus rapide, mais est déployé après de moins en moins d'examen.

De plus en plus souvent, les besoins de l'utilisateur sont placés dans une boîte de dialogue, l'IA lit le contexte, complète la fonction, met en place les dépendances, corrige la configuration, et génère même les tests.

Avant qu'on ne s'en rende compte, un morceau de code est déjà dans le dépôt, attendant d'être fusionné.

Les utilisateurs ont même développé de nouvelles habitudes : laisser d'abord l'IA écrire et faire tourner le code, puis regarder ce qui doit être modifié en cas de problème.

Mais dans le monde du logiciel, les choses les plus dangereuses sont souvent des codes qui paraissent banals : syntaxe correcte, interface légale, tests passés, commentaires parfaits.

Pourtant, ils peuvent tout de même introduire des noms de packages inexistants, ouvrir des autorisations trop larges, exposer des bases de données... ou même permettre à un Agent capable d'appeler directement les outils système, sous l'influence d'une injection d'invite, d'exfiltrer des données sensibles hors du système interne.

Ce qui est vraiment dangereux, ce n'est pas que le voyant d'erreur s'allume. C'est que tous les indicateurs de risque affichent "normal".

Les risques liés à l'IA qui écrit du code étaient jusqu'alors dispersés un peu partout : un cas dissimulé dans un blog de sécurité, une piste notée dans une Issue. Lorsqu'une autre équipe rencontrait un problème similaire, elle devait reconstituer la source du risque depuis le début et consacrer d'énormes efforts à des mesures empiriques à grande échelle sur le code.

Le Narwhal-Lab de l'Université de Pékin vient d'ouvrir en open source Narwhal AI Code Risks qui a déjà organisé ces fragments d'information, les classant en trois types : événements réels, signaux précoces et schémas de risques typiques, à la disposition des chercheurs.

Lien de l'article : https://github.com/Narwhal-Lab/Narwhal-aicode-risks

Quand les 28 vérifications sont toutes passées, le système dévie toujours

Le premier indice est une Pull Request déjà fusionnée, où la barre de signature affiche clairement Claude Opus 4.6 et Copilot, ainsi que quatre développeurs humains. Les 28 vérifications sont toutes passées : personne n'a détecté le problème.

Ensuite, le robot de liquidation a mis quelques minutes pour saisir des garanties d'une valeur de 1 778 044,83 dollars.

Dans le fichier de configuration, le prix du cbETH était défini sur le taux de conversion avec l'ETH, soit environ 1,12 dollar, au lieu du prix réel proche de 2 200 dollars.

Une erreur sémantique de prix a ainsi traversé les processus de développement, de vérification et de fusion, pour finalement se transformer en perte réelle dans le système financier. C'est ce qui rend l'incident de configuration de l'oracle cbETH de Moonwell si frappant.

Le problème vient du fait qu'il n'y avait pas d'erreur de syntaxe dans le code, et les développeurs humains n'ont pas immédiatement bloqué le processus anormal. Au contraire, tout semblait complet, fluide, c'était une livraison d'ingénierie normale.

Mais c'est précisément cette normalité aux courants souterrains qui en fait un exemple typique d'incident de sécurité.

Le risque de l'AI Coding réside dans le fait qu'il ne se manifeste pas toujours par des erreurs.

Souvent, il revêt l'apparence de la bonne réponse et entre silencieusement dans le flux d'ingénierie. Le code fonctionne, les vérifications passent, la PR est fusionnée, mais la sémantique métier s'est déjà écartée du monde réel.

Dans un projet à faible risque, cet écart sémantique pourrait n'être qu'une retouche ; mais dans des scénarios sensibles comme la finance ou les systèmes de données d'entreprise, il entraînera directement des fuites de données, des expositions de permissions et des pertes d'actifs.

Lorsque l'IA participe à l'écriture du code, à la modification de la configuration, à la relecture, voire co-signe dans une PR, avons-nous une assurance suffisante pour savoir comment chaque déviation se produit ?

Le signal de feu vert n'éclaire pas tous les recoins

Au début, l'IA vous aidant à écrire du code se limitait souvent à des complétions locales. Si la syntaxe était erronée, le compilateur signalait l'erreur, les tests unitaires échouaient, le processus d'intégration continue (CI) le rejetait.

Aujourd'hui, l'AI Coding va beaucoup plus loin, alors que la régulation tarde à suivre.

Il peut lire des fichiers, modifier des configurations, installer des dépendances, générer des scripts d'infrastructure, et permettre à un Agent de planifier de manière autonome entre plusieurs tâches.

L'IA n'est plus juste assise à côté à passer les outils, elle commence à s'insérer dans des chaînes plus longues de l'ingénierie logicielle.

Les frontières autrefois claires de l'ingénierie logicielle sont reconnectées par l'Agent d'IA en un chemin plus long, plus difficile à retracer.

Des enregistrements dispersés ont besoin d'un journal de bord public

Les incidents de sécurité ont rarement des conclusions complètes dès le départ. Certains ont des preuves solides et peuvent entrer dans le répertoire comme cas réels ; d'autres restent au stade de captures d'écran communautaires, de discussions entre chercheurs ou de divulgations préliminaires, et méritent seulement d'être surveillés ; d'autres encore ne sont liés à aucun événement réel unique, mais présentent déjà un schéma clair, adapté à une simulation préalable.

Narwhal AI Code Risks divise les matériaux en trois couches : `cases/`, `inferred/` et `scenarios/`.

cases/ enregistre les événements réels ayant des sources publiques et une chaîne de preuves étayée ; inferred/ conserve les signaux précoces qui ne sont pas encore totalement avérés, mais méritent un suivi continu ; scenarios/ organise les scénarios typiques qui ne sont pas liés à un événement unique, mais dont le schéma de risque est suffisamment clair.

Sans un tel enregistrement public, les risques de l'AI Coding pourraient facilement devenir une mémoire à court terme sur Internet.

Aujourd'hui, on se souvient d'un nom de package, demain on discute d'une exposition de données, dans quelques mois on est submergé par une nouvelle vague d'outils. Lorsqu'un problème similaire réapparaît, les équipes foncent toujours comme des mouches sans tête dans une zone de navigation aux risques inconnus.

Ce que fait Narwhal AI Code Risks, c'est figer ces fragments de risque épars, pour que les personnes suivantes puissent se référer à la même page.

Suivre les sept catégories d'index, voir d'où vient le risque

Les problèmes apportés par l'IA qui écrit du code ne sont pas seulement dans le code. Ils sont dans les dépendances, dans les permissions, dans les appels d'outils de l'Agent, et surtout dans la façon dont les humains font confiance à la sortie de l'IA.

Narwhal AI Code Risks classe actuellement les risques en 7 catégories : chaîne d'approvisionnement, vulnérabilités au niveau du code, configuration cloud et infrastructure, risques liés aux Agents, risques sectoriels, risques de propriété intellectuelle et de conformité, et facteurs humains.

Dans les risques de la chaîne d'approvisionnement, l'IA peut recommander des dépendances inexistantes. Dans les vulnérabilités au niveau du code, l'IA peut réintroduire des traversées de répertoires, des absences de validation d'entrée, des problèmes d'authentification dans le code métier. Dans la configuration cloud et infrastructure, l'IA peut, pour faire tourner le code rapidement, accorder des autorisations trop larges, des buckets de stockage publics ou des ports exposés. Les risques liés aux Agents sont plus complexes, il ne s'agit plus seulement de générer du texte, mais de commencer à exécuter des actions. Les productions de l'IA sont en train de semer des dangers dans des systèmes réels.

Le moteur de l'IA démarre, et le journal de bord commence tout juste à s'écrire

Alors que l'IA pénètre progressivement dans le monde réel, la prévention des risques associés ne devrait pas se limiter à des analyses post-mortem ou des discussions éparses.

L'aspect vraiment important de Narwhal AI Code Risks est de transformer les cas de risque en connaissances réutilisables.

Les développeurs peuvent l'utiliser pour identifier des problèmes similaires ; les chercheurs en sécurité peuvent s'en servir comme base d'échantillons ; les éditeurs d'outils peuvent en extraire des règles de détection et des benchmarks d'évaluation ; la communauté open source peut également continuer à ajouter de nouveaux cas, de nouvelles preuves et de nouveaux types de risques.

Le moteur de l'IA rugit, et chaque déviation devrait laisser ses coordonnées. Le risque ne disparaît jamais parce qu'on l'ignore, mais l'expérience peut être enregistrée et transmise. La valeur réelle ne réside pas dans la découverte d'une vulnérabilité, mais dans le fait que ceux qui suivent n'aient pas à retomber dans le même piège.

Ce que Narwhal AI Code Risks est en train de faire, c'est laisser un journal de bord open source pour le monde logiciel de l'année charnière de l'IA appliquée.

Références :

https://github.com/Narwhal-Lab/Narwhal-aicode-risks

Cet article provient du compte WeChat public "新智元", auteur : LRST

你可能也喜欢

XRP Ledger 发布 3.2.0 版本升级并启用 XRPLd 新品牌名

XRP Ledger发布了3.2.0版本，这是对其底层区块链基础设施的一次重要升级。本次更新的核心是将运行网络的软件名称从“rippled”更名为“xrpld”，以更好地反映整个项目生态。与此前侧重于前端功能的版本不同，3.2.0版本优先进行了后端升级和效率提升，旨在增强网络性能并为未来的扩展做准备。关键改进包括内存优化措施，预计可节省高达40%的服务器内存使用。此次升级引入了名为“fixCleanup3_2_0”的修改，为单资产金库、借贷协议、权限系统、去中心化交易所、多用途代币和权限域等多个模块带来了安全性增强。开发团队还新增了不变性检查，以确保已删除账户不会在账本上留下不一致的数据，从而加强整个网络的完整性和可靠性。对于开发者而言，新版本增加了一项重要功能：应用程序无需连接服务器即可检索XRP Ledger协议和服务器定义信息，这将极大便利钱包、区块链浏览器和API等的开发工作。在可扩展性和稳定性方面，更新包括可配置的区块大小、通过nuDB实现的高效数据库存储，以及将gRPC服务器的TLS/双向TLS支持改为可选，以提升企业用户的性能和连接性。此外，默认对等端口从51235更改为2459，并修复了涉及自动做市商、支付、代币托管、多用途代币、订单簿和RPC等多个方面的问题。出于性能考虑，3.2.0版本暂时禁用了交易不变性检查，但开发团队表示这不会构成安全威胁。

TheNewsCrypto15分钟前

TheNewsCrypto15分钟前

AGI不是终点，DeepMind新论文：迈向ASI，真正的AI进步才刚开始

DeepMind团队最新研究报告提出，通用人工智能（AGI）很可能不是AI发展的终点。AI将继续超越人类水平，走向超级人工智能（ASI）。报告区分了AGI（达到人类中位认知水平）、ASI（在所有重要领域整体超越人类专家集体）和UAI（理论智能上界）三个概念，并探讨了从AGI迈向ASI的四条潜在路径：持续扩展计算、模型与数据规模；算法持续演化乃至范式转变；系统通过递归自我改进形成正反馈；以及通过多智能体协作形成超越单体的集体智能。报告同时指出了发展过程中可能面临的六大关键瓶颈：高质量人类数据可能面临枯竭的“数据墙”；能源、芯片等经济和自然资源压力；现有神经网络范式在持续学习、稳定推理等方面的根本性局限；研究难度随领域成熟而增加；AI可能难以自主提炼新概念原语的“抽象壁垒”；以及监管、治理与社会反弹带来的影响。报告最后强调，一旦AI能力超越人类，现有以人类水平为参照的评估体系将失效，需要建立面向后AGI时代的新评估机制。ASI的发展仍受物理规律、资源等现实约束，其具体路径与速度存在高度不确定性，未来需持续开展跨学科研究以应对这一前景。

marsbit1小时前

marsbit1小时前

Kraken推出OpenAI和Anthropic的Pre-IPO永续合约，提供高达5倍杠杆

加密货币交易所Kraken推出了针对OpenAI和Anthropic的“IPO前永续合约”（pre-IPO perps），允许符合条件的交易者在这两家备受关注的私人人工智能公司公开上市前，进行高达5倍杠杆的多空交易。此举标志着加密货币衍生品平台正超越数字资产范畴，尝试对接私人公司股权等链下资产，为散户投资者提供原本难以触及的热门投资主题（如AI）的敞口。然而，这类产品与普通的加密货币永续合约存在显著差异。其定价基于不透明、非连续的私人市场估值（受融资轮次、二级交易、IPO预期等因素影响），而非流动的现货市场价格，因此风险管理更为复杂。高杠杆进一步放大了与估值波动、流动性及上市时间表相关的独特风险。总之，Kraken的推出显示了加密交易基础设施向更广泛投机标的的扩张，为投资者提供了新的表达观点的工具，但产品本身风险较高，投资者需充分了解其复杂性和风险后再谨慎参与。

bitcoinist1小时前

Kraken推出OpenAI和Anthropic的Pre-IPO永续合约，提供高达5倍杠杆

bitcoinist1小时前

给 OpenAI 盘前定价：Hyperliquid 上一门半年生死的新生意

本文探讨了在Hyperliquid平台上兴起的未上市公司（如SpaceX、OpenAI）“盘前定价”合约交易现象。匿名团队Trade.xyz通过聚焦即将上市的SpaceX（有明确的纳斯达克最终定价作为锚点），成功打造了该平台最大的盘前市场。相反，由知名风投Paradigm支持的Ventuals，虽手握OpenAI和Anthropic等稀缺标的，却因其定价机制（一半依赖非公开的老股交易价，一半依赖自身合约价格的均线）导致价格失真、缺乏流动性，最终在运营九个月后关停。其关停时给出的OpenAI（约1341美元）和Anthropic（约1619美元）的“最终报价”，虽被部分内部人士参考，但其公允性存疑。文章指出，为未上市公司提供实时交易价格的需求真实存在，并正吸引Coinbase等大型机构入场，但该生意的核心挑战——如何在没有公开市场的情况下形成公允、可持续的定价机制——仍未解决。Ventuals的案例揭示了，缺乏坚实价值锚点的定价游戏难以长久。

marsbit1小时前

marsbit1小时前

“七巨头”不够用了？SpaceX 上市散户狂买，华尔街端出“AI 科技十巨头”

SpaceX于上周五上市首日吸引散户净买入1.17亿美元，占当天全美散户股票买盘的56%，其IPO募资约750亿美元，估值约1.75万亿美元。研究机构Vanda据此提出“FAB 10”（前沿AI与科技十巨头）新概念，主张在原有的“七巨头”基础上，加入SpaceX、OpenAI和Anthropic，认为这些公司代表未来十年科技与AI方向。OpenAI与Anthropic尚未上市，预计估值或达万亿美元级别。与此同时，美国银行曾提出偏向半导体硬件的“AI Big 10”组合。Vanda指出，SpaceX的火爆可能从其他热门板块（如芯片股）抽走资金。尽管科技板块估值已显泡沫迹象，但市场对新巨头的追捧仍在改写投资框架。

marsbit1小时前

marsbit1小时前

交易

现货

合约

Année charnière de l'IA appliquée : Se contenter de dire oui en ignorant les risques ? Le journal de bord du développement logiciel devient open source

文章摘要

Quand les 28 vérifications sont toutes passées, le système dévie toujours

Le signal de feu vert n'éclaire pas tous les recoins

Des enregistrements dispersés ont besoin d'un journal de bord public

Suivre les sept catégories d'index, voir d'où vient le risque

Le moteur de l'IA démarre, et le journal de bord commence tout juste à s'écrire

Références :

相关问答

你可能也喜欢

XRP Ledger 发布 3.2.0 版本升级并启用 XRPLd 新品牌名

AGI不是终点，DeepMind新论文：迈向ASI，真正的AI进步才刚开始

Kraken推出OpenAI和Anthropic的Pre-IPO永续合约，提供高达5倍杠杆

给 OpenAI 盘前定价：Hyperliquid 上一门半年生死的新生意

“七巨头”不够用了？SpaceX 上市散户狂买，华尔街端出“AI 科技十巨头”

交易

热门文章

如何购买S

Sonic：Andre Cronje主导升级，逆势上涨的Layer1新星

成长学院：学习“ Sonic“ ，瓜分价值 1000 USDT

相关讨论

热门问答

热门分类

热门标签