Année charnière de l'IA appliquée : Se contenter de dire oui en ignorant les risques ? Le journal de bord du développement logiciel devient open source

marsbitОпубликовано 2026-06-16Обновлено 2026-06-16

Введение

L'ère des applications d'IA est là, mais ses risques se cachent dans un code apparemment correct, menaçant de provoquer des fuites de données ou des pertes financières. Le projet open source **Narwhal AI Code Risks**, issu de l'Université de Pékin, compile ces dangers en un journal de navigation pour le développement logiciel. Il catégorise les incidents en trois niveaux : des **cas réels** (comme l'erreur de configuration d'un oracle Moonwell ayant causé une perte de 1,7 million de dollars), des **signaux précoces** à surveiller, et des **scénarios typiques** de risques. Le danger ne réside pas dans un code erroné, mais dans un code syntaxiquement parfait qui introduit des failles sémantiques, des dépendances inexistantes, des permissions excessives ou des configurations cloud vulnérables. Les agents IA, en enchaînant les actions, complexifient encore la traçabilité. Le projet identifie **7 grandes catégories de risques** : la chaîne d'approvisionnement, les vulnérabilités du code, les configurations cloud/infrastructure, les risques liés aux agents, les risques sectoriels (fintech, santé...), la propriété intellectuelle/conformité, et les facteurs humains. L'objectif est de transformer des expériences dispersées en une connaissance réutilisable, aidant les développeurs à anticiper les pièges, les chercheurs à constituer des bases d'analyse et les éditeurs d'outils à renforcer leurs détections. Il s'agit de créer une mémoire collective pour naviguer de manière plus sûre ...

Les risques de l'IA qui écrit du code se cachent dans du code apparemment correct, pouvant entraîner des fuites de données ou des pertes d'actifs. Le projet open source Narwhal AI Code Risks recense des cas réels, des signaux précoces et des schémas de risques typiques, aidant les développeurs à identifier les dangers potentiels à l'avance et à éviter de répéter les mêmes erreurs.

2026, le code est généré à un rythme de plus en plus rapide, mais est déployé après de moins en moins d'examen.

De plus en plus souvent, les besoins de l'utilisateur sont placés dans une boîte de dialogue, l'IA lit le contexte, complète la fonction, met en place les dépendances, corrige la configuration, et génère même les tests.

Avant qu'on ne s'en rende compte, un morceau de code est déjà dans le dépôt, attendant d'être fusionné.

Les utilisateurs ont même développé de nouvelles habitudes : laisser d'abord l'IA écrire et faire tourner le code, puis regarder ce qui doit être modifié en cas de problème.

Mais dans le monde du logiciel, les choses les plus dangereuses sont souvent des codes qui paraissent banals : syntaxe correcte, interface légale, tests passés, commentaires parfaits.

Pourtant, ils peuvent tout de même introduire des noms de packages inexistants, ouvrir des autorisations trop larges, exposer des bases de données... ou même permettre à un Agent capable d'appeler directement les outils système, sous l'influence d'une injection d'invite, d'exfiltrer des données sensibles hors du système interne.

Ce qui est vraiment dangereux, ce n'est pas que le voyant d'erreur s'allume. C'est que tous les indicateurs de risque affichent "normal".

Les risques liés à l'IA qui écrit du code étaient jusqu'alors dispersés un peu partout : un cas dissimulé dans un blog de sécurité, une piste notée dans une Issue. Lorsqu'une autre équipe rencontrait un problème similaire, elle devait reconstituer la source du risque depuis le début et consacrer d'énormes efforts à des mesures empiriques à grande échelle sur le code.

Le Narwhal-Lab de l'Université de Pékin vient d'ouvrir en open source Narwhal AI Code Risks qui a déjà organisé ces fragments d'information, les classant en trois types : événements réels, signaux précoces et schémas de risques typiques, à la disposition des chercheurs.

Lien de l'article : https://github.com/Narwhal-Lab/Narwhal-aicode-risks

Quand les 28 vérifications sont toutes passées, le système dévie toujours

Le premier indice est une Pull Request déjà fusionnée, où la barre de signature affiche clairement Claude Opus 4.6 et Copilot, ainsi que quatre développeurs humains. Les 28 vérifications sont toutes passées : personne n'a détecté le problème.

Ensuite, le robot de liquidation a mis quelques minutes pour saisir des garanties d'une valeur de 1 778 044,83 dollars.

Dans le fichier de configuration, le prix du cbETH était défini sur le taux de conversion avec l'ETH, soit environ 1,12 dollar, au lieu du prix réel proche de 2 200 dollars.

Une erreur sémantique de prix a ainsi traversé les processus de développement, de vérification et de fusion, pour finalement se transformer en perte réelle dans le système financier. C'est ce qui rend l'incident de configuration de l'oracle cbETH de Moonwell si frappant.

Le problème vient du fait qu'il n'y avait pas d'erreur de syntaxe dans le code, et les développeurs humains n'ont pas immédiatement bloqué le processus anormal. Au contraire, tout semblait complet, fluide, c'était une livraison d'ingénierie normale.

Mais c'est précisément cette normalité aux courants souterrains qui en fait un exemple typique d'incident de sécurité.

Le risque de l'AI Coding réside dans le fait qu'il ne se manifeste pas toujours par des erreurs.

Souvent, il revêt l'apparence de la bonne réponse et entre silencieusement dans le flux d'ingénierie. Le code fonctionne, les vérifications passent, la PR est fusionnée, mais la sémantique métier s'est déjà écartée du monde réel.

Dans un projet à faible risque, cet écart sémantique pourrait n'être qu'une retouche ; mais dans des scénarios sensibles comme la finance ou les systèmes de données d'entreprise, il entraînera directement des fuites de données, des expositions de permissions et des pertes d'actifs.

Lorsque l'IA participe à l'écriture du code, à la modification de la configuration, à la relecture, voire co-signe dans une PR, avons-nous une assurance suffisante pour savoir comment chaque déviation se produit ?

Le signal de feu vert n'éclaire pas tous les recoins

Au début, l'IA vous aidant à écrire du code se limitait souvent à des complétions locales. Si la syntaxe était erronée, le compilateur signalait l'erreur, les tests unitaires échouaient, le processus d'intégration continue (CI) le rejetait.

Aujourd'hui, l'AI Coding va beaucoup plus loin, alors que la régulation tarde à suivre.

Il peut lire des fichiers, modifier des configurations, installer des dépendances, générer des scripts d'infrastructure, et permettre à un Agent de planifier de manière autonome entre plusieurs tâches.

L'IA n'est plus juste assise à côté à passer les outils, elle commence à s'insérer dans des chaînes plus longues de l'ingénierie logicielle.

Les frontières autrefois claires de l'ingénierie logicielle sont reconnectées par l'Agent d'IA en un chemin plus long, plus difficile à retracer.

Des enregistrements dispersés ont besoin d'un journal de bord public

Les incidents de sécurité ont rarement des conclusions complètes dès le départ. Certains ont des preuves solides et peuvent entrer dans le répertoire comme cas réels ; d'autres restent au stade de captures d'écran communautaires, de discussions entre chercheurs ou de divulgations préliminaires, et méritent seulement d'être surveillés ; d'autres encore ne sont liés à aucun événement réel unique, mais présentent déjà un schéma clair, adapté à une simulation préalable.

Narwhal AI Code Risks divise les matériaux en trois couches : `cases/`, `inferred/` et `scenarios/`.

cases/ enregistre les événements réels ayant des sources publiques et une chaîne de preuves étayée ; inferred/ conserve les signaux précoces qui ne sont pas encore totalement avérés, mais méritent un suivi continu ; scenarios/ organise les scénarios typiques qui ne sont pas liés à un événement unique, mais dont le schéma de risque est suffisamment clair.

Sans un tel enregistrement public, les risques de l'AI Coding pourraient facilement devenir une mémoire à court terme sur Internet.

Aujourd'hui, on se souvient d'un nom de package, demain on discute d'une exposition de données, dans quelques mois on est submergé par une nouvelle vague d'outils. Lorsqu'un problème similaire réapparaît, les équipes foncent toujours comme des mouches sans tête dans une zone de navigation aux risques inconnus.

Ce que fait Narwhal AI Code Risks, c'est figer ces fragments de risque épars, pour que les personnes suivantes puissent se référer à la même page.

Suivre les sept catégories d'index, voir d'où vient le risque

Les problèmes apportés par l'IA qui écrit du code ne sont pas seulement dans le code. Ils sont dans les dépendances, dans les permissions, dans les appels d'outils de l'Agent, et surtout dans la façon dont les humains font confiance à la sortie de l'IA.

Narwhal AI Code Risks classe actuellement les risques en 7 catégories : chaîne d'approvisionnement, vulnérabilités au niveau du code, configuration cloud et infrastructure, risques liés aux Agents, risques sectoriels, risques de propriété intellectuelle et de conformité, et facteurs humains.

Dans les risques de la chaîne d'approvisionnement, l'IA peut recommander des dépendances inexistantes. Dans les vulnérabilités au niveau du code, l'IA peut réintroduire des traversées de répertoires, des absences de validation d'entrée, des problèmes d'authentification dans le code métier. Dans la configuration cloud et infrastructure, l'IA peut, pour faire tourner le code rapidement, accorder des autorisations trop larges, des buckets de stockage publics ou des ports exposés. Les risques liés aux Agents sont plus complexes, il ne s'agit plus seulement de générer du texte, mais de commencer à exécuter des actions. Les productions de l'IA sont en train de semer des dangers dans des systèmes réels.

Le moteur de l'IA démarre, et le journal de bord commence tout juste à s'écrire

Alors que l'IA pénètre progressivement dans le monde réel, la prévention des risques associés ne devrait pas se limiter à des analyses post-mortem ou des discussions éparses.

L'aspect vraiment important de Narwhal AI Code Risks est de transformer les cas de risque en connaissances réutilisables.

Les développeurs peuvent l'utiliser pour identifier des problèmes similaires ; les chercheurs en sécurité peuvent s'en servir comme base d'échantillons ; les éditeurs d'outils peuvent en extraire des règles de détection et des benchmarks d'évaluation ; la communauté open source peut également continuer à ajouter de nouveaux cas, de nouvelles preuves et de nouveaux types de risques.

Le moteur de l'IA rugit, et chaque déviation devrait laisser ses coordonnées. Le risque ne disparaît jamais parce qu'on l'ignore, mais l'expérience peut être enregistrée et transmise. La valeur réelle ne réside pas dans la découverte d'une vulnérabilité, mais dans le fait que ceux qui suivent n'aient pas à retomber dans le même piège.

Ce que Narwhal AI Code Risks est en train de faire, c'est laisser un journal de bord open source pour le monde logiciel de l'année charnière de l'IA appliquée.

Références :

https://github.com/Narwhal-Lab/Narwhal-aicode-risks

Cet article provient du compte WeChat public "新智元", auteur : LRST

Связанные с этим вопросы

QQuel est l'objectif principal du projet Narwhal AI Code Risks récemment publié en open source par Narwhal-Lab ?

AL'objectif principal du projet Narwhal AI Code Risks est de compiler et d'organiser des informations sur les risques liés à l'écriture de code par l'IA. Il classe ces informations en trois catégories (cas réels, signaux précoces et scénarios typiques) afin d'aider les développeurs, chercheurs et autres parties prenantes à identifier les risques potentiels de manière proactive, à éviter de répéter les mêmes erreurs et à transformer les incidents passés en connaissances réutilisables pour la communauté.

QD'après l'article, pourquoi le risque lié au code généré par l'IA est-il particulièrement dangereux dans des domaines comme la finance ?

ALe risque lié au code généré par l'IA est particulièrement dangereux dans des domaines comme la finance car les erreurs ne se manifestent pas toujours par des bugs ou des échecs de compilation évidents. L'IA peut produire du code syntaxiquement correct, passant tous les tests et vérifications, mais introduisant une erreur sémantique discrète (comme une mauvaise valeur de configuration). Dans un système financier, une telle erreur peut directement entraîner des pertes d'actifs importantes, comme illustré par l'exemple de l'incident de l'oracle cbETH de Moonwell, qui a causé une perte de près de 1,8 million de dollars.

QEn quoi l'intervention des agents IA dans le développement logiciel complique-t-elle la gestion des risques selon l'article ?

AL'intervention des agents IA complique la gestion des risques car elle étend et brouille les frontières traditionnelles du processus de développement logiciel. Contrairement aux outils d'autocomplétion simples, les agents IA peuvent lire des fichiers, modifier des configurations, installer des dépendances, générer des scripts d'infrastructure et planifier des tâches entre elles. Cela crée une chaîne d'actions plus longue et plus complexe, dont il est plus difficile de tracer l'origine et de vérifier chaque étape, augmentant ainsi la surface d'attaque et rendant les défaillances plus difficiles à détecter en amont.

QComment le projet Narwhal AI Code Risks catégorise-t-il les différents types de matériaux ou de risques qu'il recense ?

ALe projet Narwhal AI Code Risks catégorise les matériaux en trois dossiers principaux : `cases/` pour les incidents réels avec des preuves et une chaîne de causalité établie, `inferred/` pour les signaux précoces ou les discussions communautaires qui méritent d'être surveillés mais ne sont pas encore totalement confirmés, et `scenarios/` pour les modèles de risque clairs et typiques qui ne sont pas nécessairement liés à un seul événement spécifique. De plus, il classe les risques eux-mêmes en sept catégories : risques liés à la chaîne d'approvisionnement, vulnérabilités au niveau du code, configuration du cloud et de l'infrastructure, risques liés aux agents, risques sectoriels spécifiques, risques de propriété intellectuelle et de conformité, et facteurs humains.

QQuelle métaphore l'article utilise-t-il pour décrire la valeur du projet Narwhal AI Code Risks pour la communauté du développement logiciel à l'ère de l'IA ?

AL'article utilise la métaphore d'un "journal de bord open source" (ou "logbook") pour décrire la valeur du projet Narwhal AI Code Risks. Tout comme un journal de bord maritime enregistre les itinéraires, les incidents et les enseignements d'un voyage, ce projet vise à documenter systématiquement les "déviations" (les incidents de sécurité et les risques) rencontrées lors du développement de logiciels avec l'IA. Cela permet à la communauté de ne pas oublier les erreurs passées, de partager les connaissances et, en fin de compte, d'éviter que les équipes suivantes ne retombent dans les mêmes pièges, naviguant ainsi plus sûrement dans le paysage nouveau et risqué du développement assisté par l'IA.

Похожее

Pricing OpenAI Pre-IPO: A New, Life-or-Death Business on Hyperliquid Lasting Half a Year

Pricing OpenAI Pre-IPO: Hyperliquid's High-Stakes, Six-Month Business Venture The article analyzes the nascent market for pre-IPO perpetual contracts on the Hyperliquid blockchain, exemplified by two contrasting teams: Trade.xyz and Ventuals. Trade.xyz, an anonymous team, successfully built the largest pre-market on Hyperliquid. Its strategy focused on near-term events, like the SpaceX IPO. By listing a SpaceX contract with a known launch date and price, the market had a tangible "anchor" (the eventual Nasdaq opening price) to converge upon, which kept speculation in check. This approach fueled significant growth. In stark contrast, Ventuals, backed by Paradigm, failed despite holding coveted contracts for OpenAI and Anthropic. Its critical flaw was its pricing mechanism for these companies, which have no imminent IPO. Ventuals' oracle price was half-derived from infrequent private market transactions and half from its own contract's moving average. This created a self-reinforcing loop where buying pressure artificially inflated the price, disconnecting it from real supply and demand. The market became illiquid and structurally skewed. Ventuals shut down nine months after launch, reportedly through an acquisition. Its final settlement prices—OpenAI at ~$1,341 and Anthropic at ~$1,618—were thus partially products of its flawed model. Ironically, some company employees and late-stage VCs reportedly used these prices for valuation reference, highlighting the desperate demand for price discovery in opaque private markets. The failure of Ventuals exposes the core challenge of this business: price for illiquid, non-public assets requires a robust, self-correcting market, which is absent without a definitive public listing event. Nevertheless, demand is driving major players like Coinbase and traditional finance (e.g., Citi) to enter the space, aiming to provide 24/7 trading for coveted private company shares. The venture's ultimate viability, however, hinges on solving the fundamental pricing problem Ventuals could not.

marsbit4 мин. назад

Pricing OpenAI Pre-IPO: A New, Life-or-Death Business on Hyperliquid Lasting Half a Year

marsbit4 мин. назад

Are the "Magnificent Seven" No Longer Enough? SpaceX IPO Attracts Retail Frenzy, Wall Street Serves Up the "AI Tech Ten"

The article discusses a potential shift in Wall Street's categorization of major tech stocks, driven by SpaceX's highly successful IPO. On its first day of trading, SpaceX attracted $117 million in net purchases from retail investors, accounting for 56% of all U.S. retail stock buys that day. This surge has prompted research firm Vanda to propose a new group called the "FAB 10" (Frontier AI & Big Tech 10). This concept suggests replacing the long-standing "Magnificent Seven" with ten companies believed to define the next decade of AI and technology. The proposed FAB 10 would include the original seven giants plus SpaceX and the yet-to-be-public AI firms OpenAI and Anthropic, both anticipated to go public later this year with valuations potentially reaching trillions. This contrasts with another proposed grouping, Bank of America's "AI Big 10," which adds semiconductor companies like Broadcom, AMD, and Micron to the core seven, focusing more on hardware. The divergence highlights different bets on the future drivers of tech growth. Analysts note that the massive influx of retail money into new listings like SpaceX might divert capital from other hot sectors, such as chip stocks, and warn that high valuations across the tech sector may indicate bubble risks.

marsbit24 мин. назад

Are the "Magnificent Seven" No Longer Enough? SpaceX IPO Attracts Retail Frenzy, Wall Street Serves Up the "AI Tech Ten"

marsbit24 мин. назад

Interview with Morgan Stanley Digital Asset Strategy Head: Bitcoin Hitting $1 Million Isn't Impossible, But I Hope It Slows Down

In an interview with Morgan Stanley’s Digital Asset Strategy Head Amy Oldenburg, she discussed Bitcoin’s evolution from an emerging technology to a mainstream financial asset. Oldenburg highlighted Bitcoin’s early appeal in emerging markets, where unreliable banking systems drove adoption of decentralized alternatives. Despite institutional interest, regulatory constraints and risk-averse financial advisors have slowed broader adoption. She noted that Bitcoin's price has largely consolidated since Morgan Stanley recommended it, dampening advisor enthusiasm. Oldenburg believes Bitcoin could reach $1 million but prefers a gradual, stable ascent rather than a speculative spike. She emphasized the need for better investor education and infrastructure development, while acknowledging the tension between Bitcoin’s decentralized origins and its integration into traditional finance through vehicles like ETFs. Looking ahead, she envisions steady growth and increased utility for Bitcoin, driven by evolving technology and market maturity.

marsbit31 мин. назад

Interview with Morgan Stanley Digital Asset Strategy Head: Bitcoin Hitting $1 Million Isn't Impossible, But I Hope It Slows Down

marsbit31 мин. назад

M&A Deals in the Crypto Market Are Unusually Active

Title: M&A Activity in Crypto Market Becomes Unusually Active A rare signal is emerging in the crypto primary market: mergers and acquisitions (M&A) are nearing half of all financing deals. According to RootData, this month, M&A cases in the crypto industry reached 10, while financing rounds numbered only 14, meaning M&A accounts for approximately 42% of primary market transactions—the highest level in history. This does not signal a sudden industry boom. Instead, the rapid rise in M&A share primarily reflects the continued downturn in the financing market. Since November 2024, monthly crypto M&A deals have remained between 10-20, while financing deals have plummeted from around 100 to about 50, possibly hitting a new low this month. For project teams, this means the traditional path of relying on narratives, token expectations, and ecosystem subsidies to maintain valuations is narrowing. For leading companies, it presents a rare window to acquire teams, licenses, technology, liquidity, and market access at lower prices, with less competition and stronger bargaining power. Key active buyers include Coinbase, Kraken, Ripple, MoonPay, Polymarket, Kaiko, Sol Strategies, GSR, Keyrock, Jupiter, Paxos, and Ondo Finance. Their M&A logic is consistent: acquiring key capabilities at lower costs during the industry downturn. This is driven by more attractive valuations, reduced time and trial-and-error costs, the acquisition of licenses and compliance resources, and the integration of industry upstream and downstream segments. Current M&A focuses are concentrated in four areas: trading infrastructure (e.g., Coinbase acquiring Deribit, Kraken acquiring NinjaTrader), payments and stablecoins (e.g., MoonPay, Ripple expanding payment networks), compliance licenses, and asset issuance/distribution (e.g., acquisitions related to RWA and token issuance platforms like Coinbase's purchases of Liquifi and Echo). The rise in M&A is altering the primary market's exit logic. It provides an alternative path to the token-dependent model, encouraging teams to build tangible products, revenue, and strategic value that can be integrated. This could inject confidence into the market, showing that asset buyers and exit possibilities still exist, albeit with a stricter focus on real utility. However, this trend also indicates the crypto industry is becoming more centralized. As asset issuance, trading, market-making, custody, payments, and data gradually consolidate in the hands of a few major players, the industry's initial emphasis on openness and anti-monopoly is being reshaped by commercial realities. Coupled with rising compliance barriers, this signals the end of the low-barrier era for crypto entrepreneurship.

链捕手37 мин. назад

M&A Deals in the Crypto Market Are Unusually Active

链捕手37 мин. назад

M&A Deals Are Exceptionally Active in the Crypto Market

Mergers and acquisitions (M&A) activity in the cryptocurrency primary market has reached a historic high, accounting for approximately 42% of total deals in the current month, nearly matching the number of financing rounds. This shift does not signal a new boom cycle but rather reflects a severe contraction in the venture capital funding environment. As financing dwindles, established industry giants—including major exchanges, payment firms, and infrastructure providers—are seizing the opportunity to acquire strategic assets at lower valuations. Key drivers behind the surge in M&A include depressed project valuations, the need to quickly acquire talent and technology to capture short market windows, the pursuit of crucial regulatory licenses, and the strategic expansion into adjacent business verticals such as derivatives, payments, stablecoins, and real-world asset (RWA) issuance. Major acquisitions, like Coinbase's purchase of Deribit and Kraken's acquisition of NinjaTrader, exemplify the push to expand into high-margin areas like derivatives and multi-asset trading. This trend is reshaping the industry's exit landscape, offering an alternative to token-based exits and incentivizing startups to build tangible products and revenue streams with inherent strategic value for acquisition. However, it also points toward increasing centralization, as critical functions—trading, custody, payments, compliance—become concentrated within a few large, well-capitalized platforms, potentially raising barriers to entry for new ventures.

marsbit38 мин. назад

M&A Deals Are Exceptionally Active in the Crypto Market

marsbit38 мин. назад

Торговля

Спот

Фьючерсы

Обсуждения

Добро пожаловать в Сообщество HTX. Здесь вы сможете быть в курсе последних новостей о развитии платформы и получить доступ к профессиональной аналитической информации о рынке. Мнения пользователей о цене на S (S) представлены ниже.