Auteur : DWF Ventures
Compilation : TechFlow
Guide TechFlow : Les agents IA représentent déjà près d'un cinquième du volume des transactions en DeFi, et ils surpassent effectivement les humains dans des scénarios aux règles claires comme l'optimisation des rendements. Mais lorsqu'il s'agit de transactions autonomes, les meilleures IA ne parviennent pas à atteindre un cinquième des performances des meilleurs traders humains. Cette étude décompose les performances réelles de l'IA dans différents scénarios DeFi, une lecture essentielle pour tous ceux qui s'intéressent au trading automatisé.
Points clés
L'automatisation et l'activité des agents représentent actuellement environ 19 % de toute l'activité on-chain, mais une véritable autonomie de bout en bout n'est pas encore une réalité.
Dans des cas d'utilisation étroits et bien définis comme l'optimisation des rendements, les agents ont démontré des performances supérieures à celles des humains et des bots. Mais pour des actions multidimensionnelles comme le trading, les humains surpassent les agents.
Parmi les agents, le choix du modèle et la gestion des risques ont l'impact le plus significatif sur les performances des transactions.
Avec l'adoption massive des agents, plusieurs risques concernant la confiance et l'exécution existent, notamment les attaques Sybil, l'encombrement des stratégies et les compromis sur la vie privée.
L'activité des agents continue de croître
L'activité des agents a connu une croissance régulière au cours de l'année écoulée, avec une augmentation du volume et du nombre de transactions. Nous avons vu le protocole x402 de Coinbase mener des développements majeurs, tandis que des acteurs comme Visa, Stripe et Google ont également rejoint la tendance avec leurs propres standards. La majeure partie de l'infrastructure actuellement en construction vise à servir deux types de scénarios : la communication entre agents ou des appels d'agents déclenchés par des humains.
Bien que les transactions en stablecoins soient largement prises en charge, l'infrastructure actuelle repose encore sur des passerelles de paiement traditionnelles en sous-jacent, ce qui signifie qu'elle dépend toujours de contreparties centralisées. Par conséquent, le stade final de « pleine autonomie », où les agents peuvent s'auto-financer, s'exécuter eux-mêmes et s'optimiser continuellement en fonction des conditions changeantes, n'est pas encore atteint.
Les agents ne sont pas totalement nouveaux pour le DeFi. L'automatisation via des bots existe depuis des années dans les protocoles on-chain, capturant la MEV ou obtenant des rendements excédentaires qui ne seraient pas possibles sans code. Ces systèmes fonctionnent très bien avec des paramètres bien définis qui ne changent pas fréquemment ou ne nécessitent pas de supervision supplémentaire. Cependant, les marchés sont devenus plus complexes avec le temps. C'est là que nous voyons émerger une nouvelle génération d'agents, et la chaîne est devenue un terrain d'expérimentation pour ce type d'activité au cours des derniers mois.
Les performances réelles des agents
Selon le rapport, l'activité des agents a connu une croissance exponentielle, avec plus de 17 000 agents lancés depuis 2025. Le volume total d'activité automatisée/des agents est estimé couvrir plus de 19 % de toute l'activité on-chain. Cela n'est pas surprenant, car on estime que plus de 76 % du volume des transferts de stablecoins est généré par des bots. Cela suggère un énorme potentiel de croissance pour l'activité des agents dans le DeFi.
Il existe un large spectre d'autonomie pour les agents, allant d'expériences de type chatbot nécessitant une supervision humaine importante, à des agents capables de formuler des stratégies adaptées aux conditions du marché sur la base d'objectifs définis. Par rapport aux bots, les agents présentent plusieurs avantages clés, notamment la capacité de répondre et d'exécuter de nouvelles informations en millisecondes, et d'étendre leur portée à des milliers de marchés tout en maintenant la même rigueur.
Actuellement, la plupart des agents se situent encore au niveau analyste ou copilote, car la majorité est encore en phase de test.
Optimisation des rendements : Les agents excellent
La fourniture de liquidités est un domaine où l'automatisation se produit fréquemment, avec un TVL total détenu par les agents dépassant 39 millions de dollars. Ce chiffre mesure principalement les actifs déposés directement par les utilisateurs dans les agents, mais n'inclut pas le capital acheminé via des vaults.
Giza Tech est l'un des plus grands protocoles de ce domaine, ayant lancé fin de l'année dernière sa première application d'agent, ARMA, conçue pour améliorer la capture de rendements sur les principaux protocoles DeFi. Elle a attiré plus de 19 millions de dollars d'actifs sous gestion et a généré un volume de transactions par agent de plus de 4 milliards de dollars. Le ratio élevé entre le volume des transactions et le total des actifs sous gestion indique que les agents rééquilibrent fréquemment le capital, permettant ainsi une capture de rendement plus élevée. Une fois le capital déposé dans le contrat, l'exécution est automatisée, offrant ainsi à l'utilisateur une expérience simple en un clic nécessitant très peu de supervision.
La performance d'ARMA est mesurablement excellente, générant un rendement annualisé de plus de 9,75 % pour l'USDC. Même en tenant compte des frais supplémentaires de rééquilibrage et des frais de performance de 10 % de l'agent, le rendement dépasse celui d'un prêt standard sur Aave ou Morpho. Néanmoins, l'évolutivité reste un problème clé, car ces agents n'ont pas encore été testés en conditions réelles pour gérer ou s'adapter à l'échelle des principaux protocoles DeFi.
Trading : Les humains largement en tête
Cependant, pour des actions plus complexes comme le trading, les résultats sont beaucoup plus variés. Les modèles de trading actuels fonctionnent sur la base d'entrées définies par l'homme et fournissent une sortie selon des règles prédéfinies. Le machine learning étend cela en permettant au modèle de mettre à jour son comportement en fonction de nouvelles informations sans reprogrammation explicite, le faisant évoluer vers un rôle de copilote. Avec l'arrivée d'agents totalement autonomes, le paysage du trading va considérablement changer.
Plusieurs compétitions de trading entre agents, et entre humains et agents, ont déjà eu lieu, montrant de grandes variations entre les modèles. Trade XYZ a organisé une compétition de trading humain contre agent pour les actions listées sur sa plateforme. Chaque compte avait un capital initial de 10 000 $, sans restriction sur le levier ou la fréquence des transactions. Les résultats étaient massivement en faveur des humains, les meilleurs humains surperformant les meilleurs agents de plus de 5 fois.
Parallèlement, Nof1 a organisé une compétition de trading entre agents, faisant concourir plusieurs modèles (Grok-4, GPT-5, Deepseek, Kimi, Qwen3, Claude, Gemini) en testant différentes configurations de risque, de la préservation du capital au levier maximum. Les résultats ont révélé plusieurs facteurs pouvant expliquer les différences de performance :
Temps de détention : Une forte corrélation existe, les modèles détenant en moyenne chaque position pendant 2-3 heures surperformant largement ceux retournant fréquemment leurs positions.
Espérance mathématique : Cela mesure si le modèle gagne en moyenne de l'argent sur chaque trade. Fait intéressant, seuls les 3 premiers modèles avaient une espérance positive, ce qui signifie que la plupart des modèles perdaient plus d'argent qu'ils n'en gagnaient.
Levier : Des niveaux de levier moyens plus faibles, autour de 6-8x, se sont avérés plus performants que les modèles fonctionnant avec plus de 10x de levier, les niveaux élevés accélérant les pertes.
Stratégie de prompt : Le mode « Monk Mode » était de loin le modèle le plus performant, tandis que « Situational Awareness » était le moins performant. Basé sur les caractéristiques du modèle, cela montre qu'une focalisation sur la gestion des risques et moins de sources externes conduit à de meilleures performances.
Modèle de base : Grok 4.20 a significativement surpassé les autres modèles de plus de 22 % à travers différentes stratégies de prompt, et était le seul modèle à être rentable en moyenne.
D'autres facteurs comme la préférence long/short, la taille des trades et le score de confiance n'avaient pas suffisamment de données ou n'ont montré aucune corrélation positive avec la performance du modèle. Globalement, les résultats indiquent que les agents tendent à mieux performer dans des contraintes bien définies, ce qui signifie que les humains restent très nécessaires pour la configuration des objectifs.
Comment évaluer un Agent
Étant donné que les agents en sont encore à leurs débuts, il n'existe pas encore de cadre d'évaluation complet. Les performances historiques sont souvent utilisées comme référence pour évaluer les agents, mais elles sont influencées par des facteurs sous-jacents qui fournissent des indications plus solides sur la performance d'un agent robuste.
Performance sous différentes volatilités : Inclut une discipline de contrôle des pertes lorsque les conditions se dégradent, indiquant que l'agent est capable d'identifier des facteurs off-chain qui pourraient affecter la rentabilité des trades.
Transparence vs Confidentialité : Les deux ont leurs compromis. Un agent transparent, s'il peut être copié activement, n'aura essentiellement aucun avantage stratégique. Un agent confidentiel court le risque d'extraction interne de la part de son créateur, qui pourrait facilement front-run ses propres utilisateurs.
Sources d'information : Les sources de données auxquelles l'agent a accès sont cruciales pour déterminer comment il prend ses décisions. Il est essentiel de s'assurer que les sources sont fiables et qu'il n'y a pas de dépendance unique.
Sécurité : Il est important d'avoir des audits de smart contracts et une architecture de garde de fonds appropriée pour garantir des mesures de secours en cas d'événement black swan.
Prochaines étapes pour les Agents
Pour une adoption à grande échelle des agents, il reste encore beaucoup de travail à faire au niveau de l'infrastructure. Cela se résume à des questions clés de confiance et d'exécution autour des agents. Les actions des agents autonomes n'ont pas de garde-fous, et des cas de mauvaise gestion des fonds ont déjà été observés.
L'ERC-8004, lancé en janvier 2026, est devenu le premier registre on-chain permettant aux agents autonomes de se découvrir mutuellement, d'établir une réputation vérifiable et de collaborer en toute sécurité. C'est un déverrouillage clé pour la composabilité du DeFi, car un score de confiance est intégré dans le smart contract lui-même, permettant une activité sans permission entre agents et protocoles. Cela ne garantit pas qu'un agent fonctionnera toujours de manière non malveillante, car des vulnérabilités de sécurité comme la collusion sur la réputation et les attaques Sybil peuvent encore se produire. Par conséquent, il reste un immense espace à combler en matière d'assurance, de sécurité, de stake économique des agents, etc.
Alors que l'activité des agents dans le DeFi se développe, l'encombrement des stratégies devient un risque structurel. Les yield farms en sont l'exemple le plus évident, où les rendements se compriment à mesure que les stratégies deviennent populaires. La même dynamique pourrait s'appliquer au trading par agent. Si un grand nombre d'agents sont entraînés sur des données similaires et optimisent des objectifs similaires, ils convergeront vers des positions similaires et des signaux de sortie similaires.
Un article de recherche CoinAlg, publié par l'Université Cornell en janvier 2026, a formalisé une version de ce problème. Les agents transparents peuvent être arbitrés car leurs transactions sont prévisibles et peuvent être front-runnées. Les agents confidentiels évitent ce risque, mais introduisent un risque différent où le créateur conserve un avantage informationnel sur ses propres utilisateurs et pourrait extraire de la valeur via l'opacité même censée les protéger.
L'activité des agents ne fera que s'accélérer, et l'infrastructure posée aujourd'hui déterminera comment fonctionnera la prochaine phase de la finance on-chain. À mesure que l'utilisation des agents augmentera, ils s'itéreront eux-mêmes et deviendront plus perspicaces pour s'adapter aux préférences des utilisateurs. Par conséquent, le principal facteur de différenciation se résumera à l'infrastructure en laquelle on peut avoir confiance, et ce sont celles-ci qui obtiendront la plus grande part de marché.










