Note de la rédaction : Claude Code évolue d'un assistant de codage vers une plateforme d'orchestration d'agents.
Les workflows (flux de travail) présentés ici ont pour valeur centrale de permettre à Claude de ne plus se contenter de « réfléchir puis agir » dans une même fenêtre de contexte, mais de pouvoir générer dynamiquement un cadre d'exécution pour une tâche : décomposer la tâche, distribuer des sous-agents, traiter en parallèle, valider de manière croisée, itérer en boucle, et même faire concourir différents agents entre eux, avant de synthétiser les résultats.
Cela signifie que les cas d'utilisation de Claude Code s'étendent significativement. Il n'est plus seulement adapté à la migration, la refactorisation, la reproduction de tests et la revue de code, mais aussi à des tâches non techniques comme la recherche approfondie, la vérification des faits, le tri de CV, l'analyse post-incident, la formalisation de règles, l'évaluation de plans commerciaux, le brainstorming de noms, etc. De nombreuses tâches complexes sont structurellement similaires à la programmation : elles nécessitent de décomposer un problème, d'isoler des contextes, de valider des hypothèses, de traiter une multitude de détails et de faire des choix parmi plusieurs chemins possibles.
Les workflows dynamiques cherchent justement à résoudre plusieurs problèmes courants des grands modèles dans les tâches longues : la « paresse de l'agent » qui annonce la fin prématurément, le « biais d'auto-préférence » tendant à valider ses propres conclusions, et la « dérive d'objectif » où l'agent s'éloigne progressivement du but initial après plusieurs tours d'exécution. En confiant la tâche à plusieurs instances de Claude dotées de contextes indépendants, il transforme les tâches complexes d'une « course de fond en solo » en un « travail collaboratif multi-agents ».
Bien sûr, les workflows ne sont pas une solution universelle. Ils consomment généralement plus de tokens et ne conviennent pas forcément à chaque tâche de programmation classique. Mais ils indiquent une direction importante : la future compétition entre outils d'IA pourrait ne plus reposer uniquement sur l'intelligence d'un modèle unique, mais sur sa capacité à organiser, autour d'un objectif complexe, un processus d'exécution fiable, réutilisable et examinable.
Voici l'article original :
Bien que le cadre d'exécution par défaut de Claude Code ait été conçu pour la programmation, il est également adapté à de nombreux autres types de tâches. En effet, de nombreuses tâches sont structurellement similaires à des tâches de programmation. Cependant, pour atteindre des performances optimales sur certains types de tâches spécifiques, comme la recherche, l'analyse de sécurité, la collaboration en équipe d'agents ou la revue de code, nous devons toujours construire des cadres d'exécution sur mesure au-dessus de Claude Code.
Les Workflows (flux de travail) vous permettent de créer dynamiquement des cadres d'exécution, permettant à Claude de résoudre plus naturellement, au sein même de Claude Code, les problèmes mentionnés ci-dessus ainsi que bien d'autres. Vous pouvez également partager et réutiliser ces workflows.
Dans cet article, je partagerai mes premières expériences et réflexions sur l'utilisation des workflows, pour vous aider à exploiter pleinement leurs capacités.
Il est important de noter que les meilleures pratiques dans ce domaine sont encore en cours de formation. Les workflows dynamiques consomment généralement plus de tokens, vous devez donc réfléchir attentivement à quand et comment les utiliser.
Note : Cet article est également publié sur le Claude Blog.
Exemples de Prompts
Avant d'entrer dans les détails techniques, je souhaite d'abord donner quelques exemples de prompts pour vous aider à comprendre les possibilités des workflows :
« Ce test échoue environ 1 fois sur 50. Mettez en place un workflow pour le reproduire, formuler des hypothèses et effectuer des tests adversariaux dans différents worktrees. /goal Ne vous arrêtez pas tant qu'une hypothèse n'a pas été vérifiée. »
« Utilisez un workflow pour passer en revue mes 50 dernières sessions, identifier les corrections que j'ai apportées de manière répétée, et transformer ces problèmes récurrents en règles CLAUDE.md. »
« Utilisez un workflow pour examiner les six derniers mois du canal Slack #incidents, et identifier les causes racines qui reviennent fréquemment mais pour lesquelles aucun ticket n'a été soumis. »
« Passez mon plan d'affaires dans un workflow, en demandant à différents agents de le décomposer respectivement du point de vue d'un investisseur, d'un client et d'un concurrent. »
« Voici un dossier contenant 80 CV. Utilisez un workflow pour les trier selon les exigences du poste de backend, et vérifiez les dix premiers. Utilisez l'outil AskUserQuestion pour m'interroger et établir les critères d'évaluation. »
« J'ai besoin de trouver un nom pour cet outil CLI. Utilisez un workflow pour brainstormer un lot d'options, puis sélectionnez les trois premières via un mécanisme de tournoi. »
« Utilisez un workflow pour renommer partout notre modèle User en Account. »
« Lisez mon brouillon d'article de blog et utilisez un workflow pour vérifier chaque affirmation technique qu'il contient par rapport au code source. Je ne veux publier aucune information erronée. »
Comment fonctionnent les workflows dynamiques
Un workflow dynamique exécute un fichier JavaScript contenant des fonctions spéciales pour générer et coordonner des sous-agents.
Les workflows dynamiques incluent également des fonctions JavaScript standards, comme JSON, Math et Array, pour traiter les données.
Il est particulièrement notable que les workflows dynamiques puissent décider quel modèle un agent doit utiliser, et si un sous-agent doit s'exécuter dans son propre worktree. Cela permet à Claude de choisir de manière autonome le niveau d'intelligence et le degré d'isolement nécessaires à la tâche.
Si un workflow est interrompu, par exemple par une action manuelle de l'utilisateur ou la fermeture du terminal, il peut reprendre son exécution à partir du point d'interruption lorsque la session est restaurée.
Pourquoi des workflows dynamiques ?
Lorsque vous demandez au cadre d'exécution par défaut de Claude Code de traiter une tâche, il doit à la fois planifier et exécuter dans la même fenêtre de contexte. Cette approche est très efficace pour de nombreuses tâches de programmation, mais elle peut échouer dans les tâches de longue durée, massivement parallèles ou hautement structurées de type adversarial.
La raison est que plus Claude traite une tâche complexe longtemps dans un seul contexte, plus il est susceptible de présenter certains modes d'échec spécifiques :
La « paresse de l'agent » (Agentic laziness) survient lorsque Claude, face à une tâche particulièrement complexe et multi-étape, s'arrête prématurément et déclare la tâche terminée alors qu'il n'a réalisé qu'une partie des progrès. Par exemple, dans une revue de sécurité, il pourrait traiter seulement 20 des 50 éléments et annoncer la fin du travail.
Le « biais d'auto-préférence » (Self-preferential bias) se traduit par la tendance de Claude à préférer ses propres résultats ou découvertes, surtout lorsqu'on lui demande de vérifier ou de juger sa propre production selon certains critères.
La « dérive d'objectif » (Goal drift) correspond à la diminution progressive de la fidélité de Claude à l'objectif initial au cours de tours d'exécution multiples, en particulier après compression du contexte. Chaque résumé entraîne une perte d'information, et des détails comme les cas limites ou des contraintes du type « ne faites pas X » peuvent être perdus.
Créer un workflow aide à atténuer ces problèmes en orchestrant plusieurs instances indépendantes de Claude, chacune ayant sa propre fenêtre de contexte et se concentrant sur des tâches isolées et bien définies.
Workflows dynamiques vs workflows statiques
Vous avez peut-être déjà créé des workflows statiques via le Claude Agent SDK ou claude -p pour coordonner plusieurs instances de Claude Code.
Mais comme les workflows statiques doivent couvrir divers cas limites, ils sont généralement plus génériques. Avec l'avènement de Claude Opus 4.8 et des workflows dynamiques, Claude est désormais suffisamment intelligent pour écrire un cadre d'exécution sur mesure adapté à votre cas d'usage spécifique.
Modèles pratiques lors de l'utilisation de workflows dynamiques
Vous pouvez directement demander à Claude de créer un workflow dynamique, ou utiliser le mot-clé déclencheur « ultracode » pour vous assurer que Claude Code crée un workflow.
Cependant, si vous développez un modèle mental de fonctionnement des workflows dynamiques, il vous sera plus facile de juger quand les utiliser et de guider Claude via le prompt.
Lorsque Claude construit des workflows, il utilise et combine couramment les modèles suivants :
Classer et exécuter : Utiliser un agent de classification pour juger du type de tâche, puis router vers différents agents ou comportements en fonction de ce type. Un classificateur peut aussi être utilisé en fin de processus pour juger le résultat.
Étaler et synthétiser : Décomposer une tâche en plusieurs étapes plus petites, chacune traitée par un agent, puis synthétiser ces résultats. Ce modèle est particulièrement adapté lorsque la tâche comporte de nombreuses petites étapes, ou lorsque chaque étape nécessite une fenêtre de contexte propre pour éviter les interférences ou contaminations croisées. L'étape de synthèse agit comme une « barrière » : elle attend que tous les agents de l'étape d'étalement se terminent, puis fusionne leurs sorties structurées en un seul résultat.
Validation adversariale : Pour chaque agent généré, exécuter un agent indépendant qui valide de manière adversariale sa sortie selon un ensemble de critères ou de principes.
Générer et filtrer : Générer un grand nombre d'idées autour d'un thème, puis les filtrer selon des critères d'évaluation ou un processus de vérification, éliminer les doublons, et ne renvoyer que les idées de la plus haute qualité ayant été testées.
Tournoi : Au lieu de diviser le travail, faire concourir les agents entre eux. Générer N agents, chacun tentant d'accomplir la même tâche par des méthodes différentes. Ensuite, un prompt ou un modèle via un agent d'évaluation compare les résultats deux à deux jusqu'à sélectionner un gagnant.
Boucler jusqu'à achèvement : Pour les tâches dont la charge de travail est inconnue, ne pas définir un nombre fixe de tours, mais générer des agents en boucle jusqu'à ce qu'une condition d'arrêt soit satisfaite, par exemple l'absence de nouvelles découvertes ou d'erreurs dans les journaux.
Cas d'utilisation
Vous pouvez réfléchir de manière plus créative au moment et à la manière de faire créer des workflows dynamiques par Claude Code. Je constate que les workflows sont parfois encore plus utiles pour des travaux non techniques.
Migration et refactorisation
Bun a utilisé des workflows pour être réécrit de Zig vers Rust. Vous pouvez lire le post de Jarred sur X pour connaître les détails.
La clé est de diviser la tâche en une série d'étapes à traiter, comme les points d'appel, les tests en échec, les modules, etc. Démarrer un sous-agent dans un worktree pour chaque tâche de correction, lui faire appliquer la correction ; puis faire vérifier le résultat de manière adversariale par un autre agent, et enfin fusionner les résultats. Vous pouvez envisager de dire explicitement à l'agent de ne pas utiliser de commandes trop gourmandes en ressources, afin de maximiser le parallélisme sans épuiser les ressources de la machine locale.
Recherche approfondie
Nous avons publié une skill de recherche approfondie (/deep-research) dans Claude Code, qui utilise justement un workflow dynamique. Concrètement, elle étale l'exécution de recherches web, récupère les sources, effectue une validation adversariale des affirmations pertinentes et synthétise le tout dans un rapport avec citations.
Mais ce type de recherche ne se limite pas au web. Par exemple, vous pourriez demander à Claude de compiler un rapport d'état à partir du contexte Slack, ou d'explorer en profondeur un dépôt de code pour étudier le fonctionnement d'une fonctionnalité.
Validation approfondie
À l'inverse, si vous avez un rapport et souhaitez vérifier chaque jugement factuel et chaque source qu'il cite, vous pouvez générer un workflow : un agent identifie d'abord toutes les affirmations factuelles, puis un sous-agent est lancé pour chacune afin d'effectuer une vérification minutieuse. Vous pouvez même faire vérifier par un agent de validation la qualité des sources utilisées par les sous-agents en charge de la recherche.
Tri
Vous avez peut-être un ensemble d'éléments que vous souhaitez trier selon un critère qualitatif, et vous pensez que Claude Code excelle à évaluer ce critère. Par exemple, trier des tickets de support par gravité de bug.
Mais si vous essayez de trier plus de 1000 lignes en un seul prompt, la qualité baissera et la fenêtre de contexte sera saturée. Une meilleure approche est d'exécuter un mécanisme de tournoi, en établissant un pipeline d'agents effectuant des comparaisons deux à deux, car les jugements comparatifs sont souvent plus fiables qu'un score absolu ; ou de trier en parallèle par buckets avant de fusionner les résultats. Chaque comparaison est effectuée par un agent indépendant, donc une boucle déterministe peut maintenir la structure du tournoi, seule l'ordre de passage actuel devant rester dans le contexte.
Mémoire et respect des règles
Si vous avez un ensemble de règles spécifiques, et que Claude, même après les avoir lues dans CLAUDE.md, les omet ou les exécute mal fréquemment, vous pouvez créer un workflow listant ces règles et faisant vérifier chacune par un agent de validation — un agent par règle. Créer un sous-agent au « personnage » de sceptique pour examiner si ces règles sont raisonnables peut aussi aider à éviter un excès de faux positifs.
L'inverse est également possible : explorer vos sessions et commentaires de revue de code récents, identifier les corrections que vous apportez de manière répétée ; faire regrouper ces problèmes par des agents parallèles ; soumettre chaque règle candidate à une validation adversariale pour juger si elle prévient réellement une erreur concrète ; enfin, réintégrer les règles ayant passé le filtre dans CLAUDE.md.
Investigation de cause racine
La manière la plus efficace de déboguer est de formuler plusieurs hypothèses indépendantes et de les tester une par une. Mais si vous n'utilisez qu'une seule fenêtre de contexte, Claude pourrait succomber au biais d'auto-préférence.
Un workflow peut prévenir cela structurellement : il peut lancer plusieurs agents, chacun générant des hypothèses basées sur des preuves non chevauchantes. Par exemple, faire examiner les journaux, les fichiers et les données par différents agents. Ensuite, chaque hypothèse peut être soumise à l'examen d'un groupe de vérificateurs et de contradicteurs.
Cela ne s'applique pas seulement au code. Les workflows peuvent être utilisés pour l'analyse commerciale, par exemple « Pourquoi les ventes de mars ont-elles baissé ? » ; pour l'ingénierie des données, par exemple « Pourquoi ce pipeline a-t-il échoué ? » ; ou pour toute analyse post-mortem.
Triage à grande échelle
Chaque équipe a une file d'attente de support, des rapports de bugs, ou d'autres arriérés qu'elle ne peut traiter entièrement manuellement. Un workflow de tri peut classifier chaque élément, le dédupliquer par rapport aux problèmes déjà suivis, et prendre des mesures. Cela peut signifier tenter une réparation, ou l'escalader vers un utilisateur humain.
Pour un workflow de tri, un modèle utile est la quarantaine (quarantine). C'est-à-dire interdire aux agents lisant du contenu public non fiable d'exécuter des opérations à haut niveau de privilège ; les opérations à haut privilège doivent être effectuées par des agents dédiés à l'action.
Vous pouvez combiner les workflows de tri avec /loop, pour que Claude exécute ce type de tâche en continu.
Exploration et jugement de goût
Les workflows sont utiles lorsque vous devez explorer différents chemins de solution, en particulier pour des tâches impliquant un jugement esthétique comme la conception ou le naming, et qui peuvent bénéficier d'un ensemble de critères d'évaluation.
Vous pouvez faire explorer à Claude un grand nombre de propositions, et donner à un agent de revue un ensemble de critères définissant « à quoi ressemble une bonne proposition ». La tâche est terminée lorsque l'agent de revue estime que les résultats satisfont aux critères. Les différentes propositions peuvent aussi être triées ou filtrées via un mécanisme de tournoi selon ces critères.
Evals (Évaluations)
Vous pouvez exécuter des evals légers pour des tâches spécifiques en lançant des agents indépendants dans des worktrees, puis des agents de comparaison pour noter et comparer les sorties selon des critères d'évaluation. Par exemple, vous pourriez évaluer et améliorer une skill que vous avez créée, pour voir si elle répond à certaines normes spécifiques.
Routage de modèle et de niveau d'intelligence : Vous pouvez créer un agent de classification optimisé pour votre tâche, qui décide quel modèle utiliser. C'est utile lorsque la tâche impliquera de nombreux appels d'outils, et qu'une recherche préalable peut aider à identifier le modèle le plus approprié.
Par exemple, pour une tâche comme « Expliquer comment fonctionne le module d'authentification », le modèle le plus approprié dépend du nombre de fichiers dans le module d'authentification et de la structure du dépôt. L'agent de classification peut d'abord mener cette recherche, puis router la tâche vers Sonnet ou Opus en fonction de la complexité anticipée.
Quand ne pas utiliser de workflow dynamique
Les workflows sont encore une nouveauté. Bien qu'ils puissent apporter des résultats bien supérieurs aux approches classiques dans de nombreux cas d'usage, toutes les tâches n'en ont pas besoin, et ils peuvent augmenter de manière significative la consommation de tokens.
Il est préférable d'utiliser les workflows pour des tâches qui étendent les capacités de Claude Code de nouvelles manières. Pour les tâches de programmation classiques, demandez-vous d'abord : Cette tâche a-t-elle réellement besoin de plus de ressources de calcul ? Par exemple, la plupart des tâches de programmation traditionnelles n'ont pas besoin d'un comité de 5 relecteurs.
Conseils pour construire des workflows dynamiques
Conception du prompt
Lorsque vous écrivez un prompt pour un workflow dynamique, plus les détails sont fournis, meilleur est généralement le résultat, surtout en utilisant les techniques spécifiques mentionnées ci-dessus.
Les workflows ne sont pas réservés aux grandes tâches. Vous pouvez aussi suggérer au modèle d'utiliser un « quick workflow ». Par exemple, vous pouvez créer un processus de vérification adversariale rapide pour tester une hypothèse.
Combinaison avec /goal et /loop
Lorsque vous utilisez des workflows pouvant être exécutés de manière répétée, comme ceux de tri, de recherche ou de validation, vous pouvez les combiner avec /loop pour les faire s'exécuter à intervalles réguliers ; tout en utilisant /goal pour définir des exigences d'achèvement strictes.
Budget d'utilisation de tokens
Vous pouvez définir un budget explicite d'utilisation de tokens pour un workflow dynamique, afin de limiter le nombre de tokens consommés par la tâche. Vous pouvez indiquer dans le prompt quelque chose comme « utilisez 10k tokens », ce qui définira une limite de 10 000 tokens.
Sauvegarde et partage des workflows dynamiques
Vous pouvez sauvegarder les workflows en appuyant sur « s » dans le menu des workflows. Vous pouvez les soumettre dans ~/.claude/workflows, ou les distribuer via une skill.
Pour les partager via une skill, placez le fichier JavaScript du workflow dans le dossier de la skill, et référencez-le dans SKILL.md. Pour plus de flexibilité, vous pouvez aussi suggérer à Claude de considérer les workflows dans la skill comme des modèles, et non des scripts à exécuter mot à mot.
Un tout nouveau monde
Les workflows sont une nouvelle manière utile d'étendre Claude Code. Je vous encourage à les considérer comme un point de départ. Nous avons encore beaucoup à explorer sur la meilleure façon de les utiliser. N'hésitez pas à nous faire part de vos découvertes.
Thariq Shihipar et Sid Bidasaria (@sidbid) sont membres de l'équipe technique d'Anthropic, en charge des travaux relatifs à Claude Code.
















