La bonne façon de gérer le contexte de Claude Code : Éviter que plus la session est longue, plus le modèle devient « stupide »

marsbitPublié le 2026-04-16Dernière mise à jour le 2026-04-16

Résumé

Claude Code a récemment étendu sa fenêtre contextuelle à 1 million de tokens, offrant une capacité accrue pour les tâches complexes. Cependant, une gestion efficace du contexte est cruciale pour maintenir les performances du modèle, évitant la "détérioration contextuelle" (Context Rot) où trop d'informations nuisent à la pertinence. L'article présente plusieurs stratégies clés : - **Continuer** : Envoyer directement un nouveau message dans la même conversation. - **Remonter le temps (Rewind)** : Revenir à un point précédent pour corriger une erreur ou changer d'approche, souvent plus efficace que de simples corrections. - **Nouvelle session (/clear)** : Démarrer une nouvelle conversation avec un résumé manuel des points essentiels, pour un contexte entièrement propre. - **Compression contextuelle (/compact)** : Laisser Claude résumer l'historique pour libérer de l'espace. C'est pratique mais peut être "avec perte" ; des instructions précises guident mieux le résumé. - **Sous-agents (Subagents)** : Déléguer une tâche à un agent qui travaille dans un contexte isolé et ne renvoie que le résultat final, idéal pour les travaux aux nombreux outputs intermédiaires. Le conseil principal est de démarrer une nouvelle session pour une nouvelle tâche. La commande `rewind` est privilégiée pour les corrections, et les sous-agents pour les travaux complexes à outputs éphémères. Bien maîtriser ces outils est essentiel pour optimiser les résultats avec Claude Code.

Aujourd'hui, nous lançons une nouvelle mise à jour pour la commande /usage, conçue pour vous aider à mieux comprendre votre utilisation de Claude Code. Cette décision fait suite à de nombreuses conversations approfondies que nous avons eues récemment avec nos utilisateurs.

Lors de ces échanges, un phénomène est revenu sans cesse : les habitudes de chacun en matière de gestion des sessions sont extrêmement variées. Cette différence est d'autant plus marquée depuis que Claude Code a porté sa fenêtre contextuelle (Context Window) à la barre symbolique du million.

Êtes-vous du genre à ne garder qu'une ou deux sessions ouvertes dans votre terminal ? Ou préférez-vous ouvrir une nouvelle session à chaque nouveau prompt ? À quel moment utilisez-vous généralement la compression (Compact), le retour en arrière (Rewind) ou les sous-agents (Subagents) ? Et qu'est-ce qui cause une compression ratée ?

Il y a en réalité toute une science derrière cela. Ces détails en apparence anodins influencent considérablement votre expérience d'utilisation de Claude Code. Et tout cela se résume à une chose : comment gérer votre fenêtre contextuelle.

Petit cours accéléré : Contexte, compression contextuelle et dégradation du contexte

La « fenêtre contextuelle (Context Window) » est, par analogie, l'ensemble des informations que le modèle peut « voir » simultanément devant lui lorsqu'il génère sa prochaine réponse. Elle inclut votre prompt système (System Prompt), l'historique de la conversation jusqu'à présent, chaque appel d'outil (Tool Call) et ses résultats, et même chaque fichier qu'il a lu. Aujourd'hui, Claude Code dispose d'une fenêtre contextuelle gigantesque de jusqu'à 1 million de tokens(Note : Un Token est l'unité de base de traitement du texte pour les grands modèles de langage. Un mot anglais équivaut généralement à 1 Token, un caractère chinois peut en prendre 1 à 2).

Malheureusement, utiliser le contexte a un coût, que nous appelons généralement la dégradation du contexte (Context Rot)(Note : Phénomène où, à mesure que l'historique de la conversation s'allonge, le modèle doit traiter un volume d'information trop important, ce qui disperse son attention, lui fait oublier des informations importantes du début ou est perturbé par du contenu sans rapport). Plus le contexte devient long, plus les performances du modèle ont tendance à se dégrader, car son attention est dispersée sur davantage de Tokens. Le contenu laissé depuis le début, devenu sans importance, commence à interférer avec la tâche que le modèle est en train d'exécuter.

La fenêtre contextuelle a une limite de capacité fixe. Ainsi, lorsque vous êtes sur le point de la saturer, vous devez résumer la tâche en cours en une brève description, puis continuer votre travail avec cette description dans une nouvelle fenêtre contextuelle.

Nous appelons ce processus la compression contextuelle (Compaction)(Note : Processus consistant à résumer un historique très long en un résumé succinct pour libérer de l'espace mémoire). Bien sûr, vous pouvez également déclencher manuellement cette compression à tout moment.

Imaginez que vous venez de demander à Claude de faire quelque chose pour vous, et il a terminé. Maintenant, votre contexte contient déjà certaines informations (comme des appels d'outils, leurs résultats, vos instructions).

Que faire ensuite ? Vous seriez surpris de voir à quel point vous avez d'options :

· Continuer (Continue) — Envoyer directement le message suivant dans la même session.

· Retour en arrière (/rewind ou double appui sur la touche Esc) — Remonter le temps, revenir à un message précédent et réessayer à partir de là.

· Effacer (/clear) — Démarrer une toute nouvelle session, généralement avec le résumé succinct que vous avez tiré de la conversation précédente.

· Compresser (Compact) — Résumer la conversation actuelle, puis continuer à travailler sur la base de ce résumé.

· Sous-agents (Subagents) — Déléguer la prochaine phase du travail à un autre agent IA (AI Agent) disposant de son propre contexte propre, et ne récupérer que son résultat final.

Bien que « Continuer » soit la réaction la plus naturelle, les quatre autres options sont conçues précisément pour vous aider à mieux gérer votre contexte.

Quand faut-il ouvrir une nouvelle session ?

Quand exactement faut-il maintenir une longue session existante, et quand faut-il recommencer à zéro ? Notre règle empirique est la suivante : lorsque vous commencez une nouvelle tâche, vous devriez également ouvrir une nouvelle session.

La fenêtre d'un million de tokens signifie que vous pouvez maintenant accomplir de manière très fiable des tâches plus longues et plus complexes. Par exemple, demandez à Claude de construire une application full-stack pour vous à partir de zéro.

Mais parfois, vous travaillez peut-être sur des tâches séquentielles. Dans ce cas, vous devez conserver une partie du contexte précédent, mais pas la totalité. Par exemple, vous venez de terminer l'écriture d'une nouvelle fonctionnalité et devez maintenant rédiger sa documentation. Vous pourriez ouvrir une nouvelle session, mais cela signifierait que Claude devrait relire tous les fichiers de code que vous venez d'écrire – ce qui est non seulement plus lent, mais aussi plus coûteux.

Utiliser le « retour en arrière » au lieu de « corriger »

Si je devais choisir une seule bonne habitude représentant une « excellente capacité de gestion du contexte », ce serait certainement de bien utiliser le « retour en arrière (Rewind) ».

Dans Claude Code, un double-clic sur la touche Esc (ou l'exécution de la commande /rewind) vous permet de revenir à n'importe quel message précédent, puis de soumettre un nouveau prompt à partir de là. Toute la conversation survenue après ce point sera complètement supprimée du contexte.

Lorsqu'il s'agit de corriger une erreur de l'IA, le « retour en arrière » est souvent l'approche la plus judicieuse. Exemple : Claude a lu cinq fichiers, a essayé une méthode, qui a échoué. Votre réflexe instinctif pourrait être de taper dans la zone de chat : « Ça ne marche pas, essayez la méthode X. » Mais l'approche plus intelligente serait de revenir en arrière au moment où il venait juste de lire ces cinq fichiers, et de lui redire avec la leçon que vous venez d'apprendre : « N'utilisez pas la méthode A, le module foo ne la supporte pas du tout – essayez directement la méthode B. »

Vous pouvez même utiliser la fonctionnalité « résumer à partir d'ici (summarize from here) » pour demander à Claude de résumer lui-même les leçons apprises en un « message de passation ». C'est un peu comme si la « version future de Claude » qui vient de se planter laissait un mot au « Claude du passé » qui n'a pas encore commencé.

Compression contextuelle vs Nouvelle session

Lorsqu'une session devient de plus en plus longue, vous avez deux méthodes pour l'« alléger » : utiliser /compact (compression) ou /clear (effacer et recommencer à zéro). Ces deux opérations semblent similaires mais se comportent très différemment.

Compression (Compact) demande au modèle de résumer la conversation jusqu'à présent, puis de remplacer le long historique par ce résumé. Ce processus est « avec perte », ce qui signifie que vous confiez à Claude le pouvoir de décider « quel contenu est important ».

L'avantage est que vous n'avez rien à écrire, et Claude peut être plus attentif que vous ne le pensez à conserver les leçons importantes ou les enregistrements de fichiers. Vous pouvez également contrôler la direction de la compression en lui donnant des instructions (ex: /compact en se concentrant sur la refactorisation du module d'authentification, en supprimant le contenu sur les tests de débogage).

L'utilisation de /clear, quant à elle, vous oblige à écrire vous-même les points clés (ex: « Nous refactorisons le middleware d'authentification, les contraintes actuelles sont X, les fichiers importants concernés sont A et B, et nous avons déjà écarté la méthode Y »), puis à recommencer avec un état parfaitement propre. Bien que cela demande plus d'efforts, le nouveau contexte qui en résulte est à 100% composé de ce que vous considérez comme véritablement pertinent.

Quelle « compression » peut échouer ?

Si vous gardez souvent des sessions très longues, vous avez probablement déjà rencontré des situations où l'effet de la « compression » était extrêmement mauvais. Nous avons constaté que ces « échecs » se produisent généralement à un moment précis : lorsque le grand langage de modèle (LLM) ne peut pas prédire la direction de votre prochain travail.

Par exemple, après une longue session de débogage de code, le système déclenche une compression automatique qui résume le processus de排查. Ensuite, vous envoyez un message : « Maintenant, corrigeons également l'autre avertissement que nous avons vu précédemment dans bar.ts. »

Cependant, comme la session précédente était entièrement concentrée sur le débogage du premier bug, cet avertissement non corrigé a très bien pu être considéré comme une information non pertinente et simplement jeté lors du résumé.

C'est un problème assez épineux. Parce qu'en raison de la dégradation du contexte, au moment où il effectue la compression, le modèle est souvent dans son état le moins « intelligent ». Heureusement, avec la capacité de contexte d'un million de tokens, vous disposez désormais d'un espace plus confortable pour exécuter proactivement /compact en incluant une description de « ce que je veux faire ensuite ».

Sous-agents et nouvelle fenêtre contextuelle

Les sous-agents sont également un excellent moyen de gérer le contexte. Cette technique est particulièrement utile lorsque vous prévoyez à l'avance qu'un certain travail produira de nombreux résultats intermédiaires « à usage unique » (qui ne serviront plus jamais par la suite).

Lorsque Claude dérive un sous-agent via un outil d'agent (Agent tool), ce petit bonhomme obtient une fenêtre contextuelle entièrement nouvelle. Il peut y travailler autant qu'il le souhaite. Une fois le travail terminé, il résumera les résultats et ne renverra que le rapport final au Claude parent.

La « question existentielle » que nous nous posons pour décider d'utiliser un sous-agent est : aurai-je besoin de voir les sorties détaillées de l'exécution de ces outils plus tard, ou est-ce que je veux juste une conclusion finale ?

Bien que Claude Code appelle automatiquement des sous-agents en arrière-plan, vous pouvez parfois aussi le diriger très explicitement. Par exemple, vous pouvez lui dire :

· « Envoie un sous-agent vérifier, en se basant sur le fichier de spécifications ci-dessous, si le travail que nous venons de faire est correct »

· « Envoie un sous-agent parcourir un autre dépôt de code, résume comment il implémente le flux d'authentification, puis copie son approche pour l'implémenter ici »

· « Envoie un sous-agent rédiger la documentation de cette nouvelle fonctionnalité en se basant sur mon historique de modifications Git »

En résumé, lorsque Claude a terminé un cycle de réponse et que vous vous apprêtez à envoyer un nouveau message, vous vous trouvez à un carrefour décisionnel.

Nous espérons qu'à l'avenir, Claude sera suffisamment intelligent pour gérer tout cela à votre place. Mais pour l'instant, maîtriser ces décisions est la voie incontournable pour guider Claude vers des résultats de haute qualité.

Questions liées

QQu'est-ce que la « fenêtre contextuelle » (Context Window) dans Claude Code et quelle est sa taille actuelle ?

ALa « fenêtre contextuelle » est l'ensemble des informations que le modèle peut « voir » simultanément pour générer sa prochaine réponse. Elle inclut l'invite système, l'historique de la conversation, les appels d'outils et leurs résultats, ainsi que les fichiers lus. Claude Code dispose désormais d'une fenêtre contextuelle massive de 1 million de tokens.

QQuel est le phénomène de « pourrissement du contexte » (Context Rot) et comment affecte-t-il les performances du modèle ?

ALe « pourrissement du contexte » désigne la dégradation des performances du modèle lorsque le contexte devient trop long. L'attention du modèle se disperse sur trop de tokens, et les informations anciennes ou devenues non pertinentes commencent à interférer avec la tâche en cours, ce qui nuit à sa capacité à se concentrer sur les éléments importants.

QQuelle est la différence principale entre utiliser la commande /compact (compression) et /clear (effacer) pour gérer un contexte long ?

ALa commande /compact demande au modèle de résumer lui-même la conversation jusqu'à présent et de remplacer l'historique long par ce résumé. C'est un processus « avec perte » où Claude décide ce qui est important. /clear, quant à lui, nécessite que l'utilisateur écrive lui-même les points clés pour recommencer avec un contexte entièrement nouveau et propre, contenant uniquement ce qu'il juge pertinent.

QDans quel cas l'utilisation de la fonction « Remonter dans le temps » (/rewind) est-elle préférable à une simple correction dans le chat ?

AUtiliser « Remonter dans le temps » est préférable pour corriger une erreur en revenant à un point précis de l'historique avant que l'erreur ne se produise. Au lieu de dire « ça n'a pas marché, essayez X », on revient en arrière et on donne une instruction corrigée dès le départ. Cela évite de polluer le contexte avec des tentatives infructueuses et des explications sur l'échec.

QQu'est-ce qu'un « sous-agent » (Subagent) et dans quel type de scénario son utilisation est-elle particulièrement utile ?

AUn « sous-agent » est un agent IA dérivé qui dispose de son propre contexte vierge. Il est particulièrement utile pour les travaux qui génèrent de nombreux résultats intermédiaires « jetables » dont on n'aura plus besoin. Le sous-agent effectue le travail dans son espace isolé, puis ne renvoie que le résultat final ou un rapport synthétique au Claude principal, évitant ainsi d'encombrer le contexte principal.

Lectures associées

La moyenne mobile sur 4 ans du Bitcoin indique où se trouve le plancher du marché

L'expert en cryptomonnaie Adam Livingston souligne que la moyenne mobile sur 4 ans du Bitcoin, actuellement autour de 60 000 dollars, pourrait indiquer le fond du marché baissier actuel. Historiquement, le BTC se négocie à un prix supérieur à cette moyenne 81,5 % du temps, ce qui en ferait une zone d'accumulation intéressante. Cependant, d'autres analystes comme Bluntz et Ali Martinez prévoient une baisse plus prononcée, potentiellement vers 58 000 dollars, voire entre 54 000 et 50 000 dollars, en raison d'une importante pression vendeuse. Cette pression est alimentée par des transferts d'actifs vers les plateformes d'échange et des retraits nets prolongés des ETF Bitcoin. Au moment de la rédaction, le prix du BTC est d'environ 63 600 dollars, en baisse de plus de 5 % sur 24 heures.

bitcoinistIl y a 35 mins

La moyenne mobile sur 4 ans du Bitcoin indique où se trouve le plancher du marché

bitcoinistIl y a 35 mins

La guerre XRP contre SWIFT est-elle déjà terminée, ou les banques empruntent-elles une autre voie ?

XRP et SWIFT sont souvent présentés comme des rivaux pour moderniser les paiements mondiaux, mais cette vision pourrait être dépassée. L'analyse récente de James Dula souligne une distinction cruciale : SWIFT est principalement un réseau de messagerie entre institutions, gérant les instructions et la coordination, et non le règlement lui-même. Ainsi, ses véritables concurrents dans le domaine de la communication seraient des protocoles d'interopérabilité blockchain comme Axelar ou Chainlink, plutôt que XRP. Les banques semblent adopter une approche pragmatique et hybride. De grands établissements comme JPMorgan ou HSBC participent aux initiatives de SWIFT tout en explorant des solutions basées sur la blockchain, notamment avec Ripple. Plutôt que de choisir un camp, elles combinent différentes technologies : un réseau de messagerie pour la coordination et la conformité, et une couche de règlement séparée (comme celle pouvant utiliser XRP) pour le transfert de valeur rapide. L'avenir des paiements internationaux ne se résumerait donc pas à une guerre où un vainqueur élimine l'autre, mais à la construction d'une architecture financière où infrastructures traditionnelles et actifs numériques coexistent et se complètent.

bitcoinistIl y a 1 h

La guerre XRP contre SWIFT est-elle déjà terminée, ou les banques empruntent-elles une autre voie ?

bitcoinistIl y a 1 h

BitMine Copie la Stratégie de Saylor avec une Offre d'Actions Privilégiées axée sur Ethereum

BitMine Immersion Technologies s'oriente vers le modèle de trésorerie en crypto-actifs popularisé par Michael Saylor, mais en adoptant l'Ethereum (ETH) comme actif de réserve principal plutôt que le Bitcoin. La société a déposé une demande pour une offre publique de 3 000 000 d'actions privilégiées perpétuelles de série A, avec un dividende fixe de 9,50% et une valeur nominale de 100 dollars par action. Le produit de cette émission, d'une valeur potentielle de 300 millions de dollars, servira notamment à acquérir de l'ETH, à développer son infrastructure de validation et de staking (via son réseau MAVAN), ainsi qu'à des investissements stratégiques dans l'écosystème Ethereum. Cette structure de financement par actions privilégiées à rendement, similaire à celle de Saylor, vise à lever des capitaux pour constituer une trésorerie en crypto-actifs. L'action privilégiée, qui devrait être cotée au NYSE sous le symbole BMNP, comprend des mécanismes de pénalité en cas de non-paiement des dividendes et des options de rachat par la société après certaines périodes.

bitcoinistIl y a 2 h

BitMine Copie la Stratégie de Saylor avec une Offre d'Actions Privilégiées axée sur Ethereum

bitcoinistIl y a 2 h

Cardano est-il terminé ? Charles Hoskinson met en garde contre une « vague de faillites » — et sa propre communauté est furieuse

Charles Hoskinson, co-fondateur de Cardano, a déclenché un débat houleux en avertissant qu'une vague d'échecs de projets, de consolidations forcées et de fermetures DeFi frapperait l'écosystème dans la seconde moitié de 2026. Cet avertissement fait suite à l'annonce de la fermeture imminente de TapTools, une plateforme d'infrastructure majeure de Cardano, invoquant des coûts insoutenables et le départ de membres clés de l'équipe. Hoskinson a reconnu que des projets plus anciens n'étaient plus viables et qu'un plan de soutien via un indice financé par le trésor n'avait jamais vu le jour, imputant une partie de la responsabilité à la communauté de gouvernance. Il a ensuite annoncé "prendre une pause", alimentant les inquiétudes. La réaction de la communauté a été vive, des voix critiques accusant Hoskinson d'avoir sur-vendu le potentiel de Cardano, créant des attentes irréalistes. Les données structurelles sont alarmantes : la valeur totale bloquée (TVL) de Cardano n'est que d'environ 124 millions de dollars, loin derrière les leaders, le sommet 2026 a été annulé, les fonds d'ingénierie réduits de moitié et le prix de l'ADA est tombé sous 0,20 $, son plus bas depuis cinq ans. La question de savoir si Cardano peut inverser cette trajectoire négative reste sans réponse à l'aube d'une période difficile.

bitcoinistIl y a 3 h

Cardano est-il terminé ? Charles Hoskinson met en garde contre une « vague de faillites » — et sa propre communauté est furieuse

bitcoinistIl y a 3 h

À quoi s'attendre pour le prix du Bitcoin d'ici fin 2026

L'analyste crypto pseudonyme Aralez partage ses prévisions pour le prix du Bitcoin d'ici la fin de 2026. Pour la fin du deuxième trimestre 2024, il anticipe un mouvement baissier significatif, avec le Bitcoin potentiellement en baisse vers 58 000 dollars, accompagné d'une correction sur les marchés actions. Le changement devrait intervenir au troisième trimestre. Aralez prédit une phase de capitulation pour le Bitcoin, suivie d'une accumulation par les grands investisseurs ("baleines"). Cette période coïnciderait avec un assouplissement anticipé de la politique de taux de la Fed, permettant au prix de trouver un point bas. Le dernier trimestre de 2024 marquerait le début d'une forte reprise. Sur la base de ces facteurs, l'analyste s'attend à ce que le Bitcoin entame une tendance haussière significative, visant le niveau des 100 000 dollars. Cette appréciation serait portée par plusieurs catalyseurs, dont le regain de narration autour de l'intelligence artificielle (IA) et une liquidité accrue sur le marché crypto, les investisseurs acceptant plus de risques. Si ce scénario se réalise, le prix du Bitcoin pourrait enregistrer une hausse d'au moins 30% d'ici la fin de l'année 2026.

bitcoinistIl y a 5 h

À quoi s'attendre pour le prix du Bitcoin d'ici fin 2026

bitcoinistIl y a 5 h

Trading

Spot

Futures

La bonne façon de gérer le contexte de Claude Code : Éviter que plus la session est longue, plus le modèle devient « stupide »

Résumé

Petit cours accéléré : Contexte, compression contextuelle et dégradation du contexte

Quand faut-il ouvrir une nouvelle session ?

Utiliser le « retour en arrière » au lieu de « corriger »

Compression contextuelle vs Nouvelle session

Quelle « compression » peut échouer ?

Sous-agents et nouvelle fenêtre contextuelle

Questions liées

Lectures associées

La moyenne mobile sur 4 ans du Bitcoin indique où se trouve le plancher du marché

La guerre XRP contre SWIFT est-elle déjà terminée, ou les banques empruntent-elles une autre voie ?

BitMine Copie la Stratégie de Saylor avec une Offre d'Actions Privilégiées axée sur Ethereum

Cardano est-il terminé ? Charles Hoskinson met en garde contre une « vague de faillites » — et sa propre communauté est furieuse

À quoi s'attendre pour le prix du Bitcoin d'ici fin 2026

Trading

Catégories populaires

Tags tendances