Qui sait le mieux utiliser Claude Code ? La réponse n'est peut-être pas celle que vous pensez

marsbitPublié le 2026-06-20Dernière mise à jour le 2026-06-20

Résumé

Cette étude, basée sur 400 000 sessions Claude Code, explore comment l'IA change la relation au code. Elle révèle une division claire du travail : les humains décident du « quoi faire » (70% des décisions de planification), tandis que Claude gère le « comment le faire » (80% des décisions d'exécution). L'IA assume les tâches d'implémentation (écriture, modification, débogage), mais le jugement final reste humain. Contre-intuitivement, l'efficacité ne dépend pas principalement des compétences en programmation. Dans les tâches de génération de code, les taux de réussite des utilisateurs de professions non techniques (droit, finance, gestion, recherche) sont proches de ceux des ingénieurs logiciels. Le facteur clé de succès est l'expertise métier : comprendre le problème à résoudre. Les sessions menées par des experts déclenchent des chaînes d'actions deux fois plus longues et un volume de sortie cinq fois plus élevé que celles des novices. L'outil abaisse la barrière de l'implémentation, pas celle du jugement. Il amplifie la valeur des connaissances métier. L'analyse montre aussi une évolution des usages : moins de sessions dédiées au débogage (-50% en 7 mois), davantage à l'exploitation de logiciels, à l'analyse de données et à la rédaction. La valeur économique estimée des tâches a augmenté d'environ 25%. En résumé, les assistants de programmation IA ne remplacent pas l'expertise humaine, ils la valorisent. L'avenir pourrait appartenir à ceux qui savent définir clairement ...

Note de la rédaction : Ce rapport, basé sur environ 400 000 sessions Claude Code, examine comment les outils d'IA de programmation transforment la relation entre l'humain et le code.

La découverte principale est la suivante : dans la programmation par agents intelligents, l'humain décide principalement du « quoi faire », tandis que Claude s'occupe principalement du « comment le faire ». L'utilisateur assume la plupart des décisions de planification, tandis que Claude assume la majeure partie du travail d'exécution. En d'autres termes, l'IA prend en charge les étapes de mise en œuvre comme l'écriture de code, la modification de fichiers, l'exécution de commandes et le débogage, mais la définition des objectifs et l'évaluation des résultats reposent toujours sur l'humain.

Plus important encore, l'efficacité de l'utilisation de Claude Code ne dépend pas uniquement du fait que l'utilisateur soit programmeur ou non. Le rapport montre que dans les tâches générant du code, les taux de réussite des utilisateurs exerçant des métiers non techniques comme le droit, la finance, la gestion ou la recherche se rapprochent de ceux des ingénieurs logiciels. Ce qui influence vraiment le résultat, c'est la compréhension que l'utilisateur a du problème qu'il veut résoudre.

Cela signifie que la programmation par IA réduit le seuil de mise en œuvre, pas celui du jugement. À l'avenir, les personnes qui comprennent le métier, le contexte, qui peuvent formuler clairement les besoins et évaluer les résultats, pourraient mieux utiliser l'IA que celles qui savent simplement coder. L'IA ne remplacera pas automatiquement l'expertise métier, elle en amplifiera au contraire la valeur.

Voici l'article original :

Principales découvertes

En nous appuyant sur des recherches existantes, nous proposons un cadre pour étudier la programmation interactive par agents intelligents. Ce cadre, basé sur l'analyse respectueuse de la vie privée d'environ 400 000 sessions Claude Code entre octobre 2025 et avril 2026, évalue la composition des tâches, la façon dont l'humain et l'IA collaborent, ainsi que le taux de réussite des tâches.

Dans une session typique, l'humain est responsable de la majorité des décisions de planification, c'est-à-dire de décider « quoi faire » ; Claude est responsable de la majorité des décisions d'exécution, c'est-à-dire de décider « comment le terminer ». Plus l'expertise de l'utilisateur dans un domaine est grande, plus la quantité de travail que Claude accomplit par instruction est importante. Dans les tâches de codage, les taux de réussite moyens des principaux groupes professionnels – c'est-à-dire si l'utilisateur a accompli ce qu'il voulait faire initialement, avec des preuves vérifiables comme des tests réussis, des soumissions de code, etc. – sont presque au même niveau que celui des ingénieurs logiciels.

Plus les compétences professionnelles de l'utilisateur dans le domaine sont élevées, plus la session a de chances de se terminer avec succès. Cependant, l'écart entre les utilisateurs intermédiaires et les experts n'est pas très grand. Au cours des sept mois observés, la proportion de sessions consacrées au débogage a presque diminué de moitié, et l'utilisation a évolué vers des usages plus complets de l'agent : déploiement et exécution de code, analyse de données et rédaction de documents non liés au code.

Au cours de ces sept mois, la valeur typique des tâches a augmenté dans presque tous les types de travail. En comparant avec les offres d'emploi indépendant pour estimer la valeur des tâches, nous constatons une augmentation moyenne d'environ 25%.

Introduction

La programmation par agents intelligents est en plein essor. Depuis fin 2025, la proportion de projets GitHub présentant une activité d'agent de codage a plus que doublé, et les utilisateurs de Claude Code utilisent désormais cet outil en moyenne 20 heures par semaine. Les personnes sans expérience formelle en programmation peuvent-elles réussir à diriger un agent intelligent pour accomplir des travaux techniques complexes ? Comment l'adoption rapide et l'amélioration des capacités de ces outils affecteront-elles le travail intellectuel au sens large ? Nous n'avons pas encore de réponse complète, mais les données d'utilisation de Claude Code révèlent déjà quelques signes précoces.

Ce rapport, basé sur l'analyse respectueuse de la vie privée d'environ 400 000 sessions interactives impliquant environ 235 000 utilisateurs entre octobre 2025 et avril 2026, fournit des preuves sur la façon dont Claude Code est réellement utilisé. Il s'inscrit dans la continuité de nos recherches précédentes sur les indicateurs d'autonomie dans les sessions Claude Code et sur la manière dont Claude Code change le travail interne chez Anthropic. Cet article propose un cadre pour décrire l'utilisation d'un assistant de programmation IA interactif : quel travail les gens accomplissent, qui l'accomplit, et si le travail est réussi. Nous nous concentrons sur les utilisations de Claude Code via l'interface en ligne de commande (CLI), Claude.ai ou l'application de bureau Claude Code. En suivant l'évolution des usages de la programmation par agents intelligents avec l'amélioration des capacités des modèles, nous pouvons mieux comprendre l'impact de ces outils sur les professionnels de la programmation et sur le marché du travail des travailleurs du savoir.

Ce qui se passe avec Claude Code pourrait préfigurer l'avenir du travail intellectuel : les agents intelligents s'intégreront progressivement dans des travaux non liés au codage. Nous constatons que Claude s'occupe de tâches plus complexes et de plus grande valeur. Parallèlement, une division claire du travail persiste dans la programmation par agents : l'humain décide quoi construire, l'agent décide comment le construire.

Nous voyons également des preuves que ce qui amplifie vraiment l'efficacité de l'outil est l'expertise métier, et non la maîtrise de la programmation. En particulier, les experts du domaine réussissent plus facilement et se remettent plus facilement des erreurs et des malentendus. Cependant, l'écart entre les experts et les utilisateurs intermédiaires n'est pas très marqué. Cela suggère qu'une maîtrise suffisante dans un domaine permet d'utiliser ces outils presque aussi efficacement qu'un expert confirmé.

Ces découvertes nous permettent d'observer les transformations potentielles du marché du travail. Dans nos données, le succès dépend de la compréhension du problème à résoudre par l'utilisateur, et non de sa formation en programmation. Si ces modèles se vérifient à l'échelle de l'économie, cela signifierait que les outils de programmation par agents intelligents, tout en absorbant une partie des travaux de mise en œuvre, récompensent également ceux qui comprennent véritablement les problèmes qu'ils cherchent à résoudre dans leur travail. Les agents de codage ne remplacent pas l'expertise métier. Au contraire, plus un travailleur apporte de compréhension à l'agent, plus l'agent peut accomplir un travail de haute qualité.

Division du travail

Que font les gens avec Claude Code

Pour comprendre comment les gens utilisent Claude Code, nous classons chaque session dans l'un des neuf modes de travail, c'est-à-dire l'activité unique qui décrit le mieux l'objectif de la session. Quatre de ces modes impliquent directement l'écriture ou la maintenance de code : construire quelque chose de nouveau, réparer quelque chose de cassé, tester du code, et orchestrer d'autres agents ou des pipelines d'automatisation. Une autre catégorie concerne l'exploitation de logiciels, incluant le déploiement, la configuration, l'exécution de pipelines et la surveillance de systèmes. Deux autres catégories visent davantage à comprendre « quoi faire » : comprendre le fonctionnement d'un système existant, et planifier des modifications avant de les mettre en œuvre. Enfin, deux dernières catégories sont indépendantes du code, ou le code n'est qu'un élément auxiliaire du produit final : analyser des données, et communiquer via des présentations et d'autres documents textuels.

Environ 56% des sessions consistent à écrire du code (25%), à réparer du code (26%), ou à tester et orchestrer du code (5%). L'exploitation de logiciels représente 17%, la planification ou l'exploration 14%, et l'analyse ou la rédaction de texte 13% (voir Figure 1).

Nous avons d'abord fait lire les transcriptions des sessions au modèle pour les classer ; ensuite, nous avons utilisé nos outils d'analyse respectueux de la vie privée pour recouper ces classifications avec les données de télémétrie automatiquement enregistrées pour chaque session, y compris l'ajout ou la suppression de lignes de code. Il existe une forte cohérence entre les deux sources. Par exemple, dans les sessions classées comme création ou modification de code par notre classifieur, plus de 90% montrent également des changements de code dans les données de télémétrie. Pour plus de détails, voir l'annexe.

Qui prend les décisions

À quel point Claude Code est-il autonome ? Les évaluations de capacités montrent que sa limite supérieure est déjà élevée et continue d'augmenter. Par exemple, dans des benchmarks comme l'évaluation d'intervalle temporel de METR, les modèles de pointe sont désormais capables d'accomplir de manière autonome des tâches logicielles qui nécessitaient auparavant des heures de travail humain, en surmontant elles-mêmes les obstacles. Mais dans l'usage réel, comment cela se présente-t-il ? Ici, nous nous intéressons à la part de pilotage assumée par l'humain et par Claude dans des sessions réelles.

Nous étudions cette question sous deux angles. Premièrement, nous examinons dans quelle mesure les gens délèguent les décisions à Claude ; deuxièmement, nous observons combien d'actions ils assignent à Claude. Pour comprendre la répartition des décisions dans une session, nous avons construit un classifieur d'attribution de décisions respectueux de la vie privée basé sur le contenu des sessions. Nous demandons au classifieur de lister toutes les décisions significatives de la session et de les classer en décisions de planification et en décisions d'exécution. Les décisions de planification incluent quoi faire, quelle méthode adopter, ce qui constitue une fin ; les décisions d'exécution incluent quels fichiers modifier, quel code écrire, dans quel langage, et quelles commandes exécuter. Ensuite, le classifieur attribue chaque décision à Claude ou à l'utilisateur, et génère deux chiffres pour chaque session : le pourcentage de décisions de planification assumées par l'utilisateur, et le pourcentage de décisions d'exécution assumées par l'utilisateur.

En moyenne, les humains prennent environ 70% des décisions de planification, mais seulement 20% des décisions d'exécution (voir Figure 2). Dans l'usage réel, la programmation par agents établit une division claire du travail : l'humain décide quoi construire, l'agent décide comment le construire.

Pour comprendre le degré de délégation des actions dans une session, nous examinons non pas le contenu, mais la structure de la session. Les sessions Claude Code consistent en des aller-retour entre Claude et l'utilisateur : l'utilisateur envoie un prompt, Claude exécute des actions ; puis l'utilisateur envoie un nouveau prompt, et ainsi de suite. Dans une session typique, il y a environ quatre de ces tours. Dans nos données historiques d'octobre à avril, chaque prompt envoyé par l'utilisateur déclenche en moyenne environ 10 actions de la part de Claude, parfois plus de 100. À chaque tour, Claude lit des fichiers, modifie du code, exécute des commandes, et produit en moyenne 2400 mots.

La quantité de travail accomplie par Claude entre deux vérifications de l'utilisateur dépend largement de qui prend les décisions. Lorsque l'utilisateur conserve le contrôle du processus d'exécution, c'est-à-dire lorsqu'il prend plus de 80% des décisions d'exécution, Claude exécute moins d'actions par tour, environ 8. Lorsque Claude contrôle la planification, c'est-à-dire lorsqu'il prend plus de 80% des décisions de planification, il assume le plus grand nombre d'actions, environ 16.

Niveau de compétence

Pour chaque transcription de session, Claude évalue le niveau de compétence apparent de l'utilisateur sur cette tâche sur une échelle à cinq niveaux, de novice à expert. Le classifieur de niveau de compétence se concentre sur trois signaux : la précision des instructions données par l'utilisateur, ce que l'utilisateur demande à Claude de vérifier, et si c'est plus souvent l'utilisateur qui corrige Claude ou l'inverse. Il est important de noter que cette compétence est distincte du poste ou des capacités générales, et surtout, elle est spécifique à la tâche. Un ingénieur expérimenté qui pose une question sur Rust pour la première fois peut être un débutant sur une tâche Rust. Un comptable n'ayant jamais utilisé Python, mais capable de dire précisément à Claude quelles règles de rapprochement un script Python doit exécuter et d'identifier les cas limites que le script traiterait incorrectement à la fin du mois, est un expert sur cette tâche.

Le tableau ci-dessous montre comment nous définissons chaque niveau de compétence dans le classifieur, avec des exemples de demandes tirés de l'ensemble de données publiques de conversations d'agents de codage SWE-chat. Les conversations classées comme « novice » donnent des instructions générales, sans montrer de connaissances spécifiques au domaine ; celles classées comme « expert » transmettent une compréhension approfondie de la base de code et de l'environnement technique.

Nous avons quantifié la relation entre le niveau de compétence et le volume de sorties et d'activités générées par chaque prompt de Claude. Dans une session typique de novice, chaque prompt déclenche environ 5 actions et produit environ 600 mots de la part de Claude ; dans une session d'expert, la chaîne d'actions est plus de deux fois plus longue, environ 12 actions, et le volume de sortie atteint environ 3200 mots, soit cinq fois plus (voir Figure 3). Cet écart entre novice et expert se retrouve dans tous les types de travail et toutes les tranches de valeur de tâche.

Ces indicateurs complètent nos recherches précédentes sur l'autonomie de Claude Code. Ces dernières suivaient la durée d'exécution de l'agent et la fréquence à laquelle les utilisateurs approuvaient automatiquement ses actions. En revanche, nos indicateurs d'attribution de décisions capturent qui prend les décisions substantielles sur l'ensemble de la session, tandis que le volume de sorties et le nombre d'actions par prompt mesurent le degré d'activité autonome que chaque instruction humaine peut susciter de la part de Claude.

Qui utilise Claude Code, et pour quoi faire

Utilisateurs

Pour comprendre qui accomplit ce travail, nous déduisons la profession de chaque utilisateur à partir des transcriptions de session et la faisons correspondre à l'une des 23 catégories principales du système de classification des professions (SOC) du Bureau américain des statistiques du travail. Le classifieur est invité à se baser uniquement sur les signaux suivants : le contexte du projet chargé par l'agent au début de la session, les noms et structure des fichiers, les documents ou artefacts cités par l'utilisateur (par exemple, documents juridiques, données cliniques, rapports financiers, supports de cours), et le vocabulaire utilisé par l'utilisateur. Il est explicitement demandé au classifieur de ne pas considérer le fait « d'écrire du code » comme une preuve en soi que l'utilisateur exerce une profession de programmation. Ce n'est que lorsqu'il existe un signal clair indiquant que le travail logiciel ou de données fait partie de la profession de l'utilisateur que la session est classée dans la catégorie SOC liée au codage, à savoir « Professions informatiques et mathématiques ». Si un avocat construit un script pour vérifier automatiquement l'absence de certaines clauses dans un ensemble de contrats, même si la session consiste principalement à écrire un logiciel, elle sera classée dans les professions juridiques. S'il n'y a aucun signal concernant la profession de l'utilisateur, la session n'est pas classée.

Nous avons pu déduire la profession pour environ 70% des sessions. Parmi ces sessions classables, les « Professions informatiques et mathématiques » constituent le groupe le plus important, ce qui n'est pas surprenant car cette catégorie couvre la plupart des travaux liés aux logiciels. Viennent ensuite les opérations commerciales et financières, les arts, le design et les médias, la gestion, ainsi que les sciences de la vie, physiques et sociales. Dans notre échantillon, les groupes professionnels non logiciels à la croissance la plus rapide sont la gestion, les ventes et les professions juridiques.

Travail accompli

D'octobre 2025 à avril 2026, la composition du travail accompli avec Claude Code a considérablement changé. Le changement le plus marquant est la baisse de la proportion de sessions consacrées à la réparation de code cassé, passant de 33% à 19% (voir Figure 4). Elles ont été remplacées par davantage de travaux autour du code. La proportion d'exploitation de logiciels est passée de 14% à 21%. L'écriture et l'analyse de données ont environ doublé, passant d'environ 10% à environ 20%.

La valeur des tâches elles-mêmes a également augmenté. Nous estimons approximativement la valeur économique de chaque session en évaluant le coût d'un travail similaire sur le marché du travail indépendant, en nous calibrant sur un ensemble de données d'offres d'emploi publiques réelles. Selon cette mesure, la valeur estimée moyenne d'une session a augmenté de 27% entre octobre et avril. Cette hausse est observée dans de nombreux types de travail. Les valeurs des tâches de construction, d'exploitation et de réparation ont augmenté d'environ 43%, 34% et 32% respectivement. Ces estimations de prix sont assez approximatives, nous les utilisons donc principalement pour comparer les tendances des différentes tâches au fil du temps, et non comme des valeurs en dollars directement interprétables. Pour plus de détails sur la construction de l'estimateur de valeur des tâches, voir l'annexe.

Le succès dépend de ce que l'utilisateur apporte

Estimer la valeur des tâches est une façon de comprendre comment Claude Code aide les gens à accomplir leur travail. Un autre angle est d'observer combien de sessions réussissent, et quelles caractéristiques des sessions sont corrélées au succès. Pour tous les indicateurs de succès, nous observons un schéma clair : plus le niveau de compétence manifesté par l'utilisateur dans la session est élevé, plus la session a de chances de réussir. La majeure partie de l'amélioration se concentre sur les niveaux de compétence inférieurs, c'est-à-dire que l'écart entre un novice et un utilisateur intermédiaire est plus grand qu'entre un utilisateur intermédiaire et un expert.

Avant d'analyser les caractéristiques des sessions réussies, nous devons préciser comment nous mesurons le succès. Nous ne pouvons pas observer les résultats dans le monde réel, ni demander directement aux utilisateurs s'ils ont accompli ce qu'ils voulaient avec Claude. Nous nous appuyons donc sur deux mesures complémentaires basées sur les transcriptions. La première est le « succès jugé », où un classifieur lit la transcription complète de la session et détermine si l'utilisateur a atteint son objectif initial, avec des options : succès, succès partiel, échec, aucun objectif clair. Ensuite, deux classifieurs complémentaires évaluent la force des preuves de ce jugement pour déterminer le « succès vérifié ». Le classifieur de signaux de succès recherche des preuves vérifiables de succès, en particulier les activités git correspondant au travail (commits, pull requests), la réussite de suites de tests, et l'expression explicite de satisfaction de l'utilisateur. Il note la session sur une échelle allant de « aucun signal » à « signal faible » (1 point) jusqu'à « plusieurs signaux forts » (5 points). Un classifieur parallèle de signaux d'échec note les preuves que quelque chose a mal tourné : erreurs, tests échoués, tentatives répétées de la même chose, objections de l'utilisateur, etc. Le succès vérifié requiert deux conditions simultanées : la session est jugée comme un succès, et il existe au moins un signal fort et vérifiable de succès. L'analyse suivante se concentre sur le degré de succès ou d'échec des sessions, nous excluons donc les sessions jugées « aucun objectif clair » par le classifieur de résultats, représentant environ 7,7% de l'échantillon complet.

Les bénéfices du niveau de compétence

Quelles sessions ont donc le plus de chances de réussir ? Les résultats montrent que le score de niveau de compétence de session décrit précédemment a une forte influence sur le succès de la session.

On pourrait craindre que le niveau de compétence ne soit pas le vrai facteur déterminant. Peut-être que les experts choisissent simplement des tâches différentes, ou diffèrent à d'autres égards. Dans cette section, nous répondons en partie à cette préoccupation en comparant des sessions de même type de travail, de même valeur estimée, du même mois, sur le même sujet, provenant du même grand groupe professionnel, et examinons comment le niveau de compétence de l'utilisateur influence les résultats.

Pour tous les indicateurs de succès, plus le niveau de compétence manifesté par l'utilisateur dans la session est élevé, plus la session a de chances de réussir. Les sessions notées comme novices atteignent un succès selon notre indicateur le plus strict, le « succès vérifié », dans 15% des cas, et un succès au moins partiel dans 77% des cas. Les sessions notées intermédiaires et au-dessus atteignent un taux de succès vérifié de 28% à 33%, et un taux de succès au moins partiel de 91% à 92% (voir Figure 5).

Pour chaque indicateur, la majeure partie du bénéfice provient du passage de novice à intermédiaire ; la pente ralentit ensuite du niveau intermédiaire à expert. Pour les détails de l'analyse de régression sous-jacente à la Figure 5, voir l'annexe.

On observe un gradient similaire dans les sessions rencontrant des difficultés. Lorsque les signaux d'échec enregistrent des preuves vérifiées d'échec, nous considérons que la session « a rencontré un problème ». Cela peut inclure des erreurs, des tests échoués, plusieurs tentatives pour accomplir la même chose, ou l'expression de frustration et de mécontentement par l'utilisateur. Parmi les sessions ayant rencontré un problème, après contrôle des variables ci-dessus, la proportion de succès vérifié passe de 4% pour les sessions de novices à 15% pour les sessions d'experts (voir Figure 5). Avec un indicateur de succès plus large, nous constatons que la proportion de succès au moins partiel est de 60% chez les utilisateurs novices, et de 80% à 81% chez les utilisateurs intermédiaires à experts.

Nous avons également tracé la relation inverse, entre le niveau de compétence et divers indicateurs d'échec. Il est important de noter que dans cette analyse, les sessions jugées comme des échecs sont celles qui n'atteignent même pas un succès partiel. Si une session ayant rencontré un problème est jugée comme un échec et n'a écrit aucune ligne de code, nous la qualifions d'abandonnée. Dans les sessions où l'utilisateur semble novice, 19% sont finalement abandonnées ; dans les autres groupes d'utilisateurs, ce taux est de 5% à 7%. En d'autres termes, les utilisateurs les moins expérimentés, lorsqu'ils rencontrent des difficultés en cherchant à atteindre un objectif, abandonnent plus facilement. Une partie de la valeur des compétences professionnelles semble résider dans la capacité à ramener l'agent sur la bonne voie.

La profession est peut-être moins importante que le niveau de compétence

Les utilisateurs des professions liées aux logiciels ont un taux de succès vérifié d'environ 30% sur toutes les sessions, contre environ 26% pour les autres professions. Dans les sessions générant du code, c'est-à-dire celles ajoutant ou modifiant au moins une ligne de code, ces chiffres sont respectivement de 34% et 29% (voir Figure 6). Avec une définition plus large du succès, l'écart entre les professions liées aux logiciels et les autres se réduit davantage. Dans les sessions générant du code, les proportions atteignant au moins un succès partiel sont de 89% et 88% respectivement. Un écart de cinq points n'est pas énorme, et il n'a ni augmenté ni diminué au cours des sept mois, bien que le taux de réussite des deux groupes ait progressé. Dans les sessions générant du code, les dix plus grands groupes professionnels de notre ensemble de données présentent chacun un écart de réussite de moins de sept points de pourcentage par rapport aux ingénieurs logiciels. Les professions de gestion ont le taux de succès vérifié le plus élevé, légèrement supérieur à celui des ingénieurs logiciels. Le taux de succès vérifié plus élevé des gestionnaires pourrait refléter la transférabilité des compétences managériales à la tâche de diriger un agent. Mais cela peut aussi provenir en partie de notre méthode de mesure : la vérification s'appuie dans une certaine mesure sur la confirmation explicite de l'utilisateur dans la session, et les gestionnaires peuvent être plus habitués à s'exprimer lorsqu'ils obtiennent le résultat souhaité.

Perspectives

Les résultats de ce rapport esquissent un tableau émergent : la programmation par agents intelligents amplifie certaines connaissances et compétences, tout en en remplaçant d'autres. Dans les sessions générant du code, les taux de réussite des principales professions diffèrent peu de ceux des professions liées aux logiciels. Il semble que les agents de codage rendent le fait d'avoir une formation en programmation moins important pour réussir une tâche de programmation.

Parallèlement, les sessions réussies ont plus de chances de manifester une expertise métier. Les sessions classées comme expertes ont un taux de succès vérifié plus de deux fois supérieur à celui des sessions de novices. Lorsqu'une session rencontre un problème, les novices abandonnent plusieurs fois plus souvent que les autres utilisateurs. La façon même de collaborer rend ce tableau plus clair : les experts du domaine peuvent guider Claude vers plus de travail accompli par instruction. Ainsi, la capacité à orienter Claude vers le succès provient davantage de la maîtrise d'un domaine que de la capacité à écrire du code. Toute personne possédant cette maîtrise dans n'importe quel domaine peut désormais accomplir des travaux techniques qu'elle ne pouvait pas réaliser auparavant. Ceux qui manquent de cette compréhension professionnelle, même avec le même outil, en tireront beaucoup moins. De plus, le bénéfice principal provient de la compétence, et non de l'expertise. Avoir une compréhension opérationnelle d'un domaine procure déjà la majeure partie du bénéfice ; une spécialisation approfondie n'apporte qu'un avantage supplémentaire limité.

Ces découvertes sont encore préliminaires. Comme pour la plupart de nos recherches, nous ne pouvons pas mesurer les résultats dans le monde réel, par exemple si le code écrit lors d'une session est ensuite utilisé ou jeté, ou s'il produit des résultats ayant une valeur économique. De plus, ce rapport exclut les utilisations non interactives, qui représentent une part considérable de l'activité globale. Développer un cadre capable de mesurer ce type d'utilisation est un axe de travail futur important. Par ailleurs, toutes nos classifications de sessions reposent sur la lecture des transcriptions par le modèle. Dans l'annexe, nous montrons que les classifieurs sont cohérents avec les données de télémétrie indépendantes dans les directions attendues, et qu'ils sont en accord avec les jugements d'un modèle de référence solide pour la plupart des sessions. Cependant, la validation des classifieurs à grande échelle reste difficile ; les sessions Claude Code elles-mêmes ajoutent à cette difficulté car elles peuvent être trop longues et complexes pour servir de référence fiable via un étiquetage humain.

Au fur et à mesure que les modèles, les utilisateurs et la division du travail entre eux évoluent, le tableau présenté dans ce rapport sera mis à jour. Nous espérons que ces indicateurs nous aideront à suivre les transformations majeures en cours. Par exemple, si à l'avenir les bénéfices liés au niveau de compétence commencent à diminuer, cela indiquera que les modèles commencent à fournir le jugement clé que les utilisateurs apportent actuellement, et les bénéfices de ces outils s'étendront des experts du domaine à une population plus large. Si la proportion d'utilisateurs hors des professions logicielles réussissant des sessions de codage continue d'augmenter, cela pourrait signifier que la production de logiciels devient une partie ordinaire du travail dans tous les domaines, et non plus le produit d'une profession unique. Ces transformations changeront qui bénéficie de la programmation par agents intelligents, et dans quelle mesure, et affecteront les capacités les plus valorisées sur le marché du travail.

Questions liées

QQuelle est la découverte principale du rapport concernant l'utilisation de Claude Code ?

ALe rapport constate que dans la programmation par agent, les humains décident principalement 'quoi faire' et Claude 'comment le faire'. Les utilisateurs assument la plupart des décisions de planification, tandis que Claude prend en charge l'exécution.

QL'efficacité de l'utilisation de Claude Code dépend-elle principalement du fait d'être programmeur ?

ANon. Le rapport montre que pour les tâches générant du code, les utilisateurs de professions non techniques (droit, finance, gestion, recherche) atteignent des taux de réussite proches de ceux des ingénieurs logiciels. Ce qui importe, c'est la compréhension du problème à résoudre.

QComment la répartition du travail entre l'humain et Claude est-elle décrite dans une session typique ?

AEn moyenne, les humains prennent environ 70% des décisions de planification (quoi faire) mais seulement 20% des décisions d'exécution (comment faire). Claude exécute de nombreuses actions entre chaque intervention de l'utilisateur.

QQuel facteur est le plus corrélé au succès d'une session avec Claude Code ?

ALe niveau d'expertise apparent de l'utilisateur dans le domaine de la tâche. Les sessions d'experts ont un taux de réussite vérifié environ deux fois plus élevé que celles des débutants. La compétence dans un domaine spécifique est plus déterminante que le métier (être programmeur ou non).

QQuelle tendance d'évolution de l'utilisation de Claude Code a été observée entre octobre 2025 et avril 2026 ?

ALa part des sessions dédiées au débogage a presque diminué de moitié. L'utilisation a évolué vers des usages plus complets : déploiement/exécution de code, analyse de données et rédaction de documents non-code. La valeur estimée des tâches a augmenté d'environ 25% en moyenne.

Lectures associées

Analyse des derniers ajustements de portefeuille de la « version bêta » du marché boursier américain : 9 milliards de dollars de ventes à découvert sur NVIDIA, les capitaux se redirigent vers les secteurs de l'électricité et de la mémoire

L'investisseur en IA Leopold Aschenbrenner, considéré comme l'un des plus agressifs au monde, a récemment ajusté ses positions significativement. Il a pris des positions courtes d'environ 90 milliards de dollars sur des leaders de l'infrastructure IA comme NVIDIA, ASML et Oracle. Parallèlement, il réoriente son capital vers des secteurs qu'il considère comme les prochains goulets d'étranglement physiques de l'IA : l'énergie électrique, la mémoire (RAM), les réseaux de centres de données et des actifs en capital-risque comme Anthropic. Cette rotation ne signifie pas la fin de la bulle IA, mais plutôt un déplacement des capitaux depuis les transactions « priorité aux puces » (comme NVIDIA) vers les couches d'infrastructure sous-jacentes plus contraignantes. Le récent emprunt obligataire de 250 milliards de dollars de NVIDIA, malgré sa trésorerie abondante, est interprété comme un signal que le financement de la croissance de l'IA évolue, l'entreprise saisissant des capitaux à bon marché. L'analyse souligne que les véritables limites à l'expansion de l'IA ne sont plus seulement les GPU, mais la capacité à construire physiquement des centres de données, à fournir de l'électricité et à augmenter la production de composants comme la mémoire. Les entreprises capables de relever ces défis de construction et de logistique devraient capturer la prochaine vague de valeur. Des sociétés comme CoreWeave (cloud spécialisé IA) et Marvell (réseaux optiques) sont citées comme bénéficiaires, cette dernière ayant reçu un investissement et des éloges publics de Jensen Huang, le PDG de NVIDIA. Aschenbrenner détendrait également une importante participation privée dans Anthropic, valorisant son fonds à environ 200 milliards de dollars. La conclusion des analystes est que les meilleurs paris à long terme pourraient ne pas être les sociétés de puces les plus populaires, mais plutôt les infrastructures essentielles, notamment l'énergie, dont la demande est inélastique quelle que soit l'évolution de l'IA.

marsbitIl y a 10 mins

Analyse des derniers ajustements de portefeuille de la « version bêta » du marché boursier américain : 9 milliards de dollars de ventes à découvert sur NVIDIA, les capitaux se redirigent vers les secteurs de l'électricité et de la mémoire

marsbitIl y a 10 mins

BIT Recherche : La liquidité est en train de disparaître, le Bitcoin va-t-il répéter le scénario de consolidation de 2022 ?

Le marché se trouve actuellement dans une phase de correction, influencée par les anticipations politiques et les évolutions de la liquidité. Malgré un rebond technique initial, les signaux inattendument hawkish du nouveau président de la Fed, Kevin Warsh, ont annulé les espoirs d'assouplissement. La liquidité des stablecoins se contracte, les nouveaux capitaux sont insuffisants et les volumes de transaction ont considérablement baissé, l'activité entrant dans une phase estivale typiquement plus calme. L'incertitude politique pèse sur l'appétit pour le risque. La Fed ayant laissé planer une possibilité de hausse des taux, le bitcoin évolue dans un contexte de prime de risque accrue. Techniquement, la tendance reste baissière en dessous de 73 700 $, avec un support clé à 62 446 $. La contraction de la liquidité est une contrainte majeure. Le volume journalier n'est qu'à environ 25% de son pic de 2025, et la croissance des stablecoins (USDT, USDC) ralentit fortement. Les flux nets des ETF Bitcoin et l'effet de soutien des achats de Strategy via des actions privilégiées STRC s'affaiblissent. Avec une inflation à 4,2%, une Fed hawkish, une saisonnalité estivale faible et un manque de liquidités, des difficultés persistent pour maintenir le bitcoin au-dessus de 60 000 $ à court terme. Cependant, ce processus d'ajustement pourrait contribuer à former un point bas cyclique cet été, préparant potentiellement le terrain pour le prochain cycle haussier.

marsbitIl y a 44 mins

BIT Recherche : La liquidité est en train de disparaître, le Bitcoin va-t-il répéter le scénario de consolidation de 2022 ?

marsbitIl y a 44 mins

Le pari risqué des entreprises minières sur l'IA : La valorisation entre dans une phase de différenciation, une bataille difficile pour se redresser

Les entreprises minières de cryptomonnaies, confrontées à la pression d'un marché baissier, accélèrent leur transformation vers l'infrastructure d'IA pour trouver une nouvelle courbe de croissance. Cette transition, favorisée par leurs actifs existants (énergie, terrains, refroidissement), est bien accueillie par les marchés, comme en témoignent les fortes hausses de leurs actions. Cependant, une nette divergence d'évaluation émerge, avec des acteurs comme CoreWeave en tête. Cette transformation n'est pas sans défis. La profitabilité du minage s'érode, avec une marge des mineurs tombant à 17,45%, poussant à une concentration du secteur. Bien que l'IA offre des revenus potentiellement plus élevés, la transition exige des investissements massifs (jusqu'à 2210 milliards de dollars à long terme) et affronte des cycles de retour sur investissement longs. Les entreprises font face à un déficit de financement immédiat d'environ 500 milliards. La valorisation des acteurs évolue désormais d'une logique basée sur la simple capacité électrique vers une appréciation de leur capacité réelle à livrer des projets, la qualité de leur clientèle (les hyperscalers étant privilégiés) et leurs flux de trésorerie futurs. Pour financer cette mutation, les entreprises ont recours à des levées de fonds, des ventes de bitcoins et la signature de contrats à long terme. La réussite de ce pari audacieux dépendra finalement de leur puissance financière et de leur capacité d'exécution dans cette nouvelle course aux ressources et aux infrastructures.

marsbitIl y a 1 h

Le pari risqué des entreprises minières sur l'IA : La valorisation entre dans une phase de différenciation, une bataille difficile pour se redresser

marsbitIl y a 1 h

La dépeg de 11% de l'action privilégiée STRC : La machine à mouvement perpétuel de Strategy tourne-t-elle encore ?

L'action privilégiée STRC de MicroStrategy se détache de plus en plus de sa valeur nominale cible de 100 dollars, avec un écart dépassant 11%. Ce produit, conçu comme un titre à revenu stable, est le moteur clé de la "roue de capital" de l'entreprise, lui permettant de lever des fonds sans diluer les actions ordinaires pour acheter du Bitcoin. Son mécanisme d'ancrage, basé sur un ajustement dynamique du taux de dividende, semble actuellement inefficace malgré un dividende porté à 11,5%. Les raisons de ce décrochage sont multiples : dénouement de positions à effet de levier et, surtout, inquiétudes du marché quant à la solidité financière de MicroStrategy. Un rapport de JPMorgan a souligné que les réserves de trésorerie ne couvriraient que 6,3 mois de paiements de dividendes sur les actions privilégiées. Bien que MicroStrategy rétorque que ses réserves de Bitcoin pourraient couvrir 32 ans de dividendes, cela impliquerait de vendre des actifs, rompant avec son récit d'accumulation à long terme. La première vente symbolique de Bitcoin par l'entreprise ce mois-ci a accru ces craintes. Si le décrochage de la STRC persiste, la capacité de financement de MicroStrategy s'en trouverait affaiblie. Dans un scénario où ses réserves de trésorerie diminueraient, la pression pour vendre du Bitcoin afin de payer les dividendes augmenterait, transformant potentiellement le plus grand acheteur institutionnel en un vendeur et exerçant une pression baissière sur le marché du Bitcoin.

marsbitIl y a 2 h

La dépeg de 11% de l'action privilégiée STRC : La machine à mouvement perpétuel de Strategy tourne-t-elle encore ?

marsbitIl y a 2 h

Un lauréat du prix Nobel vient de rejoindre Anthropic

Le lauréat du prix Nobel de chimie John Jumper, ancien responsable principal d'AlphaFold chez Google DeepMind, rejoint Anthropic. Cette annonce, intervenue après le départ de Noam Shazeer (co-auteur du Transformer) vers OpenAI, représente une perte majeure pour Google en l'espace de 72 heures. Jumper, diplômé en 2017, avait été placé à la tête de l'équipe AlphaFold par Demis Hassabis après seulement six mois chez DeepMind, malgré son manque initial d'expérience en deep learning. Sous sa direction, AlphaFold a révolutionné la biologie structurale, résolvant le problème du repliement des protéines et générant des centaines de millions de structures, multipliant par 1000 le nombre de structures connues. Ces avancées lui ont valu le prix Nobel de chimie en 2024 à l'âge de 39 ans. Son départ intervient dans un contexte d'exode des talents de Google DeepMind, où plus de 20 chercheurs clés sont partis ces huit dernières années. Un commentaire suggère que les jeunes laboratoires d'IA offrent ce que Google ne peut plus : la sensation qu'une seule personne peut changer la trajectoire de l'entreprise. Anthropic renforce ainsi son pôle sciences de la vie, après l'acquisition de Coefficient Bio et le lancement d'outils dédiés comme Claude for Life Sciences. Ce mouvement reflète une concurrence accrue dans le domaine, avec OpenAI (GPT-Rosalind) et Google DeepMind (via Isomorphic Labs) investissant également massivement pour réinventer la recherche biomédicale avec l'IA. Le recrutement de Jumper marque une nouvelle étape dans cette course stratégique.

marsbitIl y a 2 h

Un lauréat du prix Nobel vient de rejoindre Anthropic

marsbitIl y a 2 h

Trading

Spot
Futures
活动图片