Anthropic 数据:Les appels d'Agent IA sont concentrés à près de 50 % dans l'ingénierie logicielle, ces 16 domaines verticaux restent des marchés vierges

marsbitPublié le 2026-02-24Dernière mise à jour le 2026-02-24

Résumé

Une étude d'Anthropic révèle que près de 50% des appels aux outils d'IA Agent concernent le génie logiciel, tandis que 16 autres secteurs verticaux (santé, droit, finance, éducation, etc.) représentent chacun moins de 5% de l'activité. Ceci indique un immense potentiel inexploité pour environ 300 futures licornes des IA verticales. Bien que les modèles comme Claude puissent exécuter des tâches nécessitant près de 5 heures de travail humain, la durée médiane d’une session n’est que de 42 minutes, révélant un "déficit de confiance" qui constitue une opportunité commerciale cruciale. La confiance évolue avec l'usage : les nouveaux utilisateurs approuvent automatiquement 20% des sessions, contre plus de 40% après 750 interactions. Les utilisateurs expérimentés adoptent une surveillance proactive plutôt qu’un contrôle préalable. Les créateurs devront intégrer des données propriétaires, concevoir des workflows spécialisés et gérer le changement organisationnel pour réussir dans ces niches. La régulation devrait favoriser la supervision humaine sans imposer une approbation systématique qui freinerait la productivité.

Auteur : Garry's List

Compilation : Deep Tide TechFlow

Guide Deep Tide : Anthropic a récemment publié l'étude la plus complète à ce jour sur l'utilisation réelle des Agents IA. Le chiffre clé est : l'ingénierie logicielle représente près de 50 % du volume d'appels aux outils d'Agent, tandis que 16 domaines verticaux comme la santé, le droit, l'éducation, etc., réunis, représentent moins de la moitié du reste, chaque domaine ayant une part inférieure à 5 %.

Ce n'est pas un signal de saturation du marché, mais une carte vers 300 licornes de l'IA verticale – ce qui est encore plus précieux, c'est une découverte contre-intuitive citée dans l'article : le modèle peut déjà travailler de manière autonome pendant près de 5 heures, mais les utilisateurs ne lui laissent en réalité travailler que 42 minutes. Ce "déficit de confiance" est en soi la prochaine opportunité produit.

Texte intégral :

L'ingénierie logicielle représente près de 50 % de tous les appels aux outils d'Agent IA. Des domaines verticaux comme la santé, le droit, la finance, etc., sont presque intacts, chacun en dessous de 5 %. Cela signifie que 300 licornes de l'IA verticale attendent d'être construites.

Si je devais créer une entreprise aujourd'hui, je fixerais la zone rouge du graphique en barres ci-dessus jusqu'à voir mon avenir.

Aaron Levie, fondateur de Box, a déclaré :

Ce graphique est un bon rappel de l'ampleur des opportunités actuelles dans le domaine des Agents IA.

Il y aura bien sûr de nombreuses opportunités d'Agents horizontaux, mais tout autant de flux de travail nécessitent une expertise sectorielle profonde pour vraiment aider les utilisateurs à automatiser les processus uniques de leur domaine vertical.

Le modèle est : construire un logiciel d'Agent intégrant des données propriétaires, capable de relier efficacement l'utilisateur et l'Agent pour traiter les flux de travail, tout en ayant une capacité approfondie d'ingénierie contextuelle spécifique au domaine, ainsi qu'une capacité à piloter la gestion du changement côté client.

De nombreux domaines présentent encore d'énormes lacunes.

L'ingénierie logicielle occupe la moitié de toutes les activités d'Agent IA. L'autre moitié est dispersée dans 16 domaines verticaux, aucun ne dépassant 9 %. La santé représente 1 %, le droit 0,9 %, l'éducation 1,8 %. Ce ne sont pas des marchés saturés, ce sont des marchés qui n'existent presque pas.

Anthropic vient de publier l'étude la plus complète à ce jour sur l'utilisation réelle des Agents IA. La découverte principale est : l'ingénierie logicielle représente 49,7 % du volume d'appels aux outils d'Agent sur son API. La conclusion principale enfouie derrière est : tout le reste est un marché vierge.

Retard de déploiement

Une donnée devrait exciter les entrepreneurs : les capacités du modèle dépassent de loin ce que les utilisateurs sont prêts à lui faire confiance.

L'évaluation des capacités de METR montre que Claude peut résoudre des tâches qui nécessiteraient près de cinq heures à un humain. Mais en utilisation réelle, la durée de session au 99,9e centile n'est que d'environ 42 minutes. Cet écart – entre ce que l'IA peut faire et ce que nous lui permettons de faire – est une énorme opportunité.

Figure : La durée d'entraînement la plus longue de Claude Code a presque doublé en trois mois. Cela améliore non seulement les capacités, mais aussi la confiance.

Source :x.com

D'octobre 2025 à janvier 2026, la durée de session unique au 99,9e centile a presque doublé, passant de moins de 25 minutes à plus de 45 minutes. La croissance a été régulière entre les versions du modèle. Ce n'est pas seulement que le modèle devient plus fort, c'est que les utilisateurs apprennent au fil des utilisations, étendant progressivement leur confiance envers l'Agent.

"D'août à décembre, le taux de réussite de Claude Code sur les tâches les plus difficiles des utilisateurs internes a doublé, tandis que le nombre d'interventions humaines par session est passé de 5,4 à 3,3."

La capacité est déjà là, le déploiement n'a pas suivi. Ce n'est pas un problème, c'est une opportunité produit.

Comment la confiance évolue

20 % des nouveaux utilisateurs approuvent automatiquement les actions de Claude Code. Au bout de 750 sessions, plus de 40 % des sessions fonctionnent en mode d'approbation automatique complète. Mais il y a une découverte contre-intuitive : les utilisateurs expérimentés interviennent plus, pas moins. Les nouveaux utilisateurs interviennent sur 5 % des tours, les anciens utilisateurs sur 9 %.

Figure : La confiance est une compétence qui s'accumule continuellement. Les nouveaux utilisateurs approuvent automatiquement 20 % des sessions. Au bout de 750 sessions, ce pourcentage dépasse 40 %.

Image : Anthropic

Source: x.com

Ce n'est pas contradictoire, mais un changement de stratégie de supervision. Les débutants approuvent progressivement avant l'action, les anciens utilisateurs autorisent d'abord, puis interviennent en cas de problème – ils sont passés de l'approbation préalable à la surveillance active.

Voici une découverte notable au niveau de la sécurité : sur les tâches complexes, Claude Code demande activement des clarifications plus de deux fois plus souvent que les interventions humaines actives. L'Agent marque une pause pour confirmer, au lieu de foncer tête baissée. C'est une caractéristique, pas un défaut.

"La révélation centrale de cette étude est : l'autonomie exercée par l'Agent en pratique est co-construite par le modèle, l'utilisateur et le produit. Claude marque une pause pour poser des questions en cas d'incertitude, limitant ainsi son indépendance. Les utilisateurs bâtissent la confiance en collaborant avec le modèle et ajustent leur stratégie de supervision en conséquence."

L'approche de Levie pour l'IA verticale

Aaron Levie a pointé l'énorme richesse et valeur attendant d'être débloquées : construire un logiciel d'Agent intégrant des données propriétaires, lui faisant vraiment résoudre des problèmes et des personnes réelles, le bourrant de contexte pour maximiser la production intelligente, et – c'est la partie que la plupart des entrepreneurs ignorent – piloter la gestion du changement côté client.

Ce dernier point est précisément pourquoi l'IA verticale est si difficile à reproduire. N'importe qui peut créer un wrapper d'API, mais peu peuvent vraiment naviguer les flux de travail spécifiques, les contraintes réglementaires et les résistances organisationnelles propres à la facturation médicale, la découverte légale ou l'approbation de permis de construire.

Le SaaS a multiplié sa taille par dix chaque décennie au cours des dernières décennies. Plus de 40 % des fonds de capital-risque des 20 dernières années ont été dirigés vers des entreprises SaaS. Cette industrie a donné naissance à plus de 170 licornes SaaS. La logique est simple : chacune de ces licornes a une version d'IA verticale qui attend d'apparaître. Et la version IA pourrait être dix fois plus grande, car elle remplace non seulement le logiciel, mais aussi les opérateurs.

La nature de la co-construction

La découverte principale d'Anthropic mérite l'attention sérieuse de toute personne participant à l'élaboration des politiques d'IA. L'autonomie n'est pas un attribut inhérent au modèle, mais est co-construite par le modèle, l'utilisateur et le produit. Les évaluations pré-déploiement ne peuvent pas capturer cela, vous devez le mesurer dans une utilisation réelle.

Anthropic a officiellement déclaré :

L'ingénierie logicielle représente environ 50 % du volume d'appels aux outils d'Agent sur notre API, mais nous voyons aussi émerger d'autres industries. Alors que les frontières entre risque et autonomie continuent de s'étendre, la surveillance post-déploiement devient cruciale. Nous encourageons les autres développeurs de modèles à étendre cette recherche.

Les chiffres au niveau de la sécurité sont rassurants : 73 % des appels d'outils ont un humain dans la boucle, et seulement 0,8 % des opérations sont irréversibles. Les scénarios de déploiement à plus haut risque – comme les fuites de clés API ou les transactions cryptographiques autonomes – sont surtout des évaluations de sécurité, et non des environnements de production réels.

"Les exigences réglementaires qui prescrivent des modes d'interaction spécifiques – par exemple exiger l'approbation humaine de chaque opération – ne font que créer des frictions, sans nécessairement apporter de gains de sécurité."

Les politiques imposant "d'approuver chaque opération" tuent les gains de productivité sans augmenter la sécurité. Un meilleur objectif est de s'assurer que les humains peuvent surveiller et intervenir, plutôt que de prescrire des flux de travail d'approbation spécifiques.

Où se cachent les licornes

La carte est déjà tracée. L'ingénierie logicielle est déjà prise en charge. La santé, le droit, la finance, l'éducation, le service client, la logistique – 16 domaines verticaux, chacun avec une part de marché à un chiffre – attendent que quelqu'un intègre véritablement l'expertise sectorielle dans l'Agent.

300 licornes SaaS sont nées auparavant, les 300 prochaines licornes de l'IA verticale sont sur le point d'apparaître. Les fondateurs qui choisissent un domaine vertical, intègrent l'expertise sectorielle dans l'Agent, et comprennent comment piloter la gestion du changement, posséderont le marché des logiciels d'entreprise de la prochaine décennie.

Le modèle peut déjà travailler cinq heures, les utilisateurs ne le laissent travailler que 42 minutes. C'est le signal : nous en sommes encore aux tout débuts, il reste énormément de choses à construire, et dans d'innombrables endroits qui n'ont pas encore vu ne serait-ce qu'une minute d'intelligence en action.

Questions liées

QQuel est le principal domaine d'activité des agents d'IA selon les données d'Anthropic, et quelle est sa part ?

ALe génie logiciel est le principal domaine d'activité, représentant près de 50 % de toutes les utilisations d'outils par les agents d'IA.

QCombien de domaines verticaux sont mentionnés comme étant des marchés encore largement inexploités (zones bleues) pour les agents d'IA ?

A16 domaines verticaux, dont la santé, le droit, la finance et l'éducation, sont mentionnés comme des marchés encore largement inexploités, chacun représentant moins de 5 % des appels d'outils.

QQuelle est la durée maximale pendant laquelle le modèle Claude peut fonctionner de manière autonome selon l'évaluation des capacités, et combien de temps les utilisateurs lui permettent-ils réellement de travailler en moyenne ?

ASelon l'évaluation des capacités, Claude peut résoudre des tâches nécessitant près de cinq heures de travail humain. Cependant, dans une utilisation réelle, la durée moyenne d'une session au 99,9e percentile n'est que d'environ 42 minutes.

QQuel pourcentage de nouvelles sessions d'utilisateurs sont automatiquement approuvées pour Claude Code, et comment ce pourcentage évolue-t-il avec l'expérience ?

A20 % des nouvelles sessions d'utilisateurs sont automatiquement approuvées. Après 750 sessions, ce pourcentage dépasse 40 %, car les utilisateurs expérimentés passent d'une approbation préalable à une surveillance active.

QQuel est le plus grand défi pour les startups qui souhaitent développer des agents d'IA verticaux, selon les observations d'Aaron Levie ?

ALe plus grand défi est de gérer le changement côté client, c'est-à-dire de naviguer dans les flux de travail spécifiques, les contraintes réglementaires et les résistances organisationnelles propres à chaque domaine vertical, comme la facturation médicale ou les découvertes juridiques.

Lectures associées

La réallocation de 750 milliards de dollars d'actifs à risque : Comment l'introduction en bourse de SpaceX va-t-elle impacter les marchés américains et le Bitcoin ?

Le géant spatial SpaceX a fait son entrée en bourse avec une introduction en Bourse (IPO) historique de 75 milliards de dollars, valorisant la société à environ 1 770 milliards de dollars. Cet événement majeur place simultanément sous les projecteurs le marché américain des actions, l'engouement pour l'IA, les cryptomonnaies et les flux de fonds indiciels. L'IPO, parmi les plus importantes de l'histoire, agit comme un puissant redirectionneur de capitaux, drainant potentiellement des liquidités d'autres actifs à risque comme les actions technologiques ou les cryptomonnaies. Bien que le Bitcoin soit resté stable autour de 63 300 $ lors de l'annonce, le marché des dérivés crypto a anticipé l'événement avec un trading actif sur les contrats futures perpétuels liés à SpaceX. L'article établit un parallèle avec l'introduction en bourse de Coinbase en 2021, qui avait coïncidé avec un sommet temporaire du marché crypto, suggérant qu'une telle maturité narrative peut parfois précéder une correction. Cependant, SpaceX apporte aussi une légitimation notable au Bitcoin. Son document S-1 révèle qu'elle détient environ 18 712 BTC d'une valeur de près de 1,2 milliard de dollars, intégrant ainsi la cryptomonnaie au bilan de l'une des sociétés technologiques les plus en vue au monde. Bien que ce montant représente une fraction minime de sa valorisation, il sert de référence pour l'adoption institutionnelle. En résumé, l'IPO de SpaceX présente un double tranchant pour les cryptomonnaies : à court terme, elle pourrait entraîner une compétition pour les capitaux au profit des actions liées à l'IA et à l'espace ; à plus long terme, elle renforce la narrative du Bitcoin en tant qu'actif de réserve pour les entreprises. Cet événement agit à la fois comme une pompe à liquidités et un sceau de légitimité.

链捕手Il y a 19 mins

La réallocation de 750 milliards de dollars d'actifs à risque : Comment l'introduction en bourse de SpaceX va-t-elle impacter les marchés américains et le Bitcoin ?

链捕手Il y a 19 mins

La Loi de Tao (τ) propulse l'EDA sur le devant de la scène

Loi de Tao (τ) : Un nouveau principe chinois fait monter l’EDA sur le devant de la scène Le 25 mai 2026, lors de l'IEEE ISCAS, Huawei a présenté la "Loi de Tao (τ)", un nouveau principe directeur pour l'industrie des semi-conducteurs. Contrairement à la Loi de Moore axée sur la miniaturisation géométrique, la loi τ prône la "miniaturisation temporelle". Elle vise à optimiser la constante de temps τ à tous les niveaux (composant, circuit, puce, système) pour améliorer les performances de traitement de l'information, indépendamment du nœud de fabrication. Ce changement de paradigme replace l'EDA au cœur de la conception. Pour soutenir la loi τ, les outils EDA doivent évoluer au-delà des flux 2D traditionnels. Trois exigences majeures émergent : 1. **Conception 3D native et optimisation multiniveau** : Les flux "pseudo-3D" actuels sont insuffisants. Une véritable conception 3D, permettant une répartition flexible des cellules logiques à travers plusieurs puces (dies), est nécessaire pour des techniques comme le "Logic Folding". 2. **Optimisation STCO (System Technology Co-Optimization)** : Avec la coexistence des technologies Chiplet, 3DIC et Logic Folding, une approche systémique unifiée est cruciale pour optimiser conjointement l'architecture logique, la disposition physique, l'intégrité du signal et de l'alimentation, ainsi que les contraintes thermiques et mécaniques. 3. **Analyse couplée multi-physique** : L'analyse thermique, électrique et mécanique ne peut plus être menée de manière isolée dans les systèmes 3D empilés, nécessitant des outils de simulation intégrés. Ces défis représentent une opportunité pour les éditeurs d'EDA chinois, comme Huada Jiutian, qui a déjà développé une plateforme de vérification physique 3DIC complète, ou l'Université de Pékin, dont un prototype d'outil "vrai 3D" montre des améliorations significatives (réduction de 30% de la longueur des interconnexions, baisse de la température). La loi τ pourrait ainsi catalyser la transition de l'EDA chinois d'une collection d'outils ponctuels vers une base logicielle industrielle complète et intégrée, capable de répondre aux exigences de la miniaturisation temporelle.

marsbitIl y a 1 h

La Loi de Tao (τ) propulse l'EDA sur le devant de la scène

marsbitIl y a 1 h

Ce n'est pas Jensen Huang qui veut changer le PC, c'est le PC qui va faire sa propre révolution

L'industrie du PC, vieille de 40 ans, est en pleine transformation. En juin 2026, NVIDIA a lancé le super-puce RTX Spark pour PC Windows, marquant son entrée sur le marché des processeurs centraux. Soutenu par Microsoft et les principaux fabricants de PC, cet événement a officialisé la redéfinition de l'AI PC. Lors du Build 2026, Microsoft a repositionné Windows comme "plateforme native pour les agents d'IA locaux" et a présenté le Surface RTX Spark Dev Box. Jensen Huang a souligné que l'IA redessine l'industrie du PC, transformant l'ordinateur d'un outil passif en un assistant d'IA autonome capable d'exécuter des tâches en arrière-plan. Pourtant, le concept d'AI PC a été initialement lancé par Intel début 2026 avec ses processeurs Core Ultra de 3ᵉ génération. Le marché voit également l'arrivée de Qualcomm, AMD et Apple, signalant une tendance claire : l'IA migre massivement vers les dispositifs de calcul personnels. L'article retrace l'essor historique du duopole Wintel (Microsoft-Intel) qui a dominé l'industrie pendant des décennies, reléguant NVIDIA au rôle de fournisseur de composants. Le tournant est survenu avec les puces M d'Apple et la définition des "Copilot+ PC" par Microsoft en 2024, exigeant une puissance NPU minimale. Cependant, le manque d'applications IA locales tangibles a initialement freiné l'adoption. La stratégie de NVIDIA repose sur son écosystème. Avec 6 millions de développeurs CUDA, l'entreprise possède un avantage considérable en matière de logiciels. Le RTX Spark, une SoC intégrant CPU ARM, cœurs CUDA et mémoire unifiée, vise à porter cet écosystème sur PC portable, permettant l'exécution locale de grands modèles de langage. Trois signaux majeurs se dégagent : 1) Le PC passe d'une architecture centrée sur le CPU à une architecture centrée sur une SoC IA. 2) Il évolue d'un outil opéré par l'humain vers une plateforme de collaboration avec des agents IA autonomes. 3) La base massive de développeurs CUDA de NVIDIA trouve un nouveau support matériel grand public. Le succès dépendra du prix final, de la maturité de l'écosystème logiciel Windows sur ARM et de l'émergence d'applications phares pour les agents IA locaux. En définitive, la révolution est moins menée par un acteur spécifique que par la trajectoire inévitable de la technologie IA cherchant à s'intégrer au PC. Intel, avec ses processeurs Panther Lake, suit la même direction. Microsoft, en adaptant Windows, conserve un rôle pivot. L'ère de l'AI PC est ouverte, et l'industrie du PC est en train de se réinventer.

marsbitIl y a 4 h

Ce n'est pas Jensen Huang qui veut changer le PC, c'est le PC qui va faire sa propre révolution

marsbitIl y a 4 h

Trading

Spot
Futures
活动图片