Anthropic 数据：Les appels d'Agent IA sont concentrés à près de 50 % dans l'ingénierie logicielle, ces 16 domaines verticaux restent des marchés vierges

marsbitPublié le 2026-02-24Dernière mise à jour le 2026-02-24

Résumé

Une étude d'Anthropic révèle que près de 50% des appels aux outils d'IA Agent concernent le génie logiciel, tandis que 16 autres secteurs verticaux (santé, droit, finance, éducation, etc.) représentent chacun moins de 5% de l'activité. Ceci indique un immense potentiel inexploité pour environ 300 futures licornes des IA verticales. Bien que les modèles comme Claude puissent exécuter des tâches nécessitant près de 5 heures de travail humain, la durée médiane d’une session n’est que de 42 minutes, révélant un "déficit de confiance" qui constitue une opportunité commerciale cruciale. La confiance évolue avec l'usage : les nouveaux utilisateurs approuvent automatiquement 20% des sessions, contre plus de 40% après 750 interactions. Les utilisateurs expérimentés adoptent une surveillance proactive plutôt qu’un contrôle préalable. Les créateurs devront intégrer des données propriétaires, concevoir des workflows spécialisés et gérer le changement organisationnel pour réussir dans ces niches. La régulation devrait favoriser la supervision humaine sans imposer une approbation systématique qui freinerait la productivité.

Auteur : Garry's List

Compilation : Deep Tide TechFlow

Guide Deep Tide : Anthropic a récemment publié l'étude la plus complète à ce jour sur l'utilisation réelle des Agents IA. Le chiffre clé est : l'ingénierie logicielle représente près de 50 % du volume d'appels aux outils d'Agent, tandis que 16 domaines verticaux comme la santé, le droit, l'éducation, etc., réunis, représentent moins de la moitié du reste, chaque domaine ayant une part inférieure à 5 %.

Ce n'est pas un signal de saturation du marché, mais une carte vers 300 licornes de l'IA verticale – ce qui est encore plus précieux, c'est une découverte contre-intuitive citée dans l'article : le modèle peut déjà travailler de manière autonome pendant près de 5 heures, mais les utilisateurs ne lui laissent en réalité travailler que 42 minutes. Ce "déficit de confiance" est en soi la prochaine opportunité produit.

Texte intégral :

L'ingénierie logicielle représente près de 50 % de tous les appels aux outils d'Agent IA. Des domaines verticaux comme la santé, le droit, la finance, etc., sont presque intacts, chacun en dessous de 5 %. Cela signifie que 300 licornes de l'IA verticale attendent d'être construites.

Si je devais créer une entreprise aujourd'hui, je fixerais la zone rouge du graphique en barres ci-dessus jusqu'à voir mon avenir.

Aaron Levie, fondateur de Box, a déclaré :

Ce graphique est un bon rappel de l'ampleur des opportunités actuelles dans le domaine des Agents IA.

Il y aura bien sûr de nombreuses opportunités d'Agents horizontaux, mais tout autant de flux de travail nécessitent une expertise sectorielle profonde pour vraiment aider les utilisateurs à automatiser les processus uniques de leur domaine vertical.

Le modèle est : construire un logiciel d'Agent intégrant des données propriétaires, capable de relier efficacement l'utilisateur et l'Agent pour traiter les flux de travail, tout en ayant une capacité approfondie d'ingénierie contextuelle spécifique au domaine, ainsi qu'une capacité à piloter la gestion du changement côté client.

De nombreux domaines présentent encore d'énormes lacunes.

L'ingénierie logicielle occupe la moitié de toutes les activités d'Agent IA. L'autre moitié est dispersée dans 16 domaines verticaux, aucun ne dépassant 9 %. La santé représente 1 %, le droit 0,9 %, l'éducation 1,8 %. Ce ne sont pas des marchés saturés, ce sont des marchés qui n'existent presque pas.

Anthropic vient de publier l'étude la plus complète à ce jour sur l'utilisation réelle des Agents IA. La découverte principale est : l'ingénierie logicielle représente 49,7 % du volume d'appels aux outils d'Agent sur son API. La conclusion principale enfouie derrière est : tout le reste est un marché vierge.

Retard de déploiement

Une donnée devrait exciter les entrepreneurs : les capacités du modèle dépassent de loin ce que les utilisateurs sont prêts à lui faire confiance.

L'évaluation des capacités de METR montre que Claude peut résoudre des tâches qui nécessiteraient près de cinq heures à un humain. Mais en utilisation réelle, la durée de session au 99,9e centile n'est que d'environ 42 minutes. Cet écart – entre ce que l'IA peut faire et ce que nous lui permettons de faire – est une énorme opportunité.

Figure : La durée d'entraînement la plus longue de Claude Code a presque doublé en trois mois. Cela améliore non seulement les capacités, mais aussi la confiance.

Source :x.com

D'octobre 2025 à janvier 2026, la durée de session unique au 99,9e centile a presque doublé, passant de moins de 25 minutes à plus de 45 minutes. La croissance a été régulière entre les versions du modèle. Ce n'est pas seulement que le modèle devient plus fort, c'est que les utilisateurs apprennent au fil des utilisations, étendant progressivement leur confiance envers l'Agent.

"D'août à décembre, le taux de réussite de Claude Code sur les tâches les plus difficiles des utilisateurs internes a doublé, tandis que le nombre d'interventions humaines par session est passé de 5,4 à 3,3."

La capacité est déjà là, le déploiement n'a pas suivi. Ce n'est pas un problème, c'est une opportunité produit.

Comment la confiance évolue

20 % des nouveaux utilisateurs approuvent automatiquement les actions de Claude Code. Au bout de 750 sessions, plus de 40 % des sessions fonctionnent en mode d'approbation automatique complète. Mais il y a une découverte contre-intuitive : les utilisateurs expérimentés interviennent plus, pas moins. Les nouveaux utilisateurs interviennent sur 5 % des tours, les anciens utilisateurs sur 9 %.

Figure : La confiance est une compétence qui s'accumule continuellement. Les nouveaux utilisateurs approuvent automatiquement 20 % des sessions. Au bout de 750 sessions, ce pourcentage dépasse 40 %.

Image : Anthropic

Source: x.com

Ce n'est pas contradictoire, mais un changement de stratégie de supervision. Les débutants approuvent progressivement avant l'action, les anciens utilisateurs autorisent d'abord, puis interviennent en cas de problème – ils sont passés de l'approbation préalable à la surveillance active.

Voici une découverte notable au niveau de la sécurité : sur les tâches complexes, Claude Code demande activement des clarifications plus de deux fois plus souvent que les interventions humaines actives. L'Agent marque une pause pour confirmer, au lieu de foncer tête baissée. C'est une caractéristique, pas un défaut.

"La révélation centrale de cette étude est : l'autonomie exercée par l'Agent en pratique est co-construite par le modèle, l'utilisateur et le produit. Claude marque une pause pour poser des questions en cas d'incertitude, limitant ainsi son indépendance. Les utilisateurs bâtissent la confiance en collaborant avec le modèle et ajustent leur stratégie de supervision en conséquence."

L'approche de Levie pour l'IA verticale

Aaron Levie a pointé l'énorme richesse et valeur attendant d'être débloquées : construire un logiciel d'Agent intégrant des données propriétaires, lui faisant vraiment résoudre des problèmes et des personnes réelles, le bourrant de contexte pour maximiser la production intelligente, et – c'est la partie que la plupart des entrepreneurs ignorent – piloter la gestion du changement côté client.

Ce dernier point est précisément pourquoi l'IA verticale est si difficile à reproduire. N'importe qui peut créer un wrapper d'API, mais peu peuvent vraiment naviguer les flux de travail spécifiques, les contraintes réglementaires et les résistances organisationnelles propres à la facturation médicale, la découverte légale ou l'approbation de permis de construire.

Le SaaS a multiplié sa taille par dix chaque décennie au cours des dernières décennies. Plus de 40 % des fonds de capital-risque des 20 dernières années ont été dirigés vers des entreprises SaaS. Cette industrie a donné naissance à plus de 170 licornes SaaS. La logique est simple : chacune de ces licornes a une version d'IA verticale qui attend d'apparaître. Et la version IA pourrait être dix fois plus grande, car elle remplace non seulement le logiciel, mais aussi les opérateurs.

La nature de la co-construction

La découverte principale d'Anthropic mérite l'attention sérieuse de toute personne participant à l'élaboration des politiques d'IA. L'autonomie n'est pas un attribut inhérent au modèle, mais est co-construite par le modèle, l'utilisateur et le produit. Les évaluations pré-déploiement ne peuvent pas capturer cela, vous devez le mesurer dans une utilisation réelle.

Anthropic a officiellement déclaré :

L'ingénierie logicielle représente environ 50 % du volume d'appels aux outils d'Agent sur notre API, mais nous voyons aussi émerger d'autres industries. Alors que les frontières entre risque et autonomie continuent de s'étendre, la surveillance post-déploiement devient cruciale. Nous encourageons les autres développeurs de modèles à étendre cette recherche.

Les chiffres au niveau de la sécurité sont rassurants : 73 % des appels d'outils ont un humain dans la boucle, et seulement 0,8 % des opérations sont irréversibles. Les scénarios de déploiement à plus haut risque – comme les fuites de clés API ou les transactions cryptographiques autonomes – sont surtout des évaluations de sécurité, et non des environnements de production réels.

"Les exigences réglementaires qui prescrivent des modes d'interaction spécifiques – par exemple exiger l'approbation humaine de chaque opération – ne font que créer des frictions, sans nécessairement apporter de gains de sécurité."

Les politiques imposant "d'approuver chaque opération" tuent les gains de productivité sans augmenter la sécurité. Un meilleur objectif est de s'assurer que les humains peuvent surveiller et intervenir, plutôt que de prescrire des flux de travail d'approbation spécifiques.

Où se cachent les licornes

La carte est déjà tracée. L'ingénierie logicielle est déjà prise en charge. La santé, le droit, la finance, l'éducation, le service client, la logistique – 16 domaines verticaux, chacun avec une part de marché à un chiffre – attendent que quelqu'un intègre véritablement l'expertise sectorielle dans l'Agent.

300 licornes SaaS sont nées auparavant, les 300 prochaines licornes de l'IA verticale sont sur le point d'apparaître. Les fondateurs qui choisissent un domaine vertical, intègrent l'expertise sectorielle dans l'Agent, et comprennent comment piloter la gestion du changement, posséderont le marché des logiciels d'entreprise de la prochaine décennie.

Le modèle peut déjà travailler cinq heures, les utilisateurs ne le laissent travailler que 42 minutes. C'est le signal : nous en sommes encore aux tout débuts, il reste énormément de choses à construire, et dans d'innombrables endroits qui n'ont pas encore vu ne serait-ce qu'une minute d'intelligence en action.

Questions liées

QQuel est le principal domaine d'activité des agents d'IA selon les données d'Anthropic, et quelle est sa part ?

ALe génie logiciel est le principal domaine d'activité, représentant près de 50 % de toutes les utilisations d'outils par les agents d'IA.

QCombien de domaines verticaux sont mentionnés comme étant des marchés encore largement inexploités (zones bleues) pour les agents d'IA ?

A16 domaines verticaux, dont la santé, le droit, la finance et l'éducation, sont mentionnés comme des marchés encore largement inexploités, chacun représentant moins de 5 % des appels d'outils.

QQuelle est la durée maximale pendant laquelle le modèle Claude peut fonctionner de manière autonome selon l'évaluation des capacités, et combien de temps les utilisateurs lui permettent-ils réellement de travailler en moyenne ?

ASelon l'évaluation des capacités, Claude peut résoudre des tâches nécessitant près de cinq heures de travail humain. Cependant, dans une utilisation réelle, la durée moyenne d'une session au 99,9e percentile n'est que d'environ 42 minutes.

QQuel pourcentage de nouvelles sessions d'utilisateurs sont automatiquement approuvées pour Claude Code, et comment ce pourcentage évolue-t-il avec l'expérience ?

A20 % des nouvelles sessions d'utilisateurs sont automatiquement approuvées. Après 750 sessions, ce pourcentage dépasse 40 %, car les utilisateurs expérimentés passent d'une approbation préalable à une surveillance active.

QQuel est le plus grand défi pour les startups qui souhaitent développer des agents d'IA verticaux, selon les observations d'Aaron Levie ?

ALe plus grand défi est de gérer le changement côté client, c'est-à-dire de naviguer dans les flux de travail spécifiques, les contraintes réglementaires et les résistances organisationnelles propres à chaque domaine vertical, comme la facturation médicale ou les découvertes juridiques.

Lectures associées

Choc ! La prochaine IA d'OpenAI résout 10 problèmes du calibre de la Médaille Fields

**OpenAI provoque un séisme mathématique avec son nouveau modèle Astra** OpenAI a dévoilé des avancées mathématiques majeures réalisées par son modèle interne Astra, présenté par Sam Altman. L'IA aurait résolu ou fait progresser dix problèmes complexes dans des domaines variés comme la géométrie haute dimension, la théorie des groupes et la complexité quantique. Le résultat le plus marquant est la construction du premier groupe "non sofic" infini et finiment présenté, réfutant une conjecture de Mikhail Gromov vieille de 27 ans. Cette seule découverte est qualifiée de niveau "Prix Fields". Astra a également amélioré une borne fondamentale sur le problème de l'empilement des sphères en haute dimension, stagnant depuis 1978, et a réfuté la conjecture de rigidité d'Alain Connes en construisant une infinité de groupes non isomorphes partageant la même algèbre de von Neumann. Ces résultats, compilés dans un document de 249 pages, sont accompagnés de preuves formelles vérifiées par l'assistant Lean 4. OpenAI précise que le coût total de génération de ces démonstrations aurait été inférieur à 2000 dollars. La communauté mathématique réagit avec stupeur, certains experts y voyant un tournant historique où l'IA démontre une intuition et une capacité de raisonnement pouvant surpasser les meilleurs mathématiciens humains.

marsbitIl y a 25 mins

Choc ! La prochaine IA d'OpenAI résout 10 problèmes du calibre de la Médaille Fields

marsbitIl y a 25 mins

Comment se rendre impossible à remplacer par l'intelligence artificielle

Avec l'essor de l'IA, le vrai défi n'est pas la technologie elle-même, mais notre dépendance à un emploi traditionnel pour survivre. L'article propose de rompre avec cet « esclavage salarial » en devenant un individu autonome et « inemployable », capable de créer sa propre voie grâce à des compétences impossibles à automatiser. Pour réussir dans ce nouveau paradigme, cinq éléments clés sont essentiels : l'autonomie d'action, le goût, la persuasion, la persévérance et l'itération. Ces qualités s'acquièrent non par la théorie, mais en créant ses propres projets. L'auteur soutient que parmi les leviers disponibles, la création de contenu (médias) est plus cruciale que le code, car la valeur du contenu est subjective et nécessite un jugement humain affiné par l'expérience. Le chemin commence par une transformation profonde de son identité et de son environnement. Un exercice pratique en trois étapes est proposé pour trouver sa vocation : 1) Identifier ses connaissances uniques et passions naturelles, 2) Définir ses convictions contraires à la sagesse conventionnelle, 3) Publier immédiatement une première idée pour obtenir un retour réel du monde. L'objectif est de bâtir une œuvre de vie authentique, en utilisant les outils numériques et l'IA non comme une fin, mais comme un levier pour amplifier sa voix et son impact personnels.

marsbitIl y a 53 mins

Comment se rendre impossible à remplacer par l'intelligence artificielle

marsbitIl y a 53 mins

Grâce aux lancers de dés, les clés Bitcoin sont stockées hors ligne, mais tout le monde ne s'y mettra pas

Le titre « Les clés Bitcoin protégées par des dés, mais la méthode reste marginale » introduit un article sur la génération manuelle de graines de portefeuille Bitcoin à l'aide de dés. L'article explique le concept d'entropie, illustré par Claude Shannon, où un dé à six faces génère environ 2,585 bits d'incertitude. Il aborde le scandale récent de Coldcard, où une vulnérabilité du générateur de nombres aléatoires matériel a compromis des fonds. Les utilisateurs ayant généré leur phrase de récupération avec des dés (environ 99 lancers pour une haute sécurité) n'étaient pas affectés pour leur seed principal. Cependant, l'analyse du chercheur Kevin Loaec montre que d'autres fonctions du portefeuille (clés de copie, portefeuilles papier, mots de passe, etc.) utilisaient ce générateur défectueux et restaient vulnérables. L'article souligne les défis pratiques de la méthode des dés : elle est longue, sujette aux erreurs de saisie, et peu adaptée aux nouveaux utilisateurs qui pourraient mal l'exécuter. Il conclut que si cette méthode manuelle est robuste pour les experts, l'objectif à long terme est d'avoir un matériel et des logiciels générant une entropie fiable de manière simple et sécurisée. Il conseille aux propriétaires de Coldcard de vérifier leur firmware et les fonctions utilisées, et rappelle l'intérêt des solutions multi-signatures avec différents fabricants pour limiter les risques.

cryptonews.ruIl y a 4 h

Grâce aux lancers de dés, les clés Bitcoin sont stockées hors ligne, mais tout le monde ne s'y mettra pas

cryptonews.ruIl y a 4 h

Michael Saylor a déclaré qu'il était devenu impossible d'adopter une mise à jour de Bitcoin à laquelle il s'opposait !

Michael Saylor a expliqué qu'il était mathématiquement impossible que le BIP-110 atteigne le seuil de 55 % de soutien volontaire au cours du cycle actuel d'ajustement de la difficulté de minage de Bitcoin. Sur un total de 946 blocs générés jusqu'au bloc 960 561 pendant cette période, seuls 24 contenaient un signal de soutien au BIP-110 dans l'en-tête. Saylor affirme que tous ces signaux provenaient des mineurs DATUM via le pool de minage OCEAN, et qu'aucun soutien n'est venu de mineurs externes à OCEAN. Il conclut donc que le BIP-110 n'atteindra pas le niveau de consensus volontaire requis et que les signaux actuels ne représentent pas un consensus général des mineurs. Le BIP-110 est une proposition visant à restreindre l'ajout de données non financières (comme des images ou du texte) dans la blockchain Bitcoin, arguant que le réseau ne doit servir qu'aux transferts d'argent. Saylor s'y oppose, estimant que le réseau Bitcoin ne devrait pas décider quelles transactions sont légitimes et que les règles ne doivent pas changer selon les préférences de quelques-uns. Il souligne également que le niveau apparent de soutien pourrait être artificiellement gonflé par des processus de signalisation automatisés.

cryptonews.ruIl y a 4 h

Michael Saylor a déclaré qu'il était devenu impossible d'adopter une mise à jour de Bitcoin à laquelle il s'opposait !

cryptonews.ruIl y a 4 h

Le nombre de commentaires négatifs sur le Bitcoin atteint un niveau historique : qu'est-ce que cela signifie ?

L'entreprise d'analyse crypto Santiment a annoncé que le sentiment négatif envers le Bitcoin sur les réseaux sociaux a atteint un niveau historiquement élevé. Le ratio entre commentaires positifs et négatifs sur des plateformes comme X, Reddit et Telegram est au plus bas depuis le début de son système de surveillance moderne. La principale raison de cette inquiétude est une vulnérabilité découverte dans le firmware des portefeuilles matériels Coldcard, ébranlant la confiance dans le stockage personnel et les portefeuilles froids, pourtant perçus comme les méthodes les plus sûres. Santiment souligne que, contrairement aux crises passées (FTX, Mt. Gox, "Jeudi noir" COVID), les discussions se concentrent désormais sur la sécurité du matériel et des portefeuilles froids plutôt que sur les plateformes centralisées. Les données montrent seulement 0,58 commentaire positif pour chaque commentaire négatif, indiquant que la peur dépasse historiquement la cupidité. Bien que basé sur un seul jour, ce niveau de panique serait plus élevé que lors des pics de crainte liés à la guerre cette année ou des précédentes grandes crises crypto. *Ceci n'est pas un conseil en investissement.

cryptonews.ruIl y a 5 h

Le nombre de commentaires négatifs sur le Bitcoin atteint un niveau historique : qu'est-ce que cela signifie ?

cryptonews.ruIl y a 5 h

Trading

Spot

Anthropic 数据：Les appels d'Agent IA sont concentrés à près de 50 % dans l'ingénierie logicielle, ces 16 domaines verticaux restent des marchés vierges

Résumé

Texte intégral :

Retard de déploiement

Comment la confiance évolue

L'approche de Levie pour l'IA verticale

La nature de la co-construction

Où se cachent les licornes

Questions liées

Lectures associées

Choc ! La prochaine IA d'OpenAI résout 10 problèmes du calibre de la Médaille Fields

Comment se rendre impossible à remplacer par l'intelligence artificielle

Grâce aux lancers de dés, les clés Bitcoin sont stockées hors ligne, mais tout le monde ne s'y mettra pas

Michael Saylor a déclaré qu'il était devenu impossible d'adopter une mise à jour de Bitcoin à laquelle il s'opposait !

Le nombre de commentaires négatifs sur le Bitcoin atteint un niveau historique : qu'est-ce que cela signifie ?

Trading

Catégories populaires

Tags tendances