Bouleversement, Claude 5 "Worker's Edition" débarque, accessible à tous

marsbitPublié le 2026-07-01Dernière mise à jour le 2026-07-01

Résumé

Claude Sonnet 5 (nom de code Fennec) vient de sortir et devient immédiatement le modèle par défaut pour tous les utilisateurs gratuits et Pro d'Anthropic. Décrit comme le modèle Sonnet le plus capable en tant qu'agent jamais créé, il rivalise désormais avec les performances du modèle phare Opus 4.8, à un coût bien inférieur. Ses performances sont impressionnantes dans plusieurs domaines clés : il atteint 63,2 % sur SWE-bench Pro (dépassant GPT-5.5), 57,4 % sur "Humanity's Last Exam" (à seulement 0,5 point d'Opus 4.8) et excelle dans l'utilisation d'outils comme le navigateur et le terminal. Son prix promotionnel est de 2$ (entrée) et 10$ (sortie) par million de tokens jusqu'au 31 août, passant ensuite à 3$ et 15$ — environ 60% du prix d'Opus 4.8. Fait notable, Sonnet 5 présente des améliorations majeures en matière de sécurité, avec un taux de réussite d'injection de prompt de seulement 0,19% et une défense exceptionnelle contre les injections navigateur (0,93%), surpassant même les modèles plus grands. Il comble ainsi l'écart entre les modèles milieu de gamme et les modèles phares, offrant une puissance proche d'Opus pour un prix de Sonnet. Pour de nombreux développeurs, il s'agit désormais de l'option la plus efficace et la plus abordable.

À l'instant, Claude Sonnet 5 est arrivé !

Nom de code Fennec, le fennec, le plus petit renard du désert du Sahara.

C'est le modèle Sonnet d'Anthropic à ce jour avec les capacités d'Agent les plus puissantes, et ses performances rivalisent avec le modèle phare Opus 4.8.

À partir d'aujourd'hui, Sonnet 5 devient le modèle par défaut pour tous les utilisateurs Free et Pro.

Il peut planifier de manière autonome, utiliser des outils de navigateur et de terminal.

Il y a seulement quelques mois, cela nécessitait encore un budget conséquent pour faire appel à des modèles surdimensionnés. Aujourd'hui, Sonnet s'en charge aisément.

Par rapport à la génération précédente Sonnet 4.6, les performances de Sonnet 5 ont considérablement progressé dans les tâches de raisonnement, d'utilisation d'outils, de programmation et de travail de connaissances.

Points clés :

Score SWE-bench Pro de 63,2 %, dépassant les 58,6 % de GPT-5.5 et légèrement inférieur aux 69,2 % d'Opus 4.8.

Score au « dernier examen de l'humanité » de 57,4 %, à seulement 0,5 point de pourcentage d'Opus 4.8.

Prix standard de 3 $ par million de tokens en entrée / 15 $ en sortie, soit seulement 60 % du prix d'Opus 4.8.

Taux de réussite d'injection navigateur défensif de 0,93 %, surpassant Mythos 5 et Opus 4.8.

Fait intéressant, Fable 5 a également été révélé le même jour comme devant bientôt faire son retour. Mais au prix d'une vérification d'identité obligatoire, et très probablement limité aux utilisateurs américains.

Alors que Sonnet 5 mise sur une accessibilité totale, les utilisateurs du monde entier peuvent dès aujourd'hui l'utiliser sans restriction.

Performance au niveau d'Opus 4.8 sur toute la ligne, l'IA travailleuse ultime débarque

Cette fois, le lancement soudain de Sonnet 5 comble aussi la déception de ceux qui n'ont pas accès à Fable 5.

Pour de nombreux développeurs, l'année zéro de l'ère des Agents a commencé avec Sonnet.

Claude Sonnet 3.5, 3.6, 3.7 ont été parmi les premiers modèles à démontrer des capacités étonnantes en écriture de code et en utilisation d'outils.

En d'autres termes, c'est la gamme Sonnet « taille moyenne » qui a été la première à faire fonctionner le concept de « laisser l'IA travailler seule ».

Mais cette dernière année, les bonds de capacités les plus spectaculaires se sont concentrés sur la ligne phare « grande taille » Opus. Sonnet s'est retrouvé directement distancé par le modèle phare.

La mission de Sonnet 5 : combler cet écart !

Anthropic le définit d'une phrase : Claude Sonnet 5 est le Sonnet le plus « productif » de l'histoire.

Les résultats pratiques le démontrent clairement.

Dans son domaine de prédilection traditionnel, la programmation, Sonnet 5 obtient un impressionnant 63,2 % sur SWE-bench Pro. L'ancienne génération Sonnet 4.6 n'atteignait que 58,1 %, tandis qu'Opus 4.8 garde une avance temporaire avec 69,2 %.

En comparaison, le concurrent historique OpenAI, avec son modèle phare GPT-5.5, n'obtient que 58,6 % sur le même classement, et Gemini 3.5 Flash de Google atteint 55,1 %.

Terminal-Bench 2.1 est encore plus impressionnant : Sonnet 5 bondit à 80,4 %, laissant loin derrière Sonnet 4.6 à 67,0 %, avec une hausse de 13 points de pourcentage. Il n'est plus qu'à moins de 2 points d'Opus 4.8 (82,7 %).

Sur le benchmark de raisonnement interdisciplinaire surnommé « le dernier examen de l'humanité » (Humanity's Last Exam), Sonnet 5 avec outils obtient 57,4 %, contre 57,9 % pour Opus 4.8, soit une différence de seulement 0,5 point. GPT-5.5 sur le même test n'atteint que 52,2 %, et Gemini 3.1 Pro, 51,4 %.

En termes de capacité à contrôler un ordinateur, Sonnet 5 sur OSWorld-Verified obtient 81,2 %, dépassant également les 78,7 % de GPT-5.5 et se rapprochant des 83,4 % d'Opus 4.8.

Plus surprenant encore, dans le travail de connaissances, Sonnet 5 obtient même un score de 1618 sur GDPval-AA v2, dépassant directement les 1615 d'Opus 4.8.

Dans les performances de recherche et d'utilisation d'outils pour agents intelligents, Sonnet 5 offre des capacités de niveau Opus 4.8 au coût le plus bas.

On peut dire que sur presque chaque benchmark, Sonnet 5 se situe dans l'intervalle de 90 % à 100 % des performances d'Opus 4.8.

C'est comme acheter 90 % du cerveau d'Opus pour le prix d'un Sonnet.

Promotion limitée à 2 dollars, mais avec un gros piège

Le prix est l'« arme fatale » cette fois-ci.

Concernant la tarification API, Anthropic propose une super promotion limitée dans le temps : 2 $ par million de tokens en entrée, 10 $ par million en sortie.

Après le 31 août, retour au prix d'origine de 3 $ et 15 $.

En comparaison, Opus 4.8 coûte 5 $ et 25 $, et GPT-5.5 version standard coûte 5 $ et 30 $.

Pendant la période promotionnelle, les prix d'entrée et de sortie ne représentent que 40 % de ceux d'Opus 4.8. Après retour au prix standard, ce sera environ 60 %.

Cependant, malgré une apparente sincérité, Anthropic cache de petits détails dans les spécificités.

La raison est que Sonnet 5 utilise un nouveau tokenizer, ce qui peut faire gonfler le nombre de tokens pour une même entrée d'un facteur de 1,0 à 1,35.

Une fois la période promotionnelle terminée, le prix d'origine de 3 $/15 $ combiné à l'effet de gonflement du tokenizer rendra certainement l'utilisation plus coûteuse, à budget égal, que l'utilisation de Sonnet 4.6.

Mais même ainsi, la différence par rapport à Opus reste écrasante.

Surpasse les modèles phares de toutes les familles

La fiche technique (System Card) révèle l'aspect le plus sous-estimé de Sonnet 5.

Taux de réussite des attaques par injection de prompt de 0,19 %, égal à celui d'Opus 4.8. GPT-5.5 est à 3,08 %, Gemini 3.5 Flash à 6,66 %.

En défense contre l'injection navigateur, le taux de réussite des attaques n'est que de 0,93 %, alors que Mythos 5 est à 29,7 % et Opus 4.8 à 31,5 %.

Un modèle milieu de gamme à 2 $ surclasse tous les modèles phares de la famille ; avec les mesures de protection activées, le taux tombe directement à 0 %.

En injection de code malveillant, le taux de réussite des attaques de Sonnet 4.6 était élevé à 45,26 %, celui de Sonnet 5 est tombé à 0,29 %, une amélioration de 150 fois.

Dans les tests d'exploitation de la vulnérabilité Firefox 147, Mythos 5 peut écrire 88,4 % d'exploits utilisables, Opus 4.8 en écrit 8,8 %, Sonnet 5 en écrit 0,0 %. Capable d'écrire un code métier de haut niveau, mais incapable d'écrire un programme d'exploitation de vulnérabilité utilisable.

Un effet secondaire est un score de comportement désaligné de 2,53 (sur 10), meilleur que les 2,89 de Sonnet 4.6, mais supérieur aux 2,10 d'Opus 4.8 et aux 1,95 de Mythos Preview.

Plus puissant, et aussi plus caractériel.

Pas pour la couronne, vise la taille moyenne

Sonnet 5 se positionne avec une précision extrême : ses performances vers le haut se rapprochent d'Opus 4.8 et GPT-5.5, et son prix vers le bas est proche de celui de Gemini 3.5 Flash.

OpenAI vient de doubler son prix par rapport à la génération précédente, et Anthropic riposte en abaissant le prix d'entrée de Sonnet 5 à 3 $.

Les développeurs qui hésitaient à payer pour un modèle phare ont maintenant une option alternative redoutable.

Tandis que tout le monde vise le sommet, Anthropic tire dans le ventre mou.

Les portefeuilles des développeurs ont déjà voté ce soir

Aujourd'hui, les performances de Sonnet 5 sont entrées dans l'intervalle des modèles phares, la plupart des tâches de correction de bugs, d'ajout de tests, de refactorisation peuvent être accomplies en une seule fois.

Le dilemme d'hier, trouver Opus trop cher à utiliser et Sonnet pas assez performant, a disparu aujourd'hui.

Le rapport qualité-prix est plus avantageux. Avec le même budget, on pouvait auparavant faire tourner un Agent de niveau Opus, maintenant on peut en faire tourner deux ou trois Sonnet en parallèle.

Le seuil de coût d'une architecture multi-agents a été considérablement abaissé d'un coup par Sonnet 5.

Le retour triomphal de Fable 5 reste une inconnue.

Mais Sonnet 5 est déjà solidement présent, ses performances poussant directement au seuil d'Opus.

Pour la grande majorité des développeurs, c'est le Claude le plus puissant et le plus pratique à portée de main pour les prochains jours, voire pour longtemps.

Références :

https://x.com/claudeai/status/2072017450611142835

https://www.anthropic.com/news/claude-sonnet-5

Cet article provient du compte WeChat public « New Zhiyuan », auteur : ASI Apocalypse

Questions liées

QQuels sont les principaux avantages de Claude Sonnet 5 par rapport à son prédécesseur, Sonnet 4.6 ?

AClaude Sonnet 5 présente des améliorations significatives dans le raisonnement, l'utilisation d'outils, la programmation et les tâches de travail intellectuel. Il surpasse Sonnet 4.6 sur des benchmarks comme SWE-bench Pro (63,2% contre 58,1%) et Terminal-Bench 2.1 (80,4% contre 67,0%). Il offre également une bien meilleure sécurité, avec un taux de réussite d'attaque par injection de code malveillant réduit à 0,29% contre 45,26% pour Sonnet 4.6.

QComment le prix de Sonnet 5 se compare-t-il à celui des modèles concurrents comme Opus 4.8 ou GPT-5.5 ?

APendant la promotion limitée (jusqu'au 31 août), Sonnet 5 coûte 2$/M de tokens en entrée et 10$/M en sortie. Après, le tarif standard sera de 3$ (entrée) et 15$ (sortie). C'est bien moins cher que Claude Opus 4.8 (5$/25$) et GPT-5.5 (5$/30$), offrant des performances proches d'Opus à un coût nettement inférieur. Même au tarif standard, il ne coûte que 60% du prix d'Opus.

QQuelles sont les performances de sécurité remarquables de Claude Sonnet 5 ?

ASonnet 5 excelle en sécurité : son taux de réussite contre les attaques par injection d'invite est de 0,19% (à égalité avec Opus 4.8), et il résiste remarquablement aux injections de navigateur avec seulement 0,93% de réussite d'attaque, surpassant même les modèles phares Mythos 5 (29,7%) et Opus 4.8 (31,5%). Contre les injections de code malveillant, son taux chute à 0,29%, soit une amélioration de 150x par rapport à Sonnet 4.6.

QQuel est le positionnement stratégique de Sonnet 5 sur le marché des modèles d'IA ?

ASonnet 5 se positionne stratégiquement dans le segment 'milieu de gamme premium'. Ses performances se rapprochent de celles des modèles phares comme Opus 4.8 et GPT-5.5, mais son prix se situe à un niveau bien inférieur, proche de celui des modèles plus abordables comme Gemini 3.5 Flash. Cette stratégie vise à conquérir les développeurs qui hésitaient à payer le prix fort pour un modèle phare, offrant un excellent rapport performance/prix et rendant les architectures multi-agents plus accessibles.

QQuelles capacités d'agent (Agent) sont mises en avant pour Claude Sonnet 5 ?

AClaude Sonnet 5 est présenté comme le modèle Sonnet ayant les capacités d'Agent les plus puissantes à ce jour. Il peut planifier de manière autonome et utiliser des outils comme un navigateur web et un terminal. Ces capacités, auparavant réservées à des modèles très coûteux, sont désormais accessibles avec Sonnet, notamment pour des tâches de programmation, de manipulation de systèmes (OSWorld-Verified : 81,2%) et de raisonnement complexe avec outils (Humanity's Last Exam : 57,4%).

Lectures associées

Le PDG de Circle, Allaire, affirme que les effets de réseau de l'USDC seront difficiles à reproduire pour l'Open USD

Le PDG de Circle, Jeremy Allaire, a défendu la position compétitive de l'USDC suite au lancement du consortium Open USD. Il soutient que le succès d'un stablecoin dépend des effets de réseau à long terme, et non des structures de frais ou des modèles de gouvernance partagée. Allaire souligne que près d'une décennie d'investissements de Circle en liquidités, en approbations réglementaires et en infrastructure pour développeurs a créé des avantages difficiles à reproduire pour les nouveaux entrants. Il affirme que l'écosystème USDC, renforcé par des outils comme le CCTP et des milliers d'intégrations, a traité environ 80% du volume transactionnel des stablecoins libellés en dollars au premier trimestre 2026. Le PDG remet en question les propositions clés d'Open USD, telles que la frappe et le rachat sans frais et la gouvernance par consortium, estimant que ces modèles peinent à innover. Il précise que le partenariat de Circle avec Coinbase reste solide et que de nombreux membres fondateurs d'Open USD continueront probablement à utiliser l'USDC. En conclusion, tout en critiquant certains aspects du modèle concurrent, Allaire souhaite la bienvenue à Open USD et réaffirme l'engagement de Circle à soutenir de multiples émetteurs via ses infrastructures.

ambcryptoIl y a 20 mins

Le PDG de Circle, Allaire, affirme que les effets de réseau de l'USDC seront difficiles à reproduire pour l'Open USD

ambcryptoIl y a 20 mins

Le prix du Dogecoin chute à ses plus bas niveaux de 2023 – Le DOGE peut-il tenir au-dessus de 0,067 $ ?

Le prix du Dogecoin (DOGE) a chuté sous le seuil de soutien de 0,07 $, atteignant 0,069 $, son plus bas niveau depuis octobre 2023, avant un léger rebond à 0,071 $. Cette baisse s'est accompagnée d'une augmentation de 32% du volume des échanges, à 819 millions de dollars, marquant une forte pression vendeuse sur le marché au comptant. L'analyse révèle une activité de vente agressive, avec un volume de vente dépassant largement le volume d'achat le 30 juin. Bien que des liquidations importantes de positions longues (plus de 5 millions de dollars) aient été enregistrées, les flux nets sur les marchés à terme sont récemment redevenus positifs sur des périodes de 12 heures, indiquant un nouvel afflux de capitaux. Cependant, l'indicateur RSI quotidien est tombé à 21, signalant un état de survente et une faiblesse persistante. Tant que les vendeurs dominent le marché au comptant, DOGE risque de ne pas pouvoir maintenir le niveau de 0,07 $ et pourrait chuter vers 0,067 $. Pour invalider cette perspective baissière, le memecoin aurait besoin de clôturer au-dessus des moyennes mobiles à court terme, situées autour de 0,074 $.

ambcryptoIl y a 50 mins

Le prix du Dogecoin chute à ses plus bas niveaux de 2023 – Le DOGE peut-il tenir au-dessus de 0,067 $ ?

ambcryptoIl y a 50 mins

L'ancienne équipe institutionnelle de la Fondation Ethereum lance Ethereum Institutional

L'ancienne équipe chargée des relations avec les entreprises au sein de la Fondation Ethereum lance Ethereum Institutional, une organisation à but non lucratif indépendante. Sa mission est d'accélérer l'adoption institutionnelle d'Ethereum, de ses réseaux de couche 2, de ses applications et de son écosystème élargi. Ethereum Institutional servira de point de contact neutre pour les institutions financières, leur offrant des conseils techniques, une veille écosystémique et un accompagnement. L'organisation met en avant la neutralité d'Ethereum comme un atout majeur, tout en soulignant le besoin d'une entité crédible et indépendante pour guider les acteurs traditionnels dans leurs décisions d'infrastructure liées à la tokenisation, aux stablecoins et à la finance sur chaîne. L'équipe fondatrice, qui avait développé la fonction "Entreprise" de la Fondation Ethereum, étend désormais ses activités de façon autonome autour de cinq axes : engagement institutionnel, renseignement institutionnel, marketing de l'écosystème Ethereum et de l'ETH, analyse des besoins du secteur, et organisation d'événements. Le lancement bénéficie du soutien de Bitmine, SharpLink et du co-fondateur d'Ethereum Joseph Lubin, parmi d'autres soutiens. Cette initiative fait suite à la récente restructuration de la Fondation Ethereum et à la création d'Ethlabs, reflétant une stratégie plus large de développement de l'écosystème via des organisations spécialisées et indépendantes.

ambcryptoIl y a 1 h

L'ancienne équipe institutionnelle de la Fondation Ethereum lance Ethereum Institutional

ambcryptoIl y a 1 h

La vente de 500 BTC par Riot Platforms est-elle un signal d'alerte précoce pour le Bitcoin au troisième trimestre ?

Le passage de l'extraction de Bitcoin (BTC) à l'IA apparaît comme un risque croissant à l'approche du troisième trimestre. Riot Platforms a récemment vendu environ 500 BTC, poursuivant une tendance : au dernier trimestre, la société a vendu plus de bitcoins qu'elle n'en a miné, réduisant ainsi ses réserves. Cette stratégie vise à financer sa diversification vers les centres de données et l'informatique liée à l'IA, utilisant le BTC comme réserve de trésorerie. Cette évolution intervient dans un contexte de pression accrue sur les mineurs, le coût de production estimé (environ 78 000 $) dépassant désormais le cours du spot (sous 58 000 $). Bien que le taux de hachage ait rebondi en juin, indiquant une activité réseau à court terme, la difficulté minière croissante devrait continuer à peser sur la rentabilité. Cela pourrait accélérer le virage stratégique des grands mineurs vers l'IA. La vente de Riot Platforms pourrait donc être un signe avant-coureur de cette tendance plus large pour le secteur minier au T3, où les réserves de Bitcoin seraient de plus en plus liquidées pour financer la diversification.

ambcryptoIl y a 1 h

La vente de 500 BTC par Riot Platforms est-elle un signal d'alerte précoce pour le Bitcoin au troisième trimestre ?

ambcryptoIl y a 1 h

« La plus grande mise à niveau depuis The Merge » ? Comment Glamsterdam va impacter Ethereum et les utilisateurs lambda ?

La prochaine mise à niveau majeure d'Ethereum, baptisée "Glamsterdam" (combinaison des mises à jour de consensus "Glas" et d'exécution "Amsterdam"), est prévue pour le second semestre 2026. Considérée comme la plus importante depuis "The Merge", elle vise à réformer en profondeur l'architecture du réseau principal (L1) pour en augmenter la capacité et l'efficacité, sans compromettre sa décentralisation. Trois changements principaux sont au cœur de cette mise à niveau : 1. **L'ePBS (Enshrined Proposer-Builder Separation)** : Intègre la séparation entre proposeurs et constructeurs de blocs directement dans le protocole, éliminant le besoin d'intermédiaires de confiance externes (Relays). Cela prolonge la fenêtre de traitement des blocs, permettant d'augmenter la limite de gaz (Gas Limit) et donc la taille des blocs. 2. **Les listes d'accès au niveau des blocs (Block-Level Access Lists - BALs)** : Fournissent une "carte" préalable des données d'état que les transactions d'un bloc vont lire ou modifier. Cela permet un traitement parallèle des transactions non conflictuelles et accélère la synchronisation des nœuds, ouvrant la voie à une exécution plus rapide. 3. **La reprix du gaz** : Introduit un modèle de tarification plus précis pour mieux refléter le coût réel des ressources, en distinguant le coût de calcul instantané du coût de stockage permanent des données d'état. Cela vise à contrôler l'expansion incontrôlée de l'état du réseau. **Impact pour les utilisateurs :** * **Frais de transaction** : Une capacité de bloc accrue devrait globalement réduire la congestion et stabiliser les frais, en particulier pour les transferts simples. Cependant, les opérations créant beaucoup de données d'état (comme le déploiement de contrats complexes) pourraient voir leurs coûts augmenter. * **Expérience utilisateur** : Les portefeuilles pourront estimer les frais de gaz avec plus de précision, réduisant les échecs de transaction. Les mouvements internes d'ETH seront plus faciles à tracer. * **Couche 2 (L2)** : La capacité accrue à traiter les "blobs" de données bénéficiera à long terme aux Rollups, pouvant stabiliser leurs coûts. * **Nœuds et décentralisation** : En optimisant les processus sous-jacents plutôt qu'en exigeant simplement plus de puissance de calcul, Glamsterdam cherche à augmenter le débit tout en préservant la possibilité pour des particuliers de faire tourner des nœuds. En résumé, Glamsterdam ne se contente pas d'augmenter la taille des blocs. Il restructure les fondations d'Ethereum pour permettre une future expansion durable du réseau principal, en équilibrant performances accrues et préservation des principes de décentralisation.

marsbitIl y a 3 h

« La plus grande mise à niveau depuis The Merge » ? Comment Glamsterdam va impacter Ethereum et les utilisateurs lambda ?

marsbitIl y a 3 h

Trading

Spot

Bouleversement, Claude 5 "Worker's Edition" débarque, accessible à tous

Résumé

Performance au niveau d'Opus 4.8 sur toute la ligne, l'IA travailleuse ultime débarque

Promotion limitée à 2 dollars, mais avec un gros piège

Surpasse les modèles phares de toutes les familles

Pas pour la couronne, vise la taille moyenne

Les portefeuilles des développeurs ont déjà voté ce soir

Questions liées

Lectures associées

Le PDG de Circle, Allaire, affirme que les effets de réseau de l'USDC seront difficiles à reproduire pour l'Open USD

Le prix du Dogecoin chute à ses plus bas niveaux de 2023 – Le DOGE peut-il tenir au-dessus de 0,067 $ ?

L'ancienne équipe institutionnelle de la Fondation Ethereum lance Ethereum Institutional

La vente de 500 BTC par Riot Platforms est-elle un signal d'alerte précoce pour le Bitcoin au troisième trimestre ?

« La plus grande mise à niveau depuis The Merge » ? Comment Glamsterdam va impacter Ethereum et les utilisateurs lambda ?

Trading

Catégories populaires

Tags tendances