Alors que les attentes concernant son introduction en bourse s'intensifient, le rythme des lancements de modèles produits par Anthropic s'accélère également.
À l'instant même, Anthropic a annoncé coup sur coup deux nouvelles majeures : la première est la mise à niveau de son modèle phare vers Claude Opus 4.8, et la seconde est la finalisation d'un tour de table de série H de 650 milliards de dollars, portant sa valorisation post-investissement à 9 650 milliards de dollars, approchant ainsi le seuil du millier de milliards de dollars.
Pour une entreprise d'IA dont la valorisation approche déjà le millier de milliards de dollars, le marché n'attend plus seulement des scores de performance des modèles, mais s'interroge sur sa capacité à transformer l'intelligence, les outils, l'environnement de développement, les plateformes cloud et les ressources de calcul en une infrastructure délivrable à grande échelle.
En d'autres termes, Anthropic doit passer progressivement d'une entreprise qui livre de bons modèles à une entreprise qui tente de remodeler les méthodes de travail avec l'IA dans les entreprises.
Plus de contenu sans hausse de prix, Claude Opus 4.8 fait son entrée
Le Claude Opus 4.8 annoncé cette fois-ci est une mise à niveau de la série phare Opus d'Anthropic. À ce rythme de lancement de modèles, pour reprendre les propos d'internautes, il est fort probable que nous voyions Claude Opus 6 avant la sortie de GTA 6 (en novembre, si elle n'est pas reportée).
Anthropic affirme qu'Opus 4.8 est basé sur Opus 4.7, avec des améliorations dans le codage, les tâches d'agent, le raisonnement et le travail intellectuel, et qu'il est déjà ouvert aux utilisateurs, son prix standard d'utilisation restant inchangé, soit toujours 5 dollars par million de tokens d'entrée et 25 dollars par million de tokens de sortie.
Les développeurs peuvent également utiliser claude-opus-4-8 via l'API Claude.
Comparaison des prix API https://platform.claude.com/docs/en/about-claude/models/overview
D'après les informations officielles, les améliorations d'Opus 4.8 couvrent le codage, les capacités d'agent, les capacités de raisonnement et les tâches pratiques de travail intellectuel.
Anthropic a utilisé un tableau comparatif dans ses documents de lancement pour présenter les performances d'Opus 4.8 par rapport à la génération précédente Opus 4.7 et à d'autres modèles dans divers tests. Bien sûr, au-delà de la qualité des réponses ponctuelles, l'accent de la mise à niveau du modèle porte davantage sur ses performances dans les tâches longues et les collaborations complexes.
Dans les flux de travail réels, le modèle doit souvent traiter des tâches en plusieurs étapes consécutives, faire appel à des outils, vérifier les résultats intermédiaires et poursuivre en fonction des retours. Anthropic déclare que les testeurs précoces trouvent Opus 4.8 plus fiable et plus clair dans ses jugements lors de l'exécution de tâches d'agent.
L'amélioration de l'honnêteté d'Opus 4.8 est un point fort.
Un problème courant des modèles d'IA est de tirer des conclusions prématurées avec une confiance excessive lorsque les preuves sont insuffisantes, et d'affirmer avec assurance avoir déjà progressé. Anthropic affirme qu'Opus 4.8 est plus enclin à exprimer les incertitudes dans son travail et fait moins de jugements non étayés.
Les tâches de code illustrent particulièrement bien ce changement.
Les évaluations internes montrent que la probabilité qu'Opus 4.8 laisse passer sans les signaler des défauts dans son propre code est environ quatre fois moindre que celle de la génération précédente. En d'autres termes, le nouveau modèle est plus susceptible d'alerter l'utilisateur lorsqu'il détecte un risque, plutôt que de laisser le problème se manifester lors des tests ultérieurs ou en environnement de production.
En matière d'alignement et de sécurité, Anthropic poursuit son récit central. Le taux d'occurrence de comportements mal alignés tels que la tromperie ou la facilitation d'abus est nettement plus faible pour Opus 4.8 que pour Opus 4.7, et se rapproche de l'un des modèles actuels aux meilleures performances d'alignement, Claude Mythos Preview.
Sécurité, fiabilité, contrôlabilité restent un ensemble de mots-clés qu'Anthropic utilise pour se distinguer. À mesure que Claude s'intègre davantage dans les processus des entreprises, ces mots-clés commencent également à revêtir une plus grande signification commerciale.
Cependant, il est intéressant de noter qu'après la sortie d'Opus 4.8, des internautes ont constaté quelque chose d'anormal.
https://x.com/realNyarime/status/2060059543820963975
De nombreux tests d'internautes ont révélé que lorsqu'on interrogeait Opus 4.8 sur son identité de modèle, la réponse n'était pas toujours "Claude".
Parfois, il s'identifiait comme Qwen, d'autres fois il donnait le nom de DeepSeek, ce qui laisse suspecter un comportement de distillation.
Lorsque des internautes posaient la même question dans le client officiel Claude, ce type de réponse était généralement moins facile à reproduire. La raison en est probablement que les prompts système et les contraintes au niveau produit sont plus complets dans le client.
Les flux de travail dynamiques sont en ligne, Claude Code évolue vers la collaboration multi-agents
Plusieurs fonctionnalités produit et développeur ont été mises en ligne en même temps que Claude Opus 4.8.
Parmi elles, celle qui affecte le plus directement l'expérience utilisateur de Claude est le "effort control", c'est-à-dire le réglage de l'intensité de réflexion.
Ce contrôle se trouve à côté du sélecteur de modèle. Comme son nom l'indique, il permet à l'utilisateur de décider de la puissance de raisonnement que Claude consacrera à une tâche. À un niveau d'intensité plus élevé, Claude effectuera plus de raisonnements pour obtenir une meilleure qualité de réponse ; à un niveau plus faible, Claude répondra plus rapidement et la consommation du quota d'utilisation sera également plus lente.
Anthropic indique qu'Opus 4.8 utilise par défaut le "high effort". L'utilisateur peut également choisir "extra", qui correspond à "xhigh" dans Claude Code, ou choisir "max" pour que le modèle consacre plus de tokens. Anthropic recommande d'utiliser "extra" pour les tâches difficiles et les flux de travail asynchrones de longue durée.
Ce qui influence réellement la forme du produit Claude Code, ce sont les "dynamic workflows".
Cette fonctionnalité est actuellement en "research preview". Son objectif est de permettre à Claude Code de traiter des tâches à grande échelle qui nécessitaient auparavant des cycles d'ingénierie plus longs. Des travaux planifiés par trimestre pourraient désormais être réalisés en quelques jours.
Le mécanisme central des "dynamic workflows" est le suivant : Claude élabore dynamiquement des "orchestration scripts" en fonction de la tâche de l'utilisateur et exécute des dizaines à des centaines de "subagents" en parallèle au sein d'une même session. Le modèle planifie d'abord la tâche, puis la répartit entre plusieurs subagents, vérifie ensuite les résultats retournés, et enfin fait un rapport à l'utilisateur. Avec l'arrivée d'Opus 4.8, ces agents peuvent également fonctionner plus longtemps.
Cette fonctionnalité s'adresse principalement aux bases de code complexes, volumineuses ou avec un lourd héritage technique. Les scénarios typiques incluent la recherche de bugs à l'échelle d'un service complet, les audits d'optimisation des performances, les audits de sécurité, les migrations de grandes bases de code, le remplacement de frameworks, les migrations d'API obsolètes, les portages de langage, ainsi que la validation multi-angles de solutions critiques.
En termes d'utilisation, Anthropic recommande d'activer le mode automatique dans les "dynamic workflows". L'utilisateur peut directement demander à Claude de créer un workflow, ou ouvrir "ultracode" dans Claude Code. Ultracode définira l'intensité de réflexion sur "xhigh" et permettra à Claude de juger automatiquement si la tâche actuelle convient à l'utilisation d'un workflow.
Les "dynamic workflows" sont désormais disponibles dans Claude Code CLI, Desktop et l'extension VS Code, pour les formules Max, Team et Enterprise. Pour Enterprise, la fonction est désactivée par défaut lors de la sortie et nécessite que l'administrateur l'active dans les paramètres de Claude Code.
Cette fonctionnalité peut également être utilisée via l'API Claude, Amazon Bedrock, Vertex AI et Microsoft Foundry. Pour les utilisateurs Max, Team, et ceux utilisant Claude Code via l'API, les "dynamic workflows" sont activés par défaut.
Anthropic a illustré le potentiel maximal des "dynamic workflows" avec un cas de migration Bun. Jarred Sumner a utilisé cette fonctionnalité pour porter Bun de Zig à Rust, générant finalement environ 750 000 lignes de code Rust, avec un taux de réussite des suites de tests existantes de 99,8%, et un délai d'environ 11 jours entre le premier commit et la fusion.
Tout le processus de migration a été réalisé par plusieurs workflows : d'abord, mappage des champs de struct de la base de code Zig avec les "lifetime" Rust, puis génération de fichiers .rs cohérents en termes de comportement pour chaque fichier .zig, avec des centaines d'agents travaillant en parallèle, chaque fichier étant examiné par deux relecteurs. Ensuite, une boucle de correction a exécuté en continu les phases de construction et de tests jusqu'à ce que la compilation et les tests réussissent. Après la migration, un workflow nocturne a traité les problèmes de copie de données inutiles et a ouvert une "pull request" pour chaque type de problème, en vue de l'examen final.
Outre Claude Code, Anthropic a également mis à jour l'API Messages. Désormais, l'API Messages peut accepter des "system entries" dans le tableau des messages.
Les développeurs peuvent mettre à jour les instructions de Claude pendant l'exécution de la tâche, sans rompre le cache des prompts et sans avoir à transmettre la mise à jour via un tour utilisateur. Cette capacité peut être utilisée pour mettre à jour les autorisations, le budget de tokens ou le contexte environnemental d'un agent pendant son exécution.
Par la suite, Anthropic prévoit également de lancer une nouvelle catégorie de modèle plus intelligente qu'Opus. Oui, il s'agit de ce redoutable Claude Mythos Preview, prévu pour être mis à disposition de tous les clients dans les prochaines semaines.
À ce moment-là, nous en goûterons également les prémices.
Derrière une valorisation proche du millier de milliards de dollars, Claude a besoin d'une base de calcul plus grande
L'autre nouvelle annoncée le même jour que Claude Opus 4.8 est que Anthropic a finalisé un tour de table de série H de 650 milliards de dollars. Ce tour était mené par Altimeter Capital, Dragoneer, Greenoaks et Sequoia Capital, portant la valorisation post-investissement à 9 650 milliards de dollars.
Ce tour de financement comprenait également un investissement engagé préalable de 150 milliards de dollars de la part d'"hyperscalers", dont 50 milliards de dollars d'Amazon. Des partenaires stratégiques en infrastructure tels que Micron, Samsung, SK hynix se sont également joints. Anthropic affirme que ces entreprises jouent un rôle clé dans l'approvisionnement mondial en puces mémoire, stockage et logique, et peuvent l'aider à étendre ses capacités de calcul avec la croissance de la demande pour Claude.
L'expansion de la puissance de calcul est le contexte clé derrière ce tour de financement. Anthropic a dévoilé plusieurs accords d'infrastructure : un accord avec Amazon pour obtenir jusqu'à 5 gigawatts de capacité supplémentaire ; des accords avec Google et Broadcom pour obtenir 5 gigawatts de capacité de TPU de nouvelle génération ; et un accord avec SpaceX pour utiliser la capacité GPU de Colossus 1 et Colossus 2.
Anthropic souligne également que Claude est le premier modèle de pointe à être simultanément disponible sur les trois grandes plateformes cloud : AWS, Google Cloud et Microsoft Azure. Cependant, AWS reste le principal fournisseur de services cloud et partenaire d'entraînement d'Anthropic.
Derrière ce financement se cache en réalité un changement de positionnement commercial d'Anthropic. Les premières entreprises de grands modèles rivalisaient sur les capacités des modèles et l'expérience de conversation générale, tandis que désormais, les clients entreprises se soucient davantage de savoir si l'IA peut entrer dans les processus centraux, si elle peut traiter des tâches complexes, si elle peut être intégrée à l'environnement de développement, aux plateformes cloud et aux systèmes internes.
Claude Code, Cowork, effort control, dynamic workflows et la mise à jour de l'API Messages s'articulent tous autour de cette direction.
En considérant ensemble le lancement du produit et le financement, Anthropic est en train d'étendre simultanément trois types de capacités.
Premièrement, les capacités du modèle, Opus 4.8 améliore les performances en codage, raisonnement, tâches d'agent et travail intellectuel, et renforce l'expression des incertitudes.
Deuxièmement, les capacités de flux de travail, les dynamic workflows permettent à Claude Code de passer d'une assistance de codage ponctuelle à une exécution et révision d'ingénierie plus complexes.
Troisièmement, les capacités d'infrastructure, le financement de 650 milliards de dollars, les investissements engagés par les hyperscaleurs, l'arrivée de partenaires en mémoire et puces, ainsi que les accords de capacité de calcul avec Amazon, Google, Broadcom et SpaceX, fournissent les ressources nécessaires aux futurs besoins d'entraînement et d'inférence des modèles.
C'est également la logique centrale derrière la valorisation d'Anthropic approchant le millier de milliards de dollars. Claude n'est plus seulement une fenêtre de chat IA, mais devient progressivement un système de travail connectant les modèles, le code, les processus d'entreprise, les plateformes cloud et l'infrastructure de calcul.
Opus 4.8 est la dernière base de modèle de ce système, les dynamic workflows sont la forme produit pour les tâches d'ingénierie complexes, et le financement de 650 milliards de dollars ainsi que l'expansion de la puissance de calcul sont les conditions préalables pour continuer à pousser ce système vers une clientèle plus large.
La marée de l'IA a porté Anthropic au sommet de la vague. À cette hauteur, avancer signifie chevaucher le vent, reculer signifie couler et sombrer ; il n'y a pas de troisième posture.
Cet article provient du compte public WeChat "APPSO", auteur : APPSO, découvreur de produits de demain.
























