# Claude Fable5 Articles associés

Le Centre d'actualités HTX fournit les derniers articles et analyses approfondies sur "Claude Fable5", couvrant les tendances du marché, les mises à jour des projets, les développements technologiques et les politiques réglementaires dans l'industrie crypto.

“Le Dernier Examen des Agents”, Fable 5 de Claude est vaincu par GPT 5.5

Une nouvelle évaluation de référence, baptisée « Agents’ Last Exam » (ALE), a été publiée par UC Berkeley pour tester les capacités pratiques des IA agentes dans des environnements logiciels réels (comme Siemens NX, Unreal Engine, Adobe After Effects). Les résultats sont surprenants : dans la catégorie la plus difficile, les modèles de pointe comme Claude Fable 5 et GPT 5.5 ont obtenu un score de zéro. Dans les tâches de difficulté moindre, GPT 5.5 a surpassé Claude Fable 5, avec un taux de réussite de 24,0% contre 22,0%. Cette performance contraste avec les précédents benchmarks où Fable 5 dominait. De plus, Fable 5 s’est révélé beaucoup plus coûteux (2315 USD) et plus lent que GPT 5.5 (566 USD). L’ALE se distingue en évaluant la capacité à accomplir des tâches concrètes dans 55 domaines professionnels, via une interface graphique complète, et non par de simples questions-réponses. Les réponses sont notées automatiquement, sans jugement humain, et la majorité des tâches restent confidentielles pour éviter le « bourrage » des modèles. Les observations montrent que les agents échouent souvent en déclarant prématurément une tâche terminée sans vérifier le résultat. De plus, il est suggéré que Claude pourrait avoir été pénalisé dans certains domaines sensibles en raison de mécanismes de sécurité internes. En somme, ce benchmark révèle un écart important entre les performances académiques des IA et leurs compétences pratiques, remettant en question les prédictions sur un remplacement imminent des travailleurs humains par des agents autonomes.

marsbitIl y a 5 h

“Le Dernier Examen des Agents”, Fable 5 de Claude est vaincu par GPT 5.5

marsbitIl y a 5 h

活动图片