# Référence Articles associés

Le Centre d'actualités HTX fournit les derniers articles et analyses approfondies sur "Référence", couvrant les tendances du marché, les mises à jour des projets, les développements technologiques et les politiques réglementaires dans l'industrie crypto.

Anthropic met en garde contre l’IA récursive, la nouvelle société de Tian Yuan Dong vient de franchir la « première étape »

Il y a quelques jours, Anthropic a publié un article intitulé "When AI Builds Itself", déclenchant des discussions sur l'« amélioration récursive de soi » – des systèmes d'IA conçus pour développer de manière autonome leurs versions successives. Simultanément, Recursive Superintelligence, une startup cofondée par Tianyuandong (ex-Meta FAIR), a émergé de son mode furtif et a présenté ses premiers résultats techniques : un système d'automatisation de la recherche en IA. Intitulé "First Steps Toward Automated AI Research", ce système vise à automatiser la boucle classique de la recherche (idée, code, expérience, analyse). Il a été évalué sur trois références, établissant de nouveaux records. Sur NanoChat Autoresearch, il a amélioré la perte de validation d'un petit modèle de langage. Sur NanoGPT Speedrun, il a réduit le temps d'entraînement nécessaire pour atteindre une perte cible (de 79,7 à 77,5 secondes). Enfin, sur SOL-ExecBench (optimisation de noyaux GPU), il a augmenté le score global de 0,699 à 0,754, se rapprochant de la limite théorique du matériel. Fondée fin 2025/début 2026, Recursive a levé 650 millions de dollars avec une valorisation de 4,65 milliards. Son objectif est d'accélérer les progrès de l'IA en permettant à l'IA d'améliorer récursivement ses propres capacités de recherche. Cette avancée illustre l'émergence d'un nouveau paradigme de recherche, tandis qu'Anthropic met en garde contre les risques potentiels de cette trajectoire et appelle à une coordination mondiale. Recursive reconnaît qu'il ne s'agit que d'un premier pas, les défis comme la prévention de la triche aux indicateurs restant majeurs pour une application à des problèmes scientifiques ouverts.

marsbitIl y a 7 h

Anthropic met en garde contre l’IA récursive, la nouvelle société de Tian Yuan Dong vient de franchir la « première étape »

marsbitIl y a 7 h

« Je n’ai plus besoin de meilleurs modèles » : les réactions contrastées face à l’IA sur un post Reddit viral

Anthropic a récemment lancé Claude Fable 5, son premier modèle de niveau Mythos accessible au public. Bien qu'il affiche des performances record sur le benchmark SWE-Bench Pro, dépassant largement ses prédécesseurs, la réaction des utilisateurs sur Reddit est mitigée. Un post populaire sur r/artificial, intitulé "Claude Fable m'a fait réaliser que je n'ai pas besoin d'un meilleur modèle", résume un sentiment répandu : la fatigue face aux nouvelles versions. De nombreux utilisateurs estiment que les modèles précédents comme Opus 4.8 sont déjà "suffisants" pour leurs besoins quotidiens, évoquant un rapport coût-bénéfice défavorable, le prix de Fable 5 étant presque le double. Le principal point de critique concerne les "garde-fous" de sécurité de Fable 5. Les utilisateurs se plaignent que le modèle refuse trop fréquemment des requêtes liées à la sécurité ou à la programmation, les renvoyant vers Opus, ce qui nuit à son utilité pratique, surtout pour les abonnés payants. Cependant, une minorité d'utilisateurs aux tâches complexes (simulations physiques, code à très long contexte) font l'éloge de Fable 5, décrivant une différence de capacité "nuit et jour" pour leurs projets exigeants. Le débat soulève une question plus large : un fossé se creuse-t-il entre les modèles de pointe accessibles au public et les versions encore plus puissantes réservées aux entreprises et gouvernements ? Alors que les benchmarks montrent une progression constante, la perception des utilisateurs suggère que pour la majorité, le "suffisamment bon" pourrait être déjà atteint, laissant les gains marginaux aux seuls cas d'usage extrêmes. L'avenir de Fable 5 dépendra des ajustements d'Anthropic sur la sécurité et de l'adoption par les utilisateurs spécialisés.

marsbitIl y a 8 h

« Je n’ai plus besoin de meilleurs modèles » : les réactions contrastées face à l’IA sur un post Reddit viral

marsbitIl y a 8 h

L'AGI n'est plus qu'à un pas de distance

En avril, Anthropic a dévoilé le modèle Mythos, capable d'identifier des milliers de vulnérabilités critiques, ce qui a secoué le secteur de la cybersécurité. Considéré trop dangereux pour être publié, il est resté confidentiel jusqu'à la mise en ligne récente de Fable 5, une version dotée de sécurités. La version non censurée, Mythos 5, n'est accessible qu'à environ 200 organismes strictement sélectionnés, comme la Maison Blanche. Les tests révèlent que Fable 5 surpasse largement ses concurrents (Claude Opus 4.8, GPT-5.5, Gemini 3.1 Pro) dans des benchmarks comme SWE-Bench Pro. Une démonstration avec Stripe a montré sa capacité à migrer 50 millions de lignes de code en un jour, démontrant une réelle « capacité d'agence à long terme ». Il ne s'agit plus d'un simple assistant réactif, mais d'un outil capable de planifier, d'exécuter et de corriger des tâches complexes de manière autonome. Selon les critères d'OpenAI, Fable 5 atteint le niveau 3 (Agent) et touche au niveau 4 (Innovateur). Le rythme des progrès laisse penser que le niveau 5 (Organisation, équivalent à l'AGI) pourrait être atteint d'ici 18 à 24 mois. Cette rapidité justifie les mesures de sécurité drastiques. Les rapports internes indiquent que Mythos 5 a atteint un niveau (CB-1) lui permettant théoriquement de guider la création d'armes biochimiques ou de générer des exploits pour des cyberattaques contre des infrastructures critiques. Pour le contenir, Anthropic a implémenté un mécanisme de « routage par rétrogradation silencieuse » (redirigeant les requêtes sensibles vers un modèle moins puissant) et une rétention obligatoire des données de 30 jours pour surveiller les abus. Anthropic facture Fable 5 à un prix élevé (10$/M de tokens en entrée, 50$/M en sortie), le rendant prohibitif pour les particuliers. Cette stratégie vise délibérément le marché B2B, où les entreprises sont prêtes à payer pour un gain de productivité radical et, surtout, pour une défense contre les cybermenaces avancées que seul un modèle comme Mythos 5 peut contrer. Ceci marque la fin de l'ère « gratuite » de l'IA grand public et consacre une division où la technologie la plus avancée devient un bien stratégique réservé aux applications commerciales et gouvernementales, accélérant potentiellement l'avènement des « entreprises à une personne » tout en posant des défis majeurs pour le marché du travail.

marsbitHier 05:15

L'AGI n'est plus qu'à un pas de distance

marsbitHier 05:15

De Hunyuan à l'IA de WeChat, le rythme lent de Tencent arrive au point de livraison

Le 8 juin 2026, la plateforme de développement WeChat a annoncé le lancement en bêta d'une nouvelle fonctionnalité nommée provisoirement "WeChat AI". Cet assistant IA intégré à l'écosystème WeChat permettra aux utilisateurs d'accéder et d'opérer directement des mini-programmes par conversation en langage naturel. Deux modes d'intégration sont proposés : un mode automatique où WeChat analyse le code source du mini-programme, et un mode développement pour une intégration plus personnalisée. Cette initiative représente une étape clé pour Tencent, qui cherche à intégrer ses capacités IA dans son application super-populaire. Ce déploiement s'appuie sur le modèle de langue Hunyuan de Tencent, classé deuxième en Chine pour ses capacités de base mais premier pour ses capacités applicatives et Agent. Ce choix reflète une stratégie délibérée de privilégier la stabilité et l'utilité pratique plutôt que la course aux paramètres, adaptée aux besoins d'un assistant qui exécutera des tâches critiques (commandes, paiements). L'écosystème des mini-programmes, avec 40 000 développeurs et un milliard d'utilisateurs actifs quotidiens, constitue un avantage unique pour WeChat AI. Le mode automatique vise à faciliter l'adoption massive par les petits développeurs. Cependant, cette approche soulève des questions sensibles : protection du code source, exposition des marques et répartition des flux, car l'IA pourrait "court-circuiter" l'interface des commerçants. Avant WeChat AI, l'application autonome Yuanbao a servi de test pour l'IA de Tencent. Elle a atteint plus de 114 millions d'utilisateurs mensuels pendant les fêtes du printemps 2026, mais son utilisation quotidienne a ensuite chuté, révélant les limites d'une application indépendante pour la fidélisation. L'intégration native dans WeChat vise à retenir les utilisateurs via des scénarios d'utilisation concrets. Pekka Ma, PDG de Tencent, a évoqué la vision de "homardiser" chaque mini-programme, les transformant en agents intelligents exécutant des tâches. Il a aussi reconnu la nécessité de concilier l'efficacité centralisée de l'IA avec la protection du trafic décentralisé des commerçants. Avec Hunyuan (couche technique), Yuanbao (validation produit) et WeChat AI (intégration finale), la feuille de route de Tencent est cohérente. Cependant, son impact réel dépendra de sa capacité à rassurer les développeurs sur la sécurité, à équilibrer les intérêts de l'écosystème et à garantir la fiabilité des opérations pour les utilisateurs. L'intégration dans WeChat marque un tournant dans la stratégie IA de Tencent, mais sa réussite reste à démontrer.

marsbit06/08 10:29

De Hunyuan à l'IA de WeChat, le rythme lent de Tencent arrive au point de livraison

marsbit06/08 10:29

Évaluation dépassant les 2000 milliards, révélant que Kimi a levé 13,6 milliards supplémentaires, accélérant son IPO à Hong Kong

L'entreprise chinoise d'IA Moon's Dark Side (Kimi), une licorne spécialisée dans les grands modèles de langage, serait en négociation pour un nouveau tour de table visant à lever jusqu'à 20 milliards de dollars (environ 136 milliards de RMB). Cette levée de fonds porterait sa valorisation à 300 milliards de dollars (environ 2035 milliards de RMB), soit une multiplication par six par rapport à sa valorisation de décembre dernier. Il s'agirait de sa troisième collecte de fonds en six mois, après une levée de 20 milliards de dollars le mois dernier. Au total, l'entreprise aurait levé plus de 376 milliards de RMB. Fondée en 2023 à Pékin, la société est derrière l'assistant intelligent Kimi. En avril, elle a lancé et open-sourcé son modèle phare Kimi K2.6, qui rivalise avec les principaux modèles internationaux selon plusieurs benchmarks. Début juin, elle a également commencé les tests bêta de "Kimi Work", un agent local destiné aux travailleurs du savoir. Sur le plan commercial, son chiffre d'affaires récurrent annuel (ARR) aurait déjà dépassé les 2 milliards de dollars en avril. Parallèlement, des rumeurs font état de préparatifs en vue d'une introduction en bourse à Hong Kong (IPO), reflétant une accélération générale des processus de capitalisation des leaders chinois des grands modèles. Ce mouvement s'inscrit dans un contexte mondial où des acteurs comme OpenAI et Anthropic enchaînent également les levées de fonds records et les projets d'IPO.

marsbit06/08 07:47

Évaluation dépassant les 2000 milliards, révélant que Kimi a levé 13,6 milliards supplémentaires, accélérant son IPO à Hong Kong

marsbit06/08 07:47

À l'instant, l'IA chinoise se hisse à la deuxième place mondiale en programmation, seul Claude la devance

Aujourd'hui, Qwen3.7-Max d'Alibaba a marqué 1541 points sur le Code Arena, se hissant à la quatrième place du classement mondial des modèles de programmation IA. Il surpasse désormais des modèles leaders comme GPT-5.5 et Gemini 3.5 Flash, et n'est devancé que par les versions Claude Opus 4.7 et 4.6. Ainsi, Alibaba est le seul constructeur chinois présent sur ce podium, occupant la deuxième place mondiale derrière Anthropic (Claude). Les tests pratiques confirment sa puissance. Lors d'un défi de création d'un jeu de course 3D en HTML, Qwen3.7-Max a livré un jeu fonctionnel dès le premier essai, incluant une page de démarrage et des effets sonores, là où d'autres modèles nécessitaient plusieurs corrections. Il excelle également en termes de rapport coût-performance. La force de Qwen3.7-Max réside dans sa conception en tant que "modèle de base pour agents", optimisé pour des exécutions autonomes de longue durée. Lors d'un test interne, il a exécuté une tâche de programmation pendant 35 heures, effectuant 1158 appels d'outils sans dégradation. Cette robustesse provient de deux avancées : un « environnement étendu » d'entraînement qui lui apprend des stratégies universelles, et un cadre « d'exécution autonome à long terme » pour un raisonnement et une adaptation soutenus. En s'imposant dans cette compétition longtemps dominée par Claude, Qwen3.7-Max démontre que l'innovation en IA de programmation n'est plus l'apanage exclusif de la Silicon Valley.

marsbit05/27 00:21

À l'instant, l'IA chinoise se hisse à la deuxième place mondiale en programmation, seul Claude la devance

marsbit05/27 00:21

L'ancien élève de Tsinghua, Wang Guan, né dans les années 2000, présente une nouvelle création : Un modèle de pré-entraînement Transformer révolutionné avec 1/900 des tokens et 1/432 de la puissance de calcul

Des chercheurs dirigés par Wang Guan, alumni de Tsinghua, ont proposé HRM-Text, un modèle de pré-entraînement de langage efficace reposant sur un modèle récurrent hiérarchique (HRM) qui remplace le Transformer standard. Leur approche utilise une architecture à double échelle temporelle (modules lent H et rapide L) permettant des mises à jour récursives multiples par token, augmentant ainsi la profondeur de calcul sans ajouter de paramètres. L'objectif d'entraînement est également revu : au lieu d'un pré-entraînement autorégressif standard, le modèle est entraîné directement sur des paires instruction-réponse, avec une perte calculée uniquement sur la réponse et un masque PrefixLM. Les résultats sont remarquables en termes d'efficacité. Avec seulement 1 milliard de paramètres et 40 milliards de tokens uniques, pour un coût estimé à environ 1500 dollars, HRM-Text atteint des performances comparables à des modèles open source de 2B à 7B paramètres sur des benchmarks comme MMLU (60,7%), ARC-C (81,9%) et GSM8K (84,5%). Cela représente une réduction d'un facteur allant jusqu'à 900x des tokens d'entraînement et 432x de l'estimation de calcul par rapport aux modèles de référence. Les expériences montrent que HRM-Text surpasse des Transformers de taille similaire dans des conditions de FLOPs alignées, que l'objectif "tâche à accomplir" et le masque PrefixLM améliorent les performances, et que la structure récursive confère une profondeur effective plus importante. Les limites actuelles incluent la couverture des connaissances factuelles, liée à la taille réduite des données, le besoin potentiel d'un temps de calcul adaptatif pour réduire les coûts d'inférence, et des questions d'ingénierie pour le déploiement de PrefixLM. Les travaux futurs exploreront le découplage connaissance/raisonnement et la validation à plus grande échelle.

marsbit05/26 03:20

L'ancien élève de Tsinghua, Wang Guan, né dans les années 2000, présente une nouvelle création : Un modèle de pré-entraînement Transformer révolutionné avec 1/900 des tokens et 1/432 de la puissance de calcul

marsbit05/26 03:20

Le paradoxe de l'automatisation : Plus l'IA est puissante, plus les humains sont occupés

La paradoxe de l'automatisation : plus l'IA est puissante, plus le travail humain augmente Contrairement aux craintes courantes, l'automatisation avancée par l'IA ne réduit pas le travail des experts, mais le transforme et l'intensifie. En rendant bon marché les compétences humaines passées (code, rédaction, design, support), l'IA génère une abondance de productions standardisées et similaires. Cette homogénéité crée une demande accrue pour ce qui est différent, pertinent et adapté au contexte spécifique du moment. Le vrai travail de l'expert se déplace ainsi : de l'exécution de tâches vers la conception de cadres, le jugement de qualité, la maintenance des systèmes et la définition du sens. Les ingénieurs conçoivent et supervisent plutôt qu'ils ne codent ; les éditeurs façonnent le propos et la structure plutôt qu'ils ne rédigent ; les agents de support construisent des systèmes automatisés plutôt qu'ils ne traitent chaque requête. Les tests de référence, bien qu'impressionnants, mesurent la performance de l'IA dans des cadres prédéfinis par des humains. Dès qu'un cadre est maîtrisé, de nouveaux, plus complexes, émergent. L'IA excelle à optimiser un objectif donné, mais elle manque de l'intentionnalité et du jugement contextuel d'un humain face à une situation présente et ouverte. L'avenir du travail intellectuel n'est pas le remplacement, mais la symbiose : l'IA prend en charge l'exécution scalable des capacités d'hier, tandis que les humains se concentrent sur le travail de cadrage, d'arbitrage et de création de valeur singulière dans l'instant. L'automatisation ne supprime pas l'expertise ; elle la rend plus cruciale, en l'amenant en amont du processus.

marsbit05/24 07:28

Le paradoxe de l'automatisation : Plus l'IA est puissante, plus les humains sont occupés

marsbit05/24 07:28

Gemini 3.5 est là ! Ce soir, Google se supplante lui-même

Lors du Google I/O 2026, Sundar Pichai et Demis Hassabis ont dévoilé une série d'avancées majeures en matière d'IA. Le modèle phare Gemini Omni a été présenté comme un système « omni » capable de générer et d'éditer des vidéos de haute qualité à partir de n'importe quelle combinaison de textes, images, audio ou vidéos, avec une compréhension cohérente de la physique et du monde. Parallèlement, Gemini 3.5 Flash a été annoncé, surpassant son prédécesseur 3.1 Pro dans la plupart des tests et offrant une vitesse jusqu'à quatre fois supérieure à celle des principaux concurrents. Il est optimisé pour le codage et les tâches d'agent. La plateforme de développement d'agents Antigravity a été mise à jour en version 2.0, devenant une application de bureau indépendante. Une démonstration a montré 93 agents créant un système d'exploitation fonctionnel en 12 heures. De plus, Gemini Spark, un agent personnel IA fonctionnant 24h/24 et 7j/7 dans le cloud, a été introduit. Il peut automatiser des workflows complexes en interagissant avec les outils Google comme Gmail, Docs et Sheets, et prendre en charge les commandes vocales. Ces annonces marquent une intégration poussée des capacités de compréhension et de génération multimodales avec des agents autonomes et persistants, représentant selon l'article un pas significatif vers une intelligence artificielle plus générale et autonome.

链捕手05/20 07:06

Gemini 3.5 est là ! Ce soir, Google se supplante lui-même

链捕手05/20 07:06

活动图片