# Code Articles associés

Le Centre d'actualités HTX fournit les derniers articles et analyses approfondies sur "Code", couvrant les tendances du marché, les mises à jour des projets, les développements technologiques et les politiques réglementaires dans l'industrie crypto.

L'équipe NVIDIA permet à un Agent de programmation de prendre en charge des expériences robotiques réelles avec un taux de réussite de 99%

NVIDIA a dévoilé le projet ENPIRE, un système où des agents de programmation (Codex, Claude Code, Kimi Code) pilotent de manière autonome des recherches sur des robots physiques. Ce cadre repose sur quatre modules qui forment une boucle fermée : l'environnement, l'amélioration des stratégies, l'évaluation des déploiements et l'évolution par analyse des journaux. Les agents peuvent ainsi automatiser des tâches complexes comme serrer des attaches, ranger des épingles ou installer des GPU, en atteignant un taux de réussite de 99%. Une observation clé est qu'il est souvent plus facile de réinitialiser un environnement robotique que d'accomplir la tâche elle-même. Les agents commencent donc par créer des routines de réinitialisation automatique. L'équipe a constaté une "loi d'échelle physique" : augmenter le nombre de robots parallèles (par exemple, passer à 8) accélère considérablement la résolution des tâches. Le système fonctionne désormais toute la nuit sans intervention humaine. Deux nouvelles métriques sont proposées : le MRU (taux d'utilisation moyen des robots), souvent inférieur à 50%, et le MTU (taux d'utilisation moyen des tokens). Le projet, destiné à être open source, vise à permettre à quiconque de mettre en place un système similaire de recherche robotique autonome.

marsbitHier 00:38

L'équipe NVIDIA permet à un Agent de programmation de prendre en charge des expériences robotiques réelles avec un taux de réussite de 99%

marsbitHier 00:38

Urgent ! Anthropic appelle à un arrêt mondial de la recherche en IA

Anthropic tire la sonnette d'alarme dans un article détaillé, alertant sur l'accélération de l'auto-évolution de l'IA. L'entreprise révèle que plus de 80% de son code est désormais écrit par son modèle Claude, une proportion qui était négligeable avant le lancement de Claude Code. La productivité des ingénieurs a été multipliée par huit. Les capacités de Claude progressent à un rythme exponentiel : la durée des tâches logicielles qu'il peut accomplir de manière autonome double tous les quatre mois. Sa réussite sur des problèmes de programmation complexes est passée de 26% à 76% en six mois. Claude est désormais utilisé pour la relecture de code, interceptant des boges avant leur déploiement. Dans la recherche, Claude dépasse les humains, optimisant du code 52 fois plus vite et menant des expériences d'alignement de l'IA avec une efficacité bien supérieure. Anthropic identifie trois futurs possibles : une stagnation des capacités, une accélération avec contrôle humain maintenu, ou une amélioration récursive autonome (RSI), où l'IA conçoit ses successeurs, offrant des bénéfices immenses mais aussi des risques d'emballement et de perte de contrôle. Face à cette tendance, Anthropic appelle à une réflexion collective sur la gouvernance et propose une pause dans la recherche si un mécanisme de vérification mutuelle entre laboratoires peut être établi. Cette mise en garde fait écho à des préoccupations similaires récemment exprimées par OpenAI, suggérant que le "point de singularité" pourrait arriver plus vite que prévu.

marsbit06/05 00:31

Urgent ! Anthropic appelle à un arrêt mondial de la recherche en IA

marsbit06/05 00:31

Source interne : DeepSeek met en place une équipe 'Harness' pour concurrencer Claude Code

D'après des sources proches, DeepSeek constituerait une nouvelle équipe "Harness" afin de développer un produit d'agent d'intelligence pour le code, en visant directement Claude Code d'Anthropic. Cette initiative est confirmée par Chen Deli, chercheur principal de DeepSeek. Le recrutement concerne deux postes clés : Chef de produit Harness et Ingénieur R&D Harness, basés à Pékin. L'objectif avancé est de combler l'écart entre les capacités du modèle et les flux de travail réels des développeurs. DeepSeek définit sa vision par la formule : Modèle + Harnais = Agent. Le harnais représente la couche système essentielle permettant au modèle d'agir dans un environnement réel, en gérant le contexte, les appels d'outils, l'exécution, etc. L'article souligne que la concurrence dans le domaine de la programmation IA évolue des simples capacités des modèles vers la maîtrise de l'intégration dans le flux de travail des développeurs. La popularité de Claude Code et d'un projet communautaire appelé DeepSeek-TUI (un agent de codage en terminal) démontre à la fois la maturité perçue des modèles DeepSeek et le besoin d'une solution officielle et intégrée. En lançant son propre projet Harness, DeepSeek cherche à capitaliser sur ses atouts : un accès direct à l'équipe des modèles, la capacité de créer une boucle de rétroaction entre les produits et l'entraînement des modèles, et un contrôle total sur l'expérience développeur. Il s'agit pour la société de passer d'un fournisseur de modèles puissants à un créateur d'agents opérationnels, "en donnant des mains à ses modèles".

链捕手05/22 02:21

Source interne : DeepSeek met en place une équipe 'Harness' pour concurrencer Claude Code

链捕手05/22 02:21

Test pratique de Hunyuan Hy3 preview : L'IA de Tencent est-elle enfin compétitive ?

Le modèle de langage Hy3 preview de Tencent, récemment lancé en open source, présente des capacités améliorées en raisonnement complexe, génération de code, compréhension contextuelle et interaction naturelle. Avec 295 milliards de paramètres et une prise en charge de contexte jusqu'à 256K, il est présenté comme le modèle le plus performant de la série Hunyuan. Les tests montrent des forces dans le raisonnement logique structuré et l'extraction d'informations en contexte bruité, mais une certaine instabilité face aux pièges logiques ou aux questions ambiguës. En génération de code et en tant qu'agent intelligent (via WorkBuddy), il excède dans les tâches simples et fermées (comme créer un jeu Snake) mais peine à mener à bien des missions complexes nécessitant une analyse approfondie et une livraison complète de résultats. Ses progrès les plus notables concernent le dialogue naturel et l'écriture créative, où il produit des textes fluides, moins stéréotypés et mieux contextualisés, imitant même des styles littéraires spécifiques avec succès. Bien que Hy3 preview ne soit pas révolutionnaire dans tous les domaines, il se positionne comme un modèle pratique et polyvalent. Son lancement marque un virage important pour Tencent, qui cherche à rattraper son retard perçu dans la course à l'IA et à intégrer un modèle performant dans son écosystème de produits (QQ, Tencent Docs, etc.). Une version plus grande est attendue prochainement.

marsbit04/26 07:25

Test pratique de Hunyuan Hy3 preview : L'IA de Tencent est-elle enfin compétitive ?

marsbit04/26 07:25

活动图片