L'ancien élève de Tsinghua, Wang Guan, né dans les années 2000, présente une nouvelle création : Un modèle de pré-entraînement Transformer révolutionné avec 1/900 des tokens et 1/432 de la puissance de calcul

marsbitPublié le 2026-05-26Dernière mise à jour le 2026-05-26

Résumé

Des chercheurs dirigés par Wang Guan, alumni de Tsinghua, ont proposé HRM-Text, un modèle de pré-entraînement de langage efficace reposant sur un modèle récurrent hiérarchique (HRM) qui remplace le Transformer standard. Leur approche utilise une architecture à double échelle temporelle (modules lent H et rapide L) permettant des mises à jour récursives multiples par token, augmentant ainsi la profondeur de calcul sans ajouter de paramètres. L'objectif d'entraînement est également revu : au lieu d'un pré-entraînement autorégressif standard, le modèle est entraîné directement sur des paires instruction-réponse, avec une perte calculée uniquement sur la réponse et un masque PrefixLM. Les résultats sont remarquables en termes d'efficacité. Avec seulement 1 milliard de paramètres et 40 milliards de tokens uniques, pour un coût estimé à environ 1500 dollars, HRM-Text atteint des performances comparables à des modèles open source de 2B à 7B paramètres sur des benchmarks comme MMLU (60,7%), ARC-C (81,9%) et GSM8K (84,5%). Cela représente une réduction d'un facteur allant jusqu'à 900x des tokens d'entraînement et 432x de l'estimation de calcul par rapport aux modèles de référence. Les expériences montrent que HRM-Text surpasse des Transformers de taille similaire dans des conditions de FLOPs alignées, que l'objectif "tâche à accomplir" et le masque PrefixLM améliorent les performances, et que la structure récursive confère une profondeur effective plus importante. Les limites actu...

Remettant en question le paradigme traditionnel du pré-entraînement des grands modèles, l'ancien élève de Tsinghua Wang Guan et son équipe présentent une nouvelle réalisation :

Ils ont remplacé le Transformer standard par un modèle récurrent hiérarchique (HRM), proposant un pré-entraînement efficace HRM-Text qui dépasse la simple loi de mise à l'échelle (Scaling).

Lien de l'article : https://arxiv.org/abs/2605.20613

En utilisant environ 100 à 900 fois moins de tokens d'entraînement et une estimation de puissance de calcul 96 à 432 fois inférieure à celle du modèle de référence standard, HRM-Text parvient tout de même à offrir des performances comparables à des modèles open source de 2B à 7B de paramètres.

Par ailleurs, avec seulement 1 milliard de paramètres, 40 milliards de tokens non répétitifs, et un coût d'entraînement d'environ 1500 dollars, HRM-Text obtient les résultats suivants sur les benchmarks principaux : MMLU 60.7 %, ARC-C 81.9 %, DROP 82.2 %, GSM8K 84.5 %, MATH 56.2 %.

Figure | Efficacité du pré-entraînement.

Sur cette base, ils affirment clairement : Un biais structurel et des objectifs d'entraînement ciblés peuvent significativement abaisser le seuil du pré-entraînement. Ce schéma d'entraînement pourrait rendre viable l'entraînement de modèles de base à partir de zéro.

Comment HRM-Text est-il conçu ?

Le pré-entraînement des grands modèles de langage (LLM) dépend de plus en plus d'un petit nombre d'organisations disposant de ressources suffisantes en calcul et en données. Entraîner un modèle de base compétitif nécessite souvent des milliers de milliards de tokens, des milliers de GPU, voire un investissement en puissance de calcul de plusieurs millions de dollars.

Cependant, le mode d'entraînement actuel n'est pas efficace. Une grande partie des calculs est consommée par des tokens sans rapport comme les prompts (consignes), le remplissage de format ou le bruit des pages web, ce qui fait que beaucoup de puissance d'entraînement ne sert pas directement à l'inférence.

Dans ce travail, l'équipe de recherche a repensé l'architecture et les objectifs d'entraînement pour rendre le pré-entraînement de HRM-Text relativement plus efficace.

Architecture : Adoption d'un modèle récurrent hiérarchique à double échelle de temps, divisant les calculs en un module lent (H) et un module rapide (L). Alors qu'un Transformer standard effectue une seule passe avant par token, le HRM effectue des mises à jour récursives multiples sur le même token. Les modules H et L ne représentent chacun qu'environ la moitié des paramètres du noyau récurrent. Globalement, la quantité de calcul équivaut approximativement à dérouler récursivement le même ensemble de paramètres 4 fois, augmentant ainsi la profondeur de calcul sans accroître le nombre de paramètres.

Objectif d'entraînement : Abandon de l'approche standard de pré-entraînement autorégressif sur le texte complet. L'entraînement se fait directement sur des paires (instruction, réponse), en calculant la perte uniquement sur la partie réponse, et en utilisant un masque PrefixLM pour permettre une attention bidirectionnelle sur la partie instruction et une génération sous masque causal sur la partie réponse.

Figure | Architecture de HRM-Text.

Pour améliorer la stabilité de l'entraînement récursif, l'équipe de recherche a introduit MagicNorm et Warmup Deep Credit Assignment.

MagicNorm est une stratégie de normalisation hybride qui exploite l'asymétrie entre les profondeurs des calculs avant et arrière dans le contexte d'une rétropropagation du gradient tronquée (Truncated BPTT). Elle utilise PreNorm à l'intérieur des modules et ajoute une normalisation supplémentaire à la sortie des modules, améliorant ainsi la stabilité de l'entraînement récursif profond.

Warmup Deep Credit Assignment ne rétropropage le gradient que sur les deux dernières étapes récursives en début d'entraînement, puis étend linéairement ce nombre jusqu'aux 5 dernières étapes. Ce mécanisme d'entraînement permet au modèle de converger de manière stable sur des chemins de crédit courts, avant d'introduire progressivement des dépendances plus longues.

Quels sont les résultats ?

Les résultats expérimentaux montrent que HRM-Text présente des avantages significatifs en termes d'efficacité architecturale, d'objectifs d'entraînement et de performance globale.

1. L'architecture récurrente est-elle plus efficace pour une puissance de calcul d'entraînement fixe ?

Les résultats montrent qu'à FLOPs équivalents, HRM 1B surpasse Transformer 1B, Transformer 3B, Looped Transformer 1B et RINS 1B sur la plupart des benchmarks ; la comparaison avec TRM indique également que l'entraînement de HRM est plus stable.

Figure | Comparaison des performances et de la stabilité avec les modèles Transformer. Le HRM maintient une dynamique d'entraînement stable à toutes les échelles, tandis que les modèles Transformer présentent une instabilité sévère à l'échelle du milliard de paramètres. De plus, à l'échelle 0,6B, le HRM n'a besoin que de 2 fois moins de calculs que les modèles Transformer pour obtenir des performances compétitives sur la plupart des benchmarks.

2. L'objectif de tâche et PrefixLM sont-ils bénéfiques ?

Une étude d'ablation montre qu'à FLOPs équivalents, pour un Transformer 1B, le score MMLU passe de 40,55 avec l'autorégressif standard, à 47,72 après l'introduction de l'objectif de tâche, puis à 53,15 après l'ajout de PrefixLM, et enfin à 60,73 après le passage à l'architecture HRM.

Figure | Comparaison des performances entre différentes architectures de modèle et objectifs d'entraînement.

3. Quelle est l'efficacité de HRM-Text par rapport aux modèles open contemporains ?

HRM-Text 1B obtient respectivement 60,7, 81,9, 82,2, 84,5 et 56,2 sur MMLU, ARC-C, DROP, GSM8K et MATH. Comparé aux modèles ouverts qui ont généralement des budgets d'entraînement bien plus importants, il atteint la plage de performance des modèles open source de 2B à 7B en utilisant seulement 40 milliards de tokens uniques et 1 milliard de paramètres ; l'entraînement nécessite jusqu'à 900 fois moins de tokens et jusqu'à 432 fois moins de puissance de calcul.

Figure | Résultats de l'évaluation de HRM-Text 1B comparé aux modèles entièrement open source et aux modèles à poids ouverts de la même période.

4. La structure récurrente confère-t-elle une plus grande profondeur effective ?

Les résultats montrent que les Transformer standard et Looped Transformer se stabilisent à des couches relativement peu profondes, tandis que le HRM maintient des changements de représentation plus marqués entre blocs, une similarité cosinus plus faible et une valeur KL du logit lens plus élevée à des couches plus profondes.

Figure | Analyse de la profondeur effective.

Figure | Analyse Logit Lens KL couche par couche.

Limites et perspectives futures

Bien que HRM-Text montre des performances solides sur les tâches nécessitant de la déduction, cette approche présente encore des limites et ouvre des pistes de recherche futures.

1. Vers un découplage entre « connaissance » et « raisonnement »

Actuellement, une couverture plus large des connaissances factuelles dépend encore davantage de la taille du modèle et de l'étendue des données. HRM-Text n'est entraîné que sur 40 milliards de tokens uniques, et les sources de connaissances explicites ne constituent qu'une partie du mélange de données formatées en tâches. À l'avenir, les chercheurs devront concevoir séparément un noyau de raisonnement compact et un stockage externe de faits, en confiant l'étendue des connaissances à des corpus soigneusement sélectionnés, des modules d'augmentation par recherche ou une mémoire apprenable.

2. Temps de calcul adaptatif

L'ordonnancement récursif de HRM-Text apporte une plus grande profondeur série effective, mais cela signifie aussi que le modèle doit exécuter un nombre fixe d'étapes récursives lors de l'inférence. Une piste d'exploration future prometteuse serait l'introduction d'un mécanisme de temps de calcul adaptatif, permettant aux exemples simples de terminer le calcul plus tôt et de réserver le budget récursif complet aux exemples difficiles, réduisant ainsi le coût de l'inférence.

3. La validation de la mise à l'échelle reste encore limitée

Les expériences de scaling actuelles ne couvrent que le groupe de contrôle Transformer de 3B de paramètres et le HRM-Text de 1B. L'équipe de recherche indique que des travaux ultérieurs devront encore vérifier si l'avantage d'efficacité similaire peut être maintenu à des échelles de modèles plus grandes.

4. PrefixLM et les infrastructures d'inférence

Actuellement, PrefixLM fait toujours face à certaines limitations d'implémentation technique pour un déploiement réel. Bien qu'il puisse fonctionner sur des infrastructures d'inférence standard comme vLLM, cela nécessite que l'infrastructure prenne en charge des masques d'attention personnalisés pendant la phase de pré-remplissage (prefill). Pour l'étendre aux scénarios de conversation multi-tours, il faudra en outre concevoir un mécanisme de cache KV qui garantisse à la fois la visibilité bidirectionnelle à l'intérieur des segments de l'utilisateur et le respect des contraintes causales lors de la génération côté assistant.

Pour plus de détails techniques, consultez l'article original.

Cet article provient du compte WeChat officiel « Academic Headlines » (ID : SciTouTiao), auteur : Xia Qiansi

Questions liées

QQuels sont les principaux avantages du modèle HRM-Text par rapport à un Transformer standard, selon l'article ?

ASelon l'article, le modèle HRM-Text offre une efficacité bien supérieure en pré-entraînement. Il nécessite environ 100 à 900 fois moins de tokens d'entraînement et 96 à 432 fois moins de calcul estimé qu'un modèle de référence standard, tout en atteignant des performances comparables à des modèles open source de 2B à 7B paramètres. De plus, son coût d'entraînement est d'environ 1500 dollars.

QComment fonctionne l'architecture Hiérarchical Recurrent Model (HRM) décrite dans l'article ?

AL'architecture HRM utilise un modèle récurrent hiérarchique à deux échelles de temps, avec un module lent (H) et un module rapide (L). Contrairement au Transformer qui effectue une seule passe avant par token, le HRM effectue plusieurs mises à jour récursives sur le même token. Cela augmente la profondeur de calcul effective sans ajouter de paramètres, car les modules H et L représentent chacun la moitié des paramètres du cœur récursif, et le calcul global équivaut à déplier récursivement le même ensemble de paramètres environ 4 fois.

QQuel est l'objectif de formation non conventionnel adopté par HRM-Text, et en quoi diffère-t-il de l'approche standard ?

AHRM-Text n'utilise pas l'objectif standard de pré-entraînement autorégressif sur du texte complet. Au lieu de cela, il est directement formé sur des paires instruction-réponse, en calculant la perte uniquement sur la partie réponse. Il utilise également un masquage de type PrefixLM, permettant une attention bidirectionnelle sur la partie instruction tout en générant la réponse de manière causale (avec un masque causal).

QQuelles techniques ont été introduites pour améliorer la stabilité de l'entraînement récursif de HRM-Text ?

APour améliorer la stabilité de l'entraînement récursif profond, deux techniques principales ont été introduites : 1) MagicNorm, une stratégie de normalisation hybride qui utilise PreNorm à l'intérieur des modules et ajoute une normalisation supplémentaire à la sortie des modules. 2) Warmup Deep Credit Assignment, qui au début de l'entraînement ne rétropropage le gradient que sur les 2 dernières étapes récursives, puis étend progressivement cette rétropropagation jusqu'aux 5 dernières étapes.

QQuelles sont les principales limites et futures directions de recherche identifiées pour HRM-Text ?

AL'article identifie quatre limites et directions futures : 1) Découpler la 'connaissance' (nécessitant un large volume de données) du 'raisonnement' (le cœur compact du modèle), en utilisant par exemple des modules de mémoire externe ou de récupération. 2) Introduire un temps de calcul adaptatif pour réduire le coût d'inférence sur des échantillons simples. 3) Vérifier si les avantages en efficacité se maintiennent à des échelles de modèles plus grandes que 3B paramètres. 4) Surmonter les limitations d'implémentation du PrefixLM dans les cadres d'inférence, notamment pour les dialogues multi-tours avec mise en cache KV.

Lectures associées

Le BTC échoue à trois reprises à la barre des 80 000 $, tandis que le HYPE signale des records consécutifs | Analyse exclusive

**Analyse Hebdomadaire : BTC et HYPE** Le marché reste focalisé sur la lutte entre la zone de résistance clé du Bitcoin (78 500 - 79 500 USD) et son support majeur (73 500 - 75 000 USD). Sur le graphique journalier, le BTC évolue dans un canal haussier depuis février, mais le récent rejet depuis la borne supérieure augmente la probabilité d'un retest du support de la ligne médiane, voire de la borne inférieure. **Stratégies BTC :** * Pas de position à moyen terme actuellement. * En trading court terme (≤30% de capital), deux scénarios sont privilégiés : 1. **Vente sur résistance :** Si le prix bute sur 78 500-79 500 USD avec signaux de vente confirmés, entrée en short (stop-loss au-dessus de 80 600 USD). 2. **Vente sur rupture :** Si le support 73 500-75 000 USD cède avec confirmation, entrée en short (stop-loss au-dessus de 76 500 USD). **Analyse HYPE :** L'actif HYPE affiche une forte hausse depuis mi-mai. Cependant, les modèles internes ("Modèle de trading d'écart" et "Modèle d'énergie dynamique") signalent un épuisement de l'élan acheteur et un avertissement de sommet potentiel autour du niveau actuel ("Point final 45"). **Stratégie HYPE :** Éviter tout achat impulsif. Une opportunité d'achat à court terme (≤30% de capital) pourrait se présenter si le prix se stabilise après une correction vers la zone de support 47.5 - 50 USD, et ce uniquement si les modèles génèrent des signaux haussiers concordants. **Rappel sur la gestion des risques :** Un trade réussi sur BTC (+2.78%) illustre l'importance de la discipline. Toute position doit immédiatement être protégée par un stop-loss initial, déplacé ensuite pour sécuriser les bénéfices (à 1% et 2% de gain). *Disclaimer : Cette analyse technique ne constitue pas un conseil en investissement. Les marchés sont volatils. Investissez avec prudence.*

marsbitIl y a 21 mins

Le BTC échoue à trois reprises à la barre des 80 000 $, tandis que le HYPE signale des records consécutifs | Analyse exclusive

marsbitIl y a 21 mins

Le PDG de Notion : les entreprises d'IA devraient être des "groupes de jazz", et je suis un "Refonder"

Le PDG de Notion, Ivan Zhao, se décrit comme un "Refounder" ayant reconstruit l'entreprise à deux reprises, notamment en relançant une stratégie centrée sur l'IA en 2023 après une première refonte à Kyoto en 2015. Il présente une formule du talent : Talent = Capacité × Goût × Initiative, estimant que les capacités techniques (Capabilité) se dévalorisent avec l'IA, tandis que le Goût (sens esthétique et jugement) et l'Initiative (volonté d'agir) deviennent les véritables atouts rares. En conséquence, Notion recrute désormais davantage sur la base du potentiel et de l'initiative que de l'expérience passée. Il compare l'organisation idéale à un "orchestre de jazz" flexible et improvisateur, par opposition à un orchestre militaire rigide. Cette philosophie se traduit par une équipe d'ingénieurs en forme d'haltère (alliant juniors supervisés par des seniors experts), la suppression du poste de directeur marketing (CMO) pour une communication plus directe, et l'intégration de nombreux entrepreneurs pour renforcer l'autonomie. Enfin, Ivan Zhao affirme avoir abandonné la planification produit traditionnelle au-delà de quelques semaines, privilégiant une adaptation hebdomadaire aux évolutions technologiques rapides, tout en conservant une planification financière prudente. Il invite à repenser les processus de recrutement, la structure organisationnelle et la planification à l'aune de l'IA, soulignant que le travail du savoir, invention récente, est toujours perfectible.

marsbitIl y a 26 mins

Le PDG de Notion : les entreprises d'IA devraient être des "groupes de jazz", et je suis un "Refonder"

marsbitIl y a 26 mins

Trading

Spot
Futures

Articles tendance

Qu'est ce que $S$

Comprendre SPERO : Un aperçu complet Introduction à SPERO Alors que le paysage de l'innovation continue d'évoluer, l'émergence des technologies web3 et des projets de cryptomonnaie joue un rôle central dans la façon dont se dessine l'avenir numérique. Un projet qui a attiré l'attention dans ce domaine dynamique est SPERO, désigné comme SPERO,$$s$. Cet article vise à rassembler et à présenter des informations détaillées sur SPERO, afin d'aider les passionnés et les investisseurs à comprendre ses fondations, ses objectifs et ses innovations dans les domaines du web3 et de la crypto. Qu'est-ce que SPERO,$$s$ ? SPERO,$$s$ est un projet unique dans l'espace crypto qui cherche à tirer parti des principes de décentralisation et de la technologie blockchain pour créer un écosystème qui favorise l'engagement, l'utilité et l'inclusion financière. Le projet est conçu pour faciliter les interactions entre pairs de nouvelles manières, offrant aux utilisateurs des solutions et des services financiers innovants. Au cœur de SPERO,$$s$, l'objectif est d'autonomiser les individus en fournissant des outils et des plateformes qui améliorent l'expérience utilisateur dans l'espace des cryptomonnaies. Cela inclut la possibilité de méthodes de transaction plus flexibles, la promotion d'initiatives dirigées par la communauté et la création de voies pour des opportunités financières via des applications décentralisées (dApps). La vision sous-jacente de SPERO,$$s$ tourne autour de l'inclusivité, visant à combler les lacunes au sein de la finance traditionnelle tout en exploitant les avantages de la technologie blockchain. Qui est le créateur de SPERO,$$s$ ? L'identité du créateur de SPERO,$$s$ reste quelque peu obscure, car il existe peu de ressources publiques fournissant des informations détaillées sur son ou ses fondateurs. Ce manque de transparence peut découler de l'engagement du projet envers la décentralisation—une éthique que de nombreux projets web3 partagent, privilégiant les contributions collectives plutôt que la reconnaissance individuelle. En centrant les discussions autour de la communauté et de ses objectifs collectifs, SPERO,$$s$ incarne l'essence de l'autonomisation sans désigner des individus spécifiques. Ainsi, comprendre l'éthique et la mission de SPERO reste plus important que d'identifier un créateur unique. Qui sont les investisseurs de SPERO,$$s$ ? SPERO,$$s$ est soutenu par une diversité d'investisseurs allant des capital-risqueurs aux investisseurs providentiels dédiés à favoriser l'innovation dans le secteur crypto. L'objectif de ces investisseurs s'aligne généralement avec la mission de SPERO—priorisant les projets qui promettent des avancées technologiques sociétales, l'inclusivité financière et la gouvernance décentralisée. Ces fondations d'investisseurs s'intéressent généralement à des projets qui non seulement offrent des produits innovants, mais qui contribuent également positivement à la communauté blockchain et à ses écosystèmes. Le soutien de ces investisseurs renforce SPERO,$$s$ en tant que concurrent notable dans le domaine en rapide évolution des projets crypto. Comment fonctionne SPERO,$$s$ ? SPERO,$$s$ utilise un cadre multifacette qui le distingue des projets de cryptomonnaie conventionnels. Voici quelques-unes des caractéristiques clés qui soulignent son unicité et son innovation : Gouvernance décentralisée : SPERO,$$s$ intègre des modèles de gouvernance décentralisée, permettant aux utilisateurs de participer activement aux processus de décision concernant l'avenir du projet. Cette approche favorise un sentiment de propriété et de responsabilité parmi les membres de la communauté. Utilité du token : SPERO,$$s$ utilise son propre token de cryptomonnaie, conçu pour servir diverses fonctions au sein de l'écosystème. Ces tokens permettent des transactions, des récompenses et la facilitation des services offerts sur la plateforme, améliorant ainsi l'engagement et l'utilité globaux. Architecture en couches : L'architecture technique de SPERO,$$s$ supporte la modularité et l'évolutivité, permettant une intégration fluide de fonctionnalités et d'applications supplémentaires à mesure que le projet évolue. Cette adaptabilité est primordiale pour maintenir la pertinence dans le paysage crypto en constante évolution. Engagement communautaire : Le projet met l'accent sur des initiatives dirigées par la communauté, utilisant des mécanismes qui incitent à la collaboration et aux retours d'expérience. En cultivant une communauté forte, SPERO,$$s$ peut mieux répondre aux besoins des utilisateurs et s'adapter aux tendances du marché. Accent sur l'inclusion : En proposant des frais de transaction bas et des interfaces conviviales, SPERO,$$s$ vise à attirer une base d'utilisateurs diversifiée, y compris des individus qui n'ont peut-être pas engagé auparavant dans l'espace crypto. Cet engagement envers l'inclusion s'aligne avec sa mission globale d'autonomisation par l'accessibilité. Chronologie de SPERO,$$s$ Comprendre l'histoire d'un projet fournit des aperçus cruciaux sur sa trajectoire de développement et ses jalons. Voici une chronologie suggérée cartographiant les événements significatifs dans l'évolution de SPERO,$$s$ : Phase de conceptualisation et d'idéation : Les idées initiales formant la base de SPERO,$$s$ ont été conçues, s'alignant étroitement avec les principes de décentralisation et de concentration sur la communauté au sein de l'industrie blockchain. Lancement du livre blanc du projet : Suite à la phase conceptuelle, un livre blanc complet détaillant la vision, les objectifs et l'infrastructure technologique de SPERO,$$s$ a été publié pour susciter l'intérêt et les retours de la communauté. Construction de la communauté et engagements précoces : Des efforts de sensibilisation actifs ont été entrepris pour construire une communauté d'adopteurs précoces et d'investisseurs potentiels, facilitant les discussions autour des objectifs du projet et recueillant du soutien. Événement de génération de tokens : SPERO,$$s$ a organisé un événement de génération de tokens (TGE) pour distribuer ses tokens natifs aux premiers soutiens et établir une liquidité initiale au sein de l'écosystème. Lancement de la première dApp : La première application décentralisée (dApp) associée à SPERO,$$s$ a été mise en ligne, permettant aux utilisateurs d'interagir avec les fonctionnalités principales de la plateforme. Développement continu et partenariats : Des mises à jour et des améliorations continues des offres du projet, y compris des partenariats stratégiques avec d'autres acteurs de l'espace blockchain, ont façonné SPERO,$$s$ en un acteur compétitif et évolutif sur le marché crypto. Conclusion SPERO,$$s$ se dresse comme un témoignage du potentiel du web3 et de la cryptomonnaie pour révolutionner les systèmes financiers et autonomiser les individus. Avec un engagement envers la gouvernance décentralisée, l'engagement communautaire et des fonctionnalités conçues de manière innovante, il ouvre la voie vers un paysage financier plus inclusif. Comme pour tout investissement dans l'espace crypto en rapide évolution, les investisseurs et utilisateurs potentiels sont encouragés à mener des recherches approfondies et à s'engager de manière réfléchie avec les développements en cours au sein de SPERO,$$s$. Le projet illustre l'esprit d'innovation de l'industrie crypto, invitant à une exploration plus approfondie de ses nombreuses possibilités. Bien que le parcours de SPERO,$$s$ soit encore en cours, ses principes fondamentaux pourraient en effet influencer l'avenir de nos interactions avec la technologie, la finance et entre nous dans des écosystèmes numériques interconnectés.

101 vues totalesPublié le 2024.12.17Mis à jour le 2024.12.17

Qu'est ce que $S$

Qu'est ce que AGENT S

Agent S : L'avenir de l'interaction autonome dans Web3 Introduction Dans le paysage en constante évolution de Web3 et des cryptomonnaies, les innovations redéfinissent constamment la manière dont les individus interagissent avec les plateformes numériques. Un projet pionnier, Agent S, promet de révolutionner l'interaction homme-machine grâce à son cadre agentique ouvert. En ouvrant la voie à des interactions autonomes, Agent S vise à simplifier des tâches complexes, offrant des applications transformantes dans l'intelligence artificielle (IA). Cette exploration détaillée plongera dans les subtilités du projet, ses caractéristiques uniques et les implications pour le domaine des cryptomonnaies. Qu'est-ce qu'Agent S ? Agent S se présente comme un cadre agentique ouvert révolutionnaire, spécifiquement conçu pour relever trois défis fondamentaux dans l'automatisation des tâches informatiques : Acquisition de connaissances spécifiques au domaine : Le cadre apprend intelligemment à partir de diverses sources de connaissances externes et d'expériences internes. Cette approche double lui permet de construire un riche répertoire de connaissances spécifiques au domaine, améliorant ainsi sa performance dans l'exécution des tâches. Planification sur de longs horizons de tâches : Agent S utilise une planification hiérarchique augmentée par l'expérience, une approche stratégique qui facilite la décomposition et l'exécution efficaces de tâches complexes. Cette fonctionnalité améliore considérablement sa capacité à gérer plusieurs sous-tâches de manière efficace et efficiente. Gestion d'interfaces dynamiques et non uniformes : Le projet introduit l'Interface Agent-Ordinateur (ACI), une solution innovante qui améliore l'interaction entre les agents et les utilisateurs. En utilisant des Modèles de Langage Multimodaux de Grande Taille (MLLMs), Agent S peut naviguer et manipuler sans effort diverses interfaces graphiques. Grâce à ces fonctionnalités pionnières, Agent S fournit un cadre robuste qui aborde les complexités impliquées dans l'automatisation de l'interaction humaine avec les machines, préparant le terrain pour d'innombrables applications en IA et au-delà. Qui est le créateur d'Agent S ? Bien que le concept d'Agent S soit fondamentalement innovant, des informations spécifiques sur son créateur restent insaisissables. Le créateur est actuellement inconnu, ce qui souligne soit le stade naissant du projet, soit le choix stratégique de garder les membres fondateurs sous le radar. Quoi qu'il en soit, l'accent reste mis sur les capacités et le potentiel du cadre. Qui sont les investisseurs d'Agent S ? Étant donné qu'Agent S est relativement nouveau dans l'écosystème cryptographique, des informations détaillées concernant ses investisseurs et soutiens financiers ne sont pas explicitement documentées. Le manque d'aperçus publiquement disponibles sur les fondations d'investissement ou les organisations soutenant le projet soulève des questions sur sa structure de financement et sa feuille de route de développement. Comprendre le soutien est crucial pour évaluer la durabilité du projet et son impact potentiel sur le marché. Comment fonctionne Agent S ? Au cœur d'Agent S se trouve une technologie de pointe qui lui permet de fonctionner efficacement dans divers environnements. Son modèle opérationnel est construit autour de plusieurs caractéristiques clés : Interaction homme-ordinateur semblable à l'humain : Le cadre offre une planification IA avancée, s'efforçant de rendre les interactions avec les ordinateurs plus intuitives. En imitant le comportement humain dans l'exécution des tâches, il promet d'élever l'expérience utilisateur. Mémoire narrative : Utilisée pour tirer parti des expériences de haut niveau, Agent S utilise la mémoire narrative pour suivre les historiques de tâches, améliorant ainsi ses processus de prise de décision. Mémoire épisodique : Cette fonctionnalité fournit aux utilisateurs un accompagnement étape par étape, permettant au cadre d'offrir un soutien contextuel au fur et à mesure que les tâches se déroulent. Support pour OpenACI : Avec la capacité de fonctionner localement, Agent S permet aux utilisateurs de garder le contrôle sur leurs interactions et flux de travail, s'alignant avec l'éthique décentralisée de Web3. Intégration facile avec des API externes : Sa polyvalence et sa compatibilité avec diverses plateformes IA garantissent qu'Agent S peut s'intégrer sans effort dans des écosystèmes technologiques existants, en faisant un choix attrayant pour les développeurs et les organisations. Ces fonctionnalités contribuent collectivement à la position unique d'Agent S dans l'espace crypto, alors qu'il automatise des tâches complexes en plusieurs étapes avec un minimum d'intervention humaine. À mesure que le projet évolue, ses applications potentielles dans Web3 pourraient redéfinir la manière dont les interactions numériques se déroulent. Chronologie d'Agent S Le développement et les jalons d'Agent S peuvent être encapsulés dans une chronologie qui met en évidence ses événements significatifs : 27 septembre 2024 : Le concept d'Agent S a été lancé dans un document de recherche complet intitulé “Un cadre agentique ouvert qui utilise les ordinateurs comme un humain”, présentant les bases du projet. 10 octobre 2024 : Le document de recherche a été rendu publiquement disponible sur arXiv, offrant une exploration approfondie du cadre et de son évaluation de performance basée sur le benchmark OSWorld. 12 octobre 2024 : Une présentation vidéo a été publiée, fournissant un aperçu visuel des capacités et des caractéristiques d'Agent S, engageant davantage les utilisateurs et investisseurs potentiels. Ces jalons dans la chronologie illustrent non seulement les progrès d'Agent S, mais indiquent également son engagement envers la transparence et l'engagement communautaire. Points clés sur Agent S Alors que le cadre Agent S continue d'évoluer, plusieurs attributs clés se distinguent, soulignant sa nature innovante et son potentiel : Cadre innovant : Conçu pour offrir une utilisation intuitive des ordinateurs semblable à l'interaction humaine, Agent S propose une approche nouvelle de l'automatisation des tâches. Interaction autonome : La capacité d'interagir de manière autonome avec les ordinateurs via une interface graphique signifie un bond vers des solutions informatiques plus intelligentes et efficaces. Automatisation des tâches complexes : Avec sa méthodologie robuste, il peut automatiser des tâches complexes en plusieurs étapes, rendant les processus plus rapides et moins sujets aux erreurs. Amélioration continue : Les mécanismes d'apprentissage permettent à Agent S de s'améliorer grâce à ses expériences passées, améliorant continuellement sa performance et son efficacité. Polyvalence : Son adaptabilité à travers différents environnements d'exploitation comme OSWorld et WindowsAgentArena garantit qu'il peut servir un large éventail d'applications. Alors qu'Agent S se positionne dans le paysage Web3 et crypto, son potentiel à améliorer les capacités d'interaction et à automatiser les processus représente une avancée significative dans les technologies IA. Grâce à son cadre innovant, Agent S incarne l'avenir des interactions numériques, promettant une expérience plus fluide et efficace pour les utilisateurs à travers divers secteurs. Conclusion Agent S représente un saut audacieux en avant dans le mariage de l'IA et de Web3, avec la capacité de redéfinir notre interaction avec la technologie. Bien qu'il soit encore à ses débuts, les possibilités de son application sont vastes et convaincantes. Grâce à son cadre complet abordant des défis critiques, Agent S vise à mettre les interactions autonomes au premier plan de l'expérience numérique. À mesure que nous plongeons plus profondément dans les domaines des cryptomonnaies et de la décentralisation, des projets comme Agent S joueront sans aucun doute un rôle crucial dans la façon dont la technologie et la collaboration homme-machine évolueront à l'avenir.

799 vues totalesPublié le 2025.01.14Mis à jour le 2025.01.14

Qu'est ce que AGENT S

Comment acheter S

Bienvenue sur HTX.com ! Nous vous permettons d'acheter Sonic (S) de manière simple et pratique. Suivez notre guide étape par étape pour commencer votre parcours crypto.Étape 1 : Création de votre compte HTXUtilisez votre adresse e-mail ou votre numéro de téléphone pour ouvrir un compte sur HTX gratuitement. L'inscription se fait en toute simplicité et débloque toutes les fonctionnalités.Créer mon compteÉtape 2 : Choix du mode de paiement (rubrique Acheter des cryptosCarte de crédit/débit : utilisez votre carte Visa ou Mastercard pour acheter instantanément Sonic (S).Solde :utilisez les fonds du solde de votre compte HTX pour trader en toute simplicité.Prestataire tiers :pour accroître la commodité d'utilisation, nous avons ajouté des modes de paiement populaires tels que Google Pay et Apple Pay.P2P :tradez directement avec d'autres utilisateurs sur HTX.OTC (de gré à gré) : nous offrons des services personnalisés et des taux de change compétitifs aux traders.Étape 3 : stockage de vos Sonic (S)Après avoir acheté vos Sonic (S), stockez-les sur votre compte HTX. Vous pouvez également les envoyer ailleurs via un transfert sur la blockchain ou les utiliser pour trader d'autres cryptos.Étape 4 : tradez des Sonic (S)Tradez facilement Sonic (S) sur le marché Spot de HTX. Il vous suffit d'accéder à votre compte, de sélectionner la paire de trading, d'exécuter vos trades et de les suivre en temps réel. Nous offrons une expérience conviviale aux débutants comme aux traders chevronnés.

1.6k vues totalesPublié le 2025.01.15Mis à jour le 2025.03.21

Comment acheter S

Discussions

Bienvenue dans la Communauté HTX. Ici, vous pouvez vous tenir informé(e) des derniers développements de la plateforme et accéder à des analyses de marché professionnelles. Les opinions des utilisateurs sur le prix de S (S) sont présentées ci-dessous.

活动图片