Tsinghua '00s Alumnus Wang Guan's New Work: Disrupting Transformer Pretraining Models with 1/900 Tokens, 1/432 Compute Power

marsbitPubblicato 2026-05-26Pubblicato ultima volta 2026-05-26

Introduzione

Tsinghua alumnus Wang Guan's team proposes HRM-Text, a novel pre-training paradigm using a Hierarchical Recurrent Model to replace standard Transformers. With just 1B parameters and 40B unique tokens trained at a cost of ~$1500, HRM-Text achieves performance comparable to 2B-7B open-source models, using up to 900x fewer tokens and 432x less estimated compute. Key innovations include a dual-timescale recurrent architecture for greater effective depth, a task-completion objective training only on answer tokens with PrefixLM masking, and techniques like MagicNorm and Warmup Deep Credit Assignment for stability. Evaluations show strong results on benchmarks like MMLU (60.7%) and GSM8K (84.5%). The work highlights how architectural priors and targeted objectives can lower pre-training barriers, though limitations include knowledge-reasoning coupling, fixed compute per token, and scalability beyond 3B parameters.

Breaking the traditional paradigm of large model pretraining, Tsinghua '00s alumnus Wang Guan's team has released a new work:

They used a Hierarchical Recurrent Model (HRM) to replace the standard Transformer, proposing HRM-Text, an efficient pretraining method that goes beyond Scaling.

Paper link: https://arxiv.org/abs/2605.20613

While using approximately 100-900x fewer training tokens and 96-432x less estimated compute compared to the standard baseline model, HRM-Text still achieved performance comparable to open-source models with 2B to 7B parameters.

Furthermore, using 1B parameters, 40B non-repeating tokens, and a training cost of about $1500, HRM-Text achieved the following scores on mainstream benchmarks: MMLU 60.7%, ARC-C 81.9%, DROP 82.2%, GSM8K 84.5%, MATH 56.2%.

Figure|Pretraining efficiency.

Based on this, they clearly propose: Structural priors and targeted training objectives can significantly lower the barrier to pretraining. This training approach makes training a foundational model from scratch feasible.

How is HRM-Text designed?

Large Language Model (LLM) pretraining is increasingly reliant on a few institutions with ample computing and data resources. Training a competitive foundational model often requires trillions of tokens, thousands of GPUs, and even tens of millions of dollars in compute investment.

However, the current training paradigm is inefficient. A large amount of computation is consumed on irrelevant tokens such as prompts, formatting padding, and web noise, resulting in a significant portion of training compute not directly serving inference.

In this work, the research team redesigned the architecture and training objective, making the pretraining of HRM-Text relatively more efficient.

Architecture: Employs a Hierarchical Recurrent Model with dual timescales, splitting computation into a slow H module and a fast L module. While a standard Transformer performs one forward pass per token, HRM performs multiple rounds of recursive updates on the same token. The H and L modules each account for only half of the recursive core parameters. The overall computational load is roughly equivalent to performing 4 recursive unrolls on the same set of parameters, increasing computational depth without adding more parameters.

Training Objective: Abandons the standard full-text autoregressive pretraining. Instead, training is performed directly on instruction-answer pairs, with loss calculated only on the answer part, combined with PrefixLM masking, allowing bidirectional attention on the instruction part and causal masked generation for the answer part.

Figure|HRM-Text architecture.

To enhance the stability of recursive training, the research team introduced MagicNorm and Warmup Deep Credit Assignment.

MagicNorm is a hybrid normalization strategy that leverages the asymmetry between forward and backward computation depths under Truncated Backpropagation Through Time (Truncated BPTT). It uses PreNorm internally within modules and adds an extra normalization layer at the module exit, thereby improving the stability of deep recursive training.

Warmup Deep Credit Assignment, on the other hand, only backpropagates gradients from the last 2 recursive steps during the initial training phase, then linearly extends to the last 5 steps. This training mechanism allows the model to converge stably on shorter credit assignment paths before gradually introducing longer dependencies.

How effective is it?

Experimental results show that HRM-Text demonstrates clear advantages in architecture efficiency, training objectives, and overall performance.

1. Under fixed training compute, is the recurrent architecture more effective?

Results show that under FLOPs-aligned conditions, HRM 1B outperforms Transformer 1B, Transformer 3B, Looped Transformer 1B, and RINS 1B on most benchmarks; comparison with TRM also indicates that HRM training is more stable.

Figure|Comparison of performance and stability with Transformer models. HRM maintained stable training dynamics across all scales, while Transformer models exhibited severe instability at the 1-billion-parameter scale. Furthermore, at the 0.6B scale, HRM achieved competitive performance on most benchmarks using only 2x less computation than Transformer models.

2. Does the task completion objective and PrefixLM help?

Ablation studies show that under FLOPs-aligned conditions, the MMLU score for a 1B Transformer increased from 40.55 with standard autoregressive training, to 47.72 after introducing the task completion objective, to 53.15 after adding PrefixLM, and finally to 60.73 after switching to the HRM architecture.

Figure|Performance comparison between different model architectures and training objectives

3. How does HRM-Text's efficiency compare to contemporary open models?

HRM-Text 1B achieved scores of 60.7, 81.9, 82.2, 84.5, and 56.2 on MMLU, ARC-C, DROP, GSM8K, and MATH respectively. Compared to open models that generally have larger training budgets, it entered the performance range of 2B to 7B open-source models using only 40B unique tokens and 1B parameters; training required up to 900x fewer tokens and up to 432x less compute.

Figure|Evaluation results of HRM-Text 1B compared with contemporary fully open-source models and open-weight models

4. Does the recurrent structure bring greater effective depth?

Results show that the standard Transformer and Looped Transformer stabilize at shallower depths, while HRM maintains more pronounced inter-block representation changes, lower cosine similarity, and higher logit lens KL values even at deeper layers.

Figure|Effective depth analysis.

Figure|Layer-wise Logit Lens KL analysis.

Limitations and Future Directions

Although HRM-Text demonstrates strong performance on inference-intensive tasks, this method still has limitations, and future research directions are proposed.

1. Towards Decoupling "Knowledge" and "Reasoning"

Currently, broader factual knowledge coverage still depends more on model scale and data breadth. HRM-Text was only trained on 40B unique tokens, and explicit knowledge sources constitute only part of the task-formatted mixed data. In the future, researchers need to design a compact reasoning core separately from external fact storage, delegating knowledge breadth to curated corpora, retrieval-augmented modules, or learnable memory.

2. Adaptive Computation Time

The recurrent scheduling of HRM-Text brings greater effective serial depth, but this also means the model must execute a fixed number of recursive steps during inference. A promising future direction is to introduce an adaptive computation time mechanism, allowing simple samples to stop computation earlier and reserving the full recursive budget for difficult samples, thereby reducing inference cost.

3. Current Scaling Validation Scope Remains Limited

The current scaling experiments only cover up to the 3B parameter Transformer control group and the 1B parameter HRM-Text. The research team states that it remains to be verified by subsequent work whether similar efficiency advantages can be maintained at larger model scales.

4. PrefixLM and Inference Frameworks

Currently, PrefixLM still faces certain engineering implementation constraints in practical deployment. Although it can run on standard text generation inference frameworks like vLLM, this requires the framework to support custom attention masks during the prefill stage. Extending it to multi-turn dialogue scenarios further requires designing a KV-cache mechanism that ensures bidirectional visibility within user segments while maintaining causal constraints for the assistant's generation process.

For more technical details, please refer to the original paper.

This article comes from the WeChat public account "Academic Headlines" (ID: SciTouTiao), author: Xia Qiansi

Domande pertinenti

QWhat is HRM-Text and how does it differ from the standard Transformer architecture for pre-training large language models?

AHRM-Text is an efficient pre-training model proposed by a Tsinghua University research team. It uses a Hierarchical Recurrent Model (HRM) instead of the standard Transformer. The key difference is that HRM employs a two-timescale hierarchical recurrence, where each token undergoes multiple recursive updates (via slow 'H' and fast 'L' modules), increasing computational depth without adding parameters. This contrasts with the Transformer's single forward pass per token.

QAccording to the article, what are the key efficiency claims of HRM-Text in terms of training tokens and computational cost?

AThe article claims HRM-Text achieves performance comparable to 2B to 7B parameter open-source models while using approximately 100-900 times fewer training tokens and 96-432 times less estimated computational power compared to standard baseline models. A specific example is a 1B parameter model trained on 40B unique tokens at a cost of around $1,500.

QWhat are the two main design choices in HRM-Text's training objective that contribute to its efficiency?

AThe two main design choices in the training objective are: 1) Training directly on instruction-answer pairs and computing the loss only on the answer part, rather than using standard full-sequence autoregressive pre-training. 2) Employing PrefixLM masking, which allows bidirectional attention on the instruction (prefix) part and causal masking for generating the answer.

QWhat techniques did the researchers introduce to improve the stability of deep recurrent training in HRM-Text?

ATo improve stability for deep recurrent training, the researchers introduced two techniques: 1) MagicNorm, a hybrid normalization strategy using PreNorm inside modules and an extra normalization at the module output, leveraging asymmetry in forward/backward depths under Truncated BPTT. 2) Warmup Deep Credit Assignment, which initially backpropagates gradients only from the last 2 recursion steps and linearly extends to the last 5 steps during training.

QWhat are some of the limitations and future research directions mentioned for HRM-Text?

AThe mentioned limitations and future directions include: 1) Decoupling 'knowledge' and 'reasoning', suggesting a need to combine the compact reasoning core with external factual storage (e.g., curated corpora, retrieval-augmented modules). 2) Exploring Adaptive Computation Time to reduce inference cost for easier samples. 3) Validating the efficiency advantage at larger model scales beyond the current 3B/1B experiments. 4) Addressing engineering challenges for deploying PrefixLM in multi-turn dialogue, such as designing a suitable KV-cache mechanism.

Letture associate

BTC Thrice Rejected at $80,000 Threshold, HYPE Reaches New Highs Signaling Opportunity | Guest Analysis

**Bitcoin (BTC) Struggles at $80k; HYPE Reaches New Highs | Key Analysis & Strategy** Bitcoin faces continued resistance in the $78.5k - $79.5k zone after failing to sustain a break above its daily chart rising channel. It has retreated to the channel's midline. A failure to hold here could see a test of the $73.5k - $75k support area. The 4-hour chart shows a complex corrective structure. The strategy is neutral for mid-term positions. For short-term trading, two scenarios are outlined: **A)** Selling on a failed rally into the $78.5k-$79.5k resistance, and **B)** Selling on a confirmed breakdown below the $73.5k-$75k support, both with tight risk management. Meanwhile, **HYPE** has posted consecutive highs. The 4-hour chart indicates its current uptrend may be weakening near $65, with models showing potential bearish divergence. The view is that a short-term top could be forming. The strategy advises against chasing the rally and instead looking for a potential long entry on a pullback to the $47.5 - $50 support zone, provided clear reversal signals appear. Last week, a disciplined short BTC trade based on model signals yielded a 2.78% profit. The article emphasizes that all analysis is for informational purposes only and not investment advice, highlighting the importance of strict stop-loss discipline and dynamic position management in a volatile market. *(Note: The text references proprietary models like the "Price Difference Trading Model" and "Momentum Quantification Model" for generating trade signals.)*

marsbit46 min fa

BTC Thrice Rejected at $80,000 Threshold, HYPE Reaches New Highs Signaling Opportunity | Guest Analysis

marsbit46 min fa

Tether's New Business: Helping Small Countries Issue Stablecoins

Tether has announced a partnership with the Georgian government to issue GEL₮, a Lari-pegged stablecoin, aiming to reduce costs, accelerate settlements, and promote cross-border payments. This move is part of Tether's broader strategy to establish a replicable, standardized business of issuing sovereign currency-backed stablecoins for smaller nations, alongside its flagship USDT and other regional offerings like MXNT (Mexican Peso) and CNHT (Offshore Yuan). Georgia represents an ideal test case due to its high reliance on remittances (~15% of GDP), established digital asset regulatory framework aligned with U.S. standards, and prior engagement with Tether. The country gains accelerated internationalization of its currency by accessing Tether's global distribution network and liquidity pools, where GEL₮ can be swapped directly with assets like USDT. For Tether, the immediate financial gain from Georgia's small market is minimal. The true value lies in creating a template. Successfully navigating the compliance, reserve, and redemption processes for GEL₮ allows Tether to replicate this model swiftly for other nations with similar profiles, such as Azerbaijan or Nigeria. The deeper strategy involves subtly integrating these national currencies into an informal USDT-anchored dollar system, positioning Tether as the essential routing infrastructure. This partnership highlights a potential new model: the outsourcing of sovereign currency globalization to private stablecoin issuers. It offers smaller states a faster path to digital currency integration than developing a Central Bank Digital Currency (CBDC). However, it raises significant questions about monetary sovereignty, financial stability risks, and increased dependency on a private entity. If more countries adopt this model in the coming year, Tether could evolve from a stablecoin issuer into a unique, cross-sovereign financial infrastructure service provider.

marsbit50 min fa

Tether's New Business: Helping Small Countries Issue Stablecoins

marsbit50 min fa

Notion CEO: AI companies should be a 'Jazz Band,' and I am a 'Refounder'

Notion CEO Ivan Zhao, in a recent podcast, shared his journey of twice rebuilding the company from near-collapse and now applying the same "Refounder" mindset to reshape the 1000-person organization in the AI era. He argues that AI has commoditized technical capability (Capability). True talent now hinges on Taste (judgment/values) and Agency (proactive drive), necessitating a shift in hiring—e.g., hiring more juniors for curiosity and having sales candidates demonstrate work upfront. Zhao envisions the company as a "Jazz Band"—agile and improvisational—versus a rigid "Marching Band." This is reflected in an engineering "dumbbell" structure (super juniors + top-tier seniors, with middle layers compressed), dissolving the CMO role to let teams operate directly, and integrating entrepreneurs via acquisitions to lead their expertise areas. Notion has abandoned traditional long-term product roadmaps, planning only conservatively for finances while adopting a week-by-week, improvisational approach to product strategy, as longer plans proved futile during rapid AI shifts. He concludes that while human nature and roles remain constants, companies must rewrite their approaches to hiring (valuing Taste/Agency over Capability), organizational design (reducing roles focused on coordination/execution), and planning (embracing flexibility). Modern knowledge work, being only ~150 years old, is ripe for reinvention.

marsbit51 min fa

Notion CEO: AI companies should be a 'Jazz Band,' and I am a 'Refounder'

marsbit51 min fa

BTC Faces Triple Resistance at $80,000 Milestone, HYPE Hits New Highs Signaling Potential | Invited Analysis

This weekly analysis maintains a structured framework, focusing on Bitcoin (BTC) and HYPE, dissecting their multi-timeframe price action to identify key support and resistance zones and formulate actionable trading plans. The previous week's short position on BTC yielded a 2.78% gain, reinforcing the "signal-driven, disciplined" approach. For Bitcoin, the core scenario revolves around the battle between the 78,500–79,500 USD resistance zone and the 73,500–75,000 USD support area. The daily chart shows BTC within a rising channel; a failure to hold support at the channel's midline could lead to a test of the lower boundary. The 4-hour chart details an 8-segment corrective structure from the 82,850 USD high. Two short-term strategies are proposed: (A) Selling on a failed rally into the 78.5k-79.5k zone, with a stop above 80,600, or (B) Selling a confirmed breakdown below the 73.5k-75k support, with a stop above 76,500. Medium-term positioning remains neutral. For HYPE, the 4-hour chart indicates a five-wave advance from the May 14th low, now showing potential exhaustion and a top warning signal near 65 USD. The core view is to watch for a potential short-term peak formation. The recommended strategy is to avoid chasing the rally and instead look for a long setup upon a pullback to the 47.5–50 USD support zone, provided clear stabilization and model confirmation signals appear. The report concludes with a detailed review of the prior BTC short trade, executed based on model signals and candlestick patterns, and reiterates strict risk management rules, including immediate stop-loss placement and trailing stops to protect profits. All analysis is presented as a personal trading log, not investment advice.

Odaily星球日报1 h fa

BTC Faces Triple Resistance at $80,000 Milestone, HYPE Hits New Highs Signaling Potential | Invited Analysis

Odaily星球日报1 h fa

Trading

Spot
Futures

Articoli Popolari

Cosa è $S$

Comprendere SPERO: Una Panoramica Completa Introduzione a SPERO Mentre il panorama dell'innovazione continua a evolversi, l'emergere delle tecnologie web3 e dei progetti di criptovaluta gioca un ruolo fondamentale nel plasmare il futuro digitale. Un progetto che ha attirato l'attenzione in questo campo dinamico è SPERO, denotato come SPERO,$$s$. Questo articolo mira a raccogliere e presentare informazioni dettagliate su SPERO, per aiutare gli appassionati e gli investitori a comprendere le sue basi, obiettivi e innovazioni nei domini web3 e crypto. Che cos'è SPERO,$$s$? SPERO,$$s$ è un progetto unico all'interno dello spazio crypto che cerca di sfruttare i principi della decentralizzazione e della tecnologia blockchain per creare un ecosistema che promuove l'impegno, l'utilità e l'inclusione finanziaria. Il progetto è progettato per facilitare interazioni peer-to-peer in modi nuovi, fornendo agli utenti soluzioni e servizi finanziari innovativi. Al suo interno, SPERO,$$s$ mira a responsabilizzare gli individui fornendo strumenti e piattaforme che migliorano l'esperienza dell'utente nello spazio delle criptovalute. Questo include la possibilità di metodi di transazione più flessibili, la promozione di iniziative guidate dalla comunità e la creazione di percorsi per opportunità finanziarie attraverso applicazioni decentralizzate (dApps). La visione sottostante di SPERO,$$s$ ruota attorno all'inclusività, cercando di colmare le lacune all'interno della finanza tradizionale mentre sfrutta i vantaggi della tecnologia blockchain. Chi è il Creatore di SPERO,$$s$? L'identità del creatore di SPERO,$$s$ rimane piuttosto oscura, poiché ci sono risorse pubblicamente disponibili limitate che forniscono informazioni dettagliate sul suo fondatore o fondatori. Questa mancanza di trasparenza può derivare dall'impegno del progetto per la decentralizzazione—un ethos che molti progetti web3 condividono, dando priorità ai contributi collettivi rispetto al riconoscimento individuale. Centrando le discussioni attorno alla comunità e ai suoi obiettivi collettivi, SPERO,$$s$ incarna l'essenza dell'empowerment senza mettere in evidenza individui specifici. Pertanto, comprendere l'etica e la missione di SPERO rimane più importante che identificare un creatore singolo. Chi sono gli Investitori di SPERO,$$s$? SPERO,$$s$ è supportato da una varietà di investitori che vanno dai capitalisti di rischio agli investitori angelici dedicati a promuovere l'innovazione nel settore crypto. Il focus di questi investitori generalmente si allinea con la missione di SPERO—dando priorità a progetti che promettono avanzamenti tecnologici sociali, inclusività finanziaria e governance decentralizzata. Queste fondazioni di investitori sono tipicamente interessate a progetti che non solo offrono prodotti innovativi, ma contribuiscono anche positivamente alla comunità blockchain e ai suoi ecosistemi. Il supporto di questi investitori rafforza SPERO,$$s$ come un concorrente degno di nota nel dominio in rapida evoluzione dei progetti crypto. Come Funziona SPERO,$$s$? SPERO,$$s$ impiega un framework multifunzionale che lo distingue dai progetti di criptovaluta convenzionali. Ecco alcune delle caratteristiche chiave che sottolineano la sua unicità e innovazione: Governance Decentralizzata: SPERO,$$s$ integra modelli di governance decentralizzati, responsabilizzando gli utenti a partecipare attivamente ai processi decisionali riguardanti il futuro del progetto. Questo approccio favorisce un senso di proprietà e responsabilità tra i membri della comunità. Utilità del Token: SPERO,$$s$ utilizza il proprio token di criptovaluta, progettato per servire varie funzioni all'interno dell'ecosistema. Questi token abilitano transazioni, premi e la facilitazione dei servizi offerti sulla piattaforma, migliorando l'impegno e l'utilità complessivi. Architettura Stratificata: L'architettura tecnica di SPERO,$$s$ supporta la modularità e la scalabilità, consentendo un'integrazione fluida di funzionalità e applicazioni aggiuntive man mano che il progetto evolve. Questa adattabilità è fondamentale per mantenere la rilevanza nel panorama crypto in continua evoluzione. Coinvolgimento della Comunità: Il progetto enfatizza iniziative guidate dalla comunità, impiegando meccanismi che incentivano la collaborazione e il feedback. Nutrendo una comunità forte, SPERO,$$s$ può affrontare meglio le esigenze degli utenti e adattarsi alle tendenze di mercato. Focus sull'Inclusione: Offrendo basse commissioni di transazione e interfacce user-friendly, SPERO,$$s$ mira ad attrarre una base utenti diversificata, inclusi individui che potrebbero non aver precedentemente interagito nello spazio crypto. Questo impegno per l'inclusione si allinea con la sua missione generale di empowerment attraverso l'accessibilità. Cronologia di SPERO,$$s$ Comprendere la storia di un progetto fornisce preziose intuizioni sulla sua traiettoria di sviluppo e sui traguardi. Di seguito è riportata una cronologia suggerita che mappa eventi significativi nell'evoluzione di SPERO,$$s$: Fase di Concettualizzazione e Ideazione: Le idee iniziali che formano la base di SPERO,$$s$ sono state concepite, allineandosi strettamente con i principi di decentralizzazione e focus sulla comunità all'interno dell'industria blockchain. Lancio del Whitepaper del Progetto: Dopo la fase concettuale, è stato rilasciato un whitepaper completo che dettaglia la visione, gli obiettivi e l'infrastruttura tecnologica di SPERO,$$s$ per suscitare interesse e feedback dalla comunità. Costruzione della Comunità e Prime Interazioni: Sono stati effettuati sforzi attivi di outreach per costruire una comunità di early adopters e potenziali investitori, facilitando discussioni attorno agli obiettivi del progetto e ottenendo supporto. Evento di Generazione del Token: SPERO,$$s$ ha condotto un evento di generazione del token (TGE) per distribuire i propri token nativi ai primi sostenitori e stabilire una liquidità iniziale all'interno dell'ecosistema. Lancio della Prima dApp: La prima applicazione decentralizzata (dApp) associata a SPERO,$$s$ è stata attivata, consentendo agli utenti di interagire con le funzionalità principali della piattaforma. Sviluppo Continuo e Partnership: Aggiornamenti e miglioramenti continui alle offerte del progetto, inclusi partnership strategiche con altri attori nello spazio blockchain, hanno plasmato SPERO,$$s$ in un concorrente competitivo e in evoluzione nel mercato crypto. Conclusione SPERO,$$s$ rappresenta una testimonianza del potenziale del web3 e delle criptovalute di rivoluzionare i sistemi finanziari e responsabilizzare gli individui. Con un impegno per la governance decentralizzata, il coinvolgimento della comunità e funzionalità progettate in modo innovativo, apre la strada verso un panorama finanziario più inclusivo. Come per qualsiasi investimento nello spazio crypto in rapida evoluzione, si incoraggiano potenziali investitori e utenti a ricercare approfonditamente e a impegnarsi in modo riflessivo con gli sviluppi in corso all'interno di SPERO,$$s$. Il progetto mostra lo spirito innovativo dell'industria crypto, invitando a ulteriori esplorazioni delle sue innumerevoli possibilità. Mentre il percorso di SPERO,$$s$ è ancora in fase di sviluppo, i suoi principi fondamentali potrebbero effettivamente influenzare il futuro di come interagiamo con la tecnologia, la finanza e tra di noi in ecosistemi digitali interconnessi.

75 Totale visualizzazioniPubblicato il 2024.12.17Aggiornato il 2024.12.17

Cosa è $S$

Cosa è AGENT S

Agent S: Il Futuro dell'Interazione Autonoma in Web3 Introduzione Nel panorama in continua evoluzione di Web3 e criptovalute, le innovazioni stanno costantemente ridefinendo il modo in cui gli individui interagiscono con le piattaforme digitali. Uno di questi progetti pionieristici, Agent S, promette di rivoluzionare l'interazione uomo-computer attraverso il suo framework agentico aperto. Aprendo la strada a interazioni autonome, Agent S mira a semplificare compiti complessi, offrendo applicazioni trasformative nell'intelligenza artificiale (AI). Questa esplorazione dettagliata approfondirà le complessità del progetto, le sue caratteristiche uniche e le implicazioni per il dominio delle criptovalute. Cos'è Agent S? Agent S si presenta come un innovativo framework agentico aperto, progettato specificamente per affrontare tre sfide fondamentali nell'automazione dei compiti informatici: Acquisizione di Conoscenze Specifiche del Dominio: Il framework apprende in modo intelligente da varie fonti di conoscenza esterne ed esperienze interne. Questo approccio duale gli consente di costruire un ricco repository di conoscenze specifiche del dominio, migliorando le sue prestazioni nell'esecuzione dei compiti. Pianificazione su Lungo Orizzonte di Compiti: Agent S impiega una pianificazione gerarchica potenziata dall'esperienza, un approccio strategico che facilita la suddivisione e l'esecuzione efficiente di compiti complessi. Questa caratteristica migliora significativamente la sua capacità di gestire più sottocompiti in modo efficiente ed efficace. Gestione di Interfacce Dinamiche e Non Uniformi: Il progetto introduce l'Interfaccia Agente-Computer (ACI), una soluzione innovativa che migliora l'interazione tra agenti e utenti. Utilizzando Modelli Linguistici Multimodali di Grandi Dimensioni (MLLM), Agent S può navigare e manipolare senza sforzo diverse interfacce grafiche utente. Attraverso queste caratteristiche pionieristiche, Agent S fornisce un framework robusto che affronta le complessità coinvolte nell'automazione dell'interazione umana con le macchine, preparando il terreno per innumerevoli applicazioni nell'AI e oltre. Chi è il Creatore di Agent S? Sebbene il concetto di Agent S sia fondamentalmente innovativo, informazioni specifiche sul suo creatore rimangono elusive. Il creatore è attualmente sconosciuto, il che evidenzia sia la fase embrionale del progetto sia la scelta strategica di mantenere i membri fondatori sotto anonimato. Indipendentemente dall'anonimato, l'attenzione rimane sulle capacità e sul potenziale del framework. Chi sono gli Investitori di Agent S? Poiché Agent S è relativamente nuovo nell'ecosistema crittografico, informazioni dettagliate riguardanti i suoi investitori e sostenitori finanziari non sono documentate esplicitamente. La mancanza di approfondimenti pubblicamente disponibili sulle fondazioni di investimento o sulle organizzazioni che supportano il progetto solleva interrogativi sulla sua struttura di finanziamento e sulla roadmap di sviluppo. Comprendere il supporto è cruciale per valutare la sostenibilità del progetto e il suo potenziale impatto sul mercato. Come Funziona Agent S? Al centro di Agent S si trova una tecnologia all'avanguardia che gli consente di funzionare efficacemente in contesti diversi. Il suo modello operativo è costruito attorno a diverse caratteristiche chiave: Interazione Uomo-Computer Simile a Quella Umana: Il framework offre una pianificazione AI avanzata, cercando di rendere le interazioni con i computer più intuitive. Mimando il comportamento umano nell'esecuzione dei compiti, promette di elevare le esperienze degli utenti. Memoria Narrativa: Utilizzata per sfruttare esperienze di alto livello, Agent S utilizza la memoria narrativa per tenere traccia delle storie dei compiti, migliorando così i suoi processi decisionali. Memoria Episodica: Questa caratteristica fornisce agli utenti una guida passo-passo, consentendo al framework di offrire supporto contestuale mentre i compiti si sviluppano. Supporto per OpenACI: Con la capacità di funzionare localmente, Agent S consente agli utenti di mantenere il controllo sulle proprie interazioni e flussi di lavoro, allineandosi con l'etica decentralizzata di Web3. Facile Integrazione con API Esterne: La sua versatilità e compatibilità con varie piattaforme AI garantiscono che Agent S possa adattarsi senza problemi agli ecosistemi tecnologici esistenti, rendendolo una scelta attraente per sviluppatori e organizzazioni. Queste funzionalità contribuiscono collettivamente alla posizione unica di Agent S all'interno dello spazio crittografico, poiché automatizza compiti complessi e multi-fase con un intervento umano minimo. Man mano che il progetto evolve, le sue potenziali applicazioni in Web3 potrebbero ridefinire il modo in cui si svolgono le interazioni digitali. Cronologia di Agent S Lo sviluppo e le tappe di Agent S possono essere riassunti in una cronologia che evidenzia i suoi eventi significativi: 27 Settembre 2024: Il concetto di Agent S è stato lanciato in un documento di ricerca completo intitolato “Un Framework Agentico Aperto che Usa i Computer Come un Umano”, mostrando le basi per il progetto. 10 Ottobre 2024: Il documento di ricerca è stato reso pubblicamente disponibile su arXiv, offrendo un'esplorazione approfondita del framework e della sua valutazione delle prestazioni basata sul benchmark OSWorld. 12 Ottobre 2024: È stata rilasciata una presentazione video, fornendo un'idea visiva delle capacità e delle caratteristiche di Agent S, coinvolgendo ulteriormente potenziali utenti e investitori. Questi indicatori nella cronologia non solo illustrano i progressi di Agent S, ma indicano anche il suo impegno per la trasparenza e il coinvolgimento della comunità. Punti Chiave su Agent S Man mano che il framework Agent S continua a evolversi, diversi attributi chiave si distinguono, sottolineando la sua natura innovativa e il potenziale: Framework Innovativo: Progettato per fornire un uso intuitivo dei computer simile all'interazione umana, Agent S porta un approccio nuovo all'automazione dei compiti. Interazione Autonoma: La capacità di interagire autonomamente con i computer attraverso GUI segna un passo avanti verso soluzioni informatiche più intelligenti ed efficienti. Automazione di Compiti Complessi: Con la sua metodologia robusta, può automatizzare compiti complessi e multi-fase, rendendo i processi più veloci e meno soggetti a errori. Miglioramento Continuo: I meccanismi di apprendimento consentono ad Agent S di migliorare dalle esperienze passate, migliorando continuamente le sue prestazioni e la sua efficacia. Versatilità: La sua adattabilità attraverso diversi ambienti operativi come OSWorld e WindowsAgentArena garantisce che possa servire un'ampia gamma di applicazioni. Man mano che Agent S si posiziona nel panorama di Web3 e delle criptovalute, il suo potenziale per migliorare le capacità di interazione e automatizzare i processi segna un significativo avanzamento nelle tecnologie AI. Attraverso il suo framework innovativo, Agent S esemplifica il futuro delle interazioni digitali, promettendo un'esperienza più fluida ed efficiente per gli utenti in vari settori. Conclusione Agent S rappresenta un audace passo avanti nell'unione tra AI e Web3, con la capacità di ridefinire il modo in cui interagiamo con la tecnologia. Sebbene sia ancora nelle sue fasi iniziali, le possibilità per la sua applicazione sono vaste e coinvolgenti. Attraverso il suo framework completo che affronta sfide critiche, Agent S mira a portare le interazioni autonome al centro dell'esperienza digitale. Man mano che ci addentriamo nei regni delle criptovalute e della decentralizzazione, progetti come Agent S giocheranno senza dubbio un ruolo cruciale nel plasmare il futuro della tecnologia e della collaborazione uomo-computer.

524 Totale visualizzazioniPubblicato il 2025.01.14Aggiornato il 2025.01.14

Cosa è AGENT S

Come comprare S

Benvenuto in HTX.com! Abbiamo reso l'acquisto di Sonic (S) semplice e conveniente. Segui la nostra guida passo passo per intraprendere il tuo viaggio nel mondo delle criptovalute.Step 1: Crea il tuo Account HTXUsa la tua email o numero di telefono per registrarti il tuo account gratuito su HTX. Vivi un'esperienza facile e sblocca tutte le funzionalità,Crea il mio accountStep 2: Vai in Acquista crypto e seleziona il tuo metodo di pagamentoCarta di credito/debito: utilizza la tua Visa o Mastercard per acquistare immediatamente SonicS.Bilancio: Usa i fondi dal bilancio del tuo account HTX per fare trading senza problemi.Terze parti: abbiamo aggiunto metodi di pagamento molto utilizzati come Google Pay e Apple Pay per maggiore comodità.P2P: Fai trading direttamente con altri utenti HTX.Over-the-Counter (OTC): Offriamo servizi su misura e tassi di cambio competitivi per i trader.Step 3: Conserva Sonic (S)Dopo aver acquistato Sonic (S), conserva nel tuo account HTX. In alternativa, puoi inviare tramite trasferimento blockchain o scambiare per altre criptovalute.Step 4: Scambia Sonic (S)Scambia facilmente Sonic (S) nel mercato spot di HTX. Accedi al tuo account, seleziona la tua coppia di trading, esegui le tue operazioni e monitora in tempo reale. Offriamo un'esperienza user-friendly sia per chi ha appena iniziato che per i trader più esperti.

936 Totale visualizzazioniPubblicato il 2025.01.15Aggiornato il 2025.03.21

Come comprare S

Discussioni

Benvenuto nella Community HTX. Qui puoi rimanere informato sugli ultimi sviluppi della piattaforma e accedere ad approfondimenti esperti sul mercato. Le opinioni degli utenti sul prezzo di S S sono presentate come di seguito.

活动图片