清华00后校友王冠再出新作:用1/900 token、1/432算力,颠覆Transformer预训练模型

marsbitPublicado a 2026-05-26Actualizado a 2026-05-26

Resumen

清华00后校友王冠团队提出了一种名为HRM-Text的高效预训练模型,使用分层循环模型取代标准Transformer。该方法仅需约1/900的训练token和1/432的估计算力,便使1B参数的模型在多项基准测试中达到了媲美2B至7B开源模型的性能,训练成本约1500美元。其核心是通过双时间尺度递归架构增加计算深度,并采用针对指令-回答对的训练目标,只对回答部分计算损失。研究强调了结构先验与针对性训练能显著降低预训练门槛。同时,论文也指出了当前方法在知识覆盖、自适应计算、规模化验证及工程部署方面的局限性,为未来研究指明了方向。

打破传统大模型预训练范式,清华 00 后校友王冠团队再出新作:

他们利用分层循环模型(HRM)取代标准 Transformer,提出了超越 Scaling 的高效预训练 HRM-Text

论文链接:https://arxiv.org/abs/2605.20613

在仅使用比标准 baseline 模型少约 100-900 倍的训练 token、96-432 倍的估计计算量的情况下,HRM-Text 依然实现了可媲美 2B 至 7B 参数开源模型的性能表现。

同时,使用 1B 参数、40B 非重复 token,并以约 1500 美元的训练成本,HRM-Text 便在主流基准测试中取得了如下成绩:MMLU 60.7%、ARC-C 81.9%、DROP 82.2%、GSM8K 84.5%、MATH 56.2%。

图|预训练效率。

在此基础上,他们明确提出:结构先验与有针对性的训练目标,可以显著降低预训练门槛。这种训练方案可以让从零开始训练基础模型变得可行。

HRM-Text 是怎样设计的?

大语言模型(LLM)预训练,越来越依赖少数拥有充足算力和数据资源的机构。训练一个有竞争力的基础模型,往往需要数万亿 token、数千张 GPU,甚至上千万美元的算力投入。

然而,当前的训练模式并不高效,大量计算都消耗在了提示词格式填充网页噪声等无关 token 上,导致大量训练算力并没有直接服务于推理。

在这项工作中,研究团队重新设计了架构和训练目标,使得 HRM-Text 的预训练相对更为高效。

架构:采用双时间尺度的分层循环模型,把计算拆成慢速的 H 模块和快速的 L 模块。标准 Transformer 对每个 token 只做一次前向传播,HRM 则会在同一 token 上进行多轮递归更新。H 和 L 模块各自只占递归核心参数量的一半,整体计算量大致相当于对同一套参数做 4 次递归展开,在不增加参数量的前提下提高了计算深度

训练目标:不再沿用标准的全文自回归预训练,而是直接在指令-回答对上训练,只对回答部分计算损失,并配合 PrefixLM 掩码,让指令部分双向注意,回答部分按因果掩码生成。

图|HRM-Text 架构。

为了提升递归训练的稳定性,研究团队引入了 MagicNorm 和 Warmup Deep Credit Assignment。

MagicNorm 是一种混合归一化策略,利用截断反向传播(Truncated BPTT)下前向与反向计算深度的不对称性,在模块内部采用 PreNorm,并在模块出口额外加入归一化,从而提升深层递归训练的稳定性。

Warmup Deep Credit Assignment 则在训练初期仅对最后 2 个递归步骤回传梯度,随后线性扩展至最后 5 步。这种训练机制,能让模型在较短的信用路径上稳定收敛,再逐步引入更长的依赖关系。

效果怎么样?

实验结果表明,HRM-Text 在架构效率、训练目标和整体性能上都表现出明显优势。

1.在固定训练算力下,循环架构是否更有效

结果显示,在 FLOPs 对齐条件下,HRM 1B 在大多数基准上优于 Transformer 1B、Transformer 3B、Looped Transformer 1B 和 RINS 1B;与 TRM 的对比也表明,HRM 的训练更稳定

图|与 Transformer 模型的性能和稳定性比较。HRM 在所有规模下都保持了稳定的训练动态,而 Transformer 模型在10 亿参数规模下出现了严重的不稳定。此外,在 0.6B 规模下,HRM 仅需比 Transformer 模型少 2倍的计算量,就能在大多数基准上取得具有竞争力的表现。

2.任务完成目标和 PrefixLM 是否有帮助

消融实验显示,在 FLOPs 对齐条件下,1B Transformer 的 MMLU 从标准自回归的 40.55,依次提升到引入任务完成目标后的 47.72、加入 PrefixLM 后的 53.15,以及换成 HRM 架构后的 60.73。

图|不同模型架构与训练目标之间的性能比较

3.HRM-Text 与当代开放模型相比效率如何

HRM-Text 1B 在 MMLU、ARC-C、DROP、GSM8K、MATH 上分别达到 60.7、81.9、82.2、84.5 和 56.2。相比训练预算普遍更大的开放模型,它只用 400 亿唯一 token 和 1B 参数,就进入了 2B 到 7B 开源模型的性能区间;训练所需的token 最多少了 900 倍,算力开销最多少了 432 倍

图|HRM-Text 1B 与同期全开源模型及开放权重模型的评测结果

4.循环结构是否带来了更大的有效深度

结果显示,标准 Transformer 和 Looped Transformer 在较浅层就趋于稳定,HRM 则在更深层仍保持更明显的块间表示变化更低的余弦相似度更高的 logit lens KL 值

图|有效深度分析。

图|逐层 Logit Lens KL 分析。

不足与未来方向

尽管 HRM-Text 在推理密集型任务上展现了出强劲表现,但这一方法依然存在局限,并提出了未来的研究方向。

1.走向“知识”与“推理”的解耦

目前,更广泛的事实知识覆盖仍然更依赖模型规模与数据广度。HRM-Text 只在 400 亿唯一 token 上训练,且显式知识型来源只占任务格式化混合数据的一部分。未来,研究人员需要将紧凑的推理核心与外部事实存储分开设计,把知识广度交给精选语料检索增强模块可学习记忆

2.自适应计算时间

HRM-Text 的循环调度带来了更大的有效串行深度,但这也意味着模型在推理时需要执行固定数量的递归步骤。未来,一个值得探索的方向是引入自适应计算时间机制,使简单样本能够更早停止计算,并将完整的循环预算保留给困难样本,减少推理成本

3.现有规模化验证范围仍然有限

当前的 scaling 实验只覆盖到 3B 参数的 Transformer 对照组和 1B 参数的 HRM-Text。研究团队表示,在更大模型规模下是否还能保持类似的效率优势,仍有待后续工作进一步验证

4.PrefixLM 与推理框架

目前,PrefixLM 在实际部署中仍面临一定的工程实现限制。尽管它能够运行在 vLLM 等标准文本生成推理框架上,但这要求框架在 prefill 阶段支持自定义注意力掩码。如果将其扩展至多轮对话场景,还需进一步设计 KV-cache 机制,既保证用户片段内部保持双向可见,也要确保助手端的生成过程继续遵循因果约束。

更多技术细节,详见原论文。

本文来自微信公众号“学术头条”(ID:SciTouTiao),作者:夏千斯

Preguntas relacionadas

QHRM-Text模型相比传统Transformer模型在训练资源消耗上有多大的提升?

AHRM-Text模型在训练中,所需的训练Token比标准baseline模型少约100到900倍,所需的估计计算量比标准baseline模型少约96到432倍。

QHRM-Text模型的核心架构是什么,它与标准Transformer的主要区别在哪里?

AHRM-Text的核心架构是分层循环模型。它与标准Transformer的主要区别在于:它采用双时间尺度的设计,将计算拆分为慢速H模块和快速L模块,并在同一token上进行多轮递归更新,从而在不增加参数量的前提下提高了计算深度,而标准Transformer对每个token只进行一次前向传播。

QHRM-Text在哪些主流基准测试中取得了什么成绩?

A在使用1B参数、40B非重复token训练后,HRM-Text在多个主流基准测试中取得的成绩如下:MMLU(60.7%)、ARC-C(81.9%)、DROP(82.2%)、GSM8K(84.5%)、MATH(56.2%)。

Q为了提高递归训练的稳定性,研究团队引入了哪两项关键技术?

A研究团队引入了两项关键技术:1. MagicNorm,一种混合归一化策略,它利用截断反向传播下前向与反向计算深度的不对称性,在模块内部采用PreNorm并在模块出口额外加入归一化。2. Warmup Deep Credit Assignment,它在训练初期仅对最后2个递归步骤回传梯度,随后线性扩展至最后5步。

Q文章指出了HRM-Text方法的哪些局限和未来的研究方向?

A文章指出的局限和未来研究方向包括:1. 需要将“知识”与“推理”解耦,即把知识广度交给精选语料、检索增强模块或可学习记忆,而非仅依赖模型参数。2. 引入自适应计算时间机制,使简单样本能更早停止计算,以节省推理成本。3. 当前规模化验证仅到3B参数范围,更大规模下的效率优势有待验证。4. PrefixLM在实际部署中面临工程实现限制,需进一步设计适配多轮对话的KV-cache机制。

Lecturas Relacionadas

Desde el IDE hasta la terminal: Un manual práctico de ingeniería de agentes

De la interfaz a la terminal: Un manual práctico de ingeniería de agentes Matt Van Horn desató un debate en marzo de 2026 al afirmar que desarrollaba sin abrir un IDE gráfico, usando solo la terminal y un archivo `plan.md`. Su método, recopilado luego por Meng Shao, se basa en un ciclo de "Research → Plan → Work" y 22 técnicas prácticas. Este flujo de trabajo reemplaza la edición manual y la retroalimentación visual del IDE (resaltado, depuración) por un modelo de "delegación por lotes". La persona se centra en definir la dirección y revisar planes, mientras los agentes ejecutan. El archivo `plan.md` es clave: no es documentación para humanos, sino un "contrato" externo y persistente para guiar y restringir a los agentes, evitando la "corrupción del contexto" en conversaciones largas. La fase de **Research** usa herramientas como `last30days-skill` para que el agente analice información comunitaria antes de actuar. En la fase de **Plan**, se genera y revisa minuciosamente el `plan.md` con `ce:plan`, inyectando conocimiento experto. La fase de **Work**, con `ce:work`, delega la ejecución a sub-agentes paralelos. Se enfatiza dedicar el 80% del tiempo a planificar/revisar y solo el 20% a ejecutar. Se destacan seis técnicas: generar planes inmediatamente sin pre-pensar en exceso; hacer que el agente resuma los planes largos; usar múltiples terminales en paralelo; usar entrada por voz para diseños complejos; activar tareas asíncronas por correo; y cargar "skills" comunitarios para ampliar capacidades. Las críticas señalan que este flujo requiere experiencia en diseño de sistemas y prompt engineering, y no es apto para aprendices que dependen de la retroalimentación visual del IDE. Concentra el riesgo en la fase de revisión del plan: un error allí se amplifica. Además, existe el riesgo de "psicosis de IA", donde optimizar el flujo de trabajo se convierte en un fin en sí mismo. En resumen, este enfoque es un amplificador de eficacia para quienes ya saben lo que necesitan construir, no una herramienta de aprendizaje. Sus componentes principales (CLIs, plugins como Compound Engineering, skills) evolucionan rápidamente, definiendo una ventana temprana para la experimentación.

marsbitHace 1 hora(s)

Desde el IDE hasta la terminal: Un manual práctico de ingeniería de agentes

marsbitHace 1 hora(s)

"Xiaomei" y Yuanbao se interconectan, ¿están preparando el camino para los Agentes Inteligentes de WeChat?

El CEO de Meituan, Wang Xing, anunció tras los resultados del primer trimestre de 2026 que su asistente de IA "Xiaomei" se integrará con "Yuanbao" de Tencent. Esta colaboración permitirá a los usuarios solicitar servicios de vida local en Yuanbao y desencadenar automáticamente una comunicación entre agentes para acceder a pedidos de comida a domicilio y otros servicios de Meituan. El artículo analiza este movimiento como una respuesta estratégica de Meituan frente a la creciente competencia. Mientras plataformas como Doubao (ByteDance) y Qianwen (Alibaba) están construyendo ecosistemas cerrados ("jardines amurallados") integrando sus asistentes de IA con sus propios servicios comerciales, Meituan carece de un gran portal de IA independiente. La alianza con Yuanbao le permite a Meituan utilizar un punto de entrada conversacional de IA a cambio de proporcionar su infraestructura de servicios y datos de vida local, una relación vista como complementaria. Sin embargo, la colaboración enfrenta desafíos: la limitada experiencia del usuario debido a la arquitectura "Agente a Agente", la compleja distribución de beneficios comerciales y la necesidad de una integración fluida entre dos empresas diferentes. El artículo sitúa esta asociación en un contexto más amplio, vinculándola con los informes sobre el desarrollo de un "Agente de IA" nativo en WeChat. La cooperación entre Meituan y Yuanbao se interpreta como una prueba piloto o un modelo para futuras integraciones de alto nivel ("Agente a Agente") dentro del ecosistema de WeChat. Su éxito podría sentar un precedente crucial para atraer a otras grandes plataformas a la futura red de agentes de inteligencia artificial de Tencent, determinando en última instancia el alcance de dicho ecosistema.

marsbitHace 3 hora(s)

"Xiaomei" y Yuanbao se interconectan, ¿están preparando el camino para los Agentes Inteligentes de WeChat?

marsbitHace 3 hora(s)

Morningstar valora SpaceX en sólo 780.000 millones, menos de la mitad del objetivo de la OPI, ¿la OPI más grande de la historia está sobrevalorada?

La firma de investigación Morningstar ha emitido un informe sobre la valoración de SpaceX antes de su salida a bolsa, estableciendo su valor justo en 780 mil millones de dólares, un 45% del objetivo de 1.75 billones que persigue la empresa. La valoración de Morningstar separa su negocio central de lanzamientos y Starlink (611 mil millones) de las operaciones de IA, como xAI, que reciben una valoración ponderada de solo 170 mil millones. A pesar de esta crítica, la analista reconoce que factores como la baja oferta inicial de acciones, la fuerte demanda por empresas de infraestructura de IA y la posible inclusión rápida en el índice Nasdaq 100 podrían impulsar el precio a corto plazo tras la OPV. No obstante, advierte sobre presiones de venta a medio plazo debido a un calendario escalonado de desbloqueo de acciones para empleados e inversores internos. Elon Musk respondió a las dudas sobre la valoración sugiriendo que el mercado juzgará, en referencia al éxito de Tesla. Morningstar también destaca riesgos como la refinanciación de un préstamo puente de 200 mil millones de dólares y cuestiones de gobierno corporativo, incluida la estructura de control de voto de Musk y la adquisición reciente de xAI. La OPV, la más grande de la historia, está prevista para la segunda semana de junio.

marsbitHace 3 hora(s)

Morningstar valora SpaceX en sólo 780.000 millones, menos de la mitad del objetivo de la OPI, ¿la OPI más grande de la historia está sobrevalorada?

marsbitHace 3 hora(s)

a16z: Por qué los mercados de predicción serán la infraestructura de las "probabilidades futuras"

Los mercados de predicción, al convertir eventos futuros en contratos comercializables, permiten a los participantes expresar juicios con dinero real y agregar información dispersa en tiempo real, generando una probabilidad aproximada a través del precio. A diferencia de encuestas o predicciones de expertos, su ventaja radica en el incentivo económico para que participen quienes poseen información relevante. Estos mercados no son máquinas de profecía, sino una aplicación directa de la capacidad de los mercados para agregar información. Permiten abordar cuestiones específicas, desde geopolítica hasta el rendimiento de modelos de IA, que los activos financieros tradicionales no pueden expresar. Sin embargo, su eficacia no es automática. Depende de quién comercia, del diseño de los contratos, de la determinación de resultados y de la resistencia a la manipulación por parte de actores internos o interesados. Sin una participación informada, los precios son ruido; con información privilegiada, se pierde equidad. Por tanto, el siguiente paso no es solo escalar, sino construir una infraestructura más confiable: reglas de participación transparentes, diseño de contratos claro, mecanismos de liquidación auditables y restricciones contra la manipulación. Su verdadero valor reside en proporcionar una nueva señal de probabilidad pública en entornos de alta incertidumbre.

marsbitHace 3 hora(s)

a16z: Por qué los mercados de predicción serán la infraestructura de las "probabilidades futuras"

marsbitHace 3 hora(s)

Trading

Spot
Futuros

Artículos destacados

Qué es $S$

Entendiendo SPERO: Una Visión General Completa Introducción a SPERO A medida que el panorama de la innovación sigue evolucionando, la aparición de tecnologías web3 y proyectos de criptomonedas juega un papel fundamental en la configuración del futuro digital. Un proyecto que ha llamado la atención en este campo dinámico es SPERO, denotado como SPERO,$$s$. Este artículo tiene como objetivo recopilar y presentar información detallada sobre SPERO, para ayudar a entusiastas e inversores a comprender sus fundamentos, objetivos e innovaciones dentro de los dominios web3 y cripto. ¿Qué es SPERO,$$s$? SPERO,$$s$ es un proyecto único dentro del espacio cripto que busca aprovechar los principios de descentralización y tecnología blockchain para crear un ecosistema que promueva la participación, la utilidad y la inclusión financiera. El proyecto está diseñado para facilitar interacciones entre pares de nuevas maneras, proporcionando a los usuarios soluciones y servicios financieros innovadores. En su esencia, SPERO,$$s$ tiene como objetivo empoderar a los individuos al proporcionar herramientas y plataformas que mejoren la experiencia del usuario en el espacio de las criptomonedas. Esto incluye habilitar métodos de transacción más flexibles, fomentar iniciativas impulsadas por la comunidad y crear caminos para oportunidades financieras a través de aplicaciones descentralizadas (dApps). La visión subyacente de SPERO,$$s$ gira en torno a la inclusividad, buscando cerrar brechas dentro de las finanzas tradicionales mientras aprovecha los beneficios de la tecnología blockchain. ¿Quién es el Creador de SPERO,$$s$? La identidad del creador de SPERO,$$s$ sigue siendo algo oscura, ya que hay recursos públicos limitados que proporcionan información de fondo detallada sobre su(s) fundador(es). Esta falta de transparencia puede derivarse del compromiso del proyecto con la descentralización, una ética que muchos proyectos web3 comparten, priorizando las contribuciones colectivas sobre el reconocimiento individual. Al centrar las discusiones en torno a la comunidad y sus objetivos colectivos, SPERO,$$s$ encarna la esencia del empoderamiento sin señalar a individuos específicos. Como tal, entender la ética y la misión de SPERO es más importante que identificar a un creador singular. ¿Quiénes son los Inversores de SPERO,$$s$? SPERO,$$s$ cuenta con el apoyo de una diversa gama de inversores que van desde capitalistas de riesgo hasta inversores ángeles dedicados a fomentar la innovación en el sector cripto. El enfoque de estos inversores generalmente se alinea con la misión de SPERO, priorizando proyectos que prometen avances tecnológicos sociales, inclusividad financiera y gobernanza descentralizada. Estas fundaciones de inversores suelen estar interesadas en proyectos que no solo ofrecen productos innovadores, sino que también contribuyen positivamente a la comunidad blockchain y sus ecosistemas. El respaldo de estos inversores refuerza a SPERO,$$s$ como un contendiente notable en el rápidamente evolutivo dominio de los proyectos cripto. ¿Cómo Funciona SPERO,$$s$? SPERO,$$s$ emplea un marco multifacético que lo distingue de los proyectos de criptomonedas convencionales. Aquí hay algunas de las características clave que subrayan su singularidad e innovación: Gobernanza Descentralizada: SPERO,$$s$ integra modelos de gobernanza descentralizada, empoderando a los usuarios para participar activamente en los procesos de toma de decisiones sobre el futuro del proyecto. Este enfoque fomenta un sentido de propiedad y responsabilidad entre los miembros de la comunidad. Utilidad del Token: SPERO,$$s$ utiliza su propio token de criptomoneda, diseñado para servir a diversas funciones dentro del ecosistema. Estos tokens permiten transacciones, recompensas y la facilitación de servicios ofrecidos en la plataforma, mejorando la participación y utilidad general. Arquitectura en Capas: La arquitectura técnica de SPERO,$$s$ soporta la modularidad y escalabilidad, permitiendo la integración fluida de características y aplicaciones adicionales a medida que el proyecto evoluciona. Esta adaptabilidad es fundamental para mantener la relevancia en el siempre cambiante paisaje cripto. Participación de la Comunidad: El proyecto enfatiza iniciativas impulsadas por la comunidad, empleando mecanismos que incentivan la colaboración y la retroalimentación. Al nutrir una comunidad sólida, SPERO,$$s$ puede abordar mejor las necesidades de los usuarios y adaptarse a las tendencias del mercado. Enfoque en la Inclusión: Al ofrecer tarifas de transacción bajas y interfaces amigables para el usuario, SPERO,$$s$ busca atraer a una base de usuarios diversa, incluyendo a individuos que anteriormente pueden no haber participado en el espacio cripto. Este compromiso con la inclusión se alinea con su misión general de empoderamiento a través de la accesibilidad. Cronología de SPERO,$$s$ Entender la historia de un proyecto proporciona información crucial sobre su trayectoria de desarrollo y hitos. A continuación, se presenta una cronología sugerida que mapea eventos significativos en la evolución de SPERO,$$s$: Fase de Conceptualización e Ideación: Las ideas iniciales que forman la base de SPERO,$$s$ fueron concebidas, alineándose estrechamente con los principios de descentralización y enfoque comunitario dentro de la industria blockchain. Lanzamiento del Whitepaper del Proyecto: Tras la fase conceptual, se publicó un whitepaper completo que detalla la visión, objetivos e infraestructura tecnológica de SPERO,$$s$ para generar interés y retroalimentación de la comunidad. Construcción de Comunidad y Primeras Interacciones: Se realizaron esfuerzos de divulgación activa para construir una comunidad de primeros adoptantes e inversores potenciales, facilitando discusiones en torno a los objetivos del proyecto y obteniendo apoyo. Evento de Generación de Tokens: SPERO,$$s$ llevó a cabo un evento de generación de tokens (TGE) para distribuir sus tokens nativos a los primeros seguidores y establecer liquidez inicial dentro del ecosistema. Lanzamiento de la dApp Inicial: La primera aplicación descentralizada (dApp) asociada con SPERO,$$s$ se puso en marcha, permitiendo a los usuarios interactuar con las funcionalidades centrales de la plataforma. Desarrollo Continuo y Alianzas: Actualizaciones y mejoras continuas en las ofertas del proyecto, incluyendo alianzas estratégicas con otros actores en el espacio blockchain, han moldeado a SPERO,$$s$ en un jugador competitivo y en evolución en el mercado cripto. Conclusión SPERO,$$s$ se erige como un testimonio del potencial de web3 y las criptomonedas para revolucionar los sistemas financieros y empoderar a los individuos. Con un compromiso con la gobernanza descentralizada, la participación comunitaria y funcionalidades diseñadas de manera innovadora, allana el camino hacia un paisaje financiero más inclusivo. Como con cualquier inversión en el rápidamente evolutivo espacio cripto, se anima a los potenciales inversores y usuarios a investigar a fondo y participar de manera reflexiva con los desarrollos en curso dentro de SPERO,$$s$. El proyecto muestra el espíritu innovador de la industria cripto, invitando a una exploración más profunda de sus innumerables posibilidades. Aunque el viaje de SPERO,$$s$ aún se está desarrollando, sus principios fundamentales pueden, de hecho, influir en el futuro de cómo interactuamos con la tecnología, las finanzas y entre nosotros en ecosistemas digitales interconectados.

74 Vistas totalesPublicado en 2024.12.17Actualizado en 2024.12.17

Qué es $S$

Qué es AGENT S

Agent S: El Futuro de la Interacción Autónoma en Web3 Introducción En el paisaje en constante evolución de Web3 y las criptomonedas, las innovaciones están redefiniendo continuamente cómo los individuos interactúan con las plataformas digitales. Uno de estos proyectos pioneros, Agent S, promete revolucionar la interacción humano-computadora a través de su marco agente abierto. Al allanar el camino para interacciones autónomas, Agent S tiene como objetivo simplificar tareas complejas, ofreciendo aplicaciones transformadoras en inteligencia artificial (IA). Esta exploración detallada se adentrará en las complejidades del proyecto, sus características únicas y las implicaciones para el dominio de las criptomonedas. ¿Qué es Agent S? Agent S se presenta como un marco agente abierto revolucionario, diseñado específicamente para abordar tres desafíos fundamentales en la automatización de tareas informáticas: Adquisición de Conocimiento Específico del Dominio: El marco aprende de manera inteligente a partir de diversas fuentes de conocimiento externas y experiencias internas. Este enfoque dual le permite construir un rico repositorio de conocimiento específico del dominio, mejorando su rendimiento en la ejecución de tareas. Planificación a Largo Plazo de Tareas: Agent S emplea planificación jerárquica aumentada por la experiencia, un enfoque estratégico que facilita la descomposición y ejecución eficiente de tareas intrincadas. Esta característica mejora significativamente su capacidad para gestionar múltiples subtareas de manera eficiente y efectiva. Manejo de Interfaces Dinámicas y No Uniformes: El proyecto introduce la Interfaz Agente-Computadora (ACI), una solución innovadora que mejora la interacción entre agentes y usuarios. Utilizando Modelos de Lenguaje Multimodal Grandes (MLLMs), Agent S puede navegar y manipular diversas interfaces gráficas de usuario sin problemas. A través de estas características pioneras, Agent S proporciona un marco robusto que aborda las complejidades involucradas en la automatización de la interacción humana con las máquinas, preparando el terreno para innumerables aplicaciones en IA y más allá. ¿Quién es el Creador de Agent S? Aunque el concepto de Agent S es fundamentalmente innovador, la información específica sobre su creador sigue siendo elusiva. El creador es actualmente desconocido, lo que resalta ya sea la etapa incipiente del proyecto o la elección estratégica de mantener a los miembros fundadores en el anonimato. Independientemente de la anonimidad, el enfoque sigue siendo las capacidades y el potencial del marco. ¿Quiénes son los Inversores de Agent S? Dado que Agent S es relativamente nuevo en el ecosistema criptográfico, la información detallada sobre sus inversores y patrocinadores financieros no está documentada explícitamente. La falta de información disponible públicamente sobre las bases de inversión u organizaciones que apoyan el proyecto plantea preguntas sobre su estructura de financiamiento y hoja de ruta de desarrollo. Comprender el respaldo es crucial para evaluar la sostenibilidad del proyecto y su posible impacto en el mercado. ¿Cómo Funciona Agent S? En el núcleo de Agent S se encuentra tecnología de vanguardia que le permite funcionar de manera efectiva en diversos entornos. Su modelo operativo se basa en varias características clave: Interacción Humano-Computadora: El marco ofrece planificación avanzada de IA, esforzándose por hacer que las interacciones con las computadoras sean más intuitivas. Al imitar el comportamiento humano en la ejecución de tareas, promete elevar las experiencias de los usuarios. Memoria Narrativa: Empleada para aprovechar experiencias de alto nivel, Agent S utiliza memoria narrativa para hacer un seguimiento de las historias de tareas, mejorando así sus procesos de toma de decisiones. Memoria Episódica: Esta característica proporciona a los usuarios orientación paso a paso, permitiendo que el marco ofrezca apoyo contextual a medida que se desarrollan las tareas. Soporte para OpenACI: Con la capacidad de funcionar localmente, Agent S permite a los usuarios mantener el control sobre sus interacciones y flujos de trabajo, alineándose con la ética descentralizada de Web3. Fácil Integración con APIs Externas: Su versatilidad y compatibilidad con diversas plataformas de IA aseguran que Agent S pueda integrarse sin problemas en ecosistemas tecnológicos existentes, convirtiéndolo en una opción atractiva para desarrolladores y organizaciones. Estas funcionalidades contribuyen colectivamente a la posición única de Agent S dentro del espacio cripto, ya que automatiza tareas complejas y de múltiples pasos con una intervención humana mínima. A medida que el proyecto evoluciona, sus aplicaciones potenciales en Web3 podrían redefinir cómo se desarrollan las interacciones digitales. Cronología de Agent S El desarrollo y los hitos de Agent S pueden encapsularse en una cronología que destaca sus eventos significativos: 27 de septiembre de 2024: Se lanzó el concepto de Agent S en un documento de investigación integral titulado “Un Marco Agente Abierto que Utiliza Computadoras como un Humano”, mostrando las bases del proyecto. 10 de octubre de 2024: El documento de investigación se hizo disponible públicamente en arXiv, ofreciendo una exploración en profundidad del marco y su evaluación de rendimiento basada en el benchmark OSWorld. 12 de octubre de 2024: Se publicó una presentación en video, proporcionando una visión visual de las capacidades y características de Agent S, involucrando aún más a posibles usuarios e inversores. Estos hitos en la cronología no solo ilustran el progreso de Agent S, sino que también indican su compromiso con la transparencia y el compromiso comunitario. Puntos Clave Sobre Agent S A medida que el marco Agent S continúa evolucionando, varios atributos clave destacan, subrayando su naturaleza innovadora y potencial: Marco Innovador: Diseñado para proporcionar un uso intuitivo de las computadoras similar a la interacción humana, Agent S aporta un enfoque novedoso a la automatización de tareas. Interacción Autónoma: La capacidad de interactuar de manera autónoma con las computadoras a través de GUI significa un avance hacia soluciones informáticas más inteligentes y eficientes. Automatización de Tareas Complejas: Con su metodología robusta, puede automatizar tareas complejas y de múltiples pasos, haciendo que los procesos sean más rápidos y menos propensos a errores. Mejora Continua: Los mecanismos de aprendizaje permiten a Agent S mejorar a partir de experiencias pasadas, mejorando continuamente su rendimiento y eficacia. Versatilidad: Su adaptabilidad en diferentes entornos operativos como OSWorld y WindowsAgentArena asegura que pueda servir a una amplia gama de aplicaciones. A medida que Agent S se posiciona en el paisaje de Web3 y criptomonedas, su potencial para mejorar las capacidades de interacción y automatizar procesos significa un avance significativo en las tecnologías de IA. A través de su marco innovador, Agent S ejemplifica el futuro de las interacciones digitales, prometiendo una experiencia más fluida y eficiente para los usuarios en diversas industrias. Conclusión Agent S representa un audaz avance en la unión de la IA y Web3, con la capacidad de redefinir cómo interactuamos con la tecnología. Aunque aún se encuentra en sus primeras etapas, las posibilidades para su aplicación son vastas y atractivas. A través de su marco integral que aborda desafíos críticos, Agent S tiene como objetivo llevar las interacciones autónomas al primer plano de la experiencia digital. A medida que nos adentramos más en los reinos de las criptomonedas y la descentralización, proyectos como Agent S sin duda desempeñarán un papel crucial en la configuración del futuro de la tecnología y la colaboración humano-computadora.

830 Vistas totalesPublicado en 2025.01.14Actualizado en 2025.01.14

Qué es AGENT S

Cómo comprar S

¡Bienvenido a HTX.com! Hemos hecho que comprar Sonic (S) sea simple y conveniente. Sigue nuestra guía paso a paso para iniciar tu viaje de criptos.Paso 1: crea tu cuenta HTXUtiliza tu correo electrónico o número de teléfono para registrarte y obtener una cuenta gratuita en HTX. Experimenta un proceso de registro sin complicaciones y desbloquea todas las funciones.Obtener mi cuentaPaso 2: ve a Comprar cripto y elige tu método de pagoTarjeta de crédito/débito: usa tu Visa o Mastercard para comprar Sonic (S) al instante.Saldo: utiliza fondos del saldo de tu cuenta HTX para tradear sin problemas.Terceros: hemos agregado métodos de pago populares como Google Pay y Apple Pay para mejorar la comodidad.P2P: tradear directamente con otros usuarios en HTX.Over-the-Counter (OTC): ofrecemos servicios personalizados y tipos de cambio competitivos para los traders.Paso 3: guarda tu Sonic (S)Después de comprar tu Sonic (S), guárdalo en tu cuenta HTX. Alternativamente, puedes enviarlo a otro lugar mediante transferencia blockchain o utilizarlo para tradear otras criptomonedas.Paso 4: tradear Sonic (S)Tradear fácilmente con Sonic (S) en HTX's mercado spot. Simplemente accede a tu cuenta, selecciona tu par de trading, ejecuta tus trades y monitorea en tiempo real. Ofrecemos una experiencia fácil de usar tanto para principiantes como para traders experimentados.

1.4k Vistas totalesPublicado en 2025.01.15Actualizado en 2026.06.02

Cómo comprar S

Discusiones

Bienvenido a la comunidad de HTX. Aquí puedes mantenerte informado sobre los últimos desarrollos de la plataforma y acceder a análisis profesionales del mercado. A continuación se presentan las opiniones de los usuarios sobre el precio de S (S).

活动图片