清华00后校友王冠再出新作：用1/900 token、1/432算力，颠覆Transformer预训练模型

marsbitDipublikasikan tanggal 2026-05-26Terakhir diperbarui pada 2026-05-26

Abstrak

清华00后校友王冠团队提出了一种名为HRM-Text的高效预训练模型，使用分层循环模型取代标准Transformer。该方法仅需约1/900的训练token和1/432的估计算力，便使1B参数的模型在多项基准测试中达到了媲美2B至7B开源模型的性能，训练成本约1500美元。其核心是通过双时间尺度递归架构增加计算深度，并采用针对指令-回答对的训练目标，只对回答部分计算损失。研究强调了结构先验与针对性训练能显著降低预训练门槛。同时，论文也指出了当前方法在知识覆盖、自适应计算、规模化验证及工程部署方面的局限性，为未来研究指明了方向。

打破传统大模型预训练范式,清华 00 后校友王冠团队再出新作:

他们利用分层循环模型(HRM)取代标准 Transformer,提出了超越 Scaling 的高效预训练 HRM-Text。

论文链接:https://arxiv.org/abs/2605.20613

在仅使用比标准 baseline 模型少约 100-900 倍的训练 token、96-432 倍的估计计算量的情况下,HRM-Text 依然实现了可媲美 2B 至 7B 参数开源模型的性能表现。

同时,使用 1B 参数、40B 非重复 token,并以约 1500 美元的训练成本,HRM-Text 便在主流基准测试中取得了如下成绩:MMLU 60.7%、ARC-C 81.9%、DROP 82.2%、GSM8K 84.5%、MATH 56.2%。

图|预训练效率。

在此基础上,他们明确提出:结构先验与有针对性的训练目标,可以显著降低预训练门槛。这种训练方案可以让从零开始训练基础模型变得可行。

HRM-Text 是怎样设计的?

大语言模型(LLM)预训练,越来越依赖少数拥有充足算力和数据资源的机构。训练一个有竞争力的基础模型,往往需要数万亿 token、数千张 GPU,甚至上千万美元的算力投入。

然而,当前的训练模式并不高效,大量计算都消耗在了提示词、格式填充和网页噪声等无关 token 上,导致大量训练算力并没有直接服务于推理。

在这项工作中,研究团队重新设计了架构和训练目标,使得 HRM-Text 的预训练相对更为高效。

架构:采用双时间尺度的分层循环模型,把计算拆成慢速的 H 模块和快速的 L 模块。标准 Transformer 对每个 token 只做一次前向传播,HRM 则会在同一 token 上进行多轮递归更新。H 和 L 模块各自只占递归核心参数量的一半,整体计算量大致相当于对同一套参数做 4 次递归展开,在不增加参数量的前提下提高了计算深度。

训练目标:不再沿用标准的全文自回归预训练,而是直接在指令-回答对上训练,只对回答部分计算损失,并配合 PrefixLM 掩码,让指令部分双向注意,回答部分按因果掩码生成。

图|HRM-Text 架构。

为了提升递归训练的稳定性,研究团队引入了 MagicNorm 和 Warmup Deep Credit Assignment。

MagicNorm 是一种混合归一化策略,利用截断反向传播(Truncated BPTT)下前向与反向计算深度的不对称性,在模块内部采用 PreNorm,并在模块出口额外加入归一化,从而提升深层递归训练的稳定性。

Warmup Deep Credit Assignment 则在训练初期仅对最后 2 个递归步骤回传梯度,随后线性扩展至最后 5 步。这种训练机制,能让模型在较短的信用路径上稳定收敛,再逐步引入更长的依赖关系。

效果怎么样?

实验结果表明,HRM-Text 在架构效率、训练目标和整体性能上都表现出明显优势。

1.在固定训练算力下,循环架构是否更有效

结果显示,在 FLOPs 对齐条件下,HRM 1B 在大多数基准上优于 Transformer 1B、Transformer 3B、Looped Transformer 1B 和 RINS 1B;与 TRM 的对比也表明,HRM 的训练更稳定。

图|与 Transformer 模型的性能和稳定性比较。HRM 在所有规模下都保持了稳定的训练动态,而 Transformer 模型在10 亿参数规模下出现了严重的不稳定。此外,在 0.6B 规模下,HRM 仅需比 Transformer 模型少 2倍的计算量,就能在大多数基准上取得具有竞争力的表现。

2.任务完成目标和 PrefixLM 是否有帮助

消融实验显示,在 FLOPs 对齐条件下,1B Transformer 的 MMLU 从标准自回归的 40.55,依次提升到引入任务完成目标后的 47.72、加入 PrefixLM 后的 53.15,以及换成 HRM 架构后的 60.73。

图|不同模型架构与训练目标之间的性能比较

3.HRM-Text 与当代开放模型相比效率如何

HRM-Text 1B 在 MMLU、ARC-C、DROP、GSM8K、MATH 上分别达到 60.7、81.9、82.2、84.5 和 56.2。相比训练预算普遍更大的开放模型,它只用 400 亿唯一 token 和 1B 参数,就进入了 2B 到 7B 开源模型的性能区间;训练所需的token 最多少了 900 倍,算力开销最多少了 432 倍。

图|HRM-Text 1B 与同期全开源模型及开放权重模型的评测结果

4.循环结构是否带来了更大的有效深度

结果显示,标准 Transformer 和 Looped Transformer 在较浅层就趋于稳定,HRM 则在更深层仍保持更明显的块间表示变化、更低的余弦相似度和更高的 logit lens KL 值。

图|有效深度分析。

图|逐层 Logit Lens KL 分析。

不足与未来方向

尽管 HRM-Text 在推理密集型任务上展现了出强劲表现,但这一方法依然存在局限,并提出了未来的研究方向。

1.走向“知识”与“推理”的解耦

目前,更广泛的事实知识覆盖仍然更依赖模型规模与数据广度。HRM-Text 只在 400 亿唯一 token 上训练,且显式知识型来源只占任务格式化混合数据的一部分。未来,研究人员需要将紧凑的推理核心与外部事实存储分开设计,把知识广度交给精选语料、检索增强模块或可学习记忆。

2.自适应计算时间

HRM-Text 的循环调度带来了更大的有效串行深度,但这也意味着模型在推理时需要执行固定数量的递归步骤。未来,一个值得探索的方向是引入自适应计算时间机制,使简单样本能够更早停止计算,并将完整的循环预算保留给困难样本,减少推理成本。

3.现有规模化验证范围仍然有限

当前的 scaling 实验只覆盖到 3B 参数的 Transformer 对照组和 1B 参数的 HRM-Text。研究团队表示,在更大模型规模下是否还能保持类似的效率优势,仍有待后续工作进一步验证。

4.PrefixLM 与推理框架

目前,PrefixLM 在实际部署中仍面临一定的工程实现限制。尽管它能够运行在 vLLM 等标准文本生成推理框架上,但这要求框架在 prefill 阶段支持自定义注意力掩码。如果将其扩展至多轮对话场景,还需进一步设计 KV-cache 机制,既保证用户片段内部保持双向可见,也要确保助手端的生成过程继续遵循因果约束。

更多技术细节,详见原论文。

本文来自微信公众号“学术头条”(ID:SciTouTiao),作者:夏千斯

Pertanyaan Terkait

QHRM-Text模型相比传统Transformer模型在训练资源消耗上有多大的提升？

AHRM-Text模型在训练中，所需的训练Token比标准baseline模型少约100到900倍，所需的估计计算量比标准baseline模型少约96到432倍。

QHRM-Text模型的核心架构是什么，它与标准Transformer的主要区别在哪里？

AHRM-Text的核心架构是分层循环模型。它与标准Transformer的主要区别在于：它采用双时间尺度的设计，将计算拆分为慢速H模块和快速L模块，并在同一token上进行多轮递归更新，从而在不增加参数量的前提下提高了计算深度，而标准Transformer对每个token只进行一次前向传播。

QHRM-Text在哪些主流基准测试中取得了什么成绩？

A在使用1B参数、40B非重复token训练后，HRM-Text在多个主流基准测试中取得的成绩如下：MMLU（60.7%）、ARC-C（81.9%）、DROP（82.2%）、GSM8K（84.5%）、MATH（56.2%）。

Q为了提高递归训练的稳定性，研究团队引入了哪两项关键技术？

A研究团队引入了两项关键技术：1. MagicNorm，一种混合归一化策略，它利用截断反向传播下前向与反向计算深度的不对称性，在模块内部采用PreNorm并在模块出口额外加入归一化。2. Warmup Deep Credit Assignment，它在训练初期仅对最后2个递归步骤回传梯度，随后线性扩展至最后5步。

Q文章指出了HRM-Text方法的哪些局限和未来的研究方向？

A文章指出的局限和未来研究方向包括：1. 需要将“知识”与“推理”解耦，即把知识广度交给精选语料、检索增强模块或可学习记忆，而非仅依赖模型参数。2. 引入自适应计算时间机制，使简单样本能更早停止计算，以节省推理成本。3. 当前规模化验证仅到3B参数范围，更大规模下的效率优势有待验证。4. PrefixLM在实际部署中面临工程实现限制，需进一步设计适配多轮对话的KV-cache机制。

Bacaan Terkait

Selain Lonjakan Jepang dan Korea, Pasar Saham Singapura Tembus Rekor Tertinggi Sejarah, Didorong Siklus Lokal oleh Pertumbuhan Ekspor AI

marsbit42m yang lalu

Ketika Google Juga 'Mencetak Saham' untuk Membuat AI, Narasi Neocloud dengan Valuasi Tinggi Dipecahkan oleh Siapa?

marsbit1j yang lalu

Berhenti Fokus pada GPU, Intel Lemparkan Gerakan Besar, Bisakah Mengakhiri Monopoli Komputasi NVIDIA?

Dalam dua tahun terakhir, GPU telah menjadi pusat perangkat keras AI, mendorong dominasi Nvidia. Namun, di COMPUTEX 2026, Intel menyajikan perspektif berbeda: **era AI selanjutnya tidak boleh hanya berfokus pada GPU**. Kuncinya adalah **Agentic AI (agen cerdas)**. Agen cerdas mengubah paradigma komputasi dari sistem tanya-jawab menjadi entitas yang aktif "berpikir, merencanakan, bertindak, dan merefleksikan" dalam alur kerja nyata. Pergeseran ini akan **membentuk ulang alokasi komputasi di pusat data**. Untuk beban kerja pelatihan model, rasio CPU:GPU bisa mencapai 1:8, tetapi untuk inferensi agen cerdas yang membutuhkan pengaturan tugas, pemanggilan alat, dan koordinasi sistem, rasio tersebut bergerak menuju 1:1 atau bahkan membutuhkan kepadatan CPU lebih tinggi. Intel meluncurkan **prosesor Xeon 6+** berbasis proses 18A, dengan hingga 288 core efisiensi dan 576MB cache L3, dirancang untuk beban kerja cloud-native, Agentic AI, dan jaringan yang padat. Solusi rak yang ditawarkan menawarkan efisiensi energi lebih tinggi. Lebih lanjut, Intel memperkenalkan **arsitektur inferensi terpisah (fully decoupled inference)** bekerja sama dengan mitra seperti SambaNova. Skema ini membagi tugas inferensi agen cerdas di antara CPU Xeon 6 (untuk pengaturan), SambaNova SN40 RDU (dekode), dan GPU NVIDIA Blackwell (prefill), sehingga setiap tahap berjalan pada perangkat keras paling optimal. Di sisi *edge*, **prosesor Core Ultra Gen 3** menjadi inti AI lokal, memungkinkan alokasi beban kerja dinamis antara perangkat dan cloud untuk mengurangi biaya, latensi, dan meningkatkan privasi. Intel juga memperluasnya ke *gaming handheld* dan komputasi tepi. Strategi Intel melampaui prosesor umum. Perusahaan menekankan **chip khusus/custom** melalui kolaborasi dengan pelanggan seperti Google (untuk IPU) dan Ericsson, menawarkan solusi yang disesuaikan untuk kinerja dan efisiensi maksimal. Intel bertujuan untuk menjadi **"ada di mana-mana"** dengan memenuhi beragam kebutuhan di seluruh rantai AI – dari pengaturan agen di pusat data, inferensi terpisah, AI lokal di PC, hingga chip khusus untuk berbagai industri. Tantangan tetap ada dari dominasi Nvidia dan persaingan AMD, tetapi Intel melihat peluang dalam **periode redistribusi infrastruktur AI** di mana efisiensi sistem secara keseluruhan, bukan hanya kinerja puncak chip tunggal, menjadi kunci.

marsbit1j yang lalu

Berhenti Fokus pada GPU, Intel Lemparkan Gerakan Besar, Bisakah Mengakhiri Monopoli Komputasi NVIDIA?

marsbit1j yang lalu

Jembatan Cross-Chain Berubah Aktif, LI.FI Gunakan Arsitektur Intensi untuk Menjadi Pusat Likuiditas Institusi TradFi

**LI.FI Beradaptasi: Dari Jembatan Lintas Rantai ke Pusat Likuiditas untuk Institusi TradFi dengan Arsitektur Intents** Saat aset TradFi seperti pembayaran stablecoin dan RWA mulai berintegrasi dengan ekosistem on-chain, LI.FI, sebuah protokol jembatan lintas rantai, tidak tinggal diam. Menghadapi penurunan volume transaksi di sektor jembatan dan likuiditas pasar yang menyusut, LI.FI secara aktif mencari peran baru. Memanfaatkan pendanaan segar, LI.FI memperluas layanannya. Mereka meluncurkan **LI.FI Intents**, sebuah arsitektur eksekusi berbasis *intent* yang menargetkan perusahaan fintech, *neo-bank*, dompet digital, dan institusi keuangan terdaftar. Produk ini bertujuan menjadi lapisan eksekusi dasar untuk pembayaran stablecoin, RWA, dan likuiditas on-chain yang sesuai regulasi. LI.FI Intents menawarkan: * **Kemudahan Penggunaan:** Mengotomatiskan proses kompleks seperti manajemen gas dan langkah-langkah teknis blockchain, memungkinkan pertukaran stablecoin lintas rantai yang presisi. * **Kepatuhan (Kunci Utama):** Jaringannya terdiri dari entitas terverifikasi. Institusi dapat menyetujui pesanan secara individual dan memilih sistem pemrosesan yang tepercaya. Semua dompet yang berinteraksi diperiksa sesuai daftar OFAC AS. * **Cakupan Ekosistem Luas:** Mendukung jaringan utama seperti EVM, Solana, dan Tron. Intinya, LI.FI beralih dari sekadar "protokol transmisi likuiditas" menjadi penyedia layanan otomatis tingkat perusahaan. Dengan LI.FI Intents, pengguna institusional hanya perlu menetapkan tujuan akhir (*intent*), sementara sistem yang efisien dan sesuai regulasi akan menangani seluruh proses eksekusinya.

Odaily星球日报2j yang lalu

Jembatan Cross-Chain Berubah Aktif, LI.FI Gunakan Arsitektur Intensi untuk Menjadi Pusat Likuiditas Institusi TradFi

Odaily星球日报2j yang lalu

"Xiaomei" dan Yuanbao Saling Terhubung, Ini Sinyal Uji Coba untuk Smart Agent WeChat?

**Ringkasan:** Artikel ini membahas kemitraan antara asisten AI Meituan, "Xiaomei," dan asisten AI Tencent, "Yuanbao." Kolaborasi ini, yang memungkinkan pengguna Yuanbao mengakses layanan hidup lokal Meituan, dilihat sebagai strategi saling menguntungkan: Meituan mendapatkan akses ke pintu masuk AI baru, sedangkan Yuanbao memperkaya kemampuan layanannya. Kerja sama ini juga dianggap sebagai "tes tekanan" untuk persiapan peluncuran "WeChat Agent" Tencent, asisten AI terintegrasi di WeChat yang dapat menjalankan jutaan mini-program. Keberhasilan kemitraan Meituan-Yuanbao dapat menentukan kesediaan platform besar lain untuk bergabung dengan ekosistem WeChat Agent. Artikel ini menyoroti tantangan yang dihadapi Meituan dari AI asisten seperti Doubao (ByteDance) dan Qianwen (Alibaba), yang mengintegrasikan layanan mereka sendiri dan berpotensi melewati "parit pertahanan" Meituan. Sementara itu, Yuanbao, meskipun terintegrasi dengan ekosistem Tencent, tertinggal dalam hal pengguna aktif dan kurangnya ekosistem layanan komersial mandiri, sehingga kemitraan dengan Meituan menjadi penting. Tantangan utama kolaborasi ini meliputi: batasan pengalaman pengguna karena arsitektur "Agent to Agent" yang terpisah, pembagian keuntungan, dan kelancaran pengalaman pengguna di antara dua platform yang berbeda. Namun, jika berhasil, ini dapat membuka jalan bagi model kolaborasi serupa di ekosistem WeChat Agent di masa depan.

marsbit3j yang lalu

"Xiaomei" dan Yuanbao Saling Terhubung, Ini Sinyal Uji Coba untuk Smart Agent WeChat?

marsbit3j yang lalu

Trading

Spot

Futures

Artikel Populer

Apa Itu $S$

Memahami SPERO: Tinjauan Komprehensif Pengenalan SPERO Seiring dengan perkembangan lanskap inovasi, munculnya teknologi web3 dan proyek cryptocurrency memainkan peran penting dalam membentuk masa depan digital. Salah satu proyek yang telah menarik perhatian di bidang dinamis ini adalah SPERO, yang dilambangkan sebagai SPERO,$$s$. Artikel ini bertujuan untuk mengumpulkan dan menyajikan informasi terperinci tentang SPERO, untuk membantu para penggemar dan investor memahami dasar-dasar, tujuan, dan inovasi dalam domain web3 dan crypto. Apa itu SPERO,$$s$? SPERO,$$s$ adalah proyek unik dalam ruang crypto yang berusaha memanfaatkan prinsip desentralisasi dan teknologi blockchain untuk menciptakan ekosistem yang mendorong keterlibatan, utilitas, dan inklusi finansial. Proyek ini dirancang untuk memfasilitasi interaksi peer-to-peer dengan cara baru, memberikan pengguna solusi dan layanan keuangan yang inovatif. Pada intinya, SPERO,$$s$ bertujuan untuk memberdayakan individu dengan menyediakan alat dan platform yang meningkatkan pengalaman pengguna dalam ruang cryptocurrency. Ini termasuk memungkinkan metode transaksi yang lebih fleksibel, mendorong inisiatif yang dipimpin komunitas, dan menciptakan jalur untuk peluang finansial melalui aplikasi terdesentralisasi (dApps). Visi mendasar dari SPERO,$$s$ berputar di sekitar inklusivitas, bertujuan untuk menjembatani kesenjangan dalam keuangan tradisional sambil memanfaatkan manfaat teknologi blockchain. Siapa Pencipta SPERO,$$s$? Identitas pencipta SPERO,$$s$ tetap agak samar, karena ada sumber daya publik yang terbatas yang memberikan informasi latar belakang terperinci tentang pendiriannya. Kurangnya transparansi ini dapat berasal dari komitmen proyek terhadap desentralisasi—sebuah etos yang banyak proyek web3 bagi, memprioritaskan kontribusi kolektif di atas pengakuan individu. Dengan memusatkan diskusi di sekitar komunitas dan tujuan kolektifnya, SPERO,$$s$ mewujudkan esensi pemberdayaan tanpa menonjolkan individu tertentu. Dengan demikian, memahami etos dan misi SPERO tetap lebih penting daripada mengidentifikasi pencipta tunggal. Siapa Investor SPERO,$$s$? SPERO,$$s$ didukung oleh beragam investor mulai dari modal ventura hingga investor malaikat yang berdedikasi untuk mendorong inovasi di sektor crypto. Fokus investor ini umumnya sejalan dengan misi SPERO—memprioritaskan proyek yang menjanjikan kemajuan teknologi sosial, inklusivitas finansial, dan tata kelola terdesentralisasi. Fondasi investor ini biasanya tertarik pada proyek yang tidak hanya menawarkan produk inovatif tetapi juga memberikan kontribusi positif kepada komunitas blockchain dan ekosistemnya. Dukungan dari investor ini memperkuat SPERO,$$s$ sebagai pesaing yang patut diperhitungkan di domain proyek crypto yang berkembang pesat. Bagaimana SPERO,$$s$ Bekerja? SPERO,$$s$ menerapkan kerangka kerja multi-faceted yang membedakannya dari proyek cryptocurrency konvensional. Berikut adalah beberapa fitur kunci yang menekankan keunikan dan inovasinya: Tata Kelola Terdesentralisasi: SPERO,$$s$ mengintegrasikan model tata kelola terdesentralisasi, memberdayakan pengguna untuk berpartisipasi aktif dalam proses pengambilan keputusan mengenai masa depan proyek. Pendekatan ini mendorong rasa kepemilikan dan akuntabilitas di antara anggota komunitas. Utilitas Token: SPERO,$$s$ memanfaatkan token cryptocurrency-nya sendiri, yang dirancang untuk melayani berbagai fungsi dalam ekosistem. Token ini memungkinkan transaksi, hadiah, dan fasilitasi layanan yang ditawarkan di platform, meningkatkan keterlibatan dan utilitas secara keseluruhan. Arsitektur Berlapis: Arsitektur teknis SPERO,$$s$ mendukung modularitas dan skalabilitas, memungkinkan integrasi fitur dan aplikasi tambahan secara mulus seiring dengan perkembangan proyek. Kemampuan beradaptasi ini sangat penting untuk mempertahankan relevansi di lanskap crypto yang selalu berubah. Keterlibatan Komunitas: Proyek ini menekankan inisiatif yang dipimpin komunitas, menggunakan mekanisme yang memberikan insentif untuk kolaborasi dan umpan balik. Dengan memelihara komunitas yang kuat, SPERO,$$s$ dapat lebih baik memenuhi kebutuhan pengguna dan beradaptasi dengan tren pasar. Fokus pada Inklusi: Dengan menawarkan biaya transaksi yang rendah dan antarmuka yang ramah pengguna, SPERO,$$s$ bertujuan untuk menarik basis pengguna yang beragam, termasuk individu yang mungkin sebelumnya tidak terlibat dalam ruang crypto. Komitmen ini terhadap inklusi sejalan dengan misi utamanya untuk memberdayakan melalui aksesibilitas. Garis Waktu SPERO,$$s$ Memahami sejarah proyek memberikan wawasan penting tentang trajektori dan tonggak perkembangannya. Berikut adalah garis waktu yang disarankan yang memetakan peristiwa signifikan dalam evolusi SPERO,$$s$: Fase Konseptualisasi dan Ideasi: Ide awal yang membentuk dasar SPERO,$$s$ dikembangkan, sangat selaras dengan prinsip desentralisasi dan fokus komunitas dalam industri blockchain. Peluncuran Whitepaper Proyek: Setelah fase konseptual, whitepaper komprehensif yang merinci visi, tujuan, dan infrastruktur teknologi SPERO,$$s$ dirilis untuk menarik minat dan umpan balik komunitas. Pembangunan Komunitas dan Keterlibatan Awal: Upaya jangkauan aktif dilakukan untuk membangun komunitas pengguna awal dan investor potensial, memfasilitasi diskusi seputar tujuan proyek dan mendapatkan dukungan. Acara Generasi Token: SPERO,$$s$ melakukan acara generasi token (TGE) untuk mendistribusikan token asli kepada pendukung awal dan membangun likuiditas awal dalam ekosistem. Peluncuran dApp Awal: Aplikasi terdesentralisasi (dApp) pertama yang terkait dengan SPERO,$$s$ diluncurkan, memungkinkan pengguna untuk terlibat dengan fungsionalitas inti platform. Pengembangan Berkelanjutan dan Kemitraan: Pembaruan dan peningkatan berkelanjutan terhadap penawaran proyek, termasuk kemitraan strategis dengan pemain lain di ruang blockchain, telah membentuk SPERO,$$s$ menjadi pemain yang kompetitif dan berkembang di pasar crypto. Kesimpulan SPERO,$$s$ berdiri sebagai bukti potensi web3 dan cryptocurrency untuk merevolusi sistem keuangan dan memberdayakan individu. Dengan komitmen terhadap tata kelola terdesentralisasi, keterlibatan komunitas, dan fungsionalitas yang dirancang secara inovatif, ia membuka jalan menuju lanskap keuangan yang lebih inklusif. Seperti halnya investasi di ruang crypto yang berkembang pesat, calon investor dan pengguna dianjurkan untuk melakukan riset secara menyeluruh dan terlibat dengan perkembangan yang sedang berlangsung dalam SPERO,$$s$. Proyek ini menunjukkan semangat inovatif industri crypto, mengundang eksplorasi lebih lanjut ke dalam berbagai kemungkinan yang ada. Meskipun perjalanan SPERO,$$s$ masih berlangsung, prinsip-prinsip dasarnya mungkin benar-benar mempengaruhi masa depan cara kita berinteraksi dengan teknologi, keuangan, dan satu sama lain dalam ekosistem digital yang saling terhubung.

75 Total TayanganDipublikasikan pada 2024.12.17Diperbarui pada 2024.12.17

Apa Itu AGENT S

Agent S: Masa Depan Interaksi Otonom di Web3 Pendahuluan Dalam lanskap Web3 dan cryptocurrency yang terus berkembang, inovasi secara konstan mendefinisikan ulang cara individu berinteraksi dengan platform digital. Salah satu proyek perintis, Agent S, menjanjikan untuk merevolusi interaksi manusia-komputer melalui kerangka agen terbuka. Dengan membuka jalan untuk interaksi otonom, Agent S bertujuan untuk menyederhanakan tugas-tugas kompleks, menawarkan aplikasi transformasional dalam kecerdasan buatan (AI). Eksplorasi mendetail ini akan menyelami seluk-beluk proyek, fitur uniknya, dan implikasinya untuk domain cryptocurrency. Apa itu Agent S? Agent S berdiri sebagai kerangka agen terbuka yang inovatif, dirancang khusus untuk mengatasi tiga tantangan mendasar dalam otomatisasi tugas komputer: Memperoleh Pengetahuan Spesifik Domain: Kerangka ini secara cerdas belajar dari berbagai sumber pengetahuan eksternal dan pengalaman internal. Pendekatan ganda ini memberdayakannya untuk membangun repositori pengetahuan spesifik domain yang kaya, meningkatkan kinerjanya dalam pelaksanaan tugas. Perencanaan Selama Rentang Tugas yang Panjang: Agent S menggunakan perencanaan hierarkis yang ditingkatkan pengalaman, pendekatan strategis yang memfasilitasi pemecahan dan pelaksanaan tugas-tugas rumit dengan efisien. Fitur ini secara signifikan meningkatkan kemampuannya untuk mengelola beberapa subtugas dengan efisien dan efektif. Menangani Antarmuka Dinamis dan Tidak Seragam: Proyek ini memperkenalkan Antarmuka Agen-Komputer (ACI), solusi inovatif yang meningkatkan interaksi antara agen dan pengguna. Dengan memanfaatkan Model Bahasa Besar Multimodal (MLLM), Agent S dapat menavigasi dan memanipulasi berbagai antarmuka pengguna grafis dengan mulus. Melalui fitur-fitur perintis ini, Agent S menyediakan kerangka kerja yang kuat yang mengatasi kompleksitas yang terlibat dalam mengotomatisasi interaksi manusia dengan mesin, membuka jalan untuk berbagai aplikasi dalam AI dan seterusnya. Siapa Pencipta Agent S? Meskipun konsep Agent S secara fundamental inovatif, informasi spesifik tentang penciptanya tetap samar. Pencipta saat ini tidak diketahui, yang menyoroti baik tahap awal proyek atau pilihan strategis untuk menjaga anggota pendiri tetap tersembunyi. Terlepas dari anonimitas, fokus tetap pada kemampuan dan potensi kerangka kerja. Siapa Investor Agent S? Karena Agent S relatif baru dalam ekosistem kriptografi, informasi terperinci mengenai investor dan pendukung keuangannya tidak secara eksplisit didokumentasikan. Kurangnya wawasan yang tersedia untuk umum mengenai fondasi investasi atau organisasi yang mendukung proyek ini menimbulkan pertanyaan tentang struktur pendanaannya dan peta jalan pengembangannya. Memahami dukungan sangat penting untuk mengukur keberlanjutan proyek dan potensi dampak pasar. Bagaimana Cara Kerja Agent S? Di inti Agent S terletak teknologi mutakhir yang memungkinkannya berfungsi secara efektif dalam berbagai pengaturan. Model operasionalnya dibangun di sekitar beberapa fitur kunci: Interaksi Komputer yang Mirip Manusia: Kerangka ini menawarkan perencanaan AI yang canggih, berusaha untuk membuat interaksi dengan komputer lebih intuitif. Dengan meniru perilaku manusia dalam pelaksanaan tugas, ia menjanjikan untuk meningkatkan pengalaman pengguna. Memori Naratif: Digunakan untuk memanfaatkan pengalaman tingkat tinggi, Agent S memanfaatkan memori naratif untuk melacak sejarah tugas, sehingga meningkatkan proses pengambilan keputusannya. Memori Episodik: Fitur ini memberikan panduan langkah demi langkah kepada pengguna, memungkinkan kerangka untuk menawarkan dukungan kontekstual saat tugas berlangsung. Dukungan untuk OpenACI: Dengan kemampuan untuk berjalan secara lokal, Agent S memungkinkan pengguna untuk mempertahankan kontrol atas interaksi dan alur kerja mereka, sejalan dengan etos terdesentralisasi Web3. Integrasi Mudah dengan API Eksternal: Versatilitas dan kompatibilitasnya dengan berbagai platform AI memastikan bahwa Agent S dapat dengan mulus masuk ke dalam ekosistem teknologi yang ada, menjadikannya pilihan menarik bagi pengembang dan organisasi. Fungsionalitas ini secara kolektif berkontribusi pada posisi unik Agent S dalam ruang kripto, saat ia mengotomatisasi tugas-tugas kompleks yang melibatkan banyak langkah dengan intervensi manusia yang minimal. Seiring proyek ini berkembang, aplikasi potensialnya di Web3 dapat mendefinisikan ulang bagaimana interaksi digital berlangsung. Garis Waktu Agent S Pengembangan dan tonggak Agent S dapat dirangkum dalam garis waktu yang menyoroti peristiwa pentingnya: 27 September 2024: Konsep Agent S diluncurkan dalam sebuah makalah penelitian komprehensif berjudul “Sebuah Kerangka Agen Terbuka yang Menggunakan Komputer Seperti Manusia,” yang menunjukkan dasar untuk proyek ini. 10 Oktober 2024: Makalah penelitian tersebut dipublikasikan secara terbuka di arXiv, menawarkan eksplorasi mendalam tentang kerangka kerja dan evaluasi kinerjanya berdasarkan tolok ukur OSWorld. 12 Oktober 2024: Sebuah presentasi video dirilis, memberikan wawasan visual tentang kemampuan dan fitur Agent S, lebih lanjut melibatkan pengguna dan investor potensial. Tanda-tanda dalam garis waktu ini tidak hanya menggambarkan kemajuan Agent S tetapi juga menunjukkan komitmennya terhadap transparansi dan keterlibatan komunitas. Poin Kunci Tentang Agent S Seiring kerangka Agent S terus berkembang, beberapa atribut kunci menonjol, menekankan sifat inovatif dan potensinya: Kerangka Inovatif: Dirancang untuk memberikan penggunaan komputer yang intuitif seperti interaksi manusia, Agent S membawa pendekatan baru untuk otomatisasi tugas. Interaksi Otonom: Kemampuan untuk berinteraksi secara otonom dengan komputer melalui GUI menandakan lompatan menuju solusi komputasi yang lebih cerdas dan efisien. Otomatisasi Tugas Kompleks: Dengan metodologinya yang kuat, ia dapat mengotomatisasi tugas-tugas kompleks yang melibatkan banyak langkah, membuat proses lebih cepat dan kurang rentan terhadap kesalahan. Perbaikan Berkelanjutan: Mekanisme pembelajaran memungkinkan Agent S untuk belajar dari pengalaman masa lalu, terus meningkatkan kinerja dan efektivitasnya. Versatilitas: Adaptabilitasnya di berbagai lingkungan operasi seperti OSWorld dan WindowsAgentArena memastikan bahwa ia dapat melayani berbagai aplikasi. Saat Agent S memposisikan dirinya di lanskap Web3 dan kripto, potensinya untuk meningkatkan kemampuan interaksi dan mengotomatisasi proses menandakan kemajuan signifikan dalam teknologi AI. Melalui kerangka inovatifnya, Agent S mencerminkan masa depan interaksi digital, menjanjikan pengalaman yang lebih mulus dan efisien bagi pengguna di berbagai industri. Kesimpulan Agent S mewakili lompatan berani ke depan dalam pernikahan AI dan Web3, dengan kapasitas untuk mendefinisikan ulang cara kita berinteraksi dengan teknologi. Meskipun masih dalam tahap awal, kemungkinan aplikasinya sangat luas dan menarik. Melalui kerangka komprehensifnya yang mengatasi tantangan kritis, Agent S bertujuan untuk membawa interaksi otonom ke garis depan pengalaman digital. Saat kita melangkah lebih dalam ke dalam ranah cryptocurrency dan desentralisasi, proyek-proyek seperti Agent S pasti akan memainkan peran penting dalam membentuk masa depan teknologi dan kolaborasi manusia-komputer.

909 Total TayanganDipublikasikan pada 2025.01.14Diperbarui pada 2025.01.14

Cara Membeli S

Selamat datang di HTX.com! Kami telah membuat pembelian Sonic (S) menjadi mudah dan nyaman. Ikuti panduan langkah demi langkah kami untuk memulai perjalanan kripto Anda.Langkah 1: Buat Akun HTX AndaGunakan alamat email atau nomor ponsel Anda untuk mendaftar akun gratis di HTX. Rasakan perjalanan pendaftaran yang mudah dan buka semua fitur.Dapatkan Akun SayaLangkah 2: Buka Beli Kripto, lalu Pilih Metode Pembayaran AndaKartu Kredit/Debit: Gunakan Visa atau Mastercard Anda untuk membeli Sonic (S) secara instan.Saldo: Gunakan dana dari saldo akun HTX Anda untuk melakukan trading dengan lancar.Pihak Ketiga: Kami telah menambahkan metode pembayaran populer seperti Google Pay dan Apple Pay untuk meningkatkan kenyamanan.P2P: Lakukan trading langsung dengan pengguna lain di HTX.Over-the-Counter (OTC): Kami menawarkan layanan yang dibuat khusus dan kurs yang kompetitif bagi para trader.Langkah 3: Simpan Sonic (S) AndaSetelah melakukan pembelian, simpan Sonic (S) di akun HTX Anda. Selain itu, Anda dapat mengirimkannya ke tempat lain melalui transfer blockchain atau menggunakannya untuk memperdagangkan mata uang kripto lainnya.Langkah 4: Lakukan trading Sonic (S)Lakukan trading Sonic (S) dengan mudah di pasar spot HTX. Cukup akses akun Anda, pilih pasangan perdagangan, jalankan trading, lalu pantau secara real-time. Kami menawarkan pengalaman yang ramah pengguna baik untuk pemula maupun trader berpengalaman.

1.3k Total TayanganDipublikasikan pada 2025.01.15Diperbarui pada 2026.06.02

Diskusi

Selamat datang di Komunitas HTX. Di sini, Anda bisa terus mendapatkan informasi terbaru tentang perkembangan platform terkini dan mendapatkan akses ke wawasan pasar profesional. Pendapat pengguna mengenai harga S (S) disajikan di bawah ini.

清华00后校友王冠再出新作：用1/900 token、1/432算力，颠覆Transformer预训练模型

Abstrak

HRM-Text 是怎样设计的?

效果怎么样?

不足与未来方向

Pertanyaan Terkait

Bacaan Terkait

Selain Lonjakan Jepang dan Korea, Pasar Saham Singapura Tembus Rekor Tertinggi Sejarah, Didorong Siklus Lokal oleh Pertumbuhan Ekspor AI

Ketika Google Juga 'Mencetak Saham' untuk Membuat AI, Narasi Neocloud dengan Valuasi Tinggi Dipecahkan oleh Siapa?

Berhenti Fokus pada GPU, Intel Lemparkan Gerakan Besar, Bisakah Mengakhiri Monopoli Komputasi NVIDIA?

Jembatan Cross-Chain Berubah Aktif, LI.FI Gunakan Arsitektur Intensi untuk Menjadi Pusat Likuiditas Institusi TradFi

"Xiaomei" dan Yuanbao Saling Terhubung, Ini Sinyal Uji Coba untuk Smart Agent WeChat?

Trading

Artikel Populer

Apa Itu $S$

Apa Itu AGENT S

Cara Membeli S

Diskusi

Kategori Populer

Tag Populer