Alumni Tsinghua '00 Wang Guan Kembali Hadir dengan Karya Baru: Gunakan Token 1/900, Komputasi 1/432, Ubah Paradigma Model Pra-Latihan Transformer

marsbitDipublikasikan tanggal 2026-05-26Terakhir diperbarui pada 2026-05-26

Abstrak

Alumni muda 00-an Universitas Tsinghua, Wang Guan, dan timnya merilis karya baru: model pra-pelatihan efisien HRM-Text, yang menggunakan model rekursif berlapis (HRM) untuk menggantikan Transformer standar. Dengan hanya 1B parameter dan dilatih pada 40B token unik dengan biaya sekitar $1.500, HRM-Text mencapai performa setara model sumber terbuka 2B hingga 7B dalam benchmark seperti MMLU (60,7%) dan GSM8K (84,5%). Metode ini menggunakan 100-900 kali lebih sedikit token pelatihan dan 96-432 kali lebih sedikit perhitungan dibanding baseline standar. Arsitekturnya membagi komputasi menjadi modul H (lambat) dan L (cepat) dengan pembaruan rekursif multi-langkah, sementara target pelatihannya berfokus hanya pada bagian jawaban dalam pasangan instruksi-jawaban, menggunakan masker PrefixLM. Pendekatan ini menunjukkan bahwa prior struktural dan target pelatihan yang ditargetkan dapat secara signifikan menurunkan ambang batas pra-pelatihan. Namun, ada batasan seperti cakupan pengetahuan yang terbatas dan kebutuhan validasi skala lebih besar di masa depan.

Menerobos paradigma pra-latihan model besar tradisional, tim alumni Tsinghua '00 Wang Guan kembali menampilkan karya terbaru:

Mereka memanfaatkan Model Rekursif Berlapis (HRM) untuk menggantikan Transformer standar, dan mengusulkan pra-latihan efisien HRM-Text yang melampaui Scaling.

Tautan makalah:https://arxiv.org/abs/2605.20613

Dengan hanya menggunakan token pelatihan sekitar 100-900 kali lebih sedikit dan perkiraan daya komputasi 96-432 kali lebih sedikit daripada model baseline standar, HRM-Text tetap menunjukkan performa yang setara dengan model sumber terbuka berparameter 2B hingga 7B.

Secara bersamaan, dengan parameter 1B, token unik 40B, dan biaya pelatihan sekitar $1500, HRM-Text mencapai hasil berikut dalam tes tolok ukur utama: MMLU 60.7%, ARC-C 81.9%, DROP 82.2%, GSM8K 84.5%, MATH 56.2%.

Gambar|Efisiensi pra-latihan.

Berdasarkan hal ini, mereka secara eksplisit menyatakan: Priors struktural dan target pelatihan yang tepat sasaran dapat secara signifikan menurunkan ambang batas pra-latihan. Skema pelatihan seperti ini membuat pelatihan model dasar dari nol menjadi layak.

Bagaimana HRM-Text Dirancang?

Pra-latihan Model Bahasa Besar (LLM), semakin bergantung pada segelintir lembaga yang memiliki sumber daya komputasi dan data yang melimpah. Melatih model dasar yang kompetitif sering kali membutuhkan triliunan token, ribuan GPU, bahkan investasi komputasi jutaan dolar.

Namun, pola pelatihan saat ini tidak efisien, sebagian besar komputasi dihabiskan pada token yang tidak relevan seperti prompt, padding format, dan noise halaman web, sehingga banyak daya komputasi pelatihan tidak melayani inferensi secara langsung.

Dalam karya ini, tim peneliti mendesain ulang arsitektur dan target pelatihan, membuat pra-latihan HRM-Text relatif lebih efisien.

Arsitektur: Mengadopsi Model Rekursif Berlapis dengan dua skala waktu, memecah komputasi menjadi modul H lambat dan modul L cepat. Transformer standar hanya melakukan satu kali forward propagation untuk setiap token, sedangkan HRM akan melakukan pembaruan rekursif multi-putaran pada token yang sama. Modul H dan L masing-masing hanya mencakup setengah dari parameter inti rekursif, total komputasi kira-kira setara dengan melakukan 4 kali ekspansi rekursif pada parameter yang sama, meningkatkan kedalaman komputasi tanpa menambah jumlah parameter.

Target Pelatihan: Tidak lagi menggunakan pra-latihan otoregresif teks lengkap standar, melainkan melatih langsung pada pasangan instruksi-jawaban, hanya menghitung loss pada bagian jawaban, dan dikombinasikan dengan mask PrefixLM, sehingga bagian instruksi memperhatikan secara dua arah, dan bagian jawaban dihasilkan dengan mask kausal.

Gambar|Arsitektur HRM-Text.

Untuk meningkatkan stabilitas pelatihan rekursif, tim peneliti memperkenalkan MagicNorm dan Warmup Deep Credit Assignment.

MagicNorm adalah strategi normalisasi hibrida, memanfaatkan asimetri kedalaman komputasi maju dan mundur di bawah Backpropagation Through Time Terpotong (Truncated BPTT), menggunakan PreNorm di dalam modul, dan menambahkan normalisasi ekstra pada pintu keluar modul, sehingga meningkatkan stabilitas pelatihan rekursif dalam.

Warmup Deep Credit Assignment pada awal pelatihan hanya melakukan backpropagation gradient untuk 2 langkah rekursif terakhir, kemudian diperluas secara linear hingga 5 langkah terakhir. Mekanisme pelatihan ini memungkinkan model konvergen dengan stabil pada jalur kredit yang lebih pendek, lalu secara bertahap memperkenalkan dependensi yang lebih panjang.

Bagaimana Hasilnya?

Hasil eksperimen menunjukkan bahwa HRM-Text menunjukkan keunggulan yang jelas dalam efisiensi arsitektur, target pelatihan, dan performa keseluruhan.

1. Dalam daya komputasi pelatihan tetap, apakah arsitektur rekursif lebih efektif

Hasil menunjukkan, dalam kondisi FLOPs yang diselaraskan, HRM 1B mengungguli Transformer 1B, Transformer 3B, Looped Transformer 1B, dan RINS 1B di sebagian besar tolok ukur; perbandingan dengan TRM juga menunjukkan bahwa pelatihan HRM lebih stabil.

Gambar|Perbandingan performa dan stabilitas dengan model Transformer. HRM mempertahankan dinamika pelatihan yang stabil di semua skala, sementara model Transformer menunjukkan ketidakstabilan serius pada skala 1 miliar parameter. Selain itu, pada skala 0.6B, HRM hanya membutuhkan komputasi 2 kali lebih sedikit daripada model Transformer untuk mencapai performa yang kompetitif di sebagian besar tolok ukur.

2. Apakah target penyelesaian tugas dan PrefixLM membantu

Eksperimen ablasi menunjukkan, dalam kondisi FLOPs yang diselaraskan, MMLU Transformer 1B meningkat dari 40.55 (otoregresif standar) menjadi 47.72 setelah memperkenalkan target penyelesaian tugas, kemudian 53.15 setelah menambahkan PrefixLM, dan mencapai 60.73 setelah mengganti arsitektur menjadi HRM.

Gambar|Perbandingan performa antara arsitektur model dan target pelatihan yang berbeda

3. Seberapa efisien HRM-Text dibandingkan dengan model terbuka kontemporer

HRM-Text 1B mencapai 60.7, 81.9, 82.2, 84.5, dan 56.2 pada MMLU, ARC-C, DROP, GSM8K, dan MATH. Dibandingkan dengan model terbuka yang umumnya memiliki anggaran pelatihan lebih besar, hanya dengan 40 miliar token unik dan 1B parameter, HRM-Text memasuki rentang performa model sumber terbuka 2B hingga 7B; token yang dibutuhkan untuk pelatihan paling sedikit 900 kali lebih sedikit, dan biaya komputasi paling sedikit 432 kali lebih sedikit.

Gambar|Hasil evaluasi HRM-Text 1B dengan model sepenuhnya sumber terbuka dan model dengan bobot terbuka sezaman

4. Apakah struktur rekursif membawa kedalaman efektif yang lebih besar

Hasil menunjukkan bahwa Transformer standar dan Looped Transformer cenderung stabil di lapisan yang lebih dangkal, sedangkan HRM tetap menunjukkan perubahan representasi antar-blok yang lebih jelas, similaritas kosinus yang lebih rendah, dan nilai KL logit lens yang lebih tinggi di lapisan yang lebih dalam.

Gambar|Analisis kedalaman efektif.

Gambar|Analisis Logit Lens KL per lapisan.

Kekurangan dan Arah Masa Depan

Meskipun HRM-Text menunjukkan performa kuat dalam tugas-tugas intensif penalaran, metode ini masih memiliki keterbatasan, dan mengusulkan arah penelitian di masa depan.

1. Menuju pemisahan "Pengetahuan" dan "Penalaran"

Saat ini, cakupan pengetahuan faktual yang lebih luas masih lebih bergantung pada skala model dan keluasan data. HRM-Text hanya dilatih pada 40 miliar token unik, dan sumber pengetahuan eksplisit hanya menjadi bagian dari data campuran yang diformat tugas. Di masa depan, peneliti perlu mendesain secara terpisah inti penalaran yang kompak dengan penyimpanan fakta eksternal, menyerahkan keluasan pengetahuan kepada korpus terpilih, modul augmentasi retrieval, atau memori yang dapat dipelajari.

2. Waktu Komputasi Adaptif

Penjadwalan rekursif HRM-Text membawa kedalaman serial efektif yang lebih besar, tetapi ini juga berarti model perlu mengeksekusi jumlah langkah rekursif tetap selama inferensi. Di masa depan, arah yang layak dieksplorasi adalah memperkenalkan mekanisme waktu komputasi adaptif, sehingga sampel sederhana dapat menghentikan komputasi lebih awal, dan mengalokasikan anggaran rekursif penuh untuk sampel sulit, mengurangi biaya inferensi.

3. Ruang lingkup validasi penskalaan yang ada masih terbatas

Eksperimen penskalaan saat ini hanya mencakup grup kontrol Transformer 3B dan HRM-Text 1B. Tim peneliti menyatakan, apakah keunggulan efisiensi serupa masih dapat dipertahankan pada skala model yang lebih besar masih perlu diverifikasi lebih lanjut oleh pekerjaan selanjutnya.

4. PrefixLM dan Kerangka Kerja Inferensi

Saat ini, PrefixLM masih menghadapi batasan implementasi teknikal tertentu dalam penyebaran praktis. Meskipun dapat berjalan pada kerangka kerja inferensi teks standar seperti vLLM, hal ini memerlukan dukungan kerangka kerja terhadap mask perhatian kustom pada tahap prefill. Jika diperluas ke skenario percakapan multi-putaran, perlu mendesain mekanisme KV-cache lebih lanjut, yang memastikan segmen pengguna tetap terlihat dua arah secara internal, dan juga memastikan proses generasi di sisi asisten terus mengikuti batasan kausal.

Untuk detail teknis lebih lanjut, lihat makalah aslinya.

Artikel ini berasal dari akun WeChat publik "学术头条" (ID:SciTouTiao), penulis: Xia Qiansi

Pertanyaan Terkait

QApa yang dimaksud dengan HRM-Text, dan mengapa penelitian ini dianggap inovatif?

AHRM-Text adalah model pra-latihan bahasa yang menggunakan Hierarchical Recurrent Model (HRM) untuk menggantikan Transformer standar. Penelitian ini dianggap inovatif karena mencapai performa yang sebanding dengan model sumber terbuka 2B hingga 7B parameter, namun hanya membutuhkan 1/900 token dan 1/432 daya komputasi dari model baseline standar, sehingga secara signifikan menurunkan hambatan pra-latihan.

QApa saja komponen utama dalam desain arsitektur dan tujuan pelatihan HRM-Text?

AArsitektur utama HRM-Text menggunakan Hierarchical Recurrent Model (HRM) dengan modul H (slow) dan L (fast) untuk melakukan pembaruan rekursif multi-putaran pada token yang sama. Tujuan pelatihannya tidak lagi menggunakan pra-latihan otoregresif standar pada seluruh teks, melainkan langsung melatih pada pasangan instruksi-jawaban, hanya menghitung loss pada bagian jawaban, dan dikombinasikan dengan masker PrefixLM.

QTeknik apa yang digunakan tim peneliti untuk meningkatkan stabilitas pelatihan rekursif pada HRM-Text?

ATim peneliti memperkenalkan dua teknik utama: MagicNorm, sebuah strategi normalisasi campuran yang menggabungkan PreNorm di dalam modul dengan normalisasi tambahan di pintu keluar modul; serta Warmup Deep Credit Assignment, yang pada awal pelatihan hanya menyebarkan gradien untuk 2 langkah rekursif terakhir, kemudian secara bertahap memperpanjang hingga 5 langkah untuk meningkatkan stabilitas.

QBagaimana performa HRM-Text dalam benchmark seperti MMLU dan GSM8K dibandingkan model lain?

AHRM-Text 1B mencapai skor 60.7% pada MMLU dan 84.5% pada GSM8K. Dengan hanya 1B parameter dan 40B token unik, performanya masuk dalam kisaran model sumber terbuka 2B hingga 7B parameter, namun dengan kebutuhan token pelatihan hingga 900 kali lebih sedikit dan daya komputasi hingga 432 kali lebih rendah dibandingkan model baseline.

QApa saja keterbatasan dan arah penelitian masa depan untuk HRM-Text yang disebutkan dalam artikel?

AKeterbatasan dan arah masa depan meliputi: 1) Memisahkan 'pengetahuan' dan 'penalaran', dengan menyimpan pengetahuan eksternal. 2) Menerapkan Adaptive Computation Time untuk mengurangi biaya inferensi. 3) Validasi skalabilitas pada model yang lebih besar masih terbatas. 4) Meningkatkan kerangka kerja inferensi untuk PrefixLM, terutama dalam skenario percakapan multi-putaran.

Bacaan Terkait

Bisnis Baru Tether: Bantu Negara Kecil Menerbitkan Stablecoin

Tether, perusahaan penerbit stablecoin terbesar dunia, mengumumkan kemitraan dengan pemerintah Georgia untuk menerbitkan GEL₮, sebuah stablecoin yang dipatok pada mata uang nasional Georgia, Lari (GEL). Artikel ini menganalisis langkah strategis Tether ini dan implikasinya yang lebih luas. Analisis menunjukkan ini bukan kerja sama satu kali, melainkan bagian dari strategi Tether untuk mengembangkan bisnis standar: **menerbitkan stablecoin mata uang lokal untuk negara-negara berdaulat**. Portofolio Tether (seperti USDT, EURT, MXNT, CNHT) mencerminkan pola ini. Georgia dipilih karena faktor-faktor pendukung seperti ketergantungan tinggi pada remitansi, kerangka regulasi crypto yang sudah siap, dan kemitraan sebelumnya. Bagi Georgia, kemitraan ini menawarkan akselerasi internasionalisasi mata uangnya dengan memanfaatkan jaringan distribusi global dan likuiditas Tether. Bagi Tether, ini adalah percobaan untuk membuat "template" yang dapat direplikasi di negara lain dengan karakteristik serupa, seperti Azerbaijan, Armenia, atau Kenya. Nilai jangka panjangnya terletak pada membangun posisi sebagai **penyedia infrastruktur keuangan lintas negara**. Artikel juga menyoroti risiko dan paradoks dari model ini. Pertama, ada risiko kedaulatan moneter di mana negara menjadi bergantung pada infrastruktur swasta. Kedua, meski disebut sebagai "stablecoin mata uang lokal", pada praktiknya bisa semakin mengintegrasikan negara-negara tersebut ke dalam **sistem dolar informal berbasis USDT** di blockchain. Bank for International Settlements (BIS) telah memperingatkan risiko stabilitas keuangan dari stablecoin swasta. Kesimpulannya, jika kemitraan serupa terulang dalam 12-24 bulan ke depan, Tether dapat berevolusi dari sekadar penerbit stablecoin menjadi **organisasi pencetak mata uang lintas negara di atas blockchain**, sebuah entitas baru yang dibangun dari arbitrase regulasi, efek jaringan, dan standardisasi teknis. Kemitraan Georgia ini berpotensi menjadi titik awal penting bagi tatanan keuangan internasional baru yang mempertanyakan batas antara kedaulatan moneter dan infrastruktur swasta global.

marsbit47m yang lalu

Bisnis Baru Tether: Bantu Negara Kecil Menerbitkan Stablecoin

marsbit47m yang lalu

Trading

Spot
Futures

Artikel Populer

Apa Itu $S$

Memahami SPERO: Tinjauan Komprehensif Pengenalan SPERO Seiring dengan perkembangan lanskap inovasi, munculnya teknologi web3 dan proyek cryptocurrency memainkan peran penting dalam membentuk masa depan digital. Salah satu proyek yang telah menarik perhatian di bidang dinamis ini adalah SPERO, yang dilambangkan sebagai SPERO,$$s$. Artikel ini bertujuan untuk mengumpulkan dan menyajikan informasi terperinci tentang SPERO, untuk membantu para penggemar dan investor memahami dasar-dasar, tujuan, dan inovasi dalam domain web3 dan crypto. Apa itu SPERO,$$s$? SPERO,$$s$ adalah proyek unik dalam ruang crypto yang berusaha memanfaatkan prinsip desentralisasi dan teknologi blockchain untuk menciptakan ekosistem yang mendorong keterlibatan, utilitas, dan inklusi finansial. Proyek ini dirancang untuk memfasilitasi interaksi peer-to-peer dengan cara baru, memberikan pengguna solusi dan layanan keuangan yang inovatif. Pada intinya, SPERO,$$s$ bertujuan untuk memberdayakan individu dengan menyediakan alat dan platform yang meningkatkan pengalaman pengguna dalam ruang cryptocurrency. Ini termasuk memungkinkan metode transaksi yang lebih fleksibel, mendorong inisiatif yang dipimpin komunitas, dan menciptakan jalur untuk peluang finansial melalui aplikasi terdesentralisasi (dApps). Visi mendasar dari SPERO,$$s$ berputar di sekitar inklusivitas, bertujuan untuk menjembatani kesenjangan dalam keuangan tradisional sambil memanfaatkan manfaat teknologi blockchain. Siapa Pencipta SPERO,$$s$? Identitas pencipta SPERO,$$s$ tetap agak samar, karena ada sumber daya publik yang terbatas yang memberikan informasi latar belakang terperinci tentang pendiriannya. Kurangnya transparansi ini dapat berasal dari komitmen proyek terhadap desentralisasi—sebuah etos yang banyak proyek web3 bagi, memprioritaskan kontribusi kolektif di atas pengakuan individu. Dengan memusatkan diskusi di sekitar komunitas dan tujuan kolektifnya, SPERO,$$s$ mewujudkan esensi pemberdayaan tanpa menonjolkan individu tertentu. Dengan demikian, memahami etos dan misi SPERO tetap lebih penting daripada mengidentifikasi pencipta tunggal. Siapa Investor SPERO,$$s$? SPERO,$$s$ didukung oleh beragam investor mulai dari modal ventura hingga investor malaikat yang berdedikasi untuk mendorong inovasi di sektor crypto. Fokus investor ini umumnya sejalan dengan misi SPERO—memprioritaskan proyek yang menjanjikan kemajuan teknologi sosial, inklusivitas finansial, dan tata kelola terdesentralisasi. Fondasi investor ini biasanya tertarik pada proyek yang tidak hanya menawarkan produk inovatif tetapi juga memberikan kontribusi positif kepada komunitas blockchain dan ekosistemnya. Dukungan dari investor ini memperkuat SPERO,$$s$ sebagai pesaing yang patut diperhitungkan di domain proyek crypto yang berkembang pesat. Bagaimana SPERO,$$s$ Bekerja? SPERO,$$s$ menerapkan kerangka kerja multi-faceted yang membedakannya dari proyek cryptocurrency konvensional. Berikut adalah beberapa fitur kunci yang menekankan keunikan dan inovasinya: Tata Kelola Terdesentralisasi: SPERO,$$s$ mengintegrasikan model tata kelola terdesentralisasi, memberdayakan pengguna untuk berpartisipasi aktif dalam proses pengambilan keputusan mengenai masa depan proyek. Pendekatan ini mendorong rasa kepemilikan dan akuntabilitas di antara anggota komunitas. Utilitas Token: SPERO,$$s$ memanfaatkan token cryptocurrency-nya sendiri, yang dirancang untuk melayani berbagai fungsi dalam ekosistem. Token ini memungkinkan transaksi, hadiah, dan fasilitasi layanan yang ditawarkan di platform, meningkatkan keterlibatan dan utilitas secara keseluruhan. Arsitektur Berlapis: Arsitektur teknis SPERO,$$s$ mendukung modularitas dan skalabilitas, memungkinkan integrasi fitur dan aplikasi tambahan secara mulus seiring dengan perkembangan proyek. Kemampuan beradaptasi ini sangat penting untuk mempertahankan relevansi di lanskap crypto yang selalu berubah. Keterlibatan Komunitas: Proyek ini menekankan inisiatif yang dipimpin komunitas, menggunakan mekanisme yang memberikan insentif untuk kolaborasi dan umpan balik. Dengan memelihara komunitas yang kuat, SPERO,$$s$ dapat lebih baik memenuhi kebutuhan pengguna dan beradaptasi dengan tren pasar. Fokus pada Inklusi: Dengan menawarkan biaya transaksi yang rendah dan antarmuka yang ramah pengguna, SPERO,$$s$ bertujuan untuk menarik basis pengguna yang beragam, termasuk individu yang mungkin sebelumnya tidak terlibat dalam ruang crypto. Komitmen ini terhadap inklusi sejalan dengan misi utamanya untuk memberdayakan melalui aksesibilitas. Garis Waktu SPERO,$$s$ Memahami sejarah proyek memberikan wawasan penting tentang trajektori dan tonggak perkembangannya. Berikut adalah garis waktu yang disarankan yang memetakan peristiwa signifikan dalam evolusi SPERO,$$s$: Fase Konseptualisasi dan Ideasi: Ide awal yang membentuk dasar SPERO,$$s$ dikembangkan, sangat selaras dengan prinsip desentralisasi dan fokus komunitas dalam industri blockchain. Peluncuran Whitepaper Proyek: Setelah fase konseptual, whitepaper komprehensif yang merinci visi, tujuan, dan infrastruktur teknologi SPERO,$$s$ dirilis untuk menarik minat dan umpan balik komunitas. Pembangunan Komunitas dan Keterlibatan Awal: Upaya jangkauan aktif dilakukan untuk membangun komunitas pengguna awal dan investor potensial, memfasilitasi diskusi seputar tujuan proyek dan mendapatkan dukungan. Acara Generasi Token: SPERO,$$s$ melakukan acara generasi token (TGE) untuk mendistribusikan token asli kepada pendukung awal dan membangun likuiditas awal dalam ekosistem. Peluncuran dApp Awal: Aplikasi terdesentralisasi (dApp) pertama yang terkait dengan SPERO,$$s$ diluncurkan, memungkinkan pengguna untuk terlibat dengan fungsionalitas inti platform. Pengembangan Berkelanjutan dan Kemitraan: Pembaruan dan peningkatan berkelanjutan terhadap penawaran proyek, termasuk kemitraan strategis dengan pemain lain di ruang blockchain, telah membentuk SPERO,$$s$ menjadi pemain yang kompetitif dan berkembang di pasar crypto. Kesimpulan SPERO,$$s$ berdiri sebagai bukti potensi web3 dan cryptocurrency untuk merevolusi sistem keuangan dan memberdayakan individu. Dengan komitmen terhadap tata kelola terdesentralisasi, keterlibatan komunitas, dan fungsionalitas yang dirancang secara inovatif, ia membuka jalan menuju lanskap keuangan yang lebih inklusif. Seperti halnya investasi di ruang crypto yang berkembang pesat, calon investor dan pengguna dianjurkan untuk melakukan riset secara menyeluruh dan terlibat dengan perkembangan yang sedang berlangsung dalam SPERO,$$s$. Proyek ini menunjukkan semangat inovatif industri crypto, mengundang eksplorasi lebih lanjut ke dalam berbagai kemungkinan yang ada. Meskipun perjalanan SPERO,$$s$ masih berlangsung, prinsip-prinsip dasarnya mungkin benar-benar mempengaruhi masa depan cara kita berinteraksi dengan teknologi, keuangan, dan satu sama lain dalam ekosistem digital yang saling terhubung.

75 Total TayanganDipublikasikan pada 2024.12.17Diperbarui pada 2024.12.17

Apa Itu $S$

Apa Itu AGENT S

Agent S: Masa Depan Interaksi Otonom di Web3 Pendahuluan Dalam lanskap Web3 dan cryptocurrency yang terus berkembang, inovasi secara konstan mendefinisikan ulang cara individu berinteraksi dengan platform digital. Salah satu proyek perintis, Agent S, menjanjikan untuk merevolusi interaksi manusia-komputer melalui kerangka agen terbuka. Dengan membuka jalan untuk interaksi otonom, Agent S bertujuan untuk menyederhanakan tugas-tugas kompleks, menawarkan aplikasi transformasional dalam kecerdasan buatan (AI). Eksplorasi mendetail ini akan menyelami seluk-beluk proyek, fitur uniknya, dan implikasinya untuk domain cryptocurrency. Apa itu Agent S? Agent S berdiri sebagai kerangka agen terbuka yang inovatif, dirancang khusus untuk mengatasi tiga tantangan mendasar dalam otomatisasi tugas komputer: Memperoleh Pengetahuan Spesifik Domain: Kerangka ini secara cerdas belajar dari berbagai sumber pengetahuan eksternal dan pengalaman internal. Pendekatan ganda ini memberdayakannya untuk membangun repositori pengetahuan spesifik domain yang kaya, meningkatkan kinerjanya dalam pelaksanaan tugas. Perencanaan Selama Rentang Tugas yang Panjang: Agent S menggunakan perencanaan hierarkis yang ditingkatkan pengalaman, pendekatan strategis yang memfasilitasi pemecahan dan pelaksanaan tugas-tugas rumit dengan efisien. Fitur ini secara signifikan meningkatkan kemampuannya untuk mengelola beberapa subtugas dengan efisien dan efektif. Menangani Antarmuka Dinamis dan Tidak Seragam: Proyek ini memperkenalkan Antarmuka Agen-Komputer (ACI), solusi inovatif yang meningkatkan interaksi antara agen dan pengguna. Dengan memanfaatkan Model Bahasa Besar Multimodal (MLLM), Agent S dapat menavigasi dan memanipulasi berbagai antarmuka pengguna grafis dengan mulus. Melalui fitur-fitur perintis ini, Agent S menyediakan kerangka kerja yang kuat yang mengatasi kompleksitas yang terlibat dalam mengotomatisasi interaksi manusia dengan mesin, membuka jalan untuk berbagai aplikasi dalam AI dan seterusnya. Siapa Pencipta Agent S? Meskipun konsep Agent S secara fundamental inovatif, informasi spesifik tentang penciptanya tetap samar. Pencipta saat ini tidak diketahui, yang menyoroti baik tahap awal proyek atau pilihan strategis untuk menjaga anggota pendiri tetap tersembunyi. Terlepas dari anonimitas, fokus tetap pada kemampuan dan potensi kerangka kerja. Siapa Investor Agent S? Karena Agent S relatif baru dalam ekosistem kriptografi, informasi terperinci mengenai investor dan pendukung keuangannya tidak secara eksplisit didokumentasikan. Kurangnya wawasan yang tersedia untuk umum mengenai fondasi investasi atau organisasi yang mendukung proyek ini menimbulkan pertanyaan tentang struktur pendanaannya dan peta jalan pengembangannya. Memahami dukungan sangat penting untuk mengukur keberlanjutan proyek dan potensi dampak pasar. Bagaimana Cara Kerja Agent S? Di inti Agent S terletak teknologi mutakhir yang memungkinkannya berfungsi secara efektif dalam berbagai pengaturan. Model operasionalnya dibangun di sekitar beberapa fitur kunci: Interaksi Komputer yang Mirip Manusia: Kerangka ini menawarkan perencanaan AI yang canggih, berusaha untuk membuat interaksi dengan komputer lebih intuitif. Dengan meniru perilaku manusia dalam pelaksanaan tugas, ia menjanjikan untuk meningkatkan pengalaman pengguna. Memori Naratif: Digunakan untuk memanfaatkan pengalaman tingkat tinggi, Agent S memanfaatkan memori naratif untuk melacak sejarah tugas, sehingga meningkatkan proses pengambilan keputusannya. Memori Episodik: Fitur ini memberikan panduan langkah demi langkah kepada pengguna, memungkinkan kerangka untuk menawarkan dukungan kontekstual saat tugas berlangsung. Dukungan untuk OpenACI: Dengan kemampuan untuk berjalan secara lokal, Agent S memungkinkan pengguna untuk mempertahankan kontrol atas interaksi dan alur kerja mereka, sejalan dengan etos terdesentralisasi Web3. Integrasi Mudah dengan API Eksternal: Versatilitas dan kompatibilitasnya dengan berbagai platform AI memastikan bahwa Agent S dapat dengan mulus masuk ke dalam ekosistem teknologi yang ada, menjadikannya pilihan menarik bagi pengembang dan organisasi. Fungsionalitas ini secara kolektif berkontribusi pada posisi unik Agent S dalam ruang kripto, saat ia mengotomatisasi tugas-tugas kompleks yang melibatkan banyak langkah dengan intervensi manusia yang minimal. Seiring proyek ini berkembang, aplikasi potensialnya di Web3 dapat mendefinisikan ulang bagaimana interaksi digital berlangsung. Garis Waktu Agent S Pengembangan dan tonggak Agent S dapat dirangkum dalam garis waktu yang menyoroti peristiwa pentingnya: 27 September 2024: Konsep Agent S diluncurkan dalam sebuah makalah penelitian komprehensif berjudul “Sebuah Kerangka Agen Terbuka yang Menggunakan Komputer Seperti Manusia,” yang menunjukkan dasar untuk proyek ini. 10 Oktober 2024: Makalah penelitian tersebut dipublikasikan secara terbuka di arXiv, menawarkan eksplorasi mendalam tentang kerangka kerja dan evaluasi kinerjanya berdasarkan tolok ukur OSWorld. 12 Oktober 2024: Sebuah presentasi video dirilis, memberikan wawasan visual tentang kemampuan dan fitur Agent S, lebih lanjut melibatkan pengguna dan investor potensial. Tanda-tanda dalam garis waktu ini tidak hanya menggambarkan kemajuan Agent S tetapi juga menunjukkan komitmennya terhadap transparansi dan keterlibatan komunitas. Poin Kunci Tentang Agent S Seiring kerangka Agent S terus berkembang, beberapa atribut kunci menonjol, menekankan sifat inovatif dan potensinya: Kerangka Inovatif: Dirancang untuk memberikan penggunaan komputer yang intuitif seperti interaksi manusia, Agent S membawa pendekatan baru untuk otomatisasi tugas. Interaksi Otonom: Kemampuan untuk berinteraksi secara otonom dengan komputer melalui GUI menandakan lompatan menuju solusi komputasi yang lebih cerdas dan efisien. Otomatisasi Tugas Kompleks: Dengan metodologinya yang kuat, ia dapat mengotomatisasi tugas-tugas kompleks yang melibatkan banyak langkah, membuat proses lebih cepat dan kurang rentan terhadap kesalahan. Perbaikan Berkelanjutan: Mekanisme pembelajaran memungkinkan Agent S untuk belajar dari pengalaman masa lalu, terus meningkatkan kinerja dan efektivitasnya. Versatilitas: Adaptabilitasnya di berbagai lingkungan operasi seperti OSWorld dan WindowsAgentArena memastikan bahwa ia dapat melayani berbagai aplikasi. Saat Agent S memposisikan dirinya di lanskap Web3 dan kripto, potensinya untuk meningkatkan kemampuan interaksi dan mengotomatisasi proses menandakan kemajuan signifikan dalam teknologi AI. Melalui kerangka inovatifnya, Agent S mencerminkan masa depan interaksi digital, menjanjikan pengalaman yang lebih mulus dan efisien bagi pengguna di berbagai industri. Kesimpulan Agent S mewakili lompatan berani ke depan dalam pernikahan AI dan Web3, dengan kapasitas untuk mendefinisikan ulang cara kita berinteraksi dengan teknologi. Meskipun masih dalam tahap awal, kemungkinan aplikasinya sangat luas dan menarik. Melalui kerangka komprehensifnya yang mengatasi tantangan kritis, Agent S bertujuan untuk membawa interaksi otonom ke garis depan pengalaman digital. Saat kita melangkah lebih dalam ke dalam ranah cryptocurrency dan desentralisasi, proyek-proyek seperti Agent S pasti akan memainkan peran penting dalam membentuk masa depan teknologi dan kolaborasi manusia-komputer.

896 Total TayanganDipublikasikan pada 2025.01.14Diperbarui pada 2025.01.14

Apa Itu AGENT S

Cara Membeli S

Selamat datang di HTX.com! Kami telah membuat pembelian Sonic (S) menjadi mudah dan nyaman. Ikuti panduan langkah demi langkah kami untuk memulai perjalanan kripto Anda.Langkah 1: Buat Akun HTX AndaGunakan alamat email atau nomor ponsel Anda untuk mendaftar akun gratis di HTX. Rasakan perjalanan pendaftaran yang mudah dan buka semua fitur.Dapatkan Akun SayaLangkah 2: Buka Beli Kripto, lalu Pilih Metode Pembayaran AndaKartu Kredit/Debit: Gunakan Visa atau Mastercard Anda untuk membeli Sonic (S) secara instan.Saldo: Gunakan dana dari saldo akun HTX Anda untuk melakukan trading dengan lancar.Pihak Ketiga: Kami telah menambahkan metode pembayaran populer seperti Google Pay dan Apple Pay untuk meningkatkan kenyamanan.P2P: Lakukan trading langsung dengan pengguna lain di HTX.Over-the-Counter (OTC): Kami menawarkan layanan yang dibuat khusus dan kurs yang kompetitif bagi para trader.Langkah 3: Simpan Sonic (S) AndaSetelah melakukan pembelian, simpan Sonic (S) di akun HTX Anda. Selain itu, Anda dapat mengirimkannya ke tempat lain melalui transfer blockchain atau menggunakannya untuk memperdagangkan mata uang kripto lainnya.Langkah 4: Lakukan trading Sonic (S)Lakukan trading Sonic (S) dengan mudah di pasar spot HTX. Cukup akses akun Anda, pilih pasangan perdagangan, jalankan trading, lalu pantau secara real-time. Kami menawarkan pengalaman yang ramah pengguna baik untuk pemula maupun trader berpengalaman.

1.3k Total TayanganDipublikasikan pada 2025.01.15Diperbarui pada 2025.03.21

Cara Membeli S

Diskusi

Selamat datang di Komunitas HTX. Di sini, Anda bisa terus mendapatkan informasi terbaru tentang perkembangan platform terkini dan mendapatkan akses ke wawasan pasar profesional. Pendapat pengguna mengenai harga S (S) disajikan di bawah ini.

活动图片