Makalah Baru AMD Mengubah Persepsi: Ketidakstabilan Pelatihan FP4 Bukan Karena Kurangnya Randomness

marsbitDipublikasikan tanggal 2026-05-27Terakhir diperbarui pada 2026-05-27

Abstrak

AMD dan Penn State University menerbitkan makalah baru yang mengungkap alasan di balik ketidakstabilan pelatihan model bahasa besar (LLM) dengan presisi FP4. Bertentangan dengan keyakinan sebelumnya bahwa masalahnya adalah kurangnya randomness, penelitian ini mengidentifikasi penyebab utamanya sebagai akumulasi dan amplifikasi kesalahan struktural dari mikro-skala (micro-scaling) di jalur gradien sensitif, khususnya saat menghitung gradien bobot (Wgrad). Makalah ini berhasil melakukan pra-pelatihan penuh model Llama 3.1-8B menggunakan format MXFP4 pada perangkat keras native FP4 (AMD Instinct MI355X). Untuk menstabilkan pelatihan, tim menerapkan rotasi Hadamard deterministik, bukan metode acak, yang berhasil mengurangi overhead token hanya 8-9% dibandingkan baseline FP8, dengan percepatan pelatihan ujung-ke-ujung 9-10%. Temuan ini memiliki implikasi signifikan: (1) Memberikan diagnosis jelas untuk ketidakstabilan pelatihan presisi rendah, (2) Membuka kemungkinan penggunaan FP4 tidak hanya untuk inferensi tetapi juga untuk pelatihan, berpotensi menggandakan efisiensi perangkat keras yang ada, dan (3) Menggunakan standar terbuka OCP Microscaling, memastikan portabilitas di berbagai perangkat keras. Ini merupakan langkah penting menuju pelatihan AI yang lebih efisien secara ekonomis.

Seperti yang kita ketahui, pelatihan model besar (large model) memerlukan biaya yang sangat tinggi.

Namun, kita juga tahu bahwa menurunkan presisi pelatihan dapat secara signifikan mengurangi biaya pelatihan. DeepSeek-V3 menggunakan pelatihan FP8 untuk menekan biaya menjadi 5,6 juta dolar AS, membuat seluruh industri tercengang.

Setelah kesuksesan FP8, industri terus menjelajahi batas-batas presisi rendah: dari FP8 turun ke FP4, berapa banyak lagi biaya pelatihan yang bisa dikurangi?

Secara teori, throughput komputasi FP4 bisa dua kali lipat dari FP8. NVIDIA Blackwell dan seri AMD MI350 telah mendukung natively operasi FP4 pada level perangkat keras, dengan yang pertama mengklaim kinerja FP4 pada B200 mencapai 4500 TOPS (sparse). Perangkat keras sudah siap, tetapi sisi perangkat lunak dan algoritma selalu terkendala pada satu masalah:

Melatih model besar dari awal dengan FP4, proses pelatihannya sangat tidak stabil.

Selama dua tahun terakhir, pekerjaan seperti pelatihan awal LLM-FP4, NVFP4 telah mencoba jalur ini, tetapi sedikit skema yang dapat menjalankan dengan lancar seluruh proses pelatihan awal pada presisi 4-bit, sekaligus mempertahankan kualitas konvergensi yang mendekati FP8.

Yang lebih rumit adalah, penyebab keruntuhan tersebut tidak pernah jelas. Analisis sebelumnya berpendapat bahwa penyebab ketidakstabilan pelatihan FP4 kemungkinan besar berasal dari kurangnya randomness (acak).

Tapi baru-baru ini, AMD bersama Pennsylvania State University menerbitkan sebuah makalah yang mengubah persepsi tradisional, memberikan diagnosis yang baru dan jelas untuk pelatihan FP4 native.

  • Judul Makalah: Pretraining large language models with MXFP4 on Native FP4 Hardware
  • Tautan Makalah: https://arxiv.org/abs/2605.09825

Makalah ini menyelesaikan seluruh proses pelatihan awal Llama 3.1-8B menggunakan format MXFP4 pada GPU AMD Instinct MI355X, dengan kecepatan pelatihan end-to-end 9-10% lebih cepat dibandingkan baseline FP8, dan overhead token hanya 8-9% lebih banyak. Ini adalah eksperimen lengkap pertama yang menyelesaikan pelatihan awal model besar pada perangkat keras FP4 native (bukan simulasi perangkat lunak).

Yang lebih penting, makalah ini mengungkap masalah inti: Sumber ketidakstabilan pelatihan FP4 bukanlah kurangnya randomness, melainkan akumulasi dan amplifikasi kesalahan mikro-skala struktural di sepanjang jalur gradien yang sensitif.

Apa itu MXFP4

Sebelum menguraikan makalah, penting untuk memahami terlebih dahulu format data MXFP4 ini.

Kuantisasi integer tradisional biasanya menggunakan satu faktor penskalaan untuk seluruh tensor. Desain inti MXFP4 disebut 'Micro-scaling' (Mikro-skala): memotong tensor menjadi blok-blok kecil (misalnya, setiap 32 elemen sebagai satu grup), mengalokasikan eksponen bersama (format E8M0) untuk setiap blok kecil, dan setiap elemen dalam blok direpresentasikan dengan bilangan floating-point 4-bit. Rumus rekonstruksi dapat ditulis sebagai:

Di mana E_shared adalah eksponen maksimum dalam blok, dan Q_FP4 adalah pembulatan terdekat ke nilai yang dapat direpresentasikan oleh floating-point 4-bit.

Keuntungan mikro-skala adalah: setiap blok kecil memiliki rentang dinamisnya sendiri, tidak 'dibajak' oleh pencilan global. Ini membuat kualitas representasi bilangan floating-point 4-bit jauh lebih baik dibandingkan kuantisasi global yang sederhana.

Namun, bahkan dengan mikro-skala, pelatihan FP4 tetap tidak stabil.

Eksperimen Investigasi: Akar Ketidakstabilan

Tim peneliti pertama-tama merancang eksperimen kontrol bertahap untuk menyelidiki.

Satu perhitungan lapisan linear Transformer yang lengkap melibatkan tiga operasi perkalian matriks umum:

Fprop (Forward Propagation / Propagasi Maju): Menghitung Y = XW^T, menghasilkan nilai aktivasi.

Dgrad (Gradien Aktivasi): Menghitung ∇X = ∇Y · W, meneruskan gradien kembali ke input.

Wgrad (Gradien Bobot): Menghitung ∇W = (∇Y)^T · X, menghasilkan gradien untuk memperbarui bobot.

Tim peneliti menjaga semua faktor lain tetap konstan, dan secara bertahap mengganti ketiga operasi ini dari FP8 ke MXFP4, mengamati dampak setiap langkah pada konvergensi. Semua eksperimen dilakukan pada AMD Instinct MI355X menggunakan tensor core FP4 native, tidak bergantung pada simulasi perangkat lunak.

Tugas pelatihan adalah pengaturan standar MLPerf, melakukan pelatihan awal Llama 3.1-8B pada dataset C4, dengan target konvergensi mencapai perplexity 3.3 pada set validasi.

Dua langkah pertama hanya membawa overhead token tambahan yang moderat, tetapi begitu Wgrad juga diganti dengan MXFP4, overhead langsung melonjak ke 26-27%.

Wgrad adalah hambatan dalam pelatihan FP4. Propagasi maju dan gradien aktivasi memiliki toleransi yang cukup terhadap kuantisasi FP4, tetapi begitu gradien bobot dikuantisasi ke 4-bit, kualitas konvergensi mengalami degradasi yang signifikan.

Intuisi utama industri sebelumnya adalah: Kesalahan kuantisasi FP4 pada dasarnya adalah masalah noise, oleh karena itu dapat 'dihaluskan' dengan menyuntikkan randomness ke dalam distribusi kesalahan. Dua strategi umum adalah:

Pembulatan Stokastik (Stochastic Rounding): Memperkenalkan randomness saat kuantisasi, sehingga nilai harapan kesalahan pembulatan adalah nol.

Rotasi Hadamard Acak (Randomized Hadamard): Mengacak distribusi data sebelum kuantisasi menggunakan transformasi Hadamard dengan pembalikan tanda acak.

Setelah Wgrad dikuantisasi, kedua strategi randomness tidak hanya gagal menstabilkan pelatihan, tetapi justru langsung menyebabkan tidak konvergen. Randomness tidak membantu, malah memperkenalkan lebih banyak kesalahan kuantisasi efektif pada jalur gradien yang kritis.

Sebaliknya, rotasi Hadamard deterministik berhasil menekan overhead token seluruh proses dari 26-27% kembali ke 8-9%, dengan lintasan pelatihan yang mengikuti erat baseline FP8.

Ini adalah hasil yang sangat berharga secara diagnostik. Rotasi Hadamard acak dan deterministik keduanya adalah transformasi ortogonal, keduanya dapat mengacak distribusi energi pencilan, dan secara teori seharusnya memiliki efek mitigasi kesalahan kuantisasi yang serupa. Namun, kinerja mereka dalam skenario Wgrad sangat berbeda, yang mengungkapkan sifat sebenarnya dari masalah ini:

Ketidakstabilan pelatihan FP4, didorong oleh kesalahan struktural yang dihasilkan oleh mikro-skala MXFP4 di sepanjang jalur gradien yang sensitif. Strategi randomness gagal karena mereka memperkenalkan pola kesalahan yang berbeda pada setiap langkah, dan pola kesalahan yang berubah-ubah ini terakumulasi di sepanjang jalur gradien, justru memperbesar ketidakstabilan. Rotasi deterministik efektif justru karena menerapkan transformasi yang sama pada setiap langkah, menjaga konsistensi pola kesalahan, dan menghindari akumulasi kesalahan.

Efisiensi End-to-End: Throughput Langkah Pelatihan +20%, Percepatan Komprehensif 9-10%

Setelah menambahkan rotasi Hadamard deterministik ke MXFP4 seluruh proses, data efisiensinya adalah sebagai berikut:

Throughput langkah pelatihan meningkat 20%, dan setelah dikurangi overhead token tambahan 8-9%, percepatan komprehensif end-to-end masih mencapai 9-10%.

Mengingat ini adalah pemotongan presisi langsung dari 8-bit ke 4-bit, kualitas konvergensi dan besarnya percepatan ini cukup mengesankan.

Gambar kiri: Kurva perplexity validasi Llama 3.1–8B terhadap jumlah token pelatihan selama pelatihan awal MLPerf pada dataset C4. Hasil menunjukkan bahwa MXFP4 + Hadamard deterministik sangat mendekati performa FP8, sedangkan MXFP4 seluruh proses tanpa stabilisasi konvergen lebih lambat dan memiliki stabilitas pelatihan yang lebih buruk. Gambar kanan: Tampilan perbesaran lokal di akhir pelatihan. Target perplexity MLPerf adalah 3.3. Dibandingkan dengan MXFP4 yang tidak distabilkan, Hadamard deterministik (H16) mampu mempertahankan kesesuaian yang lebih erat dengan baseline FP8.

Perlu dicatat, penulis dengan tegas menekankan batasan penting dalam makalah: Efektivitas skema pelatihan FP4 ini (dataset MLPerf C4 + Llama 3.1-8B) telah divalidasi, tetapi tidak dapat langsung diasumsikan dapat ditransfer mulus ke semua model, semua dataset, dan semua metode pelatihan. Perilaku pelatihan FP4 mungkin sangat bergantung pada pengaturan, dan strategi stabilisasi spesifik perlu divalidasi ulang berdasarkan skenario.

Kesimpulan

Menempatkan makalah ini dalam konteks industri yang lebih besar, setidaknya ada tiga lapisan makna.

Lapisan pertama: Ini menjawab 'mengapa' yang mendasar. Pekerjaan pelatihan FP4 sebelumnya kebanyakan berfokus pada 'bagaimana membuatnya tidak crash', makalah ini untuk pertama kalinya memberikan diagnosis sebab-akibat yang jelas: Crash berasal dari kesalahan mikro-skala struktural pada jalur Wgrad, bukan karena kurangnya randomness. Diagnosis ini sendiri memiliki nilai metodologis, memberi tahu peneliti selanjutnya: Ketika menghadapi ketidakstabilan dalam pelatihan presisi rendah, prioritasnya adalah menyelidiki sumber kesalahan struktural, bukan menambah randomness secara membabi buta.

Lapisan kedua: Ini mendorong FP4 dari 'eksklusif untuk inferensi' ke 'dapat digunakan untuk pelatihan'. Sebelumnya, konsensus industri adalah FP4 hanya cocok untuk kuantisasi inferensi, pelatihan setidaknya membutuhkan FP8. NVIDIA yang mempromosikan FP4 untuk inferensi bukan pelatihan pada Blackwell juga mencerminkan penilaian ini. Makalah ini menjalankan seluruh proses pelatihan awal pada perangkat keras FP4 native, yang berarti daya komputasi FP4 yang disiapkan untuk inferensi pada MI355X dan Blackwell, secara teori juga dapat digunakan untuk pelatihan. Jika pelatihan FP4 terbukti layak pada model yang lebih besar dan lebih banyak skenario, berarti daya komputasi pelatihan yang tersedia pada perangkat keras yang ada langsung berlipat ganda.

Lapisan ketiga: Ini menggunakan standar terbuka OCP. MXFP4 adalah bagian dari standar format OCP Microscaling, didukung bersama oleh tujuh perusahaan: AMD, NVIDIA, Intel, Meta, Microsoft, Arm, dan Qualcomm. Berbasis pada standar terbuka berarti metode ini memiliki portabilitas di perangkat keras dari vendor yang berbeda, tidak terkunci dalam satu ekosistem saja.

Dari FP16 ke FP8, DeepSeek-V3 telah membuktikan bahwa memotong presisi setengah dapat secara drastis mengurangi biaya pelatihan. Dari FP8 ke FP4, makalah ini mengambil langkah kunci pertama. Setiap kali presisi dipotong, ekonomi seluruh pelatihan model besar sedang mengalami perubahan.

Artikel ini berasal dari akun WeChat "机器之心" (ID: almosthuman2014), editor: Leng Mao.

Pertanyaan Terkait

QMenurut makalah AMD, apa penyebab utama ketidakstabilan dalam pelatihan model bahasa besar (LLM) menggunakan presisi FP4?

APenyebab utama ketidakstabilan adalah akumulasi dan amplifikasi kesalahan skala-mikro struktural di jalur gradien yang sensitif, khususnya saat menghitung gradien bobot (Wgrad). Bukan karena kurangnya keacakan seperti yang diduga sebelumnya.

QApa itu format MXFP4 dan apa keunggulan utamanya dibandingkan kuantisasi tradisional?

AMXFP4 adalah format data 4-bit floating-point yang menggunakan teknik 'micro-scaling'. Keunggulannya adalah membagi tensor menjadi blok-blok kecil (misal 32 elemen) dan memberikan eksponen bersama untuk setiap blok, sehingga rentang dinamis setiap blok terlindungi dari outlier global, meningkatkan kualitas representasi.

QOperasi matriks mana dalam Transformer yang paling kritis terhadap kuantisasi FP4 dan menyebabkan degradasi konvergensi?

AOperasi penghitungan gradien bobot (Weight Gradient/Wgrad) adalah yang paling kritis. Mengganti operasi ini ke MXFP4 menyebabkan peningkatan biaya token yang signifikan (26-27%), sedangkan operasi forward propagation (Fprop) dan gradien aktivasi (Dgrad) lebih toleran.

QStrategi stabilisasi apa yang berhasil digunakan dalam penelitian ini untuk memungkinkan pelatihan FP4 yang stabil?

AStrategi yang berhasil adalah menggunakan transformasi Hadamard deterministik (deterministic Hadamard rotation) sebelum kuantisasi. Ini memastikan pola kesalahan yang konsisten di setiap langkah, mencegah akumulasi dan amplifikasi kesalahan yang tidak stabil.

QApa dampak praktis utama dari keberhasilan pelatihan FP4 end-to-end seperti yang ditunjukkan dalam makalah ini?

ADampak utamanya adalah membuka kemungkinan menggunakan hardware FP4 asli (seperti NVIDIA Blackwell dan AMD MI350/MI355X), yang sebelumnya dianggap hanya untuk inferensi, untuk pelatihan model. Ini berpotensi menggandakan throughput komputasi pelatihan yang tersedia secara efektif.

Bacaan Terkait

Ali "Menaruh Barang", Byte "Berlatih Ilmu"

Dalam satu minggu terakhir Mei, dua raksasa teknologi China, Alibaba dan ByteDance, memamerkan dua pendekatan berbeda dalam strategi AI mereka. Alibaba, sebagai perusahaan publik, fokus pada integrasi AI untuk monetisasi langsung. Mereka menghubungkan model Qwen dengan platform e-commerce seperti Taobao, menciptakan fitur seperti "pencocokan harga AI" dan "pakaian virtual AI". Melalui protokol ACT, mereka membangun infrastruktur untuk transaksi berbasis agen AI. Pendapatan eksternal Alibaba Cloud tumbuh 40%, menunjukkan model bisnis "MaaS" (Model-as-a-Service) mereka yang berhasil. Namun, pendekatan ini mungkin mengorbankan penelitian mendasar untuk keunggulan jangka pendek. Sebaliknya, ByteDance, yang masih swasta, berinvestasi besar dalam penelitian AI jangka panjang. Departemen Seed mereka, dengan anggaran belanja modal (capex) yang meningkat pesat, bertujuan "menjelajahi batas atas kecerdasan". Mereka merilis model pembuatan video Seedance 2.0 yang memimpin peringkat global dan mempublikasikan penelitian mendalam tentang "model dunia". Perusahaan ini memberikan kebebasan bagi tim risetnya tanpa tekanan kuartalan dari pasar modal. Perbedaan kunci ini lebih disebabkan oleh status kepemilikan daripada filosofi semata. Sebagai perusahaan publik, Alibaba terikat pada harapan ROI jangka pendek investor. ByteDance, yang belum IPO, memiliki kemewahan untuk berfokus pada terobosan teknologi jangka panjang. Analisis menyimpulkan bahwa jalan strategis AI sebuah perusahaan di China sangat ditentukan oleh apakah perusahaan tersebut terdaftar di bursa atau tidak, yang membentuk pilihan antara "menjual AI" dan "membuat AI".

marsbit8m yang lalu

Ali "Menaruh Barang", Byte "Berlatih Ilmu"

marsbit8m yang lalu

Mengapa Lebih Banyak AI Agent Belum Tentu Berarti Produktivitas yang Lebih Tinggi?

**Mengapa Lebih Banyak AI Agent Tidak Sama dengan Produktivitas Lebih Tinggi?** Meskipun teknologi memungkinkan kita meluncurkan banyak AI Agent dengan mudah dan murah, produktivitas nyata tidak serta-merta meningkat. Ini karena munculnya konsep "Pajak Orkestrasi"—biaya tersembunyi untuk mengelola, menilai, dan menggabungkan hasil kerja semua Agent tersebut. Pekerjaan ini harus kembali ke satu sumber daya serial yang tidak dapat diduplikasi: perhatian dan penilaian manusia. **Manusia adalah 'GIL' dalam Sistem.** Seperti Global Interpreter Lock (GIL) dalam Python, semua Agent dapat berjalan paralel, tetapi untuk keputusan penting (seperti tinjauan arsitektur, kode, atau penyelesaian konflik), mereka harus "mengambil kunci" dari Anda—sang pengembang. Hukum Amdahl berlaku: percepatan maksimum dari paralelisasi dibatasi oleh bagian kerja yang harus tetap serial, yaitu kapasitas penilaian manusia. Menambah Agent hanya membuat antrian tinjauan lebih panjang, memperbesar beban konteks, dan menyebabkan kelelahan kognitif. **Kelelahan dan Utang Tersembunyi.** Banyaknya Agent yang aktif memberi ilusi produktivitas tinggi, tetapi rasa sibuk itu tidak sama dengan hasil berkualitas. Jika Anda "menyerah secara kognitif" dan tidak meninjau hasil dengan benar, Anda menumpuk utang teknis dan utang kognitif—masalah yang akan muncul nanti. Pajak orkestrasi harus dibayar, baik secara sadar melalui proses yang terencana, atau diam-diam melalui penurunan kualitas. **Solusi: Kelola Perhatian Seperti Sistem Produksi.** Kuncinya adalah merancang alur kerja dengan menghormati batas perhatian manusia sebagai sumber daya langka: 1. **Kontrol Jumlah Agent:** Sesuaikan jumlah Agent dengan kemampuan *review* Anda, bukan dengan apa yang UI izinkan. Batasi ke angka rendah. 2. **Klasifikasi Tugas:** Pisahkan tugas independen (cocok untuk Agent paralel) dari tugas kompleks yang membutuhkan penilaian mendalam (kerjakan secara serial). 3. **Tinjau Secara Berkelompok (*Batch Review*):** Kurangi biaya alih konteks dengan meninjau hasil beberapa Agent sekaligus. 4. **Gunakan Waktu Serial untuk Penilaian:** Fokuskan perhatian hanya pada bagian yang memerlukan penilaian manusia. Biarkan Agent menangani bagian yang dapat diverifikasi otomatis (seperti tes). 5. **Lindungi Waktu Fokus Anda:** Kadang, tindakan paling produktif adalah berhenti mengoordinasi banyak Agent dan fokus pada satu masalah inti. Kemampuan sebenarnya di era AI bukanlah menjalankan banyak Agent, tetapi merancang sistem yang secara sadar mengelilingi dan melindungi kapasitas penilaian serial manusia—sumber daya paling berharga dalam proses pengembangan.

marsbit1j yang lalu

Mengapa Lebih Banyak AI Agent Belum Tentu Berarti Produktivitas yang Lebih Tinggi?

marsbit1j yang lalu

Tiga Tahun Kemudian: Meninjau Kembali Penilaian Saya terhadap ChatGPT di Tahun 2023

Tiga tahun kemudian, pada Mei 2026, penulis meninjau kembali 20 prediksi tentang ChatGPT yang dibuatnya pada Maret 2023, menggunakan AI untuk mengevaluasi akurasinya berdasarkan data terbaru. Secara keseluruhan, arah dan mekanisme prediksi banyak yang tepat. Yang paling akurat adalah tentang RAG sebagai arsitektur standar, LUI (Antarmuka Pengguna Bahasa Alami) sebagai lapisan interaksi baru, munculnya "jaringan robot" (protokol untuk agen AI), dan kemampuan China mengejar ketertinggalan model AI besar. Prediksi bahwa ChatGPT bukan AGI namun langkah besar, tidak menyebabkan gelombang pengangguran massal, serta sifat uji Turing yang hanya mengukur persepsi juga pada dasarnya benar. Namun, prediksi dengan angka spesifik atau pernyataan mutlak sering meleset. Klaim bahwa GPT-4 memiliki 100 triliun parameter sepenuhnya salah. Pernyataan bahwa LLM "tidak mungkin" mengerjakan matematika murni terbantahkan dengan model penalaran yang memenangkan medali emas IMO. Estimasi biaya pelatihan model hanya $5-10 miliar juga jauh dari kenyataan, yang kini mencapai miliaran dolar untuk model terdepan. Beberapa prediksi keliru tentang distribusi dampak, seperti bahwa nilai akan berpindah ke lapisan aplikasi (nyatanya, penyedia chip seperti NVIDIA paling untung), atau bahwa AI akan "menghindari" masalah hak cipta (justru menimbulkan gugatan besar). Kesimpulan utama adalah: dalam memprediksi teknologi yang cepat berubah, mengidentifikasi arah dan mekanisme umumnya lebih bisa diandalkan daripada memberikan angka pasti atau pernyataan mutlak. Prediksi cenderung terlalu optimis tentang kecepatan perubahan jangka pendek, tetapi meremehkan besarnya perubahan jangka panjang. Penting juga untuk mempertimbangkan distribusi dampak, bukan hanya kesimpulan agregat. Pernyataan yang disertai batasan dan keraguan justru lebih tahan uji waktu. Beberapa pertanyaan mendasar masih belum terjawab setelah tiga tahun. Tinjauan ini berfungsi sebagai pelajaran untuk membuat prediksi yang lebih baik di tiga tahun mendatang.

marsbit8j yang lalu

Tiga Tahun Kemudian: Meninjau Kembali Penilaian Saya terhadap ChatGPT di Tahun 2023

marsbit8j yang lalu

Tiga Tahun Kemudian: Menilik Kembali Penilaian Saya terhadap ChatGPT pada 2023

Tiga tahun kemudian: Meninjau Kembali 20 Prediksi ChatGPT Saya pada 2023 Pada Maret 2023, penulis Wang Jianshuo membuat 20 prediksi intuitif tentang ChatGPT dan AI masa depan. Kini, di Mei 2026, sebuah sistem AI yang terdiri dari 41 agen menganalisis prediksi-prediksi tersebut berdasarkan data terkini. Hasilnya menunjukkan pola menarik. **Yang Terbukti Benar (Secara Umum):** * **RAG dan Arsitektur Pencarian (✅):** Solusi utama untuk pengetahuan dan halusinasi adalah dengan menambahkan "contekan" (RAG), bukan mengubah model. Arsitektur pencarian + LLM kini menjadi standar. * **LUI sebagai Benua Baru (🟢):** Antarmuka Pengguna Bahasa Alami (LUI) adalah lapisan interaksi baru yang besar, melahirkan industri agen dan protokol seperti MCP. * **Jaringan Robot dan Sistem Pengalamatan Baru (🟢):** Agen akan berkomunikasi otomatis dengan bahasa alami. Protokol seperti MCP dan ANP sedang mewujudkannya. * **Model Besar Tiongkok (🟢):** Model-model seperti DeepSeek dan Qwen telah mengejar ketertinggalan performa, meski dengan investasi lebih kecil. * **Tidak Ada Kesadaran, Tes Turing Hanya Ukur Penampilan (🟢):** AI tidak memiliki kesadaran. Tes Turing hanya mengukur ilusi kesadaran. * **Prediksi Lain yang Benar:** ChatGPT bukan AGI, tapi lompatan besar; gelombang pengangguran besar tidak terjadi; tahun besar untuk startup; momen "browser 1994" telah tiba. **Yang Kurang Tepat atau Salah:** * **Parameter GPT-4 (❌):** Prediksi 100 triliun parameter salah. Estimasi terbaru sekitar 1,8 triliun. * **Matematika di LLM (🟡):** Diagnosis bahwa matematika adalah kelemahan intrinsik dan memerlukan alat bantu benar. Namun, pernyataan "tidak mungkin" ditingkatkan terbukti salah, karena model kini bisa memenangkan medali emas Olimpiade Matematika Internasional (IMO). * **Penangkapan Nilai (🟡):** Aplikasi memang berkembang pesat, tetapi nilai terbesar justru ditangkap oleh lapisan komputasi (seperti Nvidia), bukan oleh pembuat model. * **Hak Cipta (🟡):** Konten AI sulit didaftarkan hak cipta, tetapi tidak serta-mata "menghindari" pelanggaran. Gugatan dan penyelesaian besar (misalnya, Anthropic $1,5 miliar) membuktikan risikonya. * **Biaya Model (🟡):** Prediksi "perang lokal" dengan biaya $5-10 miliar untuk model canggih terbukti salah. Biaya pelatihan model terdepan (seperti GPT-5) jauh lebih tinggi, sementara biaya kloning model terbuka justru bisa lebih murah. **Pola dan Pelajaran:** 1. **Arah dan mekanisme lebih dapat diandalkan daripada angka pasti dan pernyataan mutlak.** 2. **Cenderung terlalu optimis untuk jangka pendek (kecepatan), tetapi terlalu konservatif untuk jangka panjang (skala/dampak).** 3. **Kesalahan sering terjadi pada distribusi, bukan pada total.** Contoh: Tidak ada gelombang pengangguran masif, tetapi dampak berat dirasakan oleh lulusan baru. 4. **Pernyataan yang disertai batasan dan ruang ketidakpastian justru lebih tahan uji waktu.** 5. **Beberapa pertanyaan mendasar masih belum terjawab setelah tiga tahun.** Kesimpulannya, prediksi tentang arah besar dan mekanisme cenderung akurat, sementara prediksi spesifik tentang angka, kecepatan, dan distribusi dampak lebih sering meleset. Latihan ini lebih merupakan pelajaran dalam kerendahan hati dan penilaian yang bernuansa daripada sekadar penghitungan skor.

链捕手10j yang lalu

Tiga Tahun Kemudian: Menilik Kembali Penilaian Saya terhadap ChatGPT pada 2023

链捕手10j yang lalu

Trading

Spot
Futures

Artikel Populer

Apa Itu $S$

Memahami SPERO: Tinjauan Komprehensif Pengenalan SPERO Seiring dengan perkembangan lanskap inovasi, munculnya teknologi web3 dan proyek cryptocurrency memainkan peran penting dalam membentuk masa depan digital. Salah satu proyek yang telah menarik perhatian di bidang dinamis ini adalah SPERO, yang dilambangkan sebagai SPERO,$$s$. Artikel ini bertujuan untuk mengumpulkan dan menyajikan informasi terperinci tentang SPERO, untuk membantu para penggemar dan investor memahami dasar-dasar, tujuan, dan inovasi dalam domain web3 dan crypto. Apa itu SPERO,$$s$? SPERO,$$s$ adalah proyek unik dalam ruang crypto yang berusaha memanfaatkan prinsip desentralisasi dan teknologi blockchain untuk menciptakan ekosistem yang mendorong keterlibatan, utilitas, dan inklusi finansial. Proyek ini dirancang untuk memfasilitasi interaksi peer-to-peer dengan cara baru, memberikan pengguna solusi dan layanan keuangan yang inovatif. Pada intinya, SPERO,$$s$ bertujuan untuk memberdayakan individu dengan menyediakan alat dan platform yang meningkatkan pengalaman pengguna dalam ruang cryptocurrency. Ini termasuk memungkinkan metode transaksi yang lebih fleksibel, mendorong inisiatif yang dipimpin komunitas, dan menciptakan jalur untuk peluang finansial melalui aplikasi terdesentralisasi (dApps). Visi mendasar dari SPERO,$$s$ berputar di sekitar inklusivitas, bertujuan untuk menjembatani kesenjangan dalam keuangan tradisional sambil memanfaatkan manfaat teknologi blockchain. Siapa Pencipta SPERO,$$s$? Identitas pencipta SPERO,$$s$ tetap agak samar, karena ada sumber daya publik yang terbatas yang memberikan informasi latar belakang terperinci tentang pendiriannya. Kurangnya transparansi ini dapat berasal dari komitmen proyek terhadap desentralisasi—sebuah etos yang banyak proyek web3 bagi, memprioritaskan kontribusi kolektif di atas pengakuan individu. Dengan memusatkan diskusi di sekitar komunitas dan tujuan kolektifnya, SPERO,$$s$ mewujudkan esensi pemberdayaan tanpa menonjolkan individu tertentu. Dengan demikian, memahami etos dan misi SPERO tetap lebih penting daripada mengidentifikasi pencipta tunggal. Siapa Investor SPERO,$$s$? SPERO,$$s$ didukung oleh beragam investor mulai dari modal ventura hingga investor malaikat yang berdedikasi untuk mendorong inovasi di sektor crypto. Fokus investor ini umumnya sejalan dengan misi SPERO—memprioritaskan proyek yang menjanjikan kemajuan teknologi sosial, inklusivitas finansial, dan tata kelola terdesentralisasi. Fondasi investor ini biasanya tertarik pada proyek yang tidak hanya menawarkan produk inovatif tetapi juga memberikan kontribusi positif kepada komunitas blockchain dan ekosistemnya. Dukungan dari investor ini memperkuat SPERO,$$s$ sebagai pesaing yang patut diperhitungkan di domain proyek crypto yang berkembang pesat. Bagaimana SPERO,$$s$ Bekerja? SPERO,$$s$ menerapkan kerangka kerja multi-faceted yang membedakannya dari proyek cryptocurrency konvensional. Berikut adalah beberapa fitur kunci yang menekankan keunikan dan inovasinya: Tata Kelola Terdesentralisasi: SPERO,$$s$ mengintegrasikan model tata kelola terdesentralisasi, memberdayakan pengguna untuk berpartisipasi aktif dalam proses pengambilan keputusan mengenai masa depan proyek. Pendekatan ini mendorong rasa kepemilikan dan akuntabilitas di antara anggota komunitas. Utilitas Token: SPERO,$$s$ memanfaatkan token cryptocurrency-nya sendiri, yang dirancang untuk melayani berbagai fungsi dalam ekosistem. Token ini memungkinkan transaksi, hadiah, dan fasilitasi layanan yang ditawarkan di platform, meningkatkan keterlibatan dan utilitas secara keseluruhan. Arsitektur Berlapis: Arsitektur teknis SPERO,$$s$ mendukung modularitas dan skalabilitas, memungkinkan integrasi fitur dan aplikasi tambahan secara mulus seiring dengan perkembangan proyek. Kemampuan beradaptasi ini sangat penting untuk mempertahankan relevansi di lanskap crypto yang selalu berubah. Keterlibatan Komunitas: Proyek ini menekankan inisiatif yang dipimpin komunitas, menggunakan mekanisme yang memberikan insentif untuk kolaborasi dan umpan balik. Dengan memelihara komunitas yang kuat, SPERO,$$s$ dapat lebih baik memenuhi kebutuhan pengguna dan beradaptasi dengan tren pasar. Fokus pada Inklusi: Dengan menawarkan biaya transaksi yang rendah dan antarmuka yang ramah pengguna, SPERO,$$s$ bertujuan untuk menarik basis pengguna yang beragam, termasuk individu yang mungkin sebelumnya tidak terlibat dalam ruang crypto. Komitmen ini terhadap inklusi sejalan dengan misi utamanya untuk memberdayakan melalui aksesibilitas. Garis Waktu SPERO,$$s$ Memahami sejarah proyek memberikan wawasan penting tentang trajektori dan tonggak perkembangannya. Berikut adalah garis waktu yang disarankan yang memetakan peristiwa signifikan dalam evolusi SPERO,$$s$: Fase Konseptualisasi dan Ideasi: Ide awal yang membentuk dasar SPERO,$$s$ dikembangkan, sangat selaras dengan prinsip desentralisasi dan fokus komunitas dalam industri blockchain. Peluncuran Whitepaper Proyek: Setelah fase konseptual, whitepaper komprehensif yang merinci visi, tujuan, dan infrastruktur teknologi SPERO,$$s$ dirilis untuk menarik minat dan umpan balik komunitas. Pembangunan Komunitas dan Keterlibatan Awal: Upaya jangkauan aktif dilakukan untuk membangun komunitas pengguna awal dan investor potensial, memfasilitasi diskusi seputar tujuan proyek dan mendapatkan dukungan. Acara Generasi Token: SPERO,$$s$ melakukan acara generasi token (TGE) untuk mendistribusikan token asli kepada pendukung awal dan membangun likuiditas awal dalam ekosistem. Peluncuran dApp Awal: Aplikasi terdesentralisasi (dApp) pertama yang terkait dengan SPERO,$$s$ diluncurkan, memungkinkan pengguna untuk terlibat dengan fungsionalitas inti platform. Pengembangan Berkelanjutan dan Kemitraan: Pembaruan dan peningkatan berkelanjutan terhadap penawaran proyek, termasuk kemitraan strategis dengan pemain lain di ruang blockchain, telah membentuk SPERO,$$s$ menjadi pemain yang kompetitif dan berkembang di pasar crypto. Kesimpulan SPERO,$$s$ berdiri sebagai bukti potensi web3 dan cryptocurrency untuk merevolusi sistem keuangan dan memberdayakan individu. Dengan komitmen terhadap tata kelola terdesentralisasi, keterlibatan komunitas, dan fungsionalitas yang dirancang secara inovatif, ia membuka jalan menuju lanskap keuangan yang lebih inklusif. Seperti halnya investasi di ruang crypto yang berkembang pesat, calon investor dan pengguna dianjurkan untuk melakukan riset secara menyeluruh dan terlibat dengan perkembangan yang sedang berlangsung dalam SPERO,$$s$. Proyek ini menunjukkan semangat inovatif industri crypto, mengundang eksplorasi lebih lanjut ke dalam berbagai kemungkinan yang ada. Meskipun perjalanan SPERO,$$s$ masih berlangsung, prinsip-prinsip dasarnya mungkin benar-benar mempengaruhi masa depan cara kita berinteraksi dengan teknologi, keuangan, dan satu sama lain dalam ekosistem digital yang saling terhubung.

75 Total TayanganDipublikasikan pada 2024.12.17Diperbarui pada 2024.12.17

Apa Itu $S$

Apa Itu AGENT S

Agent S: Masa Depan Interaksi Otonom di Web3 Pendahuluan Dalam lanskap Web3 dan cryptocurrency yang terus berkembang, inovasi secara konstan mendefinisikan ulang cara individu berinteraksi dengan platform digital. Salah satu proyek perintis, Agent S, menjanjikan untuk merevolusi interaksi manusia-komputer melalui kerangka agen terbuka. Dengan membuka jalan untuk interaksi otonom, Agent S bertujuan untuk menyederhanakan tugas-tugas kompleks, menawarkan aplikasi transformasional dalam kecerdasan buatan (AI). Eksplorasi mendetail ini akan menyelami seluk-beluk proyek, fitur uniknya, dan implikasinya untuk domain cryptocurrency. Apa itu Agent S? Agent S berdiri sebagai kerangka agen terbuka yang inovatif, dirancang khusus untuk mengatasi tiga tantangan mendasar dalam otomatisasi tugas komputer: Memperoleh Pengetahuan Spesifik Domain: Kerangka ini secara cerdas belajar dari berbagai sumber pengetahuan eksternal dan pengalaman internal. Pendekatan ganda ini memberdayakannya untuk membangun repositori pengetahuan spesifik domain yang kaya, meningkatkan kinerjanya dalam pelaksanaan tugas. Perencanaan Selama Rentang Tugas yang Panjang: Agent S menggunakan perencanaan hierarkis yang ditingkatkan pengalaman, pendekatan strategis yang memfasilitasi pemecahan dan pelaksanaan tugas-tugas rumit dengan efisien. Fitur ini secara signifikan meningkatkan kemampuannya untuk mengelola beberapa subtugas dengan efisien dan efektif. Menangani Antarmuka Dinamis dan Tidak Seragam: Proyek ini memperkenalkan Antarmuka Agen-Komputer (ACI), solusi inovatif yang meningkatkan interaksi antara agen dan pengguna. Dengan memanfaatkan Model Bahasa Besar Multimodal (MLLM), Agent S dapat menavigasi dan memanipulasi berbagai antarmuka pengguna grafis dengan mulus. Melalui fitur-fitur perintis ini, Agent S menyediakan kerangka kerja yang kuat yang mengatasi kompleksitas yang terlibat dalam mengotomatisasi interaksi manusia dengan mesin, membuka jalan untuk berbagai aplikasi dalam AI dan seterusnya. Siapa Pencipta Agent S? Meskipun konsep Agent S secara fundamental inovatif, informasi spesifik tentang penciptanya tetap samar. Pencipta saat ini tidak diketahui, yang menyoroti baik tahap awal proyek atau pilihan strategis untuk menjaga anggota pendiri tetap tersembunyi. Terlepas dari anonimitas, fokus tetap pada kemampuan dan potensi kerangka kerja. Siapa Investor Agent S? Karena Agent S relatif baru dalam ekosistem kriptografi, informasi terperinci mengenai investor dan pendukung keuangannya tidak secara eksplisit didokumentasikan. Kurangnya wawasan yang tersedia untuk umum mengenai fondasi investasi atau organisasi yang mendukung proyek ini menimbulkan pertanyaan tentang struktur pendanaannya dan peta jalan pengembangannya. Memahami dukungan sangat penting untuk mengukur keberlanjutan proyek dan potensi dampak pasar. Bagaimana Cara Kerja Agent S? Di inti Agent S terletak teknologi mutakhir yang memungkinkannya berfungsi secara efektif dalam berbagai pengaturan. Model operasionalnya dibangun di sekitar beberapa fitur kunci: Interaksi Komputer yang Mirip Manusia: Kerangka ini menawarkan perencanaan AI yang canggih, berusaha untuk membuat interaksi dengan komputer lebih intuitif. Dengan meniru perilaku manusia dalam pelaksanaan tugas, ia menjanjikan untuk meningkatkan pengalaman pengguna. Memori Naratif: Digunakan untuk memanfaatkan pengalaman tingkat tinggi, Agent S memanfaatkan memori naratif untuk melacak sejarah tugas, sehingga meningkatkan proses pengambilan keputusannya. Memori Episodik: Fitur ini memberikan panduan langkah demi langkah kepada pengguna, memungkinkan kerangka untuk menawarkan dukungan kontekstual saat tugas berlangsung. Dukungan untuk OpenACI: Dengan kemampuan untuk berjalan secara lokal, Agent S memungkinkan pengguna untuk mempertahankan kontrol atas interaksi dan alur kerja mereka, sejalan dengan etos terdesentralisasi Web3. Integrasi Mudah dengan API Eksternal: Versatilitas dan kompatibilitasnya dengan berbagai platform AI memastikan bahwa Agent S dapat dengan mulus masuk ke dalam ekosistem teknologi yang ada, menjadikannya pilihan menarik bagi pengembang dan organisasi. Fungsionalitas ini secara kolektif berkontribusi pada posisi unik Agent S dalam ruang kripto, saat ia mengotomatisasi tugas-tugas kompleks yang melibatkan banyak langkah dengan intervensi manusia yang minimal. Seiring proyek ini berkembang, aplikasi potensialnya di Web3 dapat mendefinisikan ulang bagaimana interaksi digital berlangsung. Garis Waktu Agent S Pengembangan dan tonggak Agent S dapat dirangkum dalam garis waktu yang menyoroti peristiwa pentingnya: 27 September 2024: Konsep Agent S diluncurkan dalam sebuah makalah penelitian komprehensif berjudul “Sebuah Kerangka Agen Terbuka yang Menggunakan Komputer Seperti Manusia,” yang menunjukkan dasar untuk proyek ini. 10 Oktober 2024: Makalah penelitian tersebut dipublikasikan secara terbuka di arXiv, menawarkan eksplorasi mendalam tentang kerangka kerja dan evaluasi kinerjanya berdasarkan tolok ukur OSWorld. 12 Oktober 2024: Sebuah presentasi video dirilis, memberikan wawasan visual tentang kemampuan dan fitur Agent S, lebih lanjut melibatkan pengguna dan investor potensial. Tanda-tanda dalam garis waktu ini tidak hanya menggambarkan kemajuan Agent S tetapi juga menunjukkan komitmennya terhadap transparansi dan keterlibatan komunitas. Poin Kunci Tentang Agent S Seiring kerangka Agent S terus berkembang, beberapa atribut kunci menonjol, menekankan sifat inovatif dan potensinya: Kerangka Inovatif: Dirancang untuk memberikan penggunaan komputer yang intuitif seperti interaksi manusia, Agent S membawa pendekatan baru untuk otomatisasi tugas. Interaksi Otonom: Kemampuan untuk berinteraksi secara otonom dengan komputer melalui GUI menandakan lompatan menuju solusi komputasi yang lebih cerdas dan efisien. Otomatisasi Tugas Kompleks: Dengan metodologinya yang kuat, ia dapat mengotomatisasi tugas-tugas kompleks yang melibatkan banyak langkah, membuat proses lebih cepat dan kurang rentan terhadap kesalahan. Perbaikan Berkelanjutan: Mekanisme pembelajaran memungkinkan Agent S untuk belajar dari pengalaman masa lalu, terus meningkatkan kinerja dan efektivitasnya. Versatilitas: Adaptabilitasnya di berbagai lingkungan operasi seperti OSWorld dan WindowsAgentArena memastikan bahwa ia dapat melayani berbagai aplikasi. Saat Agent S memposisikan dirinya di lanskap Web3 dan kripto, potensinya untuk meningkatkan kemampuan interaksi dan mengotomatisasi proses menandakan kemajuan signifikan dalam teknologi AI. Melalui kerangka inovatifnya, Agent S mencerminkan masa depan interaksi digital, menjanjikan pengalaman yang lebih mulus dan efisien bagi pengguna di berbagai industri. Kesimpulan Agent S mewakili lompatan berani ke depan dalam pernikahan AI dan Web3, dengan kapasitas untuk mendefinisikan ulang cara kita berinteraksi dengan teknologi. Meskipun masih dalam tahap awal, kemungkinan aplikasinya sangat luas dan menarik. Melalui kerangka komprehensifnya yang mengatasi tantangan kritis, Agent S bertujuan untuk membawa interaksi otonom ke garis depan pengalaman digital. Saat kita melangkah lebih dalam ke dalam ranah cryptocurrency dan desentralisasi, proyek-proyek seperti Agent S pasti akan memainkan peran penting dalam membentuk masa depan teknologi dan kolaborasi manusia-komputer.

906 Total TayanganDipublikasikan pada 2025.01.14Diperbarui pada 2025.01.14

Apa Itu AGENT S

Cara Membeli S

Selamat datang di HTX.com! Kami telah membuat pembelian Sonic (S) menjadi mudah dan nyaman. Ikuti panduan langkah demi langkah kami untuk memulai perjalanan kripto Anda.Langkah 1: Buat Akun HTX AndaGunakan alamat email atau nomor ponsel Anda untuk mendaftar akun gratis di HTX. Rasakan perjalanan pendaftaran yang mudah dan buka semua fitur.Dapatkan Akun SayaLangkah 2: Buka Beli Kripto, lalu Pilih Metode Pembayaran AndaKartu Kredit/Debit: Gunakan Visa atau Mastercard Anda untuk membeli Sonic (S) secara instan.Saldo: Gunakan dana dari saldo akun HTX Anda untuk melakukan trading dengan lancar.Pihak Ketiga: Kami telah menambahkan metode pembayaran populer seperti Google Pay dan Apple Pay untuk meningkatkan kenyamanan.P2P: Lakukan trading langsung dengan pengguna lain di HTX.Over-the-Counter (OTC): Kami menawarkan layanan yang dibuat khusus dan kurs yang kompetitif bagi para trader.Langkah 3: Simpan Sonic (S) AndaSetelah melakukan pembelian, simpan Sonic (S) di akun HTX Anda. Selain itu, Anda dapat mengirimkannya ke tempat lain melalui transfer blockchain atau menggunakannya untuk memperdagangkan mata uang kripto lainnya.Langkah 4: Lakukan trading Sonic (S)Lakukan trading Sonic (S) dengan mudah di pasar spot HTX. Cukup akses akun Anda, pilih pasangan perdagangan, jalankan trading, lalu pantau secara real-time. Kami menawarkan pengalaman yang ramah pengguna baik untuk pemula maupun trader berpengalaman.

1.3k Total TayanganDipublikasikan pada 2025.01.15Diperbarui pada 2025.03.21

Cara Membeli S

Diskusi

Selamat datang di Komunitas HTX. Di sini, Anda bisa terus mendapatkan informasi terbaru tentang perkembangan platform terkini dan mendapatkan akses ke wawasan pasar profesional. Pendapat pengguna mengenai harga S (S) disajikan di bawah ini.

活动图片