Mengapa Zhipu AI Bisa Meroket Hampir 30% dalam Satu Hari?

marsbitDipublikasikan tanggal 2026-05-23Terakhir diperbarui pada 2026-05-23

Abstrak

Hari ini, saham "Glodon" (02513.HK), yang dijuluki "saham model besar global pertama", melonjak hampir 30%. Pemicu utamanya adalah peluncuran API "GLM-5.1-highspeed" yang menawarkan kecepatan generasi hingga 400 token per detik, mencatat rekor baru untuk API model besar. Kecepatan ini sangat penting karena pergeseran paradigma dari AI chatbot ke era Agen (Agent), di mana tugas kompleks memerlukan puluhan hingga ratusan panggilan model. Setiap penghematan latensi akan terakumulasi dan secara signifikan memengaruhi efisiensi keseluruhan. Pencapaian 400 token/detik ini kira-kira 3-5 kali lebih cepat dari rata-rata industri (OpenAI GPT-4o: 100-150, Claude Sonnet: 80-120) dan dicapai tanpa mengorbankan kemampuan model inti. Lonjakan performa ini didukung oleh tiga inovasi teknis: 1. **TileRT**: Mesin inferensi yang mengkompilasi seluruh model menjadi pipeline kontinu, menghilangkan overhead start/stop antar operator dan menerapkan "Warp Specialization" untuk paralelisasi optimal dalam GPU. 2. **Strategi Paralel Heterogen untuk MLA (Multi-head Latent Attention)**: Mengatasi tantangan komputasi sparse dalam mekanisme perhatian MLA dengan menugaskan GPU berbeda untuk tugas "pengindeksan" dan "komputasi padat", meminimalkan sinkronisasi. 3. **Arsitektur Jaringan ZCube**: Mengganti topologi jaringan standar ROFT (Fat-Tree) dengan desain datar tanpa lapisan Spine. Desain ini menciptakan "jalur tunggal optimal" antara GPU mana pun, secara fundamental menghilangkan kemacetan jaringa...

Oleh | AIDeepDive

Hari ini, saham Zhipu AI (02513.HK), yang dijuluki "Saham Model Besar Pertama di Dunia", kembali melonjak tajam.

Lonjakan harga sahamnya di sesi intraday sempat menembus 30%. Pada penutupan perdagangan, harganya mencapai HK$1282, dengan kenaikan harian melebihi 26%, dan kapitalisasi pasarnya mencapai HK$571,57 miliar, sekali lagi mencetak rekor tertinggi sepanjang masa.

Pemicu lonjakan tajam ini adalah satu indikator teknis spesifik: 400 tokens/detik.

Pada 22 Mei, Zhipu secara resmi membuka API (GLM-5.1-highspeed) versi berkecepatan tinggi GLM-5.1 untuk klien perusahaan. Parameter inti yang paling krusial hanya satu: kecepatan keluaran model mencapai 400 token per detik, memecahkan batas atas kecepatan API dari vendor model besar global.

Awalnya saya mengira ini hanya kemasan PR dari model besar China lagi, namun setelah melihat detail teknismya dengan teliti, akhirnya saya memahami logika di balik respons pasar modal.

Apa artinya 400 tokens/detik?

Model mampu menghasilkan sekitar 200 karakter China per detik, setara dengan output intensif satu menit dari seorang penulis profesional, yang dipadatkan menjadi satu detik.

Volume teks yang membutuhkan waktu berhari-hari bagi seorang kreator untuk menulisnya, dapat diselesaikan oleh GLM-5.1 versi berkecepatan tinggi dalam 1 menit; tugas rekonstruksi sistem yang membutuhkan waktu 3 hari bagi seorang insinyur, dapat diselesaikannya dalam waktu minum secangkir kopi.

01 Kecepatan, Lebih Penting dari yang Anda Bayangkan

Kecepatan selalu menjadi dimensi yang paling mudah diabaikan dalam persaingan model AI.

Selama tiga tahun terakhir, perlombaan senjata model besar terkonsentrasi pada dua jalur: skala parameter (model yang lebih besar dan lebih pintar) dan perang harga (Token yang lebih murah dan lebih inklusif). "Cepat", tidak pernah menjadi pemeran utama.

Hal ini karena "cepat" di masa lalu biasanya dicapai dengan mengecilkan parameter model. Untuk mempercepat, harus menggunakan model yang lebih kecil dan lebih ringkas, dengan konsekuensi kemampuan yang menyusut.

Signifikansi GLM-5.1 versi berkecepatan tinggi kali ini terletak pada kemampuannya mempertahankan kemampuan basis berukuran penuh kelas flagship, sambil mendorong kecepatannya hingga 400 tokens/detik.

Baik dari sisi model domestik maupun skala internasional, untuk pertama kalinya "kemampuan flagship" dan "latensi sangat rendah yang ekstrem" berhasil dicapai tanpa kompromi.

Mengapa kecepatan begitu krusial? Karena medan perang utama AI sedang mengalami pergeseran fundamental.

Saat AI berpindah dari era ChatBot ke era Agent, tanya jawab bukan lagi skenario utama AI. Untuk menyelesaikan satu tugas, Agent seringkali membutuhkan model untuk melakukan panggilan mandiri puluhan bahkan ratusan putaran: menulis kode, menyesuaikan antarmuka, mencari informasi, memanggil alat...

Dalam mode kerja ini, jeda antara setiap putaran panggilan akan diakumulasi dan diperbesar tanpa ampun. Untuk tugas yang membutuhkan 50 putaran panggilan, jika setiap putaran menghemat 1 detik, seluruh tugas menjadi lebih cepat hampir 1 menit. Untuk asisten pemrograman AI, interaksi suara, sistem pengambilan keputusan bisnis, perbedaan seperti ini dapat menentukan hidup mati.

Dari tingkat yang lebih dalam, dalam anggaran waktu yang tetap, inferensi yang lebih cepat berarti model dapat menyelesaikan jalur penalaran yang lebih dalam, lebih banyak putaran verifikasi mandiri. Kecepatan, sedang berubah dari indikator sistem menjadi batas atas kecerdasan itu sendiri.

02 Seberapa Sulitkah Mencapai Kecepatan Ini?

Lalu, kira-kira seperti apa tingkat kecepatan di industri saat ini?

Di antara vendor terkemuka, GPT-4o dari OpenAI berkisar 100–150 tokens/detik, seri Claude Sonnet dari Anthropic sekitar 80–120 tokens/detik, API model flagship utama di dalam negeri sebagian besar berada di kisaran 50–100 tokens/detik. 400 tokens/detik kira-kira 3 hingga 5 kali lipat dari tingkat rata-rata industri.

Yang lebih krusial lagi, kesenjangan ini bukan sesuatu yang bisa ditutupi hanya dengan menambah daya komputasi.

Secara teoretis, satu server yang dilengkapi dengan 8 kartu grafis H200 mampu memindahkan data hingga 38TB per detik. Untuk GLM-5.1, menghasilkan satu token hanya membutuhkan pembacaan sekitar 42GB parameter aktivasi. Secara teori murni, seharusnya mendekati 1000 tokens/detik.

Tapi sistem di dunia nyata seringkali hanya dapat menghasilkan puluhan tokens/detik.

Ini adalah jurang yang sangat besar. GPU tidak cukup cepat? Bukan, melainkan banyak waktu yang terbuang untuk menunggu, menganggur, dan penjadwalan yang tidak efektif.

Zhipu kali ini berhasil mencapai terobosan kecepatan akhir melalui inovasi simultan di tiga lapisan: mesin inferensi, strategi paralel, dan arsitektur jaringan.

03 Tumpukan Teknologi Tiga Lapis, Mendekati Batas Fisik Perangkat Keras

Model besar awalnya beroperasi seperti ini: model besar dipecah menjadi operator independen satu per satu, setiap operator meluncurkan satu inti komputasi (kernel) secara terpisah, berhenti setelah selesai menghitung, menunggu sinkronisasi, lalu meluncurkan yang berikutnya.

Pada fase pelatihan, setiap perhitungan membutuhkan waktu beberapa detik hingga beberapa menit, overhead peluncuran dan penungguan ini sepenuhnya dapat diabaikan. Namun saat inferensi, untuk menghasilkan satu token, langkah kunci tertentu mungkin hanya membutuhkan puluhan mikrodetik, sehingga overhead peluncuran dan penungguan menjadi relatif signifikan.

Pemikiran inti TileRT: mengompilasi seluruh model menjadi satu mesin yang berjalan terus-menerus, diluncurkan sekali, tidak pernah berhenti.

TileRT pada fase kompilasi kode membuka logika komputasi seluruh model secara statis menjadi satu jalur pipa kontinu. Saat berjalan, GPU tetap beroperasi pada kecepatan tinggi, komputasi, pemindahan data, dan komunikasi berjalan paralel, hasil antara sebisa mungkin tetap berada dalam cache berkecepatan tinggi internal GPU, tidak lagi berulang kali ditulis kembali ke memori video yang lambat lalu dibaca ulang.

Ada satu detail desain kunci di sini: Spesialisasi Warp.

Memahami Warp, perlu memahami cara kerja GPU terlebih dahulu. Perbedaan terbesar GPU dengan CPU adalah bahwa GPU memiliki ribuan unit komputasi yang relatif sederhana di dalamnya. Unit-unit ini dibundel menjadi kelompok 32 unit, kelompok ini disebut Warp.

32 unit dalam Warp yang sama harus selalu bertindak serempak, menjalankan instruksi yang sama, seperti satu regu dalam tentara, komandan regu memberi perintah semua orang melakukan gerakan yang sama secara bersamaan.

Dalam kerangka kerja tradisional, semua Warp menjalankan urutan instruksi yang sama; TileRT membuat kelompok Warp yang berbeda menangani tanggung jawab berbeda: satu bagian khusus bertanggung jawab memindahkan data batch berikutnya terlebih dahulu, satu bagian khusus bertanggung jawab komputasi matematika, satu bagian khusus bertanggung jawab komunikasi dengan GPU lain. Tiga kelompok bekerja bersamaan, pipa berkoordinasi, saling tidak menunggu.

Seperti analogi dari "satu pekerja memindahkan batu bata, memasang dinding, memeriksa secara serial", berubah menjadi "kelompok pemindah batu bata, kelompok pemasang dinding, kelompok pemeriksa berputar bersamaan".

Efisiensi internal satu kartu terselesaikan, paralel multi-kartu menghadapi tantangan baru.

Praktik umum industri adalah Paralel Tensor (Tensor Parallel): Membagi matriks bobot model menjadi beberapa bagian, setiap GPU bertanggung jawab atas satu bagian, setelah masing-masing selesai menghitung, hasilnya dikumpulkan melalui interkoneksi berkecepatan tinggi (NVLink).

Skema ini efektif untuk komputasi padat yang teratur seperti perkalian matriks, dan merupakan skema multi-kartu standar untuk hampir semua kerangka kerja inferensi model besar saat ini.

GLM-5.1 mengadopsi MLA (Multi-head Latent Attention, Atensi Potensial Multi-kepala), ini adalah mekanisme atensi yang diusulkan oleh DeepSeek.

Mekanisme atensi tradisional perlu menyimpan banyak data antara (KV Cache) dari setiap langkah perhitungan secara lengkap untuk digunakan nanti, sangat boros memori video; Cara MLA adalah mengompresi data antara ini menjadi "vektor potensial" yang kompak terlebih dahulu, lalu menyimpannya, saat digunakan baru dibuka dan dikembalikan, kebutuhan memori video turun drastis, efisiensi inferensi lebih tinggi.

Tapi ada satu bagian khusus dalam alur komputasi MLA: perlu melakukan pengindeksan jarang (sparse indexing) dari sejumlah besar informasi historis: mirip dengan dengan cepat mencari beberapa buku yang paling relevan di perpustakaan besar terlebih dahulu, baru membaca buku-buku itu dengan teliti.

Langkah "mencari buku" ini bergantung pada informasi global, tidak cocok untuk dibagi rata ke beberapa kartu; "Membaca teliti" adalah komputasi padat yang cocok untuk paralel multi-kartu. Jika memaksa semua 8 GPU berpartisipasi dalam "mencari buku", banyak waktu akan terbuang untuk komunikasi sinkron antar GPU.

Solusi TileRT adalah menjalankan GPU secara heterogen: GPU 0 khusus berperan sebagai "petugas pencarian perpustakaan", bertanggung jawab atas pengindeksan jarang dan keputusan perutean; GPU 1–7 berperan sebagai "analis pembaca teliti", bertanggung jawab atas komputasi atensi dan operasi matriks yang padat. Dua jenis pekerja bekerja sama dengan strategi paralel yang paling sesuai untuk masing-masing untuk menyelesaikan seluruh lapisan komputasi.

Selanjutnya, TileRT menanamkan operasi komunikasi antar GPU langsung ke dalam jalur pipa eksekusi, tidak lagi sebagai langkah independen. Dari luar, seluruh sistem 8 kartu menyelesaikan komputasi satu lapisan atensi hanya membutuhkan satu peluncuran kernel, komunikasi dan komputasi internal semuanya diselesaikan secara mulus di dalam pipa kontinu.

Dua lapisan di atas menyelesaikan masalah dalam lingkup satu mesin. Ketika klaster diperluas ke ratusan bahkan ribuan GPU, transmisi data antar GPU itu sendiri menjadi langit-langit baru.

Praktik umum industri adalah ROFT (Rail-Optimized Fat-Tree), ini adalah skema yang direkomendasikan resmi oleh NVIDIA, standar absolut industri.

Strukturnya seperti pohon: server terhubung ke switch Leaf (lapisan akses, langsung menghadap server), Leaf kemudian terhubung ke atas ke switch Spine (lapisan tulang punggung, bertanggung jawab atas interkoneksi antar Leaf, seperti hub jalan raya). Data yang ditransmisikan antara dua GPU, harus "naik ke Spine terlebih dahulu, lalu turun ke Leaf target", setidaknya melewati 3 hop.

Untuk menghindari lalu lintas terkonsentrasi di beberapa jalur, arsitektur ini bergantung pada algoritma ECMP untuk mendistribusikan data di antara beberapa jalur, berjalan baik dengan asumsi lalu lintas internet "statistik seragam".

Tapi lalu lintas skenario inferensi tidak seragam sama sekali. Panjang konteks permintaan yang berbeda dapat mencapai puluhan kali lipat, arah transmisi KV Cache antar GPU hampir acak, beberapa switch Leaf akan secara berkala menjadi hotspot, memicu mekanisme backpressure, menyebarkan kemacetan dari lokal ke seluruh tautan. Kemacetan ini bukan sesuatu yang bisa diselesaikan dengan penyesuaian parameter protokol, itu adalah produk dari struktur topologi itu sendiri.

Terobosan mendasar ZCube: Dari tingkat arsitektur membuat kemacetan seperti ini secara fisik tidak mungkin terjadi.

Desain inti dibagi dua langkah:

Langkah pertama, menghapus lapisan tulang punggung Spine, meratakan seluruh jaringan. Membagi semua switch Leaf menjadi dua kelompok berdasarkan penomoran ganjil-genap, dua kelompok tersebut saling terhubung sepenuhnya, switch ganjil mana pun terhubung ke semua switch genap, begitu pula sebaliknya. Setiap dua GPU dapat saling mencapai melalui maksimal dua switch, hop berkurang dari 3 hop menjadi 2 hop.

Langkah kedua, juga yang paling cerdik: Kartu jaringan setiap GPU menggunakan dua cara yang sangat berbeda untuk terhubung ke dua kelompok switch secara terpisah. Topologi khusus ini membawa satu sifat matematika kunci: Di seluruh jaringan, antara setiap dua GPU, ada satu dan hanya satu jalur optimal.

"Jalur tunggal" langsung menghilangkan akar penyebab kemacetan. Arsitektur tradisional mudah menjadi hotspot, justru karena ada banyak jalur yang dapat dipilih, algoritma penyeimbang beban jika salah memilih akan menyebabkan lalu lintas terkonsentrasi. ZCube dalam desainnya menghilangkan "pemilihan" itu sendiri: tidak perlu penyeimbangan, karena tidak ada persimpangan jalan sama sekali.

04 Dengan Kondisi Perangkat Keras yang Sama, Bagaimana Perhitungannya?

Setelah meningkatkan klaster produksi GLM-5.1 dari ROFT tradisional ke ZCube, Zhipu mendapatkan tiga angka:

Ringkasnya, dengan investasi GPU yang sama, klaster dapat melayani lebih banyak pengguna; dengan persyaratan pengalaman pengguna yang sama, klaster dapat membeli sepertiga lebih sedikit perangkat jaringan. Efisiensi dan biaya meningkat dua arah.

Secara spesifik, throughput meningkat 15%, setara dengan mendapatkan tambahan daya komputasi 15% secara gratis. Dengan jumlah GPU yang tidak berubah, throughput bertambah 15%, setara dengan biaya perangkat keras per token turun sekitar 13%, atau dengan biaya yang sama dapat melayani 15% lebih banyak pengguna.

Jika sebuah klaster memiliki 1000 GPU, peningkatan ini setara dengan mendapatkan tambahan kapasitas 150 kartu secara cuma-cuma. Berdasarkan harga pasar kartu inferensi kelas atas saat ini, ini adalah nilai daya komputasi miliaran yuan.

Penurunan latensi ekor 40,6%, menyelesaikan masalah stabilitas bukan kecepatan rata-rata. Sebuah tugas Agent yang membutuhkan 50 putaran panggilan, jika latensi ekor berkurang 1 detik setiap kali, waktu penyelesaian terburuk seluruh tugas dikompresi hampir 1 menit.

Pengurangan biaya sepertiga, adalah penghematan langsung di tingkat pembangunan. ZCube menghapus lapisan Spine, dalam skala klaster yang sama, jumlah switch dan modul optik yang dibutuhkan langsung berkurang sepertiga. Menurut perhitungan Zhipu, dalam klaster skala sepuluh ribu kartu, hanya item ini saja dapat menghemat sekitar 2,1 hingga 6,4 miliar yuan.

Dari perspektif jangka panjang, seiring dengan meningkatnya skala klaster secara eksponensial, kompleksitas komunikasi antar GPU bertambah berkali-kali lipat, kemungkinan dan dampak kemacetan juga meningkat. Ini berarti nilai inovasi tingkat arsitektur seperti ZCube akan semakin terlihat dengan ekspansi berkelanjutan klaster inferensi. Besok, keuntungan klaster level sepuluh ribu kartu mungkin lebih dari 15% hari ini.

05 Penutup

Setelah membaca laporan teknis Zhipu, saya berpikir, apakah ini akan seperti kemunculan mendadak DeepSeek, membawa badai bagi industri?

Setelah dipikir-pikir, pengaruh keduanya sepertinya berada di aspek yang berbeda. Saat DeepSeek muncul, yang dibuktikannya adalah, kecerdasan yang sama, dapat diwujudkan dengan daya komputasi yang jauh lebih sedikit. Pasar khawatir "GPU yang dibutuhkan menjadi lebih sedikit", sehingga kapitalisasi pasar NVIDIA hari itu menguap hampir 600 miliar dolar AS.

Tapi teknologi Zhipu hari ini membuktikan: dengan daya komputasi yang sama, dapat menghasilkan lebih banyak. Ini merekonstruksi "seperti apa seharusnya infrastruktur lain di luar GPU".

Dalam jangka pendek, NVIDIA tidak akan terpengaruh, tetapi dalam jangka panjang, parit pertahanan GPU + interkoneksi NVLink + jaringan InfiniBand + ekosistem perangkat lunak CUDA sedang "dilonggarkan", terutama InfiniBand yang dibeli NVIDIA dengan akuisisi Mellanox senilai 6,9 miliar dolar AS pada tahun 2019, premium sisi jaringan NVIDIA akan sangat terkikis.

Selain itu, ZCube menghapus lapisan Spine, tetapi justru menuntut kepadatan port switch Leaf yang lebih tinggi. Yang diuntungkan adalah vendor yang mampu membuat switch Leaf berdensitas tinggi, port besar (Ruijie, Arista, chip switch Broadcom), yang dirugikan adalah vendor yang terutama mengandalkan switch kelas atas lapisan Spine untuk mendapatkan premium.

Pada tahun 2025, Celestica dan NVIDIA bersama-sama menguasai sekitar 50% pangsa pasar switch jaringan backend AI, pola ini akan menghadapi perombakan ulang setelah paradigma ZCube menyebar.

Modul optik adalah arah yang paling langsung diuntungkan dalam perubahan rantai industri kali ini, logikanya sangat jelas. Bagi produsen modul optik domestik (seperti InnoLight, TFC, dll.), ini adalah dorongan struktural: tidak hanya total volume meningkat, tetapi juga permintaan modul optik berkecepatan tinggi (800G, 1.6T) dalam paradigma ZCube lebih terkonsentrasi dan mendesak dibandingkan arsitektur tradisional.

Baik arsitektur TileRT maupun ZCube, ini adalah set mesin inferensi perangkat lunak murni yang berjalan di atas GPU standar, tidak bergantung pada fitur perangkat keras NVIDIA yang bersifat pribadi, secara teori dapat dipindahkan ke chip domestik seperti Huawei Ascend. Arah ini jika dapat diwujudkan, akan secara signifikan menurunkan ambang batas tumpukan perangkat lunak chip AI domestik dalam skenario inferensi.

Ini mungkin makna yang lebih besar di balik inovasi teknologi ini.

Pertanyaan Terkait

QApa alasan di balik lonjakan harga saham Zhipu hampir 30% dalam sehari?

ALonjakan harga saham Zhipu dipicu oleh peluncuran GLM-5.1-highspeed API, yang menawarkan kecepatan keluaran model hingga 400 token per detik, memecahkan rekor kecepatan API model bahasa besar global. Pasar melihat inovasi teknis ini sebagai penanda keunggulan kompetitif yang signifikan.

QMengapa kecepatan (400 token/detik) menjadi faktor yang begitu penting untuk model AI besar?

AKecepatan menjadi kritis karena pergeseran penggunaan AI dari chatbot ke era Agent. Agent melakukan tugas kompleks dengan puluhan hingga ratusan panggilan mandiri ke model. Setiap pengurangan delay dalam satu panggilan akan terakumulasi, sehingga secara keseluruhan dapat mempercepat penyelesaian tugas secara signifikan dan bahkan menentukan batas atas kecerdasan model.

QApa saja inovasi teknis utama di balik pencapaian kecepatan 400 token/detik oleh Zhipu?

AZhipu mencapai kecepatan ini melalui tiga lapisan inovasi utama: 1) TileRT, mesin inferensi yang mengkompilasi seluruh model menjadi satu *pipeline* yang berjalan terus-menerus. 2) Strategi paralel heterogen yang mengoptimalkan komputasi untuk mekanisme perhatian MLA. 3) Arsitektur jaringan ZCube, yang merupakan desain jaringan datar baru yang menghilangkan kemacetan komunikasi dengan menciptakan jalur unik antar-GPU.

QApa dampak praktis dari arsitektur jaringan ZCube yang dikembangkan Zhipu?

APenerapan ZCube memberikan tiga manfaat utama: 1) Peningkatan *throughput* klaster sebesar 15%, setara dengan tambahan kapasitas komputasi gratis. 2) Penurunan *tail latency* sebesar 40,6%, meningkatkan stabilitas untuk tugas multi-langkah. 3) Pengurangan biaya konstruksi hingga sepertiga karena penghapusan lapisan *spine switch* dalam jaringan.

QBagaimana inovasi Zhipu ini dapat mempengaruhi ekosistem dan rantai pasokan AI secara lebih luas?

AInovasi Zhipu, terutama TileRT dan ZCube yang berjalan di perangkat keras standar, berpotensi mengurangi ketergantungan pada ekosistem tertutup NVIDIA (seperti InfiniBand). Ini dapat membuka pintu bagi adopsi chip AI domestik (seperti Huawei Ascend). Selain itu, arsitektur ZCube menggeser permintaan dari *spine switch* ke *leaf switch* berdensitas tinggi, menguntungkan produsen modul optik kecepatan tinggi dan produsen *chip switch* seperti Broadcom.

Bacaan Terkait

Tiga Tahun Kemudian: Meninjau Kembali Penilaian Saya terhadap ChatGPT di Tahun 2023

Tiga tahun kemudian, pada Mei 2026, penulis meninjau kembali 20 prediksi tentang ChatGPT yang dibuatnya pada Maret 2023, menggunakan AI untuk mengevaluasi akurasinya berdasarkan data terbaru. Secara keseluruhan, arah dan mekanisme prediksi banyak yang tepat. Yang paling akurat adalah tentang RAG sebagai arsitektur standar, LUI (Antarmuka Pengguna Bahasa Alami) sebagai lapisan interaksi baru, munculnya "jaringan robot" (protokol untuk agen AI), dan kemampuan China mengejar ketertinggalan model AI besar. Prediksi bahwa ChatGPT bukan AGI namun langkah besar, tidak menyebabkan gelombang pengangguran massal, serta sifat uji Turing yang hanya mengukur persepsi juga pada dasarnya benar. Namun, prediksi dengan angka spesifik atau pernyataan mutlak sering meleset. Klaim bahwa GPT-4 memiliki 100 triliun parameter sepenuhnya salah. Pernyataan bahwa LLM "tidak mungkin" mengerjakan matematika murni terbantahkan dengan model penalaran yang memenangkan medali emas IMO. Estimasi biaya pelatihan model hanya $5-10 miliar juga jauh dari kenyataan, yang kini mencapai miliaran dolar untuk model terdepan. Beberapa prediksi keliru tentang distribusi dampak, seperti bahwa nilai akan berpindah ke lapisan aplikasi (nyatanya, penyedia chip seperti NVIDIA paling untung), atau bahwa AI akan "menghindari" masalah hak cipta (justru menimbulkan gugatan besar). Kesimpulan utama adalah: dalam memprediksi teknologi yang cepat berubah, mengidentifikasi arah dan mekanisme umumnya lebih bisa diandalkan daripada memberikan angka pasti atau pernyataan mutlak. Prediksi cenderung terlalu optimis tentang kecepatan perubahan jangka pendek, tetapi meremehkan besarnya perubahan jangka panjang. Penting juga untuk mempertimbangkan distribusi dampak, bukan hanya kesimpulan agregat. Pernyataan yang disertai batasan dan keraguan justru lebih tahan uji waktu. Beberapa pertanyaan mendasar masih belum terjawab setelah tiga tahun. Tinjauan ini berfungsi sebagai pelajaran untuk membuat prediksi yang lebih baik di tiga tahun mendatang.

marsbit4j yang lalu

Tiga Tahun Kemudian: Meninjau Kembali Penilaian Saya terhadap ChatGPT di Tahun 2023

marsbit4j yang lalu

Tiga Tahun Kemudian: Menilik Kembali Penilaian Saya terhadap ChatGPT pada 2023

Tiga tahun kemudian: Meninjau Kembali 20 Prediksi ChatGPT Saya pada 2023 Pada Maret 2023, penulis Wang Jianshuo membuat 20 prediksi intuitif tentang ChatGPT dan AI masa depan. Kini, di Mei 2026, sebuah sistem AI yang terdiri dari 41 agen menganalisis prediksi-prediksi tersebut berdasarkan data terkini. Hasilnya menunjukkan pola menarik. **Yang Terbukti Benar (Secara Umum):** * **RAG dan Arsitektur Pencarian (✅):** Solusi utama untuk pengetahuan dan halusinasi adalah dengan menambahkan "contekan" (RAG), bukan mengubah model. Arsitektur pencarian + LLM kini menjadi standar. * **LUI sebagai Benua Baru (🟢):** Antarmuka Pengguna Bahasa Alami (LUI) adalah lapisan interaksi baru yang besar, melahirkan industri agen dan protokol seperti MCP. * **Jaringan Robot dan Sistem Pengalamatan Baru (🟢):** Agen akan berkomunikasi otomatis dengan bahasa alami. Protokol seperti MCP dan ANP sedang mewujudkannya. * **Model Besar Tiongkok (🟢):** Model-model seperti DeepSeek dan Qwen telah mengejar ketertinggalan performa, meski dengan investasi lebih kecil. * **Tidak Ada Kesadaran, Tes Turing Hanya Ukur Penampilan (🟢):** AI tidak memiliki kesadaran. Tes Turing hanya mengukur ilusi kesadaran. * **Prediksi Lain yang Benar:** ChatGPT bukan AGI, tapi lompatan besar; gelombang pengangguran besar tidak terjadi; tahun besar untuk startup; momen "browser 1994" telah tiba. **Yang Kurang Tepat atau Salah:** * **Parameter GPT-4 (❌):** Prediksi 100 triliun parameter salah. Estimasi terbaru sekitar 1,8 triliun. * **Matematika di LLM (🟡):** Diagnosis bahwa matematika adalah kelemahan intrinsik dan memerlukan alat bantu benar. Namun, pernyataan "tidak mungkin" ditingkatkan terbukti salah, karena model kini bisa memenangkan medali emas Olimpiade Matematika Internasional (IMO). * **Penangkapan Nilai (🟡):** Aplikasi memang berkembang pesat, tetapi nilai terbesar justru ditangkap oleh lapisan komputasi (seperti Nvidia), bukan oleh pembuat model. * **Hak Cipta (🟡):** Konten AI sulit didaftarkan hak cipta, tetapi tidak serta-mata "menghindari" pelanggaran. Gugatan dan penyelesaian besar (misalnya, Anthropic $1,5 miliar) membuktikan risikonya. * **Biaya Model (🟡):** Prediksi "perang lokal" dengan biaya $5-10 miliar untuk model canggih terbukti salah. Biaya pelatihan model terdepan (seperti GPT-5) jauh lebih tinggi, sementara biaya kloning model terbuka justru bisa lebih murah. **Pola dan Pelajaran:** 1. **Arah dan mekanisme lebih dapat diandalkan daripada angka pasti dan pernyataan mutlak.** 2. **Cenderung terlalu optimis untuk jangka pendek (kecepatan), tetapi terlalu konservatif untuk jangka panjang (skala/dampak).** 3. **Kesalahan sering terjadi pada distribusi, bukan pada total.** Contoh: Tidak ada gelombang pengangguran masif, tetapi dampak berat dirasakan oleh lulusan baru. 4. **Pernyataan yang disertai batasan dan ruang ketidakpastian justru lebih tahan uji waktu.** 5. **Beberapa pertanyaan mendasar masih belum terjawab setelah tiga tahun.** Kesimpulannya, prediksi tentang arah besar dan mekanisme cenderung akurat, sementara prediksi spesifik tentang angka, kecepatan, dan distribusi dampak lebih sering meleset. Latihan ini lebih merupakan pelajaran dalam kerendahan hati dan penilaian yang bernuansa daripada sekadar penghitungan skor.

链捕手6j yang lalu

Tiga Tahun Kemudian: Menilik Kembali Penilaian Saya terhadap ChatGPT pada 2023

链捕手6j yang lalu

Peringatan Gelembung AI: Investasi AI Merupakan Pengembalian Negatif bagi Kebanyakan Raksasa Teknologi

Peringatan Gelembung AI: Investasi AI Membawa Pengembalian Negatif bagi Sebagian Besar Raksasa Teknologi Demam AI kini memasuki tahap pemeriksaan keuangan. Raksasa cloud seperti Microsoft, Alphabet, Amazon, Meta, dan Oracle berencana menginvestasikan ratusan miliar dolar ke pusat data AI dalam lima tahun ke depan. Namun, analisis terhadap proyeksi pendapatan dan pengeluaran modal (capex) hingga 2030 mengungkap masalah: tingkat pengembalian investasi implisit diperkirakan sangat negatif bagi semua perusahaan kecuali Amazon, bahkan dalam skenario optimis ekstrem. Ini menunjukkan bahwa jika tren saat ini berlanjut, boom AI bisa menjadi salah satu peristiwa perusakan nilai pemegang saham terbesar. Ada dua jalan keluar: pendapatan yang jauh melebihi ekspektasi saat ini, atau pengurangan rencana investasi. Jalan pertama tampaknya mustahil, karena membutuhkan tambahan pendapatan triliunan dolar. Jalan kedua—pemotongan investasi—akan berdampak luas, meruntuhkan harga saham perusahaan-perusahaan teknologi global dan dapat mendorong ekonomi AS ke resesi, mengingat 93% pertumbuhan PDB AS belakangan ini didorong oleh investasi teknologi. IPO perusahaan AI seperti OpenAI dan Anthropic tahun ini bisa menjadi mekanisme transfer risiko, memindahkan ketidakpastian dari pemilik awal kepada investor ritail dan dana pensiun. Sementara euphoria pemasaran mungkin bertahan hingga setelah IPO tahun 2026, tekanan matematika yang tak terelakkan mungkin memaksa raksasa cloud mengumumkan pemotongan investasi pada 2027 atau 2028, mirip dengan jeda tiga tahun antara peringatan "irrational exuberance" Alan Greenspan pada 1996 dan pecahnya gelembung dotcom pada 2000.

marsbit7j yang lalu

Peringatan Gelembung AI: Investasi AI Merupakan Pengembalian Negatif bagi Kebanyakan Raksasa Teknologi

marsbit7j yang lalu

Dari Token ke Tenaga Kerja Mesin: AI Sedang Berubah dari Alat Menjadi 'Pekerja'

Dari Token ke Tenaga Kerja Mesin: AI Berubah dari Alat Menjadi "Pekerja" AI mulai menulis kode, menangani tiket dukungan pelanggan, dan meninjau dokumen hukum. Artikel ini mengusulkan kerangka baru: komersialisasi AI sedang bergerak menuju "pasar tenaga kerja mesin". Dalam pasar ini, token hanyalah unit pengukuran, GPU adalah bahan baku, dan model adalah alat produksi. Objek yang benar-benar ditetapkan harganya dan diperdagangkan adalah kerja ekonomi yang diselesaikan langsung oleh perangkat lunak. Mekanisme penetapan harga AI akan berkembang dari token mentah, kemampuan model yang terstandarisasi, tenaga kerja yang terspesialisasi industri, hingga pasar hasil yang dapat diprogram. Di masa depan, perusahaan mungkin tidak lagi peduli model atau GPU mana yang menyelesaikan suatu tugas, tetapi lebih pada apakah tugas itu diselesaikan dalam batas latensi, akurasi, keandalan, dan biaya yang ditentukan. Implikasinya, dampak AI pada pasar tenaga kerja manusia tidak hanya sekadar penggantian. Saat mesin mengambil alih lebih banyak pekerjaan yang dapat distandardisasi dan diverifikasi, peran manusia mungkin bergeser ke pengawasan, penanggung jawab, manajemen konteks, dan keputusan akhir. Dalam beberapa kasus, penilaian manusia untuk 1% akhir justru menjadi lebih berharga karena dapat membuka kunci 99% otomatisasi skala besar. Pasar AI adalah pasar ekspansif. Ketika biaya kerja turun, permintaan tidak tetap. Jika interaksi dukungan pelanggan menjadi lebih murah, perusahaan dapat menawarkan layanan 24/7, menciptakan pasar interaksi pelanggan yang lebih besar. Persaingan tahap berikutnya di pasar AI mungkin bukan lagi sekadar pertarungan kemampuan model atau perang harga daya komputasi, tetapi tentang siapa yang dapat pertama kali menstandarisasi, memverifikasi, dan menetapkan harga "pekerjaan", akhirnya menjadikan tenaga kerja mesin sebagai faktor produksi baru yang dapat dibeli, diselesaikan, dan diperdagangkan.

marsbit7j yang lalu

Dari Token ke Tenaga Kerja Mesin: AI Sedang Berubah dari Alat Menjadi 'Pekerja'

marsbit7j yang lalu

Diskon 99% untuk MiMo Bukan Hanya Pemasaran! Luo Fuli Membantah Para Pengecam di X

**Ringkasan:** Xiaomi MiMo memotong harga API MiMo-V2.5 hingga **99%**, memicu spekulasi tentang perang harga atau strategi merugi. Luo Fuli, kepala MiMo, merespons dengan mempublikasikan blog teknis 5000 kata yang merinci **enam pilar teknikal** di balik potongan harga besar ini. Intinya, diskon 99% terutama untuk **Input (Cache Hit)** – bagian dimana pengguna membaca ulang konteks historis dalam percakapan panjang. Ini menjadi mungkin karena serangkaian optimasi teknikal yang mengubah biaya komputasi untuk bagian tersebut mendekati nol. **Enam Pilar Teknikal:** 1. **Arsitektur Hybrid SWA:** Menggunakan Sliding Window Attention di sebagian besar lapisan model, mengurangi volume **KVCache** (memori jangka pendek model) hingga **1/7**. 2. **Manajemen KVCache Dua Kolam:** Mengalokasikan memori secara terpisah untuk lapisan SWA dan Full Attention, benar-benar mewujudkan penghematan teoretis 1/7 dan meningkatkan jumlah pengguna yang dapat dilayani secara bersamaan. 3. **Prefix Cache yang Dioptimalkan:** Meningkatkan aturan pencocokan cache untuk arsitektur SWA, menghasilkan **tingkat keberhasilan cache 93-95%** untuk pembacaan ulang. Artinya, sebagian besar permintaan "baca ulang" tidak memerlukan komputasi GPU baru. 4. **Sistem Cache Terdistribusi GCache:** Menyimpan data cache di **SSD bawaan mesin GPU**, menghilangkan biaya penyimpanan cluster khusus dan memperpanjang masa hidup cache. 5. **Sistem Penjadwalan LLM-Router:** Mengarahkan permintaan secara cerdas berdasarkan kesamaan prefix dan panjang konteks, memprioritaskan permintaan yang menggunakan cache, meningkatkan efisiensi dan mengurangi latensi. 6. **Multi-Token Prediction (MTP):** Mengoptimalkan proses generasi output model, mempercepat pembuatan respons dan melengkapi pengurangan biaya di sisi input. **Kesimpulan:** Penurunan harga 99% bukanlah gimmick pemasaran atau strategi merugi, tetapi hasil dari **efisiensi sistemik rekayasa AI** yang telah divalidasi di lingkungan produksi. Rantai optimasi ini secara kumulatif mengurangi biaya komputasi per permintaan hingga lebih dari 95%, memungkinkan penurunan harga ekstrem sambil mempertahankan profitabilitas. Luo Fuli menekankan bahwa ini adalah masalah teknikal yang terwujud, bukan sekadar perang harga.

marsbit9j yang lalu

Diskon 99% untuk MiMo Bukan Hanya Pemasaran! Luo Fuli Membantah Para Pengecam di X

marsbit9j yang lalu

Trading

Spot
Futures

Artikel Populer

Apa Itu $S$

Memahami SPERO: Tinjauan Komprehensif Pengenalan SPERO Seiring dengan perkembangan lanskap inovasi, munculnya teknologi web3 dan proyek cryptocurrency memainkan peran penting dalam membentuk masa depan digital. Salah satu proyek yang telah menarik perhatian di bidang dinamis ini adalah SPERO, yang dilambangkan sebagai SPERO,$$s$. Artikel ini bertujuan untuk mengumpulkan dan menyajikan informasi terperinci tentang SPERO, untuk membantu para penggemar dan investor memahami dasar-dasar, tujuan, dan inovasi dalam domain web3 dan crypto. Apa itu SPERO,$$s$? SPERO,$$s$ adalah proyek unik dalam ruang crypto yang berusaha memanfaatkan prinsip desentralisasi dan teknologi blockchain untuk menciptakan ekosistem yang mendorong keterlibatan, utilitas, dan inklusi finansial. Proyek ini dirancang untuk memfasilitasi interaksi peer-to-peer dengan cara baru, memberikan pengguna solusi dan layanan keuangan yang inovatif. Pada intinya, SPERO,$$s$ bertujuan untuk memberdayakan individu dengan menyediakan alat dan platform yang meningkatkan pengalaman pengguna dalam ruang cryptocurrency. Ini termasuk memungkinkan metode transaksi yang lebih fleksibel, mendorong inisiatif yang dipimpin komunitas, dan menciptakan jalur untuk peluang finansial melalui aplikasi terdesentralisasi (dApps). Visi mendasar dari SPERO,$$s$ berputar di sekitar inklusivitas, bertujuan untuk menjembatani kesenjangan dalam keuangan tradisional sambil memanfaatkan manfaat teknologi blockchain. Siapa Pencipta SPERO,$$s$? Identitas pencipta SPERO,$$s$ tetap agak samar, karena ada sumber daya publik yang terbatas yang memberikan informasi latar belakang terperinci tentang pendiriannya. Kurangnya transparansi ini dapat berasal dari komitmen proyek terhadap desentralisasi—sebuah etos yang banyak proyek web3 bagi, memprioritaskan kontribusi kolektif di atas pengakuan individu. Dengan memusatkan diskusi di sekitar komunitas dan tujuan kolektifnya, SPERO,$$s$ mewujudkan esensi pemberdayaan tanpa menonjolkan individu tertentu. Dengan demikian, memahami etos dan misi SPERO tetap lebih penting daripada mengidentifikasi pencipta tunggal. Siapa Investor SPERO,$$s$? SPERO,$$s$ didukung oleh beragam investor mulai dari modal ventura hingga investor malaikat yang berdedikasi untuk mendorong inovasi di sektor crypto. Fokus investor ini umumnya sejalan dengan misi SPERO—memprioritaskan proyek yang menjanjikan kemajuan teknologi sosial, inklusivitas finansial, dan tata kelola terdesentralisasi. Fondasi investor ini biasanya tertarik pada proyek yang tidak hanya menawarkan produk inovatif tetapi juga memberikan kontribusi positif kepada komunitas blockchain dan ekosistemnya. Dukungan dari investor ini memperkuat SPERO,$$s$ sebagai pesaing yang patut diperhitungkan di domain proyek crypto yang berkembang pesat. Bagaimana SPERO,$$s$ Bekerja? SPERO,$$s$ menerapkan kerangka kerja multi-faceted yang membedakannya dari proyek cryptocurrency konvensional. Berikut adalah beberapa fitur kunci yang menekankan keunikan dan inovasinya: Tata Kelola Terdesentralisasi: SPERO,$$s$ mengintegrasikan model tata kelola terdesentralisasi, memberdayakan pengguna untuk berpartisipasi aktif dalam proses pengambilan keputusan mengenai masa depan proyek. Pendekatan ini mendorong rasa kepemilikan dan akuntabilitas di antara anggota komunitas. Utilitas Token: SPERO,$$s$ memanfaatkan token cryptocurrency-nya sendiri, yang dirancang untuk melayani berbagai fungsi dalam ekosistem. Token ini memungkinkan transaksi, hadiah, dan fasilitasi layanan yang ditawarkan di platform, meningkatkan keterlibatan dan utilitas secara keseluruhan. Arsitektur Berlapis: Arsitektur teknis SPERO,$$s$ mendukung modularitas dan skalabilitas, memungkinkan integrasi fitur dan aplikasi tambahan secara mulus seiring dengan perkembangan proyek. Kemampuan beradaptasi ini sangat penting untuk mempertahankan relevansi di lanskap crypto yang selalu berubah. Keterlibatan Komunitas: Proyek ini menekankan inisiatif yang dipimpin komunitas, menggunakan mekanisme yang memberikan insentif untuk kolaborasi dan umpan balik. Dengan memelihara komunitas yang kuat, SPERO,$$s$ dapat lebih baik memenuhi kebutuhan pengguna dan beradaptasi dengan tren pasar. Fokus pada Inklusi: Dengan menawarkan biaya transaksi yang rendah dan antarmuka yang ramah pengguna, SPERO,$$s$ bertujuan untuk menarik basis pengguna yang beragam, termasuk individu yang mungkin sebelumnya tidak terlibat dalam ruang crypto. Komitmen ini terhadap inklusi sejalan dengan misi utamanya untuk memberdayakan melalui aksesibilitas. Garis Waktu SPERO,$$s$ Memahami sejarah proyek memberikan wawasan penting tentang trajektori dan tonggak perkembangannya. Berikut adalah garis waktu yang disarankan yang memetakan peristiwa signifikan dalam evolusi SPERO,$$s$: Fase Konseptualisasi dan Ideasi: Ide awal yang membentuk dasar SPERO,$$s$ dikembangkan, sangat selaras dengan prinsip desentralisasi dan fokus komunitas dalam industri blockchain. Peluncuran Whitepaper Proyek: Setelah fase konseptual, whitepaper komprehensif yang merinci visi, tujuan, dan infrastruktur teknologi SPERO,$$s$ dirilis untuk menarik minat dan umpan balik komunitas. Pembangunan Komunitas dan Keterlibatan Awal: Upaya jangkauan aktif dilakukan untuk membangun komunitas pengguna awal dan investor potensial, memfasilitasi diskusi seputar tujuan proyek dan mendapatkan dukungan. Acara Generasi Token: SPERO,$$s$ melakukan acara generasi token (TGE) untuk mendistribusikan token asli kepada pendukung awal dan membangun likuiditas awal dalam ekosistem. Peluncuran dApp Awal: Aplikasi terdesentralisasi (dApp) pertama yang terkait dengan SPERO,$$s$ diluncurkan, memungkinkan pengguna untuk terlibat dengan fungsionalitas inti platform. Pengembangan Berkelanjutan dan Kemitraan: Pembaruan dan peningkatan berkelanjutan terhadap penawaran proyek, termasuk kemitraan strategis dengan pemain lain di ruang blockchain, telah membentuk SPERO,$$s$ menjadi pemain yang kompetitif dan berkembang di pasar crypto. Kesimpulan SPERO,$$s$ berdiri sebagai bukti potensi web3 dan cryptocurrency untuk merevolusi sistem keuangan dan memberdayakan individu. Dengan komitmen terhadap tata kelola terdesentralisasi, keterlibatan komunitas, dan fungsionalitas yang dirancang secara inovatif, ia membuka jalan menuju lanskap keuangan yang lebih inklusif. Seperti halnya investasi di ruang crypto yang berkembang pesat, calon investor dan pengguna dianjurkan untuk melakukan riset secara menyeluruh dan terlibat dengan perkembangan yang sedang berlangsung dalam SPERO,$$s$. Proyek ini menunjukkan semangat inovatif industri crypto, mengundang eksplorasi lebih lanjut ke dalam berbagai kemungkinan yang ada. Meskipun perjalanan SPERO,$$s$ masih berlangsung, prinsip-prinsip dasarnya mungkin benar-benar mempengaruhi masa depan cara kita berinteraksi dengan teknologi, keuangan, dan satu sama lain dalam ekosistem digital yang saling terhubung.

75 Total TayanganDipublikasikan pada 2024.12.17Diperbarui pada 2024.12.17

Apa Itu $S$

Apa Itu AGENT S

Agent S: Masa Depan Interaksi Otonom di Web3 Pendahuluan Dalam lanskap Web3 dan cryptocurrency yang terus berkembang, inovasi secara konstan mendefinisikan ulang cara individu berinteraksi dengan platform digital. Salah satu proyek perintis, Agent S, menjanjikan untuk merevolusi interaksi manusia-komputer melalui kerangka agen terbuka. Dengan membuka jalan untuk interaksi otonom, Agent S bertujuan untuk menyederhanakan tugas-tugas kompleks, menawarkan aplikasi transformasional dalam kecerdasan buatan (AI). Eksplorasi mendetail ini akan menyelami seluk-beluk proyek, fitur uniknya, dan implikasinya untuk domain cryptocurrency. Apa itu Agent S? Agent S berdiri sebagai kerangka agen terbuka yang inovatif, dirancang khusus untuk mengatasi tiga tantangan mendasar dalam otomatisasi tugas komputer: Memperoleh Pengetahuan Spesifik Domain: Kerangka ini secara cerdas belajar dari berbagai sumber pengetahuan eksternal dan pengalaman internal. Pendekatan ganda ini memberdayakannya untuk membangun repositori pengetahuan spesifik domain yang kaya, meningkatkan kinerjanya dalam pelaksanaan tugas. Perencanaan Selama Rentang Tugas yang Panjang: Agent S menggunakan perencanaan hierarkis yang ditingkatkan pengalaman, pendekatan strategis yang memfasilitasi pemecahan dan pelaksanaan tugas-tugas rumit dengan efisien. Fitur ini secara signifikan meningkatkan kemampuannya untuk mengelola beberapa subtugas dengan efisien dan efektif. Menangani Antarmuka Dinamis dan Tidak Seragam: Proyek ini memperkenalkan Antarmuka Agen-Komputer (ACI), solusi inovatif yang meningkatkan interaksi antara agen dan pengguna. Dengan memanfaatkan Model Bahasa Besar Multimodal (MLLM), Agent S dapat menavigasi dan memanipulasi berbagai antarmuka pengguna grafis dengan mulus. Melalui fitur-fitur perintis ini, Agent S menyediakan kerangka kerja yang kuat yang mengatasi kompleksitas yang terlibat dalam mengotomatisasi interaksi manusia dengan mesin, membuka jalan untuk berbagai aplikasi dalam AI dan seterusnya. Siapa Pencipta Agent S? Meskipun konsep Agent S secara fundamental inovatif, informasi spesifik tentang penciptanya tetap samar. Pencipta saat ini tidak diketahui, yang menyoroti baik tahap awal proyek atau pilihan strategis untuk menjaga anggota pendiri tetap tersembunyi. Terlepas dari anonimitas, fokus tetap pada kemampuan dan potensi kerangka kerja. Siapa Investor Agent S? Karena Agent S relatif baru dalam ekosistem kriptografi, informasi terperinci mengenai investor dan pendukung keuangannya tidak secara eksplisit didokumentasikan. Kurangnya wawasan yang tersedia untuk umum mengenai fondasi investasi atau organisasi yang mendukung proyek ini menimbulkan pertanyaan tentang struktur pendanaannya dan peta jalan pengembangannya. Memahami dukungan sangat penting untuk mengukur keberlanjutan proyek dan potensi dampak pasar. Bagaimana Cara Kerja Agent S? Di inti Agent S terletak teknologi mutakhir yang memungkinkannya berfungsi secara efektif dalam berbagai pengaturan. Model operasionalnya dibangun di sekitar beberapa fitur kunci: Interaksi Komputer yang Mirip Manusia: Kerangka ini menawarkan perencanaan AI yang canggih, berusaha untuk membuat interaksi dengan komputer lebih intuitif. Dengan meniru perilaku manusia dalam pelaksanaan tugas, ia menjanjikan untuk meningkatkan pengalaman pengguna. Memori Naratif: Digunakan untuk memanfaatkan pengalaman tingkat tinggi, Agent S memanfaatkan memori naratif untuk melacak sejarah tugas, sehingga meningkatkan proses pengambilan keputusannya. Memori Episodik: Fitur ini memberikan panduan langkah demi langkah kepada pengguna, memungkinkan kerangka untuk menawarkan dukungan kontekstual saat tugas berlangsung. Dukungan untuk OpenACI: Dengan kemampuan untuk berjalan secara lokal, Agent S memungkinkan pengguna untuk mempertahankan kontrol atas interaksi dan alur kerja mereka, sejalan dengan etos terdesentralisasi Web3. Integrasi Mudah dengan API Eksternal: Versatilitas dan kompatibilitasnya dengan berbagai platform AI memastikan bahwa Agent S dapat dengan mulus masuk ke dalam ekosistem teknologi yang ada, menjadikannya pilihan menarik bagi pengembang dan organisasi. Fungsionalitas ini secara kolektif berkontribusi pada posisi unik Agent S dalam ruang kripto, saat ia mengotomatisasi tugas-tugas kompleks yang melibatkan banyak langkah dengan intervensi manusia yang minimal. Seiring proyek ini berkembang, aplikasi potensialnya di Web3 dapat mendefinisikan ulang bagaimana interaksi digital berlangsung. Garis Waktu Agent S Pengembangan dan tonggak Agent S dapat dirangkum dalam garis waktu yang menyoroti peristiwa pentingnya: 27 September 2024: Konsep Agent S diluncurkan dalam sebuah makalah penelitian komprehensif berjudul “Sebuah Kerangka Agen Terbuka yang Menggunakan Komputer Seperti Manusia,” yang menunjukkan dasar untuk proyek ini. 10 Oktober 2024: Makalah penelitian tersebut dipublikasikan secara terbuka di arXiv, menawarkan eksplorasi mendalam tentang kerangka kerja dan evaluasi kinerjanya berdasarkan tolok ukur OSWorld. 12 Oktober 2024: Sebuah presentasi video dirilis, memberikan wawasan visual tentang kemampuan dan fitur Agent S, lebih lanjut melibatkan pengguna dan investor potensial. Tanda-tanda dalam garis waktu ini tidak hanya menggambarkan kemajuan Agent S tetapi juga menunjukkan komitmennya terhadap transparansi dan keterlibatan komunitas. Poin Kunci Tentang Agent S Seiring kerangka Agent S terus berkembang, beberapa atribut kunci menonjol, menekankan sifat inovatif dan potensinya: Kerangka Inovatif: Dirancang untuk memberikan penggunaan komputer yang intuitif seperti interaksi manusia, Agent S membawa pendekatan baru untuk otomatisasi tugas. Interaksi Otonom: Kemampuan untuk berinteraksi secara otonom dengan komputer melalui GUI menandakan lompatan menuju solusi komputasi yang lebih cerdas dan efisien. Otomatisasi Tugas Kompleks: Dengan metodologinya yang kuat, ia dapat mengotomatisasi tugas-tugas kompleks yang melibatkan banyak langkah, membuat proses lebih cepat dan kurang rentan terhadap kesalahan. Perbaikan Berkelanjutan: Mekanisme pembelajaran memungkinkan Agent S untuk belajar dari pengalaman masa lalu, terus meningkatkan kinerja dan efektivitasnya. Versatilitas: Adaptabilitasnya di berbagai lingkungan operasi seperti OSWorld dan WindowsAgentArena memastikan bahwa ia dapat melayani berbagai aplikasi. Saat Agent S memposisikan dirinya di lanskap Web3 dan kripto, potensinya untuk meningkatkan kemampuan interaksi dan mengotomatisasi proses menandakan kemajuan signifikan dalam teknologi AI. Melalui kerangka inovatifnya, Agent S mencerminkan masa depan interaksi digital, menjanjikan pengalaman yang lebih mulus dan efisien bagi pengguna di berbagai industri. Kesimpulan Agent S mewakili lompatan berani ke depan dalam pernikahan AI dan Web3, dengan kapasitas untuk mendefinisikan ulang cara kita berinteraksi dengan teknologi. Meskipun masih dalam tahap awal, kemungkinan aplikasinya sangat luas dan menarik. Melalui kerangka komprehensifnya yang mengatasi tantangan kritis, Agent S bertujuan untuk membawa interaksi otonom ke garis depan pengalaman digital. Saat kita melangkah lebih dalam ke dalam ranah cryptocurrency dan desentralisasi, proyek-proyek seperti Agent S pasti akan memainkan peran penting dalam membentuk masa depan teknologi dan kolaborasi manusia-komputer.

906 Total TayanganDipublikasikan pada 2025.01.14Diperbarui pada 2025.01.14

Apa Itu AGENT S

Cara Membeli S

Selamat datang di HTX.com! Kami telah membuat pembelian Sonic (S) menjadi mudah dan nyaman. Ikuti panduan langkah demi langkah kami untuk memulai perjalanan kripto Anda.Langkah 1: Buat Akun HTX AndaGunakan alamat email atau nomor ponsel Anda untuk mendaftar akun gratis di HTX. Rasakan perjalanan pendaftaran yang mudah dan buka semua fitur.Dapatkan Akun SayaLangkah 2: Buka Beli Kripto, lalu Pilih Metode Pembayaran AndaKartu Kredit/Debit: Gunakan Visa atau Mastercard Anda untuk membeli Sonic (S) secara instan.Saldo: Gunakan dana dari saldo akun HTX Anda untuk melakukan trading dengan lancar.Pihak Ketiga: Kami telah menambahkan metode pembayaran populer seperti Google Pay dan Apple Pay untuk meningkatkan kenyamanan.P2P: Lakukan trading langsung dengan pengguna lain di HTX.Over-the-Counter (OTC): Kami menawarkan layanan yang dibuat khusus dan kurs yang kompetitif bagi para trader.Langkah 3: Simpan Sonic (S) AndaSetelah melakukan pembelian, simpan Sonic (S) di akun HTX Anda. Selain itu, Anda dapat mengirimkannya ke tempat lain melalui transfer blockchain atau menggunakannya untuk memperdagangkan mata uang kripto lainnya.Langkah 4: Lakukan trading Sonic (S)Lakukan trading Sonic (S) dengan mudah di pasar spot HTX. Cukup akses akun Anda, pilih pasangan perdagangan, jalankan trading, lalu pantau secara real-time. Kami menawarkan pengalaman yang ramah pengguna baik untuk pemula maupun trader berpengalaman.

1.3k Total TayanganDipublikasikan pada 2025.01.15Diperbarui pada 2025.03.21

Cara Membeli S

Diskusi

Selamat datang di Komunitas HTX. Di sini, Anda bisa terus mendapatkan informasi terbaru tentang perkembangan platform terkini dan mendapatkan akses ke wawasan pasar profesional. Pendapat pengguna mengenai harga S (S) disajikan di bawah ini.

活动图片