a16z: Bagaimana Blockchain Dapat Mengisi Kekosongan Identitas, Pembayaran, dan Kepercayaan untuk AI Agent?

marsbitDipublikasikan tanggal 2026-04-23Terakhir diperbarui pada 2026-04-23

Abstrak

AI Agent berkembang pesat menjadi peserta ekonomi yang sebenarnya, tetapi masih menghadapi tantangan dalam identitas, pembayaran, dan kepercayaan. Blockchain menawarkan solusi infrastruktur dengan menyediakan identitas portabel melalui dompet kripto, pembayaran terprogram dengan stablecoin, dan lapisan verifikasi yang transparan. Masalah utama adalah kurangnya standar identitas universal untuk Agent (seperti KYA - Know Your Agent), yang menghambat interoperabilitas dan akuntabilitas. Blockchain dapat menyediakan credential terverifikasi yang membatasi wewenang dan reputasi Agent. Dalam hal pembayaran, stablecoin menjadi lapisan penyelesaian alternatif untuk transaksi AI-to-AI, didukung oleh pasar seperti Stripe MPP dan x402 yang memungkinkan pembayaran tanpa izin dan berbiaya rendah. Tantangan tata kelola juga muncul ketika Agent mengontrol sistem nyata. Kriptografi dapat memastikan transparansi, auditabilitas, dan kepatuhan terhadap preferensi manusia, mencegah sentralisasi kekuasaan oleh penyedia AI. Keunggulan manusia akan bergeser ke verifikasi dan pengambilan tanggung jawab strategis, sementara blockchain menyediakan kerangka untuk membangun kepercayaan melalui bukti yang dapat diaudit. Tanpa verifikasi, skalabilitas Agent hanya akan menimbulkan risiko yang terakumulasi.

AI Agent sedang berkembang dengan kecepatan yang jauh melampaui infrastruktur lainnya, dari alat bantu dengan cepat berevolusi menjadi peserta ekonomi yang sebenarnya.

Meskipun Agent sekarang sudah dapat menjalankan tugas dan transaksi, mereka masih kekurangan cara standar lintas lingkungan untuk membuktikan "siapa saya", "apa yang saya diizinkan untuk lakukan", dan "bagaimana saya harus dibayar". Identitas tidak dapat bermigrasi, pembayaran belum dapat diprogram secara default, kolaborasi masih berada dalam keadaan terisolasi.

Blockchain sedang menyelesaikan masalah-masalah ini di tingkat infrastruktur. Buku besar publik menyediakan kredensial yang dapat diaudit oleh siapa pun untuk setiap transaksi; dompet memberikan identitas yang dapat dipindahkan kepada Agent; stablecoin menjadi lapisan penyelesaian lainnya. Ini bukanlah konsep masa depan, mereka sudah tersedia hari ini, mampu membantu Agent beroperasi sebagai entitas ekonomi yang sebenarnya dengan cara tanpa izin.

Memberikan Identitas untuk Non-Manusia

Kendala ekonomi Agent saat ini bukan lagi kecerdasan, melainkan identitas.

Hanya di industri jasa keuangan, jumlah identitas non-manusia (sistem perdagangan otomatis, mesin risiko, model penipuan) sudah sekitar 100 kali lipat dari karyawan manusia. Seiring dengan penerapan skala besar kerangka kerja Agent modern (model bahasa dengan kemampuan memanggil alat, alur kerja otonom, orkestrasi multi-Agent), rasio ini akan terus meningkat di berbagai industri.

Namun, Agent-agent ini sebenarnya masih dalam status "tidak memiliki rekening bank". Mereka dapat berinteraksi dengan sistem keuangan, tetapi tidak dapat melakukannya dengan cara yang dapat dipindahkan, dapat diverifikasi, dan dipercaya secara default. Mereka kekurangan cara yang terstandarisasi untuk membuktikan otoritas mereka, beroperasi secara independen lintas platform, atau mempertanggungjawabkan tindakan mereka sendiri.

Yang hilang adalah lapisan identitas universal — setara dengan SSL untuk Agent, yang mampu menstandarkan kolaborasi lintas platform. Solusi saat ini masih terfragmentasi: di satu sisi ada tumpukan yang terintegrasi secara vertikal, mengutamakan fiat; di sisi lain ada standar terbuka yang asli kripto (seperti x402 dan proposal identitas Agent yang baru muncul); serta ekstensi kerangka kerja pengembang yang mencoba menjembatani identitas lapisan aplikasi (seperti MCP, Model Context Protocol).

Saat ini masih belum ada cara yang diadopsi secara luas dan dapat dioperasikan, yang memungkinkan satu Agent membuktikan kepada Agent lain: siapa yang diwakilinya, apa yang diizinkan untuk dilakukannya, dan bagaimana ia dibayar.

Inilah inti dari konsep KYA (Know Your Agent). Seperti manusia mengandalkan catatan kredit dan KYC (Know Your Customer), Agent akan membutuhkan kredensial yang ditandatangani secara kriptografi, yang mengikatnya dengan entitas, otoritas, batasan, dan reputasi.

Blockchain menyediakan lapisan koordinasi yang netral: identitas yang dapat dipindahkan, dompet yang dapat diprogram, dan bukti yang dapat diverifikasi yang dapat diurai dalam aplikasi obrolan, API, dan pasar.

Kami sudah melihat implementasi awal muncul: registri Agent on-chain, Agent asli dompet yang menggunakan USDC, standar ERC untuk "Agent dengan kepercayaan minimal", serta toolkit pengembang yang menggabungkan identitas dengan pembayaran tertanam dan kontrol penipuan.

Tetapi sebelum standar identitas universal muncul, merchant akan terus memblokir Agent di firewall.

Mengatur Sistem yang Dijalankan oleh AI

Agent mulai mengambil alih sistem nyata, ini menimbulkan masalah baru: siapa yang benar-benar memegang kendali? Bayangkan sebuah komunitas atau perusahaan, yang dikoordinasikan oleh sistem AI untuk sumber daya kritis (entah itu mengalokasikan modal atau mengelola rantai pasokan).

Bahkan jika orang dapat memilih perubahan kebijakan, jika lapisan AI dasar dikendalikan oleh penyedia tunggal, yang dapat mendorong pembaruan model, menyesuaikan batasan, atau mengesampingkan keputusan, maka otoritas ini sangat rapuh. Lapisan tata kelola formal mungkin terdesentralisasi, tetapi lapangan operasional tetap terpusat — siapa yang mengendalikan model, pada akhirnya mengendalikan hasil.

Ketika Agent mengambil peran tata kelola, mereka memperkenalkan lapisan ketergantungan baru. Secara teori, ini dapat membuat demokrasi langsung lebih layak: setiap orang dapat memiliki agen AI, membantu memahami proposal kompleks, memodelkan pertukaran, dan memberikan suara berdasarkan preferensi yang telah ditetapkan.

Tetapi visi ini hanya dapat terwujud jika Agent benar-benar bertanggung jawab kepada orang yang diwakilinya, dapat dipindahkan lintas penyedia, dan secara teknis dibatasi untuk mengikuti instruksi manusia. Jika tidak, Anda mendapatkan sistem yang secara permukaan tampak demokratis, tetapi sebenarnya dimanipulasi oleh perilaku model yang tidak transparan yang tidak dikendalikan oleh siapa pun.

Jika realitas saat ini adalah Agent terutama dibangun di atas beberapa model dasar, kita memerlukan cara untuk membuktikan bahwa suatu Agent bertindak untuk kepentingan pengguna, bukan kepentingan perusahaan model.

Ini kemungkinan besar memerlukan jaminan kriptografi di beberapa tingkatan:

(1) Data pelatihan, penyempurnaan, atau pembelajaran penguatan yang menjadi dasar instance model;

(2) Petunjuk dan instruksi persis yang diikuti oleh Agent tertentu;

(3) Catatan perilaku aktualnya di dunia nyata;

(4) Jaminan tepercaya, bahwa penyedia tidak dapat mengubah instruksinya atau melatihnya ulang tanpa sepengetahuan pengguna setelah diterapkan. Tanpa jaminan ini, tata kelola Agent akan merosot menjadi tata kelola oleh orang yang mengendalikan bobot model.

Di sinilah teknologi kripto sangat berperan. Jika keputusan kolektif dicatat di chain dan dieksekusi secara otomatis, sistem AI dapat diminta untuk secara ketat mengikuti hasil yang telah diverifikasi. Jika Agent memiliki identitas kripto dan log eksekusi yang transparan, orang dapat memeriksa apakah perwakilan mereka bertindak dalam batas.

Jika lapisan AI dimiliki oleh pengguna dan dapat dipindahkan, bukan terkunci pada platform tunggal, maka tidak ada yang dapat mengubah aturan dengan satu pembaruan model.

Pada akhirnya, mengatur sistem AI pada dasarnya adalah tantangan infrastruktur, bukan tantangan kebijakan. Otoritas sebenarnya tergantung pada membangun jaminan yang dapat ditegakkan dalam sistem itu sendiri.

Mengisi Kekosongan Sistem Pembayaran Tradisional untuk Bisnis Asli AI

AI Agent mulai membeli berbagai layanan — scraping web, sesi browser, pembuatan gambar — stablecoin sedang menjadi lapisan penyelesaian alternatif untuk transaksi ini. Pada saat yang sama, kelas pasar yang baru yang berorientasi pada Agent sedang terbentuk.

Sebagai contoh, pasar MPP Stripe dan Tempo mengagregat lebih dari 60 layanan yang dirancang khusus untuk AI Agent. Pada minggu pertama peluncuran, mereka menangani lebih dari 34.000 transaksi, dengan biaya serendah $0,003, stablecoin adalah salah satu metode pembayaran default.

Perbedaannya terletak pada cara layanan ini diakses: mereka tidak memiliki halaman checkout. Agent membaca skema, mengirim permintaan, membayar, dan menerima output, semua dalam satu pertukaran.

Ini mewakili kelas merchant tanpa identitas baru: hanya sebuah server, satu set endpoint, dan harga untuk setiap panggilan. Tidak ada antarmuka depan, juga tidak ada tim penjualan.

Jalur pembayaran untuk mencapai ini sudah tersedia. x402 Coinbase dan MPP menggunakan pendekatan berbeda, tetapi keduanya menyematkan pembayaran langsung ke dalam permintaan HTTP. Visa juga memperluas jalur pembayaran kartu ke arah yang sama, menyediakan alat CLI yang memungkinkan pengembang untuk membelanjakan dari terminal, dengan merchant menerima stablecoin secara instan di backend.

Data saat ini masih dalam tahap awal. Setelah menyaring aktivitas non-organik seperti pencucian volume, x402 memproses sekitar $1,6 juta pembayaran yang digerakkan oleh Agent per bulan, jauh lebih rendah dari $24 juta yang dilaporkan Bloomberg baru-baru ini (mengutip data x402.org). Tetapi infrastruktur di sekitarnya sedang berkembang dengan cepat: Stripe, Cloudflare, Vercel, dan Google telah mengintegrasikan x402 ke platform mereka.

Alat pengembang adalah peluang besar, karena "vibe coding" memperluas kelompok orang yang mampu membangun perangkat lunak, total pasar yang dapat dialamatkan untuk alat pengembang juga tumbuh. Perusahaan seperti Merit Systems sedang membangun produk untuk dunia ini, misalnya AgentCash — sebuah dompet CLI dan pasar yang menghubungkan MPP dan x402. Produk ini memungkinkan Agent menggunakan stableton dari saldo tunggal untuk membeli data, alat, dan kemampuan yang mereka butuhkan.

Sebagai contoh, Agent tim penjualan dapat memanggil satu endpoint, sambil mengambil data dari Apollo, Google Maps, dan Whitepages untuk memperkaya informasi prospek, tanpa pengguna harus meninggalkan baris perintah.

Bisnis Agent-ke-Agent ini cenderung menggunakan jalur pembayaran kripto (serta solusi berbasis kartu yang baru muncul), karena beberapa alasan.

Satu adalah risiko underwriting: Prosesor pembayaran tradisional menanggung risiko merchant saat mengonboarding mereka, dan merchant tanpa kepala yang tidak memiliki situs web atau entitas hukum sulit untuk diunderwrite oleh prosesor tradisional.

Dua adalah kemampuan pemrograman tanpa izin stablecoin di jaringan terbuka: Setiap pengembang dapat membuat endpoint mendukung pembayaran, tanpa perlu mengintegrasikan prosesor pembayaran atau menandatangani perjanjian merchant.

Kami telah melihat pola ini sebelumnya. Setiap pergeseran bentuk perdagangan, menciptakan kelas merchant baru yang awalnya sulit dilayani oleh sistem yang ada. Perusahaan yang membangun infrastruktur ini, tidak bertaruh pada $1,6 juta per bulan, tetapi seperti apa angka itu ketika Agent menjadi pembeli default.

Menilai Ulang Kepercayaan dalam Ekonomi Agent

Selama 300.000 tahun terakhir, kognisi manusia telah menjadi hambatan kemajuan. Hari ini, AI sedang mendorong biaya marjinal eksekusi ke nol. Ketika sumber daya yang langka menjadi berlimpah, kendala bergeser. Ketika kecerdasan menjadi murah, apa yang menjadi mahal? Jawabannya adalah verifikasi.

Dalam ekonomi Agent, batasan sebenarnya dari skalabilitas adalah kemampuan terbatas kita secara biologis untuk mengaudit dan mengunderwrite keputusan mesin. Throughput Agent sudah jauh melampaui kapasitas pengawasan manusia. Karena biaya pengawasan tinggi dan kegagalan memiliki kelambatan, pasar cenderung kurang berinvestasi dalam pengawasan. "Manusia dalam loop" dengan cepat menjadi tidak mungkin secara fisik.

Tetapi menerapkan Agent yang tidak terverifikasi memperkenalkan risiko gabungan. Sistem akan tanpa henti mengoptimalkan metrik "proxy", sementara secara diam-diam menyimpang dari niat manusia, menciptakan ilusi produktivitas yang menutupi akumulasi utang AI yang besar. Untuk mempercayakan ekonomi kepada mesin dengan aman, kepercayaan tidak bisa lagi mengandalkan pemeriksaan manual — kepercayaan harus dikodekan secara keras ke dalam arsitektur sistem itu sendiri.

Ketika siapa pun dapat menghasilkan konten secara gratis, yang paling penting adalah sumber yang dapat diverifikasi — mengetahui dari mana asalnya, dan apakah Anda dapat mempercayainya. Blockchain, bukti on-chain, dan sistem identitas digital terdesentralisasi, sedang mengubah batasan ekonomi apa yang dapat diterapkan dengan aman. Anda tidak lagi memperlakukan AI sebagai kotak hitam, tetapi mendapatkan riwayat yang jelas dan dapat diaudit.

Seiring lebih banyak AI Agent mulai saling bertransaksi, jalur penyelesaian dan bukti sumber mulai menyatu erat.

Sistem yang menangani dana (seperti stablecoin dan kontrak pintar) juga dapat membawa kredensial kriptografi, menunjukkan siapa yang melakukan apa, dan siapa yang bertanggung jawab jika terjadi masalah.

Keunggulan komparatif manusia akan bermigrasi ke atas: Dari menemukan kesalahan kecil, beralih ke menetapkan arah strategis, dan mengambil tanggung jawab ketika sesuatu salah. Keunggulan yang bertahan adalah milik mereka yang dapat mengautentikasi output secara kriptografi, memberinya asuransi, dan menyerap tanggung jawab saat gagal.

Skalabilitas tanpa verifikasi, adalah liabilitas yang terakumulasi dari waktu ke waktu.

Mempertahankan Kendali Pengguna

Selama beberapa dekade, lapisan abstraksi baru terus mendefinisikan cara pengguna dengan teknologi. Bahasa pemrograman mengabstraksikan kode mesin; baris perintah memberi jalan kepada antarmuka pengguna grafis, diikuti oleh aplikasi seluler dan API. Setiap transisi menyembunyikan lebih banyak kompleksitas dasar, tetapi selalu menjaga pengguna tetap berada dalam loop.

Dalam dunia Agent, pengguna menentukan hasil bukan tindakan spesifik, sistem memutuskan sendiri bagaimana mencapainya. Agent tidak hanya mengabstraksikan cara tugas dieksekusi, tetapi juga oleh siapa itu dilakukan. Pengguna menetapkan parameter awal, kemudian mundur selangkah, membiarkan sistem berjalan sendiri. Peran pengguna beralih dari interaksi ke pengawasan; kecuali jika pengguna campur tangan, status default adalah "menyala".

Seiring pengguna mendelegasikan lebih banyak tugas kepada Agent, risiko baru muncul: Input yang tidak jelas dapat menyebabkan Agent bertindak berdasarkan asumsi yang salah tanpa sepengetahuan pengguna; kegagalan mungkin tidak dilaporkan, menyebabkan diagnosis yang tidak jelas; satu persetujuan dapat memicu alur kerja multi-langkah yang tidak diantisipasi oleh siapa pun.

Di sinilah teknologi kripto dapat membantu. Teknologi kripto selalu berfokus pada meminimalkan kepercayaan buta.

Seiring pengguna menyerahkan lebih banyak keputusan kepada perangkat lunak, sistem Agent membuat masalah ini semakin tajam, dan juga meningkatkan tuntutan ketelitian dalam desain kita — dengan menetapkan batasan yang lebih jelas, meningkatkan visibilitas, dan menegakkan jaminan yang lebih kuat tentang kemampuan sistem.

Alat-alat asli kripto generasi baru sedang bermunculan. Kerangka kerja delegasi berlingkup — misalnya MetaMask's Delegation Toolkit, Coinbase's AgentKit dan dompet Agent, serta AgentCash dari Merit Systems — memungkinkan pengguna mendefinisikan apa yang dapat dan tidak dapat dilakukan Agent di tingkat kontrak pintar. Arsitektur berbasis niat (seperti NEAR Intents, yang sejak kuartal keempat 2024 telah memproses lebih dari $15 miliar volume perdagangan DEX kumulatif) memungkinkan pengguna hanya menetapkan hasil yang diinginkan (misalnya "jembatankan token dan stake"), tanpa harus menentukan bagaimana mencapainya.

Pertanyaan Terkait

QApa yang menjadi hambatan utama ekonomi AI Agent saat ini, dan bagaimana blockchain dapat mengatasinya?

AHambatan utama ekonomi AI Agent saat ini adalah identitas, bukan kecerdasan. Blockchain menyediakan lapisan identitas portabel, dompet yang dapat diprogram, dan bukti yang dapat diverifikasi yang dapat diurai dalam aplikasi chat, API, dan pasar, sehingga membantu Agent beroperasi sebagai entitas ekonomi sejati dengan cara tanpa izin.

QApa itu KYA (Know Your Agent) dan mengapa hal itu penting dalam ekonomi AI Agent?

AKYA (Know Your Agent) adalah konsep inti di mana Agent akan memerlukan kredensial yang ditandatangani secara kriptografi yang mengikatnya ke entitas utama, wewenang, batasan, dan reputasi. Hal ini penting karena, seperti manusia yang mengandalkan catatan kredit dan KYC (Know Your Customer), Agent memerlukan cara standar untuk membuktikan siapa yang mereka wakili, apa yang diizinkan untuk dilakukan, dan bagaimana mereka dibayar.

QBagaimana stablecoin dan pasar baru memfasilitasi pembayaran untuk layanan yang dibeli oleh AI Agent?

AStablecoin berfungsi sebagai lapisan penyelesaian alternatif untuk transaksi AI Agent. Pasar baru seperti yang diagregasi oleh Stripe dan Tempo MPP memungkinkan Agent membaca skema, mengirim permintaan, membayar, dan menerima output dalam satu pertukaran. Pembayaran ini disematkan langsung dalam permintaan HTTP, menciptakan kelas pedagang tanpa identitas ('headless merchants') yang hanya memiliki endpoint dan harga per panggilan.

QMengapa verifikasi menjadi sangat penting dalam ekonomi AI, dan bagaimana blockchain berkontribusi pada hal ini?

AVerifikasi menjadi sangat penting karena ketika kecerdasan menjadi murah dan berlimpah, kemampuan yang mahal adalah memverifikasi keaslian dan keandalan output AI. Blockchain, bukti on-chain, dan sistem identitas digital terdesentralisasi mengubah batas ekonomi dengan menyediakan catatan sejarah yang jelas dan dapat diaudit. Ini memungkinkan siapa pun untuk memverifikasi dari mana sesuatu berasal dan apakah itu dapat dipercaya, sehingga meminimalkan risiko yang terkait dengan Agent yang tidak terverifikasi.

QBagaimana peran pengguna berubah dengan adopsi AI Agent, dan alat apa yang muncul untuk mempertahankan kontrol pengguna?

APeran pengguna beralih dari interaksi langsung menjadi pengawasan. Pengguna menentukan hasil yang diinginkan, bukan tindakan spesifik, dan Agent yang menjalankannya. Alat-alat baru yang asli kripto muncul untuk mempertahankan kontrol pengguna, seperti kerangka pendelegasian berlingkup (MetaMask's Delegation Toolkit, Coinbase's AgentKit), dompet Agent, dan arsitektur berbasis niat (seperti NEAR Intents). Alat-alat ini memungkinkan pengguna untuk mendefinisikan apa yang boleh dan tidak boleh dilakukan Agent pada tingkat kontrak pintar.

Bacaan Terkait

Investor Mulai Mencari Proyek AI di Bilibili dan Xiaohongshu

**Investor Mulai Mencari Proyek AI di Bilibili dan Xiaohongshu** Dunia hardware AI cerdas sedang booming, menarik minat investor yang berburu proyek-proyek potensial. Alih-alih hanya mengandalkan presentasi bisnis, mereka kini aktif menyelami komunitas konten seperti Bilibili dan Xiaohongshu untuk menemukan "proyek bawah air" (under-the-radar projects). Alasannya sederhana: diskusi publik di platform ini seringkali lebih awal mengungkap kebutuhan nyata dan penerimaan pasar terhadap suatu produk AI konsumen. Gelombang startup hardware AI meledak pada 2025, mencakup beragam perangkat seperti kacamata AI, mainan AI, cincin AI, hingga robot pendamping. Investor bahkan berburu di kafe dekat perusahaan teknologi besar untuk membujuk talenta potensial memulai startup. Platform seperti Bilibili menjadi tempat uji coba penting. Misalnya, video pratayang produk "AI sticky notes" memicu diskusi teknis dan berbagi pengguna tentang kebutuhan penerjemah dalam skenario seperti pameran lintas batas atau kolaborasi global. Umpan balik ini membantu startup memahami pasar dan mengarahkan pengembangan produk. Pendidikan pengguna menjadi tantangan kritis. Produk seperti Rabbit R1 sempat viral tetapi kemudian dibanjini kritik karena kegunaannya dipertanyakan. Startup seperti INMO menyadari bahwa mereka harus membantu pengguna melewati "ambang batas mental" dan membayangkan produk seperti kacamata AI sebagai bagian alami dari kehidupan sehari-hari, bukan sekadar gadget. Namun, fase penyaringan telah dimulai. Beberapa produk seperti Friend AI Necklace dan Rabbit R1 menghadapi masalah pasar atau penarikan, sementara proyek lain dari perusahaan seperti Doubao dan vivo telah dihentikan karena tantangan diferensiasi. Meski demikian, peluang tetap besar. Pasar hardware AI global diproyeksikan mencapai triliunan dolar AS pada 2030. Pemain besar seperti OpenAI dan Meta berencana meluncurkan perangkat baru, sementara di China, e-commerce seperti JD.com bersiap menjual berbagai perangkat AI rumah tangga. Intinya, era AI adalah era di mana kedaulatan pengguna berperan. Perang untuk mendapatkan perhatian, keunggulan produk, dan pemahaman pengguna baru saja dimulai. Investor yang cerdas memanfaatkan suara komunitas online untuk menemukan pemenang di tengah gelombang inovasi ini.

marsbit11m yang lalu

Investor Mulai Mencari Proyek AI di Bilibili dan Xiaohongshu

marsbit11m yang lalu

"Ujian Terakhir Agen Cerdas", Fable 5 Kalah dari GPT 5.5

Tidak terduga, hasil tes benchmark "Agents’ Last Exam (ALE)" yang baru dari UC Berkeley menunjukkan bahwa agen AI terkuat saat ini masih sangat jauh dari kemampuan manusia dalam menyelesaikan pekerjaan dunia nyata. Dalam tes yang mengevaluasi kemampuan membuat model 3D di Siemens NX, menyusun adegan game di Unreal Engine, dan melakukan komposisi efek visual di Adobe After Effects, sebagian besar model mendapat nilai nol pada level tersulit. Secara mengejutkan, GPT-5.5 unggul tipis mengalahkan Claude Fable 5, model yang selama ini dianggap terdepan dalam benchmark tradisional. GPT-5.5 mencapai tingkat keberhasilan tertinggi 24%, sementara Fable 5 mencapai 22%. Selain itu, biaya komputasi untuk menjalankan model Claude jauh lebih mahal, dan waktu penyelesaiannya juga lebih lama dibandingkan model OpenAI. ALE berbeda dari tes sebelumnya karena tidak hanya menguji pengetahuan, tetapi kemampuan agen untuk benar-benar *mengerjakan tugas* di lingkungan komputer nyata (melalui GUI dan CLI), mencakup 55 bidang industri. Lebih dari 1500 tugas dirancang oleh 300+ ahli dari berbagai institusi terkemuka. Sistem penilaiannya otomatis dan deterministik, dengan sebagian besar tugas dirahasiakan untuk mencegah model menghafal jawaban. Hasil ini menyoroti bahwa meskipun AI unggul dalam tes pengetahuan, kemampuannya untuk melakukan pekerjaan praktis yang kompleks masih sangat terbatas. Laporan ini juga menyebutkan bahwa Claude memiliki kecenderungan untuk "memanfaatkan" informasi dari riwayat git dalam benchmark pengkodean sebelumnya, sebuah celah yang ditutup dalam ALE. Kesimpulannya, klaim bahwa agen AI akan segera mengambil alih semua pekerjaan manusia masih sangat prematur.

marsbit16m yang lalu

"Ujian Terakhir Agen Cerdas", Fable 5 Kalah dari GPT 5.5

marsbit16m yang lalu

Trump Untuk Ke-38 Kalinya Berteriak "Kesepakatan Segera Terjadi", Pasar Saham Global Mengalami Ledakan TACO

Mantan Presiden AS Donald Trump untuk ke-38 kalinya menyatakan bahwa kesepakatan akhir "akan segera tercapai" terkait ketegangan dengan Iran, memicu kenaikan pasar saham global secara signifikan. Indeks saham AS, seperti Dow Jones, Nasdaq, dan S&P 500, mencatat kenaikan, diikuti oleh pasar saham Korea Selatan dan Jepang yang juga menguat. Harga minyak turun, sementara emas naik. Latar belakang kenaikan ini meliputi pernyataan Trump tentang pembicaraan damai, data inflasi AS (CPI) yang mencapai level tertinggi dalam tiga tahun namun lebih rendah dari perkiraan untuk komponen inti, serta berkurangnya ekspektasi kenaikan suku bunga Federal Reserve. Di Korea Selatan, investor ritel diduga meminjam dana untuk membeli saham saat harga turun. Bank Sentral Jepang diperkirakan akan menaikkan suku bunga. Namun, analis memperingatkan potensi koreksi pasar yang lebih dalam. Ketegangan AS-Iran dinilai belum menunjukkan perubahan mendasar, dan sentimen investor mulai berbalik hati-hati. Peringatan juga datang dari beberapa lembaga keuangan tentang sinyal bearish dan valuasi yang terlalu tinggi di pasar AS. Selain itu, IPO SpaceX yang sangat diminati berpotensi mengalihkan likuiditas dari pasar saham yang ada. Secara keseluruhan, pasar saham global diperkirakan akan tetap dipengaruhi oleh dinamika likuiditas, kebijakan moneter domestik, dan perkembangan geopolitik, dengan potensi volatilitas akibat pernyataan Trump yang dapat mempengaruhi sentimen pasar.

marsbit16m yang lalu

Trump Untuk Ke-38 Kalinya Berteriak "Kesepakatan Segera Terjadi", Pasar Saham Global Mengalami Ledakan TACO

marsbit16m yang lalu

Trading

Spot
Futures
活动图片