2026-05-21 Kamis

Pusat Berita - Halaman 43

Dapatkan berita kripto dan tren pasar secara real-time melalui Pusat Berita HTX.

Era Auto Research: 47 Tugas Tanpa Jawaban Baku Jadi Daftar Wajib Uji Kemampuan Agent

Di era Auto Research, 47 tugas tanpa jawaban standar kini menjadi patokan wajib untuk mengukur kemampuan Agent AI. Biasanya, AI Agent tampak serba bisa, namun sebenarnya banyak yang hanya mengandalkan pengetahuan dalam basis data yang sudah ada. Dunia rekayasa nyata lebih keras: stabilitas robot bawah air, batas litium pada baterai, pengendalian kebisingan sirkuit kuantum — masalah-masalah ini tidak memiliki "jawaban sempurna", hanya "optimisasi yang mendekati batas maksimal". Baru-baru ini, Frontier-Eng Bench dari Einsia AI's Navers lab menghadirkan perubahan paradigma. Alih-alih menguji AI dengan soal pemrograman lama, benchmark ini memberikan sistem "loop rekayasa" yang lengkap: mengusulkan solusi, terhubung ke simulator, menerima umpan balik dan error, memperbaiki parameter, dan menjalankannya kembali. Dalam 47 tugas lintas disiplin yang menantang, AI harus bertindak seperti insinyur berpengalaman, mencari solusi optimal di antara tiga kendala yang sulit: daya, keamanan, dan kinerja. Ini bukan sekadar kumpulan tes, melainkan gambaran evolusi Agent. Hasil pengujian menunjukkan bahwa model seperti GPT-5.4 berkinerja cukup stabil, tetapi masih jauh dari menyelesaikan seluruh benchmark. Penelitian ini mengungkap pola penting: peningkatan kinerja AI mengikuti hukum pangkat (power law), di mana kemajuan awal cepat tetapi semakin sulit dan kecil seiring waktu. Selain itu, kedalaman eksplorasi (depth) lebih krusial daripada sekadar menjalankan banyak percobaan paralel (width) untuk mencapai terobosan. Implikasi jangka panjangnya adalah potensi lahirnya "AI Engineer". Di masa depan, manusia mungkin fokus pada penentuan tujuan dan arahan, sementara AI akan bekerja tanpa lelah untuk mengoptimalkan solusi — menjalankan simulasi, menganalisis hasil, dan melakukan iterasi terus-menerus menuju target yang ditetapkan. Frontier-Eng Bench menandai langkah menuju sistem AI yang dapat berevolusi secara mandiri dalam loop umpan balik jangka panjang, membawa kita lebih dekat ke era penelitian otomatis (Auto Research) di mana AI aktif berkontribusi dalam memecahkan masalah rekayasa dunia nyata yang kompleks.

marsbit05/13 07:29

Era Auto Research: 47 Tugas Tanpa Jawaban Baku Jadi Daftar Wajib Uji Kemampuan Agent

marsbit05/13 07:29

Wall Street's 'Perburuan Kepatuhan': Migrasi Besar-besaran Cadangan Stablecoin

Dalam sepekan terakhir, beberapa lembaga Wall Street secara bersamaan mempercepat langkah mereka dalam pengembangan dana pasar uang ter-tokenisasi. Pada 12 Mei, JPMorgan Chase mengumumkan peluncuran dana pasar uang ter-tokenisasi kedua mereka, JLTXX, di Ethereum. Di hari yang sama, Payward (induk perusahaan Kraken) menjalin kerja sama strategis dengan Franklin Templeton untuk mengintegrasikan dana ter-tokenisasi seri BENJI ke platform Kraken sebagai alat kolateral dan manajemen kas bagi institusi. Tidak lama sebelumnya, BlackRock kembali mengajukan permohonan kepada SEC untuk dua dana ter-tokenisasi baru, memperdalam kerja samanya dengan Securitize. Serangkaian tindakan ini mencerminkan bahwa antisipasi regulasi mendorong persiapan sisi penawaran dari para institusi besar. Aksi para raksasa keuangan ini menargetkan likuiditas crypto dari berbagai sisi. BlackRock, melalui kemitraan dengan Securitize, berupaya mentransformasi bisnis penyimpanan cadangan stablecoin tradisionalnya secara menyeluruh menjadi aset ter-tokenisasi. JPMorgan, dengan produk JLTXX-nya, mempersiapkan infrastruktur penyelesaian dan cadangan backend untuk bank-bank besar di masa depan jika mereka menerbitkan stablecoin. Sementara itu, kolaborasi Franklin Templeton dan Kraken dengan BENJI bertujuan menyediakan alat manajemen kas berbasis blockchain yang menghasilkan yield dan dapat digunakan sebagai kolateral, mengakali potensi larangan pembayaran bunga pada stablecoin. Langkah-langkah ini sebagian besar dipicu oleh kerangka regulasi yang sedang dibentuk, terutama GENIUS Act yang menetapkan daftar ketat aset cadangan yang memenuhi syarat untuk stablecoin dan melarang pembayaran bunga kepada pemegangnya. Peraturan pelaksanaannya ditargetkan selesai pada 2026. Di sisi lain, CLARITY Act yang sedang dibahas akan mengatur struktur pasar aset digital. Celah antara kedua undang-undang ini—di mana stablecoin dilarang memberi bunga tetapi aset ter-tokenisasi lainnya (seperti dana pasar uang) mungkin tidak—menciptakan peluang bagi produk seperti BENJI. Para pelaku pasar memperkirakan pasar stablecoin dan dana ter-tokenisasi dapat mencapai triliunan dolar dalam beberapa tahun ke depan, mendorong persaingan sengit di antara institusi keuangan tradisional untuk menguasai aliran likuiditas baru ini.

marsbit05/13 05:22

Wall Street's 'Perburuan Kepatuhan': Migrasi Besar-besaran Cadangan Stablecoin

marsbit05/13 05:22

SK Hynix Menjadi "Pengkhianat Kapitalis", Karyawan Samsung Mogok Kerja Besar-besaran

Pembicaraan antara Samsung Electronics dan serikat pekerjanya mencapai titik kritis, dengan serikat pekerja mengancam akan melakukan pemogokan selama 18 hari mulai 21 Mei karena perundingan gagal. Pemogokan yang melibatkan puluhan ribu pekerja di divisi semikonduktor ini berpotensi mengganggu produksi memori global. Inti perselisihan terletak pada struktur bonus. Serikat pekerja menuntut formula pembagian keuntungan tahunan yang tetap sebesar 13% dari laba operasional divisi semikonduktor, mencontoh kesepakatan yang telah diterapkan oleh pesaing SK Hynix. SK Hynix tahun lalu menyetujui pembagian 10% laba operasional kepada karyawan untuk sepuluh tahun ke depan, yang telah menghasilkan bonus signifikan berkat keuntungan besar dari penjualan HBM untuk chip AI Nvidia. Manajemen Samsung menawarkan bonus satu kali berdasarkan kinerja saat ini, tetapi menolak mengikatnya dalam formula tahunan yang permanen. Kekhawatiran mereka adalah menetapkan preseden yang dapat mengacaukan struktur kompensasi di seluruh grup bisnis yang beragam dan memicu tuntutan serupa dari divisi lain. Konflik ini menyoroti pertanyaan yang lebih luas dalam industri AI: bagaimana keuntungan besar yang dihasilkan oleh teknologi ini didistribusikan di dalam perusahaan? Model bagi hasil berbasis tunai ala SK Hynix menawarkan alternatif terhadap skema kepemilikan saham tradisional Silicon Valley. Hasil negosiasi di Samsung, apa pun bentuknya, dapat menjadi tren penting bagi pekerja di seluruh rantai pasokan teknologi tinggi untuk memperjuangkan bagian yang lebih adil dari "kue AI".

marsbit05/13 05:12

SK Hynix Menjadi "Pengkhianat Kapitalis", Karyawan Samsung Mogok Kerja Besar-besaran

marsbit05/13 05:12

Altman Ungkap Bom Waktu Saat Musk Sedang Bepergian: Dia Pernah Ingin Anak-anaknya Mewarisi OpenAI

Saat sidang kasus hukum antara Elon Musk dan OpenAI, Sam Altman bersaksi untuk pertama kalinya. Dalam kesaksiannya, Altman mengungkapkan konflik internal mendalam di awal pendirian OpenAI dengan Musk. Altman menyatakan bahwa Musk ingin memiliki kendali yang lebih besar atas OpenAI, termasuk kepemilikan saham mayoritas dan hak penentu akhir atas arah organisasi. Klaim paling mengejutkan adalah bahwa Musk pernah membayangkan untuk mewariskan kendali atas OpenAI kepada anak-anaknya di masa depan—sebuah gagasan yang ditolak keras oleh Altman dengan alasan bertentangan dengan prinsip dasar bahwa AGI seharusnya tidak dikendalikan oleh individu atau entitas tunggal. Altman juga membantah narasi utama Musk bahwa OpenAI telah "mengkhianati misi awalnya" dengan beralih ke struktur for-profit. Dia bersaksi bahwa Musk sejak awal mengetahui dan bahkan mendukung eksplorasi model profit, karena menyadari kebutuhan dana besar untuk pengembangan AI. Perselisihan lain muncul ketika Musk mengusulkan agar OpenAI bergabung dengan Tesla, usul yang ditolak Altman karena khawatir misi penelitian OpenAI akan tersandung oleh tujuan komersial perusahaan mobil. Altman menggambarkan gaya manajemen Musk yang terstruktur dan berorientasi pada hasil sebagai tidak cocok dengan budaya penelitian OpenAI, bahkan merusak moral tim inti. Dia juga mengungkapkan kekhawatiran tim akan tindakan balasan Musk setelah hengkang dari dewan. Dalam kesaksiannya, Altman tampak lebih banyak berbicara sebagai CEO yang menangani tata kelola organisasi dan tantangan sumber daya, dibandingkan sebagai idealis teknologi. Dia mengaku sempat mempertimbangkan pindah ke Microsoft saat sempat dipecat pada 2023, tetapi memilih kembali karena dedikasinya yang besar pada OpenAI.

marsbit05/13 04:16

Altman Ungkap Bom Waktu Saat Musk Sedang Bepergian: Dia Pernah Ingin Anak-anaknya Mewarisi OpenAI

marsbit05/13 04:16

活动图片