Tren Teknologi

Mengulas inovasi terbaru, peningkatan protokol, solusi cross-chain, dan mekanisme keamanan dalam ekosistem blockchain. Ini memberikan perspektif yang berfokus pada pengembang untuk menganalisis tren teknologi yang muncul dan potensi terobosan.

Gelembung AI Sebenarnya, Anda Tidak Bisa Membelinya

Baru-baru ini, banyak orang membahas lonjakan harga saham Nvidia dan sektor memori, serta khawatir tentang gelembung AI. Namun, gelembung AI yang sebenarnya mungkin tidak terlihat oleh publik. Inti gelembung ini terjadi di pasar privat, di mana perusahaan-perusahaan AI unggulan seperti OpenAI (valuasi $852 miliar), Anthropic, dan xAI mengalami kenaikan valuasi yang luar biasa, tetapi tidak tersedia untuk investor umum. Kecurangan ini memicu kecemasan, yang kemudian mengalir ke aset terkait AI yang dapat diperdagangkan secara publik, seperti chip dan memori. Berbeda dengan era dotcom, likuidasi kekayaan di era AI terjadi lebih dini dan tertutup. Karyawan dan pendiri perusahaan AI dapat mencairkan saham mereka jauh sebelum IPO, melalui penjualan saham internal, "akuisisi" terselubung yang hanya mengambil tim inti dan lisensi teknologi, atau pinjaman berbasis agunan saham. Investor awal juga dapat keluar melalui dana kelanjutan yang dipimpin oleh GP. Di sisi infrastruktur, risiko gelembung semakin mirip dengan krisis perumahan 2008. Pusat data AI dan kontrak komputasi kini difinansialisasi menjadi produk kredit yang kompleks melalui pembiayaan utang, pinjaman dengan agunan GPU, dan struktur SPV. Aset-aset ini dinilai berdasarkan proyeksi permintaan AI di masa depan, yang kebenarannya masih belum pasti. Risiko diperparah oleh ketidaktransparan pasar kredit privat, di mana kualitas aset dasar sulit diverifikasi. Singkatnya, bagian terbesar dan paling berisiko dari gelembung AI ini terbentuk di balik layar, di pasar yang tidak dapat diakses oleh investor retail. Ketika gelembung itu akhirnya terlihat oleh publik, transaksi dan likuidasi terpenting seringkali sudah selesai.

marsbit05/14 07:15

Gelembung AI Sebenarnya, Anda Tidak Bisa Membelinya

marsbit05/14 07:15

Dari Ekspor ke Penjualan Domestik: Pelayaran Khas Tiongkok Sebuah Film Pendek AI

**Ringkasan: Ekspor ke Pasar Dalam Negeri, Sebuah Cerita "Ekspor" Gaya China untuk Film Pendek AI** Hollywood mencari seorang pembuat konten China, MX-Shell, setelah CEO studio film AI Genre.ai, PJ Ace, memuji film pendek AI-nya "The Zombie Sweeper" sebagai salah satu film pendek terbaik yang pernah dilihatnya. Film ini awalnya tidak populer di Bilibili dan Douyin, tetapi viral di X (Twitter) setelah dibagikan oleh PJ Ace, memicu pencarian besar-besaran. MX-Shell, yang menyebut diri sendiri sebagai "penggemar amatir" dari Yunnan, membuat film tersebut sendirian dalam 10 hari menggunakan alat video AI China, Seedance 2.0 (dari ByteDance), dengan biaya sekitar 3000 RMB. Dia tidak menyadari popularitasnya di luar negeri karena hambatan bahasa dan akses. Akhirnya, berkat bantuan netizen, dia terhubung dengan PJ Ace melalui email QQ dan menerima tawaran untuk menjadi sutradara di Hollywood. Kisah ini menyoroti fenomena "ekspor ke pasar dalam negeri": sebuah karya buatan China, menggunakan alat AI China, meraih pengakuan global terlebih dahulu sebelum mendapatkan perhatian di dalam negeri. Ini dimungkinkan oleh ekosistem AI video yang matang di luar negeri dan biaya pembuatan yang rendah berkat persaingan ketat antar-platform AI di China. Kisah MX-Shell menunjukkan bahwa meskipun AI menurunkan hambatan teknis dan biaya produksi secara drastis, estetika, kreativitas, dan kemampuan bercerita tetaplah milik individu. Dia bukan sekadar pengguna alat yang beruntung; dia memiliki latar belakang fotografi, musik, dan standar naratif yang tinggi (terinspirasi oleh "Love, Death & Robots"). Ada dua jalur dalam produksi konten AI global: jalur industri (produksi massal untuk monetisasi) dan jalur kreator individu seperti MX-Shell, di mana kualitas konten adalah penggerak utamanya. Jalur kedua ini mungkin akan semakin banyak ditempuh oleh banyak kreator berbakat di China yang kini memiliki alat yang lebih mudah diakses, meskipun menemukan audiens yang tepat mungkin masih memerlukan "rute ekspor" terlebih dahulu.

marsbit05/14 04:29

Dari Ekspor ke Penjualan Domestik: Pelayaran Khas Tiongkok Sebuah Film Pendek AI

marsbit05/14 04:29

Memahami Kolam Profit dan Lanskap Industri dalam Hierarki Penyimpanan AI dalam Satu Artikel

**Ringkasan:** AI storage dibagi menjadi enam lapisan berdasarkan kedekatan dengan unit komputasi: SRAM on-chip, HBM, DRAM motherboard, lapisan pooling CXL, SSD kelas perusahaan, serta NAS dan penyimpanan objek cloud. Pada 2025, total pasar mencapai sekitar $229 miliar, didominasi oleh DRAM (50%), HBM (15%), dan SSD (11%). Struktur pasar sangat terkonsentrasi, dengan tiga pemain utama (Samsung, SK Hynix, Micron) menguasai >90% di lapisan atas. Terdapat tiga jenis kolam laba utama: 1. **Kolam laba oligarki dengan margin tinggi** (HBM, SRAM tertanam, SSD QLC): HBM adalah yang paling menguntungkan (margin operasi Hynix mencapai 72%), didorong oleh permintaan tinggi dan proses manufaktur kompleks (TSV, CoWoS). Pasar HBM diproyeksikan tumbuh CAGR ~40% hingga $100 miliar pada 2028. 2. **Kolam laba baru dengan margin tinggi** (CXL): Teknologi yang memungkinkan pooling memori di tingkat rak, dengan pertumbuhan diperkirakan sangat cepat (CAGR 37%). 3. **Kolam laba berbasis layanan dengan skala besar** (NAS, cloud storage): Mengandalkan penguncian ekosistem dan biaya perpindahan yang tinggi. Intinya: Semakin dekat lapisan penyimpanan dengan unit komputasi (seperti HBM), semakin langka, tinggi marginnya, dan teknologinya semakin kompleks. Pertumbuhan utama berasal dari HBM, SSD kelas perusahaan, dan CXL. Dominasi tiga raksasa memori (Samsung, SK Hynix, Micron) terlihat di hampir semua lapisan kecuali SRAM on-chip (didominasi TSMC) dan CXL Retimer (didominasi Astera Labs).

marsbit05/14 04:07

Memahami Kolam Profit dan Lanskap Industri dalam Hierarki Penyimpanan AI dalam Satu Artikel

marsbit05/14 04:07

AI Agent Dapat Diverifikasi, Tapi Siapa yang Melindungi Privasi Mereka?

**Ringkasan: AI Agent Dapat Diverifikasi, Tapi Siapa yang Melindungi Privasi Mereka?** AI Agent semakin berkembang dari sekadar alat otomatis menjadi partisipan aktif dalam ekonomi *on-chain*. Mereka dapat mewakili pengguna dalam perdagangan, tata kelola, atau interaksi dengan protokol DeFi. Standar seperti ERC-8004 (yang masih dalam draf) diusulkan untuk menyediakan infrastruktur kepercayaan dasar, termasuk identitas dan reputasi portabel, agar Agent dapat dipercaya di jaringan terbuka. Namun, kepercayaan yang dibangun melalui verifikasi dan transparansi penuh dapat menimbulkan masalah privasi. Catatan publik tentang interaksi, umpan balik, dan riwayat Agent dapat membongkar strategi, hubungan bisnis, atau bahkan niat pengguna di baliknya, khususnya dalam skenario sensitif seperti DeFi, tata kelola DAO, atau pasar prediksi. Oleh karena itu, muncul proposal seperti **ACTA (Anonymous Credentials for Trustless Agents)** dari PSE. ACTA berfungsi sebagai lapisan privasi di atas infrastruktur kepercayaan. Alih-alih memaparkan semua data kredensial (seperti skor audit, hash model, atau identitas pengguna), Agent dapat menggunakan kredensial anonim dan bukti pengetahuan nol (zero-knowledge proof) untuk membuktikan bahwa mereka memenuhi persyaratan atau kebijakan tertentu tanpa mengungkapkan detail yang mendasarinya. Pergeseran ini mengubah fokus dari "identitas terbuka" menjadi "bukti kepatuhan terhadap kebijakan." Misalnya, sebuah protokol dapat memverifikasi bahwa Agent telah diaudit atau memiliki reputasi yang cukup, tanpa mengetahui siapa penerbit audit atau riwayat interaksi spesifik Agent tersebut. Ini melindungi strategi dan hubungan sensitif sambil tetap memungkinkan verifikasi yang diperlukan. Meskipun ACTA masih berupa arah penelitian dengan tantangan tersendiri (seperti biaya komputasi, risiko sentralisasi penerbit, atau ukuran *anonymity set*), proposal ini menyoroti pertanyaan kritis untuk ekonomi AI Agent di masa depan. Ekosistem memerlukan lapisan yang tidak hanya menjawab "Apakah Agent ini dapat dipercaya?" tetapi juga "Informasi apa yang terekspos selama proses pembuktian kepercayaan tersebut?" Privasi menjadi syarat fundamental untuk keamanan dan keberlanjutan ketika Agent mulai mewakili tindakan dan niat manusia di ruang *on-chain*.

marsbit05/14 01:30

Negara Penguasa: Anthropic

Pada 6 Mei, Anthropic mengumumkan akan mengambil alih seluruh daya komputasi data center Colossus 1 milik SpaceX, lebih dari 300 MW dengan 220.000 GPU NVIDIA. Tiga bulan saja setelah putaran pendanaan Februari, valuasi Anthropic melonjak dari $380 miliar menjadi $950 miliar, menjadikannya perusahaan AI dengan valuasi tertinggi. Pendorong utama adalah pendapatan tahunan yang meledak menjadi lebih dari $440 miliar, didorong oleh Claude Code yang menguasai 54% pangsa pasar alat pengkodean AI. Anthropic kini mendominasi infrastruktur AI dengan mengamankan komitmen daya komputasi lebih dari 20 GW dan pendanaan besar dari Amazon ($250 miliar) dan Google ($400 miliar), yang sebagian besar harus dibelanjakan kembali untuk layanan cloud dan chip mereka. Ini menciptakan struktur "negara penguasa" di mana raksasa teknologi saling bersaing memasok sumber daya langka mereka. Namun, status ini menghadapi tantangan. OpenAI menyerang metode akuntansi "bruto" Anthropic, yang mencatat seluruh pendapatan termasuk bagian platform cloud, berbeda dengan metode "bersih" mereka. Perbedaan ini, diperkirakan $64 miliar untuk tahun 2026, menjadi titik lemah sebelum IPO kedua perusahaan. Meski demikian, kekuatan Anthropic terletak pada arsitektur multi-cloudnya (tersedia di AWS, Google Cloud, Azure) dan dominasi dalam alur kerja pengembangan perangkat lunak melalui Claude Code. Masa depan "negara penguasa" ini bergantung pada kemampuannya bertransisi dari ketergantungan pada "pemasok" ke kemampuan mandiri, terutama saat menghadapi pengawasan ketat SEC selama proses IPO nanti.

marsbit05/14 00:46

marsbit05/14 00:46

Setelah Keluar dari Meta, Tian Yuandong Baru Saja Umumkan Akan Memulai Startup

Setelah meninggalkan Meta, Tian Yuandong secara resmi mengumumkan pembentukan perusahaan startup bernama Recursive_SI. Perusahaan ini didirikan oleh sejumlah ahli AI terkemuka, termasuk Tian Yuandong, Richard Socher (CEO), Tim Rocktäschel, Jeff Clune, Tim Shi, Caiming Xiong, dan Alexey Dosovitskiy. Mereka memiliki pengalaman luas di laboratorium penelitian AI perusahaan seperti Salesforce, Uber, OpenAI, DeepMind, Google Brain, dan Meta. Recursive_SI berfokus pada pengembangan kecerdasan buatan yang mampu melakukan eksperimen secara mandiri dan meningkatkan diri dengan aman melalui proses penemuan ilmiah otomatis yang terbuka. Pendekatan ini dianggap sebagai jalur yang paling memungkinkan menuju superintelijen. Saat ini, perusahaan telah mengumpulkan pendanaan sebesar $6,5 miliar dengan valuasi $46,5 miliar, dipimpin oleh GV (Google Ventures) dan Greycroft, dengan partisipasi penting dari AMD Ventures dan NVIDIA. Tim yang terdiri dari lebih dari 25 orang terus berkembang, menarik bakat-bakat seperti Zhuge Mingchen, seorang Founding Member yang lulusan doktoral KAUST di bawah bimbingan Prof. Jürgen Schmidhuber. Penelitiannya berfokus pada Agen Pemrograman, Perbaikan Diri Rekursif (RSI), dan Paradigma Mesin Generasi Berikutnya. Karya sebelumnya tim ini mencakup sistem awal RSI seperti GPTSwarm dan penelitian tentang arsitektur AI baru seperti NeuralComputer. Para pendiri menyatakan bahwa mereka sedang membangun AI yang dapat menemukan pengetahuan secara otomatis dan meningkatkan diri secara rekursif, sebuah proses yang diharapkan dapat mengubah cara kemajuan sains dan teknologi. Tim mereka telah mencapai terobosan signifikan dalam berbagai bidang inti AI, seperti algoritma terbuka, algoritma keanekaragaman kualitas, agen pemrograman yang dapat memperbaiki diri, dan model dunia dasar.

marsbit05/14 00:28

Setelah Keluar dari Meta, Tian Yuandong Baru Saja Umumkan Akan Memulai Startup

marsbit05/14 00:28

AI Bull Market Mendefinisikan Ulang Segalanya, Termasuk "Sistem Penilaian Pria" di Pasar Lamaran

**Judul: Bull Market AI Menilai Ulang Segalanya, Termasuk "Sistem Penilaian Pria" di Pasar Pernikahan** Pasar perjodohan Korea Selatan kini memiliki "mata uang keras" baru: karyawan **SK Hynix**. Agen perjodohan bahkan secara otomatis menaikkan rating pasangan yang cocok untuk mereka ke level tertinggi. Hal ini terjadi karena sistem bonus "Profit Sharing" (PS) perusahaan, yang tanpa batas atas dan mengalokasikan 10% dari laba operasional, telah menciptakan era bonus miliaran Won. Rata-rata bonus karyawan pada Q1 2025 mencapai ~107 juta Won (sekitar Rp 1,2 miliar). Proyeksi untuk 2027 bahkan mencapai 1,29 miliar Won (sekitar Rp 14,6 miliar) per karyawan. Imbasnya, hubungan kantor pun dilihat sebagai "strategi alokasi aset keluarga". Ini adalah bagian dari pergeseran besar dalam hierarki daya tarik pria lajang, yang didorong oleh gelombang **AI**. Berikut adalah peringkat berdasarkan "nilai pasar" di era AI: * **Tier S (夯爆了 / Sangat Panas): NVIDIA & SK Hynix.** NVIDIA adalah "mesin pencetak uang" utama dunia AI, GPU-nya adalah "minyak" baru. SK Hynix adalah pemenang besar di pasar memori HBM untuk AI, menciptakan legenda bonus bagi karyawannya. * **Tier A (夯 / Panas): Anthropic & OpenAI.** Perusahaan-perusahaan model AI paling top ini memungkinkan karyawan mencairkan kekayaan saham dalam skala besar (misalnya, ratusan juta dolar AS), mengubah opsi menjadi kekayaan nyata, tidak seperti era dotcom dulu. * **Tier B (Manusia di Atas Manusia): DeepSeek & ByteDance.** Keduanya terlibat dalam "perang talenta AI" dengan pendanaan besar. ByteDance (valuasi >$600B) meningkatkan harga buyback saham karyawan. DeepSeek mengumpulkan dana besar untuk mempertahankan talenta intinya. Karyawan AI mereka adalah pemain kelas tinggi yang sangat langka. * **Tier C (NPC / Karakter Latar): Samsung & Tencent.** Mereka terlihat seperti masih mencari "tiket" ke era AI. Samsung tertinggal di HBM dari SK Hynix, memicu rencana mogok kerja besar-besaran oleh serikat pekerja. Tencent, meski berinvestasi dalam AI, lebih hati-hati dan menghadapi perlambatan bisnis inti, membuatnya tertinggal dari agresivitas ByteDance. * **Tier D (拉完了 / Selesai / Redup): Pria Finansial Tradisional & Pria Crypto.** Mereka kehilangan cahaya kejayaan karena redistribusi kekayaan di era baru ini. Dibandingkan dengan bonus dan ekuitas bernilai fantastis di perusahaan AI, daya tarik "elit finansial" dan "dewa crypto" telah memudar dalam pandangan pasar perjodohan. Singkatnya, AI tidak hanya mendefinisikan ulang valuasi perusahaan, tetapi juga "valuasi" sosial dan ekonomi dari para profesional, yang tercermin secara nyata dalam dinamika pasar perjodohan.

marsbit05/13 13:13

AI Bull Market Mendefinisikan Ulang Segalanya, Termasuk "Sistem Penilaian Pria" di Pasar Lamaran

marsbit05/13 13:13

AI Bull Market Harga Ulang Segalanya, Termasuk 'Sistem Penilaian Pria' di Pasar Kencan

Pasar perjodohan Korea Selatan kini memiliki "mata uang keras" baru: karyawan SK Hynix. Menurut agen perjodohan Gayeon, peringkat kecocokan untuk karyawan SK Hynix melonjak dari B+ menjadi A. Penyebabnya adalah sistem bonus yang luar biasa. Dengan permintaan HBM (High-Bandwidth Memory) untuk AI yang meledak, SK Hynix menghapus batas atas bonus dan mengalokasikan 10% laba operasional untuk bonus karyawan. Pada 2025, rata-rata bonus mencapai 1,4 miliar Won (sekitar Rp 1,5 miliar). Bahkan diprediksi pada 2027 bisa mencapai 12,9 miliar Won (sekitar Rp 14 miliar) per karyawan. Fenomena ini menyebabkan "efek sinergi ekonomi" sehingga hubungan romantis di kantor dianggap sebagai pilihan strategis. Demam AI telah mengubah hierarki nilai pria di pasar perjodohan. Berikut peringkat berdasarkan analisis *Odaily Planet Daily*: **Tier S (Terbaik): NVIDIA & SK Hynix** NVIDIA adalah "mesin pencetak uang" utama di dunia AI, sementara SK Hynix adalah "pembuat mitos bonus". Keduanya mewakili infrastruktur AI dan memberikan aliran pendapatan yang stabil dan sangat tinggi. **Tier A (Sangat Baik): Anthropic & OpenAI** Perusahaan AI terkemuka ini memungkinkan karyawan mencairkan kekayaan saham mereka dalam skala besar (misalnya, beberapa karyawan OpenAI mencairkan saham senilai $30 juta). Mereka dianggap sebagai "aset pertumbuhan tinggi" meski dengan volatilitas yang lebih besar. **Tier B (Baik): DeepSeek & ByteDance (TikTok)** Kedua raksasa teknologi China ini sedang berperang merebut talenta AI dengan pendanaan besar-besaran (ByteDance menginvestasikan ~Rp 4.500 triliun, DeepSeek mencari pendanaan Rp 1.000 triliun). Nilai perusahaan dan kekayaan karyawan terus naik, menjadikan mereka pemain utama yang sangat dihargai. **Tier C (Biasa): Samsung & Tencent (WeChat)** Mereka dianggap tertinggal dalam perlombaan AI. Samsung kalah dari SK Hynix dalam HBM, sementara investasi AI Tencent lebih hati-hati dibandingkan ByteDance. Mereka digambarkan sedang mencari "tiket kapal" di era AI. **Tier D (Kurang): Pria Finansial Tradisional & Pria Dunia Kripto** Dibandingkan dengan gelombang kekayaan baru dari industri AI, daya tarik profesi di sektor keuangan tradisional dan aset kripto dianggap memudar, karena tidak lagi berada di pusat distribusi kekayaan era sekarang. Kesimpulannya, gelombang AI tidak hanya menilai ulang perusahaan dan saham, tetapi juga "sistem penilaian" pria di pasar perjodohan, dengan insinyur dan talenta AI menjadi yang paling berharga.

Odaily星球日报05/13 13:12

AI Bull Market Harga Ulang Segalanya, Termasuk 'Sistem Penilaian Pria' di Pasar Kencan

Odaily星球日报05/13 13:12

Setelah Meninggalkan OpenAI, Berapa Kali Lipat Nilai Kekayaan Mereka Meningkat?

Judul: Setelah Meninggalkan OpenAI, Berapa Kali Lipat Nilai Mereka Meningkat? Artikel ini membahas bagaimana para mantan karyawan OpenAI menjadi sangat berharga dengan mendirikan perusahaan atau berinvestasi di bidang AI. Nilai gabungan mereka diperkirakan mendekati $10 triliun. Contohnya termasuk Dario Amodei (Anthropic, valuasi potensial $9 triliun), Ilya Sutskever (SSI, valuasi $320 miliar), Aravind Srinivas (Perplexity, valuasi $212 miliar), dan Mira Murati (Thinking Machines Lab, valuasi $120 miliar). Sorotan utama adalah Leopold Aschenbrenner, yang dipecat pada usia 23 tahun. Ia menulis laporan "Situational Awareness" dan berhasil meningkatkan aset dana lindung nilai dari $225 juta menjadi $5,5 miliar dengan berinvestasi di perusahaan nuklir Vistra dan bahan bakar Bloom Energy, berdasarkan pengetahuan internalnya tentang kebutuhan energi AI. Selain pendiri, ada juga yang beralih ke investasi. Misalnya, dana Zero Shot senilai $100 juta yang didirikan oleh mantan karyawan OpenAI seperti Evan Morikawa. Mereka berfokus pada investasi tahap awal, dengan keunggulan utama mereka adalah mengetahui area mana yang harus dihindari berdasarkan wawasan internal, seperti alat "pemrograman atmosfer" atau perusahaan robotika yang mengandalkan data video manusia. Artikel ini juga menyoroti jaringan investasi malaikat di antara alumni, seperti Sam Altman yang dengan cepat mendukung mantan karyawan yang memulai bisnis. Jaringan ini didorong oleh keyakinan bersama pada masa depan AGI (Kecerdasan Buatan Umum), berbeda dengan "PayPal Mafia" yang didasarkan pada pengalaman bersama. Kesimpulannya, alumni OpenAI menggunakan "kesadaran situasional" unik mereka — pemahaman mendalam tentang lanskap AI — untuk membuat keputusan strategis, baik dengan membangun perusahaan baru atau berinvestasi. Pergeseran mereka dari pembangun menjadi investor menunjukkan keyakinan yang kuat pada peluang yang telah mereka identifikasi.

marsbit05/13 09:18

Setelah Meninggalkan OpenAI, Berapa Kali Lipat Nilai Kekayaan Mereka Meningkat?

marsbit05/13 09:18

Era Auto Research: 47 Tugas Tanpa Jawaban Baku Jadi Daftar Wajib Uji Kemampuan Agent

Di era Auto Research, 47 tugas tanpa jawaban standar kini menjadi patokan wajib untuk mengukur kemampuan Agent AI. Biasanya, AI Agent tampak serba bisa, namun sebenarnya banyak yang hanya mengandalkan pengetahuan dalam basis data yang sudah ada. Dunia rekayasa nyata lebih keras: stabilitas robot bawah air, batas litium pada baterai, pengendalian kebisingan sirkuit kuantum — masalah-masalah ini tidak memiliki "jawaban sempurna", hanya "optimisasi yang mendekati batas maksimal". Baru-baru ini, Frontier-Eng Bench dari Einsia AI's Navers lab menghadirkan perubahan paradigma. Alih-alih menguji AI dengan soal pemrograman lama, benchmark ini memberikan sistem "loop rekayasa" yang lengkap: mengusulkan solusi, terhubung ke simulator, menerima umpan balik dan error, memperbaiki parameter, dan menjalankannya kembali. Dalam 47 tugas lintas disiplin yang menantang, AI harus bertindak seperti insinyur berpengalaman, mencari solusi optimal di antara tiga kendala yang sulit: daya, keamanan, dan kinerja. Ini bukan sekadar kumpulan tes, melainkan gambaran evolusi Agent. Hasil pengujian menunjukkan bahwa model seperti GPT-5.4 berkinerja cukup stabil, tetapi masih jauh dari menyelesaikan seluruh benchmark. Penelitian ini mengungkap pola penting: peningkatan kinerja AI mengikuti hukum pangkat (power law), di mana kemajuan awal cepat tetapi semakin sulit dan kecil seiring waktu. Selain itu, kedalaman eksplorasi (depth) lebih krusial daripada sekadar menjalankan banyak percobaan paralel (width) untuk mencapai terobosan. Implikasi jangka panjangnya adalah potensi lahirnya "AI Engineer". Di masa depan, manusia mungkin fokus pada penentuan tujuan dan arahan, sementara AI akan bekerja tanpa lelah untuk mengoptimalkan solusi — menjalankan simulasi, menganalisis hasil, dan melakukan iterasi terus-menerus menuju target yang ditetapkan. Frontier-Eng Bench menandai langkah menuju sistem AI yang dapat berevolusi secara mandiri dalam loop umpan balik jangka panjang, membawa kita lebih dekat ke era penelitian otomatis (Auto Research) di mana AI aktif berkontribusi dalam memecahkan masalah rekayasa dunia nyata yang kompleks.

marsbit05/13 07:29

Era Auto Research: 47 Tugas Tanpa Jawaban Baku Jadi Daftar Wajib Uji Kemampuan Agent