Kuda Hitam AI Jepang Muncul: Bagaimana Model Kecil 7B Ini Berani Menantang Fable dan Mythos?
Sakana AI merilis model baru bernama Fugu pada Juni 2026, memicu kehebohan di komunitas AI. Dengan hanya 7B parameter inti, model ini mencetak skor 73.7 pada SWE-Bench Pro dan 82.1 pada TerminalBench 2.1, melampaui model raksasa seperti GPT-5.5 dan Claude Opus 4.8, bahkan diklaim sebanding dengan model terdepan seperti Fable 5 dan Mythos Preview. Kunci keberhasilannya terletak pada arsitektur "multi-agen" yang tidak biasa.
Fugu tidak bekerja sendiri. Intinya adalah model kecil 7B yang dilatih dengan pembelajaran penguatan (RL Conductor), bertindak sebagai "mandor" pintar. Saat pengguna memberikan tugas, RL Conductor menganalisis dan membaginya, lalu secara dinamis menugaskannya kepada model-model terbaik dunia seperti GPT-5, Gemini, atau Claude di dalam kumpulan agennya. Ia mengoordinasikan, memverifikasi, dan menyintesis output mereka untuk menghasilkan jawaban akhir yang andal.
Pendekatan ini mengubah paradigma "parameter adalah segalanya". Daripada mengandalkan komputasi internal yang berat, Fugu mengalokasikan daya komputasi untuk penjadwalan, verifikasi, dan sintesis eksternal yang cerdas. Dalam pengujian beta, Fugu menunjukkan keunggulan dalam skenario nyata seperti tinjauan kode yang mendalam, stabilitas percakapan panjang, dan efisiensi token.
Namun, arsitektur ini memiliki kelemahan. Fugu sangat bergantung pada API model dasar AS (GPT, Claude, Gemini), sehingga rentan terhadap perubahan harga, pembatasan, atau ketentuan. Penjadwalan multi-agen juga dapat menambah latensi, dan klaim kesetaraan dengan model seperti Fable didasarkan pada data laporan yang berbeda, bukan pengujian langsung.
Bagi Jepang yang memiliki sumber daya komputasi dan data terbatas, serta menghadapi risiko pembatasan ekspor model AS, Fugu mewakili strategi "penembusan asimetris". Alih-alih bersaing langsung dalam pelatihan model raksasa, Sakana AI fokus pada pelatihan "mandor" cerdas yang dapat memanfaatkan model global terbaik, memberikan fleksibilitas dan ketahanan tertentu. Meski terobosan sistem ini mengesankan, batas kemampuan akhirnya tetap ditentukan oleh model dasar yang diaturnya.
marsbit47m yang lalu