Semua orang mungkin masih ingat, pada bulan April lalu, Anthropic merilis model bernama Mythos.
Dari namanya saja sudah tahu betapa hebatnya, mitologi.
Saat itu, dikabarkan telah menemukan lebih dari sepuluh ribu kerentanan berisiko tinggi bagi 50 perusahaan klien, mengguncang seluruh industri.
Kabar ini pernah menyebabkan saham keamanan siber anjlok, semua orang mungkin masih ingat.
Karena terlalu kuat, khawatir disalahgunakan, "terlalu berbahaya untuk dipublikasikan", jadi tidak dibuka untuk umum.
Sampai kemarin malam, Anthropic menambahkan pengklasifikasi keamanan ke model Mythos, secara resmi meluncurkan Fable 5.
Adapun Mythos 5 yang belum dikebiri, saat ini hanya dibuka untuk sekitar 200 institusi yang telah melalui peninjauan ketat seperti Gedung Putih, pembela keamanan siber, dan proyek Plan Butterfly.
Begitu hati-hatinya, sangat sulit untuk tidak mengingatkan pada animasi AI yang sedang panas belakangan ini "Angel Engine".
Apakah yang terkunci di dalam sangkar itu adalah sang "malaikat"?
Bahkan jika sekarang bukan, sudah tidak jauh lagi.
01
Berdasarkan data pengujian yang dirilis resmi oleh Anthropic, serta laporan pengujian praktis dari mitra perusahaan pertama, kehebatan Fable 5 dapat digambarkan dengan empat kata: luar biasa mengagumkan.
Pertama lihat skor benchmark.
Pada daftar evaluasi pemrograman otomatis SWE-Bench Pro, Claude Fable 5 memiliki tingkat kelulusan 80.3%, "induknya" Opus 4.8 adalah 69.2%; GPT-5.5 adalah 58.6%; Gemini 3.1 Pro hanya 54.2%.
Evaluasi kode mutakhir, Fable 5 mencapai 29.3%, Opus 4.8 adalah 13.4%; GPT-5.5 hanya 5.7%.
......
Perbedaan di antaranya, sama seperti seseorang tiba-tiba mengeluarkan senapan mesin di era senjata dingin.
Selain itu, rekayasa perangkat lunak, hipotesis penelitian independen, desain molekul obat, distilasi model dan kompresi ekstrem, pemahaman konteks panjang, dan sebagainya, dalam hampir semua pengujian, Fable 5 adalah yang pertama.
Secara spesifik, semua orang bisa mencari video untuk melihatnya.
Selanjutnya lihat praktik nyata.
Raksasa pembayaran Stripe melakukan tes awal dengan Fable 5. Mereka memiliki basis kode warisan sejarah setinggi 50 juta baris yang perlu dimigrasikan seluruhnya. Menurut penilaian, rekonstruksi skala seperti ini, bahkan jika diberikan kepada tim profesional, setidaknya membutuhkan dua bulan.
Hasilnya, setelah tugas diberikan kepada Fable 5, ia sendiri yang membuat perencanaan, memeriksa kemajuan, dan memperbaiki sendiri jika menemukan error. Hanya dalam waktu satu hari, migrasi 50 juta baris kode selesai.
Performa seperti ini, bukan hanya bisa dijelaskan dengan kata "kuat".
Dari sudut pandang sempit, sebenarnya Fable 5 telah mencapai AGI di tingkat ekonomi digital.
Alasannya, ia menunjukkan kemampuan "agen jarak jauh" yang sebenarnya.
Baik GPT-5.5 maupun Gemin 3.5, apalagi model besar lainnya yang lebih rendah, pada dasarnya hanyalah "menjawab".
Anda menendang, ia melangkah satu kali.
Bertemu jalan buntu, ia hanya bisa melempar pengecualian, merajuk mengatakan "maaf saya hanya model bahasa".
Disebut alat, tetapi sebenarnya pengguna masih perlu berpikir mendalam, langkah demi langkah memandu AI untuk memberikan hasil yang diinginkan, tidaklah mudah.
Fable 5 yang memiliki logika berorientasi tujuan yang terinternalisasi berbeda.
Seperti pengujian Strip, ketika pengguna memberikan tugas panjang yang sulit, ia melangkah dalam tiga tahap:
Membangun pohon sub-tugas;
Mengatur alat yang berbeda (pencarian web, pengambilan database, lingkungan sandbox Python);
Merenungkan diri sendiri, menemukan tidak bisa dijalankan, segera mengganti jalan.
Manusia selain mengusulkan tugas dan menerima hasil, tidak perlu lagi memberikan arahan di samping.
Sebagai alat produktivitas, ini sudah sangat sempurna.
Tetapi dengan AGI sejati, tetap dua hal yang berbeda.
Kehebatan Fable 5, dibangun di atas basis kode, literatur ilmiah, dll. tempatnya berada yang masih memiliki struktur logika dan definisi matematika dasar.
Alasan ia tidak tersesat dalam tugas siklus panjang, adalah karena mengatasi masalah "penurunan perhatian teks panjang", dalam menangani tugas kompleks hingga jutaan token, dapat tetap mempertahankan keselarasan tujuan inti.
Tetapi begitu dilemparkan ke dalam lumpur masyarakat fisik realitas yang sepenuhnya kacau, kurang aturan digital, dan bahkan manusia sendiri belum sepenuhnya memahaminya, ia tetap akan mengalami keretakan logika karena "kekurangan fondasi".
Jika menggunakan "standar lima tingkat kecerdasan buatan" yang diusulkan OpenAI (Tingkat 1: chatbot; Tingkat 2: penalaran; Tingkat 3: agen; Tingkat 4: inovator; Tingkat 5: organisasi) untuk mengukur.
Opus 4.8 adalah Tingkat 2 menuju Tingkat 3, Fable 5 benar-benar berdiri kokoh di Tingkat 3 dan menjelajah ke Tingkat 4.
Dan dari Opus 4.7 ke 4.8 butuh 43 hari, 4.8 ke Fable 5 hanya butuh 11 hari.
Berapa lama untuk berdiri kokoh di Tingkat 4? Menurut ritme pembaruan Anthropic yang semakin cepat, kemungkinan besar dapat dicapai dalam tahun ini.
Bahkan Tingkat 5 akhir, perkiraan optimis juga hanya membutuhkan 18-24 bulan, benar-benar hanya selangkah lagi.
Kecepatan ini terlalu cepat, ini juga alasan terbesar mengapa harus diberi batasan keamanan.
02
Dalam "System Card" dan laporan evaluasi RSP yang dirilis Anthropic bersama model, Mythos 5 menunjukkan sinyal yang sangat berbahaya dalam dua kemampuan.
Pertama, model dasar Fable/Mythos dalam evaluasi kimia dan biologi telah mencapai tingkat CB-1.
Artinya, model ini telah memiliki kemampuan end-to-end untuk "mensintesis dan memandu pembuatan senjata biologi/kimia non-novel", bahkan memberikan saran modifikasi sekuens gen untuk mengoptimalkan efisiensi penyebaran virus berisiko tinggi.
Jika seorang teroris dengan dasar biologi sarjana mendapatkan Mythos 5 yang telah dibebaskan dari segel, sepenuhnya dapat melalui terus-menerus memicu model, mendapatkan panduan lengkap tentang cara menghindari pengawasan bahan baku, cara membangun laboratorium P3 sederhana di ruang bawah tanah, cara mensintesis patogen dengan mortalitas tinggi.
Kedua, serangan siber dan eksploitasi kerentanan.
Dalam pengujian yang sangat awal, Mythos 5 telah menunjukkan kemampuan untuk secara mandiri mencari, dan meretas kerentanan inti infrastruktur kritis (seperti pembangkit listrik, sistem kliring keuangan, sistem jaringan rumah sakit), dalam hitungan detik dapat menghasilkan skrip serangan kerentanan nol hari yang ditargetkan.
Saat Mythos baru dikembangkan bulan April lalu, ada pengungkapan mengatakan telah menemukan lebih dari sepuluh ribu kerentanan tingkat tinggi bagi 50 mitra awal.
......
Untuk dua situasi ini, langsung melemparkan Mythos 5 kepada publik, risikonya terlalu tinggi.
Harus mengurung binatang buas ini ke dalam sangkar.
Setelah dua bulan, sangkar yang dibuat Anthropic memiliki dua lapis.
Pertama, mekanisme perutean degradasi diam.
Anthropic telah menempatkan AI pengklasifikasi berpresisi tinggi yang sepenuhnya independen dan bereaksi sangat sensitif di frontend Fable 5.
Ketika pengguna memasukkan petunjuk yang kompleks, mungkin melibatkan serangan dan pertahanan jaringan, biologi kimia, atau mencoba mendapatkan bobot model secara tersembunyi, pengklasifikasi akan segera membunyikan alarm, dan di backend secara diam-diam mengalihkan sesi ke Opus 4.8 lama untuk menjawab.
Kedua, retensi data.
Anthropic bersama Amazon mengumumkan tadi malam: terlepas dari platform pertama atau pihak ketiga, semua lalu lintas yang memanggil model Mythos, harus diberlakukan retensi data wajib 30 hari.
Mengapa?
Karena peretas atau teroris sejati, kebanyakan sangat cerdas, mereka tidak akan langsung bertanya "bagaimana cara membuat bom" dalam satu percakapan, tetapi memecah masalah menjadi 100 pertanyaan dasar yang tampaknya tidak berbahaya.
Pemantauan data penuh 30 hari, bertujuan untuk menangkap penyalahgunaan jahat "potong sosis" yang tidak terlihat dalam percakapan tunggal melalui pengenalan pola.
Seperti yang pernah diperingatkan Dario Amodei di kesempatan publik: "Probabilitas AI menyebabkan risiko bencana bagi manusia, mencapai 25%."
Untuk mematuhi "Kebijakan Skala Bertanggung Jawab" (RSP) internal perusahaan serta "Kerangka Kepatutan Terdepan" (FCF), Anthropic harus secara pribadi memberikan rantai pada raksasa ini.
Maka, lahirlah Fable 5.
03
Selanjutnya bicara harga.
Harga resmi yang diumumkan Anthropic adalah: $10 per juta token input, $50 per juta token output.
Terlalu mahal.
Tugas Agen tingkat perusahaan saat ini, untuk mengejar akurasi tinggi, sering menggunakan logika berantai "berpikir berpikir lagi berpikir", satu putaran mungkin sudah menghabiskan 20 juta token input, lalu mengeluarkan 5 juta kode yang dimodifikasi.
Dihitung, sekali tugas saja sudah $450.
Dan, Anthropic telah mengeluarkan pemberitahuan: jendela pengalaman model Mythos yang disertakan dalam langganan pribadi (Claude Pro) yang ada, akan ditutup sepenuhnya pada 22 Juni 2026.
Kemudian, jika pengguna pribadi benar-benar menggunakannya untuk bekerja, puluhan dolar benar-benar akan habis dalam sekejap.
Walaupun, dengan pembaruan teknologi, harganya pada akhirnya pasti akan turun, tetapi saat itu ia sudah bukan yang terkuat lagi.
Kondisi saat ini sudah sangat jelas: model besar paling mutakhir telah menjadi barang mewah, orang biasa tidak mampu menggunakannya.
Tentu, bagi Anthropic yang fokus di pasar B2B, ini wajar.
Masalahnya, belum lama ini, Google dengan gegap gempita mengumumkan perang harga.
Saat pesaing pada umumnya menurunkan harga untuk merebut pasar, mengapa Anthropic berani menaikkan harga secara terbalik?
Karena harga Token adalah palsu, tingkat pengembalianlah yang mendasar.
Klien perusahaan sama sekali tidak peduli berapa harga satu kilowatt listrik, satu Token, asalkan AI dapat menyelesaikan seluruh alur rekayasa dengan sempurna tanpa Bug, premium ini mereka bayar dengan antusias.
Yang lebih kritis, perang keamanan siber saat ini, telah sepenuhnya menjadi pertarungan antara AI dan AI.
Karena model tingkat Fable/Mythos dapat langsung menemukan kerentanan sistem, satu-satunya pilihan bagi perusahaan dan lembaga negara untuk mencegah serangan adalah membeli layanan pertahanan privatisasi jaringan internal Mythos 5 dari Anthropic dengan harga tinggi.
Sederhananya adalah memungut biaya perlindungan: Saya membuat pedang yang paling menakutkan (Mythos 5), saya takut melukai jadi saya masukkan ke sarung dan jual ke publik (Fable 5), tetapi saya juga menjual pedang yang tidak terbatas kepada departemen pertahanan, agar mereka gunakan untuk mencegat pedang yang sedang dikembangkan orang lain.
Ancaman pertahanan AI, akan menjadi pengeluaran wajib bagi setiap perusahaan besar.
Ini akan langsung menyebabkan anggaran high-end pasar B2B semakin terkonsentrasi ke Anthropic, sementara model murah yang hanya bisa digunakan untuk menulis dokumen, mengirim email, hanya bisa saling beradu di pasar C2C dengan margin keuntungan sangat rendah.
Dapat diprediksi, selanjutnya, sektor keamanan siber global akan menyambut penilaian ulang nilai yang didorong oleh AI.
Bersamaan dengan itu, "perusahaan satu orang" juga akan segera menjadi fenomena yang semakin umum.
04
Dilengkapi fungsi alokasi anggaran tugas, mendukung manajemen memori dan konteks, dapat mengingat, membatalkan, memulai ulang seperti manusia, dapat secara mandiri menerima siklus hidup penuh dari dokumen kebutuhan hingga pengiriman kode......
Kemunculan Fable 5 dan Mythos 5, lebih merupakan upacara kedewasaan pembagian kerja industri AI yang benar-benar matang, daripada pembaruan teknologi model besar.
Pasar AI secara awal mengucapkan selamat tinggal pada era pastoral "semua mencoba gratis".
Kecerdasan komputasi paling canggih dan kebijaksanaan paling dalam, akan diprioritaskan sebagai bahan strategis produktivitas, diarahkan ke medan perang aplikasi B2B, infrastruktur, dan penelitian ilmiah yang paling dapat menghasilkan nilai komersial.
Ini adalah pesta ledakan produktivitas, juga musim dingin pasar tenaga kerja.
Artikel ini berasal dari akun WeChat publik "Gelong", penulis: Wan Lianshan










