Baru saja, Claude Mythos 5 Rilis, 50 Juta Baris Kode Selesai dalam 1 Hari

marsbitDipublikasikan tanggal 2026-06-10Terakhir diperbarui pada 2026-06-10

Abstrak

Anthropic secara resmi meluncurkan model AI terkuat mereka, Claude Mythos 5, bersama versi aman bernama Claude Fable 5. Fable 5 tersedia untuk umum namun dilengkapi sistem keamanan yang secara otomatis menurunkan ke model Opus 4.8 jika mendeteksi permintaan berisiko tinggi seperti pembuatan malware atau riset biologi/kimia tertentu. Sementara itu, Mythos 5 yang "versi lengkap" hanya tersedia bagi pengguna terpercaya dengan kemampuan tak terbatas di bidang seperti keamanan siber dan penelitian ilmiah. Secara teknis, Fable 5 menunjukkan kemampuan luar biasa. Dalam pengujian SWE-bench Pro, ia mencetak 80.3%, mengungguli kompetitor. Kasus nyata dari Stripe menunjukkan Fable 5 dapat bermigrasi seluruh basis kode Ruby sebesar 50 juta baris hanya dalam 1 hari, pekerjaan yang biasanya membutuhkan tim engineering dua bulan. Model ini juga unggul dalam pemahaman visual, mampu menyelesaikan permainan Pokemon tanpa alat bantu, dan dalam tugas analisis finansial serta hukum. Di bidang penelitian, Mythos 5 menunjukkan lompatan besar. Model ini dapat menjalankan seluruh alur kerja ahli biologi secara mandiri, merancang senyawa protein, dengan 9 dari 14 desainnya sudah masuk pipeline pengembangan obat nyata. Dalam satu kasus, model kecil yang dilatih mandiri oleh Mythos 5 bahkan mengungguli penelitian terbaru yang diterbitkan di jurnal *Science*. Anthropic juga memperkenalkan perubahan paradigma keamanan, di mana kemampuan dan keamanan dipisahkan melalui sistem "klasifikasi dan penurunan ...

Mythos yang telah lama disimpan oleh Anthropic selama dua bulan, akhirnya turun ke bumi—

Model flagship paling kuat sepanjang sejarah mereka, disajikan dalam dua versi: Claude Fable 5 dan Claude Mythos 5.

Fable 5 adalah versi Mythos dengan "jaring pengaman" tambahan, terbuka untuk semua pengguna.

Begitu pertanyaan pengguna memicu pengklasifikasi risiko (misalnya mencoba membuatnya menulis malware), sistem secara otomatis akan menurunkan level dan memanggil Claude Opus 4.8 generasi sebelumnya untuk menjawab.

Mythos 5 adalah versi "Mythos" asli dan penuh, tetapi hanya diberikan kepada sedikit pengguna tepercaya.

Model ini melepas batasan keamanan di bidang seperti keamanan siber, dan situs web resmi menyebutnya memiliki "kemampuan murni terdepan di dunia dalam serangan dan pertahanan keamanan siber serta penelitian biologi".

Secara resmi dinyatakan, waktu operasi mandiri Fable 5 dan Mythos 5 lebih lama daripada model Claude mana pun sebelumnya.

Menghela napas kecil? AI terdepan, mulai memasuki era perizinan.

Dan itu terjadi hanya dua hari setelah Anthropic secara serius menyerukan agar semua penelitian AI segera dihentikan......

Tidak mengerti mengapa Dario juga mulai menempuh jalan lama Sam Altman yang setiap kali mempromosikan model baru, produk baru mereka lebih awal, dan dengan skala yang cukup besar pula.

(Saya tahu Anthropic punya alasannya sendiri, tetapi saya tetap memberikan senyuman).

Tapi tetap ada kabar yang menggembirakan bagi pengembang di luar aspek teknis, harga API untuk dua flagship baru ini langsung memotong lebih dari setengah dari harga versi preview sebelumnya:

Hanya $10 per juta Token input, $50 per juta Token output.

Baiklah, mari kita dengan cepat masuk ke bagian teknis terkait, ayo—

Dual Version Mythos Tiba! Resmi Menyoroti "Efisiensi Token"

Pertama, beri tahu sebuah situasi.

Dalam catatan rilis resmi dan evaluasi industri, tidak seperti pengenalan Fable 5, untuk Mythos 5 tidak ada daftar panjang benchmark standar dan terbuka (seperti MMLU, GSM8K, SWE-bench, dll.) yang dicantumkan.

Namun mengingat keduanya adalah model dengan dasar yang sama, sebenarnya mereka dapat dianggap sebagai "cerminan" dari inti yang sama, dengan indikator teknis dasar yang sepenuhnya identik.

Jadi untuk sementara kita hanya bisa melihat kinerja Fable 5 yang terutama dipublikasikan melalui saluran resmi saat ini.

Menurut pernyataan Anthropic sendiri, Claude Fable 5 adalah Claude publik terkuat saat ini, dan juga pertama kalinya seri Fable memasuki tingkat kemampuan Mythos.

Keunggulannya terutama terkonsentrasi pada beberapa arah: rekayasa perangkat lunak, pekerjaan pengetahuan kompleks, visual, konteks panjang, kemampuan memori, serta penelitian ilmu kehidupan.

Yang lebih krusial adalah, semakin panjang dan kompleks tugasnya, semakin jelas keunggulan Fable5 dibandingkan Claude sebelumnya—menunjukkan bahwa fokus Fable5 bukanlah membuat pertanyaan jawaban tunggal lebih cantik, tetapi mampu menangani tugas siklus panjang.

Mari kita gunakan data dan Demo keras untuk mengurai kekuatan dominasi model tingkat mitos generasi ini:

Rekayasa Perangkat Lunak: Tolak Ukur Kesulitan Tinggi Ditembus, dari "Perbaikan Bug" ke "Pasukan Otomatis Penuh"

Dalam evaluasi SWE-bench Pro yang mengukur kemampuan model menyelesaikan masalah rekayasa perangkat lunak kompleks di dunia nyata, Claude Fable 5 mencetak skor tinggi 80,3%.

Sebagai perbandingan, model utama pesaing, GPT-5.5, mencetak skor 58,6%.

Dalam evaluasi Frontier Code Cognition—evaluasi ini lebih menekankan apakah model dapat menyelesaikan tugas pemrograman sulit sekaligus memenuhi standar basis kode produksi berkualitas tinggi—Fable 5 mendapatkan skor tertinggi di antara model frontier bahkan dalam intensitas penalaran sedang.

Benchmark FrontierCode ini sangat sulit untuk mencapai saturasi.

Namun bahkan dalam mode "usaha sedang (Medium effort)", skor Fable 5 tetap tertinggi di antara semua model frontier.

Contoh kasus pertama yang diberikan resmi berasal dari Stripe.

Dalam sebuah basis kode Ruby dengan 50 juta baris, Fable 5 menyelesaikan migrasi seluruh basis. Pekerjaan ini jika dilakukan secara manual oleh sebuah tim teknik, awalnya membutuhkan waktu lebih dari dua bulan.

Fable 5? Hanya butuh satu hari.

Selain itu, pada tolok ukur pengembangan front-end ujung-ke-ujung ViBench (Vibe-coding benchmark), Fable 5 hampir langsung memenuhi kasus penggunaan pengembangan dasar, mencapai generasi aplikasi "one-shot" yang sesungguhnya.

Visual Asli: Tanpa Scaffolding, Bermain Game "Pokémon" Buta

Media teknologi terkenal VentureBeat dalam artikelnya "Anthropic brings Mythos to the masses with Claude Fable 5, its most powerful generally available model ever" mengungkapkan, pada tes tolok ukur GDPpdf yang berfokus pada penalaran file visual, Fable 5 dan Mythos 5 meraih skor 29,8% tanpa menggunakan alat eksternal.

Sebagai perbandingan, Opus 4.8 mencetak skor 22,5%, GPT-5.5 24,9%, dan Gemini 3.1 Pro 16,7%.

Anthropic secara resmi juga menduga bahwa melihat banyak data akan membosankan, sehingga merilis Demo Fable 5 bermain game, yang memberikan efek visual lebih langsung.

Model Claude sebelumnya jika ingin memainkan game RPG "Pokémon FireRed", harus dilengkapi dengan serangkaian "scaffolding" yang sangat kompleks di eksternal (termasuk bantuan navigasi peta, pembacaan status memori game, dll.).

Sekarang, Fable 5 mencapai "buta visual asli murni".

Hanya dengan tangkapan layar game mentah satu per satu, tanpa modifikasi peta apa pun, ia sepenuhnya secara mandiri menyimpulkan, merencanakan strategi, dan memainkan game hingga selesai.

Lebih dari itu, karena konsentrasi urutan superpanjangnya, ketika dikonfigurasi dengan memori tingkat file yang persisten, saat memainkan game kartar roguelike "Slay the Spire", kinerjanya langsung melonjak 3 kali lipat, kemungkinan mencapai bintang akhir juga melonjak 3 kali lipat.

Konteks Panjang dan Kemampuan Memori Ditingkatkan, Sekaligus Menekankan "Efisiensi Token"

Konteks panjang dan kemampuan memori juga menjadi fokus peningkatan kali ini.

Anthropic menyatakan, Fable 5 dapat tetap fokus dalam tugas jangka panjang jutaan Token, dan dapat menggunakan catatannya sendiri untuk meningkatkan output.

Resmi menguji dengan SlaytheSpire, setelah model diberi akses ke memori file persisten, peningkatan kinerja Fable5 tiga kali lipat dari Opus4.8, frekuensi mencapai bab akhir juga meningkat tiga kali lipat.

Ini sebenarnya adalah bagian yang sangat mendasar dalam kemampuan Agen.

AI yang dapat bekerja lama, harus dapat mengingat apa yang telah dilakukannya, apa yang terlewatkan, mengapa langkah selanjutnya dilakukan seperti itu. Tanpa memori yang stabil, tugas mandiri dengan mudah berubah menjadi adegan kehilangan memori besar-besaran.

Untuk itu Anthropic juga secara khusus menekankan efisiensi Token (ini juga merupakan arah kunci model generasi ini).

Semakin lama model dapat bekerja mandiri, semakin banyak Token yang akan dikonsumsi.

Jika di satu sisi model sangat kuat, di sisi lain sangat "boros kata", biaya dengan cepat akan menjadi sangat tinggi hingga menyulitkan perusahaan.

Penekanan Fable 5 pada efisiensi Token, pada dasarnya adalah menyelesaikan masalah pembukuan dalam implementasi Agen.

Keuangan, Hukum, dan Operasional: Lubang Hitam Logika yang Pertama Kali Menembus Batas 90%

Dalam tes tolok ukur keuangan Hebbia (Finance Benchmark for senior-level reasoning) yang menguji kemampuan penalaran analitis tingkat lanjut, Fable 5 meraih skor tertinggi di industri.

Dalam penalaran dokumen panjang, interpretasi bagan dan tabel kompleks, serta analisis akar penyebab multi-langkah, Fable 5 mencapai pertumbuhan lompatan dua digit.

Dalam pengujian nyata perusahaan perdagangan kuantitatif besar IMC dan Optiver, Fable 5 hampir mengambil seluruh bobot evaluasi analisis perdagangan mereka (termasuk pengambilan fakta, penalaran konseptual, dan perhitungan nilai yang diharapkan), dan menunjukkan stabilitas yang menakjubkan—dalam beberapa kali menjalankan berulang, skor hasil output sepenuhnya konsisten.

Platform analisis data Hex memberikan evaluasi seperti ini:

Fable 5 adalah model pertama dalam industri yang menembus batas skor 90% pada tolok ukur analisis inti kami (mencakup tugas analisis siklus panjang yang sangat kompleks), 10 poin persentase lebih tinggi dari Opus. Dalam pertanyaan paling sulit, ia menunjukkan penilaian mikro setara ahli manusia.

Penelitian Terdepan: Mythos Versi Penuh "Mengalahkan" Model 100 Kali Lebih Besar

Dalam penelitian fisika terdepan, perusahaan rintisan VibeCAD dan lembaga penelitian fisika menguji menunjukkan bahwa Fable 5 hanya menggunakan 1/3 Token penalaran, dan dalam 36 jam menghasilkan hasil penelitian fisika yang mendekati kinerja GPT-5.5 yang membutuhkan waktu empat hari.

Serta Myhtos yang masih sedikit disembunyikan akhirnya muncul di bagian ini.

Anthropic menyatakan, di bidang biofarmasi, Mythos 5 versi penuh tanpa bantuan manusia sama sekali, sudah dapat secara mandiri menjalankan seluruh alur kerja seorang ahli biologi: memilih situs pengikatan protein, secara mandiri menjadwalkan dan menjalankan berbagai alat bioinformatika, bahkan Debug sendiri saat mengalami kegagalan eksekusi.

Dari 14 kompleks protein target yang dirancangnya, 9 telah masuk ke dalam saluran pengembangan obat nyata di laboratorium.

Anthropic juga menekankan, Mythos 5 adalah "model pertama kami yang secara konsisten dapat menghasilkan hipotesis ilmiah baru dan menarik".

Dalam perbandingan langsung buta dengan model seri Opus, ilmuwan dalam 80% kasus lebih memilih hipotesis biologi molekuler Mythos, dan beberapa hipotesis telah dimajukan ke tahap verifikasi eksperimental.

Sementara itu, satu hipotesis Mythos—mekanisme baru tentang protein Escherichia coli—dikonfirmasi dalam penelitian laboratorium independen lain yang meneliti masalah yang sama "A newly identified detoxification system protects uropathogenic Escherichia coli from reactive chlorine species".

Lebih ekstrem lagi dalam penelitian genomik, Mythos 5 bekerja mandiri selama lebih dari seminggu, menyatukan data sel tunggal dari 138 spesies, dan secara mandiri merancang serta melatih sebuah model pembelajaran mesin mini khusus.

Model mini yang dilatih oleh AI ini, dengan volume 100 kali lebih kecil, secara langsung mengalahkan hasil penelitian terbaru yang baru saja diterbitkan di majalah "Science".

Setelah Menyerukan Penghentian Penelitian AI, "Kemampuan Berbahaya" Tampaknya Dijadikan Mekanisme Produk

Tempat paling menarik kali ini, seharusnya adalah jaring pengaman yang dipasang Anthropic untuk Fable 5.

Tepatnya, Fable 5 memiliki satu set pengklasifikasi independen di belakangnya.

Pengklasifikasi ini akan mendeteksi apakah permintaan pengguna melibatkan serangan keamanan siber, risiko biologi dan kimia, serta distilasi model.

Begitu terpicu, Fable 5 akan menolak menjawab sendiri, kemudian secara otomatis meneruskan permintaan ke Claude Opus 4.8, dan memberi tahu pengguna bahwa telah terjadi penurunan level.

Agak menarik ya.

Model besar sebelumnya di bidang keamanan, biasanya membuat model menolak, mengatakan hal seperti "Maaf, saya tidak dapat membantu Anda", "Maaf saya tidak bisa menjawab", "Maaf saya tidak mengerti maksud Anda", dan sebagainya.

Fable 5 mengambil pendekatan berbeda.

Ia tidak melakukan penolakan sederhana lagi, tetapi melakukan perutean model.

Pertanyaan umum ditangani oleh Fable 5, begitu teridentifikasi ada pertanyaan berisiko tinggi, model segera dialihkan ke Opus4.8.

Maksud Anthropic adalah, Opus4.8 sendiri juga model yang kuat, pengalaman jawaban tingkat lebih rendah tentu lebih baik daripada langsung ditolak, kan?~

Desain ini sebenarnya memisahkan kemampuan dan keamanan.

Yang Anda gunakan sehari-hari adalah kemampuan tingkat Mythos.

Tapi ketika menghadapi beberapa pertanyaan sensitif, ofensif, upaya jailbreak, dll., Anthropic dengan mulus beralih ke model versi lama untuk melayani Anda, membuat alat yang nyaman di tangan Anda tiba-tiba menjadi kurang nyaman.

(Terutama untuk mencegah beberapa masalah di bidang keamanan siber, biokimia, dan distilasi model)

Anthropic memberikan data—

Kabar baik, lebih dari 95% sesi Fable 5 tidak memicu penurunan level.

Artinya, untuk sebagian besar tugas menulis, kode, analisis, penelitian, dan kantor, pengalaman yang didapatkan pengguna pada dasarnya mendekati Mythos 5.

Tapi masih ada kurang dari 5% permintaan sisanya, yang akan masuk ke jalur keamanan yang lebih ketat.

Situs web resmi menunjukkan, ada tiga kategori utama bidang berisiko tinggi.

Kategori pertama adalah keamanan siber, kedua adalah biologi dan kimia, ketiga adalah distilasi model.

Mekanisme ini sebenarnya adalah perubahan bentuk produk model terdepan.

Keamanan tidak lagi hanya pernyataan tanggung jawab sebelum model menjawab, atau hanya deskripsi kebijakan yang tertulis di kartu sistem.

Ia berubah menjadi arsitektur produk yang terdiri dari pengklasifikasi, perutean model, tingkat izin, penyimpanan data, dan pengujian tim merah bersama-sama.

Tentu, konsekuensinya datang.

Pengklasifikasi Fable 5 diatur cukup konservatif, permintaan normal juga mungkin terkena dampak negatif.

Misalnya, ahli biologi yang meneliti virus, insinyur keamanan yang melakukan latihan serangan dan pertahanan yang berwenang, mungkin memicu penurunan level dalam tugas yang wajar.

Anthropic sendiri juga mengakui, bahwa penghalang saat ini lebih ketat daripada kondisi ideal, dan akan mengurangi tingkat kesalahan di kemudian hari.

Biaya lain adalah penyimpanan data.

Mulai dari Fable 5, Mythos 5, dan model setara berikutnya, Anthropic mengharuskan semua lalu lintas model tingkat Mythos disimpan selama 30 hari, mencakup skenario penggunaan pihak pertama dan pihak ketiga.

Resmi menekankan bahwa data ini tidak akan digunakan untuk pelatihan, hanya untuk pemantauan keamanan, termasuk mengidentifikasi serangan kompleks, jailbreak baru, dan serangan lintas permintaan.

Bagi pengguna biasa, ini mungkin hanya satu baris dalam ketentuan.

Tapi bagi pelanggan perusahaan, ini adalah masalah tata kelola data yang sangat nyata.

Ingin menggunakan kemampuan terkuat, harus menerima pemeriksaan keamanan dan penyimpanan data tingkat lebih tinggi.

Tidak terhindarkan, biaya model terdepan, tidak hanya tercermin dalam tagihan API.

Dalam hal harga, Fable5 dan Mythos5 memiliki harga tetap per juta Token input $10, per juta Token output $50.

Memang, lebih murah dibandingkan Claude Mythos Preview, tetapi tetap model harga tinggi.

Satu kalimat, Fable5 memang kuat, tetapi tidak akan murah sampai bisa dibakar sembarangan.

Ini juga menjelaskan mengapa Anthropic secara bersamaan menekankan kemampuan, keamanan, dan efisiensi Token.

Pengalaman Uji Internal AI Scholar: Semakin Kuat AI, Manusia Semakin Mirip Pemberi Tugas

Ahli AI terkenal, profesor Wharton School of Business, Ethan Mollick, setelah mendapatkan izin pengujian lebih dulu, menulis sebuah artikel panjang.

Logika tulisannya langsung mengenai inti esensi revolusi teknologi ini—

Paradigma kolaborasi antara manusia dan model besar, telah mengalami perubahan mendasar dan tidak dapat diubah.

Dia meminta Fable 5 membuat peta isokron.

Tugas ini terdengar tidak terlalu misterius, tetapi benar-benar melakukannya sangat merepotkan.

Harus memeriksa penerbangan, jadwal kereta api, menilai kecepatan jalan, serta menangani hubungan antara negara berbeda, cara transportasi berbeda, dan biaya waktu berbeda.

Fable 5 sendiri meluncurkan beberapa agen untuk mencari informasi, mendapatkan lebih dari 2200 informasi penerbangan spesifik, juga mengambil data kereta TGV, Shinkansen, serta informasi kecepatan jalan di berbagai negara.

Akhirnya, ia mengintegrasikan informasi ini ke dalam sebuah proyek peta yang dapat digunakan.

Poin penting dari hal ini adalah Fable 5 membagi tujuan kabur menjadi beberapa tautan seperti penelitian, pengumpulan informasi, desain, pengkodean, verifikasi, dan maju sendiri.

Ini sangat berbeda dengan pengalaman model besar sebelumnya.

Kemudian, Mollick mengajukan wawasan yang mendalam.

Di masa lalu, manusia menggunakan model besar seperti seorang "penyihir (Wizard)", Anda harus membimbingnya, mengemudikannya (Steer) tangan ke tangan, memahat setiap Prompt dengan teliti, melalui petunjuk percakapan berulang untuk "membaca mantra", AI baru bisa menghasilkan trik sulap dengan susah payah.

Dan ketika menghadapi model tingkat Mythos, manusia sedang merosot menjadi "sponsor (Patron, di sini saya rasa diterjemahkan sebagai "pemberi tugas" lebih sesuai?)" atau "pemberi mandat".

Profesor Mollick bekerja dengan Fable5, merasa sudah tidak seperti mengoperasikan alat, lebih mirip mempercayakan sebuah studio kecil.

Selain itu, dalam pengujian nyata Mollick, ia tidak perlu lagi bekerja di lapisan instruksi yang paling mikro.

Dia langsung memberikan dokumen desain proyek yang sangat kompleks sepanjang 15 halaman ke Fable 5, kemudian meninggalkan deskripsi kebutuhan makro.

Selama 9 jam lebih berikutnya, Fable 5 beroperasi sepenuhnya mandiri (Autonomous) di latar belakang.

Ia sendiri menghasilkan alur kerja Agen, secara internal menjadwalkan beberapa Agen kecil untuk melakukan penelitian, menulis garis besar, saling mengoreksi, menggulingkan asumsi yang salah, memperbaiki kesalahan dan memulai kembali.

Manusia bahkan tidak perlu ikut campur dalam alur kerja ini setengah langkah pun.

9 jam kemudian, sebuah produk berkualitas tinggi langsung disampaikan kepada Mollick.

Inilah yang disebut metafora "studio".

Dulu, kita menggunakan model besar adalah mempekerjakan seorang freelancer sementara yang perlu berkomunikasi berulang kali; sekarang, Anda menggunakan Fable 5, sama dengan Anda menggunakan Token beberapa dolar, secara instan mempekerjakan seluruh perusahaan desain kelas Hollywood, atau sebuah lembaga penelitian terkemuka.

Anda tidak perlu peduli berapa banyak keputusan mikro yang dibuatnya dalam kotak hitam, Anda hanya perlu memainkan peran "pemberi tugas" yang menandatangani produk akhir.

Kombinasi konteks teks panjang (Context) dan logika mandiri model besar ini, membuat Context tidak lagi hanya menjadi "wadah konten", tetapi sepenuhnya mengendap menjadi "sistem operasi cerdas baru" yang dapat menyimpulkan dan berjalan lama secara mandiri.

Dengan kata lain, semakin AI mirip kontraktor, semakin manusia mirip pemberi tugas yang perlu memiliki kemampuan verifikasi penerimaan.

Selingan, untuk menunjukkan lebih intuitif dan menarik, profesor juga memintanya menghasilkan serangkaian game untuk dicoba semua orang.

Game-game ini didasarkan pada petunjuk awal Claude Code, Fable 5 perlu menghasilkan beberapa program yang layak berdasarkan petunjuk kabur yang saya berikan, setelah itu saya akan memberikan beberapa petunjuk tambahan, dan memberikan beberapa dorongan (misalnya "lakukan lebih baik") atau umpan balik.

Karena Claude Code tidak dapat menghasilkan gambar, semua karya seni atau objek 3D sepenuhnya dihasilkan melalui operasi matematika, tanpa menggunakan sumber eksternal apa pun.

Di sini ada demo game lempar koin:

Setelah menguji Fable 5 lebih awal, profesor akhirnya menyatakan "hasil akhirnya mengesankan".

Tetapi, terutama ketika menangani proyek yang lebih serius, profesor sering merasa menggunakan alat ini menyenangkan sekaligus mengganggu.

Yang menyenangkan adalah, saya hanya perlu mengajukan permintaan, dan itu bisa mewujudkannya. Yang mengganggu juga adalah, saya hanya perlu mengajukan permintaan, dan itu bisa mewujudkannya.

Memang.

Kembali ke rilis Anthropic kali ini.

Beberapa orang menganggap yang terpenting adalah Mythos akhirnya setengah terbuka, beberapa orang menganggap yang terpenting adalah produk AI terdepan sedang memasuki bentuk baru.

Sebuah model yang lebih kuat telah disajikan.

Tapi Anthropic pertama-tama memasang sabuk pengamannya, baru kemudian memberikan kuncinya kepada semua orang.

Ada yang bersorak, ada yang cemas, ada yang menyetel kode semalaman, hanya untuk mengejar kurva kecerdasan yang terus berlari ke depan, bahkan telah mulai meninggalkan pandangan mikro manusia.

Tiga Hal Lain

1. Perhatikan periode jendela. Dari hari ini hingga 22 Juni, pengguna Pro, Max, Team, dan Enterprise dapat menggunakan Fable 5 secara gratis.

Tapi mulai 23 Juni, jika masih ingin menggunakan Fable 5, harus membeli usage credits tambahan.

2. Anthropic mengatakan, setelah kapasitas produksi mengikuti, Fable 5 akan kembali dijadikan standar langganan.

Klien API dan perusahaan pembayaran sesuai pemakaian tidak terpengaruh oleh irama ini, mulai hari ini panggilan seperti biasa.

Referensi:

[1]https://www.anthropic.com/news/claude-fable-5-mythos-5

[2]https://www.oneusefulthing.org/p/what-it-feels-like-to-work-with-mythos

[3]https://www.biorxiv.org/content/10.64898/2026.03.12.711259v1

Artikel ini berasal dari akun WeChat "Qubit", penulis: Heng Yu

Kripto yang Sedang Tren

CitreaCTR

wrapped stUSDTWSTUSDT

Velodrome FinanceVELODROME

BrevisBREV

PancakeSwapCAKE

JUSTJST

Pertanyaan Terkait

QApa yang membedakan Claude Fable 5 dan Claude Mythos 5?

AClaude Fable 5 adalah versi dengan pengamanan ('pelindung') yang terbuka untuk semua pengguna. Jika permintaan pengguna memicu pengklasifikasi risiko (misalnya, mencoba membuat perangkat lunak berbahaya), sistem akan secara otomatis menurunkan dan menggunakan model Claude Opus 4.8 untuk menjawab. Sementara Claude Mythos 5 adalah versi 'penuh' tanpa pembatasan keamanan tertentu, tetapi hanya tersedia untuk sejumlah kecil pengguna terpercaya di bidang seperti keamanan siber dan penelitian biologi.

QApa pencapaian Claude Fable 5 dalam bidang rekayasa perangkat lunak?

ADalam bidang rekayasa perangkat lunak, Claude Fable 5 mencetak skor 80.3% pada pengujian SWE-bench Pro, mengungguli model pesaing utama seperti GPT-5.5 (58.6%). Ia juga menyelesaikan migrasi seluruh basis kode Ruby sebesar 50 juta baris untuk Stripe hanya dalam satu hari, suatu tugas yang biasanya membutuhkan waktu lebih dari dua bulan untuk tim insinyur. Selain itu, pada benchmark pengembangan front-end ViBench, Fable 5 hampir menyelesaikan kasus pengembangan dasar dengan sekali percobaan.

QBagaimana kemampuan visual asli (native vision) Claude Fable 5 ditunjukkan?

AKemampuan visual asli Claude Fable 5 ditunjukkan melalui demo bermain game. Model ini mampu bermain game RPG 'Pokémon FireRed' dengan 'buta visual murni', artinya hanya mengandalkan tangkapan layar game mentah tanpa alat bantu peta eksternal apa pun. Fable 5 merencanakan strategi dan menyelesaikan seluruh game secara mandiri. Dalam game kartu roguelike 'Slay the Spire', dengan memori berbasis file yang persisten, kinerjanya meningkat tiga kali lipat.

QApa mekanisme keamanan baru yang diterapkan pada Claude Fable 5?

AClaude Fable 5 dilengkapi dengan seperangkat pengklasifikasi independen yang memantau permintaan pengguna. Jika permintaan terdeteksi berisiko tinggi di bidang seperti keamanan siber, risiko biologi/kimia, atau distilasi model, Fable 5 tidak akan menjawab sendiri. Sebagai gantinya, permintaan akan secara otomatis dialihkan (dirutekan) ke model Claude Opus 4.8 yang lebih lama, dan pengguna akan diberi tahu tentang penurunan tingkat model ini. Lebih dari 95% sesi tidak memicu penurunan ini.

QMenurut pengalaman Ethan Mollick, bagaimana perubahan paradigma kolaborasi manusia dengan model seperti Claude Fable 5?

AMenurut Ethan Mollick, kolaborasi telah berubah secara mendasar. Dahulu, manusia seperti 'penyihir' yang harus mengarahkan model secara detail melalui prompt. Dengan model tingkat Mythos seperti Fable 5, manusia menjadi lebih seperti 'klien' atau 'pemberi kerja'. Pengguna dapat memberikan deskripsi proyek makro yang kompleks, dan model akan beroperasi secara mandiri selama berjam-jam, mengoordinasikan agen internal untuk penelitian, penulisan, dan verifikasi, kemudian menyerahkan hasil akhir berkualitas tinggi. Peran manusia bergeser menjadi pengawas yang mengevaluasi hasil, bukan pengarah mikro setiap langkahnya.

Bacaan Terkait

Kunci Bitcoin Disimpan Offline Berkat Lemparan Dadu, Tetapi Tidak Semua Orang Akan Melakukannya

Berdasarkan insiden kerentanan generator angka acak pada perangkat hardware wallet Coldcard, artikel ini membahas metode pembuatan kunci Bitcoin menggunakan dadu untuk menghasilkan entropi mandiri. Claude Shannon mengukur ketidakpastian dengan konsep entropi, di mana satu lemparan dadu enam sisi setara dengan sekitar 2,585 bit. Praktik melempar dadu 50 hingga 99 kali dapat menghasilkan frasa pemulihan 12 kata yang aman (128 bit entropi), melampaui ketergantungan pada generator perangkat. Namun, insiden Coldcard mengungkap bahwa meskipun seed utama dibuat dari dadu aman, fungsi lain seperti dompet kertas, kunci kloning, dan password masih berpotensi menggunakan generator cacat. Peneliti keamanan Kevin Loaec menekankan bahwa perlindungan hanya berlaku untuk seed utama, bukan keseluruhan sistem. Proses manual ini membutuhkan ketelitian tinggi, rentan kesalahan, dan tidak praktis bagi kebanyakan pengguna baru. Oleh karena itu, meski kuat secara matematis, metode ini lebih cocok untuk pengguna berpengalaman. Artikel menyarankan pemilik Coldcard untuk memperbarui firmware, memeriksa fungsi yang pernah digunakan, dan mempertimbangkan skema multisignature dengan perangkat dari produsen berbeda untuk mitigasi risiko. Tujuan jangka panjang adalah perangkat yang dapat menghasilkan keacakan kuat secara mandiri, tanpa memerlukan prosedur rumit dari pengguna.

cryptonews.ru2j yang lalu

Kunci Bitcoin Disimpan Offline Berkat Lemparan Dadu, Tetapi Tidak Semua Orang Akan Melakukannya

cryptonews.ru2j yang lalu

Michael Saylor Klaim Sudah Tidak Mungkin Menerima Pembaruan Bitcoin yang Ditolaknya!

Michael Saylor menyatakan bahwa secara matematis mustahil bagi BIP-110 untuk mencapai ambang batas dukungan sukarela sebesar 55% dalam siklus penyesuaian kesulitan penambangan Bitcoin saat ini. Berdasarkan data yang ia sajikan, dari total 946 blok yang dihasilkan hingga blok #960.561, hanya 24 blok yang mengandung sinyal dukungan untuk BIP-110 di header mereka. Semua sinyal ini berasal dari penambang DATUM yang berbagi hadiah melalui pool penambangan OCEAN, tanpa ada dukungan dari penambang di luar OCEAN. Karena situasi ini, Saylor menyimpulkan bahwa BIP-110 tidak akan mencapai tingkat dukungan 55% yang diperlukan dalam siklus ini dan sinyal yang ada tidak mewakili konsensus penambang secara luas. BIP-110 adalah proposal yang bertujuan membatasi penyertaan data non-keuangan (seperti gambar atau teks besar) dalam jaringan Bitcoin, dengan argumen bahwa Bitcoin seharusnya hanya untuk transfer uang. Saylor menentang hal ini. Ia berpendapat bahwa jaringan Bitcoin tidak seharusnya memutuskan mana transaksi yang "perlu" dan mana yang tidak, serta aturan tidak boleh diubah berdasarkan keinginan segelintir orang. Ia juga mencurigai bahwa tingkat dukungan tinggi yang terlihat mungkin disebabkan oleh otomatisasi perangkat lunak, bukan cerminan dukungan penambang yang sebenarnya.

cryptonews.ru3j yang lalu

Michael Saylor Klaim Sudah Tidak Mungkin Menerima Pembaruan Bitcoin yang Ditolaknya!

cryptonews.ru3j yang lalu

Jumlah Komentar Negatif tentang Bitcoin Capai Rekor Tertinggi Sejarah: Apa Artinya?

Perusahaan analisis kripto Santiment mengumumkan bahwa sentimen negatif terhadap Bitcoin di media sosial mencapai level tertinggi sepanjang masa. Data mereka menunjukkan rasio komentar positif terhadap negatif tentang Bitcoin di platform seperti X, Reddit, dan Telegram jatuh ke titik terendah sejak sistem pemantauan modern mereka digunakan. Salah satu penyebab utama kekhawatiran pasar adalah kerentanan dalam firmware perangkat Coldcard. Insiden ini dikatakan sangat mengguncang investor karena langsung mempertanyakan keamanan sistem penyimpanan pribadi dan dompet dingin (cold wallet), yang selama ini dianggap sebagai metode paling aman. Santiment menyebutkan bahwa meskipun krisis lebih besar seperti keruntuhan FTX dan Mt. Gox pernah terjadi, insiden Coldcard berdampak berbeda pada investor ritel. Kali ini, diskusi lebih fokus pada keamanan perangkat keras dan dompet dingin secara keseluruhan, bukan pada pertukaran terpusat atau platform leverage yang sering dikritik. Data menunjukkan hanya ada 0,58 komentar positif untuk setiap komentar negatif tentang Bitcoin, yang mengindikasikan ketakutan secara historis jauh melampaui keserakahan. Meski data hanya mencakup satu hari, Santiment mencatat tingkat kepanikan saat ini lebih tinggi daripada puncak kekhawatiran perang awal tahun ini dan kepanikan media sosial selama krisis kripto besar sebelumnya.

cryptonews.ru4j yang lalu

Jumlah Komentar Negatif tentang Bitcoin Capai Rekor Tertinggi Sejarah: Apa Artinya?

cryptonews.ru4j yang lalu

SUI Berada di Ambang Terobosan Baru, Karena 'Bull' Menargetkan Kenaikan Hingga $20

Token SUI telah dilepaskan sekitar 13,72 juta pada 1 Agustus, bernilai sekitar $9,9 juta, sebagai bagian dari skema vesting harian bertahap. Ini bertujuan untuk menghindari tekanan jual besar-besaran di pasar. SUI adalah blockchain layer-1 yang dikembangkan oleh mantan insinyur Meta, dengan total pasokan maksimum 10 miliar token. Seorang trader populer, CryptoPatel, melihat pola akumulasi pada grafik harga tinggi dan mengidentifikasi zona beli antara $0,50-$0,70, dengan target harga $5, $10, dan bahkan $20. Namun, harga saat ini sekitar $0,68 telah turun lebih dari 5%, seiring dengan pelemahan pasar kripto secara umum, dan sentimen sosial cenderung bearish dalam jangka pendek. Di sisi fundamental, jaringan SUI mencatat perkembangan positif: peluncuran dana tokenisasi senilai $75 juta oleh Mubadala Capital, jaringan tes Hashi untuk penggunaan Bitcoin sebagai jaminan, serta penerapan transfer stablecoin gratis. Penurunan harga akhir-akhir ini lebih disebabkan oleh meningkatnya pasokan token dari unlock dan kondisi pasar, bukan karena masalah pada protokol jaringan itu sendiri.

cryptonews.ru4j yang lalu

SUI Berada di Ambang Terobosan Baru, Karena 'Bull' Menargetkan Kenaikan Hingga $20

cryptonews.ru4j yang lalu

Blackrock dan Fidelity Pimpin Aliran Keluar Dana Bitcoin ETF Senilai $265 Juta di Tengah Kenaikan Harga Ether

Pada 31 Juli, ETF spot Bitcoin AS mencatat arus keluar bersih sebesar $265,4 juta. iShares Bitcoin Trust (IBIT) BlackRock memimpin dengan penarikan $122,7 juta, diikuti FBTC Fidelity dengan $54,8 juta. Ini terjadi setelah hari sebelumnya (30 Juli) arus masuk kuat sebesar $233,1 juta, dengan IBIT saja menyumbang $183,4 juta. Aset bersih IBIT turun dari $47,67 miliar menjadi $46,52 miliar, mencerminkan volatilitas yang berlanjut di pasar ETF Bitcoin. Berlawanan dengan tren ini, ETF spot Ethereum mencatat arus masuk bersih sekitar $9,03 juta pada hari yang sama, dipimpin oleh iShares Ethereum Trust (ETHA) BlackRock. Minat institusional tampaknya bergeser ke produk altcoin, didorong oleh peran Ethereum dalam tokenisasi dan penyelesaian stablecoin. Ini adalah kuartal ketiga berturut-turut dengan arus keluar bersih dari ETF spot Bitcoin AS pada Q2 2026, meskipun aset kelolaan total kategori tetap sekitar $105 miliar. Ketidakpastian peraturan di Washington dan tekanan harga Bitcoin berkontribusi pada kehati-hatian investor. Sebagai pemimpin pasar, aliran dana IBIT kemungkinan akan terus menentukan suasana pasar ETF Bitcoin.

cryptonews.ru4j yang lalu

Blackrock dan Fidelity Pimpin Aliran Keluar Dana Bitcoin ETF Senilai $265 Juta di Tengah Kenaikan Harga Ether

cryptonews.ru4j yang lalu

Trading

Spot

Artikel Populer

Cara Membeli ONE

Selamat datang di HTX.com! Kami telah membuat pembelian Harmony (ONE) menjadi mudah dan nyaman. Ikuti panduan langkah demi langkah kami untuk memulai perjalanan kripto Anda.Langkah 1: Buat Akun HTX AndaGunakan alamat email atau nomor ponsel Anda untuk mendaftar akun gratis di HTX. Rasakan perjalanan pendaftaran yang mudah dan buka semua fitur.Dapatkan Akun SayaLangkah 2: Buka Beli Kripto, lalu Pilih Metode Pembayaran AndaKartu Kredit/Debit: Gunakan Visa atau Mastercard Anda untuk membeli Harmony (ONE) secara instan.Saldo: Gunakan dana dari saldo akun HTX Anda untuk melakukan trading dengan lancar.Pihak Ketiga: Kami telah menambahkan metode pembayaran populer seperti Google Pay dan Apple Pay untuk meningkatkan kenyamanan.P2P: Lakukan trading langsung dengan pengguna lain di HTX.Over-the-Counter (OTC): Kami menawarkan layanan yang dibuat khusus dan kurs yang kompetitif bagi para trader.Langkah 3: Simpan Harmony (ONE) AndaSetelah melakukan pembelian, simpan Harmony (ONE) di akun HTX Anda. Selain itu, Anda dapat mengirimkannya ke tempat lain melalui transfer blockchain atau menggunakannya untuk memperdagangkan mata uang kripto lainnya.Langkah 4: Lakukan trading Harmony (ONE)Lakukan trading Harmony (ONE) dengan mudah di pasar spot HTX. Cukup akses akun Anda, pilih pasangan perdagangan, jalankan trading, lalu pantau secara real-time. Kami menawarkan pengalaman yang ramah pengguna baik untuk pemula maupun trader berpengalaman.

646 Total TayanganDipublikasikan pada 2024.12.12Diperbarui pada 2026.06.02

Diskusi

Selamat datang di Komunitas HTX. Di sini, Anda bisa terus mendapatkan informasi terbaru tentang perkembangan platform terkini dan mendapatkan akses ke wawasan pasar profesional. Pendapat pengguna mengenai harga ONE (ONE) disajikan di bawah ini.

Baru saja, Claude Mythos 5 Rilis, 50 Juta Baris Kode Selesai dalam 1 Hari

Abstrak

Dual Version Mythos Tiba! Resmi Menyoroti "Efisiensi Token"

Rekayasa Perangkat Lunak: Tolak Ukur Kesulitan Tinggi Ditembus, dari "Perbaikan Bug" ke "Pasukan Otomatis Penuh"

Visual Asli: Tanpa Scaffolding, Bermain Game "Pokémon" Buta

Konteks Panjang dan Kemampuan Memori Ditingkatkan, Sekaligus Menekankan "Efisiensi Token"

Keuangan, Hukum, dan Operasional: Lubang Hitam Logika yang Pertama Kali Menembus Batas 90%

Penelitian Terdepan: Mythos Versi Penuh "Mengalahkan" Model 100 Kali Lebih Besar

Setelah Menyerukan Penghentian Penelitian AI, "Kemampuan Berbahaya" Tampaknya Dijadikan Mekanisme Produk

Pengalaman Uji Internal AI Scholar: Semakin Kuat AI, Manusia Semakin Mirip Pemberi Tugas

Tiga Hal Lain

Kripto yang Sedang Tren

Pertanyaan Terkait

Bacaan Terkait

Kunci Bitcoin Disimpan Offline Berkat Lemparan Dadu, Tetapi Tidak Semua Orang Akan Melakukannya

Michael Saylor Klaim Sudah Tidak Mungkin Menerima Pembaruan Bitcoin yang Ditolaknya!

Jumlah Komentar Negatif tentang Bitcoin Capai Rekor Tertinggi Sejarah: Apa Artinya?

SUI Berada di Ambang Terobosan Baru, Karena 'Bull' Menargetkan Kenaikan Hingga $20

Blackrock dan Fidelity Pimpin Aliran Keluar Dana Bitcoin ETF Senilai $265 Juta di Tengah Kenaikan Harga Ether

Trading

Artikel Populer

Cara Membeli ONE

Diskusi

Kategori Populer

Tag Populer