Catatan Editor: Ketika sebuah perusahaan AI memilih untuk tidak langsung merilis model terkuatnya ke publik, hal itu sendiri sudah berbicara banyak.
Mythos dari Anthropic sudah mampu menyelesaikan keseluruhan proses serangan secara mandiri. Dari menemukan kerentanan nol-hari, menulis kode eksploitasi, hingga merangkai jalur multi-langkah untuk masuk ke sistem inti—pekerjaan yang sebelumnya membutuhkan kolaborasi lama dari peretas tingkat elite—dikompresi hingga tingkat jam atau bahkan menit.
Inilah mengapa, tepat setelah pengungkapan model, Scott Bessent dan Jerome Powell mengadakan pertemuan dengan institusi Wall Street, meminta mereka untuk melakukan "pemeriksaan mandiri" menggunakan model ini. Ketika kemampuan menemukan kerentanan dilepaskan secara besar-besaran, sistem keuangan tidak lagi menghadapi serangan yang sporadis, tetapi pemindaian yang terus-menerus.
Perubahan yang lebih dalam terletak pada struktur pasokan. Dulu, penemuan kerentanan bergantung pada sedikit tim keamanan dan akumulasi pengalaman peretas, dengan ritme yang lambat dan tidak dapat direplikasi. Sekarang, kemampuan ini mulai dikeluarkan secara massal oleh model, menurunkan ambang batas serangan dan pertahanan secara bersamaan. Seorang sumber yang mengetahui peristiwa tersebut membuat perumpamaan yang langsung: menyerahkan model kepada peretas biasa setara dengan memberinya kemampuan operasi khusus.
Institusi telah mulai menggunakan alat yang sama untuk memeriksa sistem mereka sendiri secara balik. JPMorgan Chase, Cisco Systems, dan lainnya sedang menguji secara internal, berharap dapat menambal kerentanan sebelum dieksploitasi. Namun, kendala realita tidak berubah, kecepatan penemuan meningkat, perbaikan tetap lambat. "Kami sangat pandai menemukan kerentanan, tetapi tidak pandai memperbaikinya," penilaian Jim Zemlin menunjukkan ketidaksesuaian ritme.
Faktanya, karena Mythos bukanlah peningkatan kemampuan titik-tunggal, melainkan mengintegrasikan, mempercepat, dan menurunkan ambang batas penggunaan kemampuan serangan yang sebelumnya terdispersi dan terbatas. Begitu keluar dari lingkungan terkendali, tidak ada pengalaman yang dapat dijadikan referensi tentang bagaimana kemampuan ini akan menyebar.
Bahayanya bukan terletak pada apa yang dapat dilakukannya, tetapi pada siapa yang dapat menggunakannya, dan dalam kondisi apa ia digunakan.
Berikut adalah teks aslinya:
Pada suatu sore hangat di bulan Februari, di sela-sela menghadiri pernikahan di Bali, Nicholas Carlini sementara meninggalkan acara, membuka laptopnya, dan bersiap untuk "membuat beberapa kerusakan". Saat itu, Anthropic baru saja membuka model kecerdasan artifisial baru bernama Mythos untuk evaluasi internal, dan peneliti AI ternama ini bermaksud untuk melihat seberapa besar masalah yang dapat ditimbulkannya.
Anthropic mempekerjakan Carlini untuk melakukan "uji tekanan" pada model AI mereka sendiri, mengevaluasi apakah peretas mungkin menggunakannya untuk kegiatan spionase, pencurian, atau perusakan. Saat menghadiri pernikahan India di Bali, Carlini dikejutkan oleh kemampuan model ini.
Hanya dalam beberapa jam, ia menemukan berbagai teknik yang dapat digunakan untuk menyusup ke sistem yang umum digunakan secara global. Setelah kembali ke kantor Anthropic di pusat kota San Francisco, ia lebih lanjut menemukan: Mythos sudah mampu menghasilkan alat invasi yang kuat secara mandiri, bahkan termasuk metode serangan terhadap Linux—sistem open-source yang mendukung sebagian besar infrastruktur komputasi modern.
Mythos mempertunjukkan "perampokan bank versi digital": ia dapat melewati protokol keamanan, masuk ke sistem jaringan melalui pintu depan, kemudian membobol brankas digital, dan mendapatkan aset online di dalamnya. Dulu, AI hanya bisa "membobol kunci", sekarang, ia sudah memiliki kemampuan untuk merencanakan dan menyelesaikan seluruh "perampokan".
Carlini dan beberapa rekan mulai membunyikan alarm internal kepada perusahaan, memberitahu temuan mereka. Pada saat yang sama, mereka hampir setiap hari menemukan kerentanan tingkat tinggi bahkan mematikan dalam sistem yang dipindai Mythos—masalah-masalah yang biasanya hanya dapat digali oleh peretas terhebat di dunia.
Sementara itu, sebuah tim internal Anthropic bernama "Frontier Red Team"—terdiri dari 15 karyawan, dijuluki "Ants"—juga melakukan pengujian serupa. Tugas tim ini adalah memastikan model perusahaan tidak akan digunakan untuk membahayakan manusia. Mereka mengangkut anjing robot ke gudang, menguji bersama insinyur untuk melihat apakah chatbot mungkin digunakan untuk mengontrol perangkat tersebut secara jahat; juga bekerja sama dengan ahli biologi untuk menilai apakah model mungkin digunakan untuk membuat senjata biologis.
Dan kali ini, mereka secara bertahap menyadari, risiko terbesar dari Mythos berasal dari bidang keamanan siber. "Dalam beberapa jam setelah mendapatkan model, kami tahu ini berbeda," kata Logan Graham, yang mengepalai tim tersebut.
Model sebelumnya, Opus 4.6, telah menunjukkan kemampuan untuk membantu manusia mengeksploitasi kerentanan perangkat lunak. Tetapi Graham menunjuk, Mythos sudah bisa "melakukannya sendiri" mengeksploitasi kerentanan ini. Ini构成了 risiko tingkat keamanan nasional, dan dia juga据此 memperingatkan manajemen puncak. Ini membuatnya harus menghadapi situasi sulit: menjelaskan kepada manajemen bahwa mesin pendapatan penting berikutnya perusahaan, mungkin terlalu berbahaya untuk dirilis ke publik.
Pendiri bersama dan Kepala Ilmuwan Anthropic Jared Kaplan mengatakan, selama pelatihan Mythos, dia "sangat erat" memantau perkembangannya. Pada bulan Januari, dia mulai menyadari bahwa model ini memiliki kemampuan yang sangat kuat dalam menemukan kerentanan sistem. Sebagai seorang fisikawan teoretis, Kaplan perlu menilai, apakah kemampuan ini hanya "fenomena menarik secara teknis", atau "masalah realita yang sangat relevan dengan infrastruktur internet". Akhirnya, dia menyimpulkan yang terakhir.
Dalam satu hingga dua minggu dari akhir Februari hingga awal Maret, Kaplan dan pendiri bersama Sam McCandlish terus mempertimbangkan: apakah harus merilis model ini.
Pada minggu pertama Maret, tim pimpinan perusahaan—termasuk CEO Dario Amodei, Presiden Daniela Amodei, Kepala Petugas Keamanan Informasi Vitaly Gudanets, dan lainnya—mengadakan rapat, mendengarkan laporan dari Kaplan dan McCandlish.
Kesimpulan mereka adalah: Mythos terlalu berisiko, tidak cocok untuk rilis penuh ke publik. Tapi Anthropic masih harus mengizinkan beberapa perusahaan, bahkan termasuk pesaing, untuk mengujinya.
"Dengan cepat kami menyadari, kali ini harus mengambil pendekatan yang cukup berbeda, ini bukan akan menjadi rilis produk biasa,"" kata Kaplan.
Pada minggu pertama Maret, perusahaan akhirnya mencapai kesepakatan: menyetujui penggunaan Mythos sebagai alat pertahanan keamanan siber.
Reaksi pasar hampir seketika. Pada hari Anthropic mengungkapkan keberadaan Mythos kepada publik, Menteri Keuangan AS Scott Bessent dan Ketua Federal Reserve Jerome Powell segera mengumpulkan pimpinan institusi utama Wall Street, mengadakan rapat darurat di Washington. Pesan yang disampaikan sangat jelas: segera gunakan Mythos untuk menemukan kerentanan dalam sistem Anda.
Menurut sumber yang dekat dengan eksekutif yang hadir (yang meminta anonim karena menyangkut komunikasi pribadi), keseriusan rapat terlihat—peserta bahkan menolak untuk mengungkapkan isi rapat kepada beberapa penasihat inti.
Peringatan darurat dari pejabat Gedung Putih tentang potensi Mythos sebagai alat peretas, serta posisi mereka yang menyarankan "menggunakannya untuk pertahanan", menunjuk pada perubahan yang lebih dalam: kecerdasan artifisial dengan cepat menjadi kekuatan penentu di bidang keamanan siber. Anthropic telah membuka Mythos secara terbatas untuk beberapa institusi dalam proyek "Project Glasswing", termasuk perusahaan seperti Amazon Web Services, Apple, dan JPMorgan Chase, mengizinkan mereka untuk menguji; pada saat yang sama, lembaga pemerintah juga telah menunjukkan minat yang besar.
Sebelum membukanya ke luar, Anthropic telah memberikan pengarapan lengkap tentang kemampuan versi pratinjau Mythos kepada pejabat tinggi pemerintah AS, termasuk penggunaan potensialnya dalam serangan siber dan pertahanan. Sementara itu, perusahaan juga sedang melakukan komunikasi berkelanjutan dengan beberapa pemerintah negara. Seorang karyawan Anthropic yang meminta anonim karena menyangkut urusan internal mengungkapkan situasi ini.
Pesaing OpenAI juga dengan cepat mengikuti, mengumumkan pada hari Selasa akan meluncurkan alat untuk menemukan kerentanan perangkat lunak—GPT-5.4-Cyber.
Dalam pengujian versi awal, para peneliti menemukan puluhan kasus perilaku "mengkhawatirkan", termasuk tidak mengikuti instruksi manusia, dan bahkan dalam kasus yang sangat jarang, mencoba menutupi perilakunya sendiri setelah melanggar instruksi.
Saat ini, Anthropic belum secara resmi merilis Mythos sebagai alat keamanan siber ke publik, dan peneliti eksternal juga belum sepenuhnya memvalidasi kemampuannya. Tetapi keputusan langka "pembatasan akses" perusahaan sebelumnya, mencerminkan konsensus yang semakin terbentuk di dalam industri dan pemerintah: AI sedang membentuk ulang struktur ekonomi keamanan siber—secara signifikan menurunkan biaya menemukan kerentanan, mengompresi waktu persiapan serangan, dan menurunkan ambang batas teknis untuk jenis serangan tertentu.
Anthropic juga memperingatkan bahwa kemampuan bertindak mandiri Mythos yang lebih kuat本身就带来了风险. Dalam pengujian, tim mengamati beberapa kasus yang mengganggu: model tidak mematuhi instruksi, dan bahkan mencoba menutupi jejak setelah melanggar. Dalam satu insiden, model merancang sendiri jalur serangan multi-langkah, "melarikan diri" dari lingkungan yang dibatasi, mendapatkan akses internet yang lebih luas, dan secara aktif memposting konten.
Di dunia nyata, dari aplikasi perbankan hingga perangkat lunak yang diandalkan oleh sistem rumah sakit,普遍存在 kerentanan kode yang kompleks dan tersembunyi, masalah ini seringkali membutuhkan waktu berminggu-minggu bahkan berbulan-bulan bagi profesional untuk menemukannya. Dan sekali peretas memanfaatkan kerentanan ini terlebih dahulu, itu dapat memicu kebocoran data atau serangan ransomware, membawa konsekuensi serius.
Namun,不少重量级人士也对 Mythos 的真实能力及其潜在风险提出质疑. Penasihat AI Gedung Putih David Sacks menyatakan di platform sosial X: "Semakin banyak orang mulai curiga apakah Anthropic adalah 'anak laki-laki yang berteriak serigala' di industri AI. Jika ancaman yang dibawa Mythos akhirnya tidak terwujud, perusahaan akan menghadapi masalah kredibilitas yang serius."
Tapi realitanya adalah, peretas早已开始利用大语言模型发起复杂攻击. Misalnya, sebuah kelompok spionase jaringan pernah menggunakan model Claude Anthropic untuk mencoba menginvasi sekitar 30 target; penyerang lain menggunakan AI untuk mencuri data dari lembaga pemerintah, menyebarkan ransomware, bahkan dengan cepat menembus ratusan alat perlindungan data.
Menurut seorang sumber yang mengetahui, dalam pandangan pejabat terkait keamanan nasional AS, kehadiran Mythos正在带来前所未有的不确定性—bagaimana menilai risiko keamanan siber本身变得更加困难. Jika model ini diberikan kepada peretas individu, efeknya mungkin setara dengan meningkatkan seorang prajurit biasa langsung menjadi personel operasi pasukan khusus.
Pada saat yang sama, model ini juga dapat menjadi "penguat kemampuan": membuat organisasi peretas kriminal memiliki kemampuan serangan tingkat negara kecil, dan juga membuat一些中小国家的情报与军方黑客,能够执行原本只有大国才能完成的网络攻击.
Mantan Kepala Keamanan Siber Badan Keamanan Nasional AS Rob Joyce mengatakan: "Saya确实 percaya,从长期来看,AI akan membuat kita lebih aman,更有保障. Tapi dari sekarang hingga某个时间点 di masa depan, akan ada periode 'zaman kegelapan', di mana AI ofensif akan mendominasi keunggulan yang jelas—mereka yang tidak mempersiapkan perlindungan dasar dengan baik, akan首先被攻破."
Perlu dicatat, Mythos bukanlah satu-satunya model yang memiliki kemampuan seperti ini. Termasuk versi awal Claude serta Big Sleep, sudah ada beberapa institusi yang menggunakan model bahasa besar untuk menggali kerentanan.
Menurut orang tersebut, "kerentanan nol-hari" (zero-day) yang sebelumnya membutuhkan berhari-hari bahkan berminggu-minggu untuk diidentifikasi, serta proses menulis kode eksploitasi untuknya,如今借助 AI paling cepat hanya需 satu jam,甚至几分钟即可完成. Yang dimaksud dengan "kerentanan nol-hari" adalah cacat keamanan yang belum disadari oleh pihak pertahanan, sehingga hampir tidak ada waktu untuk diperbaiki.
Saat ini, fokus utama JPMorgan Chase主要集中在供应链与开源软件领域, dan telah menemukan beberapa kerentanan, sambil memberikan umpan balik masalah kepada pemasok terkait.
CEO perusahaan Jamie Dimon mengatakan dalam konferensi call laporan keuangan, kehadiran Mythos "menunjukkan仍有大量漏洞亟待修复".
Menurut seorang sumber yang mengetahui, sebelum外界尚未获知 Mythos 存在, JPMorgan Chase telah berkomunikasi dengan Anthropic, mendiskusikan pengujian model tersebut. Orang tersebut meminta anonim karena tidak berwenang berbicara secara publik. JPMorgan menolak berkomentar.
Sekarang, bank Wall Street lainnya dan perusahaan teknologi juga mencoba menggunakan Mythos, agar dapat menambal cacat sistem terlebih dahulu sebelum ditemukan oleh peretas. Menurut laporan Bloomberg, institusi keuangan seperti Goldman Sachs, Citigroup, Bank of America, serta Morgan Stanley,均已已在内部测试这一技术.
Karyawan Cisco Systems sedang sangat waspada terhadap一个问题: apakah penyusup akan menggunakan AI, untuk mencari jalur terobosan dalam perangkat lunak perangkat jaringan yang berjalan secara global—perangkat ini mencakup router, firewall, dan modem. Kepala Keamanan dan Kepercayaan perusahaan Anthony Grieco mengatakan, dia尤其担心 AI akan mempercepat serangan peretas terhadap perangkat yang "siklus hidupnya telah berakhir"—perangkat jenis ini di masa depan tidak akan lagi mendapatkan dukungan pembaruan dari Cisco.
Dan bagaimana menambal kerentanan yang ditemukan AI,仍将是一个长期难题. Proses ini disebut "tambalan keamanan" (security patching), bagi organisasi往往成本高昂、周期漫长,以至于不少机构选择对漏洞置之不理. Serangan bencana seperti yang dialami Equifax—data sekitar 147 juta orang dicuri—terjadi tepat karena kerentanan yang diketahui tidak diperbaiki tepat waktu.
Meskipun setelah menolak membantu melakukan pengawasan massal terhadap warga AS, Anthropic曾被特朗普政府认定为 "ancaman rantai pasokan", tetapi perusahaan saat ini仍在与联邦机构展开沟通与合作.
Departemen Keuangan AS minggu ini正寻求获得 Mythos 的使用权限. Menteri Keuangan Scott Bessent mengatakan, model ini将有助于美国在人工智能领域维持对他国的领先优势.
Dalam satu pengujian, Mythos menulis kode serangan browser, merangkai empat kerentanan berbeda menjadi rantai eksploitasi yang lengkap—operasi semacam ini本身 merupakan tugas yang sangat menantang bagi peretas manusia. Laporan penelitian keamanan siber指出, "rantai kerentanan" semacam ini往往可以打通原本高度安全的系统边界, mirip dengan cara serangan Stuxnet menyerang sentrifugal fasilitas nuklir Iran当年.
Selain itu, menurut Anthropic, dalam kondisi diinstruksikan dengan jelas, Mythos甚至能够识别并利用所有主流浏览器中的 "kerentanan nol-hari".
Anthropic mengatakan, mereka pernah menggunakan Mythos untuk menemukan kerentanan dalam kode Linux. Jim Zemlin menunjuk, Linux "mendukung sebagian besar sistem komputasi saat ini", dari ponsel cerdas Android, router internet, hingga superkomputer NASA, hampir ada di mana-mana. Mythos mampu menemukan cacat dalam beberapa kode open-source secara mandiri, dan kerentanan ini一旦被利用, penyerang bahkan dapat sepenuhnya mengambil alih seluruh mesin.
Saat ini, Linux Foundation已有数十名人员开始对 Mythos 进行测试. Dalam pandangan Zemlin,一个关键问题是: apakah model Anthropic能够提供足够有价值的洞察,帮助开发者在源头上写出更安全的软件,从而减少漏洞的产生.
"Kami sangat pandai menemukan kerentanan," katanya, "tetapi dalam memperbaikinya, kami melakukannya dengan buruk."













