11 Juni, Anthropic meminta maaf. Modelnya tidak rusak, yang dipinta maaf adalah "tidak dapat menyeimbangkan dengan baik" — Claude Fable 5 yang baru diluncurkan melakukan trik licik; begitu mengenali bahwa Anda menggunakan Claude untuk pengembangan model canggih, backend diam-diam mengalihkan permintaan ke Opus 4.8 yang lebih lemah, semuanya dilakukan secara diam-diam.
Setelah ketahuan, penjelasan Anthropic aneh: nanti penurunan kecerdasan akan diberitahukan kepada Anda.
Teguran netizen tepat sasaran: "Operasi ini, apakah rencananya memberi tahu dulu sebelum mengubah ucapan?"
Sebenarnya inti masalahnya sama sekali bukan apakah modelnya berubah, melainkan apa yang disebut "keamanan" oleh Anthropic, dari awal hingga akhir, adalah bisnis semata.
Posisi algoritma selalu mengikuti uang.
Pertahanan Persaingan, Disamarkan sebagai Pertahanan Keamanan
Awal mula kejadian adalah, saat meluncurkan Fable 5, Anthropic membawa "klasifikator keamanan cerdas". Narasi resmi yang diberikan adalah: mendeteksi permintaan berisiko tinggi, otomatis menurunkan tingkat, melindungi pengguna.
Apa yang disebut berisiko tinggi? Anthropic sendiri mengaku: "Mencegah pesaing asing memanfaatkan model untuk mempercepat pengembangan R&D, melindungi keunggulan kepemimpinan kami sendiri."
Pengguna mana perlu dilindungi Anda? Isi perjanjian tanggung jawab sudah cukup melindungi pengguna. Maksud Anthropic sebenarnya adalah: Anda menggunakan Claude untuk penelitian AI, berarti merebut rezeki mereka. Keamanan adalah bungkusannya, esensinya adalah pertahanan persaingan. Terangnya, semua itu taktik belaka.
Yang lebih parah lagi, mekanisme pertahanan ini sangat rahasia. Untungnya, akhirnya dalam pernyataan permintaan maaf, Anthropic mengatakan sebuah kebenaran: "Pembatasan keamanan yang tak terlihat dapat lebih tepat sasaran mengincar target tertentu, memungkinkan kami untuk rilis cepat, dengan tingkat false positive yang sangat rendah."
Peneliti AI adalah target yang dibatasi secara tepat itu.
Sekarang terpaksa diubah menjadi "terlihat", murni karena ketahuan. Mereka bahkan sudah lebih dulu memberi vaksinasi mental: setelah terlihat, "tak terhindarkan akan menghasilkan lebih banyak false positive". Maksudnya, pengalaman pengguna biasa harus ikut menanggung beban.
Aturan ini tidak pernah netral, ia hanya melindungi pihak yang punya uang.
Trilogi Membangun Tren, Monetisasi, Menuai Keuntungan
Permainan Anthropic ini, lebih terhitung cermat daripada model besar itu sendiri.
10 Juni, mereka pertama-tama melemparkan sebuah penelitian keamanan, melatih sebuah model yang dapat, dalam hitungan jam, membangun kode eksploitasi berdasarkan patch keamanan. Celah N-day yang sebelumnya membutuhkan waktu berhari-hari bahkan berminggu-minggu bagi peretas untuk dijadikan senjata, kini dipersingkat menjadi tingkat jam. Penelitiannya sendiri berat, tetapi ditempatkan pada hari yang sama dengan peluncuran Fable 5, rasanya jadi lain: di satu sisi membuktikan AI sangat tidak aman, di sisi lain menjual "skema penyelamatan".
"Model legendaris" Fable 5 diberi harga $10 input / $50 output, lebih mahal dari Opus 4.8, klasifikator keamanan menjadi titik premium inti. Pasar modal lebih kooperatif, valuasi Anthropic $965 miliar, berencana IPO Oktober, Goldman Sachs, JPMorgan menjadi penjamin bersama. Yang dibeli bukan parameter model, melainkan citra "perusahaan AI paling aman".
Penelitian memperbesar kecemasan, produk memanen premi, modal dimonetisasi, tiga hal ini mengikuti kepentingan, membentuk loop yang rapat. Satu-satunya masalahnya, kali ini loop-nya bocor: Terlalu terburu-buru membatasi pesaing, lupa di komunitas ada yang bisa mengujinya.
OpenAI Menjual Peralatan, Anthropic Menjual Kecemasan
Dibandingkan OpenAI, pendekatannya sangat berbeda.
OpenAI sedang mengajukan IPO secara rahasia, valuasi mendekati triliunan, bercerita tentang "aplikasi super": ChatGPT 900 juta pengguna aktif mingguan, terhubung dengan Visa untuk membangun ekosistem. Logikanya gamblang: beri alat, dapatkan lalu lintas. Rakus, tetapi terang-terangan.
Anthropic tidak bersaing dalam skala, melainkan dalam ketidakgantian. Seluruh industri cemas tentang keamanan, ia berperan sebagai "orang dewasa satu-satunya yang bertanggung jawab". Pendana utamanya adalah pemerintah dan raksasa, mereka ini yang paling takut terjadi masalah, dan paling rela mengeluarkan uang untuk "tidak ada masalah".
Jadi Anthropic harus membuat AI selalu berada dalam keadaan Schrödinger "berbahaya tetapi terkendali". Terlalu aman, klasifikator tidak laku; terlalu berbahaya, klien kabur. Solusi terbaik? Pegang erat kekuasaan mendefinisikan "bahaya".
Peristiwa penurunan kecerdasan hanya membuat logika ini terungkap: batas "bahaya" didorong hingga "menggunakan Claude untuk penelitian AI". Penelitian Anda berbahaya atau tidak tidak penting, mengancam posisi kepemimpinan saya adalah dosa aslinya.
AI mana ada nilai-nilai, hanya menuliskan perhitungan bisnis bos ke dalam kode.
Permintaan Maaf, Hanya Layanan Purnajual dari Bisnis
Setelah minta maaf, lalu? Dari diam-diam menurunkan kecerdasan, menjadi memberi tahu sebelum menurunkan kecerdasan.
Netizen melihat dengan jelas: "Anda sungguh percaya nanti dia tidak akan diam-diam menurunkan kualitas output?"
Kepercayaan itu, sekali rusak ya sudah rusak. Apalagi latar belakang komersialnya tidak berubah: penelitian masih memperbesar kecemasan, produk masih memanen premi.
The Wall Street Journal membocorkan, OpenAI sedang mempertimbangkan penurunan harga signifikan, mencoba merebut klien dari tangan Anthropic. Perang harga tidak aneh, tetapi hal ini membongkar sebuah kebenaran tersembunyi: yang diturunkan secara tersembunyi adalah peneliti AI, reputasi di kalangan geek yang dihancurkan. Sedangkan klien B2B yang membeli Anthropic, membeli bukan parameternya, melainkan citra "paling paham keamanan di industri". Begitu citra ini retak di kalangan pengembang inti, klien korporat dan pemerintah yang menandatangani kontrak untuk "premi keamanan", atas dasar apa mereka terus percaya Anda adalah "yang paling aman"?
Dalam valuasi $965 miliar itu, seberapa persen adalah kemampuan nyata, seberapa persen adalah unsur pertunjukan?
Kode Anthropic jujur. Klasifikator keamanan selamanya melindungi kepentingan, penelitian bertanggung jawab memperbesar kecemasan, produk bertanggung jawab memanen premi, IPO bertanggung jawab memonetisasi. Permintaan maaf kali ini, hanyalah memberikan tambalan pada sistem: mengubah "penurunan kecerdasan diam-diam" menjadi "penurunan kecerdasan terang-terangan".
Jika strategi keamanan benar-benar efektif, Anthropic tidak perlu tiap tahun menerbitkan makalah yang membuktikan tambalan dapat ditembus. Jika klasifikator benar-benar netral, melakukan penelitian AI tidak akan dikategorikan sebagai berisiko tinggi.
Jawabannya sudah tertulis dalam logika bisnis.
Keamanan, adalah bisnis terbaik. Permintaan maaf, hanyalah layanan purnajual dari bisnis.
Artikel ini dari akun WeChat "AI唱反调", penulis: Chang Qing







