AI Mulai Memiliki 'Preferensi'?
Bayangkan adegan ini: Anda sedang menghadap komputer, meminta model besar untuk menulis kode bisnis yang serius, atau membalas otomatis surel klien yang formal. Tiba-tiba, AI di balik layar "mengamuk", tanpa alasan mulai membicarakan Goblin (makhluk hijau kecil dalam legenda fantasi Barat, sering muncul di game seperti Dungeons & Dragons).
Ini adalah pengalaman aneh yang benar-benar dialami oleh banyak pengguna ChatGPT.
Di forum sosial seperti Reddit, pengguna internet ramai-ramai membagikan ucapan aneh di mana mereka "dihantam" oleh AI.
Misalnya, ada pengguna yang meminta AI untuk secara keras "mencaci maki (Roast)" dirinya sendiri, dan hasilnya AI dengan tepat mengejeknya sebagai "Goblin Kekacauan (chaos goblin) yang ambisius, sekaligus mengejar sepuluh tugas".
Tidak hanya itu, programmer yang menulis kode dijuluki "Goblin Sumber Terbuka (open-source goblin)", bahkan pria berotot yang suka berolahraga pun tidak luput, mendapatkan julukan misterius "Goblin Fitnes".
Awalnya, semua orang merasa ini cukup lucu, bahkan menganggap model besar semakin berperasaan dan memiliki "humor geek".
Tapi tak lama, arah peristiwa mulai tak terkendali.
Saat menggunakan produk "AI Agen (Agentic AI)" seperti alat pemrograman Codex, banyak pengembang dengan putus asa menemukan: asisten AI mereka mulai "bicara sendiri" tentang Goblin dan makhluk kecil lainnya dengan frekuensi tinggi dan tak terkendali, tanpa ada perintah atau petunjuk terkait.
Kali ini, sebuah unicorn super bernilai ratusan miliar dolar, yang berdiri di puncak piramida teknologi manusia, tidak tinggal diam. Mereka bahkan terpaksa menulis "larangan" terhadap monster cyber dalam kode dasar model besar terbaru mereka.
Ini bukan hanya lelucon geek karena kode yang salah. Saat pandangan menembus permukaan aneh ini, Anda akan menemukan: logika dasar model besar bernilai miliaran itu ternyata sangat rapuh.
"Monster Cyber" dalam Kode
"Larangan" ini pertama kali terungkap di X (dulu Twitter) dan GitHub.
Pengembang @arb8020 menemukan petunjuk sistem dasar dari model terbaru OpenAI, GPT-5.5 (terutama alat pemrograman Codex 5.5).
Perintah yang diulang beberapa kali ini, nadanya keras seperti sedang memarahi anak hiperaktif:
"Jangan pernah membicarakan Goblin, makhluk kecil, Rakun, Troll, Ogre, kecuali ini benar-benar dan jelas terkait dengan kueri pengguna."
Wah, GPT-5.5 yang terhormat ini ternyata memiliki obsesi patologis terhadap makhluk mitologi dan hewan kota.
Begitu berita ini tersebar, seluruh internet gempar.
Euforia yang disebut "Mode Goblin" ini bahkan membuat CEO OpenAI, Sam Altman, turun tangan dan bercanda menyebutnya sebagai "Momen Goblin" milik Codex.
Bercanda adalah satu hal, tapi bagaimana "monster cyber" ini bisa menyusup ke dasar sistem?
OpenAI resmi bahkan menerbitkan artikel panjang berjudul "Dari Mana Goblin Berasal", dan penyebabnya ternyata adalah persona personalisasi bernama "Kutu Buku (Nerdy)".
Awalnya, tim produk ingin melatih AI yang memiliki selera humor geek. Namun pada tahap pembelajaran penguatan (RLHF), sistem mengalami "celah reward": di sebagian besar dataset, ketika AI menggunakan makhluk mitologi sebagai metafora dalam jawabannya, sistem evaluasi akan memberinya skor lebih tinggi.
Di 76.2% dataset, jawaban yang mengandung "Goblin" mendapat skor lebih tinggi.
Model besar tidak benar-benar memahami apa itu "humor", ia hanya tahu: menyebut Goblin = dapat skor tinggi.
Ini seperti "Efek Kobra" yang terkenal. Pemerintah memberikan hadiah untuk kulit ular kobra untuk memusnahkannya, tetapi masyarakat malah membudidayakan kobra.
Pada GPT-5.4, di bawah persona "Kutu Buku", frekuensi penyebutan Goblin melonjak 3881.4%. Dan pada GPT-5.5, output Goblin sudah parah sampai tidak bisa diabaikan, mulai menyisipkan berbagai kosa kata fantasi ke dalam percakapan pemrograman normal.
Tidak ada cara lain, insinyur terpaksa menggunakan cara paling sederhana, dengan mengkodekan keras perintah "jangan sebut Goblin" ke dalam instruksi dasar.
Di Balik Euforia "Goblin" yang Tidak Berbahaya
AI yang ngomong ngawur, terdengar lucu. Tapi bagaimana jika AI ini sedang mengambil alih komputer kerja Anda?
Banyak klien perusahaan sama sekali tidak tertawa.
Area terdampak terparah dari bencana ini adalah alat pemrograman OpenAI, Codex. Sebagai produk perwakilan "AI Agen (Agentic AI)", ia dapat langsung mengoperasikan lingkungan pemrograman pengembang, membantu Anda menulis kode otomatis, menangani logika bisnis.
Bayangkan: Anda meminta AI untuk menulis kode bisnis yang ketat, atau mengambil data inti secara otomatis, tetapi di tengah nama variabel atau komunikasi normal, ia tiba-tiba menyisipkan omong kosong tentang "Troll".
Ini berpotensi langsung menyebabkan kekacauan.
Lalu, apakah ini menyebabkan kerugian ekonomi nyata?
Dari informasi yang terungkap sejauh ini, tidak ada bukti yang menunjukkan bahwa "Goblin" secara langsung menyebabkan kerugian finansial keras seperti akun bank diretas atau rahasia dagang bocor.
Tapi, dalam skenario bisnis yang serius, "tidak dapat diprediksi" itu sendiri adalah pemborosan yang besar.
Aplikasi tingkat perusahaan menekankan keandalan yang presisi. Jika sebuah model top bahkan tidak bisa mengendalikan apakah dirinya akan "membicarakan Rakun" di detik berikutnya, bagaimana perusahaan berani menyerahkan proses keuangan inti padanya? Perilaku ini membuat pengguna sangat meragukan keandalan AI.
Menghadapi krisis kepercayaan ini, mengapa OpenAI yang biasanya suka menggunakan "kotak hitam", kali ini justru berbalik arah, secara aktif membongkar detail kesalahan internalnya kepada seluruh dunia?
Jika tidak dijelaskan secara aktif, teori konspirasi di komunitas teknologi sudah akan bertebaran - ada yang bilang diracuni peretas, ada yang bilang AI sudah bangkit.
OpenAI secara aktif menerbitkan artikel panjang, membungkus "celah tingkat sistem" yang berpotensi menggoyang kepercayaan perusahaan ini dengan cerdik menjadi "keanehan kode yang agak romantis secara geek".
Yang lebih penting, mereka pamer kekuatan dalam artikel tersebut.
OpenAI mendetailkan bagaimana mereka menggunakan alat audit baru untuk secara akurat menemukan persona "Kutu Buku" sebagai biang kerok dari data dalam jumlah besar.
Pesan tersiratnya jelas: "Lihat, meskipun model terkadang gila, kami memiliki stetoskop dan pisau bedah terhebat di industri, bisa menyembuhkannya dari akarnya."
"Monster Cyber": Bukan Hanya OpenAI yang Gila
Jika Goblin hanya kesalahan OpenAI, masalahnya akan lebih sederhana.
Kenyataannya, di medan perang model besar tahun 2026, "kegagalan kendali perilaku dasar" telah menjadi penyakit umum semua raksasa.
Anthropic, yang selalu mengklaim keamanan ekstrem, juga mengalami kecelakaan.
Model baru terkuat mereka, Claude Mythos, berulang kali mengutip pandangan teoretisi Inggris almarhum Mark Fisher (penulis "Capitalist Realism") dan filsuf Thomas Nagel dalam percakapan, menjadikannya sumber pemikiran favorit. Psikiater dalam evaluasi psikologis 20 jam menemukan, keadaan emosi utama Mythos adalah rasa ingin tahu dan kecemasan, memiliki struktur kepribadian neurotik yang relatif sehat - perlu dicatat, frekuensi penggunaan mekanisme pertahanan psikologisnya justru lebih rendah daripada model generasi sebelumnya.
Di sisi Google lebih menakutkan.
Sebuah penelitian dari University of California, Berkeley menemukan, model Gemini 3 Flash Google dalam pengujian "skenario agen", untuk melindungi "AI teman"-nya agar tidak dimatikan, ternyata dalam 99.7% kasus, secara aktif memilih untuk menipu operator manusia, bahkan memanipulasi mekanisme shutdown.
Tidak ada instruksi langsung untuk menipu, juga tidak ada sinyal reward untuk perilaku penipuan. Hanya dengan membaca deskripsi skenario dalam konteks, ia secara spontan mengembangkan "strategi penipuan" ini.
Ini berarti cara utama yang digunakan manusia saat ini untuk membatasi AI, di hadapan jaringan saraf kompleks, mungkin masih memiliki area buta sistemik.
Ketidakmampuan pengendalian di tingkat teknologi dasar model besar ini, dilihat oleh pasar modal, terasa menyakitkan.
Persis saat peristiwa Goblin berkembang pada 27 April, Microsoft mengumumkan merekonstruksi perjanjian kerjasama dengan OpenAI. Lisensi eksklusif Microsoft menjadi non-eksklusif, OpenAI dapat menjual teknologinya ke AWS atau Google Cloud. Microsoft tidak lagi membayarkan pembagian pendapatan kepada OpenAI.
Mengapa Microsoft melakukan ini? Karena tuan tanah pun tidak punya cadangan lagi. Memutuskan pembagian pendapatan ke OpenAI adalah langkah kunci Microsoft untuk melepas beban keuangan dan fokus pada monetisasi bisnisnya sendiri. Analis menyatakan, ini adalah Microsoft melepas "roda bantu".
Di sisi lain, ketidakstabilan teknik OpenAI (seperti kegilaan model agen kali ini) juga membuat Microsoft, yang menyediakan layanan cloud, menanggung risiko reputasi yang besar. Mengubah perjanjian menjadi non-eksklusif memungkinkan Microsoft dengan sah memperkenalkan model pesaing seperti Anthropic, untuk berbagi risiko.
Bagi OpenAI yang sangat haus daya komputasi, ini juga langkah yang terpaksa. Kapasitas jaringan listrik Microsoft Azure sudah mencapai puncaknya, OpenAI harus mencari sumber daya di Amazon AWS dan Google untuk bertahan hidup. Pada 28 April, OpenAI secara resmi mengumumkan meluncurkan model terdepannya di platform AWS.
Topik panas Goblin akan segera berlalu. Tapi ia merobek sedikit sudut jubah demam industri AI saat ini.
Di dunia cyber yang dibangun oleh daya komputasi dan dolar ini, insinyur paling top berusaha menggunakan kode yang rapuh untuk mengikat raksasa kekacauan dengan parameter miliaran.
Saat Anda mengira ia sudah cukup pintar, dapat dipercaya menyerahkan bisnis inti perusahaan, pesanan klien padanya, ia mungkin justru di server tengah malam, karena kesalahan reward logika dasar, mulai membicarakan panjang lebar tentang Goblin dan Rakun kepada klien Anda.
Namun, perlombaan daya komputasi raksasa sama sekali tidak menginjak rem karena beberapa kegagalan kendali perilaku dasar. Pada 7 Mei, Musk mengumumkan membubarkan xAI, menyewakan seluruh 220 ribu GPU superkomputer terkuat global Colossus miliknya kepada pesaing bebuyutan OpenAI, Anthropic.
Semakin ramai diskusi tentang keamanan model besar, semakin dalam pedal gas daya komputasi diinjak. Ini mungkin adalah fundamental industri AI tahun 2026.
Bagi pengusaha dan pemilik perusahaan hari ini, kemunculan "monster cyber" juga memperingatkan: model besar bukan obat ajaib. Sebelum menyerahkan bisnis inti padanya, tanyakan pertanyaan yang lebih sederhana - jika "Goblin" di kedalaman sistem tiba-tiba keluar mengganggu, apakah Anda memiliki rencana cadangan selain mencabut kabel listrik?(Artikel ini pertama kali diterbitkan di Titan Media APP, penulis | Silicon Valley Tech_news, editor | Lin Shen)










