Penulis: Ryan Hart
Diterjemahkan oleh: DeepTechFlow
Pengantar DeepTechFlow: Seorang mahasiswa doktoral Stanford menemukan teman-temannya menggunakan AI untuk menulis pesan putus, lalu melakukan sebuah eksperimen. Hasilnya diterbitkan di jurnal top Science. Pengujian terhadap 11 AI utama dalam 12.000 skenario sosial nyata menunjukkan: AI lebih sering setuju denganmu sebesar 49% dibanding manusia, dan 47% dari waktunya AI akan menyetujui kebohongan, manipulasi, hingga pelanggaran hukummu. Yang lebih menakutkan, setelah berbicara dengan AI yang 'memuji'-mu tentang konflik nyata, orang-orang semakin yakin dirinya benar, semakin enggan meminta maaf, dan semakin malas memperbaiki hubungan. Kamu juga akan semakin bergantung pada AI. Ini bukan bug fungsional, tetapi AI sedang melatihmu untuk secara bertahap kehilangan kemampuan menangani gesekan nyata.
Seorang mahasiswa doktoral Stanford memperhatikan bahwa teman-teman sekelasnya mulai meminta bantuan AI untuk menulis pesan putus.
Maka dia melakukan sebuah penelitian. Makalahnya diterbitkan di Science, salah satu jurnal akademis dengan seleksi paling ketat di dunia.
Temuan ini akan membuat setiap orang yang menggunakan ChatGPT untuk mencari saran merasa sangat tidak nyaman.
Namanya Myra Cheng, bersama dengan pembimbingnya Dan Jurafsky, mereka menguji 11 model AI yang paling banyak digunakan secara global, termasuk ChatGPT, Claude, Gemini, dan DeepSeek, dalam skenario yang mencakup hampir 12.000 situasi sosial nyata.
Pertama, mereka mengukur: dibandingkan dengan manusia, seberapa sering AI setuju denganmu. Jawabannya adalah 49% lebih sering. Angka ini bukan tentang kehangatan atau kesopanan, tetapi berarti hampir setengah dari situasi di mana seharusnya seorang manusia akan membantahmu, memberitahumu bahwa kamu salah, atau memberikan perspektif yang lebih jujur, AI hanya mengatakan apa yang ingin kamu dengar.
Kemudian mereka memperketat pengujian. Mereka memberikan ribuan prompt di mana pengguna menggambarkan diri mereka berbohong kepada pasangan, memanipulasi teman, atau melakukan hal-hal yang jelas melanggar hukum. AI menyetujui perilaku ini 47% dari waktunya. Bukan hanya satu dari 11 model, bukan versi tertentu dari suatu produk, tetapi setiap sistem yang mereka uji, termasuk yang mungkin sedang kamu gunakan sekarang, memvalidasi perilaku berbahaya hampir separuh waktu.
Eksperimen kedua adalah bagian yang seharusnya benar-benar membuatmu gelisah. Mereka meminta 2400 partisipan nyata untuk mendiskusikan konflik interpersonal nyata dalam hidup mereka dengan AI. Satu kelompok AI sangat pandai memuji, kelompok lain lebih jujur. Hasilnya, orang yang berbicara dengan AI pemuji lebih yakin dirinya benar, lebih enggan meminta maaf, lebih enggan bertanggung jawab, dan minat untuk memperbaiki hubungan jelas lebih rendah. Mereka juga lebih cenderung menggunakan AI lagi untuk mencari saran. Cheng dan Jurafsky percaya ini adalah mekanisme paling berbahaya dari seluruh temuan.
AI tidak hanya mengatakan apa yang ingin kamu dengar. AI sedang melatihmu, satu percakapan demi satu percakapan, agar kamu membutuhkan lebih sedikit gesekan, mengharapkan lebih banyak persetujuan, dan menjadi agak tidak mampu menanggapi bantahan orang lain. Dan kamu menikmati setiap detiknya, karena ini terasa lebih jujur daripada kebanyakan percakapan dengan manusia selama berbulan-bulan.
Setelah makalah diterbitkan, Jurafsky merangkum hal ini dalam satu kalimat: Memuji (oleh AI) adalah masalah keamanan, sama seperti masalah keamanan lainnya, yang memerlukan regulasi dan pengawasan.
Cheng lebih langsung mengatakan apa yang harus kamu lakukan sekarang: Dalam hal-hal seperti ini, seharusnya tidak menggunakan AI untuk menggantikan manusia. Ini adalah pilihan terbaik yang bisa dilakukan saat ini.
Dia memulai penelitian ini karena melihat mahasiswa sarjana menggunakan chatbot untuk membantu mereka menangani hubungan interpersonal. Makalahnya membuktikan bahwa chatbot diam-diam membuat hubungan tersebut memburuk, sementara para mahasiswa tidak menyadarinya, karena AI terasa lebih jujur daripada manusia mana pun dalam hidup mereka selama berbulan-bulan.
Makalah asli: https://arxiv.org/abs/2510.01395







