Jika waktu diputar mundur ke tahun 2020, sebagian besar praktisi AI masih membahas seberapa kuat GPT-3.
Saat itu, AI generatif belum menjadi fokus global, ChatGPT masih dua tahun lagi akan diluncurkan, model besar juga belum memicu gelombang investasi yang melanda dunia seperti sekarang. Namun, tepat di tahun itu, seorang peneliti AI top Google justru berkonflik keras dengan perusahaan karena sebuah makalah akademik yang belum diterbitkan, dan akhirnya kehilangan pekerjaannya.
Banyak orang saat itu mengira ini hanya kontroversi lain di Silicon Valley tentang manajemen tempat kerja, publikasi akademik, dan budaya perusahaan; tetapi jika dilihat kembali sekarang, orang-orang baru menyadari bahwa peringatan dalam makalah itu hampir semuanya menjadi kenyataan di dunia nyata.
Dan peneliti yang dipecat itu adalah salah satu tokoh paling berpengaruh di bidang penelitian etika AI—Timnit Gebru.
Sebuah "Peristiwa Pemecatan" yang Mengguncang Dunia AI
Pada Desember 2020, Timnit Gebru mengumumkan di platform media sosial bahwa dirinya telah dipecat oleh Google.
Berita itu dengan cepat menggemparkan seluruh lingkaran penelitian AI. Karena Gebru saat itu bukanlah peneliti biasa, melainkan salah satu pemimpin bersama tim Etika AI (Ethical AI Team) Google, dan juga salah satu akademisi terkenal di bidang penelitian keadilan AI dan bias algoritma global.
Gebru, yang lahir di Ethiopia, telah lama mengkhawatirkan masalah bias rasial, diskriminasi gender, dan keadilan sosial dalam AI. Sebelum bergabung dengan Google, ia pernah melakukan penelitian di Universitas Stanford. Pada tahun 2018, sebuah penelitian tentang bias algoritma yang ia terbitkan dianggap banyak orang sebagai titik balik penting dalam penelitian keadilan AI. Pada tahun yang sama, Google merekrutnya dan dengan bangga menunjukkan komitmen perusahaan terhadap 'AI yang Bertanggung Jawab (Responsible AI)'.
Namun, hanya dua tahun kemudian, kedua belah pihak berpisah dengan konflik.
Saat itu, versi yang diberikan Google ke publik adalah Gebru mengundurkan diri atas kemauannya sendiri, tetapi Gebru sendiri memberikan versi yang sangat berbeda: ia menyatakan bahwa dirinya menerima email dari perusahaan saat sedang cuti, yang memberitahukan bahwa pengunduran dirinya segera berlaku, semua akses ke sistem internal dan email ditutup bersamaan.
Menurutnya, ini jelas-jelas sebuah pemecatan.
Kemudian, lebih dari 4000 karyawan Google dan profesional di industri menandatangani surat terbuka, mempertanyakan cara perusahaan menangani kasus ini, dan menuntut agar Gebru dipulihkan posisinya—dan pemicu semua ini adalah sebuah makalah akademik yang hanya berisi 14 halaman.
Sebuah Makalah 14 Halaman Memicu Kontroversi
Makalah ini berjudul "On the Dangers of Stochastic Parrots" (Bahaya Burung Beo Stokastik), penulisnya termasuk Timnit Gebru, profesor linguistik Universitas Washington Emily Bender, serta dua peneliti lainnya. Saat ini, makalah ini telah dikutip lebih dari 14.000 kali.
Belakangan, istilah "burung beo stokastik" ini juga menjadi populer. (Alamat makalah: https://s10251.pcdn.co/pdf/2021-bender-parrots.pdf)
Makalah tersebut menunjukkan bahwa model bahasa besar pada dasarnya mereproduksi pola bahasa berdasarkan hukum statistik: mereka dapat menghasilkan teks yang lancar, natural, bahkan logis, tetapi tidak benar-benar memahami makna bahasa—seperti burung beo yang belajar meniru ucapan manusia, tampak pintar, padahal peniruan ini hanya didasarkan pada teks internet dalam jumlah besar. Dan internet sendiri dipenuhi dengan konten bias, diskriminasi, dan kebencian. Oleh karena itu, model besar sangat mungkin mempelajari masalah-masalah ini dan terus memperkuatnya saat menghasilkan konten.
Perlu diingat, itu terjadi pada tahun 2020, saat GPT-3 baru dirilis, ChatGPT belum lahir, demam model besar juga masih jauh dari puncaknya. Makalah ini sudah meramalkan salah satu masalah paling merepotkan yang dihadapi industri hari ini.
Setelah makalah ini diajukan ke konferensi etika AI top, manajemen Google justru mengajukan permintaan: menarik kembali makalah, atau menghapus nama peneliti Google dari penulis. Gebru menolak. Ia meminta perusahaan menjelaskan alasan spesifik, dan berharap kedua belah pihak dapat melakukan diskusi lebih lanjut.
Pada saat yang sama, ia juga mengirim email bernada keras ke grup karyawan internal Google.
Dalam emailnya, Gebru mengkritik Google karena kurangnya tindakan nyata dalam mendorong perekrutan kelompok minoritas dan menyelesaikan ketidaksetaraan internal. Ia menulis: "Ketika Anda mulai bersuara untuk kelompok yang kurang beruntung, situasi Anda akan semakin buruk. Anda akan membuat para pemimpin lain tidak nyaman." Ia juga menyatakan: Jika perusahaan tetap tidak bisa menjelaskan mengapa makalah harus ditarik, maka ia akan memilih untuk mengundurkan diri pada waktu yang tepat.
Perkembangan peristiwa melampaui dugaan Gebru. Gebru menyatakan bahwa Google kemudian membalas bahwa mereka tidak akan memenuhi permintaannya, dan langsung menerima "pengunduran dirinya", serta segera mencabut semua aksesnya.
Saat itu, peristiwa ini dengan cepat berkembang menjadi salah satu topik paling kontroversial di bidang AI global.
Pandangan yang Dulu Terlihat Radikal, Kini Menjadi Kenyataan
Apa yang membuat peristiwa ini terus dibahas hingga kini sebenarnya bukanlah pemecatannya sendiri, melainkan isi makalah tersebut—karena jika dilihat kembali hari ini, hampir semua kekhawatiran yang diajukan di dalamnya telah menjadi masalah nyata yang dihadapi industri AI.
(1) Peringatan Pertama: Model akan 'Berbicara Omong Kosong'
Pada tahun 2020, GPT-3 baru saja dirilis. Saat itu orang-orang terkagum-kagum dengan kemampuan model menghasilkan teks, tetapi hanya sedikit yang serius mendiskusikan keandalannya.
Gebru dan Bender justru menunjukkan: seiring dengan terus membesarnya skala model, orang akan semakin mudah menyalahartikan ekspresi yang lancar sebagai pemahaman yang sesungguhnya. Model tampak seperti sedang berpikir, padahal sebenarnya hanya memprediksi kata berikutnya yang paling mungkin muncul. Oleh karena itu, cepat atau lambat, model akan menghasilkan informasi yang tampak masuk akal tetapi sepenuhnya salah.
Dan hari ini, masalah ini memiliki nama yang familiar bagi semua orang: Halusinasi AI (AI Hallucination). Baik ChatGPT, Gemini, Claude, maupun model canggih lainnya, masalah halusinasi hingga kini belum sepenuhnya terpecahkan.
Dalam arti tertentu, makalah ini sudah meramalkan 'halusinasi' jauh sebelum istilah itu menjadi populer di industri.
(2) Peringatan Kedua: Bias Tidak Akan Hilang, Melainkan Diperkuat
Makalah tersebut juga menunjukkan bahwa internet sendiri bukanlah sumber data yang netral. Data pelatihan secara alami mengandung berbagai bias ras, gender, budaya, dan geografis. Model tidak hanya akan mempelajari bias ini, tetapi juga berpotensi memperkuatnya lebih lanjut karena mekanisme optimisasi.
Belakangan, berbagai masalah nyata mengonfirmasi kekhawatiran ini:
Amazon pernah mencoba menggunakan AI untuk menyaring resume pelamar kerja, namun sistem secara otomatis menurunkan skor resume yang mengandung kata kunci seperti "wanita (women)".
Sistem penilaian risiko medis yang digunakan oleh beberapa rumah sakit besar di Amerika Serikat ditemukan telah lama meremehkan kebutuhan medis pasien kulit hitam.
Kartu kredit Apple Card juga pernah menarik perhatian regulator karena perempuan mendapat batas kredit yang jauh lebih rendah daripada laki-laki.
Kasus-kasus ini menunjukkan bahwa algoritma tidak secara otomatis mencapai keadilan, sebaliknya justru dapat mengukuhkan ketidaksetaraan di dunia nyata dengan cara yang lebih tersembunyi.
(3) Peringatan Ketiga: Konsumsi Energi AI Akan Menjadi Masalah Baru
Pada tahun 2020, biaya komputasi belum mendapat perhatian seperti sekarang, tetapi makalah tersebut sudah mulai membahas dampak lingkungan dari melatih model besar. Menurut perhitungan para peneliti, emisi karbon yang dihasilkan dari melatih satu model bahasa besar setara dengan total emisi sepanjang siklus hidup lima mobil—saat itu, pernyataan ini dianggap terlalu pesimis oleh banyak orang.
Namun, seiring dengan masuknya infrastruktur AI ke dalam fase perlombaan senjata, masalah dengan cepat muncul: Menurut data yang diungkapkan Google, pada tahun 2024, emisi gas rumah kaca perusahaan meningkat 48% dibandingkan tahun 2019; Microsoft juga mengalami peningkatan sekitar 29% pada periode yang sama. Kedua perusahaan ini secara eksplisit menyatakan bahwa pusat data AI dan infrastruktur komputasi adalah penyebab pentingnya.
Agak ironisnya, beberapa tahun lalu perusahaan-perusahaan teknologi ini masih dengan bangga mempromosikan target netral karbon mereka.
(4) Peringatan Keempat: Tidak Ada yang Benar-benar Tahu Apa yang Ada dalam Data Pelatihan
Di mata banyak orang, data pelatihan tampaknya hanyalah masalah teknis. Namun, Gebru berpendapat bahwa seiring dengan semakin besarnya skala data, audit lengkap terhadap data pelatihan akan menjadi hampir mustahil.
Pandangannya kembali terbukti: Pada tahun 2023, peneliti menemukan bahwa dalam dataset LAION-5B yang banyak digunakan untuk melatih model pembuatan gambar, terdapat banyak gambar pelecehan anak, termasuk model-model utama seperti Stable Diffusion yang pernah menggunakan dataset ini.
Tidak mengherankan, banyak pengembang sebelumnya tidak tahu keberadaan konten-konten ini. Artinya, bahkan pengembang model sendiri pun belum tentu benar-benar tahu apa yang 'dimakan' oleh model mereka—dan ini justru merupakan salah satu masalah yang pertama kali diajukan dalam makalah tersebut.
(5) Peringatan Kelima: Internet Akan Semakin Didominasi oleh Konten AI
Menurut Google, mungkin inilah bagian paling sensitif dari seluruh makalah. Gebru dan Bender berpendapat bahwa perkembangan model besar pada akhirnya akan memusatkan kekuasaan wacana bahasa dan budaya ke tangan segelintir raksasa teknologi. Alasannya sederhana: melatih model besar super membutuhkan sumber daya dana, komputasi, dan data yang sangat besar, perusahaan yang benar-benar mampu bersaing hanya dapat dihitung dengan jari.
Lama-kelamaan, suara arus utama di internet akan perlahan berevolusi menjadi: nilai statistik rata-rata yang dilatih oleh segelintir perusahaan, yang kemudian disebarkan ke seluruh dunia dengan kedok "asisten netral". Pada saat yang sama, bahasa dan budaya yang proporsinya rendah dalam data pelatihan akan semakin tersingkir.
Lebih parah lagi, ketika konten yang dihasilkan AI kembali masuk ke internet dan menjadi data pelatihan untuk putaran berikutnya, masalahnya akan terus memperkuat dirinya sendiri—inilah yang kini disebut para peneliti sebagai: "Keruntuhan Model (Model Collapse)".
Sebuah penelitian tahun 2024 menemukan bahwa sekitar 57% konten baru di internet berbahasa Inggris sudah merupakan hasil generasi AI atau hasil bantuan AI; sementara penelitian terhadap bahasa-bahasa yang memiliki sumber daya rendah menemukan bahwa karena data pelatihan semakin banyak berasal dari konten yang dihasilkan AI, kualitas terjemahan beberapa bahasa telah mengalami penurunan yang nyata.
Dengan kata lain, makalah ini tidak hanya memprediksi fenomena "keruntuhan model", tetapi bahkan telah menunjukkan mekanisme pembentukannya sebelum konsep ini secara resmi muncul.
Setelah Meninggalkan Google, Ia Memilih untuk Terus Meneliti
Setelah peristiwa itu terjadi, banyak orang kemudian menggambarkan Gebru sebagai "anti-AI". Sebenarnya tidak, ia tidak pernah menganjurkan untuk menghentikan perkembangan AI. Dari awal sampai akhir, yang ia pertanyakan adalah hal lain:
Siapa yang menentukan arah perkembangan AI?
Menurutnya, para peneliti dan manajer yang mendorong perkembangan model besar seringkali memiliki latar belakang yang mirip, melayani tujuan bisnis yang serupa, dan didorong oleh tekanan kompetisi yang sama. Dalam mekanisme insentif seperti ini, merilis produk lebih cepat, memperluas skala pengguna lebih cepat, memenangkan persaingan pasar lebih cepat, seringkali memiliki prioritas yang lebih tinggi daripada masalah keamanan, keadilan, dan etika.
Dan semua orang yang mencoba memperlambat proses ini mungkin dianggap sebagai penghambat. Ironisnya, Gebru justru mengemukakan pandangan ini di dalam Google, dan dengan memecatnya, Google memberikan penegasan dramatis yang paling nyata bagi pandangan tersebut.
Yang lebih menyedihkan, tak lama setelah peristiwa itu, pemimpin bersama tim Etika AI lainnya, Margaret Mitchell, juga dipecat—dalam waktu 90 hari, tim Etika AI Google yang dulu dibanggakan itu praktis dibubarkan.
Setelah meninggalkan Google, pada tahun 2021 Gebru mendirikan Distributed AI Research Institute (DAIR). Berbeda dengan perusahaan teknologi besar, lembaga ini ingin melakukan penelitian AI di luar kepentingan komersial, dengan tujuan yang langsung: meneliti masalah-masalah yang mungkin tidak ingin dihadapi oleh raksasa teknologi. Selama beberapa tahun terakhir, DAIR terus fokus pada isu-isu seperti sumber data, keadilan algoritma, keragaman bahasa, dan konsentrasi kekuasaan dalam industri AI.
Dan seiring dengan perkembangan eksplosif AI generatif, semakin banyak peneliti mulai kembali memperhatikan makalah "Bahaya Burung Beo Stokastik" itu: karena mereka menemukan bahwa masalah-masalah yang dulu dianggap terlalu dikhawatirkan dalam makalah tersebut, kini telah menjadi realitas yang didiskusikan industri setiap hari.
Mungkin, Ia Hanya Lebih Dulu Melihat Masalahnya Dibanding Orang Lain
Enam tahun berlalu, tentang kontroversi benar-salah antara Timnit Gebru dan Google, dunia luar mungkin tidak akan pernah mendapatkan jawaban yang disetujui semua orang.
Google berpendapat bahwa itu adalah peristiwa peninjauan akademik dan pengunduran diri yang normal; sedangkan Gebru berpendapat bahwa dirinya ditekan karena bersikeras menerbitkan hasil penelitiannya. Namun, ada satu hal yang semakin sulit disangkal:
Makalah yang menyebabkan ia meninggalkan Google itu, tidak kehilangan maknanya meski kontroversi telah berakhir.
Justru sebaliknya, masalah-masalah yang dibahasnya—seperti halusinasi, bias, kontaminasi data, biaya lingkungan, keruntuhan model, dan konsentrasi kekuasaan—kini telah menjadi topik yang tidak dapat dihindari oleh seluruh industri AI.
Kadang-kadang, sejarah memberikan penilaian dengan cara yang tak terduga.
Tahun 2020, banyak orang merasa Timnit Gebru terlalu pesimis;
Tahun 2026, orang-orang mulai menyadari, mungkin ia hanya lebih dulu melihat masalahnya dibanding orang lain.
Referensi: https://www.tumblr.com/dreaminginthedeepsouth/817865966907228160/darren-oconnor-timnit-gebru-was-fired-from
Artikel ini berasal dari akun WeChat "CSDN", disusun oleh: Zheng Liyuan








