Setiap hari, sekitar 500.000 jam tenaga manusia dimanfaatkan Google secara gratis. Dan yang berkontribusi hanyalah orang-orang yang ingin login ke internet banking.
reCAPTCHA adalah operasi data terselubung paling sukses dalam sejarah internet. Pada puncaknya, 200 juta orang menyelesaikan verifikasi setiap hari. Namun hampir tidak ada yang menyadari apa yang terjadi di balik setiap klik.
Waymo, perusahaan mobil otonom Google, kini bernilai 450 miliar dolar AS. Dan sebagian besar data pelatihan intinya disediakan secara gratis oleh Anda saat mengunjungi berbagai situs web.
Berikut kisah lengkapnya:
Awal Mula: Sebuah Konsep yang Cerdas
Tahun 2000, bot spam sedang menghancurkan internet. Forum dibanjiri, kotak masuk penuh, situs web sangat membutuhkan cara untuk membedakan manusia dan mesin.
Profesor Luis von Ahn dari Carnegie Mellon University memecahkan masalah ini. Dia menciptakan CAPTCHA: teks terdistorsi yang hanya bisa dibaca manusia, yang tidak bisa dilalui robot.
Tapi von Ahn melihat lebih dari itu. Jutaan orang menghabiskan tenaga dalam tantangan ini. Bagaimana jika tenaga itu bisa melakukan dua hal sekaligus?
2007, dia meluncurkan reCAPTCHA. Kejeniusannya terletak pada: ia tidak lagi menampilkan kode acak, tetapi dua kata. Satu adalah kata yang sudah diketahui sistem, yang lainnya adalah hasil pindaian buku nyata yang belum bisa dikenali komputer. Dan jawaban Anda membantu digitalisasi buku-buku ini.
Buku-buku ini berasal dari arsip The New York Times dan Google Books, mencapai 130 juta judul.
Anda pikir hanya login ke situs web biasa, padahal Anda sedang membantu perpustakaan digital terbesar di dunia melakukan OCR (pengenalan karakter optik).
2009, Google secara resmi mengakuisisi reCAPTCHA.
Kemudian, Google Mengubah Cara Bermain
Era 'teks terdistorsi' berakhir sekitar tahun 2012.
Google menghadapi tantangan baru: mobil Street View memotret setiap jalan di dunia, tetapi foto hanyalah data mentah. Agar AI berfungsi, ia perlu memahami apa yang dilihatnya: rambu jalan, zebra cross, lampu lalu lintas, fasad toko.
Jadi Google mendesain ulang reCAPTCHA v2. Tidak ada teks terdistorsi, melainkan kisi-kisi foto. 'Klik semua kotak yang ada lampu lalu lintasnya.' 'Pilih setiap zebra cross.' 'Identifikasi toko.'
Gambar-gambar ini langsung berasal dari Google Street View. Klik Anda adalah label.
Setiap pilihan memberitahu model visi komputer Google: gugus piksel ini adalah lampu lalu lintas, bentuk itu adalah zebra cross. Anda tidak sedang lulus tes, Anda sedang membangun kumpulan data.
Skala yang Luar Biasa
Pada puncaknya, 200 juta reCAPTCHA diselesaikan setiap hari. Setiap tantangan memakan waktu 10 detik, artinya menghasilkan 2 miliar detik tenaga manusia per hari. Atau: 500.000 jam per hari.
Biaya pelabelan data berbayar sekitar $10 hingga $50 per jam. Dengan standar terendah: nilai tenaga kerja yang diekstraksi gratis setiap hari mencapai $5 juta.
Dan reCAPTCHA tidak hanya ada di satu App. Ia tersebar di setiap bank, setiap portal pemerintah, setiap situs e-niaga. Anda tidak punya pilihan: ingin login akun? Bantu label dataset dulu. Google tidak pernah menanyakan pendapat Anda, tidak membayar sepeser pun, bahkan tidak pernah memberitahu Anda hal ini.
Apa yang Dihasilkan Semua Ini?
Data ini langsung diberikan kepada dua produk:
-Google Maps: Alat navigasi paling populer di dunia. Kemampuannya mengenali rambu jalan, toko, dan geografi kota, sebagian berkat miliaran kali pelabelan oleh manusia saat login ke situs web.
-Waymo: Proyek mobil tanpa pengemudi Google. Untuk navigasi yang aman, mobil otonom perlu mengenali ribuan pola visual dengan hampir sempurna.
Data pelatihan kebenaran (ground truth) untuk pekerjaan identifikasi itu tepatnya dilabeli oleh jutaan orang tanpa sepengetahuan mereka melalui reCAPTCHA. Waymo pada 2024 menyelesaikan lebih dari 4 juta perjalanan berbayar, bernilai 450 miliar dolar AS. Landasannya, diletakkan oleh 'warga internet tidak dibayar' yang hanya ingin memeriksa email.
Mengapa Tidak Ada yang Bisa Meniru Model Ini?
Pelabelan data sangat mahal. Perusahaan seperti Scale AI, Appen, dan Labelbox ada untuk menyelesaikan masalah ini, mereka mempekerjakan ratusan ribu pekerja, kadang dengan upah kurang dari $1 per jam.
Solusi Google mengambil jalan lain: mereka membuat pelabelan menjadi wajib. Tanpa perlu bayar, tanpa meminta persetujuan, melainkan sebagai 'tiket' masuk ke setiap sudut internet. Hasilnya: miliaran gambar berlabel, cakupan global, cuaca sepanjang hari, setiap kota di dunia. Tidak ada perusahaan pelabelan yang bisa melakukan ini. Internet sendiri adalah pabrik, setiap netizen adalah karyawan tanpa kontrak.
Anda Masih Berpartisipasi Hingga Kini
reCAPTCHA v3 yang diluncurkan 2018 bahkan tidak lagi menampilkan tantangan. Ia mengamati cara Anda menggerakkan mouse, kecepatan scroll, waktu diam. Sidik jari perilaku Anda memberitahunya apakah Anda manusia. Data perilaku ini juga akan memberi umpan balik ke sistem AI Google.
Anda tidak pernah secara aktif memilih untuk bergabung, tidak pernah ada kotak centang untuk Anda centang. Namun saat ini, di sebagian besar situs web yang Anda kunjungi, Anda masih melakukannya.
Ironi yang Mengganggu
Niat awal Luis von Ahn jenius: Mengubah tenaga yang sudah terbuang sia-sia oleh manusia menjadi hasil yang berguna. Tapi yang dilakukan dengan visi ini oleh Google adalah hal lain. Mereka memanfaatkan mekanisme keamanan yang harus digunakan pengguna, menyebarkannya di seluruh jaringan, memanen hasil untuk membangun produk komersial bernilai ratusan miliar dolar. Pengguna tidak mendapatkan apa-apa, bahkan tidak tahu.
Ironi paling dalam adalah: Anda menghabiskan waktu bertahun-tahun membuktikan diri sebagai manusia, dengan menyelesaikan pekerjaan pengenalan visual yang saat itu belum bisa dilakukan AI. Dan begitu AI mempelajarinya, pelabelan visual manusia tidak lagi dibutuhkan.
Anda membuktikan diri sebagai manusia, hasilnya justru membuat diri Anda bisa digantikan.











