Penulis: The Guardian
Diterjemahkan: Deep Tide TechFlow
Panduan Deep Tide: Laporan investigasi ini mengungkap industri abu-abu yang berkembang pesat: ribuan orang di seluruh dunia menghasilkan uang untuk biaya pelatihan AI dengan menjual suara, wajah, rekaman panggilan, dan video sehari-hari mereka.
Ini bukan diskusi umum tentang kontroversi privasi, tetapi investigasi dengan orang nyata, jumlah uang nyata, konsekuensi nyata—seorang aktor yang menjual wajahnya, kemudian melihat "dirinya" di Instagram mempromosikan produk medis tidak jelas, dengan komentar yang mengevaluasi "penampilan"nya.
Ketika kehausan data perusahaan AI bergabung dengan kesenjangan ekonomi, hal ini menciptakan transaksi yang tidak setara.
Teks lengkap sebagai berikut:
Suatu pagi tahun lalu, Jacobus Louw yang tinggal di Cape Town, Afrika Selatan, seperti biasa pergi berjalan-jalan, memberi makan burung camar di sepanjang jalan. Tapi kali ini dia merekam beberapa video—mengambil langkah kakinya di trotoar dan pandangannya. Video ini membuatnya menghasilkan 14 dolar, sekitar 10 kali upah minimum negara itu, dan juga setara dengan setengah minggu pengeluaran makanan untuk pemuda 27 tahun ini.
Ini adalah tugas "navigasi kota" yang diselesaikan Louw di Kled AI. Kled AI adalah aplikasi yang membayar pengguna untuk mengunggah foto, video, dan data lainnya untuk melatih model AI. Dalam beberapa minggu, Louw menghasilkan 50 dolar dengan mengunggah foto dan video kehidupan sehari-harinya.
Ribuan mil jauhnya, di Ranchi, India, Sahil Tigga, seorang siswa berusia 22 tahun, secara teratur menghasilkan uang dari Silencio—aplikasi ini mengumpulkan data audio secara crowdsourcing untuk pelatihan AI, mengakses mikrofon ponselnya, mengumpulkan suara lingkungan seperti di dalam restoran atau persimpangan sibuk. Dia juga mengunggah rekaman suaranya sendiri. Sahil secara khusus pergi ke tempat-tempat unik, seperti lobi hotel yang belum tercatat di peta Silencio. Dia menghasilkan lebih dari 100 dolar per bulan dari ini, cukup untuk menutupi semua biaya makan.
Di Chicago, Ramelio Hill, seorang magang las berusia 18 tahun, menjual rekaman percakapan pribadi ponselnya dengan teman dan keluarga ke Neon Mobile—ini adalah platform pelatihan AI percakapan yang membayar $0,50 per menit—menghasilkan beberapa ratus dolar. Bagi Hill, hitungannya sederhana: dia pikir perusahaan teknologi sudah mengumpulkan banyak data pribadinya, jadi lebih baik dia juga mendapat bagian darinya.
"Pekerjaan lepas pelatihan AI" ini—mengunggah lingkungan sekitar, foto diri, video, dan audio—berada di garis depan demam data global. Saat Silicon Valley haus akan data manusia berkualitas tinggi yang melampaui apa yang dapat diambil dari internet terbuka, industri pasar data yang berkembang pesat muncul untuk menjembatani kesenjangan ini. Dari Cape Town hingga Chicago, ribuan orang sedang memberikan lisensi mikro identitas biometrik dan data pribadi mereka ke AI generasi berikutnya.
Tapi ekonomi lepas baru ini datang dengan biaya. Di balik beberapa dolar, para pelatih ini sedang menyediakan bahan bakar untuk industri yang pada akhirnya dapat membuat keterampilan mereka menjadi usang, sambil membiarkan diri mereka terpapar risiko masa depan deepfake, pencurian identitas, dan eksploitasi digital—yang baru mulai mereka pahami.
Membuat Roda AI Terus Berputar
Model AI bahasa seperti ChatGPT dan Gemini membutuhkan bahan belajar yang sangat besar untuk terus meningkat, tetapi mereka menghadapi kelangkaan data. Sumber data pelatihan yang paling umum digunakan—C4, RefinedWeb, dan Dolma—mencakup seperempat dari kumpulan data berkualitas tertinggi di web, dan sekarang membatasi perusahaan AI generatif untuk menggunakan datanya untuk melatih model. Peneliti memperkirakan perusahaan AI akan kehabisan teks berkualitas tinggi yang tersedia paling cepat tahun 2026. Meskipun beberapa laboratorium telah mulai melatih dengan data sintetis yang dihasilkan AI sendiri, proses rekursif ini menyebabkan output model dipenuhi dengan "sampah" yang salah, yang memicu keruntuhan.
Aplikasi seperti Kled AI dan Silencio muncul di sini. Di pasar data ini, jutaan orang sedang menjual data identitas mereka untuk memberi makan dan melatih AI. Selain Kled AI, Silencio, dan Neon Mobile, pelatih AI memiliki banyak pilihan: Luel AI, didukung oleh inkubator terkenal Y-Combinator, memperoleh materi percakapan multibahasa dengan harga sekitar $0,15 per menit; ElevenLabs memungkinkan Anda mengkloning suara Anda secara digital dan membuatnya tersedia untuk orang lain dengan tarif dasar $0,02 per menit.
Profesor Ekonomi King's College London Bouke Klein Teeselink mengatakan, pekerjaan lepas pelatihan AI adalah kategori pekerjaan baru yang akan tumbuh pesat.
Perusahaan AI tahu bahwa membayar orang untuk lisensi data membantu menghindari sengketa hak cipta yang mungkin timbul dari mengandalkan sepenuhnya pada konten yang diambil dari web, kata Teeselink. Peneliti AI Veniamin Veselovsky mengatakan perusahaan-perusahaan ini juga membutuhkan data berkualitas tinggi untuk memodelkan perilaku baru dan yang ditingkatkan untuk sistem. "Untuk saat ini, data manusia adalah standar emas untuk sampling dari luar distribusi model," tambah Veselovsky.
Manusia yang menggerakkan mesin-mesin ini—terutama orang-orang di negara berkembang—seringkali membutuhkan uang ini, dan hampir tidak punya pilihan. Banyak pekerja lepas pelatihan AI, melakukan pekerjaan ini adalah respons pragmatis terhadap kesenjangan ekonomi. Di negara-negara dengan tingkat pengangguran tinggi dan mata uang yang terdepresiasi, menghasilkan dolar seringkali lebih stabil dan lebih menguntungkan daripada pekerjaan lokal. Beberapa kesulitan menemukan pekerjaan tingkat pemula, terpaksa melakukan pelatihan AI untuk mencari nafkah. Bahkan di negara yang lebih makmur, kenaikan biaya hidup membuat menjual diri menjadi pilihan finansial yang logis.
Pelatih AI dari Cape Town, Louw, sangat menyadari biaya privasi ini. Meskipun pendapatannya tidak stabil dan tidak cukup untuk menutupi semua pengeluaran bulanannya, dia bersedia menerima syarat-syarat ini untuk menghasilkan uang. Dia telah menderita penyakit neurologis selama bertahun-tahun, tidak dapat menemukan pekerjaan, tetapi uang yang dihasilkan dari pasar data AI (termasuk Kled AI) memungkinkannya mengumpulkan 500 dolar, mendaftar di kursus pelatihan spa, menjadi terapis pijat.
"Sebagai orang Afrika Selatan, menerima dolar lebih berharga daripada yang dipikirkan orang," kata Louw.
Profesor Geografi Internet Universitas Oxford, penulis buku "Feeding the Machine", Mark Graham, mengakui bahwa bagi individu di negara berkembang, uang ini mungkin masuk akal dalam jangka pendek, tetapi dia memperingatkan, "secara struktural, pekerjaan ini tidak stabil, tidak memiliki ruang untuk berkembang, sebenarnya adalah jalan buntu".
Graham menambahkan bahwa pasar data AI mengandalkan "perlombaan ke bawah upah", dan "permintaan sementara untuk data manusia". Begitu permintaan ini bergeser, "pekerja tidak akan memiliki jaminan, tidak memiliki keterampilan yang dapat dialihkan, dan tidak memiliki jaring pengaman".
Graham mengatakan, satu-satunya pemenang adalah "platform di belahan Bumi Utara, yang mengambil semua nilai yang bertahan".
Lisensi Penuh
Pelatih AI dari Chicago, Hill, memiliki perasaan campur aduk tentang menjual panggilan telepon pribadinya ke Neon Mobile. Sekitar 11 jam konten panggilan menghasilkan 200 dolar baginya, tetapi dia mengatakan aplikasi ini sering offline, menunda pembayaran. "Neon selalu terlihat mencurigakan di mataku, tapi aku tetap menggunakannya, hanya untuk mendapatkan uang tambahan membayar tagihan," kata Hill.
Sekarang dia mempertimbangkan kembali apakah uang itu benar-benar semudah itu. September lalu, Neon Mobile offline hanya beberapa minggu setelah diluncurkan, setelah TechCrunch menemukan kerentanan keamanan yang memungkinkan siapa pun mengakses nomor telepon pengguna, rekaman panggilan, dan transkrip. Hill mengatakan Neon Mobile tidak pernah memberitahunya tentang hal ini, dan sekarang dia khawatir suaranya akan disalahgunakan di web.
Peneliti privasi data di Institut AI Berpusat pada Manusia Universitas Stanford, Jennifer King, khawatir bahwa pasar data AI tidak jelas tentang bagaimana dan di mana data pengguna akan digunakan. Dia menambahkan, tanpa memahami hak mereka dan tidak dapat menegosiasikannya, "konsumen menghadapi risiko data mereka akan digunakan kembali dengan cara yang tidak mereka sukai, pahami, atau antisipasi, dengan hampir tidak ada jalan pemulihan".
Ketika pelatih AI berbagi data di Neon Mobile dan Kled AI, mereka memberikan lisensi penuh (global, eksklusif, tidak dapat dibatalkan, dapat dialihkan, dan bebas royalti), mengizinkan platform untuk menjual, menggunakan, menampilkan secara publik, dan menyimpan potret mereka, bahkan membuat karya turunan berdasarkan itu.
Pendiri Kled AI Avi Patel mengatakan, perjanjian data perusahaannya membatasi penggunaan untuk tujuan pelatihan dan penelitian AI. "Seluruh model bisnis bergantung pada kepercayaan pengguna. Jika kontributor berpikir data mereka mungkin disalahgunakan, platform tidak dapat beroperasi." Dia mengatakan perusahaan akan meninjau pembeli sebelum menjual kumpulan data, menghindari kerja sama dengan lembaga "dengan niat mencurigakan", seperti industri pornografi, dan "badan pemerintah" yang mereka anggap mungkin menggunakan data dengan cara yang bertentangan dengan kepercayaan itu.
Neon Mobile tidak menanggapi permintaan komentar.
Profesor Hukum Universitas St George, London, Enrico Bonadio, mencatat bahwa syarat-syarat perjanjian ini mengizinkan platform dan kliennya "hampir melakukan apa pun dengan materi itu, secara permanen, tanpa pembayaran tambahan, dan kontributor tidak memiliki cara praktis untuk menarik persetujuan atau menegosiasikan ulang".
Risiko yang lebih mengkhawatirkan termasuk: data pelatih digunakan untuk membuat deepfake dan peniruan identitas. Meskipun pasar data mengklaim akan menghapus informasi identifikasi (seperti nama dan lokasi) dari data sebelum dijual, pola biometrik pada dasarnya sulit untuk dianonimkan dengan cara yang bermakna, tambah Bonadio.
Penyesalan Penjual
Bahkan jika pelatih AI dapat menegosiasikan perlindungan yang lebih terperinci tentang bagaimana data digunakan, mereka masih mungkin menyesal. Tahun 2024, aktor dari New York Adam Coy menjual potretnya seharga 1000 dolar ke Captions—perangkat lunak editor video AI, sekarang berganti nama menjadi Mirage. Perjanjiannya menyatakan bahwa identitasnya tidak akan digunakan untuk tujuan politik, tidak untuk mempromosikan alkohol, tembakau, atau konten pornografi, dan masa lisensi adalah satu tahun.
Captions tidak menanggapi permintaan komentar.
Tak lama kemudian, teman-teman Adam mulai meneruskan video yang mereka temukan online, video yang menggunakan wajah dan suaranya, dengan jutaan penayangan. Salah satu video Instagram, replika AI Adam menyebut dirinya "dokter vagina", mempromosikan suplemen medis yang tidak terbukti untuk wanita hamil dan pascapersalinan.
"Saya malu menjelaskan hal ini kepada orang lain," kata Coy.
"Komentarnya aneh, karena mereka mengevaluasi penampilan saya, tapi itu bukan saya," tambah Coy. "Saat saya membuat keputusan (menjual potret) ini, pemikiran saya adalah, kebanyakan model akan mengambil data dan potret dari web, lebih baik dibayar."
Coy mengatakan, dia sejak itu tidak menerima pekerjaan lepas data AI lagi. Dia mengatakan, hanya jika suatu perusahaan menawarkan bayaran besar, dia akan mempertimbangkan untuk melakukannya lagi.








