GitHub Umumkan Mulai 24 April Akan Data Pengguna Copilot untuk Melatih Model AI Secara Default

marsbitDipublikasikan tanggal 2026-03-26Terakhir diperbarui pada 2026-03-26

Abstrak

GitHub mengumumkan akan memperbarui kebijakan repositorinya mulai 24 April 2026, dengan rencana memanfaatkan data interaksi pengguna untuk melatih model AI-nya. Pengumpulan data ini mencakup pengguna Copilot Free, Pro, dan Pro+, termasuk input dan output model, cuplikan kode, informasi konteks, struktur repositori, serta riwayat interaksi obrolan. Kebijakan ini menerapkan mekanisme "opt-out", yang berarti pengguna yang terkena dampak harus menonaktifkan opsi terkait secara manual melalui pengaturan privasi jika ingin mengecualikan datanya. Namun, pengguna Copilot Business, Enterprise, dan versi pendidikan tidak terpengaruh oleh perubahan ini karena terikat oleh ketentuan kontrak. GitHub menyatakan bahwa langkah ini bertujuan meningkatkan akurasi dan keamanan saran kode dari model AI, seraya menegaskan bahwa praktik tersebut sejalan dengan standar industri yang umum diikuti oleh Anthropic, JetBrains, dan Microsoft. Namun, kebijakan ini memicu diskusi luas di komunitas pengembang mengenai definisi repositori pribadi dan kepemilikan data.

GitHub baru-baru ini mengumumkan akan memperbarui kebijakan repositori kodenya mulai 24 April 2026, berencana memanfaatkan data interaksi pengguna untuk melatih model AI-nya. Cakupan pengumpulan data ini mencakup pengguna Copilot Free, Pro, dan Pro+, secara spesifik mencakup masukan dan keluaran model, potongan kode, informasi konteks, struktur repositori, serta catatan interaksi obrolan.

Kepala Produk GitHub, Mario Rodriguez, menyatakan bahwa pengenalan data interaksi bertujuan untuk meningkatkan akurasi dan keamanan saran kode model, dan menyebut bahwa pengujian awal data internal Microsoft telah secara signifikan meningkatkan tingkat penerimaan saran. Perlu dicatat, kebijakan ini menerapkan mekanisme "opt-out", di mana pengguna yang terdampak harus secara manual masuk ke pengaturan privasi dan menonaktifkan opsi terkait untuk keluar, hal ini memicu diskusi luas di komunitas pengembang mengenai definisi repositori pribadi dan penentuan hak atas data.

Saat ini, pengguna Copilot Business, Enterprise yang terikat oleh ketentuan kontrak serta pengguna versi pendidikan sementara tidak terdampak oleh perubahan ini. GitHub dalam penjelasannya menekankan, langkah ini sesuai dengan praktik industri umum yang dilakukan oleh perusahaan besar seperti Anthropic, JetBrains, dan Microsoft. Namun, memasukkan kode repositori pribadi ke dalam set pelatihan pada dasarnya menantang batas konsep "pribadi" tradisional, meskipun GitHub mengklaim tujuannya adalah untuk mengoptimalkan alur kerja pengembangan.

Dari perspektif industri, seiring dengan menipisnya data kode domain publik berkualitas tinggi, vendor AI terkemuka sedang mempercepat peralihan ke penambangan data interaksi pribadi dan "data dalam" lainnya untuk mencari keuntungan kinerja model. Perubahan kebijakan ini tidak hanya menandai kemiringan lebih lanjut GitHub dari platform hosting sumber terbuka ke ekosistem pelatihan AI yang tertutup, tetapi juga mengisyaratkan bahwa bidang alat pengembang AI sedang memasuki tahap baru permainan antara kepatuhan data dan evolusi model.

Pertanyaan Terkait

QMulai kapan GitHub akan menggunakan data pengguna Copilot untuk melatih model AI secara default?

AGitHub akan mulai menggunakan data pengguna Copilot untuk melatih model AI secara default mulai 24 April 2026.

QJenis data apa saja yang akan dikumpulkan GitHub dari pengguna Copilot?

AData yang dikumpulkan mencakup input dan output model, cuplikan kode, informasi konteks, struktur repositori, dan riwayat interaksi obrolan.

QBagaimana cara pengguna Copilot Free, Pro, dan Pro+ untuk tidak ikut serta dalam pengumpulan data ini?

APengguna harus secara manual masuk ke pengaturan privasi dan menonaktifkan opsi yang relevan untuk memilih keluar (opt-out), karena kebijakan ini menggunakan mekanisme 'opt-out'.

QApakah semua jenis pengguna Copilot akan terkena kebijakan baru ini?

ATidak. Pengguna Copilot Business, Enterprise, dan pengguna versi pendidikan tidak akan terkena dampak perubahan kebijakan ini karena terikat oleh ketentual kontrak yang berbeda.

QApa alasan utama GitHub menerapkan kebijakan penggunaan data pengguna ini menurut pernyataan resmi mereka?

AMenurut GitHub, pengenalan data interaksi ini bertujuan untuk meningkatkan akurasi dan keamanan saran kode yang diberikan oleh model AI mereka, yang telah diuji sebelumnya dengan data internal Microsoft dan berhasil meningkatkan tingkat penerimaan saran.

Bacaan Terkait

Trading

Spot
Futures
活动图片