GitHub Umumkan Mulai 24 April Akan Data Pengguna Copilot untuk Melatih Model AI Secara Default

marsbitDipublikasikan tanggal 2026-03-26Terakhir diperbarui pada 2026-03-26

Abstrak

GitHub mengumumkan akan memperbarui kebijakan repositorinya mulai 24 April 2026, dengan rencana memanfaatkan data interaksi pengguna untuk melatih model AI-nya. Pengumpulan data ini mencakup pengguna Copilot Free, Pro, dan Pro+, termasuk input dan output model, cuplikan kode, informasi konteks, struktur repositori, serta riwayat interaksi obrolan. Kebijakan ini menerapkan mekanisme "opt-out", yang berarti pengguna yang terkena dampak harus menonaktifkan opsi terkait secara manual melalui pengaturan privasi jika ingin mengecualikan datanya. Namun, pengguna Copilot Business, Enterprise, dan versi pendidikan tidak terpengaruh oleh perubahan ini karena terikat oleh ketentuan kontrak. GitHub menyatakan bahwa langkah ini bertujuan meningkatkan akurasi dan keamanan saran kode dari model AI, seraya menegaskan bahwa praktik tersebut sejalan dengan standar industri yang umum diikuti oleh Anthropic, JetBrains, dan Microsoft. Namun, kebijakan ini memicu diskusi luas di komunitas pengembang mengenai definisi repositori pribadi dan kepemilikan data.

GitHub baru-baru ini mengumumkan akan memperbarui kebijakan repositori kodenya mulai 24 April 2026, berencana memanfaatkan data interaksi pengguna untuk melatih model AI-nya. Cakupan pengumpulan data ini mencakup pengguna Copilot Free, Pro, dan Pro+, secara spesifik mencakup masukan dan keluaran model, potongan kode, informasi konteks, struktur repositori, serta catatan interaksi obrolan.

Kepala Produk GitHub, Mario Rodriguez, menyatakan bahwa pengenalan data interaksi bertujuan untuk meningkatkan akurasi dan keamanan saran kode model, dan menyebut bahwa pengujian awal data internal Microsoft telah secara signifikan meningkatkan tingkat penerimaan saran. Perlu dicatat, kebijakan ini menerapkan mekanisme "opt-out", di mana pengguna yang terdampak harus secara manual masuk ke pengaturan privasi dan menonaktifkan opsi terkait untuk keluar, hal ini memicu diskusi luas di komunitas pengembang mengenai definisi repositori pribadi dan penentuan hak atas data.

Saat ini, pengguna Copilot Business, Enterprise yang terikat oleh ketentuan kontrak serta pengguna versi pendidikan sementara tidak terdampak oleh perubahan ini. GitHub dalam penjelasannya menekankan, langkah ini sesuai dengan praktik industri umum yang dilakukan oleh perusahaan besar seperti Anthropic, JetBrains, dan Microsoft. Namun, memasukkan kode repositori pribadi ke dalam set pelatihan pada dasarnya menantang batas konsep "pribadi" tradisional, meskipun GitHub mengklaim tujuannya adalah untuk mengoptimalkan alur kerja pengembangan.

Dari perspektif industri, seiring dengan menipisnya data kode domain publik berkualitas tinggi, vendor AI terkemuka sedang mempercepat peralihan ke penambangan data interaksi pribadi dan "data dalam" lainnya untuk mencari keuntungan kinerja model. Perubahan kebijakan ini tidak hanya menandai kemiringan lebih lanjut GitHub dari platform hosting sumber terbuka ke ekosistem pelatihan AI yang tertutup, tetapi juga mengisyaratkan bahwa bidang alat pengembang AI sedang memasuki tahap baru permainan antara kepatuhan data dan evolusi model.

Pertanyaan Terkait

QMulai kapan GitHub akan menggunakan data pengguna Copilot untuk melatih model AI secara default?

AGitHub akan mulai menggunakan data pengguna Copilot untuk melatih model AI secara default mulai 24 April 2026.

QJenis data apa saja yang akan dikumpulkan GitHub dari pengguna Copilot?

AData yang dikumpulkan mencakup input dan output model, cuplikan kode, informasi konteks, struktur repositori, dan riwayat interaksi obrolan.

QBagaimana cara pengguna Copilot Free, Pro, dan Pro+ untuk tidak ikut serta dalam pengumpulan data ini?

APengguna harus secara manual masuk ke pengaturan privasi dan menonaktifkan opsi yang relevan untuk memilih keluar (opt-out), karena kebijakan ini menggunakan mekanisme 'opt-out'.

QApakah semua jenis pengguna Copilot akan terkena kebijakan baru ini?

ATidak. Pengguna Copilot Business, Enterprise, dan pengguna versi pendidikan tidak akan terkena dampak perubahan kebijakan ini karena terikat oleh ketentual kontrak yang berbeda.

QApa alasan utama GitHub menerapkan kebijakan penggunaan data pengguna ini menurut pernyataan resmi mereka?

AMenurut GitHub, pengenalan data interaksi ini bertujuan untuk meningkatkan akurasi dan keamanan saran kode yang diberikan oleh model AI mereka, yang telah diuji sebelumnya dengan data internal Microsoft dan berhasil meningkatkan tingkat penerimaan saran.

Bacaan Terkait

Mampukah DeepSeek Menghemat 1 Triliun Dolar untuk China?

**Ringkasan Artikel: Apakah DeepSeek Dapat Menghemat 1 Triliun Dolar AS untuk China?** Artikel ini membahas bagaimana DeepSeek, melalui serangkaian inovasi teknologinya, berpotensi secara drastis menekan biaya infrastruktur AI China dan berpotensi menghemat investasi hingga triliunan dolar AS. **Tantangan: Biaya AI yang Melonjak** Biaya perangkat keras AI, terutama memori berbandwidth tinggi (HBM), sedang meroket. Misalnya, pada sistem AI canggih NVIDIA Vera Rubin, biaya komponen memori saja mencapai sekitar $2 juta dan telah naik 435% dalam setahun. **Solusi DeepSeek: Tiga Inovasi Utama** DeepSeek mendekati masalah ini dengan tiga terobosan teknis utama untuk meningkatkan efisiensi token perangkat keras hingga 4 kali lipat: 1. **Kompresi Memori (KV Cache):** Melalui **Multi-head Latent Attention (MLA)**, DeepSeek mengompres "memori" konteks panjang model secara signifikan (hingga 90%+ pengurangan) tanpa mengorbankan kualitas, mengurangi ketergantungan pada HBM yang mahal. 2. **Aktivasi "Tubuh" Model Sesuai Kebutuhan:** Menggunakan arsitektur **Mixture of Experts (MoE)**, model hanya mengaktifkan sebagian kecil dari total parameternya untuk setiap tugas. Ini seperti hanya memanggil dokter spesialis yang relevan, bukan seluruh rumah sakit. 3. **Cache dan Penggunaan Ulang:** Hasil komputasi yang sudah dihitung disimpan dan digunakan kembali (cache hit), menghindari perhitungan berulang yang mahal. DeepSeek menerapkan ini bahkan dalam struktur harga layanannya. **Dampak dan Potensi Penghematan** Efisiensi ini mengubah ekonomi infrastruktur AI: * **Pengurangan Biaya Operasional:** Untuk tugas tertentu (misalnya, membaca ulang kode panjang), biaya menggunakan DeepSeek V4-Pro bisa **100 kali lebih murah** dibandingkan model seperti GPT-5.5 atau Claude Opus. * **Penghematan Infrastruktur Berskala Besar:** Artikel memperkirakan, dengan peningkatan efisiensi 4x, untuk memenuhi permintaan token harian masa depan China yang mencapai ribuan triliun, pendekatan DeepSeek berpotensi menghemat investasi setara dengan **puluhan ribu pusat komputasi cerdas**, yang nilainya bisa mendekati **$1 triliun**. * **Pergeseran Strategis:** Alih-alih hanya bergantung pada chip komputasi canggih (di mana China tertinggal), DeepSeek mengalihkan beban ke manajemen memori, cache, dan rekayasa sistem — area di mana industri China seperti produsen memori DRAM (contoh: CXMT) semakin kompetitif. Ini meningkatkan keamanan rantai pasokan. **Kesimpulan** DeepSeek tidak menghilangkan kebutuhan akan perangkat keras canggih, tetapi secara radikal mengurangi ketergantungan marjinal padanya. Dengan membuat AI lebih terjangkau melalui efisiensi teknis mendalam, DeepSeek berpotensi membentuk ulang buku besar infrastruktur AI China, menghemat investasi besar, dan yang terpenting, membuat daya AI dapat diakses oleh industri luas di China. *(Catatan: Artikel ini didasarkan pada analisis industri dan proyeksi, bukan fakta yang sudah pasti.)*

marsbit36m yang lalu

Mampukah DeepSeek Menghemat 1 Triliun Dolar untuk China?

marsbit36m yang lalu

Menggugat Gagasan Utama Menangani Halusinasi: Metakognisi, Solusi Baru untuk Menghancurkan Halusinasi Model Besar

Peneliti Google mengusulkan pendekatan baru untuk mengatasi "halusinasi" AI dalam makalahnya, **"Hallucinations Undermine Trust; Metacognition is a Way Forward."** Alih-alih berusaha membuat AI mengetahui segalanya atau menolak menjawab banyak pertanyaan (yang menimbulkan "pajak utilitas"), makalah ini mendefinisikan ulang halusinasi sebagai **AI memberikan informasi yang salah dengan keyakinan tinggi padahal ia tidak yakin.** Solusi intinya adalah **"ketidakpastian yang setia" (faithful uncertainty)** atau **metakognisi** – kemampuan AI untuk merasakan tingkat keyakinan internalnya dan mengekspresikannya dengan jujur dalam bahasa. Misalnya, jika AI ragu, ia harus mengatakan "Saya tidak terlalu yakin." Pendekatan ini lebih realistis karena hanya mengharuskan keselarasan antara sinyal internal dan output AI, bukan kebenaran mutlak yang mustahil. Metakognisi menjadi sangat penting di era **Agent AI** yang menggunakan alat eksternal seperti mesin pencari. Tanpanya, Agent tidak dapat memutuskan kapan harus mencari, kapan harus berhenti, atau bagaimana mengevaluasi informasi yang ditemukan. Namun, implementasinya menghadapi tantangan seperti **"paradoks bootstrap"** (data pelatihan yang statis untuk kemampuan dinamis), **"sinyak perusak keselarasan"** dari pelatihan RLHF yang mendorong AI selalu tampak yakin, dan kesulitan menilai apakah AI benar-benar memiliki metakognisi atau hanya berpura-pura. Makalah ini menyerukan perubahan paradigma: fokus pada pengembangan AI yang jujur tentang batas pengetahuannya, bukan AI yang sempurna tanpa kesalahan. Kepercayaan datang dari kejujuran tentang ketidakpastian, bukan dari klaim kepastian yang salah.

marsbit42m yang lalu

Menggugat Gagasan Utama Menangani Halusinasi: Metakognisi, Solusi Baru untuk Menghancurkan Halusinasi Model Besar

marsbit42m yang lalu

Belilah Emas dan Minyak untuk Hedging, AI untuk Pertumbuhan Cepat, Bitcoin yang 'Ketinggalan Zaman' Masuki Pasar Beruang

Bitcoin terus mengalami penurunan, mencapai level terendah dalam dua bulan di sekitar $66.123. Menurut analis, alasan di balik penurunan ini lebih dalam daripada sekadar aliran keluar dana ETF atau penjualan oleh Strategy. Inti masalahnya adalah Bitcoin kini kalah bersaing di tiga bidang utama. Pertama, sebagai lindung nilai inflasi, emas dan saham energi kini lebih disukai karena memiliki dukungan fisik dan logika yang lebih langsung. Kedua, untuk pertumbuhan tinggi, investor beralih ke perusahaan AI yang memiliki pendapatan dan laba nyata, di mana Bitcoin tidak menghasilkan arus kas. Ketiga, bahkan di dalam ekosistem kripto, eksposur kini dapat diperoleh melalui stablecoin, pertukaran, atau infrastruktur yang terkait dengan adopsi nyata, bukan hanya Bitcoin. Narasi "emas digital" Bitcoin tidak lagi mendapatkan reaksi positif otomatis terhadap kekhawatiran inflasi. Aliran keluar ETF dan penjualan oleh institusi mencerminkan gejala dari realitas baru: investor kini lebih selektif. Mereka memiliki lebih banyak pilihan dan mempertanyakan nilai tambah Bitcoin. Logika bearish baru untuk Bitcoin bukan lagi tentang penipuan atau kegagalan teknologi, melainkan bahwa kelangkaan saja tidak lagi cukup untuk menarik modal. Bitcoin terjepit di zona tengah yang canggung, bukan sebagai aset lindung nilai terbaik, aset pertumbuhan terbaik, atau satu-satunya pilihan kripto.

华尔街日报46m yang lalu

Belilah Emas dan Minyak untuk Hedging, AI untuk Pertumbuhan Cepat, Bitcoin yang 'Ketinggalan Zaman' Masuki Pasar Beruang

华尔街日报46m yang lalu

Terlewat Gelombang Kenaikan Saham AI, Sekarang Harus Bagaimana?

Penulis: Think AI, Aaron Saham AI telah naik selama tiga setengah tahun tanpa tanda-tanda berhenti. Mereka yang memperkirakan bubble AI atau kejatuhan pasar saham AS tahun lalu kini merenung. Pasar global menunjukkan kinerja kuat: indeks Korea telah circuit breaker 19 tahun ini, naik 4 kali lipat sejak tahun lalu. Saham SK Hynix naik 260%. Micron AS, raksasa memori, tembus valuasi $1 triliun. SoftBank Jepang, dengan taruhan besar pada AI, menjadi perusahaan bernilai tertinggi di Jepang. Di China, perusahaan seperti Yushu dan ChangXin akan masuk bursa dengan valuasi besar. Namun, situasi lain muncul: mereka yang meminjam untuk beli emas awal tahun masih rugi, saham konsumen China terus turun. Banyak investor merasa cemas karena melewatkan rally AI ini. Data menunjukkan, pada 2025, hanya 18.9% investor ritel A股 yang untung, 81.1% rugi. Saat pasar koreksi awal 2026, keyakinan pada AI goyah. Banyak institusi jual di titik terendah, seperti pemegang saham besar Zhongji Innolight yang jual RMB 4.9 miliar, lalu sahamnya naik 35%. Laporan menunjukkan kerugian potensial institusi karena jual terlalu awal di sektor komputasi AI bisa lebih dari RMB 200 miliar. Beberapa institusi yang bertahan justru salah arah, fokus pada aplikasi vertikal seperti AI pendidikan/kesehatan yang turun >20%, sementara sektor komputasi naik >50%. Di luar negeri, kesalahan serupa terjadi. Bridgewater jual besar-besaran saham seperti NVIDIA, Alphabet akhir 2025, tepat sebelum mereka rata-rata naik >80%. Posisi short di pasar AS mencapai level tertinggi sejak 2012. Warren Buffett juga banyak memegang kas, melewatkan rally AI. Namun, AI tetap dianggap sebagai peluang revolusioner paling pasti – bukan konsep jangka pendek, tapi revolusi infrastruktur seperti listrik atau internet. Bagi yang melewatkan gelombang pertama, masih ada peluang di lapisan aplikasi atau gelombang infrastruktur berikutnya. China punya ruang unik dalam pengembangan AI mandiri, penerapan, dan penyempurnaan rantai pasokan. Pemimpin industri memberikan perspektif. Ma Huateng (Tencent) menyatakan pentingnya fokus pada keunggulan sendiri di era AI, bukan sekadar mengejar tren. Jack Ma menyebut AI sebagai peluang revolusi industri setara penemuan listrik, dan era AI baru dimulai. Masih banyak peluang jangka panjang di sepanjang rantai industri, dari infrastruktur komputasi, platform model besar, hingga aplikasi AI sektoral. Peluang struktural berikutnya akan datang bagi mereka yang siap dan memiliki pola pikir stabil. Kuncinya adalah berpegang pada keunggulan sendiri dan berpikir jangka panjang.

marsbit1j yang lalu

Terlewat Gelombang Kenaikan Saham AI, Sekarang Harus Bagaimana?

marsbit1j yang lalu

Trading

Spot
Futures
活动图片