GitHub thông báo từ ngày 24/4 sẽ sử dụng dữ liệu người dùng Copilot làm mặc định để huấn luyện mô hình AI

marsbitXuất bản vào 2026-03-26Cập nhật gần nhất vào 2026-03-26

Tóm tắt

GitHub vừa thông báo sẽ cập nhật chính sách từ ngày 24/4/2026, sử dụng dữ liệu tương tác người dùng để huấn luyện mô hình AI. Dữ liệu thu thập bao gồm đầu vào/đầu ra mô hình, đoạn mã, thông tin ngữ cảnh, cấu trúc kho lưu trữ và lịch sử trò chuyện từ người dùng Copilot Free, Pro và Pro+. Chính sách mặc định áp dụng cơ chế "opt-out", yêu cầu người dùng chủ động tắt tùy chọn trong cài đặt riêng tư nếu muốn không tham gia. GitHub khẳng định việc này nhằm nâng cao độ chính xác và bảo mật của gợi ý mã, đồng thời tuân thủ thông lệ ngành từ các công ty như Microsoft hay Anthropic. Tuy nhiên, người dùng doanh nghiệp, giáo dục và tổ chức theo hợp đồng không bị ảnh hưởng. Động thái này đặt ra tranh luận về quyền sở hữu dữ liệu và định nghĩa lại khái niệm "riêng tư" trong kho mã, đánh dấu xu hướng chuyển đổi từ nền tảng mã nguồn mở sang hệ sinh thái AI khép kín của GitHub.

GitHub gần đây đã thông báo sẽ cập nhật chính sách kho lưu trữ mã từ ngày 24/4/2026, với kế hoạch sử dụng dữ liệu tương tác người dùng để huấn luyện mô hình AI của họ. Phạm vi thu thập dữ liệu này bao gồm người dùng Copilot Free, Pro và Pro+, cụ thể bao gồm đầu vào/đầu ra mô hình, đoạn mã, thông tin ngữ cảnh, cấu trúc kho lưu trữ và lịch sử tương tác trò chuyện.

Giám đốc sản phẩm GitHub Mario Rodriguez cho biết, việc đưa vào dữ liệu tương tác nhằm nâng cao độ chính xác và tính bảo mật của các đề xuất mã từ mô hình, đồng thời khẳng định rằng việc thử nghiệm trước với dữ liệu nội bộ Microsoft đã cải thiện đáng kể tỷ lệ chấp nhận đề xuất. Đáng chú ý, chính sách này áp dụng cơ chế "tham gia mặc định", người dùng bị ảnh hưởng phải thủ công vào cài đặt quyền riêng tư để tắt tùy chọn liên quan nếu muốn thoát, điều này đã khơi lên cuộc thảo luận sâu rộng trong cộng đồng nhà phát triển về định nghĩa kho lưu trữ riêng tư và quyền sở hữu dữ liệu.

Hiện tại, người dùng Copilot Business, Enterprise bị ràng buộc bởi điều khoản hợp đồng và người dùng phiên bản giáo dục tạm thời không bị ảnh hưởng bởi thay đổi này. GitHub trong phần giải thích nhấn mạnh, hành động này phù hợp với thông lệ ngành phổ biến của các đại gia như Anthropic, JetBrains và Microsoft. Tuy nhiên, việc đưa mã từ kho lưu trữ riêng tư vào tập huấn luyện trên thực tế đã thách thức ranh giới khái niệm "riêng tư" truyền thống, ngay cả khi GitHub tuyên bố mục đích của họ là tối ưu hóa quy trình làm việc phát triển.

Xét từ góc độ ngành, khi dữ liệu mã nguồn công cộng chất lượng cao dần cạn kiệt, các hãng AI hàng đầu đang tăng tốc chuyển hướng sang khai thác các "dữ liệu sâu" như dữ liệu tương tác riêng tư để tìm kiếm lợi thế về hiệu suất mô hình. Sự thay đổi chính sách này không chỉ đánh dấu bước nghiêng xa hơn nữa của GitHub từ nền tảng lưu trữ mã nguồn mở sang hệ sinh thái huấn luyện AI khép kín, mà còn báo trước lĩnh vực công cụ dành cho nhà phát triển AI đang bước vào một giai đoạn mới của cuộc đấu giữa sự tuân thủ dữ liệu và sự tiến hóa của mô hình.

Câu hỏi Liên quan

QGitHub thông báo sẽ sử dụng dữ liệu người dùng Copilot để huấn luyện AI từ thời điểm nào?

AGitHub sẽ bắt đầu sử dụng dữ liệu người dùng Copilot để huấn luyện mô hình AI từ ngày 24 tháng 4 năm 2026.

QNhững loại dữ liệu nào của người dùng sẽ được GitHub thu thập để huấn luyện AI?

ADữ liệu thu thập bao gồm đầu vào/đầu ra mô hình, đoạn mã, thông tin ngữ cảnh, cấu trúc kho lưu trữ và lịch sử tương tác trò chuyện.

QNgười dùng có thể từ chối không cho GitHub sử dụng dữ liệu của mình không?

ACó, người dùng có thể từ chối bằng cách thủ công vào cài đặt quyền riêng tư và tắt tùy chọn liên quan, vì chính sách này mặc định là 'tự động tham gia'.

QNhóm người dùng Copilot nào không bị ảnh hưởng bởi thay đổi chính sách này?

ANgười dùng Copilot Business, Enterprise và phiên bản giáo dục hiện không bị ảnh hưởng bởi thay đổi này do các điều khoản hợp đồng.

QLý do GitHub đưa ra để biện minh cho việc thu thập dữ liệu người dùng là gì?

AGitHub tuyên bố việc thu thập dữ liệu tương tác nhằm mục đích cải thiện độ chính xác và tính bảo mật của các đề xuất mã từ mô hình AI, đồng thời phù hợp với thông lệ ngành của các công ty lớn.

Nội dung Liên quan

Vụ hack Coldcard, một trong những vụ hack ví Bitcoin lớn nhất gần đây, đã bắt đầu một làn sóng tổn thất mới! Tổn thất đang tăng

Công ty Galaxy Research thông báo đã phát hiện đợt tấn công thứ ba nhắm vào các ví Bitcoin được tạo trên thiết bị Coldcard. Trong đợt này, 207,7294 BTC đã bị đánh cắp, nâng tổng số thiệt hại lên 1367,05 BTC (khoảng 88,6 triệu USD) từ 4585 địa chỉ. Hai đợt tấn công đầu tiên có đặc điểm tương tự, có thể do cùng một kẻ tấn công. Tuy nhiên, đợt thứ ba lại có nhiều khác biệt về hành vi (sử dụng địa chỉ P2WSH riêng lẻ, gộp nhiều địa chỉ nạn nhân...), khiến các nhà nghiên cứu cho rằng có thể là một kẻ tấn công khác hoặc cùng kẻ tấn công nhưng đã thay đổi công cụ. Số Bitcoin bị đánh cắp hiện vẫn nằm trong các địa chỉ do kẻ tấn công kiểm soát và chưa được chuyển đi. Phần lớn số ví bị ảnh hưởng có số dư dưới 1 BTC, cho thấy chủ yếu là ví cá nhân. Lỗ hổng trên phần mềm Coldcard bắt đầu từ tháng 3/2021, và tất cả Bitcoin bị đánh cắp đều được tạo sau thời điểm đó.

cryptonews.ru18 phút trước

Vụ hack Coldcard, một trong những vụ hack ví Bitcoin lớn nhất gần đây, đã bắt đầu một làn sóng tổn thất mới! Tổn thất đang tăng

cryptonews.ru18 phút trước

Trump Media bán thêm 2.628 BTC, khoản nắm giữ giảm xuống còn 4.261 BTC

Công ty Trump Media & Technology Group, chủ sở hữu của Truth Social, đã thực hiện một đợt bán Bitcoin (BTC) lớn khác. Theo dữ liệu từ Lookonchain dẫn nguồn Arkham, công ty đã chuyển 2.628 BTC (trị giá khoảng 165 triệu USD) tới sàn Crypto.com vào Chủ nhật. Đây là một phần trong chuỗi giao dịch bán kéo dài 7 tháng qua. Tính tổng cộng, Trump Media đã bán 7.281 BTC với giá bán trung bình khoảng 74.855 USD/BTC, thu về xấp xỉ 545 triệu USD. Số Bitcoin còn lại trong kho của công ty theo báo cáo là 4.261 BTC, tương đương 269,8 triệu USD. Các giao dịch này diễn ra trong bối cảnh các hoạt động tiền mã hóa liên quan đến cựu Tổng thống Donald Trump đang chịu sự giám sát về đạo đức. Các nhà lập pháp Mỹ đang tranh luận về Đạo luật CLARITY, nhằm siết chặt các quy tắc đạo đức, sở hữu tài sản số và ngăn ngừa xung đột lợi ích đối với các quan chức công quyền, bao gồm cả những lo ngại về các dự án crypto của ông Trump.

cointelegraph37 phút trước

Trump Media bán thêm 2.628 BTC, khoản nắm giữ giảm xuống còn 4.261 BTC

cointelegraph37 phút trước

Phúc Kiến Tấn Giang, một kỳ lân công nghệ lưu trữ siêu cấp im lặng vươn lên

Những ngày này, khi Trường Tân Công nghệ Hợp Phì lên sàn A, và Trường Giang Tích Trữ Vũ Hán đang trong giai đoạn chuẩn bị IPO, một "kỳ lân siêu cấp" trong lĩnh vực bộ nhớ vẫn lặng lẽ hoạt động tại Tấn Giang, Phúc Kiến - Công ty TNHH Mạch tích hợp Tấn Hoa Phúc Kiến (Phúc Kiến Tấn Hoa). Từng là một trong ba trụ cột sản xuất chip bộ nhớ trong nước cùng với Trường Giang Tích Trữ và Trường Tân Công nghệ, thậm chí có thời điểm được đánh giá cao hơn, nhưng số phận của Tấn Hoa lại không suôn sẻ. Ngay trước khi sản phẩm ra đời, công ty đã bị Bộ Thương mại Mỹ đưa vào danh sách đen và đối mặt với cáo trạng hình sự từ Bộ Tư pháp Mỹ vào năm 2018, khiến dây chuyền sản xuất đình trệ. Phải đến tháng 2/2024, tòa án liên bang Mỹ mới tuyên án vô tội, kết thúc 6 năm vướng vào tranh chấp. Nhân vật then chốt đằng sau Tấn Hoa là Trần Chính Khôn, cựu kỹ sư của Micron. Với khát vọng phát triển công nghệ DRAM tự chủ, ông đã dẫn dắt đội ngũ hợp tác với United Microelectronics Corporation (UMC) của Đài Loan. Dù vấp phải lệnh trừng phạt nghiêm trọng, nhóm của ông vẫn kiên trì tái thiết dây chuyền sản xuất, tối ưu hóa thiết bị trong nước để giảm thiểu sự phụ thuộc vào công nghệ Mỹ. Hiện tại, Tấn Hoa tập trung vào thị trường DRAM chuyên biệt (niche DRAM), với sản phẩm ứng dụng trong TV thông minh, thiết bị mạng và công nghiệp. Năng lực sản xuất ổn định ở mức khoảng 40.000 tấm wafer 12-inch mỗi tháng, dự kiến mở rộng lên 60.000 vào năm 2026. Dù vậy, công ty vẫn nằm trong danh sách đen của Mỹ. Sự tồn tại và phục hồi của Tấn Hoa có sự hậu thuẫn mạnh mẽ từ chính quyền địa phương Tấn Giang - một thành phố vốn nổi tiếng với giày thể thao và thực phẩm. Thành phố này đã mạnh dạn đầu tư vào ngành công nghiệp bán dẫn, coi Tấn Hoa là hạt nhân để xây dựng cụm công nghiệp mạch tích hợp hoàn chỉnh, với tổng vốn đầu tư hàng trăm tỷ nhân dân tệ. Sự kiên định của chính quyền trong việc hỗ trợ Tấn Hoa vượt qua khủng hoảng là minh chứng cho chiến lược phát triển công nghiệp mới đầy tham vọng của Tấn Giang. Dù quy mô và doanh thu hiện tại (khoảng 2 tỷ nhân dân tệ/năm) còn cách xa các đối thủ trong nước, Tấn Hoa đại diện cho một thực tế: một doanh nghiệp từng bị siết chặt vẫn có thể đứng dậy. Trong chu kỳ siêu tăng trưởng mới của ngành bộ nhớ được AI thúc đẩy, Tấn Hoa vẫn giữ được vị trí trên bàn chơi.

marsbit1 giờ trước

Phúc Kiến Tấn Giang, một kỳ lân công nghệ lưu trữ siêu cấp im lặng vươn lên

marsbit1 giờ trước

38GW thiếu hụt điện năng: Vì sao các trang trại Bitcoin đột nhiên trở thành 'cánh cửa' mới tiếp cận năng lực tính toán AI?

Khi nhu cầu điện cho trung tâm dữ liệu AI tại Mỹ được dự báo thiếu hụt khoảng 38GW trong giai đoạn 2026-2028, các trang trại khai thác Bitcoin cũ đang nổi lên như một lối tiếp cận mới cho hạ tầng điện toán. Nhiều công ty khai thác tiền mã hóa như TeraWulf, Hut 8... đang chuyển hướng sang mô hình "Nhà cung cấp vỏ trung tâm dữ liệu có sẵn điện" (Powered Shell Provider). Họ tận dụng lợi thế sẵn có về chỉ tiêu hòa lưới điện, đất đai và trạm biến áp để cung cấp cơ sở hạ tầng cơ bản cho các nhà khai thác đám mây và AI. Giá trị cốt lõi nằm ở khả năng rút ngắn đáng kể thời gian triển khai, khi việc xin phép hòa lưới điện mới có thể mất 5-7 năm. Theo phân tích của Morgan Stanley, việc cải tạo các trang trại Bitcoin cũ có khả năng đóng góp 10-19GW công suất, giúp lấp đầy một phần đáng kể khoảng trống điện năng. Sự chuyển đổi này đang định nghĩa lại giá trị của mỗi watt điện, không chỉ cho tiền mã họa mà còn cho cả ngành công nghiệp AI đang khát năng lượng.

华尔街日报1 giờ trước

38GW thiếu hụt điện năng: Vì sao các trang trại Bitcoin đột nhiên trở thành 'cánh cửa' mới tiếp cận năng lực tính toán AI?

华尔街日报1 giờ trước

Michael Saylor: 'Chúng tôi chưa bao giờ nói rằng sẽ không bao giờ bán Bitcoin'

Chủ tịch MicroStrategy, Michael Saylor, đã làm rõ rằng công ty chưa từng cam kết sẽ không bao giờ bán Bitcoin (BTC) của mình, mặc dù kỳ vọng vẫn sẽ là nhà mua ròng BTC trong dài hạn. Tuyên bố được đưa ra sau các báo cáo về việc MicroStrategy nhận được một sự cho phép mới để bán BTC trị giá tới 5 tỷ USD. Saylor phủ nhận thông tin này, nói rằng sự cho phép không phải là mới và đã được công bố từ ngày 29/6 như một phần trong hệ thống quản lý vốn của công ty. Ông nhấn mạnh rằng thỏa thuận này cho phép việc bán BTC vì các mục đích cụ thể nhưng không bắt buộc công ty phải bán. MicroStrategy không công bố bất kỳ sự cho phép mới nào và vẫn dự kiến tiếp tục là bên mua ròng Bitcoin. Saylor cũng nói thêm rằng chương trình kiếm tiền từ Bitcoin của MicroStrategy không yêu cầu bán tài sản BTC và công ty chưa từng chính thức thông qua chính sách "sẽ không bao giờ bán BTC".

cryptonews.ru2 giờ trước

Michael Saylor: 'Chúng tôi chưa bao giờ nói rằng sẽ không bao giờ bán Bitcoin'