Mỗi ngày có khoảng 500.000 giờ lao động của con người được Google sử dụng miễn phí. Và những người đóng góp chỉ đơn giản là muốn đăng nhập vào ngân hàng trực tuyến.
reCAPTCHA là chiến dịch vận hành dữ liệu tàng hình thành công nhất trong lịch sử Internet. Vào thời điểm đỉnh cao, mỗi ngày có 200 triệu người hoàn thành xác minh. Nhưng hầu như không ai nhận ra, mỗi lần nhấp chuột đằng sau đó có ý nghĩa gì.
Công ty xe tự lái Waymo của Google, hiện có định giá thị trường là 450 tỷ USD. Và phần lớn dữ liệu huấn luyện cốt lõi của nó đều do bạn cung cấp miễn phí khi truy cập các trang web khác nhau.
Dưới đây là câu chuyện đầy đủ:
Khởi nguồn: Một ý tưởng thông minh
Năm 2000, robot thư rác đang tàn phá Internet. Diễn đàn bị spam, hộp thư đến bị bão hòa, các trang web cần khẩn cấp một phương pháp để phân biệt con người với máy móc.
Giáo sư Luis von Ahn từ Đại học Carnegie Mellon đã giải quyết vấn đề này. Ông đã phát minh ra CAPTCHA: một dòng chữ bị biến dạng chỉ con người có thể đọc được, robot không thể vượt qua.
Nhưng von Ahn nhìn thấy nhiều hơn thế. Hàng triệu người đang tiêu tốn sức lực vào những thử thách này. Vậy nếu nỗ lực này có thể đồng thời làm được hai việc thì sao?
Năm 2007, ông lại cho ra mắt reCAPTCHA. Điều tinh tế của nó là: nó không hiển thị các ký tự ngẫu nhiên nữa, mà hiển thị hai từ. Một từ hệ thống đã biết, từ còn lại là văn bản thật từ sách được quét mà máy tính chưa thể nhận dạng. Và câu trả lời của bạn đã giúp số hóa những cuốn sách này.
Những cuốn sách này đến từ kho lưu trữ của The New York Times và Google Books, lên tới 130 triệu cuốn.
Bạn tưởng mình chỉ đang đăng nhập vào một trang web bình thường, nhưng thực ra bạn đang thực hiện OCR (nhận dạng ký tự quang học) cho thư viện kỹ thuật số lớn nhất toàn cầu.
Năm 2009, Google chính thức mua lại reCAPTCHA.
Về sau, Google đã thay đổi cách chơi
Kỷ nguyên của những "dòng chữ biến dạng" đã kết thúc vào khoảng năm 2012.
Google lại gặp phải thách thức mới: xe Street View chụp ảnh mọi con đường trên toàn cầu, nhưng những bức ảnh chỉ là dữ liệu thô. Để AI phát huy tác dụng, nó cần hiểu những gì nó thấy: biển báo đường, vạch kẻ đường dành cho người đi bộ, đèn giao thông, mặt tiền cửa hàng.
Vì vậy Google đã thiết kế lại reCAPTCHA v2. Trong khung hình không có chữ viết biến dạng, mà là lưới ảnh. "Nhấp vào tất cả các ô có đèn giao thông." "Chọn mọi vạch kẻ đường dành cho người đi bộ." "Nhận diện mặt tiền cửa hàng."
Những hình ảnh này trực tiếp từ Google Street View. Cú nhấp chuột của bạn chính là nhãn dán.
Mỗi lần lựa chọn đang nói với mô hình thị giác máy tính của Google: cụm pixel này là đèn giao thông, hình dạng kia là vạch kẻ đường dành cho người đi bộ. Bạn không phải đang vượt qua bài kiểm tra, bạn đang xây dựng bộ dữ liệu.
Quy mô vượt quá tưởng tượng
Vào thời kỳ đỉnh cao, mỗi ngày có 200 triệu reCAPTCHA được giải. Mỗi thử thách mất 10 giây, điều này có nghĩa là mỗi ngày tạo ra 2 tỷ giây lao động của con người. Tức là: 500.000 giờ mỗi ngày.
Chi phí gắn nhãn dữ liệu có trả phí vào khoảng 10 đến 50 USD mỗi giờ. Tính theo mức tối thiểu: giá trị lao động được trích lũy miễn phí mỗi ngày lên tới 5 triệu USD.
Và reCAPTCHA không chỉ tồn tại trong một ứng dụng nào đó. Nó có mặt ở mọi ngân hàng, mọi cổng thông tin chính phủ, mọi trang web thương mại điện tử. Bạn không có lựa chọn nào khác: muốn đăng nhập tài khoản? Trước tiên hãy gắn nhãn bộ dữ liệu. Google chưa bao giờ hỏi ý kiến bạn, chưa trả một đồng lương nào, thậm chí chưa bao giờ nói với bạn về việc này.
Tất cả điều này đã tạo nên cái gì?
Những dữ liệu này được đưa trực tiếp vào hai sản phẩm:
- Google Maps: Công cụ định vị được sử dụng phổ biến nhất toàn cầu. Khả năng nhận dạng biển báo đường, cửa hàng và địa lý thành phố của nó, một phần là nhờ vào hàng tỷ lần gắn nhãn của con người khi đăng nhập trang web.
- Waymo: Dự án xe không người lái của Google. Để định vị an toàn, xe không người lái cần nhận dạng gần như hoàn hảo hàng nghìn mẫu hình thị giác.
Dữ liệu huấn luyện chân lý cho những công việc nhận dạng đó chính xác là do hàng triệu người gắn nhãn thông qua reCAPTCHA mà không hề hay biết. Waymo vào năm 2024 đã hoàn thành hơn 4 triệu chuyến đi trả phí, định giá 450 tỷ USD. Nền tảng của nó, chính là do những "cư dân Internet không được trả công" chỉ muốn kiểm tra email xây nên.
Tại sao không ai có thể sao chép mô hình này?
Việc gắn nhãn dữ liệu cực kỳ đắt đỏ. Các công ty như Scale AI, Appen và Labelbox tồn tại là để giải quyết vấn đề này, họ thuê hàng trăm nghìn công nhân, đôi khi với mức lương dưới 1 USD một giờ.
Giải pháp của Google đi theo một hướng khác: họ biến việc gắn nhãn trở thành bắt buộc. Không cần trả phí, không cần được đồng ý, mà là "vé vào cửa" để bước vào mọi ngóc ngách của Internet. Kết quả là: hàng tỷ hình ảnh được gắn nhãn, phủ sóng toàn cầu, thời tiết suốt ngày đêm, mọi thành phố trên thế giới. Không có công ty gắn nhãn nào có thể làm được điều này. Bản thân Internet là nhà máy, mỗi cư dân mạng là nhân viên chưa ký hợp đồng.
Bạn đến nay vẫn đang tham gia
reCAPTCHA v3 ra mắt năm 2018 thậm chí không còn hiển thị thử thách. Nó quan sát cách bạn di chuyển chuột, tốc độ cuộn, thời gian dừng. Dấu vết hành vi của bạn sẽ cho nó biết bạn có phải là con người hay không. Dữ liệu hành vi này cũng sẽ phản hồi lại hệ thống AI của Google.
Bạn chưa bao giờ chủ động chọn tham gia, chưa bao giờ có một hộp kiểm để bạn đánh dấu. Nhưng ngay lúc này, trên hầu hết các trang web bạn truy cập, bạn vẫn đang làm như vậy.
Sự mỉa mai đáng lo ngại
Mục đích ban đầu của Luis von Ahn là thiên tài: Biến sức lực vốn đang bị lãng phí của con người thành sản phẩm hữu ích. Nhưng những gì Google làm với tầm nhìn đó lại là chuyện khác. Họ đã lợi dụng cơ chế bảo mật mà người dùng bắt buộc phải sử dụng, triển khai nó trên toàn mạng, thu hoạch đầu ra để xây dựng các sản phẩm thương mại trị giá hàng trăm tỷ USD. Người dùng không nhận được gì, thậm chí không hề hay biết.
Sự mỉa mai sâu sắc nhất là: Bạn đã dành nhiều năm để chứng minh mình là con người, bằng cách hoàn thành công việc nhận dạng hình ảnh mà lúc đó AI chưa thể làm được. Và một khi AI đã học được những điều đó, việc gắn nhãn thị giác của con người sẽ không còn được cần đến nữa.
Bạn đã chứng minh mình là con người, nhưng kết quả lại khiến chính mình có thể bị thay thế.












