Tác giả: Vaidik Mandloi
Biên dịch: Luffy, Foresight News
Từ khi ra mắt vào cuối năm 2022, ChatGPT đã phát triển cho đến nay, thúc đẩy sự hình thành của một hệ sinh thái AI tác nhân thông minh khổng lồ. Hiện tại, tổng lưu lượng mạng do các chương trình loại này tạo ra đã vượt qua tất cả người dùng trên toàn cầu. Hành vi lướt web của AI thông minh hoàn toàn khác biệt so với con người: chúng không xem quảng cáo, không nhấp vào liên kết, cũng không mua sắm trực tuyến, mà chỉ thu thập dữ liệu mạng để hoàn thành nhiệm vụ, sau đó rời đi ngay khi nhiệm vụ kết thúc.
Kiến trúc và logic kinh doanh ban đầu của internet được xây dựng xung quanh hành vi và thói quen sử dụng của con người. Nhưng ngày nay, phần lớn hoạt động truy cập mạng không đến từ người thật, điều này khiến các trang web lớn gặp nhiều khó khăn. Hiện đã có 2,5 triệu trang web bắt đầu chặn các chương trình thu thập dữ liệu AI, và các nền tảng như Perplexity cũng vướng vào các vụ kiện liên quan. Nhà cung cấp dịch vụ đám mây Cloudflare thậm chí đã xây dựng "mê cung mật ong", sử dụng văn bản vô nghĩa được tạo bởi AI để tạo ra các trang web lặp vô hạn, nhằm giam giữ các công cụ thu thập dữ liệu.
Nhưng một số tác nhân AI cao cấp đã có khả năng vượt qua các biện pháp bảo vệ này. Trước tình trạng đối đầu giữa người và máy ngày càng gay gắt, toàn ngành đang tập trung nghiên cứu và phát triển một cơ chế xác minh danh tính người thật đáng tin cậy hơn. Hệ thống này cần xác định chính xác liệu người thao tác ở đầu kia màn hình có phải là con người hay không: khi người thật thao tác, sẽ có sự do dự, gõ sai, và chuyển động con trỏ cũng sẽ có những rung động nhỏ đặc trưng của hệ thần kinh con người. Bài viết này sẽ phân tích nguyên nhân đằng sau cuộc cách mạng này, hai giải pháp công nghệ chính, cũng như những lựa chọn mà mọi người sắp phải đối mặt: chấp nhận giám sát sinh trắc học tập trung, hay sử dụng công nghệ chứng minh không tiết lộ thông tin (zero-knowledge proof) để thực hiện xác minh danh tính người thật ẩn danh.
AI làm đảo lộn mô hình kinh doanh internet
Các trang web đồng loạt bắt đầu chặn chương trình AI, nguyên nhân gốc rễ nằm ở việc AI đồng thời tấn công vào cả hai đầu, phá vỡ nền tảng kinh doanh mà internet dựa vào để tồn tại. Logic lợi nhuận của internet truyền thống được xây dựng dựa trên sự chú ý của người dùng: người dùng truy cập trang, xem quảng cáo, và nhà phát hành nội dung sẽ nhận được doanh thu. Nếu để AI thay mặt mua sắm trực tuyến, nó sẽ tìm kiếm năm nghìn trang web cùng một lúc, trong khi người bình thường thường chỉ xem bốn hoặc năm trang.
Tốc độ đọc của AI vượt xa con người, chỉ trong vài phút có thể hoàn thành việc so sánh giá toàn mạng và thậm chí đặt hàng trực tiếp, toàn bộ quá trình không tạo ra bất kỳ lượt xem quảng cáo nào. Điều này có nghĩa là các trang web phải gánh chịu chi phí vận hành máy chủ một cách vô ích, mà không nhận được bất kỳ lợi ích nào.
Đồng thời, tìm kiếm AI cũng đang liên tục phân tán lưu lượng truy cập trang web. Sau khi Google thêm khối tóm tắt thông minh AI vào đầu kết quả tìm kiếm, chỉ có 8% người dùng nhấp vào để vào trang web gốc, lưu lượng truy cập dẫn hướng mà các trang web nội dung lớn nhận được từ Google đã giảm trực tiếp 33%. Tính năng này chỉ mới ra mắt một năm, người dùng hoạt động hàng tháng đã vượt 1 tỷ, và lượng tìm kiếm trên nền tảng đã tăng gấp đôi mỗi quý kể từ khi ra mắt.
Chắc hẳn mọi người vẫn nhớ nền tảng giải đáp học tập Chegg. Ban đầu, nó dựa vào lợi thế xếp hạng tìm kiếm để kinh doanh chính trong lĩnh vực hỏi đáp bài tập, nhưng giờ đây đã chính thức đóng cửa mảng hỏi đáp, và đổ lỗi nguyên nhân đóng cửa cho sự tác động của ChatGPT. Những người làm nội dung đang rơi vào tình thế bị kẹp từ hai phía: một mặt, các công cụ thu thập dữ liệu tự do thu thập nội dung trong trang, mặt khác, tóm tắt AI chặn lưu lượng truy cập trước khi người dùng đến được trang web.
Khoảng cách dữ liệu còn đáng kinh ngạc hơn, cứ mỗi lần công cụ thu thập dữ liệu của OpenAI mang lại một lưu lượng chuyển tiếp cho trang web hợp tác, trước đó nó đã thu thập dữ liệu từ 400 trang; tỷ lệ này của Anthropic thậm chí đạt 38000:1. Những doanh nghiệp này sử dụng dữ liệu công khai toàn mạng để huấn luyện mô hình AI mà không trả phí, sau đó lại sử dụng sản phẩm hoàn thiện để phân tán lưu lượng vốn thuộc về các trang web.
Nếu ở các ngành khác, hành vi thu thập dữ liệu kiểu cướp bóc như vậy đã dẫn đến vô số vụ kiện, nhưng trong lĩnh vực AI, những doanh nghiệp này lại có thể đạt được định giá nghìn tỷ.
Cơ thể bạn chính là mật khẩu mới
Trong 25 năm qua, internet chủ yếu dựa vào CAPTCHA để phân biệt người và máy. Mọi người cần nhận biết biển báo giao thông, nhập ký tự méo mó, cơ chế này hiệu quả vì khả năng nhận dạng hình ảnh của máy móc thời kỳ đầu kém xa con người.
Nhưng tình hình hiện nay đã đảo ngược hoàn toàn. Chương trình thao tác thông minh thuộc sở hữu của OpenAI đạt điểm số mô phỏng người thật trong hệ thống xác minh người-máy của Google vượt xa con người, có thể nhấp chính xác vào giao diện, sao chép và dán nội dung; ảnh do AI tạo ra có thể lừa được hệ thống xác minh danh tính, cuộc gọi video deepfake thậm chí còn bị kẻ xấu sử dụng để hoàn tất chuyển khoản ngân hàng. Tiền đề thiết kế của các phương thức xác minh truyền thống – khả năng máy móc yếu hơn con người, đã không còn tồn tại.
Ngành công nghiệp hiện nay chỉ có thể tập trung vào lĩnh vực mà AI tạm thời chưa thể sao chép. Đặc điểm hành vi cơ thể của con người khi thao tác thiết bị điện tử, chính là công nghệ nhận dạng sinh trắc học hành vi. Các doanh nghiệp như IBM, BioCatch đều đang nghiên cứu và phát triển hệ thống liên quan, công nghệ này không chỉ xác minh danh tính ở bước đăng nhập, mà còn giám sát trạng thái sử dụng của người dùng trong suốt quá trình, thu thập các chiều dữ liệu bao gồm tốc độ di chuyển con trỏ, cách thức cuộn trang, nhịp độ gõ phím, lực nhấn phím, thói quen sửa chữa văn bản, góc cầm điện thoại, v.v., con quay hồi chuyển của điện thoại sẽ ghi lại thông tin liên quan trong suốt quá trình.
Hệ thống còn có thể nhận diện các chi tiết như tay thuận của người dùng, quỹ đạo trượt ngón tay. IBM chỉ cần thu thập dữ liệu sử dụng tám lần là có thể thiết lập hồ sơ hành vi riêng cho người dùng, sau đó sẽ so sánh từng thao tác với dữ liệu chuẩn trong thời gian thực.
Công nghệ của BioCatch thậm chí có thể nhận diện các tình huống lừa đảo trên mạng. Khi nạn nhân đọc tài khoản và mật khẩu theo hướng dẫn qua điện thoại của kẻ lừa đảo, nhịp độ gõ phím hỗn loạn, ngắt quãng sẽ được hệ thống bắt chính xác. Chỉ trong vòng một năm, hệ thống này đã hỗ trợ 257 ngân hàng xác định khoảng 2 triệu tài khoản rửa tiền. Hiện nay Liên minh Châu Âu cũng bắt đầu thử nghiệm công nghệ nhận dạng dáng đi. Kỷ nguyên tác nhân AI thông minh mới chỉ mở ra ba năm, nhân viên biên phòng EU đã bắt đầu thu thập tư thế đi lại của người dân.
Nghiên cứu liên quan còn kết hợp hiệu ứng Stroop: khi từ "màu xanh lam" được viết bằng phông chữ màu xanh lục, não người sẽ phản ứng chậm hơn rõ rệt do xung đột giữa ý nghĩa từ ngữ và màu sắc trực quan, nhưng AI không bị ảnh hưởng. Nghiên cứu phát hiện, sự nhiễu loạn nhận thức này sẽ trực tiếp thể hiện trên hành vi gõ phím. Nền tảng thậm chí không cần đưa ra bài kiểm tra chuyên biệt, chỉ dựa vào nhịp độ gõ phím, là có thể phán đoán người thao tác có phải là con người hay không; trong thói quen đánh máy, ẩn chứa đặc điểm xử lý thông tin độc đáo của não người.
Theo dõi mạng trước đây, chủ yếu ghi lại hành vi duyệt web, nhấp chuột, tiêu dùng của người dùng, người dùng có thể tránh né bằng cách chặn Cookie, sử dụng mạng riêng ảo, tắt chức năng định vị. Nhưng nhận dạng sinh trắc học hành vi thu thập là đặc điểm bản năng của cơ thể con người: cách di chuyển con trỏ, nhịp độ gõ phím đều khó thay đổi một cách nhân tạo.
Đặc điểm hành vi của mỗi người đều độc nhất vô nhị như dấu vân tay. Khác với mật khẩu, khóa, hồ sơ sinh trắc học này không thể thay đổi, đặt lại. Một khi công nghệ này được phổ cập rộng rãi, các nền tảng lớn sẽ buộc phải theo kịp để thích ứng. Hiện nay công nghệ mô phỏng giọng nói đã có thể giả mạo hoàn hảo trong cuộc gọi, công nghệ deepfake video cũng theo sát phía sau. Nếu đây là tương lai, vấn đề cốt lõi nhất sẽ nổi lên: những dữ liệu cơ thể con người này, cuối cùng sẽ do ai kiểm soát?
Ai sẽ kiểm soát hệ thống xác minh người thật
Hiện nay ngành công nghiệp chia thành hai phe chính, lần lượt khám phá giải pháp xác minh danh tính người thật.
Thứ nhất là World của Sam Altman (tiền thân là Worldcoin). Người dùng cần đến trước thiết bị quét mống mắt hình cầu, thiết bị thu thập thông tin mống mắt và tạo chứng chỉ mã hóa, để chứng minh người dùng là cá nhân tự nhiên độc nhất. Hiện tại, 18 triệu người từ 160 quốc gia trên toàn cầu đã hoàn thành đăng ký mống mắt. Tháng 4 năm 2026, World lần lượt hợp tác với ứng dụng hẹn hò Tinder, nền tảng hội nghị truyền hình Zoom, nhà cung cấp dịch vụ chữ ký điện tử DocuSign để xác minh người dùng; cũng hợp tác với Coinbase ra mắt công cụ AgentKit, người dùng có thể liên kết tác nhân AI của mình với danh tính thực, nền tảng vừa có thể xác nhận có chủ thể người thật đằng sau tác nhân thông minh, lại không tiết lộ thông tin cá nhân của người dùng.
Nhưng công nghệ quét mống mắt bị nhiều quốc gia cấm chỉ rõ ràng. Người dân không rõ việc ủy quyền thu thập dữ liệu sinh trắc học sẽ mang lại những rủi ro gì, đây là nguyên nhân cốt lõi khiến các quốc gia phản đối. Cuộc điều tra của MIT Technology Review còn phát hiện, World trong trường hợp chưa được ủy quyền hiệu lực, ngoài việc thu thập mống mắt, còn tự ý thu thập nhiều dữ liệu dấu hiệu sinh tồn của cơ thể như nhịp tim, hô hấp.
Loại thứ hai là dựa trên công nghệ chứng minh không tiết lộ thông tin (zero-knowledge proof), cho phép bạn chứng minh mình là con người mà không tiết lộ danh tính thật, vị trí hay diện mạo. Vitalik Buterin đã đề xuất ý tưởng này từ năm 2023. Ông cho rằng, nếu không thể xây dựng hệ thống danh tính người thật phi tập trung, internet cuối cùng sẽ đi đến quản lý danh tính tập trung. Quyền xác minh danh tính một khi bị doanh nghiệp hoặc chính phủ nắm giữ, cơ chế giám sát sẽ bén rễ vào tầng đáy của mạng.
Hệ thống danh tính người thật phi tập trung trước đây đã có nỗ lực triển khai quy mô lớn, nhưng cuối cùng lại thất bại. Idena là một trong những dự án blockchain công khai đầu tiên chủ trương "một người một danh tính", chỉ sau hai năm ra mắt, 40% tài khoản toàn mạng và 48% phần thưởng đã bị 23 tổ chức kiểm soát. Các đội ngũ vận hành tài khoản ở Ấn Độ, Nga, v.v., thuê người bình thường cho mượn danh tính với mức thù lao chưa đến một đô la một giờ, kiếm lợi nhuận cao nhất gấp 55 lần. Các nhà nghiên cứu còn phát hiện, thậm chí có thông tin danh tính trẻ em bị sử dụng làm tài khoản giả.
Vitalik trước đó đã dự đoán trước những rủi ro loại này. Ông nói, đối với hệ thống xác minh danh tính người thật, phương thức tấn công chi phí thấp nhất không phải là deepfake hay kỹ thuật hacker cao cấp, mà là trả tiền thuê người dân ở khu vực thu nhập thấp cho mượn danh tính cá nhân. Bất kỳ hệ thống xác minh danh tính người thật nào, cũng không thể tách rời sự hỗ trợ tài chính: thiết bị quét mống mắt, nút xác minh trên chuỗi đều cần đầu tư chi phí liên tục.
Nhưng một khi chứng chỉ danh tính được gán giá trị kinh tế, thị trường đen cho thuê danh tính sẽ nảy sinh. Trong thế giới thực chênh lệch giàu nghèo rõ rệt, những người mạnh về vốn luôn kiểm soát loại thị trường này.
"Trong hệ thống có khuyến khích kinh tế thực tế, việc cưỡng chế thực hiện quy tắc một người một phiếu, cuối cùng chỉ lặp lại vết xe đổ của các thí nghiệm xã hội liên quan thế kỷ XX."
Nhìn một cách khách quan, cả hai lộ trình phát triển đều tồn tại khiếm khuyết rõ ràng. Giải pháp tập trung có thể thực hiện triển khai quy mô hóa, nhưng dữ liệu sinh trắc học của người dùng sẽ được giao cho doanh nghiệp thu thập thông tin quá mức bảo quản, mà bản thân loại doanh nghiệp này lại có thể thu lợi từ tình trạng robot tràn lan. Lộ trình mã hóa về lý thuyết có thể bảo vệ quyền riêng tư, nhưng khó thoát khỏi vấn đề mất cân bằng kinh tế trong thực tế, cuối cùng bị ngành công nghiệp xám lợi dụng kẽ hở.
Nếu buộc tôi phải đặt cược, tôi vẫn sẽ đặt cược vào giải pháp mã hóa. Bởi vì công nghệ nhận dạng sinh trắc học hành vi và quét mống mắt tập trung sẽ ghi lại vĩnh viễn thông tin cơ thể bạn, và quyền sở hữu những thông tin này thuộc về người triển khai hệ thống đó. Một khi họ nắm giữ dữ liệu của bạn, bạn không thể xóa hoặc chuyển đi; những dữ liệu này sẽ bị khóa trong tay công ty thu thập nó.
Ngay cả khi biết rõ chứng minh không tiết lộ thông tin sẽ bị người khác lợi dụng kẽ hở, nó vẫn đáng để phát triển, bởi vì chứng minh này không cần tiết lộ thêm thông tin vẫn có thể xác nhận bạn là con người. Ngược lại, nếu từ bỏ lộ trình này, trong tương lai chúng ta truy cập bất kỳ trang web nào, đối phương đều sẽ lưu lại dữ liệu hành vi cơ thể của chúng ta. Hiện nay, giải pháp tập trung mang tính giám sát này, tốc độ triển khai đã vượt xa lộ trình công nghệ mã hóa.










