Tác giả: Vaidik Mandloi
Biên dịch: Luffy, Foresight News
ChatGPT ra mắt cuối năm 2022 cho đến nay đã tạo ra cả một hệ sinh thái AI agent khổng lồ. Hiện tại, tổng lưu lượng mạng do các chương trình loại này tạo ra đã vượt quá tất cả người dùng trên toàn cầu. Hành vi lướt web của AI trí tuệ hoàn toàn khác biệt với con người: chúng không xem quảng cáo, không nhấp vào liên kết, cũng không mua sắm trực tuyến, mà chỉ thu thập dữ liệu mạng để hoàn thành nhiệm vụ, sau đó rời đi ngay khi nhiệm vụ kết thúc.
Kiến trúc và logic kinh doanh ban đầu của Internet được xây dựng xoay quanh hành vi và thói quen sử dụng của con người. Nhưng ngày nay, phần lớn hành vi truy cập mạng không đến từ người thật, điều này khiến các trang web lớn nhỏ gặp nhiều phiền toái. Hiện đã có 2.5 triệu trang web bắt đầu chặn các chương trình AI crawler, các nền tảng như Perplexity cũng vì thế mà vướng vào các vụ kiện liên quan. Nhà cung cấp dịch vụ đám mây Cloudflare thậm chí còn xây dựng "mê cung mật ong", sử dụng văn bản ngẫu nhiên vô nghĩa được tạo bởi AI để tạo ra các trang web lặp vô hạn, nhằm mục đích giam giữ các trình thu thập dữ liệu khác nhau.
Nhưng một số AI agent cao cấp đã có khả năng vượt qua các biện pháp bảo vệ này. Trước cuộc đối đầu ngày càng gay gắt giữa người và máy, toàn ngành đang tập trung nghiên cứu phát triển một cơ chế xác minh danh tính người thật đáng tin cậy hơn. Hệ thống này cần xác định chính xác người điều khiển phía bên kia màn hình có phải là con người hay không: khi con người thao tác sẽ có sự do dự, gõ sai, chuyển động con trỏ cũng mang theo những rung động nhỏ đặc trưng của hệ thần kinh con người. Bài viết này sẽ phân tích nguyên nhân đằng sau cuộc biến đổi này, hai giải pháp công nghệ chủ lưu, và sự lựa chọn mà mọi người sẽ phải đối mặt: chấp nhận giám sát đặc điểm sinh trắc học tập trung, hay sử dụng công nghệ xác minh bằng chứng không tiết lộ thông tin (zero-knowledge proof) mã hóa để thực hiện xác minh người thật ẩn danh.
AI làm đảo lộn mô hình kinh doanh Internet
Các trang web lần lượt bắt đầu chặn chương trình AI, căn nguyên nằm ở việc AI từ hai phía đồng thời xuyên thủng nền tảng kinh doanh mà Internet dựa vào để tồn tại. Logic lợi nhuận của Internet truyền thống được xây dựng dựa trên sự chú ý của người dùng: người dùng truy cập trang, xem quảng cáo, nhà phát hành nội dung sẽ nhận được doanh thu. Nếu để AI đại lý mua sắm trực tuyến, nó sẽ tìm kiếm một lúc năm nghìn trang web, trong khi người bình thường thường chỉ xem bốn năm trang.
Tốc độ đọc của AI vượt xa con người, chỉ trong vài phút có thể hoàn thành so sánh giá toàn mạng thậm chí trực tiếp đặt hàng, toàn bộ quá trình không tạo ra bất kỳ lượt xem quảng cáo nào. Điều này có nghĩa là trang web gánh chịu chi phí vận hành máy chủ một cách vô ích, nhưng không nhận được bất kỳ lợi nhuận nào.
Đồng thời, tìm kiếm AI cũng đang liên tục phân tán lưu lượng truy cập trang web. Sau khi Google thêm khối tóm tắt thông minh AI vào đầu kết quả tìm kiếm, chỉ có 8% người dùng nhấp vào trang web gốc, lưu lượng dẫn truyền từ Google đến các trang nội dung lớn đã giảm trực tiếp 33%. Chỉ một năm sau khi tính năng này ra mắt, người dùng hoạt động hàng tháng đã vượt 1 tỷ, lượng truy vấn trên nền tảng mỗi quý đều tăng gấp đôi kể từ khi ra mắt.
Chắc hẳn mọi người vẫn nhớ nền tảng giải đáp học tập Chegg. Nó vốn dựa vào lợi thế xếp hạng tìm kiếm để kinh doanh chính dịch vụ hỏi đáp bài tập, nhưng nay đã chính thức đóng cửa mảng hỏi đáp, và đổ lỗi nguyên nhân phá sản cho tác động của ChatGPT. Những người làm nội dung đang rơi vào tình thế bị kẹp từ hai phía: một mặt crawler tự ý thu thập nội dung trong trang, mặt khác bản tóm tắt AI đã chặn lưu lượng trước khi người dùng đến được trang web.
Khoảng cách dữ liệu càng gây sốc hơn, crawler của OpenAI cứ mỗi lần mang về một lưu lượng chuyển tiếp cho trang web hợp tác, trước đó đã thu thập dữ liệu của 400 trang; tỷ lệ này của Anthropic thậm chí đạt 38000:1. Những doanh nghiệp này sử dụng miễn phí dữ liệu công khai toàn mạng để huấn luyện mô hình AI, sau đó lại dùng sản phẩm thành phẩm phân tán lưu lượng vốn thuộc về các trang web.
Đặt trong các ngành khác, hành vi thu thập dữ liệu mang tính cướp bóc như vậy đã thu hút vô số vụ kiện, nhưng trong lĩnh vực AI, những doanh nghiệp loại này lại có thể đạt được định giá nghìn tỷ.
Cơ thể bạn chính là mật khẩu mới
Trong 25 năm qua, Internet chủ yếu dựa vào CAPTCHA để phân biệt người và máy. Mọi người cần nhận diện biển báo giao thông, nhập ký tự méo mó, cơ chế này có hiệu quả vì khả năng nhận diện hình ảnh của máy móc thời kỳ đầu kém xa con người.
Ngày nay tình thế đảo ngược hoàn toàn. Chương trình hoạt động thông minh của OpenAI trong hệ thống xác minh người-máy của Google đạt điểm số mô phỏng người thật vượt xa con người, có thể nhấp chuột chính xác vào giao diện, sao chép dán nội dung; ảnh do AI tạo ra có thể lừa hệ thống xác minh danh tính, cuộc gọi video deepfake thậm chí bị kẻ xấu sử dụng để hoàn tất chuyển khoản ngân hàng. Tiền đề thiết kế của phương thức xác minh truyền thống - năng lực máy móc yếu hơn con người, đã không còn tồn tại.
Ngành hiện nay chỉ có thể tập trung vào lĩnh vực mà AI tạm thời không thể sao chép. Đặc điểm hành vi cơ thể khi con người thao tác thiết bị điện tử, chính là công nghệ nhận diện sinh trắc học hành vi. Các doanh nghiệp như IBM, BioCatch đều đang nghiên cứu phát triển hệ thống liên quan, công nghệ này không chỉ xác minh danh tính ở bước đăng nhập, mà còn giám sát trạng thái sử dụng của người dùng trong suốt quá trình, thu thập dữ liệu bao gồm tốc độ di chuyển con trỏ, cách thức cuộn trang, nhịp độ gõ phím, lực nhấn phím, thói quen sửa chữa văn bản, góc cầm điện thoại, v.v., con quay hồi chuyển điện thoại sẽ ghi lại thông tin liên quan xuyên suốt.
Hệ thống còn có thể nhận diện các chi tiết như tay thuận của người dùng, quỹ đạo trượt ngón tay. IBM chỉ cần thu thập dữ liệu sử dụng tám lần là có thể thiết lập hồ sơ hành vi riêng cho người dùng, sau đó sẽ so sánh từng thao tác với dữ liệu chuẩn trong thời gian thực.
Công nghệ của BioCatch thậm chí có thể nhận diện các tình huống lừa đảo mạng. Khi nạn nhân đọc số tài khoản mật khẩu theo chỉ dẫn qua điện thoại của kẻ lừa đảo, nhịp độ gõ phím lo lắng ngắt quãng sẽ bị hệ thống bắt chính xác. Chỉ trong một năm, hệ thống này đã hỗ trợ 257 ngân hàng nhận diện khoảng 2 triệu tài khoản rửa tiền. Ngày nay EU cũng bắt đầu thử nghiệm công nghệ nhận diện dáng đi. Kỷ nguyên AI agent mới mở ra chỉ ba năm, nhân viên biên phòng EU đã bắt đầu thu thập tư thế đi bộ của người dân.
Các nghiên cứu liên quan còn kết hợp hiệu ứng Stroop: khi chữ màu xanh lá viết từ "xanh dương", não người sẽ xung đột vì ý nghĩa từ ngữ và màu sắc hình ảnh, tốc độ phản ứng chậm hơn rõ rệt, nhưng AI không bị ảnh hưởng. Nghiên cứu phát hiện, sự can thiệp nhận thức này sẽ thể hiện trực tiếp trên hành vi gõ phím. Nền tảng thậm chí không cần ra đề kiểm tra chuyên biệt, chỉ dựa vào nhịp độ gõ phím, là có thể phán đoán người thao tác có phải là con người hay không; trong thói quen đánh máy, ẩn chứa đặc điểm xử lý thông tin đặc hữu của bộ não con người.
Theo dõi mạng trước đây, chủ yếu ghi lại hành vi duyệt web, nhấp chuột, tiêu dùng của người dùng, người dùng có thể tránh bằng cách chặn Cookie, sử dụng mạng riêng ảo, tắt chức năng định vị. Nhưng nhận diện sinh trắc học hành vi thu thập là đặc điểm bản năng của cơ thể con người: cách di chuyển con trỏ, nhịp độ gõ phím đều khó thay đổi một cách nhân tạo.
Đặc điểm hành vi của mỗi người đều độc nhất vô nhị như dấu vân tay. Khác với mật khẩu, khóa, hồ sơ sinh trắc học này không thể thay đổi, đặt lại. Một khi công nghệ này được phổ cập toàn diện, các nền tảng lớn sẽ buộc phải theo kịp để thích ứng. Ngày nay công nghệ mô phỏng giọng nói đã có thể giả mạo như thật trong cuộc gọi, công nghệ deepfake video cũng theo sát phía sau. Nếu đây là tương lai, vấn đề cốt lõi nhất nổi lên: những dữ liệu cơ thể người này, cuối cùng sẽ do ai kiểm soát?
Ai sẽ kiểm soát hệ thống xác minh người thật
Hiện ngành chia thành hai phe, lần lượt khám phá giải pháp xác minh danh tính người thật.
Thứ nhất là World của Sam Altman (tiền thân là Worldcoin). Người dùng cần đi đến thiết bị quét mống mắt hình cầu, thiết bị thu thập thông tin mống mắt và tạo chứng chỉ mã hóa, để chứng minh người dùng là cá nhân tự nhiên độc nhất vô nhị. Hiện 18 triệu người tại 160 quốc gia đã hoàn tất đăng ký mống mắt. Tháng 4 năm 2026, World lần lượt đạt được hợp tác xác minh người dùng với ứng dụng hẹn hò Tinder, nền tảng hội nghị truyền hình Zoom, nhà cung cấp dịch vụ ký điện tử DocuSign; còn hợp tác với Coinbase ra mắt công cụ AgentKit, người dùng có thể liên kết AI agent của mình với danh tính thực, nền tảng vừa có thể xác nhận phía sau agent có chủ thể người thật, lại không tiết lộ thông tin cá nhân người dùng.
Nhưng công nghệ quét mống mắt bị nhiều quốc gia cấm chỉ rõ ràng. Người dân không rõ việc ủy quyền thu thập dữ liệu sinh trắc học sẽ mang lại hiểm họa gì, đây là nguyên nhân cốt lõi các nước phản đối. Điều tra của MIT Technology Review còn phát hiện, World trong tình huống chưa có sự ủy quyền hiệu lực, ngoài thu thập mống mắt, còn tự ý thu thập nhiều dữ liệu dấu hiệu sinh mệnh cơ thể người như nhịp tim, hô hấp.
Loại thứ hai dựa trên bằng chứng không tiết lộ thông tin (zero-knowledge proof) mã hóa, cho phép bạn chứng minh mình là con người mà không tiết lộ danh tính thật, vị trí hay hình dáng. Vitalik Buterin đã đề xuất ý tưởng này từ năm 2023. Ông cho rằng, nếu không thể xây dựng hệ thống danh tính người thật phi tập trung, Internet cuối cùng sẽ đi đến kiểm soát danh tính tập trung. Quyền xác minh danh tính một khi bị doanh nghiệp hoặc chính phủ nắm giữ, cơ chế giám sát sẽ bám rễ vào tầng đáy mạng.
Hệ thống danh tính người thật phi tập trung trước đây đã có nỗ lực triển khai quy mô lớn, cuối cùng lại tuyên bố thất bại. Idena là một trong những dự án blockchain công khai đầu tiên chủ trương "một người một danh tính", chỉ hai năm ngắn ngủi sau khi ra mắt, 40% tài khoản toàn mạng và 48% phần thưởng đã bị 23 tổ chức kiểm soát. Nhóm vận hành tài khoản tại Ấn Độ, Nga, thuê người bình thường cho mượn danh tính với mức thù lao dưới một đô la một giờ, từ đó kiếm lợi nhuận cao nhất gấp 55 lần. Nghiên cứu còn phát hiện, thậm chí có thông tin danh tính trẻ em bị sử dụng như tài khoản bù nhìn.
Vitalik trước đó đã dự đoán trước loại rủi ro này. Ông nói, đối với hệ thống xác minh danh tính người thật, phương thức tấn công chi phí thấp nhất không phải là deepfake hay kỹ thuật hacker cao cấp, mà là dùng tiền thuê người dân vùng thu nhập thấp cho mượn danh tính cá nhân. Bất kỳ hệ thống xác minh danh tính người thật nào, đều không thể tách rời sự hỗ trợ tài chính: thiết bị quét mống mắt, node xác minh trên chuỗi đều cần đầu tư chi phí liên tục.
Nhưng một khi chứng chỉ danh tính được trao giá trị kinh tế, thị trường đen cho mượn danh tính sẽ ứng vận mà sinh. Trong thế giới thực chênh lệch giàu nghèo nghiêm trọng, kẻ mạnh vốn luôn kiểm soát loại thị trường này.
"Trong hệ thống mang theo khích lệ kinh tế thực tế mà cưỡng chế thực hiện quy tắc một người một phiếu, cuối cùng chỉ lặp lại vết xe đổ của thí nghiệm xã hội liên quan thế kỷ hai mươi."
Xem xét khách quan, hai tuyến phát triển đều tồn tại khuyết điểm rõ rệt. Giải pháp tập trung có thể thực hiện triển khai quy mô hóa, nhưng dữ liệu sinh trắc học người dùng sẽ giao cho doanh nghiệp thu thập thông tin quá mức bảo quản, mà bản thân loại doanh nghiệp này lại có thể thu lợi từ thực trạng robot tràn lan. Tuyến mã hóa về lý thuyết có thể bảo vệ quyền riêng tư, nhưng khó thoát khỏi vấn đề mất cân bằng kinh tế trong thực tế, cuối cùng bị ngành công nghiệp xám lợi dụng kẽ hở.
Nếu bắt buộc tôi đặt cược, tôi vẫn sẽ đặt cược vào giải pháp mã hóa. Bởi vì công nghệ nhận diện sinh trắc học hành vi và quét mống mắt tập trung sẽ ghi vĩnh viễn thông tin cơ thể bạn, và quyền sở hữu những thông tin này thuộc về người triển khai hệ thống đó. Một khi họ nắm được dữ liệu của bạn, bạn không thể xóa hoặc chuyển đi; những dữ liệu này sẽ bị khóa trong tay công ty thu thập nó.
Dù biết rõ bằng chứng không tiết lộ thông tin sẽ bị người ta lợi dụng kẽ hở, nó vẫn đáng để phát triển, vì chứng minh này không cần tiết lộ thêm thông tin vẫn có thể xác nhận bạn là con người. Ngược lại, nếu từ bỏ tuyến đường này, tương lai chúng ta truy cập bất kỳ trang web nào, đối phương đều sẽ lưu lại dữ liệu hành vi cơ thể chúng ta. Ngày nay, giải pháp tập trung mang tính giám sát này, tốc độ triển khai đã vượt xa tuyến công nghệ mã hóa.










