Tác giả bài viết gốc:ShirleyLi, Nhà nghiên cứu tại Ngoại Bộ Nghiên Cứu (Web3Caff Research)
Làm thế nào để nắm bắt dễ dàng những điểm nóng thị trường, xu hướng công nghệ, tiến triển hệ sinh thái, tình thế quản trị... đang diễn ra trong ngành công nghệ tài chính (FinTech) thế hệ mới? Chuyên mục "Phân tích mạch đập thị trường" do Ngoại Bộ Nghiên Cứu (Web3Caff Research) ra mắt sẽ đi sâu tìm hiểu và sàng lọc các sự kiện nổi bật đang diễn ra, đồng thời đưa ra giải thích giá trị, bình luận và phân tích nguyên lý. Nhìn xuyên hiện tượng để thấy bản chất, hãy nhanh chóng theo chân chúng tôi để nắm bắt hướng gió thị trường thời sự.
So với người dùng con người, lợi thế lớn nhất của AI Agent nằm ở chỗ, trong điều kiện lý tưởng, nó có khả năng thực thi tự chủ mạnh mẽ hơn: nó có thể tự mình hoàn thành nhiệm vụ, tự thực hiện thao tác và chủ động gọi các công cụ bên ngoài mà không cần sự can thiệp thủ công liên tục. Tuy nhiên, trong quá trình thực tế AI Agent gọi các công cụ (ví dụ: API của sàn giao dịch, công cụ phân tích dữ liệu, oracle), vẫn sẽ gặp phải một số vấn đề.
Đầu tiên, các điểm truy cập vào những công cụ này phân tán ở nhiều nơi như GitHub, trang web chính thức, nền tảng API tập trung, v.v., thiếu kênh khám phá thống nhất. Trong điều kiện không có sự can thiệp của con người, AI Agent rất khó tự định vị và kết nối với các công cụ cần thiết, hơn nữa phương thức thanh toán cụ thể trên các nền tảng khác nhau cũng khác biệt, thiếu quy trình chuẩn hóa. Điều này sẽ gây ra một số trở ngại cho quá trình AI Agent gọi công cụ.
Thứ hai, trong internet truyền thống, việc gọi API thường yêu cầu nhà phát triển đăng ký tài khoản, lấy API Key và thực hiện xác thực quyền hạn theo các quy tắc cụ thể. Quy trình này ban đầu được thiết kế cho người tham gia là con người, nhưng đối với AI Agent, việc muốn tự động hoàn tất đăng ký, lấy chứng chỉ và gọi công cụ, hiện vẫn thiếu một phương án triển khai công khai và tiêu chuẩn hóa.
Mặc dù hiện nay giao thức x402 đã có thể hỗ trợ AI Agent tự động hoàn tất thanh toán, nhưng nó chủ yếu phù hợp với các giao diện mở "trả phí là dùng được", khó đáp ứng các tình huống quyền hạn phức tạp hơn, ví dụ, chỉ người dùng đã đăng ký mới có thể truy cập dịch vụ, hoặc người dùng nắm giữ một loại chứng chỉ nào đó mới được hưởng ưu đãi chiết khấu, v.v.
Để lấp đầy khoảng trống này, OpenSea gần đây đã thử nghiệm đưa ra bản dự thảo tiêu chuẩn ERC-8257, nỗ lực xây dựng một danh mục công cụ trên chuỗi mở, không cần cấp phép cho AI Agent, cho phép AI Agent tự chủ khám phá công cụ, hiểu quy tắc truy cập và tự động hoàn tất việc gọi cũng như thanh toán sau khi đáp ứng điều kiện.
Nói một cách đơn giản, lõi của ERC-8257 là một bộ sổ đăng ký công cụ trên chuỗi. Sổ đăng ký này về bản chất là một hợp đồng thông minh, nhà phát triển công cụ có thể đăng ký thông tin liên quan và quyền truy cập công cụ của họ lên chuỗi và công khai cho toàn mạng.
Tuy nhiên, do chi phí đưa toàn bộ dữ liệu trực tiếp lên chuỗi khá cao, do đó, ERC-8257 cho phép nhà phát triển lưu trữ thông tin công cụ chi tiết hơn trên máy chủ hoặc tên miền do chính họ duy trì, được trình bày dưới dạng tệp JSON (Manifest), trong khi sổ đăng ký trên chuỗi chỉ ghi lại liên kết trỏ đến tệp đó. Tệp ngoài chuỗi này thường bao gồm: tên công cụ, mô tả chức năng, giao diện API, phương thức gọi, thông tin định giá, giao thức thanh toán, quy tắc truy cập, v.v. Còn sổ đăng ký trên chuỗi cần ghi lại các dữ liệu quan trọng như địa chỉ tệp ngoài chuỗi, giá trị băm của tệp và thông tin nhà phát triển công cụ. Thiết kế này nhằm mục đích ngăn chặn nhà phát triển tự ý sửa đổi nội dung công cụ sau này. Khi AI Agent gọi công cụ, nó có thể xác minh nội dung ngoài chuỗi có khớp với thông tin đã đăng ký trên chuỗi hay không bằng cách kiểm tra giá trị băm của tệp.
Trong ERC-8257, còn có một thiết kế rất quan trọng: quyền truy cập không phải là định dạng cố định, mà được định nghĩa thông qua một hợp đồng thông minh độc lập. Nhà phát triển công cụ có thể tự do định nghĩa hợp đồng này để quy định ai đủ tư cách gọi công cụ của họ. Ví dụ, nhà phát triển có thể kiểm tra xem AI Agent có đang nắm giữ một loại NFT nào đó không, có đang nắm giữ một loại Token nào đó không, có đăng ký dịch vụ không, có nằm trong danh sách trắng nào đó không, v.v.
Hãy xem một ví dụ, một công cụ phân tích trên chuỗi quy định: Phí gọi API thông thường cho người dùng thông thường là 0,05 USD/lần, trong khi người dùng nắm giữ một loại NFT cụ thể chỉ cần thanh toán 0,01 USD/lần. Đồng thời, nếu người dùng đăng ký dịch vụ của họ (thông qua Token chỉ định hoặc giao thức thanh toán trả phí liên tục), còn có thể nhận được quyền truy cập vào giao diện phân tích nâng cao.
Trong tình huống này, "nắm giữ một loại NFT cụ thể", "đăng ký dịch vụ" là hai loại chứng chỉ truy cập đặc biệt. Nếu AI Agent hiện tại không có quyền hạn tương ứng, nó có thể lấy các điều kiện này trên chuỗi hoặc đi đến thị trường để mua (ví dụ: mua NFT hoặc hoàn tất đăng ký), sau đó mới nộp đơn gọi lại.
Tuy nhiên cần lưu ý, khi quyền truy cập tồn tại dưới dạng tài sản như NFT hoặc Token, bản thân chúng có thể tham gia vào hệ thống lưu thông thị trường, từ đó chịu ảnh hưởng của quan hệ cung cầu, dẫn đến biến động giá trị cao hoặc hành vi đầu cơ.
Do đó, ERC-8257 không giới hạn hệ thống quyền hạn ở mô hình tài sản đơn nhất, mà lựa chọn duy trì tính mở. Nhà phát triển công cụ hoặc dịch vụ có thể lựa chọn cơ chế truy cập khác nhau tùy theo nhu cầu cụ thể, ví dụ: đưa vào Soulbound NFT (NFT liên kết linh hồn) không thể chuyển nhượng để tránh biến động giá trị do hành vi giao dịch gây ra, hoặc đưa vào cơ chế không phải tài sản hóa như điểm uy tín, nhằm giảm thiểu tác động của hành vi đầu cơ.
Ở cấp độ thanh toán, ERC-8257 cũng không chịu trách nhiệm định nghĩa logic thanh toán cụ thể, mà chỉ yêu cầu nhà phát triển khai báo trong tệp JSON rằng hỗ trợ giao thức thanh toán nào, ví dụ: x402, thanh toán ERC-20 trên chuỗi, hoặc các giao thức thanh toán máy móc khác, việc thực thi thanh toán thực sự sẽ do giao thức tương ứng hoàn thành.
Nhìn từ toàn bộ quy trình, cách thức hoạt động của ERC-8257 đại khái như sau:
- Nhà phát triển công cụ triển khai dịch vụ công cụ, viết quyền truy cập tương ứng, sau đó gửi thông tin liên quan lên sổ đăng ký trên chuỗi;
- Khi AI Agent cần gọi một công cụ hoặc dịch vụ nào đó, nó có thể quét sổ đăng ký trên chuỗi, khi phát hiện công cụ hoặc dịch vụ phù hợp với nhu cầu của mình, có thể đọc tiếp tệp mô tả chi tiết để hiểu quy tắc gọi;
- Nếu AI Agent không đáp ứng điều kiện truy cập, có thể thử lấy quyền hạn tương ứng, sau đó khởi động lại việc gọi;
- Cuối cùng, AI Agent có thể tự chủ hoàn tất toàn bộ quy trình khám phá công cụ, xác minh quyền hạn, thanh toán và gọi mà không cần sự tham gia của con người.
Nguồn ảnh: The App Store for Agent Tools: ERC-8257
Tổng thể mà nói, điều mà ERC-8257 cố gắng giải quyết, không chỉ đơn thuần là vấn đề làm thế nào để đưa API lên chuỗi, mà là làm thế nào để AI Agent có thể giống như người dùng con người, tự động khám phá công cụ, hiểu quy tắc truy cập, lấy quyền truy cập và gọi các công cụ này theo cách tiêu chuẩn hóa. Nhìn từ mục tiêu thiết kế, ERC-8257 sẽ cùng với giao thức x402, hình thành một mối quan hệ bổ sung:
- ERC-8257 hy vọng sẽ giúp AI Agent khám phá công cụ trên phạm vi toàn cục, đồng thời dựa trên quy tắc để đánh giá bản thân có quyền truy cập hay không;
- Giao thức x402 chịu trách nhiệm thanh toán và quyết toán trong quá trình gọi công cụ. Sau khi công cụ được phép gọi, hỗ trợ AI Agent trả phí theo lần hoặc theo tần suất gọi.
Tuy nhiên, ngoài vấn đề đã đề cập ở trên, nếu quyền truy cập tồn tại dưới dạng tài sản như NFT hoặc Token, có thể sẽ đưa vào rủi ro biến động giá trị và đầu cơ, tiêu chuẩn ERC-8257 trong quá trình triển khai thực tế còn phải đối mặt với một số thách thức rủi ro tiềm ẩn.
Ví dụ, mặc dù ERC-8257 cung cấp khung đăng ký và truy cập công cụ tiêu chuẩn hóa, nhưng sự khác biệt vẫn tồn tại khi các nhà phát triển khác nhau thiết lập điều kiện truy cập. Mặc dù AI Agent ở cấp độ khám phá công cụ có thể dựa vào đường dẫn chỉ mục thống nhất trên chuỗi, nhưng trong quá trình gọi thực tế, vẫn cần tương thích với logic đánh giá quyền hạn khác nhau, điều này sẽ mang lại một độ phức tạp kỹ thuật nhất định.
Hơn nữa, về cơ chế tin cậy, hiện tại AI Agent sẽ thông qua so sánh giá trị băm được ghi trên chuỗi và tệp mô tả công cụ ngoài chuỗi, để kiểm tra xem tệp có bị sửa đổi trong quá trình truyền tải hay không. Tuy nhiên, cơ chế này chỉ có thể giải quyết vấn đề dữ liệu có nhất quán hay không, không thể đảm bảo thêm rằng logic chạy của công cụ có chính xác không, giao diện của nó có đáng tin cậy không, cũng như có tồn tại rủi ro rò rỉ thông tin tiềm ẩn trong quá trình xử lý dữ liệu hay không. Đồng thời, do dịch vụ công cụ thường được triển khai trên cơ sở hạ tầng ngoài chuỗi, khả năng sẵn sàng lâu dài và tính ổn định của nó vẫn phụ thuộc vào khả năng vận hành của nhà phát triển, điều này có nghĩa là, AI Agent còn cần thông qua cơ chế uy tín bên ngoài để tiến hành sàng lọc.
Có thể thấy, trước khi tiêu chuẩn ERC-8257 được áp dụng thực tế, nó vẫn cần được kiểm chứng và hoàn thiện thêm về độ tin cậy của công cụ, tính nhất quán của quy tắc quyền hạn, v.v.
Sơ đồ cấu trúc điểm chính:
Tài liệu tham khảo:】
[1] The App Store for Agent Tools: ERC-8257
[2] ERC-8257: Agent Tool Registry
Miễn trừ trách nhiệm
Báo cáo này được Ngoại Bộ Nghiên Cứu (Web3Caff Research) biên soạn, thông tin chứa đựng chỉ mang tính chất tham khảo, không cấu thành bất kỳ dự báo hoặc tư vấn đầu tư, đề xuất hoặc chào mời nào, nhà đầu tư vui lòng không dựa vào những thông tin như vậy để mua, bán bất kỳ chứng khoán, tiền mã hóa nào hoặc áp dụng bất kỳ chiến lược đầu tư nào. Các thuật ngữ được sử dụng trong báo cáo và quan điểm được trình bày nhằm mục đích giúp hiểu xu hướng ngành, thúc đẩy sự phát triển có trách nhiệm trong lĩnh vực công nghệ tài chính (FinTech) bao gồm Web3, blockchain, AI, thanh toán, v.v., không nên được hiểu là quan điểm pháp lý rõ ràng hoặc quan điểm của Ngoại Bộ Nghiên Cứu (Web3Caff Research). Các quan điểm trong báo cáo chỉ phản ánh ý kiến cá nhân của tác giả tính đến ngày được nêu, không liên quan đến lập trường của Ngoại Bộ Nghiên Cứu (Web3Caff Research) và có thể thay đổi sau tình hình tiếp theo. Thông tin và quan điểm chứa đựng trong báo cáo này đến từ các nguồn độc quyền và không độc quyền mà Ngoại Bộ Nghiên Cứu (Web3Caff Research) cho là đáng tin cậy, không nhất thiết bao phủ tất cả dữ liệu, cũng không đảm bảo tính chính xác của chúng. Do đó, Ngoại Bộ Nghiên Cứu (Web3Caff Research) không đưa ra bất kỳ hình thức bảo đảm nào về tính chính xác và độ tin cậy của chúng, cũng không chịu trách nhiệm đối với lỗi và thiếu sót phát sinh theo bất kỳ cách nào khác (bao gồm trách nhiệm đối với bất kỳ ai do sơ suất). Báo cáo này có thể chứa thông tin "hướng tới tương lai", loại thông tin này có thể bao gồm dự báo và dự đoán, bài viết này không cấu thành sự bảo đảm đối với bất kỳ dự báo nào. Việc có dựa vào thông tin trong báo cáo này hay không hoàn toàn do người đọc tự quyết định. Báo cáo này chỉ mang tính chất tham khảo, không cấu thành tư vấn đầu tư, đề xuất hoặc chào mời mua hoặc bán bất kỳ chứng khoán, tiền mã hóa nào hoặc áp dụng bất kỳ chiến lược đầu tư nào, và đề nghị bạn tuân thủ nghiêm ngặt các luật và quy định có liên quan của quốc gia hoặc khu vực của bạn.








