Bắt đầu từ năm 2025, nhiều người có lẽ sẽ dần làm quen với một cách tương tác mới: nói với GPT hoặc Gemini một câu "Hãy giúp tôi lên kế hoạch cho chuyến đi đến Hong Kong vào tuần tới và đề xuất vé máy bay, khách sạn phù hợp", nó sẽ âm thầm hoàn thành một loạt các bước như tìm kiếm thông tin, lọc điều kiện, lựa chọn lộ trình, so sánh giá cả ở hậu trường, và cuối cùng chỉ đưa ra kết quả để bạn xác nhận.
Tuy nhiên, khi mang cùng kỳ vọng đó lên on-chain, câu chuyện lại hoàn toàn khác.
Ví dụ, bạn ra lệnh cho một DeFi Agent: "Hãy đổi ETH trong ví thành USDC, chuyển cross-chain sang Base, rồi gửi toàn bộ vào Aave". Khách quan mà nói, xét về góc độ "hiểu nhu cầu" và "lập kế hoạch đường đi", Agent ngày nay không hẳn là không làm được, điểm đứt gãy thực sự nằm ở khâu thực thi:
Bạn vẫn rất có thể sẽ phải hoàn thành từng bước ký tên, ủy quyền, trao đổi, cross-chain và gửi tiền,, và mỗi bước đều phơi bày trước các rủi ro như biến động trượt giá, biến động Gas, độ trễ bridge và thay đổi trạng thái on-chain. Điều này cũng có nghĩa là chỉ cần một khâu trung gian nào đó lệch khỏi dự kiến, các hành động phía trước chưa chắc đã rút lại được, các hành động phía sau lại có thể không tiếp nối được, và cuối cùng những gì còn lại trên chain, thường chỉ là một quy trình làm dở dang.
Vấn đề không nằm ở chỗ AI không đủ thông minh, mà là vì tầng thực thi on-chain cho đến nay vẫn thiếu một cách thức biểu đạt thực sự phù hợp với Agent.
Cũng chính vì vậy, đầu tháng 4/2026, Biconomy và Quỹ Ethereum cùng công bố ERC-8211, nhằm giải quyết vấn đề "hạn chế tĩnh" trong thực thi smart contract hiện tại, cung cấp một tầng thực thi biểu cảm hơn cho AI agent và các workflow DeFi phức tạp, cố gắng lắp ráp mảnh ghép còn thiếu này.
一、"Đoạn Đứt Gãy Cuối Cùng" Khi AI Agent Kết Nối On-Chain
Trong một đến hai năm qua, trọng tâm chú ý của ngành công nghiệp crypto đang chuyển dần từ mở rộng quy mô L2, thanh khoản RWA, sang chủ đề mang tính đột phá rõ rệt hơn là làm thế nào để AI Agent thực sự tiếp quản các thao tác on-chain.
Khách quan mà nói, từ "sử dụng ngôn ngữ tự nhiên để đưa ra chiến lược DeFi nhiều bước" đến "để autonomous agent quản lý toàn bộ một portfolio đầu tư cross-chain", gần đây chúng ta cũng đã chứng kiến nhiều thực tiễn, và hầu hết các ý tưởng đã chín muồi ở cấp độ demo, cho dù là tạo ra chiến lược DeFi nhiều bước từ ngôn ngữ tự nhiên, tự động thực hiện tái cân bằng, tự động di chuyển lợi nhuận, điều chỉnh vị thế cross-chain, hay thậm chí là quản lý kết hợp phức tạp hơn.
Xét từ góc độ suy luận và sắp xếp, khả năng của AI đã chạy khá nhanh, nhưng khi thực sự đưa nó vào môi trường production, điểm yếu của tầng thực thi ngày càng trở nên rõ rệt.
Nếu thực sự áp dụng vào môi trường production, điểm yếu này có thể được tóm gọn trong một câu: DeFi là động, nhưng hầu hết các xử lý batch (xử lý hàng loạt) ngày nay vẫn là tĩnh.
Trang web chính thức của ERC-8211 và các bài thảo luận đều nói rất rõ vấn đề này, tức là các ERC-4337 và EIP-5792 hiện có, quả thực đã đẩy mô hình cũ "một chữ ký tương ứng với một lệnh gọi" sang giai đoạn mới "một chữ ký có thể đóng gói nhiều lệnh gọi", nhưng các tham số trong những lệnh gọi này, về bản chất, vẫn phần lớn bị đóng băng tại thời điểm ký.
Nói cách khác, số tiền, giá trị mục tiêu, đầu ra dự kiến mà người dùng điền vào khi ký, đến khi thực thi thực sự, sẽ không tự động điều chỉnh vì sự thay đổi trạng thái on-chain.
Nhưng bản thân DeFi lại đầy rẫy sự không chắc chắn. Đầu ra thực tế của một lần Swap phụ thuộc vào trượt giá và thanh khoản trong khối thực thi đó; thời gian đến tài khoản và số tiền cuối cùng đến của một lần Bridge phụ thuộc vào cơ chế và phí của chính bridge; tỷ lệ share-to-asset của giao thức cho vay hoặc Vault cũng sẽ liên tục thay đổi.
Rốt cuộc, các giá trị mà người dùng hoặc Agent nhìn thấy khi ký, nhiều khi chỉ là một ước tính tại thời điểm đó, chứ không phải là kết quả thực tế khi thực thi.
Để hiểu ERC-8211 giải quyết được điều gì, trước tiên hãy xem một ví dụ điển hình nhất, đó là giả sử Agent muốn làm một việc có vẻ rất bình thường - đổi ETH trong tài khoản thành USDC, sau đó gửi toàn bộ vào Spark để kiếm lãi.
Trong mô hình xử lý batch tĩnh hiện có, Agent phải ước tính trước sẽ nhận được bao nhiêu USDC sau khi Swap, điều này thường buộc bạn phải ghi chết số tiền đầu vào của bước thứ hai trước khi ký, và nếu ước tính quá cao, con số thực nhận không đủ, toàn bộ batch sẽ rollback ngay lập tức; nếu ước tính quá thấp, lại sẽ để lại một phần tiền nhàn rỗi trong ví không thể làm gì.
Nói cách khác, về cơ bản đã rơi vào tình thế tiến thoái lưỡng nan, hoặc là chấp nhận rủi ro thất bại, hoặc là chịu chi phí cơ hội. Đây là lý do tại sao, rất nhiều quy trình on-chain trông không phức tạp, một khi các bước kéo dài đến 5 bước, 8 bước, thậm chí跨hai chain, sẽ nhanh chóng trở nên mong manh, không phải vì bản thân chiến lược phức tạp đến mức không thể mô tả, mà là vì mô hình thực thi hiện tại quá phụ thuộc vào các tham số được ghi chết trước.
Nói ngắn gọn, giới hạn trên của khả năng xử lý batch tĩnh, trên thực tế, quyết định giới hạn trên của chiến lược mà Agent có thể thực thi một cách an toàn.
Từ góc độ này, điều ERC-8211 muốn giải quyết, không phải là AI Agent đưa ra quyết định như thế nào, mà là sau khi Agent đã đưa ra quyết định, trên chain có một cách thức thực thi tự nhiên hơn, ổn định hơn, an toàn hơn hay không. Nhờ đó lần đầu tiên cho phép thực thi on-chain có một hình thức biểu đạt được thiết kế nguyên bản cho AI Agent.
二、ERC-8211 Rốt Cuộc Đã Thay Đổi Điều Gì?
Đột phá cốt lõi của ERC-8211, không nằm ở chỗ nhồi nhét thêm nhiều bước vào một chữ ký, mà là nâng cấp xử lý batch từ một chuỗi giao dịch với các tham số được ghi chết, thành một "chương trình" mà các tham số được đánh giá động tại hiện trường thực thi.
Nghe có vẻ rất trừu tượng, nhưng không khó hiểu,官方用了一句话来描述它:官方 đã dùng một câu để mô tả nó: Từ transactions đến programs.
Điều này có nghĩa là ERC-8211 không còn coi batch là một danh sách các hành động được thực thi theo trình tự, mà coi nó như một chương trình thực thi được đánh giá trong thời gian chạy và mang theo các điều kiện an toàn. Cụ thể, nó đạt được điều này thông qua ba primitive có thể kết hợp:
- Fetchers (Bộ trích xuất giá trị): Xác định tham số này lấy giá trị từ đâu, nó có thể là một truy vấn số dư hiện tại của một địa chỉ nào đó, khiến tham số không còn là snapshot tại thời điểm ký, mà là số đọc thời gian thực được lấy từ trạng thái on-chain tại thời điểm thực thi;
- Constraints (Bộ ràng buộc): Sau khi tham số được giải mã, nó còn phải thông qua kiểm tra ràng buộc nội tuyến - ví dụ "USDC đổi được phải ≥ 2500", hoặc "trượt giá không vượt quá 0.5%". Những ràng buộc này được kiểm tra hoàn tất trước khi giá trị được định tuyến vào lệnh gọi tiếp theo, bất kỳ mục nào không đạt, toàn bộ batch lập tức rollback;
- Predicates (Điều kiện kích hoạt): Có thể hiểu là người gác cổng giữa các bước, không chịu trách nhiệm tạo ra giá trị, mà chịu trách nhiệm đánh giá có tiếp tục thực thi hay không. Ví dụ trong cảnh cross-chain, batch phía Ethereum có thể thông qua predicate đợi ở điều kiện "WETH跨chain过来 đã đến tài khoản", không提交 cho đến khi đến tài khoản;
Trong thiết kế này, mỗi tham số phải trả lời hai câu hỏi: Thứ nhất, giá trị này khi thực thi nên đến từ đâu; Thứ hai, trước khi nó thực sự được sử dụng trong lệnh gọi, nó cần thỏa mãn điều kiện gì. Sau khi kết hợp ba thứ này, một batch không còn chỉ là một chuỗi giao dịch, mà là một chương trình nhúng kiểm tra an toàn.
Nói cho cùng, mô hình tâm trí của xử lý batch tĩnh là một danh sách kiểm tra - thực thi tuần tự ba bước A, B, C; còn mô hình tâm trí của ERC-8211 là một chương trình có điều kiện - Sau khi A thực thi, lấy đầu ra thực tế của A làm đầu vào của B; B thỏa mãn ràng buộc mới vào C; Bất kỳ bước nào không đạt dự kiến, toàn batch rollback.
Chúng ta thực ra có thể hiểu đơn giản nó như một cơ chế "xử lý hàng loạt thông minh" được thiết kế riêng cho AI Agent và các thao tác DeFi phức tạp, bởi vì trong các thao tác on-chain truyền thống, việc hoàn thành một chiến lược DeFi phức tạp thường yêu cầu nhiều giao dịch độc lập: rút tiền từ giao thức cho vay, trao đổi token, rồi gửi vào một giao thức khác (Đọc thêm《Toàn cảnh giao thức AI Crypto: Xuất phát từ chiến trường chính của Ethereum, làm thế nào để xây dựng hệ điều hành mới cho AI Agent?》).
Mỗi bước đều cần ký và xác nhận riêng, điều này đã rườm rà đối với người dùng, và càng là nút cổ chai đối với AI Agent cần thao tác tự chủ tần suất cao. Giải pháp của ERC-8211 là cho phép kết hợp thực thi nhiều thao tác blockchain trong một giao dịch, mỗi bước phân giải động giá trị thực tế khi thực thi, và phải thỏa mãn điều kiện xác định trước mới có thể tiếp tục bước tiếp theo.
Ví dụ, một Agent có thể hoàn thành trong một giao dịch ký: Rút tiền từ Aave → Trao đổi số tiền thực nhận được trên Uniswap → Gửi kết quả trao đổi vào Compound — Tất cả thực thi atomic, không cần viết smart contract mới.
三、Tại Sao Lại Nói Nó Liên Quan Lớn Hơn Đến Ví, Đặc Biệt Là Smart Wallet
Lý do ERC-8211 đáng để ngành ví chú ý, không chỉ vì nó phù hợp với Agent, mà còn vì nó sẽ định nghĩa lại vị trí của ví trong chuỗi tương tác.
Ví trong quá khứ, giống như một bộ ký tên an toàn hơn, nhiệm vụ của nó là bảo quản private key, hiển thị giao dịch, để người dùng xác nhận, rồi gửi chữ ký đi. Vai trò này trong thời đại EOA đã đủ quan trọng, trong thời đại account abstraction vẫn tiếp tục thành lập. Nhưng nếu trong tương lai ngày càng nhiều thao tác on-chain được Agent thay mặt thực hiện, thì vai trò của ví sẽ càng trở nên trung gian và nặng nề hơn.
Lý do rất đơn giản, khi người dùng không còn thao tác từng giao dịch on-chain, mà bắt đầu ủy quyền cho một Agent thực thi cả một bộ mục tiêu, thì ví phải có khả năng tiếp nhận đối tượng tương tác cao cấp hơn này. Nó cần hiển thị không chỉ là một địa chỉ contract và một đoạn calldata, mà là cả một chương trình thực thi "ý định - logic lấy giá trị - điều kiện phán đoán - kết quả cuối cùng".
Vì vậy, ví trong tương lai cần hiểu, không còn chỉ là giao dịch, mà là chương trình. ERC-8211 chính ở tầng này cung cấp cho ví một điểm tiếp cận rõ ràng hơn, bởi vì nó viết rõ ràng các ngữ nghĩa thực thi này vào cấu trúc mã hóa, bao gồm tham số đến từ đâu, phải thỏa mãn điều kiện gì, khi nào tiếp tục, khi nào rollback, đều không phải là hộp đen ẩn trong logic backend, mà là đối tượng có thể được giải thích, mô phỏng và hiển thị bởi ví.
Từ góc nhìn của ví, toàn bộ cơ chế này cuối cùng hướng đến cùng một điều, đó là người dùng không còn ký một chuỗi lệnh gọi tầng thấp mà bản thân khó có thể đọc hiểu hoàn toàn, mà đang ký một chương trình thực thi hướng đến kết quả, ranh giới rõ ràng, điều kiện có thể xác minh:
- AI Agent có thể chịu trách nhiệm hiểu ý định người dùng, tạo đường đi;
- Ví chịu trách nhiệm trình bày con đường này một cách rõ ràng hơn để người dùng xem xét;
- Và relayer chỉ chịu trách nhiệm提交 khi điều kiện thành lập, không có quyền sửa đổi kết quả;
Đây chính là lý do tại sao thực thi non-custodial được coi là tiền đề của Agentic DeFi, bởi vì agent có thể tham gia, nhưng chủ quyền, ràng buộc và thanh toán cuối cùng vẫn nằm trên chain. Đây cũng là nơi ERC-8211 và smart wallet thực sự phù hợp, đó là nó viết việc "biểu đạt ý định phức tạp một cách an toàn" vào tiêu chuẩn tầng giao thức.
Đáng chú ý, ERC-8211 hoàn toàn tương thích với các framework account abstraction như ERC-4337, EIP-7702, ERC-7579. Nó không thay thế account abstraction, mà là trên account abstraction, thêm một lớp ngữ nghĩa thực thi lập trình cho Agent.
Nếu nói ERC-4337 giải quyết "Ai có thể đại diện tôi发起 giao dịch", EIP-7702 giải quyết "EOA làm thế nào để tạm thời có khả năng smart contract", thì ERC-8211 giải quyết的是 một khi Agent bắt đầu thao tác thay tôi, nó có thể hoàn thành toàn bộ một chuỗi quyết định trong một lần ký hay không.
Nhìn lại sự tiến hóa của mô hình tương tác on-chain Ethereum trong 10 năm qua:
- Giai đoạn 1: Một chữ ký = Một lần gọi hàm (Thời đại EOA)
- Giai đoạn 2: Một chữ ký = Một nhóm lệnh gọi đóng gói tĩnh (Thời đại ERC-4337, EIP-5792)
- Giai đoạn 3: Một chữ ký = Một chương trình ý định đánh giá giá trị động (Thời đại ERC-8211)
Mỗi lần nhảy vọt, đều có nghĩa là người dùng (hoặc Agent đại diện người dùng) có thể sử dụng ít ma sát hơn, để biểu đạt các mục tiêu phức tạp hơn.
Mặc dù ERC-8211 hiện vẫn đang trong giai đoạn dự thảo, thảo luận kỹ thuật vẫn đang diễn ra, việc tích hợp giao thức quy mô lớn cũng cần thời gian, nhưng hướng đi mà nó chỉ ra đã đủ rõ ràng: khi AI Agent thực sự bắt đầu thay con người đưa ra quyết định on-chain, trên chain sẽ cần một cú pháp thực thi phù hợp, nguyên bản với nó.









