Năm 2026 đang trở thành bước ngoặt then chốt cho sự giao thoa sâu sắc giữa Crypto và AI.
Hai năm qua, chúng ta đã chứng kiến sự biến đổi của AI từ "công cụ hỗ trợ" thành "tác nhân kinh tế tự chủ". AI Agent không còn chỉ là chatbot trả lời câu hỏi, chúng đã bắt đầu tự chủ khởi tạo giao dịch, gọi API, quản lý danh mục tài sản, thậm chí thuê các Agent khác để hoàn thành nhiệm vụ.
Nhưng tiền đề cho tất cả điều này là các Agent này cần danh tính, cần kênh thanh toán, cần hồ sơ uy tín, cần môi trường thực thi có thể xác minh.
Và những nhu cầu này, đúng là những vấn đề mà blockchain giải quyết tốt nhất.
Vẫn là điều thường được nhắc lại, Quỹ Ethereum vào tháng 9/2025 đã thành lập nhóm AI phi tập trung (dAI), Vitalik Buterin vào đầu năm 2026 đã công bố khung chiến lược AI mang tính hệ thống, và một loạt các giao thức tiêu chuẩn xoay quanh danh tính Agent, thanh toán, thực thi đã được đưa lên mainnet và vận hành. Đồng thời, các hệ sinh thái blockchain mới như Solana cũng đang xây dựng cơ sở hạ tầng AI trên con đường riêng của họ.
Do đó, bài viết này cũng cố gắng lấy hệ sinh thái Ethereum làm trục chính, bổ sung thêm những tiến bộ quan trọng của các blockchain khác, để sắp xếp lại bản đồ đầy đủ của các giao thức AI mã hóa hiện tại.
I. Bản thiết kế AI của Vitalik: Ethereum muốn trở thành "Lớp tin cậy" của thế giới AI
Tháng 2/2026, Vitalik Buterin đã đăng một bài viết mang tính hệ thống trên X, chuyên sửa đổi khung giao thoa "Crypto × AI" mà ông đề xuất hai năm trước.
Trong bài viết ông đã xem xét lại quan điểm đưa ra hai năm trước, cho rằng việc thúc đẩy tăng tốc hướng tới trí tuệ nhân tạo phổ quát (AGI) thường giống với tốc độ và quy mô không bị hạn chế mà chính Ethereum đã thách thức khi được tạo ra, và phản đối rõ ràng việc đơn giản hóa sự phát triển AI thành "cuộc đua AGI", mà chủ trương Ethereum nên trở thành người dẫn đường cho thế giới AI.
Nói cách khác, điều ông thực sự quan tâm không phải là làm thế nào để AI mất kiểm soát nhanh hơn, mà là làm thế nào để sự bành trướng của AI được xây dựng trên cơ sở hạ tầng có thể xác minh, kiểm toán, kiềm chế.
Nhìn chung, khung của Vitalik bao gồm bốn trụ cột cốt lõi.
Đầu tiên là các công cụ tương tác AI đáng tin cậy. Ông ủng hộ việc sử dụng mô hình ngôn ngữ lớn cục bộ (local LLM), cơ chế thanh toán bằng bằng chứng không kiến thức (zero-knowledge proof) và các công cụ khác, cho phép người dùng sử dụng dịch vụ AI mà không tiết lộ danh tính và dữ liệu gốc.
Thái độ này không chỉ dừng lại ở biểu đạt trừu tượng. Tháng 4/2026, Vitalik còn công khai chia sẻ phương án sử dụng LLM cục bộ của mình. Sau khi thử nghiệm nhiều bộ phần cứng, ông chọn chạy mô hình nguồn mở 35 tỷ tham số Qwen3.5 trên máy tính được trang bị GPU NVIDIA 5090, toàn bộ tính toán được thực hiện cục bộ, mục tiêu là nâng tốc độ suy luận lên mức có thể sử dụng hàng ngày và giảm thiểu sự phụ thuộc vào các mô hình đám mây.
Tất nhiên, ý nghĩa biểu tượng của việc này lớn hơn ý nghĩa thực tế, nhưng cũng cho thấy ít nhất trong góc nhìn của ông, hướng đi thực sự đáng theo đuổi của AI không chỉ là mô hình mạnh hơn, mà là mô hình có thể kiểm soát được hơn.
Thứ hai là lớp điều phối kinh tế của AI, điều này bao gồm việc Ethereum có thể thông qua hợp đồng thông minh hỗ trợ thanh toán lẫn nhau giữa các Agent, tiền ký quỹ, giải quyết tranh chấp và tích lũy uy tín, cho phép hình thành mối quan hệ kinh tế có thể lập trình giữa máy móc với máy móc; Thứ ba là AI với tư cách là giao diện của Web3, ví dụ như trợ lý AI cục bộ có thể giúp người dùng soạn thảo giao dịch, kiểm toán hợp đồng thông minh, giải thích bằng chứng xác minh chính thức, trở thành cầu nối cho người bình thường bước vào thế giới trên chuỗi phức tạp.
Cuối cùng là hệ thống quản trị được tăng cường bởi AI, như sử dụng AI để nâng cấp thị trường dự đoán, bỏ phiếu bình phương, cơ chế phân bổ vốn công, tìm ra sự cân bằng giữa tự động hóa và phán đoán của con người.
Nhìn chung, ý tưởng cốt lõi của khung này có thể cô đọng thành một câu: Ethereum không muốn tăng tốc AI, mà là muốn AI chạy trong một môi trường có thể xác minh, kiểm toán, phi tập trung.
Vậy rốt cuộc phải thực hiện như thế nào?
II. Từ giao thức danh tính, đến giao thức thanh toán, đến giao thức thực thi, đến AI có thể xác minh
Nếu khung của Vitalik là bản thiết kế vĩ mô, thì làn sóng tiến hóa giao thức gần đây của hệ sinh thái Ethereum đã bắt đầu ép phương pháp luận này vào ngăn xếp kỹ thuật cụ thể.
Nút cơ sở hạ tầng đầu tiên đáng chú ý nhất là ERC-8004.
Là tiêu chuẩn danh tính, uy tín và xác minh được Ethereum thiết kế cho AI Agent, nó được nhóm dAI của Quỹ Ethereum dẫn đầu, cùng với sự tham gia xây dựng của Google, Coinbase và MetaMask, hầu như bao gồm ba lối vào then chốt là AI, giao dịch và ví (đọc thêm "Vé tàu mới thời đại AI Agent: ERC-8004 được thúc đẩy mạnh mẽ, Ethereum đang đặt cược vào điều gì?").
Như tên chính thức của nó là Trustless Agents, logic cốt lõi của nó cũng không phải là thuật toán phức tạp, mà nhằm mục đích để AI sở hữu danh tính, danh tiếng và bằng chứng năng lực có thể xác minh trên chuỗi, tóm tắt đơn giản thì thiết kế của nó rất kiềm chế, chỉ làm ba việc:
- Bảng đăng ký danh tính: Dựa trên tiêu chuẩn ERC-721, mỗi AI Agent sẽ được "NFT hóa", nghĩa là AI Agent có thể được tra cứu, trích dẫn, tích hợp vào các giao thức khác giống như địa chỉ ví;
- Bảng đăng ký uy tín: Có thể hiểu là "Điểm bình chọn" của giới AI, cho phép người dùng hoặc Agent khác đã thực sự tương tác với Agent gửi phản hồi, và những đánh giá này có thể được liên kết với hành vi thanh toán hoặc ủy thác trên chuỗi, đảm bảo danh tiếng không phải là tường thuật được tạo ra từ không trung, mà là hồ sơ lịch sử được xây dựng dựa trên hành vi kinh tế thực tế;
- Bảng đăng ký xác minh: Đối với nhiệm vụ giá trị cao hoặc rủi ro cao, bản thân danh tiếng lịch sử là không đủ, do đó ERC-8004 dành sẵn giao diện xác minh của bên thứ ba, cho phép thông qua môi trường thực thi đáng tin cậy (TEE), bằng chứng không kiến thức (zk) và các cách khác, để chứng thực năng lực hoặc quá trình thực thi của Agent;
Nếu danh tính trả lời câu hỏi "Agent là ai", thì cơ sở hạ tầng thanh toán đại diện bởi giao thức x402 trả lời câu hỏi "Agent giao dịch như thế nào".
Như mọi người đều biết, x402 là một giao thức thanh toán HTTP mở, được đồng khởi xướng bởi Coinbase và Cloudflare, nguyên lý cơ bản của nó rất khéo léo, làm sống lại mã trạng thái 402 (Payment Required - Yêu cầu thanh toán) vốn bị bỏ quên lâu nay trong giao thức HTTP. Khi một Agent cố gắng truy cập dịch vụ trả phí, máy chủ trả về mã trạng thái 402 và yêu cầu thanh toán, Agent dùng stablecoin hoàn thành thanh toán sau đó có thể nhận được quyền truy cập.
Toàn bộ quá trình được nhúng trong yêu cầu HTTP, không cần đăng ký tài khoản, không cần thẻ tín dụng, không cần can thiệp thủ công. Nói cách khác, đây là một hệ thống thanh toán được thiết kế cho máy móc chứ không phải con người.
Đáng chú ý, vào đầu tháng này, Linux Foundation coi như chính thức tiếp quản x402 Foundation, và tiếp nhận giao thức x402 do Coinbase đóng góp, cách diễn đạt chính thức rất rõ ràng: x402 muốn làm là nhúng thanh toán trực tiếp vào tương tác HTTP, để AI agents, API, ứng dụng trao đổi giá trị giống như trao đổi dữ liệu.
Người viết cho rằng tầm quan trọng của tin này đã bị xem nhẹ rất nhiều, một mặt là khả năng thâm nhập và ảnh hưởng quan trọng của x402 trong thanh toán AI và Internet, mặt khác là đội ngũ cực kỳ hùng hậu, dĩ nhiên việc quảng bá x402 từ trước đến nay đều là các gã khổng lồ này, nhưng lần này hiệu quả rõ ràng là 1+1 lớn hơn 2.
Ngoài ra, phiên bản V2 của x402 cũng đang nỗ lực mở rộng phương thức thanh toán, bao gồm không chỉ hỗ trợ stablecoin trên chuỗi, mà còn tương thích với mạng lưới ACH (Automated Clearing House, hệ thống thanh toán bù trừ tự động) truyền thống và mạng lưới thẻ ngân hàng, để kết nối biên giới giữa AI Agent và hệ thống tài chính thực tế.
Cuối cùng, ngoài danh tính và thanh toán, mảnh ghép thứ ba mà Ethereum bổ sung gần đây, là lớp thực thi.
Tháng 4/2026, Biconomy cùng với hướng Cải thiện trải nghiệm người dùng (Improve UX) của Quỹ Ethereum thúc đẩy ERC-8211, cố gắng giải quyết chính điểm nghẽn thực tế nhất của AI Agent trong thế giới DeFi, ví dụ như hoạt động phức tạp trên chuỗi thường không phải là một lần gọi, mà là một chuỗi thực thi nhiều bước, động, dễ bị lỗi.
Chúng ta thực sự có thể hiểu nó đơn giản như một cơ chế "xử lý hàng loạt thông minh" được thiết kế riêng cho AI Agent và các thao tác DeFi phức tạp, bởi vì trong hoạt động trên chuỗi truyền thống, hoàn thành một chiến lược DeFi phức tạp thường cần nhiều giao dịch độc lập: rút tiền từ giao thức cho vay, trao đổi token, rồi gửi vào một giao thức khác.
Mỗi bước đều cần ký và xác nhận riêng, điều này đã rườm rà đối với người dùng con người, đối với AI Agent cần thao tác tự chủ tần suất cao thì càng là nút thắt cổ chai. Giải pháp của ERC-8211 là cho phép nhiều thao tác blockchain kết hợp thực thi trong một giao dịch, mỗi bước phân tích giá trị thực tế một cách linh động khi thực thi, và phải đáp ứng điều kiện xác định trước mới có thể tiếp tục bước tiếp theo.
Ví dụ, một Agent có thể hoàn thành trong một giao dịch ký: Rút tiền từ Aave → Trao đổi số tiền thực tế nhận được trên Uniswap → Gửi kết quả trao đổi vào Compound — Tất cả thực thi nguyên tử, không cần viết hợp đồng thông minh mới.
Đặt ba thứ này cùng nhau xem, đường hướng gần đây của Ethereum đã rất rõ ràng, tức là ERC-8004 trả lời "Bạn là ai, tại sao người khác tin bạn", x402 trả lời "Bạn thanh toán cho dịch vụ như thế nào", ERC-8211 trả lời "Bạn hoàn thành thao tác phức tạp hiệu quả ra sao".
Nói cách khác, nền kinh tế AI Agent thực sự thiếu, không chỉ là mô hình lớn thông minh hơn, mà là một ngăn xếp giao thức mở, có thể kết hợp, có thể mở rộng; Và đây chính xác là điều Ethereum làm giỏi nhất.
III. Ngoài Ethereum: Solana, DePIN và tính toán phi tập trung
Tất nhiên, ngay cả khi Ethereum chiếm vị trí dẫn đầu trong việc thiết lập tiêu chuẩn và cơ sở hạ tầng tin cậy, hệ sinh thái AI mã hóa còn xa mới chỉ là một chuỗi.
Cách nói chính xác hơn là, Ethereum đang tranh giành lớp tiêu chuẩn và lớp tin cậy, còn một số hệ sinh thái khác, đang thể hiện lợi thế khác nhau ở lớp thực thi và lớp sức mạnh tính toán.
Solana là ví dụ điển hình nhất. Lý do nó ngày càng có mặt trong chủ đề thanh toán Agent, là bắt nguồn từ nhu cầu của AI Agent đối với chuỗi vốn không phải là ý thức hệ đúng đắn, mà là "độ trễ thấp, chi phí thấp, đủ ổn định", phần giới thiệu chính thức của Solana về x402, trực tiếp lấy tính cuối cùng (finality) tính bằng mili giây và chi phí giao dịch cực thấp làm điểm bán quan trọng cho thanh toán máy móc, điều này cũng giải thích tại sao Solana dễ dàng tiếp nhận những kịch bản tương tác Agent tần suất cao, giá trị nhỏ, cần phản hồi tức thì hơn.
Đồng thời, chuỗi công cụ Agent xung quanh Solana cũng đang nhanh chóng trưởng thành, Solana Agent Kit trên GitHub chính thức cho phép Agent trên bất kỳ mô hình nào tự chủ thực thi hơn 60 hành động Solana, bao phủ nhiều kịch bản như giao dịch, phát hành token, cho vay, airdrop, Blink, cross-chain, được sử dụng lại bởi một lượng lớn dự án và nhà phát triển trên chuỗi.
Do đó, nhìn từ cục diện ngày nay, sự phân công của AI mã hóa đang trở nên rõ ràng hơn. Ethereum giống như đang làm sự trừu tượng cơ sở cho tiêu chuẩn giao thức, danh tiếng danh tính và thực thi đáng tin cậy, Solana thì chiếm ưu thế thực tế trong thanh toán tần suất cao và tương tác ma sát thấp, và giá trị của mạng lưới sức mạnh tính toán phi tập trung, cũng sẽ được định giá lại khi nhiều Agent thực sự bước vào môi trường sản xuất.
Nhìn chung, đứng ở thời điểm tháng 4/2026 nhìn lại, bản đồ giao thức AI mã hóa đã sơ bộ định hình:
- Lớp danh tính: ERC-8004 với tư cách là tiêu chuẩn danh tính Agent do Ethereum dẫn dắt, đã mở rộng đến Base và nhiều chuỗi khác;
- Lớp thanh toán: x402 từ dự án thử nghiệm của Coinbase phát triển thành tiêu chuẩn toàn cầu dưới sự quản trị của Linux Foundation;
- Lớp thực thi: Các tiêu chuẩn như ERC-8211 đã đơn giản hóa thao tác trên chuỗi phức tạp của Agent;
- Lớp xác minh: Các công nghệ như zkML, TEE, bằng chứng mật mã bắt đầu cung cấp khả năng xác minh cho tương tác Agent giá trị cao;
- Cục diện cạnh tranh: Ethereum làm lớp tiêu chuẩn và tin cậy, Solana làm lớp thực thi tần suất cao, Bittensor có lẽ cũng có thể là bổ sung cho các chiều như sức mạnh tính toán, hình thành cục diện bổ sung chứ không phải không tổn thất (non-zero-sum);
Nhìn về nửa cuối năm, bản nâng cấp mới của Ethereum có khả năng sẽ thúc đẩy mở rộng quy mô L1, trừu tượng tài khoản gốc (native account abstraction) và bảo mật hậu lượng tử, trong đó sự phổ cập của trừu tượng tài khoản chắc chắn sẽ giảm đáng kể ngưỡng sử dụng ví Agent; Việc tích hợp sâu giữa x402 và ERC-8004 cũng có khả năng thúc đẩy một nền kinh tế Agent khép kín, bao gồm đăng ký danh tính Agent, phát hiện dịch vụ, khởi tạo thanh toán, tích lũy uy tín, tất cả hoàn thành trên chuỗi.
Viết ở cuối
Ethereum và blockchain, không phải để tăng tốc sự xuất hiện của AI, mà là để đảm bảo khi AI đến, thế giới sẽ không đi đến mất kiểm soát.
Xét cho cùng, trong thế giới Web2, danh tính của AI được định nghĩa bởi API Key của các công ty lớn, thanh toán được hệ thống thẻ tín dụng đảm nhận, sự tin tưởng được các nền tảng tập trung chứng thực, hệ thống này vận hành một cách miễn cưỡng trong kịch bản người dùng con người, nhưng trong mô hình mới nơi hàng triệu AI Agent cần cộng tác tự chủ 24/7, nó ngày càng tỏ ra không đủ sức.
Mà những người đặt tiêu chuẩn lấy Ethereum làm cốt lõi, lớp thực thi hiệu quả đại diện bởi Solana, sức mạnh tính toán phi tập trung được hỗ trợ bởi DePIN, có lẽ sẽ xây dựng một cơ sở hạ tầng hoàn toàn mới cho nền kinh tế AI Agent.













