Lời biên tập: Bài viết này cung cấp một góc nhìn xây dựng tương đối điềm tĩnh: Trong một năm qua, thanh toán Agent (trợ lý ảo) đã trở thành câu chuyện nổi bật ở giao điểm của AI với thanh toán và tiền mã hóa, với sự tham gia của Stripe, Visa, Coinbase, Google và các công ty khác. Các khái niệm như micropayment bằng stablecoin, x402, thanh toán giữa các máy móc, thương mại Agent cũng không ngừng nóng lên. Tuy nhiên, tác giả sau khi thực sự bắt tay xây dựng sản phẩm, tiếp xúc với các nhà bán lẻ và nhà phát triển, đã phát hiện ra rằng nhu cầu thực sự vẫn chưa xuất hiện trên quy mô lớn.
Bài viết phân tích một số kịch bản điển hình: Mua sắm bằng Agent không tốt hơn thương mại điện tử truyền thống ở hầu hết các danh mục vì người dùng vẫn cần hình ảnh, so sánh và duyệt qua các sản phẩm; Thanh toán API máy móc có vẻ phù hợp với micropayment bằng stablecoin, nhưng hiện tại hầu hết nhà phát triển đã giải quyết vấn đề thông qua đăng ký, nạp tiền vào tài khoản và hệ thống hóa đơn hiện có; Thanh toán giữa các Agent mặc dù là tầm nhìn dài hạn, nhưng hiện vẫn còn ở giai đoạn sơ khai, thiếu khối lượng giao dịch thực.
Tương đối mà nói, tài chính Agent là một trong số ít hướng đi đã có nhu cầu. Các quỹ, nhóm quản lý ngân quỹ và người dùng DeFi vốn dĩ đã trả tiền cho các công cụ tài chính, AI cũng có thể mang lại năng lực thực tế được nâng cao như giám sát thời gian thực, điều chỉnh danh mục tự động. Nhưng thị trường này cũng có lợi hơn cho các tổ chức truyền thống đã có giấy phép, tuân thủ và quan hệ khách hàng.
Đánh giá cuối cùng của tác giả là: Nền kinh tế Agent thực sự thiếu không phải là một lớp thanh toán đơn thuần, mà là khả năng phối hợp phức tạp hơn - làm thế nào để Agent hợp tác với con người, xác minh việc hoàn thành nhiệm vụ và thực hiện thanh toán kết quả. Thanh toán chỉ là một mắt xích trong đó. Đối với các gã khổng lồ, việc bố trí trước là lựa chọn phòng thủ; nhưng đối với các công ty khởi nghiệp, điều thực sự quan trọng là tìm ra thị trường đã tồn tại ngay lúc này.
Dưới đây là nội dung gốc:
Một năm qua, tôi đã xây dựng cơ sở hạ tầng cho nền kinh tế Agent, và cũng đã trao đổi với các nhóm đang thúc đẩy hoạt động thương mại Agent tại Stripe, Visa, Coinbase, Google cũng như hàng chục công ty khởi nghiệp. Tôi đã sắp xếp lĩnh vực này, ra mắt sản phẩm và cố gắng tìm ra thị trường thực sự.
Nhưng thực tế là: Nhu cầu thực sự vẫn chưa xuất hiện. Đối với các công ty khởi nghiệp muốn tham gia lĩnh vực này, vẫn còn nhiều vấn đề cấu trúc ở đây.
Stripe đã ra mắt 288 sản phẩm mới tại hội nghị Sessions vào tháng trước, lượng truy cập tài liệu liên quan đến Agent đã gần bằng 40% tổng số lượt đọc tài liệu. Thị trường thương mại Agent của họ đã kết nối với hơn 1000 nhà bán lẻ. Nhưng tại sự kiện Sessions, số lượng Agent thực sự đăng ký và hoàn thành giao dịch chỉ đếm trên đầu ngón tay.
Visa đề cập rằng token Agent của họ hiện cần trải qua quy trình phê duyệt KYC từ 3 đến 9 tháng, và về cơ bản yêu cầu doanh thu hàng năm của doanh nghiệp ít nhất đạt 250 triệu USD mới đủ điều kiện kết nối. Ngày nay, chỉ có những công ty cấp độ Amazon, Walmart mới có khả năng đóng vòng xác minh danh tính.
Coinbase đã báo cáo rằng, tính đến tháng 4, đã có 69.000 Agent hoạt động và 165 triệu giao dịch trên x402. Nhưng phân tích chuỗi độc lập cho thấy khối lượng giao dịch thực tế hàng ngày khoảng 17.000 USD, trong đó khoảng một nửa là giao dịch thử nghiệm (CoinDesk, tháng 3/2026).
Chúng tôi đã học được gì khi xây dựng shop.fast.xyz
Agent đến nhà bán lẻ, tức là thương mại đại lý
Chúng tôi đã xây dựng shop.fast.xyz với mục đích kiểm chứng trực tiếp thương mại đại lý. Hàng hóa thực, nhà bán lẻ thực, giao dịch thực.
Nhưng đối với hầu hết các danh mục sản phẩm, trải nghiệm mua sắm AI hiện tại rõ ràng kém hơn thương mại điện tử truyền thống. Khi mua quần áo, thiết bị điện tử hay đồ nội thất, người dùng muốn xem ảnh, duyệt qua các lựa chọn, so sánh song song. Dạng hội thoại qua chatbot thực ra là một sự thụt lùi: bạn thay thế một giao diện hình ảnh phong phú bằng một chuỗi hội thoại văn bản. Con người mua sắm, trước hết là mua bằng mắt.
Agent thể hiện tốt ở phần mà chúng tôi vốn tưởng là khó nhất. Nó có thể hiểu người dùng muốn gì và xử lý tốt các yêu cầu như "giống cái này, nhưng rẻ hơn một chút". Lớp mô hình có hiệu quả. Nhưng nó không thể thay thế trải nghiệm "xem cùng lúc mười sản phẩm, rồi chọn một". Giao diện trò chuyện có thể thêm luân chuyển sản phẩm và hiển thị tương tác, nhưng đến bước đó, bạn thực chất đang xây dựng lại một front-end thương mại điện tử trong cửa sổ chat. Đối với các cảnh mua sắm cần so sánh hình ảnh, chúng tôi vẫn chưa tìm được câu trả lời thuyết phục để giải thích tại sao vỏ bọc trò chuyện lại tốt hơn giao diện thương mại điện tử ban đầu.
Chúng tôi thực sự thấy có nhu cầu từ phía nhà bán lẻ, nhưng nhu cầu này mang tính phòng thủ nhiều hơn. Nhà bán lẻ muốn cửa hàng của họ có thể được Agent truy vấn, không phải vì hôm nay đã có nhiều người tiêu dùng mua sắm qua Agent, mà vì họ lo sợ nếu Agent trở thành kênh chủ đạo trong tương lai, họ sẽ bị bỏ lại phía sau. Đây chính là cơ hội được gọi là Tối ưu hóa Công cụ Agent (Agentic Engine Optimization), nhưng hiện tại nó chỉ là "có thì tốt", chứ không phải là "phải có". Các nhà bán lẻ đang chuẩn bị trước cho một làn sóng chưa đến.
Nơi thương mại đối thoại thực sự có thể cải thiện trải nghiệm, là các cảnh mua hàng tần suất cao, chi phí quyết định thấp, và người dùng đã biết mình muốn gì. Ví dụ rõ ràng nhất là đặt đồ ăn. Thị trường đủ lớn, tần suất đủ cao, quyết định đủ nhanh, ví dụ "giúp tôi đặt một phần phở xào Thái từ cửa hàng tôi thích lần trước". Trong kịch bản như vậy, Agent đối thoại có thể chiến thắng. Nhưng các nền tảng giao đồ ăn chính lại không mở API. Con đường duy nhất là computer use, tức là để AI hoạt động App qua hình ảnh như con người. Quá trình này chậm, dễ hỏng, và đối với một bữa trưa 15 USD, chi phí suy luận hoàn toàn không hợp lý.
Một cơ hội khác, là những cửa hàng trực tuyến phức tạp đến mức người dùng thực sự cảm thấy khổ sở. Ví dụ như các mã giảm giá chồng chéo, mã ưu đãi, điểm tích lũy thành viên, quy trình thanh toán hỗn loạn. Một Agent có thể hiểu "giúp tôi sử dụng phiếu giảm giá, khấu trừ điểm, tìm cách giao hàng rẻ nhất và hoàn tất thao tác bằng ngôn ngữ của tôi", thực sự có thể đơn giản hóa trải nghiệm mua sắm đã bị hỏng ngày nay. Điều này đặc biệt quan trọng với người dùng lớn tuổi, người dùng không phải người bản địa, đặc biệt là khi mua sắm xuyên khu vực; hoặc trong một số cảnh rất cụ thể, nơi người dùng có nhu cầu cực kỳ thích hợp và phức tạp.
Nhưng cả hai cơ hội này đều cần khả năng phân phối B2C khổng lồ. Bạn đang cạnh tranh lối vào người dùng với DoorDash, Amazon. Khả năng phân phối ở quy mô người tiêu dùng là lợi thế của các gã khổng lồ hiện có. Mặt cung ứng của thương mại đại lý đã sẵn sàng, nhưng mặt nhu cầu bị giới hạn bởi trải nghiệm người dùng và kênh phân phối, và nhiều cơ sở hạ tầng hơn không giải quyết được hai vấn đề này.
Chúng tôi đã học được gì từ x402 và MPP
Agent đến Web/API, tức là thương mại máy móc
Chúng tôi đã trao đổi với hàng chục nhà phát triển về nhu cầu thanh toán thực tế của họ. Mô hình gần như hoàn toàn giống nhau: Việc sử dụng API Agent ngày nay, về bản chất là tiêu dùng thường xuyên, như điện toán, suy luận, nguồn dữ liệu. Các nhà phát triển đã có mối quan hệ tính phí qua đăng ký, API key, tài khoản liên kết và nhà cung cấp dịch vụ cốt lõi.
Lập luận điển hình cho thanh toán bằng stablecoin là: Chi phí tối thiểu hiệu quả của thanh toán bằng thẻ tín dụng trên Stripe là khoảng 2,9% cộng 30 cent, điều này làm cho các lệnh gọi API dưới 1 USD trở nên không kinh tế. Nhưng với khối lượng giao dịch thấp như ngày nay, việc nạp tiền vào tài khoản có thể giải quyết vấn đề. Các nhà phát triển nạp tiền trước vào tài khoản, vấn đề này sẽ không còn nữa.
Vấn đề sâu xa hơn nằm ở thị trường nhà cung cấp. Hầu hết các công ty SaaS lớn không muốn cung cấp quyền truy cập API lẻ tẻ với giá một phần cent. Mô hình kinh doanh của họ là các hợp đồng doanh nghiệp nhiều năm. Những công ty phụ thuộc vào doanh thu cam kết lớn sẽ chống lại các cách định giá mới bỏ qua mô hình này.
Thương mại máy móc về cấu trúc là một thị trường đuôi dài. Nó phục vụ các dịch vụ nhỏ, nguồn dữ liệu chuyên ngành, nhà phát triển độc lập, máy chủ MCP, v.v. Các giao thức như MPP và x402 rất phù hợp với phân khúc thị trường này. Nhưng theo định nghĩa, đây là thị trường dành cho người dùng có nhu cầu chuyên nghiệp; và các nhà phát triển vốn dĩ cũng là nhóm người không sẵn lòng trả tiền nhất.
Stripe Projects khi ra mắt đã kết nối với 32 đối tác nhà cung cấp dịch vụ, bao gồm Vercel, Supabase, Cloudflare, Twilio, v.v., bao phủ hầu hết các dịch vụ cốt lõi mà nhà phát triển sử dụng khi xây dựng và triển khai phần mềm, và tất cả đều có thể truy cập thông qua hệ thống tính phí hiện có. Phần đầu của ngăn xếp công nghệ nhà phát triển đã được phục vụ rất tốt. Cơ hội cho làn đường thanh toán mới nằm ở mọi thứ ngoài 30 nhà cung cấp dịch vụ hàng đầu đó: Nó có tồn tại thực, nhưng quy mô tự nhiên nhỏ hơn không gian thị trường mà các câu chuyện hoành tráng ám chỉ.
Truy cập nội dung cũng theo logic tương tự. Agent đã liên tục thu thập và tóm tắt bài viết, các nhà xuất bản bắt đầu phản công. Nhưng khi việc kiếm tiền từ nội dung thực sự diễn ra trên quy mô lớn, rất có thể nó sẽ được thực hiện thông qua các nhà cung cấp dịch vụ CDN vốn đã nằm giữa nhà xuất bản và internet, ví dụ như Cloudflare đã ra mắt công cụ kiểm toán AI; hoặc thông qua các thỏa thuận cấp phép hàng loạt giữa nhà xuất bản và phòng thí nghiệm AI. Cơ hội cơ sở hạ tầng sẽ chảy về các tay chơi hiện có đã có khả năng phân phối.
Chúng tôi đã học được gì từ thanh toán Agent đến Agent
Thương mại giữa các Agent, là tầm nhìn dài hạn, nhưng hiện tại hầu như hoàn toàn dừng lại ở giai đoạn lý thuyết. Chưa có ai đạt được khối lượng giao dịch có ý nghĩa. Phần thực sự khó khăn, đang được các công ty khởi nghiệp thuộc nhiều loại hình thúc đẩy, bao gồm phát hiện Agent, thiết lập niềm tin, đàm phán điều khoản và giải quyết tranh chấp.
Một khi cấu trúc giao dịch này thực sự định hình, nó sẽ trông hoàn toàn khác với các làn đường thanh toán hiện có. Hai bên giao dịch đều không có danh tính con người; yêu cầu độ trễ dưới một giây; số tiền giao dịch có thể từ một phần cent đến hàng triệu USD; còn liên quan đến thanh toán nhiều bên, chứ không phải mô hình người mua - người bán song phương mặc định của các làn thanh toán hiện có. Khi nó thực sự xảy ra, chúng tôi tin rằng nó sẽ bùng nổ với tốc độ cực nhanh và quy mô cực lớn.
Đây chính là cược dài hạn cho cơ sở hạ tầng thanh toán chuyên dụng, và cược này là có thật. Nhưng "cược dài hạn có thật" và "thị trường hiện tại" không phải là một. Chúng tôi từng là một trong những người tuyên bố thị trường này sẽ đến trong nhiều tháng liền, và đã xây dựng cả một hệ thống cơ sở hạ tầng xung quanh nó trong vài năm qua, bao gồm mạng phân tán của chúng tôi. Về lý thuyết, nó có thể mở rộng hơn 10 tỷ TPS, độ trễ dưới 50 mili giây, thời gian nhất quán trung bình 10 mili giây. Nhưng chúng tôi phải quay trở lại vị trí hiện tại của thị trường.
Chúng tôi đã học được gì từ tài chính Agent
Có thể nói, đây là loại duy nhất đã có nhu cầu thực tế. Khách hàng đã tồn tại, và đã đang trả tiền. Các nhà quản lý quỹ, nhóm quản lý ngân quỹ và người dùng DeFi ngày nay vốn dĩ đã chi tiền cho các công cụ tài chính. Việc chèn AI vào quy trình làm việc hiện có là một con đường sản phẩm tự nhiên.
Tài chính Agent còn tạo ra các hành vi hoàn toàn mới. Một Agent có thể tự chủ giám sát và tái cân bằng hàng trăm vị thế theo thời gian thực, có thể hoạt động theo cách mà con người không thể sao chép thủ công. Ở đây có sự nâng cao năng lực thực sự, chứ không chỉ là tự động hóa.
Thách thức nằm ở cạnh tranh. Ngành tài chính được quản lý chặt chẽ và phụ thuộc vào các mối quan hệ đã có. Các tổ chức hiện có sở hữu giấy phép, cơ sở hạ tầng tuân thủ và quan hệ khách hàng. Công ty khởi nghiệp có thể cắt vào các lĩnh vực ít bị quản lý hơn, như DeFi; hoặc tìm kiếm các lĩnh vực mà các tổ chức hiện có hành động chậm hơn, hoặc nơi AI có thể tạo ra năng lực mới mà các gã khổng lồ chưa có. Nhìn chung, động thái cạnh tranh trong lĩnh vực này có lợi hơn cho các tay chơi đã có so với ba loại trước, bởi vì việc chồng AI lên sản phẩm và khách hàng đã có dễ dàng hơn nhiều so với việc đi từ AI rồi mới bổ sung sản phẩm và khách hàng.
Tóm tắt một cách trung thực
Vậy tại sao mọi người vẫn tiếp tục làm việc này? Có hai lý do.
Thứ nhất là động cơ khuyến khích. Các công ty lớn có đủ dòng tiền để đặt cược vào một tương lai cần nhiều năm mới hiện rõ. Đối với họ, chi phí vào sớm hơn năm năm chỉ là lỗi làm tròn số; nhưng cái giá phải trả cho việc vào muộn hơn một năm có thể là thảm họa. Vì vậy, họ buộc phải làm.
Thứ hai là điểm mù nhận thức. Khi công việc kinh doanh của bạn là thanh toán, mọi vấn đề đều trông giống như vấn đề thanh toán. Nền kinh tế Agent cần một lớp thanh toán, vì vậy mọi người đi xây dựng lớp thanh toán.
Nhưng thanh toán chỉ là một phần của vấn đề lớn hơn. Vấn đề thực sự khó khăn không phải là làm cho tiền chảy giữa các Agent, mà là làm thế nào để phối hợp công việc giữa Agent và con người, làm thế nào để xác minh việc đã hoàn thành, và làm thế nào để thanh toán kết quả. Thanh toán chỉ là một phần của việc thanh toán kết quả. Thanh toán kết quả chỉ là một phần của sự phối hợp. Và sự phối hợp, mới chính là phần thưởng thực sự.
Sự phối hợp trên quy mô lớn một cách tự nhiên sẽ tạo ra nhu cầu về cơ chế thanh toán kết quả. Thanh toán sẽ trở thành một nhạc cụ trong bản hòa tấu đó, chứ không phải là toàn bộ tác phẩm. Công ty thực sự giải quyết được vấn đề phối hợp, cuối cùng sẽ đưa thanh toán vào trong đó, chứ không phải ngược lại bị các công ty thanh toán nuốt chửng sự phối hợp.
Hầu hết các gã khổng lồ hiện có đang xây dựng một cách phòng thủ cho một tương lai "giao dịch quy mô lớn của máy móc". Đối với họ, thời gian không quan trọng, bởi vì họ có runway gần như vô hạn.
Nhưng công ty khởi nghiệp không có sự xa xỉ đó. Chúng tôi phải tìm ra thị trường thực sự đang ở đâu ngay lúc này. Chúng tôi không thể chỉ ngồi chờ làn sóng đến.
Một năm xây dựng đã đưa chúng tôi đến một hướng đi bất ngờ. Ở đó thực sự có hoạt động, và tăng trưởng nhanh, chưa được phục vụ đầy đủ. Nó tồn tại bên ngoài bốn loại mà chúng tôi đã liệt kê.








