Tháng 5 năm 2026, Alipay thông báo số lượng giao dịch thanh toán bằng AI đã vượt quá 300 triệu giao dịch. Một tháng sau, WeChat mở quyền truy cập AI cho các nhà phát triển Mini Program, trong đó một yêu cầu đã gây tranh cãi: nhà phát triển ủy quyền cho nền tảng đọc mã nguồn Mini Program.
Hai thời điểm cách nhau chưa đầy 30 ngày, nhưng đằng sau là hai con đường đã phân nhánh hơn một năm. Theo báo cáo từ LatePost, Alipay đang thử nghiệm nội bộ một phiên bản AI có mã hiệu "Dự án Bảo", không phải là thêm một trợ lý, mà là để người dùng chuyển đổi một cú nhấp chuột sang một giao diện hoàn toàn mới, được điều khiển bởi đối thoại. Trong khi đó, tại cuộc họp báo cáo tài chính, Chủ tịch WeChat, Liu Zhiping, đã định hướng: cuối cùng sẽ được trang bị một Agent AI, nhưng sẽ kết nối sâu sắc với các mối quan hệ xã hội, tài khoản công khai và kênh video, không có lộ trình riêng biệt.
Hai nền tảng nắm trong tay 1 tỷ người dùng và hàng triệu Mini Program, đã đưa ra câu trả lời trái ngược cho cùng một câu hỏi: khi AI có thể thay thế người dùng thao tác dịch vụ, cổng vào nên được viết lại hay bị ẩn đi?
Alipay cắt bỏ không chỉ là giao diện
Để hiểu Alipay đã làm gì, trước tiên cần xem xét một hành động cụ thể của người dùng.
Trước đây, việc đặt ba ly cà phê latte ít đường và gọi một chiếc xe ra sân bay trong Alipay, quy trình chuẩn là: tìm cổng vào Mini Program của DiDi, nhập điểm đến, xác nhận gọi xe; thoát ra, tìm cổng vào Mini Program của Luckin Coffee, chọn loại, chỉnh lượng đường, thêm vào giỏ hàng, thanh toán; chuyển đổi qua lại giữa hai Mini Program, hoàn thành thanh toán riêng biệt. Mỗi bước là một lần nhấp chuột, một lần chuyển trang, một lần chờ đợi.
Điều mà "Dự án Bảo" muốn thay đổi, là nén toàn bộ chuỗi hành động này thành một câu nói. Người dùng nói vào hộp thoại "Hãy gọi cho tôi một chiếc xe đến sân bay, và đặt ba ly latte ít đường ở gần đó", AI tiếp quản tất cả các bước tiếp theo: hiểu ý định, phân giải nhiệm vụ, gọi các dịch vụ di chuyển và ăn uống tương ứng, kết hợp đơn hàng, hoàn thành thanh toán. Giao diện tương tác không còn là một hàng loạt cổng vào Mini Program, mà là một cửa sổ trò chuyện.
Sự thay đổi triệt để này có thể thấy từ quá trình thiết kế sản phẩm nội bộ. Theo LatePost, để xác định hình thái tương tác mới, nhóm dự án đã đưa ra hơn 100 phiên bản thiết kế sản phẩm. Việc cuối cùng lựa chọn phương án lấy đối thoại làm cốt lõi, đằng sau là nhận định rằng ngôn ngữ tự nhiên đã trở thành phương thức tương tác AI chủ đạo, phân phối dịch vụ nên được xây dựng lại cổng vào theo hướng này, chứ không phải dán một miếng vá AI vào khung cũ.
Sự cấp tiến này không phải là lựa chọn ban đầu của Alipay. Vào nửa cuối năm 2023, khi ban lãnh đạo nhóm sự nghiệp Alipay khởi xướng thảo luận "Làm thế nào để tiến tới thông minh hóa", câu hỏi đầu tiên đặt ra là: Cải tạo trên ứng dụng gốc, hay tạo một ứng dụng mới? Ban đầu, nhóm dự án chọn phương án thứ hai. Tháng 9 năm 2024 tại Hội nghị Bờ sông, Alipay đã phát hành ứng dụng AI độc lập "Zhixiaobao", định vị là quản gia cuộc sống AI.
Zhixiaobao đã không chạy thông. Theo nguồn tin nội bộ, DAU của ứng dụng độc lập này thấp hơn nhiều so với trợ lý thông minh trong ứng dụng. Ngược lại, trợ lý đối thoại nằm trong Alipay, tận dụng lưu lượng trang chủ, lại duy trì ổn định ở mức hàng triệu DAU, tích lũy dữ liệu tương tác phong phú hơn nhiều so với ứng dụng độc lập.
Còn một ràng buộc thực tế hơn: lúc đó, Tập đoàn Ant đang tập trung lực lượng phát triển ứng dụng sức khỏe "Ant Afu", AI thông dụng "Lingguang" cũng đang được thúc đẩy, nguồn lực tính toán và phát triển có hạn. Làm thêm một ứng dụng độc lập, không chỉ phải cạnh tranh tài nguyên với các dự án này, mà còn phải gánh chi phí khổng lồ để người dùng di chuyển từ số không.
Tháng 3 năm 2025, nhóm quay đầu, không kiên trì theo đuổi con đường ứng dụng độc lập nữa. Nội bộ dần hình thành một nhận định: Phục vụ tốt hơn 1 tỷ người dùng nền tảng hiện có của Alipay, để người dùng nhận được dịch vụ AI với chi phí di chuyển bằng không, hiệu quả hơn so với việc kéo một ứng dụng mới từ bên ngoài. Tháng 12 năm 2025, dự án phiên bản AI Alipay chính thức được lập, đội ngũ sớm nhất đến từ nhóm trợ lý thông minh trong ứng dụng, sau đó lần lượt tham gia các nhóm thuật toán, sản phẩm C-end và kinh doanh Mini Program.
Lộ trình sản phẩm cuối cùng không phải là ứng dụng nguyên bản độc lập, cũng không phải là nhúng trợ lý vào ứng dụng hiện có, mà là chuyển đổi một cú nhấp chuột. Sau khi phiên bản mới lên sóng, mặc định mở ra vẫn là Alipay cũ, người dùng có thể tự đặt phiên bản AI làm giao diện ưu tiên. LatePost đưa tin, cách thức triển khai "để lại dư địa" này, hướng tới một cách nói nội bộ gọi là "Đổi lồng chim".
WeChat không để AI cản trở giữa người với người
Con đường AI của WeChat, từ đầu đã đi theo một logic khác.
Tuyên bố của Chủ tịch Tencent Liu Zhiping tại cuộc họp báo cáo tài chính Q3 2025 hầu như không có sự mơ hồ: Agent AI mà WeChat sẽ ra mắt sẽ kết nối sâu sắc với các mối quan hệ xã hội, khả năng liên lạc, tài khoản công khai và kênh video, đây là một Agent độc đáo. Không có lộ trình cấp tiến, chính thức còn hai lần lên tiếng phủ nhận tin đồn về trợ lý AI.
Tại sao WeChat không thể cắt một giao diện đối thoại như Alipay? Nguyên nhân không nằm ở năng lực công nghệ, mà ở thuộc tính sản phẩm. Giao diện cốt lõi của WeChat là danh sách trò chuyện, đây là trang di động mà một tỷ người mở ra thường xuyên nhất mỗi ngày. Bất kỳ hành động nào cố gắng chồng lên một cổng vào đối thoại AI trên giao diện này, đều có thể bị người dùng coi là sự can thiệp vào mối quan hệ xã hội. Trang chủ của Alipay là cổng vào dịch vụ, biến cổng vào dịch vụ thành cửa sổ đối thoại, người dùng cần thích nghi lại với một thói quen thao tác. Trang chủ của WeChat là đối thoại giữa người với người, thay thế hoặc chiếm chỗ đối thoại của con người bằng đối thoại AI, chạm vào vùng lãnh thổ tâm lý quan trọng nhất của người dùng.
Giải pháp của WeChat gần hơn với logic "ký sinh". Trợ lý AI không thay thế bất kỳ giao diện nào, nó ẩn trong các nhóm chat, trong các tài khoản công khai, như một Agent chờ được gọi. Có thể hình dung một cảnh như thế này: trong nhóm chat gia đình WeChat, ai đó chuyển tiếp một bài viết dài về địa điểm cắm trại gia đình từ một tài khoản công khai, các thành viên khác không cần mở ra đọc, trực tiếp trong nhóm nhờ trợ lý AI tóm tắt điểm chính, và để nó phối hợp lịch của các thành viên nhóm, đặt chỗ cho địa điểm được đề xuất trong bài viết. Agent tiêu hóa nội dung của tài khoản công khai, gọi dịch vụ đặt chỗ trong Mini Program, dựa trên thông tin lịch trình của nhiều thành viên trong nhóm chat để hoàn thành phối hợp thời gian, cuối cùng đẩy kết quả đặt chỗ trở lại nhóm.
Trong toàn bộ quá trình, AI luôn hoạt động trong ngữ cảnh của nhóm chat, người dùng vẫn thấy nhóm này, những người này, những cuộc đối thoại này. Việc "làm việc" mà Agent hoàn thành được nhúng vào mối quan hệ xã hội, thay vì tạo ra một giao diện khác để thể hiện sự tồn tại của mình.
Sự kiềm chế này có cái giá của nó. Trong WeChat, dịch vụ tồn tại dưới dạng Mini Program trên nền tảng, lên đến hàng triệu. Để AI thay người dùng hoàn thành những việc này, nó cần hiểu không chỉ ý định của người dùng, mà còn cả cấu trúc dữ liệu, logic trang và quy trình tương tác của chính các dịch vụ này. Alipay đối mặt với vấn đề tương tự, và giải pháp của hai bên xuất hiện một sự phân kỳ cốt lõi nhất trên đường đua này.
Đọc màn hình và đọc mã nguồn, hai giải pháp khó hơn ai
Cộng đồng mở WeChat đã phát hành "Hướng dẫn truy cập chế độ phát triển AI Mini Program (beta)" vào tháng 6 năm 2026, cung cấp hai chế độ.
Chế độ thứ nhất là "Chế độ tự động". Nhà phát triển ủy quyền cho nền tảng đọc mã nguồn Mini Program khi gửi duyệt, AI thông qua phân tích mã nguồn để hiểu cấu trúc trang và logic thao tác, trực tiếp điều khiển Mini Program. Chế độ thứ hai là "Chế độ phát triển", nhà phát triển đóng gói dịch vụ của mình thành Skill theo giao thức do WeChat định nghĩa, bao gồm giao diện nguyên tử và thành phần nguyên tử, AI hoàn thành nhiệm vụ thông qua việc gọi các giao diện tiêu chuẩn hóa này.
Giải pháp của Alipay là "chế độ song song". Theo LatePost, một mặt thúc đẩy các thương nhân có nguyện vọng chủ động truy cập, biến dịch vụ của họ thành MCP hoặc Skill mà AI có thể gọi trực tiếp; mặt khác, với sự ủy quyền của người dùng, AI thông qua thao tác "đọc màn hình" trên giao diện Mini Program hiện có, tương thích với các dịch vụ chưa được cải tạo.
So sánh hai bên, sự khác biệt cốt lõi nằm ở: khi cải tạo các Mini Program hiện có chưa sẵn sàng, WeChat yêu cầu nhà phát triển giao mã nguồn, Alipay chọn để AI thay người dùng thao tác dựa trên hình ảnh.
Từ cách diễn đạt trong tài liệu của cộng đồng mở WeChat, "Chế độ tự động" về mặt kỹ thuật là giải pháp triệt để hơn. Sau khi AI đọc mã nguồn, sự hiểu biết về trang là có cấu trúc, đường dẫn thao tác rõ ràng và kiểm soát được, không giống như đọc màn hình phụ thuộc vào nhận dạng hình ảnh và mô phỏng giao diện, xác suất sai sót thấp hơn. Nhưng bộ giải pháp này chuyển áp lực sang nhà phát triển. Mã nguồn là tài sản cốt lõi của nhà phát triển Mini Program, giao mã nguồn có nghĩa là để lộ hoàn toàn logic kinh doanh, cấu trúc dữ liệu, thiết kế tương tác của mình cho Tencent. Đối với các doanh nghiệp vừa và nhỏ kinh doanh thông qua Mini Program, đây không chỉ là lo ngại về mặt an ninh, mà còn là rủi ro thương mại: sau khi quy trình dịch vụ được nền tảng nắm hoàn toàn, còn lại bao nhiêu không gian trong phân phối lưu lượng và thương lượng?
Nếu không chọn "Chế độ tự động", chế độ phát triển cũng không dễ dàng. Nhà phát triển cần sắp xếp lại quy trình kinh doanh, chia nhỏ thành khả năng nguyên tử, đóng gói thành Skill theo giao thức WeChat định nghĩa, sau đó thông qua quy trình duyệt mới. Toàn bộ quy trình đặt món, thanh toán, xác nhận phiếu giảm giá, tích điểm thành viên của một Mini Program ẩm thực, khối lượng công việc phân giải và đóng gói có thể chiếm vài phần mười so với lần phát triển ban đầu. Ai sẽ gánh chịu chi phí này? WeChat chưa đưa ra phương án khuyến khích, ít nhất là hiện tại.
Giải pháp đọc màn hình của Alipay tránh được những vấn đề này. Nó không cần sự phối hợp của thương gia, không cần sửa mã, thậm chí thương gia không cần biết Mini Program của mình đang được AI thao tác. Người dùng nói vào giao diện đối thoại "Hãy mua cho tôi một vé tàu đến Thượng Hải", AI mở giao diện Mini Program của 12306, nhận diện điểm đi, điểm đến, danh sách chuyến tàu, nút chọn chỗ ngồi, trang xác nhận thanh toán, từng bước mô phỏng thao tác ngón tay của người dùng. Đối với các thương gia đã hoàn thành truy cập MCP hoặc Skill, AI có thể trực tiếp gọi giao diện tiêu chuẩn hóa, trải nghiệm mượt mà hơn; đối với hàng loạt dịch vụ dài đuôi chưa được cải tạo, đọc màn hình cung cấp con đường tương thích với ngưỡng thấp nhất.
Vấn đề của đọc màn hình cũng rất trực tiếp: độ ổn định chưa được xác nhận ở quy mô lớn. Giao diện của các Mini Program khác nhau rất nhiều, tải động, quảng cáo pop-up, thay đổi bố cục do cập nhật phiên bản, đều sẽ làm tăng xác suất nhận dạng thất bại của AI. Vị trí của một nút xác nhận thanh toán lệch đi vài pixel, liệu AI có thể nhấn chính xác không? Nếu xảy ra thao tác sai trong quá trình đọc màn hình, chẳng hạn như nhìn nhầm số tiền, chọn nhầm địa chỉ nhận hàng, trách nhiệm thuộc về ai? Alipay chưa công bố các điều khoản miễn trừ và cơ chế xử lý tranh chấp liên quan.
Logic của con đường này là để người dùng sử dụng trước. Khi thương gia thấy sự chuyển đổi đơn hàng do AI mang lại, tự nhiên sẽ chủ động truy cập giao diện tiêu chuẩn để tối ưu hóa trải nghiệm. Bên C thúc đẩy bên B.
300 triệu giao dịch xác nhận điều gì
Ngoài sản phẩm và hệ sinh thái, Alipay đã làm một việc khác, liên quan đến việc AI thanh toán như thế nào.
Tại Hội nghị hệ sinh thái thanh toán AI tháng 5 năm 2026, Alipay tiết lộ số lượng giao dịch thanh toán AI đã vượt quá 300 triệu giao dịch, hỗ trợ 95% khung Agent thông minh thông dụng, đồng thời phát hành Token Pay và Ví AI. Hai sản phẩm này là chìa khóa để hiểu cơ sở hạ tầng kinh tế Agent.
Token Pay giải quyết vấn đề thanh toán với số tiền cực nhỏ, tần suất cao. Khi AI so sánh giá giữa hai nền tảng giao đồ ăn, có thể cần gọi giao dịch xác nhận 0.01 nhân dân tệ để xác nhận tài khoản có hiệu lực; khi AI lọc ra tổ hợp ưu đãi tối ưu trong nhiều phiếu giảm giá, mỗi lần xác nhận một phiếu là một hành động thanh toán. Mặc dù số tiền giao dịch này rất nhỏ, nhưng tần suất cao hơn nhiều so với người dùng là con người. Hệ thống thanh toán trước đây được thiết kế cho "người xác nhận, người thanh toán", Token Pay giao hành động này cho Agent.
Ví AI giống như phát một thẻ ngân sách cho Agent hơn. Người dùng thiết lập quy tắc và giới hạn trên, AI tự chủ hoàn thành thanh toán trong phạm vi quy tắc. CEO Tập đoàn Ant, Han Xinyi, tại hội nghị đã đưa ra một nhận định: Trong tương lai, có thể sẽ có vô số Agent hoạt động trong các hoạt động kinh tế, hành động tương tác từ tương tác giữa người với người, biến thành tương tác giữa người với Agent, và tương tác giữa các Agent với nhau.
Giá trị tuyệt đối của con số 300 triệu giao dịch này trong toàn bộ quy mô giao dịch hàng năm của Alipay không phải là lớn, nhưng ý nghĩa của nó nằm ở việc xác nhận một điều: người dùng đã cho phép AI thay mình hoàn thành thực hiện thương mại thực tế, không chỉ dừng lại ở truy vấn và so sánh giá. Từ việc gọi xe đặt đồ uống bằng một câu nói đến thanh toán trừ tiền bằng AI, cả chuỗi công nghệ và chuỗi ủy quyền người dùng của vòng khép kín dịch vụ này đều được thông suốt.
WeChat Pay ở phía cải tạo AI chưa công bố phương án cụ thể. WeChat Pay cũng bao phủ lượng người dùng khổng lồ, nhưng các tình huống của nó chủ yếu gắn liền với chuyển khoản xã hội, phong bao đỏ, thu tiền thương gia. Hình thái kinh tế Agent có thể khác biệt, việc hai bên có hình thành sự khác biệt mới trong cơ sở hạ tầng thanh toán hay không, phụ thuộc vào việc khi trợ lý AI WeChat chính thức ra mắt có đi kèm khả năng thanh toán Agent tương tự hay không.
Hệ sinh thái đang bị xé ra hai vết nứt
Cả Alipay và WeChat đều hướng tới cổng vào dịch vụ Agent, nhưng sự khác biệt trong con đường trung gian sẽ xé ra hai vết nứt hướng đi khác nhau trong hệ sinh thái Mini Program.
Giải pháp đọc màn hình của Alipay khiến một lượng lớn Mini Program dài đuôi bị AI hóa một cách thụ động. Thương gia không làm gì, người dùng đã có thể thao tác dịch vụ của họ thông qua AI. Điều này sẽ tạo ra hai phản ứng: một số thương gia phát hiện lượng đơn hàng do AI mang lại đang tăng, chủ động truy cập MCP hoặc Skill để tối ưu hóa trải nghiệm, tranh giành thêm phân phối lưu lượng; số thương gia khác có thể phản đối, vì nguồn đơn hàng trở nên mờ nhạt. Trước đây, mỗi lần nhấp chuột của người dùng trong Mini Program đều có thể theo dõi được, bây giờ đoạn đường dẫn thao tác đọc màn hình của AI, thương gia không nhận được dữ liệu hành vi người dùng.
Nội bộ Alipay rõ ràng đã dự đoán được điều này. LatePost đưa tin, sau khi phiên bản AI Alipay lên sóng, nền tảng mở AI dành cho thương gia và nhà phát triển cũng sẽ sớm được phát hành. Nền tảng này rất có thể sẽ giải quyết vấn đề: làm thế nào để thương gia vừa tận hưởng được sự gia tăng đơn hàng do AI mang lại, vừa giữ được khả năng hiển thị và kiểm soát đối với quy trình dịch vụ, tiếp cận người dùng và phân phối lợi nhuận.
Áp lực ở phía WeChat khác. Ngưỡng ủy quyền mã nguồn sẽ lọc nhà phát triển thành hai nhóm. Nhà phát triển hàng đầu, có đội ngũ kỹ thuật, có thế mạnh thương lượng thương mại, sẵn sàng giao mã nguồn hoặc đầu tư nguồn lực đóng gói Skill, đổi lấy phân phối lưu lượng ưu tiên từ trợ lý AI WeChat. Nhưng phần lớn các doanh nghiệp vừa và nhỏ có thể vừa không muốn giao mã nguồn, vừa không đủ khả năng gánh chi phí đóng gói. Nếu sau khi trợ lý AI WeChat lên sóng, lưu lượng thực sự hướng về các thương gia được ủy quyền, những Mini Program chưa được ủy quyền sẽ bị gạt ra ngoài lề trong kênh phân phối dịch vụ AI. Về lâu dài, hệ sinh thái Mini Program của WeChat có thể tập trung hơn nữa vào các đầu mối, và điều này tạo ra sự căng thẳng với tường thuật hệ sinh thái "phi tập trung" mà WeChat luôn nhấn mạnh.
Một vấn đề ẩn hơn nằm trong tiêu chuẩn kỹ thuật. Alipay thúc đẩy MCP, WeChat định nghĩa bộ giao thức MCP Mini Program của riêng mình, mặc dù tên giống nhau, nhưng cách triển khai cụ thể không hoàn toàn tương thích. Một thương gia ẩm thực muốn cả AI Alipay và AI WeChat đều có thể gọi dịch vụ đặt món của mình, có thể cần đóng gói theo hai quy định riêng biệt. Đây không phải là một vấn đề kỹ thuật, nhưng nó là chi phí. Bên nào hình thành ưu thế quy mô trước, sẽ có quyền thương lượng lớn hơn để thúc đẩy tiêu chuẩn thực tế ngành. Vào thời điểm số lượng thanh toán AI của Alipay đã vượt 300 triệu giao dịch, ưu thế tạm thời thuộc về phía Alipay.
Quay trở lại phía người dùng, kết quả cuối cùng của sự cải tạo có thể định nghĩa lại mối quan hệ giữa con người và điện thoại di động. Nếu giao diện đối thoại của Alipay chạy thông, tần suất và tình huống người dùng mở Alipay sẽ thay đổi. Không phải chỉ mở khi trả tiền, mà là hỏi một câu khi có nhu cầu. Nếu Agent của WeChat chạy thông, cách người dùng làm việc trong nhóm chat sẽ thay đổi. Không cần thoát khỏi giao diện trò chuyện để tìm dịch vụ, mọi thứ được hoàn thành thông qua Agent trong nhóm chat.
Hai nền tảng trong "Cuộc chiến phong bao đỏ" đêm giao thừa năm 2014, đã thay đổi việc người dùng để tiền ở tài khoản nào. Lần này, cuộc chiến giành giật là người dùng sẽ giao câu nói "giúp tôi làm việc" cho ai.
12 năm trước, phong bao đỏ WeChat được Jack Ma gọi là "cuộc tấn công Trân Châu Cảng". 12 năm sau, tại thời điểm tin tức AI WeChat thật giả lẫn lộn truyền đi vài tháng, Alipay đã tiến lên sân khấu trước. Con đường nào trong hai con đường thực sự gần hơn với nhu cầu thực tế của thời đại Agent, câu trả lời không nằm ở buổi ra mắt sản phẩm, mà nằm ở việc hàng triệu Mini Program được đánh thức lại như thế nào, và trải nghiệm của hàng trăm triệu người dùng sau lần đầu tiên nói câu "giúp tôi" với điện thoại.






