En mai 2026, Alipay a annoncé que le nombre de paiements par IA dépassait les 300 millions. Un mois plus tard, WeChat a ouvert aux développeurs l'accès à l'IA pour les mini-programmes, suscitant une controverse avec une exigence : l'autorisation pour la plateforme de lire le code source des mini-programmes.
Ces deux événements sont séparés de moins de 30 jours, mais ils représentent deux voies divergentes depuis plus d'un an. Selon le média LatePost, Alipay teste en interne une version IA de son application, portant le nom de code "Projet Bao". Il ne s'agit pas d'ajouter un assistant, mais de permettre aux utilisateurs de basculer d'un simple clic vers une interface entièrement nouvelle, axée sur le dialogue. Quant à WeChat, lors d'un appel aux résultats financiers, son président Liu Chi Ping a fixé la ligne directrice : "Un agent IA sera finalement intégré, mais en connexion profonde avec les relations sociales, les comptes officiels et les chaînes vidéo, sans calendrier précis."
Ces deux plateformes, chacune avec plus d'un milliard d'utilisateurs et des millions de mini-programmes, ont donné des réponses opposées à la même question : lorsque l'IA peut exécuter des services pour l'utilisateur, l'entrée doit-elle être réécrite ou dissimulée ?
Alipay ne modifie pas seulement l'interface
Pour comprendre ce qu'Alipay fait réellement, il faut examiner une action utilisateur concrète.
Auparavant, pour commander trois lattes avec moins de sucre et appeler un taxi pour l'aéroport dans Alipay, le processus standard était le suivant : trouver l'entrée du mini-programme de Didi, entrer la destination, confirmer la course ; quitter, trouver l'entrée du mini-programme de Luckin, choisir le produit, modifier la quantité de sucre, ajouter au panier, régler ; passer d'un mini-programme à l'autre pour effectuer les paiements. Chaque étape représentait un clic, un changement de page, une attente.
L'objectif du "Projet Bao" est de condenser tout cela en une phrase. L'utilisateur dit au dialogue : "Appelez-moi un taxi pour l'aéroport, et commandez trois lattes avec moins de sucre à proximité". L'IA prend en charge toutes les étapes suivantes : comprendre l'intention, décomposer la tâche, appeler les services de transport et de restauration correspondants, combiner les commandes, effectuer le paiement. L'interface d'interaction n'est plus une série d'entrées de mini-programmes, mais une fenêtre de chat.
Ce changement est si radical qu'il se voit dans le processus de conception interne. Selon LatePost, pour déterminer la nouvelle forme d'interaction, l'équipe du projet a produit plus de 100 versions de conception. Le choix final d'une solution centrée sur le dialogue repose sur le constat que le langage naturel est devenu le mode d'interaction dominant de l'IA, et que la distribution des services doit reconstruire son entrée dans cette direction, plutôt que de coller un patch IA sur l'ancien cadre.
Cette approche radicale n'a pas été le premier choix d'Alipay. À la fin de l'année 2023, lorsque la direction de la division Alipay a lancé une discussion sur "Comment évoluer vers l'intelligence", la première question posée était : modifier l'application existante ou en créer une nouvelle ? L'équipe du projet a initialement choisi la seconde option. En septembre 2024, lors de la conférence "The Bund Summit", Alipay a lancé l'application IA indépendante "Zhi Xiaobao", positionnée comme un assistant de vie IA.
Zhi Xiaobao n'a pas fonctionné comme prévu. Selon des sources informées, l'application indépendante n'a pas atteint le nombre d'utilisateurs actifs quotidiens (DAU) de l'assistant intelligent intégré à l'application principale. Cet assistant de dialogue, présent dans Alipay et bénéficiant du trafic de la page d'accueil, a maintenu un DAU de plusieurs millions et a accumulé bien plus de données d'interaction que l'application indépendante.
Une contrainte plus pratique existait également : à l'époque, le groupe Ant concentrait ses efforts sur le développement de l'application de santé "Ant Afu" et de l'IA générale "Ling Guang", avec des ressources informatiques et de développement limitées. Créer une autre application indépendante aurait non seulement concurrencé ces projets pour les ressources, mais aurait aussi entraîné des coûts énormes pour migrer les utilisateurs.
En mars 2025, l'équipe a changé de cap, abandonnant l'idée d'une application indépendante. Une conviction interne s'est progressivement formée : mieux servir la base existante de plus d'un milliard d'utilisateurs d'Alipay, en leur offrant des services IA sans coût de migration, était plus efficace que de créer une nouvelle application externe. En décembre 2025, le projet de version IA d'Alipay a été officiellement lancé, avec une équipe initiale provenant des équipes de l'assistant intelligent intégré, rejointes ensuite par des équipes d'algorithmes, de produits grand public et de mini-programmes.
La voie produit finale n'est ni une application native indépendante, ni un assistant intégré dans l'application existante, mais bien un basculement en un clic. Après le lancement de la nouvelle version, l'application Alipay standard s'ouvrira par défaut, mais l'utilisateur pourra choisir de définir la version IA comme interface principale. LatePost rapporte que cette approche progressive, "laissant une porte de sortie", est décrite en interne comme "changer l'oiseau en déplaçant la cage".
WeChat ne laisse pas l'IA s'interposer entre les personnes
La voie de WeChat en matière d'IA a, depuis le début, suivi une autre logique.
La déclaration du président de Tencent, Liu Chi Ping, lors de l'appel aux résultats du T3 2025, était pratiquement sans ambiguïté : L'agent IA que WeChat déploiera sera profondément connecté aux relations sociales, aux capacités de communication, aux comptes officiels et aux chaînes vidéo. C'est un Agent unique. Pas de calendrier agressif, et la société a même démenti à deux reprises des rumeurs concernant un assistant IA.
Pourquoi WeChat ne peut-il pas basculer vers une interface conversationnelle comme Alipay ? La raison n'est pas technique, mais liée à la nature du produit. L'interface principale de WeChat est la liste des conversations, la page de téléphone la plus fréquemment ouverte chaque jour par des milliards de personnes. Toute tentative de superposer une entrée de dialogue IA sur cette interface pourrait être perçue par les utilisateurs comme une perturbation des relations sociales. La page d'accueil d'Alipay est une entrée de services ; la transformer en fenêtre de dialogue demande aux utilisateurs de s'adapter à une nouvelle habitude opérationnelle. La page d'accueil de WeChat est celle des dialogues interpersonnels ; remplacer ou empiéter sur ces dialogues par des dialogues IA touche au territoire psychologique le plus important pour l'utilisateur.
La solution de WeChat se rapproche davantage d'une logique "parasite". L'assistant IA ne remplace aucune interface ; il se cache dans les conversations de groupe et les comptes officiels, attendant d'être invoqué en tant qu'Agent. On peut imaginer ce scénario : dans un groupe familial WeChat, quelqu'un partage un long article de compte officiel sur un terrain de camping familial. Les autres membres n'ont pas besoin de l'ouvrir ; ils demandent directement à l'assistant IA, dans le groupe, de résumer les points clés et de coordonner les agendas des membres pour réserver le terrain recommandé. L'Agent digère le contenu de l'article, appelle le service de réservation du mini-programme, coordonne les disponibilités des membres du groupe et renvoie le résultat de la réservation dans la conversation.
Pendant tout ce processus, l'IA opère toujours dans le contexte de la conversation de groupe ; l'utilisateur voit toujours ce groupe, ces personnes, ces conversations. Les "tâches" exécutées par l'Agent sont intégrées dans le tissu social, plutôt que de surgir sur une interface séparée pour afficher sa propre présence.
Cette retenue a un prix. Dans WeChat, les services sont fournis sous forme de mini-programmes, des millions. Pour que l'IA les exécute à la place de l'utilisateur, elle doit comprendre non seulement l'intention de l'utilisateur, mais aussi la structure des données, la logique des pages et les flux d'interaction de ces services. Alipay fait face au même problème, et leurs solutions ont donné lieu à la divergence la plus fondamentale dans cette course.
Lecture d'écran vs lecture du code source : quelle solution est la plus difficile ?
La communauté ouverte de WeChat a publié en juin 2026 le "Guide d'accès (bêta) au mode de développement IA pour mini-programmes", proposant deux modes.
Le premier est le "mode automatique". Le développeur autorise la plateforme à lire le code source du mini-programme lors de la soumission pour examen. L'IA analyse le code source pour comprendre la structure des pages et la logique opérationnelle, et manipule directement le mini-programme. Le second est le "mode de développement". Le développeur encapsule son service selon un protocole défini par WeChat en tant que Skill, comprenant des interfaces et composants atomiques. L'IA exécute les tâches en appelant ces interfaces standardisées.
La solution d'Alipay est un "système à double voie". D'après LatePost, d'un côté, la plateforme encourage les commerçants volontaires à s'intégrer activement, en transformant leurs services en MCP ou Skills directement appelables par l'IA. De l'autre, avec l'autorisation de l'utilisateur, l'IA peut prendre en charge les services non encore adaptés via des opérations de "lecture d'écran" sur l'interface existante du mini-programme.
La différence fondamentale est la suivante : pour adapter les mini-programmes existants non préparés, WeChat exige que le développeur fournisse le code source, tandis qu'Alipay choisit de laisser l'IA effectuer des opérations basées sur la reconnaissance visuelle pour le compte de l'utilisateur.
Selon la documentation de la communauté ouverte de WeChat, le "mode automatique" est techniquement une solution plus radicale. Après lecture du code source, la compréhension de la page par l'IA est structurée, les chemins d'opération sont clairs et contrôlables, et les risques d'erreur sont moindres que pour la lecture d'écran, qui dépend de la reconnaissance visuelle et de la simulation d'interface. Cependant, cette approche transfère la pression sur les développeurs. Le code source est un actif essentiel pour eux ; le fournir signifie exposer complètement leur logique métier, structure de données et conception d'interaction à Tencent. Pour les petites et moyennes entreprises qui dépendent des mini-programmes, cela représente non seulement un souci de sécurité, mais aussi un risque commercial : une fois que la plateforme maîtrise entièrement le processus de service, quelle marge de manœuvre reste-t-il en termes de distribution de trafic et de pouvoir de négociation ?
Si le "mode automatique" n'est pas choisi, le mode de développement n'est pas non plus facile. Les développeurs doivent réorganiser leurs processus métier, les décomposer en capacités atomiques, les encapsuler en Skills selon le protocole de WeChat, puis passer par un nouveau processus d'approbation. Pour un mini-programme de restauration, le travail de décomposition et d'encapsulation pour la commande, le paiement, la validation des coupons, les points de fidélité pourrait représenter une part importante du développement initial. Qui supportera ce coût ? WeChat n'a pas encore proposé de plan d'incitation, du moins pas pour l'instant.
La solution de lecture d'écran d'Alipay contourne ces problèmes. Elle ne nécessite pas la coopération du commerçant, ni de modifications de code. Le commerçant peut même ignorer que son mini-programme est manipulé par l'IA. L'utilisateur dit à l'interface conversationnelle : "Achetez-moi un billet de train pour Shanghai". L'IA ouvre l'interface du mini-programme 12306, reconnaît le lieu de départ, la destination, la liste des trains, les boutons de sélection de sièges, la page de confirmation de paiement, et simule étape par étape les actions de l'utilisateur. Pour les commerçants déjà intégrés via MCP ou Skill, l'IA peut appeler directement les interfaces standardisées, offrant une expérience plus fluide. Pour la multitude de services non adaptés, la lecture d'écran offre un chemin de compatibilité à très faible seuil.
Le problème de la lecture d'écran est direct : sa stabilité n'a pas été vérifiée à grande échelle. Les interfaces des mini-programmes sont très diverses. Le chargement dynamique, les publicités pop-up, les modifications de mise en page dues aux mises à jour peuvent augmenter la probabilité d'échec de reconnaissance de l'IA. Un bouton de confirmation de paiement décalé de quelques pixels sera-t-il identifié avec précision ? En cas d'erreur lors de la lecture d'écran (ex : montant mal lu, adresse de livraison erronée), qui est responsable ? Alipay n'a pas encore rendu public les clauses de non-responsabilité et les mécanismes de règlement des litiges associés.
La logique de cette voie est de laisser les utilisateurs commencer à l'utiliser d'abord. Lorsque les commerçants verront l'augmentation des commandes générée par l'IA, ils s'intégreront naturellement via les interfaces standard pour optimiser l'expérience. Le côté grand public pousse le côté entreprises.
Que démontrent les 300 millions de transactions ?
Au-delà du produit et de l'écosystème, Alipay a fait autre chose, lié à la manière dont l'IA paie.
Lors de la conférence sur l'écosystème des paiements par IA en mai 2026, Alipay a révélé que le nombre de paiements par IA dépassait les 300 millions, supportant 95 % des frameworks d'agents intelligents généraux, et a lancé Token Pay et le Portefeuille IA. Ces deux produits sont essentiels pour comprendre l'infrastructure économique des Agents.
Token Pay résout le problème des paiements de très faible montant et haute fréquence. Lorsque l'IA compare les prix entre deux plateformes de livraison de repas, elle peut avoir besoin d'effectuer une transaction de vérification de 0,01 € pour confirmer la validité d'un compte. Lorsqu'elle filtre les combinaisons de coupons les plus avantageuses, la validation de chaque coupon est une action de paiement. Ces transactions sont infimes, mais leur fréquence est bien supérieure à celle d'un utilisateur humain. Les anciens systèmes de paiement étaient conçus pour le schéma "confirmation humaine, paiement humain". Token Pay confie cette action à l'Agent.
Le Portefeuille IA ressemble davantage à une carte de budget attribuée à l'Agent. L'utilisateur définit des règles et une limite, et l'IA effectue les paiements de manière autonome dans ces limites. Le PDG d'Ant Group, Han Xinyi, a émis un constat lors de la conférence : "À l'avenir, d'innombrables Agents pourraient être actifs dans l'activité économique. Les interactions passeront des interactions personne-à-personne aux interactions personne-Agent, et même Agent-à-Agent."
En valeur absolue, le chiffre de 300 millions n'est pas énorme par rapport au volume annuel total de transactions d'Alipay, mais sa signification est de démontrer une chose : les utilisateurs autorisent déjà l'IA à exécuter de véritables engagements commerciaux en leur nom, au-delà de la simple consultation ou comparaison de prix. De la commande verbale de transport et de repas au paiement et débit par l'IA, la chaîne technologique et le processus d'autorisation utilisateur pour cette boucle de service complète ont été établis.
WeChat Pay n'a pas encore dévoilé de plan spécifique pour l'adaptation à l'IA. WeChat Pay couvre également une vaste base d'utilisateurs, mais ses scénarios sont davantage liés aux transferts sociaux, aux enveloppes rouges et aux paiements marchands. La forme de l'économie des Agents pourrait être différente. La question de savoir si des différences émergeront dans l'infrastructure de paiement dépendra de la capacité de paiement Agent que WeChat intégrera éventuellement à son assistant IA lors de son lancement officiel.
L'écosystème se fissure en suivant deux voies
Alipay et WeChat convergent tous deux vers une entrée de service Agent, mais leurs chemins différents vont créer deux fissures distinctes dans l'écosystème des mini-programmes.
La solution de lecture d'écran d'Alipay rend passivement compatibles avec l'IA une multitude de mini-programmes à longue traîne. Sans rien faire, les commerçants voient leurs services utilisables via l'IA. Cela peut provoquer deux types de réactions : une partie des commerçants, constatant une augmentation des commandes grâce à l'IA, s'intégrera activement via MCP ou Skill pour optimiser l'expérience et obtenir plus de trafic. Une autre partie pourrait montrer une résistance, car la source des commandes devient floue. Auparavant, chaque clic de l'utilisateur dans le mini-programme était traçable. Maintenant, pour la partie manipulée par l'IA via lecture d'écran, le commerçant n'a pas accès aux données comportementales de l'utilisateur.
Alipay a visiblement anticipé cela. Selon LatePost, après le lancement de la version IA d'Alipay, une plateforme ouverte IA pour les commerçants et développeurs sera bientôt publiée. Cette plateforme devra très probablement résoudre la question suivante : comment permettre aux commerçants de bénéficier de l'augmentation des commandes due à l'IA, tout en conservant une visibilité et un contrôle sur leurs processus de service, leur accès aux utilisateurs et la répartition de leurs revenus.
La pression du côté WeChat est différente. Le seuil d'accès via l'autorisation du code source va diviser les développeurs en deux groupes. Les grands développeurs, avec leurs équipes techniques et leur pouvoir de négociation commercial, seront prêts à fournir le code source ou à investir des ressources pour encapsuler leurs Skills, en échange d'une distribution prioritaire du trafic via l'assistant IA de WeChat. Mais de nombreuses petites et moyennes entreprises pourraient être réticentes à fournir le code source et incapables de supporter les coûts d'encapsulation. Si, après le lancement de l'assistant IA de WeChat, le trafic favorise effectivement les commerçants autorisés, les mini-programmes non autorisés risquent d'être marginalisés dans le canal de distribution des services IA. À long terme, l'écosystème des mini-programmes de WeChat pourrait se concentrer davantage vers les acteurs majeurs, ce qui créerait une tension avec le discours habituel de WeChat sur un écosystème "décentralisé".
Un problème plus subtil réside dans les standards techniques. Alipay promeut le MCP, et WeChat a défini son propre protocole MCP pour mini-programmes. Bien que le nom soit similaire, les implémentations spécifiques ne sont pas entièrement compatibles. Un restaurateur voulant que l'IA d'Alipay et celle de WeChat puissent appeler son service de commande devra peut-être encapsuler selon deux spécifications différentes. Ce n'est pas un défi technique insurmontable, mais c'est un coût supplémentaire. Celui qui prendra d'abord l'avantage en termes d'échelle aura un plus grand pouvoir de négociation pour imposer un standard de facto dans l'industrie. Au moment où les paiements IA d'Alipay dépassent les 300 millions, cet avantage est temporairement du côté d'Alipay.
Du point de vue de l'utilisateur final, le résultat de cette transformation pourrait redéfinir la relation entre l'homme et son téléphone. Si l'interface conversationnelle d'Alipay fonctionne, la fréquence et les scénarios d'ouverture d'Alipay changeront. On ne l'ouvrira plus seulement pour payer, mais pour exprimer une demande par une simple phrase. Si l'Agent de WeChat fonctionne, la manière dont les utilisateurs accomplissent des tâches dans les conversations de groupe changera. Ils n'auront plus besoin de quitter l'interface de discussion pour chercher un service ; tout se fera via l'Agent dans le groupe.
La "bataille des enveloppes rouges" des deux plateformes, la veille du Nouvel An chinois 2014, a changé l'endroit où les utilisateurs gardent leur argent. Cette fois, l'enjeu est de savoir à qui l'utilisateur confiera la phrase "Aide-moi à faire ça".
Il y a douze ans, les enveloppes rouges de WeChat ont été qualifiées par Jack Ma d'"attaque de Pearl Harbor". Douze ans plus tard, alors que les rumeurs sur l'IA de WeChat circulent depuis des mois, Alipay s'est avancé en premier sur scène. Laquelle de ces deux voies se rapproche le plus des besoins réels de l'ère des Agents ? La réponse ne se trouve pas dans les conférences de presse, mais dans la manière dont des millions de mini-programmes seront réactivés, et dans l'expérience des milliards d'utilisateurs qui, pour la première fois, diront à leur téléphone : "Aide-moi".






