Le premier à amener un système d'exploitation alimenté par IA à 1,4 milliard de personnes est... WeChat ?

marsbit發佈於 2026-06-10更新於 2026-06-10

文章摘要

L'IA de WeChat se met enfin en mouvement. Le jour même du WWDC d'Apple, WeChat a publié un guide d'intégration pour les développeurs, permettant aux IA d'accéder et d'opérer des mini-programmes. Deux modes sont proposés : un mode automatique sans code et un mode de développement pour des compétences sur mesure. Cette annonce signifie que WeChat transforme son écosystème entier — millions de mini-programmes, WeChat Pay, notifications — en une couche d'exécution pour l'IA. L'architecture technique, similaire au standard MCP, montre que WeChat a capitalisé sur l'expérience pratique pour créer des règles robustes, comme la priorité donnée aux réponses d'API et le format "fait + action". Contrairement à Apple dont l'approche est limitée avec les apps tierces, WeChat bénéficie d'un "point de vue divin" grâce à sa plateforme centralisée : il peut analyser le code des mini-programmes pour les rendre automatiquement actionnables par l'IA, sans effort supplémentaire pour les développeurs. Avec 1,432 milliard d'utilisateurs mensuels et une couverture quasi-totale des services quotidiens, WeChat est en position unique pour devenir le système d'exploitation de l'IA pour des centaines de millions de personnes. L'utilisateur pourrait simplement demander "Réserve-moi un billet de train pour Shanghai" et l'IA décomposerait la tâche, utiliserait les mini-programmes adéquats et finaliserait le paiement via WeChat Pay, le tout de manière transparente. Le défi reste la confiance, surtout pour...

L'IA de WeChat s'est enfin mise en mouvement.

Le même jour que le WWDC d'Apple, WeChat a fait quelque chose de potentiellement plus important qu'Apple : publier une annonce d'une simplicité trompeuse : « Guide pour les développeurs souhaitant intégrer l'écosystème IA de WeChat ».

Dès aujourd'hui, les développeurs de mini-programmes peuvent donner leur autorisation pour que l'IA de WeChat puisse lire, manipuler et appeler les fonctionnalités de leur mini-programme.

WeChat propose deux modes d'intégration. Le premier, le « mode automatique », a un seuil d'accès quasi nul. Le développeur active un simple interrupteur, et la plateforme lit automatiquement le code source, analyse les pages, comprend ce que le mini-programme peut faire, puis l'IA peut directement commencer à l'utiliser, sans écrire une seule ligne de code.

L'autre mode s'appelle « mode développement ». Ici, les développeurs créent leurs propres « Skills » personnalisés, qui, une fois validés, pourront être appelés par l'IA. Les deux modes peuvent être activés simultanément. Meituan a déjà annoncé son intégration.

Il ne faut pas voir cela simplement comme le lancement d'une nouvelle fonctionnalité, mais comprendre que WeChat est en train de transformer son écosystème entier — des millions de mini-programmes, WeChat Pay, les notifications de service, les comptes publics — en une couche d'exécution pour l'IA.

Plongée dans la documentation des Skills : Comment l'IA de WeChat utilise les mini-programmes

La documentation ouverte de WeChat détaille les spécifications techniques pour connecter un mini-programme aux Skills de l'IA. En y regardant de près, on découvre de nombreux détails de conception.

Lien vers la documentation officielle des skills 👇🏻 :

https://developers.weixin.qq.com/miniprogram/dev/ai/best-practices.html

D'un point de vue architectural, ceux qui ont déjà développé des solutions IA reconnaîtront immédiatement qu'il s'agit essentiellement de MCP. Le fichier mcp.json déclare la fonction et les paramètres de chaque interface atomique, et SKILL.md décrit comment s'exécute l'ensemble du flux de travail. Cela ressemble presque trait pour trait à l'architecture MCP+Skills utilisée dans Claude, Cursor ou VS Code. WeChat n'a pas tout réinventé, mais a directement adopté le standard qui émerge dans le secteur.

Dans ses recommandations, WeChat propose un système très clair de « pondération de l'attention ». Lorsque l'IA décide quelle interface appeler et quels paramètres générer, elle priorise d'abord le « content » renvoyé par l'interface (cinq étoiles), puis la « description » de l'interface (quatre étoiles) et la « description » des paramètres (quatre étoiles) dans le fichier mcp.json. Le fichier SKILL.md arrive en dernier (trois étoiles). Cela signifie que l'endroit où le développeur écrit est plus important que ce qu'il écrit. Une même règle écrite dans le retour d'interface ou dans SKILL.md aura un poids totalement différent pour l'IA.

Au niveau du retour d'interface, il existe une règle fondamentale : la structure en deux parties « fait + action ». Il faut d'abord dire à l'IA « ce qui s'est passé », puis lui dire « quelle est la prochaine étape ». Si on ne mentionne que l'action sans le fait, l'IA pourrait interpréter « afficher une carte » comme « préparer l'appel à l'interface suivante » et sauter la confirmation de l'utilisateur. C'est une règle qu'on ne rédige qu'après être tombé dans beaucoup de pièges.

Quatrièmement, la transmission des paramètres privilégie les ID par rapport au langage naturel. Prenons l'exemple de la scène de « commande de café » illustrée. L'utilisateur formule une demande, l'IA comprend l'intention vague ainsi que les options, modifie les spécifications, gère le paiement, le tout sans jamais quitter la boîte de dialogue.

Cette conception envoie un signal clair : WeChat a déjà testé suffisamment de cas d'usage en situation réelle, sait où se trouvent les pièges liés à l'appel de services externes par une IA, et a figé cette expérience dans une norme pour les développeurs.

En réalité, si l'on compare les écosystèmes de WeChat (mini-programmes) et d'Apple (App Store), tous deux réputés, WeChat bénéficie d'une « vue d'ensemble » (« Dieu ») sur son propre écosystème, un prérequis essentiel à toutes ces réalisations.

En quoi c'est peut-être plus important que l'IA d'Apple

Cette année, lors du WWDC, Apple a dévoilé la nouvelle version de son assistant IA Siri. Bien que connecté en sous-couche à Google Gemini et capable de créer des raccourcis en langage naturel, il n'a pas suscité beaucoup de discussions.

En y regardant de plus près, l'écart est flagrant : Apple cherche à faire en sorte que l'IA coordonne certaines fonctions natives au sein du système iOS. Dès qu'il s'agit d'applications tierces, ces apps installées sur votre téléphone, elle montre ses limites.

Prenez par exemple l'app Ele.me. Son code s'exécute sur les propres serveurs d'Ele.me, qu'Apple ne peut pas lire. Pour que Siri puisse appeler Ele.me, les ingénieurs d'Ele.me doivent volontairement se connecter à l'ensemble d'interfaces App Intents, négocier une par une, les intégrer une par une, ce qui prend du temps et des efforts.

En revanche, ce que fait WeChat, c'est permettre à l'IA de manipuler directement des millions de services tiers, car les mini-programmes sont différents. Le code de chaque mini-programme, depuis sa soumission par le développeur, en passant par la revue de WeChat, jusqu'à son exécution sur le téléphone de l'utilisateur, se trouve entièrement dans l'écosystème technique de WeChat. WeChat peut scanner le code lors de l'étape de validation, analyser automatiquement « quelles sont les pages de ce mini-programme, ce qu'il peut faire, quelles sont ses entrées et sorties ».

C'est pourquoi le « mode automatique » est possible. Le développeur n'a pas besoin d'écrire une ligne de code ; il active un interrupteur, et WeChat traduit automatiquement son mini-programme en un outil utilisable par l'IA. L'architecture de base de WeChat supporte naturellement cette approche, elle bénéficie d'une « vue d'ensemble » (« Dieu »), capable de mettre en œuvre une orchestration basée sur la centralisation.

Cet avantage architectural, Apple ne l'a pas. Google non plus.

Il est également intéressant de noter que, selon des rumeurs récentes, WeChat collaborerait avec Huawei, Honor, Xiaomi, OPPO et vivo pour lancer des capacités d'assistant A2A (Agent-to-Agent), permettant aux utilisateurs de lancer directement un appel audio/vidéo WeChat ou d'envoyer un message via l'assistant vocal de leur téléphone.

En interne, l'IA de WeChat peut appeler des millions de mini-programmes ; vers l'extérieur, les assistants IA des fabricants de téléphones peuvent appeler WeChat. WeChat est en train de devenir le super connecteur de l'ère de l'IA, le centre de service que toutes les IA peuvent intégrer.

L'ancienne prophétie du « WeChat OS »

Lorsque les mini-programmes ont été lancés, beaucoup plaisantaient en disant que WeChat voulait créer un « WeChat OS ». À l'époque, c'était plutôt une figure de style — les mini-programmes remplaçaient certaines fonctionnalités des applications, mais restaient fondamentalement une « plateforme d'applications légères ».

Plus fortuit, le mécanisme de validation centralisé conçu à l'époque l'était pour le contrôle de la qualité et de la sécurité. Mais neuf ans plus tard, cette conception initialement critiquée comme étant un « contrôle excessif » est devenue, par accident, un avantage infrastructurel à l'ère de l'IA. Les écosystèmes d'applications distribués (Apple/Android), qui semblaient alors plus « libres », sont aujourd'hui devenus un obstacle à l'intégration de l'IA.

Une ancienne prophétie, avec l'arrivée d'une nouvelle technologie — l'IA —, prend un tournant radical.

Dans des articles précédents sur OpenClaw et Feishu, j'ai émis un constat : la messagerie instantanée (IM) est l'entrée la plus naturelle pour un Agent IA, car la conversation est en soi la manière la plus naturelle d'interagir avec une IA, et l'écosystème de services intégré à l'IM (robots, paiement, mini-programmes) permet à l'IA non seulement de « discuter » mais aussi d'« agir ». Feishu évolue déjà dans cette direction, avec le lancement de l'amélioration de son Bot API et des nœuds Agent IA.

Cependant, Feishu est un outil de collaboration d'entreprise, couvrant des scénarios de travail. WeChat a une portée radicalement différente — 1,432 milliard d'utilisateurs actifs mensuels, des centaines de millions de mini-programmes dans des domaines variés, de la commande de nourriture à la prise de rendez-vous médicaux, en passant par l'achat de billets d'avion et le paiement des factures, couvrant presque tous les besoins quotidiens d'une personne.

Si l'IA de WeChat parvient réellement à utiliser ces mini-programmes de manière fluide pour accomplir des tâches, alors, comme le dit la prophétie, elle deviendra un système d'exploitation piloté par le langage naturel.

L'utilisateur dit simplement « Aide-moi à réserver un billet de train pour demain après-midi à 15h de Pékin à Shanghai », l'IA décompose l'intention, appelle le mini-programme 12306 pour rechercher les billets, choisir un siège, utilise WeChat Pay pour finaliser la commande, le tout sans quitter WeChat. En théorie, ce cheminement pourrait fonctionner dès aujourd'hui.

Bien sûr, il y a un fossé entre la théorie et la réalité. L'appel par l'IA de services impliquant des paiements exige un taux d'erreur proche de zéro — commander le mauvais café est une petite erreur, mais acheter le mauvais billet d'avion est grave. La précision requise du modèle sous-jacent est bien supérieure à celle d'un simple scénario de conversation. C'est aussi le goulot d'étranglement commun au déploiement mondial des Agents IA : passer de « capable de discuter » à « capable d'accomplir des tâches », ce n'est pas une question de métrique technique, mais de confiance.

Mais WeChat a au moins fait une chose correcte : il n'a pas construit un réseau de services à partir de zéro. Ces dernières années, ce que faisait ChatGPT, c'était d'abord avoir un « cerveau » intelligent, puis se connecter un par un à Shopify, DoorDash, Stripe, chaque connexion étant établie à partir de zéro. Aujourd'hui, les requêtes liées aux transactions représentent encore moins de 3% de son activité.

Le véritable changement qui va se produire sera, pour la majorité des utilisateurs, probablement imperceptible. Un jour, vous taperez dans WeChat « Aide-moi à réserver un billet pour Shanghai ce soir à 21h », et ce sera fait. Vous ne saurez même pas quel mini-programme a été appelé en arrière-plan, ni quel processus de paiement a été utilisé.

Cette « réalisation sans perception » est le véritable signe de maturité d'un Agent IA. Et WeChat est plus proche de cette étape que quiconque.

Cet article provient du compte public WeChat « APPSO », auteur : APPSO, découvreur de produits de demain

相關問答

QQuelle est la principale différence entre l'approche de l'IA de WeChat et celle d'Apple (Siri) pour interagir avec les services tiers ?

ALa différence clé réside dans l'architecture et le contrôle. WeChat, grâce à son écosystème centralisé de mini-programmes, possède une « vue d'ensemble » (God's Eye View). Il peut automatiquement analyser le code d'un mini-programme, comprendre ses fonctionnalités et le rendre utilisable par l'IA via un simple interrupteur, sans effort supplémentaire du développeur. En revanche, l'écosystème d'applications iOS d'Apple est distribué. Pour que Siri interagisse avec une application tierce comme Ele.me, Apple doit compter sur les développeurs de cette application pour implémenter manuellement et individuellement des interfaces spécifiques (App Intents), ce qui est un processus plus lent et plus fragmenté.

QQuels sont les deux modes d'intégration proposés par WeChat pour connecter les mini-programmes à son IA ?

AWeChat propose deux modes d'intégration : 1. Le « mode automatique » : le développeur active simplement un interrupteur. La plateforme WeChat analyse automatiquement le code source et la structure du mini-programme pour déterminer ce qu'il peut faire, permettant à l'IA de l'utiliser sans qu'aucune ligne de code supplémentaire ne soit écrite. 2. Le « mode développement » : les développeurs créent des « Skills » (compétences) personnalisées pour leur mini-programme. Après approbation, ces Skills peuvent être appelées par l'IA de WeChat. Il est possible d'activer les deux modes simultanément.

QSelon l'article, pourquoi la structure centralisée des mini-programmes de WeChat, initialement critiquée, est-elle devenue un avantage à l'ère de l'IA ?

ALe processus de révision et de déploiement centralisé des mini-programmes, autrefois critiqué pour son contrôle excessif, garantit que tout le code s'exécute dans l'écosystème technique de WeChat. Cela donne à WeChat une visibilité et un contrôle complets sur chaque service. Cette « vue d'ensemble » centrale permet à WeChat d'analyser automatiquement les capacités des millions de mini-programmes et de les rendre interopérables avec l'IA de manière standardisée. À l'inverse, les écosystèmes d'applications distribués (comme iOS et Android), perçus comme plus « libres », rencontrent des obstacles pour permettre à une IA de comprendre et d'utiliser de manière homogène des applications tierces dont elle ne maîtrise pas l'infrastructure.

QQuelle est la règle de conception principale pour les réponses d'interface que WeChat recommande aux développeurs de suivre, afin d'assurer une interaction fiable avec l'IA ?

ALa règle principale est la structure en deux parties « Fait + Action ». La réponse de l'interface doit d'abord indiquer à l'IA « ce qui s'est passé » (le fait, par exemple, l'état d'une commande), puis lui dire « quelle est la prochaine étape possible » (l'action, par exemple, « confirmer la commande »). Si seul l'élément « action » est fourni, l'IA pourrait mal interpréter l'instruction et passer directement à l'étape suivante sans attendre une confirmation de l'utilisateur, ce qui pourrait entraîner des erreurs.

QQuel est, selon l'auteur, le principal défi à surmonter pour que l'IA de WeChat passe de « pouvoir discuter » à « pouvoir accomplir des tâches » de manière fiable ?

ALe défi principal n'est pas purement technique, mais concerne la « confiance ». Lorsque l'IA effectue des actions réelles, en particulier dans des scénarios impliquant des paiements ou des décisions importantes (comme réserver un billet d'avion), le taux d'erreur doit être proche de zéro. Une erreur de conversation est mineure, mais une erreur dans une transaction a des conséquences graves. La précision requise du modèle d'IA sous-jacent est donc bien plus élevée que pour un simple chat. C'est le goulot d'étranglement universel pour le déploiement des agents IA : établir une fiabilité suffisante pour que les utilisateurs leur confient des tâches critiques.

你可能也喜歡

XRP Ledger 发布 3.2.0 版本升级并启用 XRPLd 新品牌名

XRP Ledger发布了3.2.0版本,这是对其底层区块链基础设施的一次重要升级。本次更新的核心是将运行网络的软件名称从“rippled”更名为“xrpld”,以更好地反映整个项目生态。 与此前侧重于前端功能的版本不同,3.2.0版本优先进行了后端升级和效率提升,旨在增强网络性能并为未来的扩展做准备。关键改进包括内存优化措施,预计可节省高达40%的服务器内存使用。 此次升级引入了名为“fixCleanup3_2_0”的修改,为单资产金库、借贷协议、权限系统、去中心化交易所、多用途代币和权限域等多个模块带来了安全性增强。开发团队还新增了不变性检查,以确保已删除账户不会在账本上留下不一致的数据,从而加强整个网络的完整性和可靠性。 对于开发者而言,新版本增加了一项重要功能:应用程序无需连接服务器即可检索XRP Ledger协议和服务器定义信息,这将极大便利钱包、区块链浏览器和API等的开发工作。 在可扩展性和稳定性方面,更新包括可配置的区块大小、通过nuDB实现的高效数据库存储,以及将gRPC服务器的TLS/双向TLS支持改为可选,以提升企业用户的性能和连接性。此外,默认对等端口从51235更改为2459,并修复了涉及自动做市商、支付、代币托管、多用途代币、订单簿和RPC等多个方面的问题。出于性能考虑,3.2.0版本暂时禁用了交易不变性检查,但开发团队表示这不会构成安全威胁。

TheNewsCrypto4 小時前

XRP Ledger 发布 3.2.0 版本升级并启用 XRPLd 新品牌名

TheNewsCrypto4 小時前

交易

現貨
合約

熱門文章

如何購買PEOPLE

歡迎來到HTX.com!在這裡,購買ConstitutionDAO (PEOPLE)變得簡單而便捷。跟隨我們的逐步指南,放心開始您的加密貨幣之旅。第一步:創建您的HTX帳戶使用您的 Email、手機號碼在HTX註冊一個免費帳戶。體驗無憂的註冊過程並解鎖所有平台功能。立即註冊第二步:前往買幣頁面,選擇您的支付方式信用卡/金融卡購買:使用您的Visa或Mastercard即時購買ConstitutionDAO (PEOPLE)。餘額購買:使用您HTX帳戶餘額中的資金進行無縫交易。第三方購買:探索諸如Google Pay或Apple Pay等流行支付方式以增加便利性。C2C購買:在HTX平台上直接與其他用戶交易。HTX 場外交易 (OTC) 購買:為大量交易者提供個性化服務和競爭性匯率。第三步:存儲您的ConstitutionDAO (PEOPLE)購買ConstitutionDAO (PEOPLE)後,將其存儲在您的HTX帳戶中。您也可以透過區塊鏈轉帳將其發送到其他地址或者用於交易其他加密貨幣。第四步:交易ConstitutionDAO (PEOPLE)在HTX的現貨市場輕鬆交易ConstitutionDAO (PEOPLE)。前往您的帳戶,選擇交易對,執行交易,並即時監控。HTX為初學者和經驗豐富的交易者提供了友好的用戶體驗。

800 人學過發佈於 2024.12.12更新於 2026.06.02

如何購買PEOPLE

相關討論

歡迎來到 HTX 社群。在這裡,您可以了解最新的平台發展動態並獲得專業的市場意見。 以下是用戶對 PEOPLE (PEOPLE)幣價的意見。

活动图片