Le premier à amener un système d'exploitation alimenté par IA à 1,4 milliard de personnes est... WeChat ?

marsbit發佈於 2026-06-10更新於 2026-06-10

文章摘要

L'IA de WeChat se met enfin en mouvement. Le jour même du WWDC d'Apple, WeChat a publié un guide d'intégration pour les développeurs, permettant aux IA d'accéder et d'opérer des mini-programmes. Deux modes sont proposés : un mode automatique sans code et un mode de développement pour des compétences sur mesure. Cette annonce signifie que WeChat transforme son écosystème entier — millions de mini-programmes, WeChat Pay, notifications — en une couche d'exécution pour l'IA. L'architecture technique, similaire au standard MCP, montre que WeChat a capitalisé sur l'expérience pratique pour créer des règles robustes, comme la priorité donnée aux réponses d'API et le format "fait + action". Contrairement à Apple dont l'approche est limitée avec les apps tierces, WeChat bénéficie d'un "point de vue divin" grâce à sa plateforme centralisée : il peut analyser le code des mini-programmes pour les rendre automatiquement actionnables par l'IA, sans effort supplémentaire pour les développeurs. Avec 1,432 milliard d'utilisateurs mensuels et une couverture quasi-totale des services quotidiens, WeChat est en position unique pour devenir le système d'exploitation de l'IA pour des centaines de millions de personnes. L'utilisateur pourrait simplement demander "Réserve-moi un billet de train pour Shanghai" et l'IA décomposerait la tâche, utiliserait les mini-programmes adéquats et finaliserait le paiement via WeChat Pay, le tout de manière transparente. Le défi reste la confiance, surtout pour...

L'IA de WeChat s'est enfin mise en mouvement.

Le même jour que le WWDC d'Apple, WeChat a fait quelque chose de potentiellement plus important qu'Apple : publier une annonce d'une simplicité trompeuse : « Guide pour les développeurs souhaitant intégrer l'écosystème IA de WeChat ».

Dès aujourd'hui, les développeurs de mini-programmes peuvent donner leur autorisation pour que l'IA de WeChat puisse lire, manipuler et appeler les fonctionnalités de leur mini-programme.

WeChat propose deux modes d'intégration. Le premier, le « mode automatique », a un seuil d'accès quasi nul. Le développeur active un simple interrupteur, et la plateforme lit automatiquement le code source, analyse les pages, comprend ce que le mini-programme peut faire, puis l'IA peut directement commencer à l'utiliser, sans écrire une seule ligne de code.

L'autre mode s'appelle « mode développement ». Ici, les développeurs créent leurs propres « Skills » personnalisés, qui, une fois validés, pourront être appelés par l'IA. Les deux modes peuvent être activés simultanément. Meituan a déjà annoncé son intégration.

Il ne faut pas voir cela simplement comme le lancement d'une nouvelle fonctionnalité, mais comprendre que WeChat est en train de transformer son écosystème entier — des millions de mini-programmes, WeChat Pay, les notifications de service, les comptes publics — en une couche d'exécution pour l'IA.

Plongée dans la documentation des Skills : Comment l'IA de WeChat utilise les mini-programmes

La documentation ouverte de WeChat détaille les spécifications techniques pour connecter un mini-programme aux Skills de l'IA. En y regardant de près, on découvre de nombreux détails de conception.

Lien vers la documentation officielle des skills 👇🏻 :

https://developers.weixin.qq.com/miniprogram/dev/ai/best-practices.html

D'un point de vue architectural, ceux qui ont déjà développé des solutions IA reconnaîtront immédiatement qu'il s'agit essentiellement de MCP. Le fichier mcp.json déclare la fonction et les paramètres de chaque interface atomique, et SKILL.md décrit comment s'exécute l'ensemble du flux de travail. Cela ressemble presque trait pour trait à l'architecture MCP+Skills utilisée dans Claude, Cursor ou VS Code. WeChat n'a pas tout réinventé, mais a directement adopté le standard qui émerge dans le secteur.

Dans ses recommandations, WeChat propose un système très clair de « pondération de l'attention ». Lorsque l'IA décide quelle interface appeler et quels paramètres générer, elle priorise d'abord le « content » renvoyé par l'interface (cinq étoiles), puis la « description » de l'interface (quatre étoiles) et la « description » des paramètres (quatre étoiles) dans le fichier mcp.json. Le fichier SKILL.md arrive en dernier (trois étoiles). Cela signifie que l'endroit où le développeur écrit est plus important que ce qu'il écrit. Une même règle écrite dans le retour d'interface ou dans SKILL.md aura un poids totalement différent pour l'IA.

Au niveau du retour d'interface, il existe une règle fondamentale : la structure en deux parties « fait + action ». Il faut d'abord dire à l'IA « ce qui s'est passé », puis lui dire « quelle est la prochaine étape ». Si on ne mentionne que l'action sans le fait, l'IA pourrait interpréter « afficher une carte » comme « préparer l'appel à l'interface suivante » et sauter la confirmation de l'utilisateur. C'est une règle qu'on ne rédige qu'après être tombé dans beaucoup de pièges.

Quatrièmement, la transmission des paramètres privilégie les ID par rapport au langage naturel. Prenons l'exemple de la scène de « commande de café » illustrée. L'utilisateur formule une demande, l'IA comprend l'intention vague ainsi que les options, modifie les spécifications, gère le paiement, le tout sans jamais quitter la boîte de dialogue.

Cette conception envoie un signal clair : WeChat a déjà testé suffisamment de cas d'usage en situation réelle, sait où se trouvent les pièges liés à l'appel de services externes par une IA, et a figé cette expérience dans une norme pour les développeurs.

En réalité, si l'on compare les écosystèmes de WeChat (mini-programmes) et d'Apple (App Store), tous deux réputés, WeChat bénéficie d'une « vue d'ensemble » (« Dieu ») sur son propre écosystème, un prérequis essentiel à toutes ces réalisations.

En quoi c'est peut-être plus important que l'IA d'Apple

Cette année, lors du WWDC, Apple a dévoilé la nouvelle version de son assistant IA Siri. Bien que connecté en sous-couche à Google Gemini et capable de créer des raccourcis en langage naturel, il n'a pas suscité beaucoup de discussions.

En y regardant de plus près, l'écart est flagrant : Apple cherche à faire en sorte que l'IA coordonne certaines fonctions natives au sein du système iOS. Dès qu'il s'agit d'applications tierces, ces apps installées sur votre téléphone, elle montre ses limites.

Prenez par exemple l'app Ele.me. Son code s'exécute sur les propres serveurs d'Ele.me, qu'Apple ne peut pas lire. Pour que Siri puisse appeler Ele.me, les ingénieurs d'Ele.me doivent volontairement se connecter à l'ensemble d'interfaces App Intents, négocier une par une, les intégrer une par une, ce qui prend du temps et des efforts.

En revanche, ce que fait WeChat, c'est permettre à l'IA de manipuler directement des millions de services tiers, car les mini-programmes sont différents. Le code de chaque mini-programme, depuis sa soumission par le développeur, en passant par la revue de WeChat, jusqu'à son exécution sur le téléphone de l'utilisateur, se trouve entièrement dans l'écosystème technique de WeChat. WeChat peut scanner le code lors de l'étape de validation, analyser automatiquement « quelles sont les pages de ce mini-programme, ce qu'il peut faire, quelles sont ses entrées et sorties ».

C'est pourquoi le « mode automatique » est possible. Le développeur n'a pas besoin d'écrire une ligne de code ; il active un interrupteur, et WeChat traduit automatiquement son mini-programme en un outil utilisable par l'IA. L'architecture de base de WeChat supporte naturellement cette approche, elle bénéficie d'une « vue d'ensemble » (« Dieu »), capable de mettre en œuvre une orchestration basée sur la centralisation.

Cet avantage architectural, Apple ne l'a pas. Google non plus.

Il est également intéressant de noter que, selon des rumeurs récentes, WeChat collaborerait avec Huawei, Honor, Xiaomi, OPPO et vivo pour lancer des capacités d'assistant A2A (Agent-to-Agent), permettant aux utilisateurs de lancer directement un appel audio/vidéo WeChat ou d'envoyer un message via l'assistant vocal de leur téléphone.

En interne, l'IA de WeChat peut appeler des millions de mini-programmes ; vers l'extérieur, les assistants IA des fabricants de téléphones peuvent appeler WeChat. WeChat est en train de devenir le super connecteur de l'ère de l'IA, le centre de service que toutes les IA peuvent intégrer.

L'ancienne prophétie du « WeChat OS »

Lorsque les mini-programmes ont été lancés, beaucoup plaisantaient en disant que WeChat voulait créer un « WeChat OS ». À l'époque, c'était plutôt une figure de style — les mini-programmes remplaçaient certaines fonctionnalités des applications, mais restaient fondamentalement une « plateforme d'applications légères ».

Plus fortuit, le mécanisme de validation centralisé conçu à l'époque l'était pour le contrôle de la qualité et de la sécurité. Mais neuf ans plus tard, cette conception initialement critiquée comme étant un « contrôle excessif » est devenue, par accident, un avantage infrastructurel à l'ère de l'IA. Les écosystèmes d'applications distribués (Apple/Android), qui semblaient alors plus « libres », sont aujourd'hui devenus un obstacle à l'intégration de l'IA.

Une ancienne prophétie, avec l'arrivée d'une nouvelle technologie — l'IA —, prend un tournant radical.

Dans des articles précédents sur OpenClaw et Feishu, j'ai émis un constat : la messagerie instantanée (IM) est l'entrée la plus naturelle pour un Agent IA, car la conversation est en soi la manière la plus naturelle d'interagir avec une IA, et l'écosystème de services intégré à l'IM (robots, paiement, mini-programmes) permet à l'IA non seulement de « discuter » mais aussi d'« agir ». Feishu évolue déjà dans cette direction, avec le lancement de l'amélioration de son Bot API et des nœuds Agent IA.

Cependant, Feishu est un outil de collaboration d'entreprise, couvrant des scénarios de travail. WeChat a une portée radicalement différente — 1,432 milliard d'utilisateurs actifs mensuels, des centaines de millions de mini-programmes dans des domaines variés, de la commande de nourriture à la prise de rendez-vous médicaux, en passant par l'achat de billets d'avion et le paiement des factures, couvrant presque tous les besoins quotidiens d'une personne.

Si l'IA de WeChat parvient réellement à utiliser ces mini-programmes de manière fluide pour accomplir des tâches, alors, comme le dit la prophétie, elle deviendra un système d'exploitation piloté par le langage naturel.

L'utilisateur dit simplement « Aide-moi à réserver un billet de train pour demain après-midi à 15h de Pékin à Shanghai », l'IA décompose l'intention, appelle le mini-programme 12306 pour rechercher les billets, choisir un siège, utilise WeChat Pay pour finaliser la commande, le tout sans quitter WeChat. En théorie, ce cheminement pourrait fonctionner dès aujourd'hui.

Bien sûr, il y a un fossé entre la théorie et la réalité. L'appel par l'IA de services impliquant des paiements exige un taux d'erreur proche de zéro — commander le mauvais café est une petite erreur, mais acheter le mauvais billet d'avion est grave. La précision requise du modèle sous-jacent est bien supérieure à celle d'un simple scénario de conversation. C'est aussi le goulot d'étranglement commun au déploiement mondial des Agents IA : passer de « capable de discuter » à « capable d'accomplir des tâches », ce n'est pas une question de métrique technique, mais de confiance.

Mais WeChat a au moins fait une chose correcte : il n'a pas construit un réseau de services à partir de zéro. Ces dernières années, ce que faisait ChatGPT, c'était d'abord avoir un « cerveau » intelligent, puis se connecter un par un à Shopify, DoorDash, Stripe, chaque connexion étant établie à partir de zéro. Aujourd'hui, les requêtes liées aux transactions représentent encore moins de 3% de son activité.

Le véritable changement qui va se produire sera, pour la majorité des utilisateurs, probablement imperceptible. Un jour, vous taperez dans WeChat « Aide-moi à réserver un billet pour Shanghai ce soir à 21h », et ce sera fait. Vous ne saurez même pas quel mini-programme a été appelé en arrière-plan, ni quel processus de paiement a été utilisé.

Cette « réalisation sans perception » est le véritable signe de maturité d'un Agent IA. Et WeChat est plus proche de cette étape que quiconque.

Cet article provient du compte public WeChat « APPSO », auteur : APPSO, découvreur de produits de demain

你可能也喜歡

Kraken计划为美国专业交易者推出CFTC监管的永续期货

加密货币交易所Kraken计划通过其收购的衍生品交易所Bitnomial，为符合条件的美国专业交易者推出受美国商品期货交易委员会（CFTC）监管的永续期货合约。此举旨在为美国交易者提供一个受监管的国内渠道，以获取在海外加密货币市场中占据主导地位的衍生品。永续期货是全球加密货币交易中的重要产品，允许交易者在没有到期日的情况下持有多头或空头头寸，并通过资金费率机制使合约价格贴近现货市场。由于监管限制，美国交易者此前难以通过本土受监管平台获得此类产品。 Kraken计划将这款产品整合至其Kraken Pro平台，为交易者提供统一的现货、保证金和期货交易界面。该合约设计将包含连续定价、无到期日以及每八小时结算的资金费率。然而，该产品目前仅面向符合条件的美国专业交易者，并非对所有零售用户开放。此举若成功推行，可能吸引更多流动性，并推动其他竞争对手寻求类似的受监管途径，从而将永续期货进一步纳入美国受监管的市场基础设施。不过，产品的实际影响将取决于用户准入范围、流动性深度以及执行质量等因素。

bitcoinist4 小時前

bitcoinist4 小時前

沃什首秀：史上最懂Crypto的FED主席会为市场带来惊喜还是惊吓？

2026年6月16日，新任美联储主席凯文·沃什将迎来首次货币政策记者会。他面临通胀升温、国债被抛售与白宫降息压力的复杂局面。沃什因个人资产中持有Solana等多个加密资产而备受关注，是首位间接投资加密领域的联储主席。沃什的政策立场呈现双重性：一方面，他以通胀鹰派著称，可能倾向紧缩货币政策；另一方面，他长期关注加密资产，视其为宏观经济的“监测器”和美国竞争力的组成部分，有望推动更友善的监管框架。这种“鹰派利率+友善监管”的组合可能成为影响加密市场的关键。其上任可能从三方面影响加密市场：一是监管范式从“防御”转向“整合”，利好稳定币和DeFi发展；二是其清晰的沟通可能降低市场政策不确定性；三是其背景可能加速全球机构资金配置加密资产。发布会结果可能呈现两种情境：若释放鸽派基调并认可数字资产创新，市场或迎惊喜；若鹰派超预期，强调加息，风险资产可能普遍承压。尽管沃什已承诺出售加密持仓，但其对技术的深层理解，长期看将为加密资产主流化提供更稳固的基础。市场关注点在于能否从其信号中窥见一个更具连贯性的新时代轮廓。

marsbit4 小時前

marsbit4 小時前

XRP Ledger 发布 3.2.0 版本升级并启用 XRPLd 新品牌名

XRP Ledger发布了3.2.0版本，这是对其底层区块链基础设施的一次重要升级。本次更新的核心是将运行网络的软件名称从“rippled”更名为“xrpld”，以更好地反映整个项目生态。与此前侧重于前端功能的版本不同，3.2.0版本优先进行了后端升级和效率提升，旨在增强网络性能并为未来的扩展做准备。关键改进包括内存优化措施，预计可节省高达40%的服务器内存使用。此次升级引入了名为“fixCleanup3_2_0”的修改，为单资产金库、借贷协议、权限系统、去中心化交易所、多用途代币和权限域等多个模块带来了安全性增强。开发团队还新增了不变性检查，以确保已删除账户不会在账本上留下不一致的数据，从而加强整个网络的完整性和可靠性。对于开发者而言，新版本增加了一项重要功能：应用程序无需连接服务器即可检索XRP Ledger协议和服务器定义信息，这将极大便利钱包、区块链浏览器和API等的开发工作。在可扩展性和稳定性方面，更新包括可配置的区块大小、通过nuDB实现的高效数据库存储，以及将gRPC服务器的TLS/双向TLS支持改为可选，以提升企业用户的性能和连接性。此外，默认对等端口从51235更改为2459，并修复了涉及自动做市商、支付、代币托管、多用途代币、订单簿和RPC等多个方面的问题。出于性能考虑，3.2.0版本暂时禁用了交易不变性检查，但开发团队表示这不会构成安全威胁。

TheNewsCrypto4 小時前

TheNewsCrypto4 小時前

AGI不是终点，DeepMind新论文：迈向ASI，真正的AI进步才刚开始

DeepMind团队最新研究报告提出，通用人工智能（AGI）很可能不是AI发展的终点。AI将继续超越人类水平，走向超级人工智能（ASI）。报告区分了AGI（达到人类中位认知水平）、ASI（在所有重要领域整体超越人类专家集体）和UAI（理论智能上界）三个概念，并探讨了从AGI迈向ASI的四条潜在路径：持续扩展计算、模型与数据规模；算法持续演化乃至范式转变；系统通过递归自我改进形成正反馈；以及通过多智能体协作形成超越单体的集体智能。报告同时指出了发展过程中可能面临的六大关键瓶颈：高质量人类数据可能面临枯竭的“数据墙”；能源、芯片等经济和自然资源压力；现有神经网络范式在持续学习、稳定推理等方面的根本性局限；研究难度随领域成熟而增加；AI可能难以自主提炼新概念原语的“抽象壁垒”；以及监管、治理与社会反弹带来的影响。报告最后强调，一旦AI能力超越人类，现有以人类水平为参照的评估体系将失效，需要建立面向后AGI时代的新评估机制。ASI的发展仍受物理规律、资源等现实约束，其具体路径与速度存在高度不确定性，未来需持续开展跨学科研究以应对这一前景。

marsbit6 小時前

marsbit6 小時前

Kraken推出OpenAI和Anthropic的Pre-IPO永续合约，提供高达5倍杠杆

加密货币交易所Kraken推出了针对OpenAI和Anthropic的“IPO前永续合约”（pre-IPO perps），允许符合条件的交易者在这两家备受关注的私人人工智能公司公开上市前，进行高达5倍杠杆的多空交易。此举标志着加密货币衍生品平台正超越数字资产范畴，尝试对接私人公司股权等链下资产，为散户投资者提供原本难以触及的热门投资主题（如AI）的敞口。然而，这类产品与普通的加密货币永续合约存在显著差异。其定价基于不透明、非连续的私人市场估值（受融资轮次、二级交易、IPO预期等因素影响），而非流动的现货市场价格，因此风险管理更为复杂。高杠杆进一步放大了与估值波动、流动性及上市时间表相关的独特风险。总之，Kraken的推出显示了加密交易基础设施向更广泛投机标的的扩张，为投资者提供了新的表达观点的工具，但产品本身风险较高，投资者需充分了解其复杂性和风险后再谨慎参与。

bitcoinist6 小時前

Kraken推出OpenAI和Anthropic的Pre-IPO永续合约，提供高达5倍杠杆

bitcoinist6 小時前

交易

現貨

合約

Le premier à amener un système d'exploitation alimenté par IA à 1,4 milliard de personnes est... WeChat ?

文章摘要

En quoi c'est peut-être plus important que l'IA d'Apple

L'ancienne prophétie du « WeChat OS »

相關問答

你可能也喜歡

Kraken计划为美国专业交易者推出CFTC监管的永续期货

沃什首秀：史上最懂Crypto的FED主席会为市场带来惊喜还是惊吓？

XRP Ledger 发布 3.2.0 版本升级并启用 XRPLd 新品牌名

AGI不是终点，DeepMind新论文：迈向ASI，真正的AI进步才刚开始

Kraken推出OpenAI和Anthropic的Pre-IPO永续合约，提供高达5倍杠杆

交易

熱門文章

如何購買PEOPLE

相關討論

熱門問答

熱門分類

熱門標籤