Le premier à amener un système d'exploitation alimenté par IA à 1,4 milliard de personnes est... WeChat ?

marsbitPublicado a 2026-06-10Actualizado a 2026-06-10

Resumen

L'IA de WeChat se met enfin en mouvement. Le jour même du WWDC d'Apple, WeChat a publié un guide d'intégration pour les développeurs, permettant aux IA d'accéder et d'opérer des mini-programmes. Deux modes sont proposés : un mode automatique sans code et un mode de développement pour des compétences sur mesure. Cette annonce signifie que WeChat transforme son écosystème entier — millions de mini-programmes, WeChat Pay, notifications — en une couche d'exécution pour l'IA. L'architecture technique, similaire au standard MCP, montre que WeChat a capitalisé sur l'expérience pratique pour créer des règles robustes, comme la priorité donnée aux réponses d'API et le format "fait + action". Contrairement à Apple dont l'approche est limitée avec les apps tierces, WeChat bénéficie d'un "point de vue divin" grâce à sa plateforme centralisée : il peut analyser le code des mini-programmes pour les rendre automatiquement actionnables par l'IA, sans effort supplémentaire pour les développeurs. Avec 1,432 milliard d'utilisateurs mensuels et une couverture quasi-totale des services quotidiens, WeChat est en position unique pour devenir le système d'exploitation de l'IA pour des centaines de millions de personnes. L'utilisateur pourrait simplement demander "Réserve-moi un billet de train pour Shanghai" et l'IA décomposerait la tâche, utiliserait les mini-programmes adéquats et finaliserait le paiement via WeChat Pay, le tout de manière transparente. Le défi reste la confiance, surtout pour...

L'IA de WeChat s'est enfin mise en mouvement.

Le même jour que le WWDC d'Apple, WeChat a fait quelque chose de potentiellement plus important qu'Apple : publier une annonce d'une simplicité trompeuse : « Guide pour les développeurs souhaitant intégrer l'écosystème IA de WeChat ».

Dès aujourd'hui, les développeurs de mini-programmes peuvent donner leur autorisation pour que l'IA de WeChat puisse lire, manipuler et appeler les fonctionnalités de leur mini-programme.

WeChat propose deux modes d'intégration. Le premier, le « mode automatique », a un seuil d'accès quasi nul. Le développeur active un simple interrupteur, et la plateforme lit automatiquement le code source, analyse les pages, comprend ce que le mini-programme peut faire, puis l'IA peut directement commencer à l'utiliser, sans écrire une seule ligne de code.

L'autre mode s'appelle « mode développement ». Ici, les développeurs créent leurs propres « Skills » personnalisés, qui, une fois validés, pourront être appelés par l'IA. Les deux modes peuvent être activés simultanément. Meituan a déjà annoncé son intégration.

Il ne faut pas voir cela simplement comme le lancement d'une nouvelle fonctionnalité, mais comprendre que WeChat est en train de transformer son écosystème entier — des millions de mini-programmes, WeChat Pay, les notifications de service, les comptes publics — en une couche d'exécution pour l'IA.

Plongée dans la documentation des Skills : Comment l'IA de WeChat utilise les mini-programmes

La documentation ouverte de WeChat détaille les spécifications techniques pour connecter un mini-programme aux Skills de l'IA. En y regardant de près, on découvre de nombreux détails de conception.

Lien vers la documentation officielle des skills 👇🏻 :

https://developers.weixin.qq.com/miniprogram/dev/ai/best-practices.html

D'un point de vue architectural, ceux qui ont déjà développé des solutions IA reconnaîtront immédiatement qu'il s'agit essentiellement de MCP. Le fichier mcp.json déclare la fonction et les paramètres de chaque interface atomique, et SKILL.md décrit comment s'exécute l'ensemble du flux de travail. Cela ressemble presque trait pour trait à l'architecture MCP+Skills utilisée dans Claude, Cursor ou VS Code. WeChat n'a pas tout réinventé, mais a directement adopté le standard qui émerge dans le secteur.

Dans ses recommandations, WeChat propose un système très clair de « pondération de l'attention ». Lorsque l'IA décide quelle interface appeler et quels paramètres générer, elle priorise d'abord le « content » renvoyé par l'interface (cinq étoiles), puis la « description » de l'interface (quatre étoiles) et la « description » des paramètres (quatre étoiles) dans le fichier mcp.json. Le fichier SKILL.md arrive en dernier (trois étoiles). Cela signifie que l'endroit où le développeur écrit est plus important que ce qu'il écrit. Une même règle écrite dans le retour d'interface ou dans SKILL.md aura un poids totalement différent pour l'IA.

Au niveau du retour d'interface, il existe une règle fondamentale : la structure en deux parties « fait + action ». Il faut d'abord dire à l'IA « ce qui s'est passé », puis lui dire « quelle est la prochaine étape ». Si on ne mentionne que l'action sans le fait, l'IA pourrait interpréter « afficher une carte » comme « préparer l'appel à l'interface suivante » et sauter la confirmation de l'utilisateur. C'est une règle qu'on ne rédige qu'après être tombé dans beaucoup de pièges.

Quatrièmement, la transmission des paramètres privilégie les ID par rapport au langage naturel. Prenons l'exemple de la scène de « commande de café » illustrée. L'utilisateur formule une demande, l'IA comprend l'intention vague ainsi que les options, modifie les spécifications, gère le paiement, le tout sans jamais quitter la boîte de dialogue.

Cette conception envoie un signal clair : WeChat a déjà testé suffisamment de cas d'usage en situation réelle, sait où se trouvent les pièges liés à l'appel de services externes par une IA, et a figé cette expérience dans une norme pour les développeurs.

En réalité, si l'on compare les écosystèmes de WeChat (mini-programmes) et d'Apple (App Store), tous deux réputés, WeChat bénéficie d'une « vue d'ensemble » (« Dieu ») sur son propre écosystème, un prérequis essentiel à toutes ces réalisations.

En quoi c'est peut-être plus important que l'IA d'Apple

Cette année, lors du WWDC, Apple a dévoilé la nouvelle version de son assistant IA Siri. Bien que connecté en sous-couche à Google Gemini et capable de créer des raccourcis en langage naturel, il n'a pas suscité beaucoup de discussions.

En y regardant de plus près, l'écart est flagrant : Apple cherche à faire en sorte que l'IA coordonne certaines fonctions natives au sein du système iOS. Dès qu'il s'agit d'applications tierces, ces apps installées sur votre téléphone, elle montre ses limites.

Prenez par exemple l'app Ele.me. Son code s'exécute sur les propres serveurs d'Ele.me, qu'Apple ne peut pas lire. Pour que Siri puisse appeler Ele.me, les ingénieurs d'Ele.me doivent volontairement se connecter à l'ensemble d'interfaces App Intents, négocier une par une, les intégrer une par une, ce qui prend du temps et des efforts.

En revanche, ce que fait WeChat, c'est permettre à l'IA de manipuler directement des millions de services tiers, car les mini-programmes sont différents. Le code de chaque mini-programme, depuis sa soumission par le développeur, en passant par la revue de WeChat, jusqu'à son exécution sur le téléphone de l'utilisateur, se trouve entièrement dans l'écosystème technique de WeChat. WeChat peut scanner le code lors de l'étape de validation, analyser automatiquement « quelles sont les pages de ce mini-programme, ce qu'il peut faire, quelles sont ses entrées et sorties ».

C'est pourquoi le « mode automatique » est possible. Le développeur n'a pas besoin d'écrire une ligne de code ; il active un interrupteur, et WeChat traduit automatiquement son mini-programme en un outil utilisable par l'IA. L'architecture de base de WeChat supporte naturellement cette approche, elle bénéficie d'une « vue d'ensemble » (« Dieu »), capable de mettre en œuvre une orchestration basée sur la centralisation.

Cet avantage architectural, Apple ne l'a pas. Google non plus.

Il est également intéressant de noter que, selon des rumeurs récentes, WeChat collaborerait avec Huawei, Honor, Xiaomi, OPPO et vivo pour lancer des capacités d'assistant A2A (Agent-to-Agent), permettant aux utilisateurs de lancer directement un appel audio/vidéo WeChat ou d'envoyer un message via l'assistant vocal de leur téléphone.

En interne, l'IA de WeChat peut appeler des millions de mini-programmes ; vers l'extérieur, les assistants IA des fabricants de téléphones peuvent appeler WeChat. WeChat est en train de devenir le super connecteur de l'ère de l'IA, le centre de service que toutes les IA peuvent intégrer.

L'ancienne prophétie du « WeChat OS »

Lorsque les mini-programmes ont été lancés, beaucoup plaisantaient en disant que WeChat voulait créer un « WeChat OS ». À l'époque, c'était plutôt une figure de style — les mini-programmes remplaçaient certaines fonctionnalités des applications, mais restaient fondamentalement une « plateforme d'applications légères ».

Plus fortuit, le mécanisme de validation centralisé conçu à l'époque l'était pour le contrôle de la qualité et de la sécurité. Mais neuf ans plus tard, cette conception initialement critiquée comme étant un « contrôle excessif » est devenue, par accident, un avantage infrastructurel à l'ère de l'IA. Les écosystèmes d'applications distribués (Apple/Android), qui semblaient alors plus « libres », sont aujourd'hui devenus un obstacle à l'intégration de l'IA.

Une ancienne prophétie, avec l'arrivée d'une nouvelle technologie — l'IA —, prend un tournant radical.

Dans des articles précédents sur OpenClaw et Feishu, j'ai émis un constat : la messagerie instantanée (IM) est l'entrée la plus naturelle pour un Agent IA, car la conversation est en soi la manière la plus naturelle d'interagir avec une IA, et l'écosystème de services intégré à l'IM (robots, paiement, mini-programmes) permet à l'IA non seulement de « discuter » mais aussi d'« agir ». Feishu évolue déjà dans cette direction, avec le lancement de l'amélioration de son Bot API et des nœuds Agent IA.

Cependant, Feishu est un outil de collaboration d'entreprise, couvrant des scénarios de travail. WeChat a une portée radicalement différente — 1,432 milliard d'utilisateurs actifs mensuels, des centaines de millions de mini-programmes dans des domaines variés, de la commande de nourriture à la prise de rendez-vous médicaux, en passant par l'achat de billets d'avion et le paiement des factures, couvrant presque tous les besoins quotidiens d'une personne.

Si l'IA de WeChat parvient réellement à utiliser ces mini-programmes de manière fluide pour accomplir des tâches, alors, comme le dit la prophétie, elle deviendra un système d'exploitation piloté par le langage naturel.

L'utilisateur dit simplement « Aide-moi à réserver un billet de train pour demain après-midi à 15h de Pékin à Shanghai », l'IA décompose l'intention, appelle le mini-programme 12306 pour rechercher les billets, choisir un siège, utilise WeChat Pay pour finaliser la commande, le tout sans quitter WeChat. En théorie, ce cheminement pourrait fonctionner dès aujourd'hui.

Bien sûr, il y a un fossé entre la théorie et la réalité. L'appel par l'IA de services impliquant des paiements exige un taux d'erreur proche de zéro — commander le mauvais café est une petite erreur, mais acheter le mauvais billet d'avion est grave. La précision requise du modèle sous-jacent est bien supérieure à celle d'un simple scénario de conversation. C'est aussi le goulot d'étranglement commun au déploiement mondial des Agents IA : passer de « capable de discuter » à « capable d'accomplir des tâches », ce n'est pas une question de métrique technique, mais de confiance.

Mais WeChat a au moins fait une chose correcte : il n'a pas construit un réseau de services à partir de zéro. Ces dernières années, ce que faisait ChatGPT, c'était d'abord avoir un « cerveau » intelligent, puis se connecter un par un à Shopify, DoorDash, Stripe, chaque connexion étant établie à partir de zéro. Aujourd'hui, les requêtes liées aux transactions représentent encore moins de 3% de son activité.

Le véritable changement qui va se produire sera, pour la majorité des utilisateurs, probablement imperceptible. Un jour, vous taperez dans WeChat « Aide-moi à réserver un billet pour Shanghai ce soir à 21h », et ce sera fait. Vous ne saurez même pas quel mini-programme a été appelé en arrière-plan, ni quel processus de paiement a été utilisé.

Cette « réalisation sans perception » est le véritable signe de maturité d'un Agent IA. Et WeChat est plus proche de cette étape que quiconque.

Cet article provient du compte public WeChat « APPSO », auteur : APPSO, découvreur de produits de demain

Preguntas relacionadas

QQuelle est la principale différence entre l'approche de l'IA de WeChat et celle d'Apple (Siri) pour interagir avec les services tiers ?

ALa différence clé réside dans l'architecture et le contrôle. WeChat, grâce à son écosystème centralisé de mini-programmes, possède une « vue d'ensemble » (God's Eye View). Il peut automatiquement analyser le code d'un mini-programme, comprendre ses fonctionnalités et le rendre utilisable par l'IA via un simple interrupteur, sans effort supplémentaire du développeur. En revanche, l'écosystème d'applications iOS d'Apple est distribué. Pour que Siri interagisse avec une application tierce comme Ele.me, Apple doit compter sur les développeurs de cette application pour implémenter manuellement et individuellement des interfaces spécifiques (App Intents), ce qui est un processus plus lent et plus fragmenté.

QQuels sont les deux modes d'intégration proposés par WeChat pour connecter les mini-programmes à son IA ?

AWeChat propose deux modes d'intégration : 1. Le « mode automatique » : le développeur active simplement un interrupteur. La plateforme WeChat analyse automatiquement le code source et la structure du mini-programme pour déterminer ce qu'il peut faire, permettant à l'IA de l'utiliser sans qu'aucune ligne de code supplémentaire ne soit écrite. 2. Le « mode développement » : les développeurs créent des « Skills » (compétences) personnalisées pour leur mini-programme. Après approbation, ces Skills peuvent être appelées par l'IA de WeChat. Il est possible d'activer les deux modes simultanément.

QSelon l'article, pourquoi la structure centralisée des mini-programmes de WeChat, initialement critiquée, est-elle devenue un avantage à l'ère de l'IA ?

ALe processus de révision et de déploiement centralisé des mini-programmes, autrefois critiqué pour son contrôle excessif, garantit que tout le code s'exécute dans l'écosystème technique de WeChat. Cela donne à WeChat une visibilité et un contrôle complets sur chaque service. Cette « vue d'ensemble » centrale permet à WeChat d'analyser automatiquement les capacités des millions de mini-programmes et de les rendre interopérables avec l'IA de manière standardisée. À l'inverse, les écosystèmes d'applications distribués (comme iOS et Android), perçus comme plus « libres », rencontrent des obstacles pour permettre à une IA de comprendre et d'utiliser de manière homogène des applications tierces dont elle ne maîtrise pas l'infrastructure.

QQuelle est la règle de conception principale pour les réponses d'interface que WeChat recommande aux développeurs de suivre, afin d'assurer une interaction fiable avec l'IA ?

ALa règle principale est la structure en deux parties « Fait + Action ». La réponse de l'interface doit d'abord indiquer à l'IA « ce qui s'est passé » (le fait, par exemple, l'état d'une commande), puis lui dire « quelle est la prochaine étape possible » (l'action, par exemple, « confirmer la commande »). Si seul l'élément « action » est fourni, l'IA pourrait mal interpréter l'instruction et passer directement à l'étape suivante sans attendre une confirmation de l'utilisateur, ce qui pourrait entraîner des erreurs.

QQuel est, selon l'auteur, le principal défi à surmonter pour que l'IA de WeChat passe de « pouvoir discuter » à « pouvoir accomplir des tâches » de manière fiable ?

ALe défi principal n'est pas purement technique, mais concerne la « confiance ». Lorsque l'IA effectue des actions réelles, en particulier dans des scénarios impliquant des paiements ou des décisions importantes (comme réserver un billet d'avion), le taux d'erreur doit être proche de zéro. Une erreur de conversation est mineure, mais une erreur dans une transaction a des conséquences graves. La précision requise du modèle d'IA sous-jacent est donc bien plus élevée que pour un simple chat. C'est le goulot d'étranglement universel pour le déploiement des agents IA : établir une fiabilité suffisante pour que les utilisateurs leur confient des tâches critiques.

Lecturas Relacionadas

El debut de Warsh: ¿El presidente de la FED más conocedor del Crypto de la historia traerá sorpresas o sustos al mercado?

**Debut de Warsh: ¿Sorpresa o Susto? Un Presidente de la Fed Experto en Crypto se Estrena** Kevin Warsh, el nuevo presidente de la Reserva Federal, se enfrenta a su primera conferencia de prensa en medio de un contexto macroeconómico complejo: inflación creciente, ventas de bonos del Tesoro y presión de la Casa Blanca para bajar tasas. Su estreno es especialmente relevante para el mercado de criptoactivos, ya que Warsh es el primer presidente de la Fed en declarar inversiones indirectas sustanciales en el sector, abarcando desde L1 hasta DeFi. Su política monetaria se define por dos líneas: un tono **halcón frente a la inflación** que podría inclinarse hacia una política de tasas más restrictiva, y una **comprensión única de los activos digitales**, a los que considera un "buen policía" para la política económica, a diferencia del enfoque más defensivo de su predecesor. Para los criptomercados, su llegada implica una posible **reformulación regulatoria** (de la prevención a la integración), una **revalorización del riesgo** ligada a la trayectoria de las tasas de interés, y una **señal de legitimación** que podría atraer mayor inversión institucional a largo plazo. El resultado de su primera comparecencia puede seguir dos escenarios: una **"sorpresa"** si combina señales amistosas para crypto con un tono moderado sobre tasas, impulsando los activos de riesgo; o una **"alarma"** si enfatiza excesivamente la lucha contra la inflación y el endurecimiento monetario, lo que generaría una venta generalizada de activos riesgosos, incluyendo cripto. Aunque por ética ha vendido sus participaciones directas, la perspectiva de un regulador que comprende profundamente la tecnología subyacente podría sentar, a largo plazo, las bases para una integración más estructurada de los criptoactivos en el sistema financiero.

marsbitHace 1 hora(s)

El debut de Warsh: ¿El presidente de la FED más conocedor del Crypto de la historia traerá sorpresas o sustos al mercado?

marsbitHace 1 hora(s)

La cadena XRP Ledger lanza la nueva denominación XRPLd con la actualización de la versión 3.2.0

La versión 3.2.0 de XRP Ledger ya está disponible, introduciendo una importante mejora de infraestructura y un cambio de marca del software central, que pasa de llamarse "rippled" a "xrpld". Esta actualización se centra en optimizaciones de back-end y eficiencia, incluyendo medidas de optimización de memoria que pueden reducir hasta un 40% el uso de memoria del servidor, preparando la arquitectura para una futura escalabilidad. Las principales novedades incluyen la modificación `fixCleanup3_2_0`, que refuerza la seguridad de módulos como bóvedas de activos únicos, protocolos de préstamo y exchanges descentralizados. Se han añadido nuevas comprobaciones de invariantes para garantizar la consistencia del libro mayor. Además, las aplicaciones ahora pueden recuperar información sobre el protocolo y definiciones del servidor sin necesidad de conexión directa, facilitando el desarrollo de carteras y exploradores. En cuanto a escalabilidad y estabilidad, la actualización introduce tamaños de bloque configurables, soporte opcional de TLS/mTLS para servidores gRPC y un cambio en el puerto predeterminado para conexiones entre pares. También incluye varias correcciones para creadores de mercado automáticos, pagos y tokens de múltiples propósitos. Las invariantes de transacción se desactivaron temporalmente por rendimiento, sin comprometer la seguridad.

TheNewsCryptoHace 2 hora(s)

La cadena XRP Ledger lanza la nueva denominación XRPLd con la actualización de la versión 3.2.0

TheNewsCryptoHace 2 hora(s)

AGI no es el destino final: nuevo estudio de DeepMind afirma que el verdadero progreso de la IA apenas comienza al avanzar hacia una ASI

El documento de DeepMind plantea que la Inteligencia Artificial General (AGI) no será el punto final del desarrollo de la IA, sino un paso hacia una Inteligencia Artificial Superintendente (ASI) que supere colectivamente a los mejores equipos de expertos humanos. El informe explora cuatro posibles caminos hacia la ASI: 1) escalar recursos (cómputo, modelos, datos), 2) avances algorítmicos o nuevos paradigmas, 3) mejora recursiva automática de los sistemas, y 4) la coordinación de múltiples agentes de AGI para crear una inteligencia colectiva. También identifica cuellos de botella clave, como el límite de los datos de alta calidad generados por humanos, las presiones sobre recursos económicos y naturales, las posibles limitaciones de los paradigmas actuales de redes neuronales, la creciente dificultad de la investigación, las "barreras de abstracción" para descubrir nuevos conceptos fundamentales, y los factores de gobernanza y aceptación social. El documento destaca la necesidad urgente de desarrollar nuevos marcos de evaluación, ya que las métricas basadas en el rendimiento humano quedarán obsoletas una vez alcanzada la AGI. Finalmente, concluye que el progreso hacia la ASI es incierto y estará sujeto a restricciones físicas y prácticas, requiriendo un esfuerzo de investigación multidisciplinar global para monitorear y guiar su desarrollo.

marsbitHace 3 hora(s)

AGI no es el destino final: nuevo estudio de DeepMind afirma que el verdadero progreso de la IA apenas comienza al avanzar hacia una ASI

marsbitHace 3 hora(s)

Trading

Spot
Futuros

Artículos destacados

Cómo comprar PEOPLE

¡Bienvenido a HTX.com! Hemos hecho que comprar ConstitutionDAO (PEOPLE) sea simple y conveniente. Sigue nuestra guía paso a paso para iniciar tu viaje de criptos.Paso 1: crea tu cuenta HTXUtiliza tu correo electrónico o número de teléfono para registrarte y obtener una cuenta gratuita en HTX. Experimenta un proceso de registro sin complicaciones y desbloquea todas las funciones.Obtener mi cuentaPaso 2: ve a Comprar cripto y elige tu método de pagoTarjeta de crédito/débito: usa tu Visa o Mastercard para comprar ConstitutionDAO (PEOPLE) al instante.Saldo: utiliza fondos del saldo de tu cuenta HTX para tradear sin problemas.Terceros: hemos agregado métodos de pago populares como Google Pay y Apple Pay para mejorar la comodidad.P2P: tradear directamente con otros usuarios en HTX.Over-the-Counter (OTC): ofrecemos servicios personalizados y tipos de cambio competitivos para los traders.Paso 3: guarda tu ConstitutionDAO (PEOPLE)Después de comprar tu ConstitutionDAO (PEOPLE), guárdalo en tu cuenta HTX. Alternativamente, puedes enviarlo a otro lugar mediante transferencia blockchain o utilizarlo para tradear otras criptomonedas.Paso 4: tradear ConstitutionDAO (PEOPLE)Tradear fácilmente con ConstitutionDAO (PEOPLE) en HTX's mercado spot. Simplemente accede a tu cuenta, selecciona tu par de trading, ejecuta tus trades y monitorea en tiempo real. Ofrecemos una experiencia fácil de usar tanto para principiantes como para traders experimentados.

740 Vistas totalesPublicado en 2024.12.12Actualizado en 2026.06.02

Cómo comprar PEOPLE

Discusiones

Bienvenido a la comunidad de HTX. Aquí puedes mantenerte informado sobre los últimos desarrollos de la plataforma y acceder a análisis profesionales del mercado. A continuación se presentan las opiniones de los usuarios sobre el precio de PEOPLE (PEOPLE).

活动图片