Le premier à amener un système d'exploitation alimenté par IA à 1,4 milliard de personnes est... WeChat ?

marsbitDipublikasikan tanggal 2026-06-10Terakhir diperbarui pada 2026-06-10

Abstrak

L'IA de WeChat se met enfin en mouvement. Le jour même du WWDC d'Apple, WeChat a publié un guide d'intégration pour les développeurs, permettant aux IA d'accéder et d'opérer des mini-programmes. Deux modes sont proposés : un mode automatique sans code et un mode de développement pour des compétences sur mesure. Cette annonce signifie que WeChat transforme son écosystème entier — millions de mini-programmes, WeChat Pay, notifications — en une couche d'exécution pour l'IA. L'architecture technique, similaire au standard MCP, montre que WeChat a capitalisé sur l'expérience pratique pour créer des règles robustes, comme la priorité donnée aux réponses d'API et le format "fait + action". Contrairement à Apple dont l'approche est limitée avec les apps tierces, WeChat bénéficie d'un "point de vue divin" grâce à sa plateforme centralisée : il peut analyser le code des mini-programmes pour les rendre automatiquement actionnables par l'IA, sans effort supplémentaire pour les développeurs. Avec 1,432 milliard d'utilisateurs mensuels et une couverture quasi-totale des services quotidiens, WeChat est en position unique pour devenir le système d'exploitation de l'IA pour des centaines de millions de personnes. L'utilisateur pourrait simplement demander "Réserve-moi un billet de train pour Shanghai" et l'IA décomposerait la tâche, utiliserait les mini-programmes adéquats et finaliserait le paiement via WeChat Pay, le tout de manière transparente. Le défi reste la confiance, surtout pour...

L'IA de WeChat s'est enfin mise en mouvement.

Le même jour que le WWDC d'Apple, WeChat a fait quelque chose de potentiellement plus important qu'Apple : publier une annonce d'une simplicité trompeuse : « Guide pour les développeurs souhaitant intégrer l'écosystème IA de WeChat ».

Dès aujourd'hui, les développeurs de mini-programmes peuvent donner leur autorisation pour que l'IA de WeChat puisse lire, manipuler et appeler les fonctionnalités de leur mini-programme.

WeChat propose deux modes d'intégration. Le premier, le « mode automatique », a un seuil d'accès quasi nul. Le développeur active un simple interrupteur, et la plateforme lit automatiquement le code source, analyse les pages, comprend ce que le mini-programme peut faire, puis l'IA peut directement commencer à l'utiliser, sans écrire une seule ligne de code.

L'autre mode s'appelle « mode développement ». Ici, les développeurs créent leurs propres « Skills » personnalisés, qui, une fois validés, pourront être appelés par l'IA. Les deux modes peuvent être activés simultanément. Meituan a déjà annoncé son intégration.

Il ne faut pas voir cela simplement comme le lancement d'une nouvelle fonctionnalité, mais comprendre que WeChat est en train de transformer son écosystème entier — des millions de mini-programmes, WeChat Pay, les notifications de service, les comptes publics — en une couche d'exécution pour l'IA.

Plongée dans la documentation des Skills : Comment l'IA de WeChat utilise les mini-programmes

La documentation ouverte de WeChat détaille les spécifications techniques pour connecter un mini-programme aux Skills de l'IA. En y regardant de près, on découvre de nombreux détails de conception.

Lien vers la documentation officielle des skills 👇🏻 :

https://developers.weixin.qq.com/miniprogram/dev/ai/best-practices.html

D'un point de vue architectural, ceux qui ont déjà développé des solutions IA reconnaîtront immédiatement qu'il s'agit essentiellement de MCP. Le fichier mcp.json déclare la fonction et les paramètres de chaque interface atomique, et SKILL.md décrit comment s'exécute l'ensemble du flux de travail. Cela ressemble presque trait pour trait à l'architecture MCP+Skills utilisée dans Claude, Cursor ou VS Code. WeChat n'a pas tout réinventé, mais a directement adopté le standard qui émerge dans le secteur.

Dans ses recommandations, WeChat propose un système très clair de « pondération de l'attention ». Lorsque l'IA décide quelle interface appeler et quels paramètres générer, elle priorise d'abord le « content » renvoyé par l'interface (cinq étoiles), puis la « description » de l'interface (quatre étoiles) et la « description » des paramètres (quatre étoiles) dans le fichier mcp.json. Le fichier SKILL.md arrive en dernier (trois étoiles). Cela signifie que l'endroit où le développeur écrit est plus important que ce qu'il écrit. Une même règle écrite dans le retour d'interface ou dans SKILL.md aura un poids totalement différent pour l'IA.

Au niveau du retour d'interface, il existe une règle fondamentale : la structure en deux parties « fait + action ». Il faut d'abord dire à l'IA « ce qui s'est passé », puis lui dire « quelle est la prochaine étape ». Si on ne mentionne que l'action sans le fait, l'IA pourrait interpréter « afficher une carte » comme « préparer l'appel à l'interface suivante » et sauter la confirmation de l'utilisateur. C'est une règle qu'on ne rédige qu'après être tombé dans beaucoup de pièges.

Quatrièmement, la transmission des paramètres privilégie les ID par rapport au langage naturel. Prenons l'exemple de la scène de « commande de café » illustrée. L'utilisateur formule une demande, l'IA comprend l'intention vague ainsi que les options, modifie les spécifications, gère le paiement, le tout sans jamais quitter la boîte de dialogue.

Cette conception envoie un signal clair : WeChat a déjà testé suffisamment de cas d'usage en situation réelle, sait où se trouvent les pièges liés à l'appel de services externes par une IA, et a figé cette expérience dans une norme pour les développeurs.

En réalité, si l'on compare les écosystèmes de WeChat (mini-programmes) et d'Apple (App Store), tous deux réputés, WeChat bénéficie d'une « vue d'ensemble » (« Dieu ») sur son propre écosystème, un prérequis essentiel à toutes ces réalisations.

En quoi c'est peut-être plus important que l'IA d'Apple

Cette année, lors du WWDC, Apple a dévoilé la nouvelle version de son assistant IA Siri. Bien que connecté en sous-couche à Google Gemini et capable de créer des raccourcis en langage naturel, il n'a pas suscité beaucoup de discussions.

En y regardant de plus près, l'écart est flagrant : Apple cherche à faire en sorte que l'IA coordonne certaines fonctions natives au sein du système iOS. Dès qu'il s'agit d'applications tierces, ces apps installées sur votre téléphone, elle montre ses limites.

Prenez par exemple l'app Ele.me. Son code s'exécute sur les propres serveurs d'Ele.me, qu'Apple ne peut pas lire. Pour que Siri puisse appeler Ele.me, les ingénieurs d'Ele.me doivent volontairement se connecter à l'ensemble d'interfaces App Intents, négocier une par une, les intégrer une par une, ce qui prend du temps et des efforts.

En revanche, ce que fait WeChat, c'est permettre à l'IA de manipuler directement des millions de services tiers, car les mini-programmes sont différents. Le code de chaque mini-programme, depuis sa soumission par le développeur, en passant par la revue de WeChat, jusqu'à son exécution sur le téléphone de l'utilisateur, se trouve entièrement dans l'écosystème technique de WeChat. WeChat peut scanner le code lors de l'étape de validation, analyser automatiquement « quelles sont les pages de ce mini-programme, ce qu'il peut faire, quelles sont ses entrées et sorties ».

C'est pourquoi le « mode automatique » est possible. Le développeur n'a pas besoin d'écrire une ligne de code ; il active un interrupteur, et WeChat traduit automatiquement son mini-programme en un outil utilisable par l'IA. L'architecture de base de WeChat supporte naturellement cette approche, elle bénéficie d'une « vue d'ensemble » (« Dieu »), capable de mettre en œuvre une orchestration basée sur la centralisation.

Cet avantage architectural, Apple ne l'a pas. Google non plus.

Il est également intéressant de noter que, selon des rumeurs récentes, WeChat collaborerait avec Huawei, Honor, Xiaomi, OPPO et vivo pour lancer des capacités d'assistant A2A (Agent-to-Agent), permettant aux utilisateurs de lancer directement un appel audio/vidéo WeChat ou d'envoyer un message via l'assistant vocal de leur téléphone.

En interne, l'IA de WeChat peut appeler des millions de mini-programmes ; vers l'extérieur, les assistants IA des fabricants de téléphones peuvent appeler WeChat. WeChat est en train de devenir le super connecteur de l'ère de l'IA, le centre de service que toutes les IA peuvent intégrer.

L'ancienne prophétie du « WeChat OS »

Lorsque les mini-programmes ont été lancés, beaucoup plaisantaient en disant que WeChat voulait créer un « WeChat OS ». À l'époque, c'était plutôt une figure de style — les mini-programmes remplaçaient certaines fonctionnalités des applications, mais restaient fondamentalement une « plateforme d'applications légères ».

Plus fortuit, le mécanisme de validation centralisé conçu à l'époque l'était pour le contrôle de la qualité et de la sécurité. Mais neuf ans plus tard, cette conception initialement critiquée comme étant un « contrôle excessif » est devenue, par accident, un avantage infrastructurel à l'ère de l'IA. Les écosystèmes d'applications distribués (Apple/Android), qui semblaient alors plus « libres », sont aujourd'hui devenus un obstacle à l'intégration de l'IA.

Une ancienne prophétie, avec l'arrivée d'une nouvelle technologie — l'IA —, prend un tournant radical.

Dans des articles précédents sur OpenClaw et Feishu, j'ai émis un constat : la messagerie instantanée (IM) est l'entrée la plus naturelle pour un Agent IA, car la conversation est en soi la manière la plus naturelle d'interagir avec une IA, et l'écosystème de services intégré à l'IM (robots, paiement, mini-programmes) permet à l'IA non seulement de « discuter » mais aussi d'« agir ». Feishu évolue déjà dans cette direction, avec le lancement de l'amélioration de son Bot API et des nœuds Agent IA.

Cependant, Feishu est un outil de collaboration d'entreprise, couvrant des scénarios de travail. WeChat a une portée radicalement différente — 1,432 milliard d'utilisateurs actifs mensuels, des centaines de millions de mini-programmes dans des domaines variés, de la commande de nourriture à la prise de rendez-vous médicaux, en passant par l'achat de billets d'avion et le paiement des factures, couvrant presque tous les besoins quotidiens d'une personne.

Si l'IA de WeChat parvient réellement à utiliser ces mini-programmes de manière fluide pour accomplir des tâches, alors, comme le dit la prophétie, elle deviendra un système d'exploitation piloté par le langage naturel.

L'utilisateur dit simplement « Aide-moi à réserver un billet de train pour demain après-midi à 15h de Pékin à Shanghai », l'IA décompose l'intention, appelle le mini-programme 12306 pour rechercher les billets, choisir un siège, utilise WeChat Pay pour finaliser la commande, le tout sans quitter WeChat. En théorie, ce cheminement pourrait fonctionner dès aujourd'hui.

Bien sûr, il y a un fossé entre la théorie et la réalité. L'appel par l'IA de services impliquant des paiements exige un taux d'erreur proche de zéro — commander le mauvais café est une petite erreur, mais acheter le mauvais billet d'avion est grave. La précision requise du modèle sous-jacent est bien supérieure à celle d'un simple scénario de conversation. C'est aussi le goulot d'étranglement commun au déploiement mondial des Agents IA : passer de « capable de discuter » à « capable d'accomplir des tâches », ce n'est pas une question de métrique technique, mais de confiance.

Mais WeChat a au moins fait une chose correcte : il n'a pas construit un réseau de services à partir de zéro. Ces dernières années, ce que faisait ChatGPT, c'était d'abord avoir un « cerveau » intelligent, puis se connecter un par un à Shopify, DoorDash, Stripe, chaque connexion étant établie à partir de zéro. Aujourd'hui, les requêtes liées aux transactions représentent encore moins de 3% de son activité.

Le véritable changement qui va se produire sera, pour la majorité des utilisateurs, probablement imperceptible. Un jour, vous taperez dans WeChat « Aide-moi à réserver un billet pour Shanghai ce soir à 21h », et ce sera fait. Vous ne saurez même pas quel mini-programme a été appelé en arrière-plan, ni quel processus de paiement a été utilisé.

Cette « réalisation sans perception » est le véritable signe de maturité d'un Agent IA. Et WeChat est plus proche de cette étape que quiconque.

Cet article provient du compte public WeChat « APPSO », auteur : APPSO, découvreur de produits de demain

Pertanyaan Terkait

QQuelle est la principale différence entre l'approche de l'IA de WeChat et celle d'Apple (Siri) pour interagir avec les services tiers ?

ALa différence clé réside dans l'architecture et le contrôle. WeChat, grâce à son écosystème centralisé de mini-programmes, possède une « vue d'ensemble » (God's Eye View). Il peut automatiquement analyser le code d'un mini-programme, comprendre ses fonctionnalités et le rendre utilisable par l'IA via un simple interrupteur, sans effort supplémentaire du développeur. En revanche, l'écosystème d'applications iOS d'Apple est distribué. Pour que Siri interagisse avec une application tierce comme Ele.me, Apple doit compter sur les développeurs de cette application pour implémenter manuellement et individuellement des interfaces spécifiques (App Intents), ce qui est un processus plus lent et plus fragmenté.

QQuels sont les deux modes d'intégration proposés par WeChat pour connecter les mini-programmes à son IA ?

AWeChat propose deux modes d'intégration : 1. Le « mode automatique » : le développeur active simplement un interrupteur. La plateforme WeChat analyse automatiquement le code source et la structure du mini-programme pour déterminer ce qu'il peut faire, permettant à l'IA de l'utiliser sans qu'aucune ligne de code supplémentaire ne soit écrite. 2. Le « mode développement » : les développeurs créent des « Skills » (compétences) personnalisées pour leur mini-programme. Après approbation, ces Skills peuvent être appelées par l'IA de WeChat. Il est possible d'activer les deux modes simultanément.

QSelon l'article, pourquoi la structure centralisée des mini-programmes de WeChat, initialement critiquée, est-elle devenue un avantage à l'ère de l'IA ?

ALe processus de révision et de déploiement centralisé des mini-programmes, autrefois critiqué pour son contrôle excessif, garantit que tout le code s'exécute dans l'écosystème technique de WeChat. Cela donne à WeChat une visibilité et un contrôle complets sur chaque service. Cette « vue d'ensemble » centrale permet à WeChat d'analyser automatiquement les capacités des millions de mini-programmes et de les rendre interopérables avec l'IA de manière standardisée. À l'inverse, les écosystèmes d'applications distribués (comme iOS et Android), perçus comme plus « libres », rencontrent des obstacles pour permettre à une IA de comprendre et d'utiliser de manière homogène des applications tierces dont elle ne maîtrise pas l'infrastructure.

QQuelle est la règle de conception principale pour les réponses d'interface que WeChat recommande aux développeurs de suivre, afin d'assurer une interaction fiable avec l'IA ?

ALa règle principale est la structure en deux parties « Fait + Action ». La réponse de l'interface doit d'abord indiquer à l'IA « ce qui s'est passé » (le fait, par exemple, l'état d'une commande), puis lui dire « quelle est la prochaine étape possible » (l'action, par exemple, « confirmer la commande »). Si seul l'élément « action » est fourni, l'IA pourrait mal interpréter l'instruction et passer directement à l'étape suivante sans attendre une confirmation de l'utilisateur, ce qui pourrait entraîner des erreurs.

QQuel est, selon l'auteur, le principal défi à surmonter pour que l'IA de WeChat passe de « pouvoir discuter » à « pouvoir accomplir des tâches » de manière fiable ?

ALe défi principal n'est pas purement technique, mais concerne la « confiance ». Lorsque l'IA effectue des actions réelles, en particulier dans des scénarios impliquant des paiements ou des décisions importantes (comme réserver un billet d'avion), le taux d'erreur doit être proche de zéro. Une erreur de conversation est mineure, mais une erreur dans une transaction a des conséquences graves. La précision requise du modèle d'IA sous-jacent est donc bien plus élevée que pour un simple chat. C'est le goulot d'étranglement universel pour le déploiement des agents IA : établir une fiabilité suffisante pour que les utilisateurs leur confient des tâches critiques.

Bacaan Terkait

Debut Wash: Ketua FED yang Paling Paham Crypto Sepanjang Sejarah Akan Datangkan Kejutan atau Teror Bagi Pasar?

**Penampilan Perdana Kevin Warsh: Ketua Fed Paling Paham Crypto, Akan Bawa Kejutan atau Kekhawatiran?** Ketua Federal Reserve yang baru, Kevin Warsh, bersiap untuk konferensi pers kebijakan moneter pertamanya di tengah situasi sulit: inflasi yang bangkit kembali, tekanan pasar untuk menaikkan suku bunga, dan desakan Presiden Trump untuk menurunkan suku bunga. Yang unik, Warsh adalah ketua Fed pertama yang secara terbuka memiliki portofolio investasi tidak langsung yang signifikan di aset kripto dan perusahaan Web3, mencakup berbagai sektor seperti blockchain, DeFi, dan infrastruktur pembayaran. Pemahaman pribadinya tentang teknologi ini berbeda dengan pendahulunya. Analisis kebijakannya berfokus pada dua hal: **sikap hawkish melawan inflasi** yang mungkin berarti lingkungan suku bunga ketat, dan **sikap ramah terhadap aset digital** yang bisa membawa perubahan regulasi dari "pencegahan" menjadi "integrasi dan inovasi". Dampak pada pasar kripto dapat dilihat dari: **pergeseran ekspektasi regulasi** yang lebih mendukung, **penetapan ulang premi risiko** bergantung pada komunikasi kebijakan yang jelas dari Warsh, serta **aliran modal global** yang mungkin mengalir lebih deras ke aset kripto karena legitimasi yang meningkat. Dua skenario utama untuk penampilan perdananya: 1. **Kejutan:** Gabungan sikap kebijakan moneter yang relatif lunak (dovish) dan sinyal ramah kripto dapat memulihkan sentimen pasar. 2. **Kekhawatiran:** Sinyal hawkish yang lebih keras dari perkiraan, seperti isyarat kenaikan suku bunga, dapat memicu tekanan jual di aset berisiko, termasuk kripto. Meski secara etika Warsh telah menjual semua kepemilikannya terkait kripto, pemahaman mendalamnya tentang blockchain diharapkan dapat membentuk kerangka regulasi yang lebih koheren dan mendukung, menjadi infrastruktur penting bagi arus utama aset kripto dalam jangka panjang.

marsbit2j yang lalu

Debut Wash: Ketua FED yang Paling Paham Crypto Sepanjang Sejarah Akan Datangkan Kejutan atau Teror Bagi Pasar?

marsbit2j yang lalu

AGI Bukan Akhir, Makalah Baru DeepMind: Menuju ASI, Kemajuan AI yang Sesungguhnya Baru Dimulai

Jika Kecerdasan Buatan Umum (AGI) tercapai, apakah itu titik akhir? Tim Google DeepMind dalam laporan terbarunya berpendapat bahwa AGI **bukanlah akhir perjalanan**. AI diprediksi akan terus berkembang melampaui kemampuan tim ahli manusia terbaik, menuju Superintelligence (ASI). Laporan ini membedakan tiga konsep: AGI (kecerdasan setara manusia rata-rata), ASI (melampaui manusia di hampir semua bidang), dan UAI (batas teoretis maksimal). Transisi dari AGI ke ASI dapat melalui empat jalur potensial: 1. **Ekspansi Lanjutan**: Meningkatkan skala komputasi, model, dan data. 2. **Inovasi Algoritma**: Penyempurnaan paradigma yang ada atau pergeseran paradigma baru. 3. **Peningkatan Diri Secara Rekursif**: AI yang lebih kuat membantu mengembangkan generasi AI berikutnya yang lebih kuat. 4. **Koordinasi Multi-Agen**: Kecerdasan kolektif dari banyak sistem AGI yang berkolaborasi. Namun, terdapat enam kemacetan potensial: dinding data, tekanan sumber daya ekonomi & alam, batasan paradigma jaringan saraf saat ini, meningkatnya kesulitan penelitian, hambatan abstraksi, serta tantangan regulasi dan penerimaan sosial. Laporan ini juga menyoroti bahwa jika AI melampaui manusia, sistem evaluasi (benchmark) yang ada menjadi tidak relevan. Diperlukan kerangka pengukuran baru, seperti tugas kolaborasi/kompetisi multi-agen, pengujian yang dihasilkan otomatis, atau indikator tidak langsung seperti produktivitas ekonomi. ASI bukanlah sistem ajaib yang mahatahu; perkembangannya tetap dibatasi oleh hukum fisika, kompleksitas komputasi, data, sumber daya, dan umpan balik dunia nyata. Arah dan kecepatan kemajuan AI masih penuh ketidakpastian, sehingga memerlukan penelitian, prediksi, dan mekanisme evaluasi yang terus diperbarui.

marsbit3j yang lalu

AGI Bukan Akhir, Makalah Baru DeepMind: Menuju ASI, Kemajuan AI yang Sesungguhnya Baru Dimulai

marsbit3j yang lalu

Trading

Spot
Futures

Artikel Populer

Cara Membeli PEOPLE

Selamat datang di HTX.com! Kami telah membuat pembelian ConstitutionDAO (PEOPLE) menjadi mudah dan nyaman. Ikuti panduan langkah demi langkah kami untuk memulai perjalanan kripto Anda.Langkah 1: Buat Akun HTX AndaGunakan alamat email atau nomor ponsel Anda untuk mendaftar akun gratis di HTX. Rasakan perjalanan pendaftaran yang mudah dan buka semua fitur.Dapatkan Akun SayaLangkah 2: Buka Beli Kripto, lalu Pilih Metode Pembayaran AndaKartu Kredit/Debit: Gunakan Visa atau Mastercard Anda untuk membeli ConstitutionDAO (PEOPLE) secara instan.Saldo: Gunakan dana dari saldo akun HTX Anda untuk melakukan trading dengan lancar.Pihak Ketiga: Kami telah menambahkan metode pembayaran populer seperti Google Pay dan Apple Pay untuk meningkatkan kenyamanan.P2P: Lakukan trading langsung dengan pengguna lain di HTX.Over-the-Counter (OTC): Kami menawarkan layanan yang dibuat khusus dan kurs yang kompetitif bagi para trader.Langkah 3: Simpan ConstitutionDAO (PEOPLE) AndaSetelah melakukan pembelian, simpan ConstitutionDAO (PEOPLE) di akun HTX Anda. Selain itu, Anda dapat mengirimkannya ke tempat lain melalui transfer blockchain atau menggunakannya untuk memperdagangkan mata uang kripto lainnya.Langkah 4: Lakukan trading ConstitutionDAO (PEOPLE)Lakukan trading ConstitutionDAO (PEOPLE) dengan mudah di pasar spot HTX. Cukup akses akun Anda, pilih pasangan perdagangan, jalankan trading, lalu pantau secara real-time. Kami menawarkan pengalaman yang ramah pengguna baik untuk pemula maupun trader berpengalaman.

649 Total TayanganDipublikasikan pada 2024.12.12Diperbarui pada 2026.06.02

Cara Membeli PEOPLE

Diskusi

Selamat datang di Komunitas HTX. Di sini, Anda bisa terus mendapatkan informasi terbaru tentang perkembangan platform terkini dan mendapatkan akses ke wawasan pasar profesional. Pendapat pengguna mengenai harga PEOPLE (PEOPLE) disajikan di bawah ini.

活动图片