¿La primera en llevar un Sistema Operativo con IA a 1400 millones de personas fue WeChat?

marsbitPublié le 2026-06-10Dernière mise à jour le 2026-06-10

Résumé

La inteligencia artificial de WeChat finalmente ha dado un paso importante. El mismo día del WWDC de Apple, WeChat publicó una guía para que los desarrolladores integren sus aplicaciones de mini-programas en su ecosistema de IA. A partir de ahora, los desarrolladores pueden autorizar a la IA de WeChat para que lea, opere e interactúe con sus mini-programas. Ofrece dos métodos: un "modo automático" de baja fricción, donde la plataforma analiza automáticamente el código, y un "modo de desarrollo" para crear habilidades personalizadas. Esto convierte a todo el ecosistema de WeChat —millones de mini-programas, WeChat Pay, notificaciones— en una capa de ejecución para la IA. La arquitectura técnica se basa en estándares emergentes como MCP (Model Context Protocol), y la documentación revela un diseño detallado que prioriza la claridad en las respuestas de las APIs y el uso de identificadores únicos, fruto de la experiencia práctica. Este movimiento contrasta con el enfoque de Apple. Mientras Siri lucha por integrarse profundamente con aplicaciones de terceros debido a la naturaleza distribuida de iOS, la infraestructura centralizada de WeChat le otorga una "visión divina". Cada mini-programa se ejecuta dentro de su sistema, permitiendo un análisis y una automatización más sencillos. WeChat también está colaborando con fabricantes de teléfonos como Huawei y Xiaomi para permitir que sus asistentes de voz inicien llamadas o envíen mensajes a través de WeChat, posicionándose como ...

La IA de WeChat, finalmente, se pone en movimiento.

El mismo día del WWDC de Apple, WeChat hizo algo que puede ser más importante que Apple: publicó un anuncio sencillo y claro: Guía para desarrolladores sobre cómo integrarse en el ecosistema de IA de WeChat.

A partir de hoy, los desarrolladores de Mini Programas pueden otorgar autorización para que la IA de WeChat complete las funciones de leer, operar e invocar los Mini Programas.

WeChat ofrece dos formas de integración. La primera es el "modo automático", con una barrera de entrada casi nula. El desarrollador activa un interruptor, la plataforma lee automáticamente el código fuente, analiza las páginas y comprende qué puede hacer el Mini Programa, y luego la IA puede empezar a operarlo directamente, sin necesidad de escribir una sola línea de código.

La otra se llama "modo de desarrollo", donde los desarrolladores crean sus propias Skills personalizadas, que son invocadas por la IA después de pasar la revisión. Ambos modos pueden estar activados simultáneamente. Meituan ya ha anunciado su integración.

Esto no debe entenderse simplemente como el lanzamiento de otra nueva función, sino que hay que ver que WeChat está convirtiendo todo su ecosistema—millones de Mini Programas, WeChat Pay, notificaciones de servicio, Cuentas Oficiales—en la capa de ejecución de la IA.

Analizando la documentación de Skills: ¿Cómo invoca la IA de WeChat a los Mini Programas?

La documentación abierta de WeChat ha hecho pública la especificación técnica de Skills para la integración de Mini Programas con IA. Si se mira con detenimiento, se encuentran muchos detalles de diseño.

Enlace a la documentación oficial de skills 👇🏻:

https://developers.weixin.qq.com/miniprogram/dev/ai/best-practices.html

Desde la perspectiva arquitectónica, quienes hayan hecho desarrollo de IA lo reconocerán al instante: esencialmente es MCP. El archivo mcp.json declara la funcionalidad y los parámetros de cada interfaz atómica, SKILL.md describe cómo se ejecuta todo el flujo del proceso empresarial. Esto es prácticamente idéntico a la arquitectura MCP+Skills en Claude, Cursor o VS Code. WeChat no ha creado algo desde cero, sino que ha adoptado directamente el estándar en el que está convergiendo la industria.

En la guía de soluciones, WeChat proporciona un sistema muy claro de "pesos de atención". Cuando la IA decide qué interfaz invocar y qué parámetros generar, lo que prioriza más es el contenido devuelto por la interfaz (cinco estrellas), seguido de la descripción de la interfaz (cuatro estrellas) y la descripción de los parámetros (cuatro estrellas) en el archivo mcp.json, mientras que SKILL.md queda en último lugar (tres estrellas). Esto significa que dónde escribe el desarrollador es más importante que lo que escribe: una misma regla, si se escribe en la respuesta de la interfaz o en SKILL.md, el peso que le da la IA es completamente diferente.

A nivel de respuesta de la interfaz, hay una especificación central: el formato de dos partes "hecho + acción". Primero se le dice a la IA "qué ha sucedido", y luego "qué hacer a continuación". Si solo se escribe la acción sin el hecho, la IA podría entender "mostrar tarjeta" como "prepararse para invocar la siguiente interfaz" y saltarse la confirmación del usuario. Esta es una regla que solo se resume después de haber pasado por muchos problemas.

Cuarto, la transferencia de parámetros prioriza el uso de ID en lugar del lenguaje natural. Tomando como ejemplo la escena de "pedir café" en la imagen, después de que el usuario plantea su demanda, la IA comprende la intención difusa, las opciones, modifica especificaciones y procesa el pago, todo sin salir del cuadro de diálogo.

Este diseño transmite una señal: WeChat ya ha ejecutado suficientes casos en la práctica, sabe dónde están los problemas cuando la IA invoca servicios externos, y ha consolidado esta experiencia en una guía para desarrolladores.

En realidad, si se comparan los Mini Programas de WeChat y las aplicaciones de Apple, ambos conocidos por su "ecosistema", WeChat tiene una "perspectiva divina" sobre su propio ecosistema, y esta es la premisa para que todo se haga realidad.

¿Por qué es más importante que la IA de Apple?

Este año, la nueva Siri con IA que Apple presentó en el WWDC, aunque en su nivel subyacente se integró con Google Gemini y Shortcuts ahora admite la creación con lenguaje natural, no generó mucha discusión.

Si se observa con detalle, se nota la diferencia: lo que hace Apple es permitir que la IA coordine algunas funciones nativas dentro del sistema iOS; una vez que se trata de aplicaciones de terceros, aquellas Apps instaladas en tu teléfono, se queda corta.

Por ejemplo, Ele.me (una app de entrega de comida). Su código se ejecuta en los servidores propios de Ele.me, a los que Apple no puede acceder. Para que Siri invoque a Ele.me, los ingenieros de Ele.me deben tomar la iniciativa de integrarse con el conjunto de interfaces App Intents, negociando y conectando uno por uno, un proceso que consume mucho tiempo y esfuerzo.

Mientras que lo que WeChat hace es permitir que la IA opere directamente millones de servicios de terceros, porque los Mini Programas son diferentes. El código de cada Mini Programa, desde que el desarrollador lo envía, pasa por la revisión de WeChat y finalmente se ejecuta en el teléfono del usuario, todo el proceso está dentro del sistema tecnológico de WeChat. WeChat puede escanear el código en la fase de revisión, analizando automáticamente "qué páginas tiene este Mini Programa, qué puede hacer, cuáles son sus entradas y salidas".

Por eso el "modo automático" puede existir: el desarrollador no necesita escribir ni una línea de código, solo activa un interruptor, y WeChat mismo puede traducir tu Mini Programa a una herramienta que la IA pueda invocar. La infraestructura básica de WeChat soporta naturalmente esto, posee una "perspectiva divina" que le permite lograr la programación basándose en la centralización.

Apple no tiene esta ventaja arquitectónica, ni Google tampoco.

También es digno de atención lo que se rumoreaba hace un tiempo: WeChat está colaborando con Huawei, Honor, Xiaomi, OPPO y vivo para lanzar capacidades de asistente A2A (Agent-to-Agent), permitiendo a los usuarios iniciar videollamadas o enviar mensajes de WeChat directamente a través del asistente por voz del teléfono.

Internamente, la IA de WeChat puede invocar millones de Mini Programas; externamente, los asistentes de IA de los fabricantes de teléfonos pueden invocar a WeChat. WeChat se está convirtiendo en el súper conector de la era de la IA, el centro de servicios al que todas las IAs pueden conectarse.

La antigua profecía del "Sistema Operativo WeChat"

Cuando se lanzaron los Mini Programas, mucha gente bromeó diciendo que WeChat quería crear un "Sistema Operativo WeChat". En ese momento, era más bien una figura retórica: los Mini Programas sustituían parte de la funcionalidad de las Apps, pero en esencia seguían siendo una "plataforma de aplicaciones ligeras".

Más casualmente, el mecanismo de revisión centralizada diseñado en ese entonces tenía el propósito de controlar la calidad y la seguridad. Pero nueve años después, este diseño, que entonces fue criticado por "excesivo control", se ha convertido inesperadamente en una ventaja de infraestructura para la era de la IA. El ecosistema de Apps distribuido (Apple/Android) que en su momento parecía más "libre", ahora resulta ser un obstáculo para el acceso de la IA.

Una vieja profecía, debido a la aparición de una nueva tecnología—la IA—, ha experimentado un cambio revolucionario.

Antes, cuando escribí sobre OpenClaw y Feishu, mencioné un juicio: la mensajería instantánea (IM) es la entrada más natural para un Agente de IA, porque la conversación en sí misma es la forma más natural de interacción entre el humano y la IA, y el ecosistema de servicios inherente al IM (robots, pagos, mini programas) permite que la IA no solo pueda "charlar" sino también "actuar". Feishu ya está avanzando en esta dirección, lanzando la mejora de la API de Bots y los nodos de Agentes de IA.

Sin embargo, Feishu es una herramienta de colaboración empresarial, que cubre escenarios de oficina. WeChat tiene una amplitud completamente diferente: 1.432 mil millones de usuarios activos mensuales, cientos de Mini Programas en sectores específicos, desde pedir comida a domicilio hasta sacar cita médica, comprar billetes de avión o pagar servicios públicos, cubriendo casi todas las necesidades de servicios de la vida diaria de una persona.

Si la IA de WeChat realmente pudiera invocar fluidamente estos Mini Programas para completar tareas, entonces, como dice la profecía, se convertiría en un sistema operativo operable con lenguaje natural.

El usuario dice: "Ayúdame a reservar un tren de alta velocidad de Pekín a Shanghái para mañana a las tres de la tarde", la IA descompone la intención, invoca el Mini Programa de 12306 para buscar billetes, seleccionar asiento, completa la compra con WeChat Pay, todo sin salir de WeChat. Teóricamente, este flujo podría ejecutarse hoy mismo.

Por supuesto, entre la teoría y la realidad hay distancia. La invocación por parte de la IA de servicios que involucran escenarios de pago tiene una tasa de error cercana a cero: pedir una taza de café por error es una cosa pequeña, pero comprar un billete de avión incorrecto es un gran problema. La precisión requerida por el modelo subyacente es mucho mayor que en escenarios de diálogo. Este es también el cuello de botella común que enfrenta la implementación de Agentes de IA en todo el mundo: entre "poder conversar" y "poder actuar" no hay indicadores técnicos, sino confianza.

Pero WeChat al menos ha hecho una cosa correcta: no ha construido una red de servicios desde cero. A lo largo de estos años, lo que ChatGPT ha estado haciendo es tener primero un cerebro inteligente, y luego conectar uno por uno con Shopify, DoorDash, Stripe, cada conexión establecida desde cero, y hasta hoy las consultas relacionadas con transacciones representan menos del 3%.

El verdadero cambio que va a ocurrir, para la mayoría de los usuarios, puede ser silencioso. Un día escribes en WeChat: "Ayúdame a reservar un billete para Shanghái esta noche a las nueve", y luego está reservado, ni siquiera sabes qué Mini Programa se invocó en el fondo, ni qué proceso de pago se siguió.

Esta "finalización imperceptible" es el verdadero signo de madurez de un Agente de IA, y WeChat está más cerca de este paso que cualquier otro.

Este artículo proviene del WeChat Official Account "APPSO", autor: APPSO que descubre los productos del mañana

Questions liées

Q¿Qué anunció WeChat que permite a sus desarrolladores de mini programas interactuar con la IA?

AWeChat anunció la "Guía para desarrolladores que acceden al ecosistema de IA de WeChat", que permite a los desarrolladores de mini programas dar su autorización para que la IA de WeChat lea, opere e invoque las funciones de sus mini programas.

Q¿Cuáles son los dos modos de acceso que ofrece WeChat para que los mini programas se integren con su IA?

AWeChat ofrece dos modos de acceso: el 'modo automático', que no requiere código y permite a la plataforma analizar automáticamente el código fuente del mini programa, y el 'modo de desarrollo', que permite a los desarrolladores crear Skills personalizadas para ser invocadas por la IA tras una revisión. Ambos pueden activarse simultáneamente.

QSegún el artículo, ¿qué ventaja clave tiene la arquitectura centralizada de los mini programas de WeChat frente a las aplicaciones nativas de iOS para la integración con IA?

ALa ventaja clave es que WeChat tiene una 'visión de Dios' o perspectiva centralizada. Todo el código de los mini programas pasa por el sistema técnico de WeChat, desde el envío del desarrollador hasta la ejecución en el dispositivo del usuario. Esto permite a WeChat analizar automáticamente lo que hace cada mini programa y traducirlo para la IA, algo que Apple no puede hacer con aplicaciones de terceros que se ejecutan en sus propios servidores.

Q¿Cómo describe el artículo el potencial papel de WeChat en la era de la IA más allá de ser una aplicación de mensajería?

AEl artículo describe a WeChat como un 'conector superpoderoso' o 'centro de servicios' en la era de la IA. Internamente, su IA puede invocar millones de mini programas. Externamente, los asistentes de IA de los fabricantes de teléfonos (como Huawei, Xiaomi, etc.) pueden integrarse con WeChat. Esto lo posiciona como un sistema operativo basado en lenguaje natural que puede gestionar gran parte de las necesidades diarias de servicios de los usuarios.

Q¿Qué gran desafío, común a todos los Agentes de IA, identifica el artículo entre 'poder charlar' y 'poder realizar tareas' de manera fiable?

AEl mayor desafío es la 'confianza'. Para tareas que involucran transacciones (como pagos o compras), la tasa de error debe ser cercana a cero. Un error en una conversación es menor, pero un error al comprar un billete de avión es grave. La precisión requerida del modelo de IA subyacente es mucho mayor para 'hacer cosas' de manera fiable que para 'charlar'.

Lectures associées

Début de Warsh : le président de la Fed le plus au fait du Crypto de l'histoire apportera-t-il des surprises ou des chocs au marché ?

**Résumé :** Kevin Warsh, nouveau président de la Réserve fédérale américaine, s'apprête à tenir sa première conférence de presse monétaire. Sa nomination est historique : il est le premier président de la Fed à détenir personnellement des actifs numériques (investissements indirects dans Solana, dYdX, etc.), montrant une compréhension unique du secteur. Son dilemme est majeur : il doit faire face à une résurgence de l'inflation, qui exige une politique monétaire stricte (position "de faucon"), tout en répondant aux pressions politiques pour des baisses de taux. Parallèlement, son attitude envers les crypto-actifs diffère fondamentalement de celle de son prédécesseur. Il ne les considère pas comme de simples actifs spéculatifs, mais plutôt comme un "bon policier" pour la politique économique et une composante de la compétitivité américaine. Son impact potentiel sur le marché crypto s'articule autour de trois axes : 1. Un changement de paradigme réglementaire, passant de la prévention à l'intégration et à l'innovation. 2. Une reprixation des actifs liée aux taux d'intérêt, où sa clarté de communication pourrait réduire la prime d'incertitude. 3. Une légitimation accrue pouvant attirer les capitaux institutionnels traditionnels. Deux scénarios principaux sont envisagés pour sa première intervention : * **Scénario "Surprise"** : Un ton modéré ("de colombe") sur les taux combiné à des signaux favorables à l'innovation numérique pourrait booster le marché. * **Scénario "Choc"** : Un message excessivement restrictif sur les taux pourrait entraîner une vente généralisée des actifs risqués, y compris les cryptos. Bien qu'il ait dû vendre ses actifs crypto pour des raisons d'éthique, la compréhension intrinsèque de Warsh pour la technologie blockchain pourrait, à long terme, poser les bases d'une intégration plus structurelle des actifs numériques dans le système financier.

marsbitIl y a 3 h

Début de Warsh : le président de la Fed le plus au fait du Crypto de l'histoire apportera-t-il des surprises ou des chocs au marché ?

marsbitIl y a 3 h

XRP Ledger Lance le Rebranding XRPld Avec la Mise à Niveau Version 3.2.0

La version 3.2.0 du XRP Ledger (XRPL) est désormais disponible, introduisant une refonte majeure incluant le changement de nom du logiciel principal de « rippled » à « xrpld ». Cette mise à niveau se concentre principalement sur les améliorations des performances, de la sécurité et de l'évolutivité de l'infrastructure sous-jacente, plutôt que sur de nouvelles fonctionnalités utilisateur. Les principales avancées incluent des optimisations de mémoire pouvant réduire jusqu'à 40% l'utilisation de la mémoire serveur. Sur le plan de la sécurité, la modification `fixCleanup3_2_0` renforce plusieurs modules, notamment les coffres-forts à actif unique, le protocole de prêt, les échanges décentralisés et les jetons multi-usages. De nouveaux contrôles d'invariance garantissent la cohérence du registre après la suppression de comptes. Pour les développeurs, la mise à jour permet désormais de récupérer des informations sur les définitions du protocole et du serveur XRPL sans nécessiter de connexion active, facilitant ainsi la création de portefeuilles, d'explorateurs de blockchain et d'APIs. En termes d'évolutivité et de stabilité, les améliorations comprennent des tailles de bloc configurables, un stockage de base de données optimisé via nuDB, et le support optionnel de TLS/mutual TLS pour le serveur gRPC. Le port de peering par défaut est également passé du 51235 au 2459. Divers correctifs ont été apportés aux fonctions liées aux Market Makers Automatisés, aux paiements, aux séquestres de jetons et aux carnets d'ordres. Une note importante : les invariants de transaction ont été temporairement désactivés dans la v3.2.0 en raison d'un impact sur les performances, mais cela ne présente pas de risque pour la sécurité.

TheNewsCryptoIl y a 3 h

XRP Ledger Lance le Rebranding XRPld Avec la Mise à Niveau Version 3.2.0

TheNewsCryptoIl y a 3 h

L'AGI n'est pas l'arrivée, nouveau document de DeepMind : Vers l'ASI, le véritable progrès de l'IA ne fait que commencer

Si l'intelligence artificielle générale (IAG) était atteinte demain, quelle serait la prochaine étape ? Une étude de Google DeepMind suggère que l'IAG n'est pas un point final, mais une étape vers une superintelligence artificielle (ISA) dépassant les collectifs d'experts humains. L'étude distingue trois concepts : l'IAG (niveau médian humain), l'ISA (supérieure aux meilleurs collectifs humains dans presque tous les domaines) et l'IA universelle (limite théorique). Elle propose quatre voies potentielles vers l'ISA : 1. **Extension des ressources** : augmentation de la puissance de calcul, des données et des modèles. 2. **Évolution algorithmique** : améliorations incrémentales ou nouveaux paradigmes (apprentissage continu, utilisation d'outils, modèles du monde). 3. **Auto-amélioration récursive** : des IA plus performantes conçoivent la génération suivante, créant une boucle de rétroaction positive. 4. **Coordination multi-agents** : des systèmes IAG collaborant atteignent une intelligence collective supérieure. L'étude identifie six principaux goulets d'étranglement : 1. **Le mur des données** : les données humaines de haute qualité pourraient s'épuiser. 2. **Pressions économiques et ressources naturelles** : coûts énergétiques et matériels. 3. **Limites des paradigmes neuronaux actuels** : problèmes d'apprentissage continu, de raisonnement robuste, d'hallucinations. 4. **Difficulté croissante de la recherche**. 5. **Barrières à l'abstraction** : difficulté à former de nouveaux concepts fondamentaux. 6. **Régulation, gouvernance et réaction sociale**. Un défi crucial est l'évaluation des capacités de l'IA au-delà du niveau humain, nécessitant de nouveaux benchmarks. L'étude conclut que la progression vers l'ISA reste incertaine, soumise à des contraintes physiques et de ressources, et appelle à un effort de recherche interdisciplinaire pour mieux anticiper cette évolution.

marsbitIl y a 4 h

L'AGI n'est pas l'arrivée, nouveau document de DeepMind : Vers l'ASI, le véritable progrès de l'IA ne fait que commencer

marsbitIl y a 4 h

Trading

Spot
Futures

Articles tendance

Comment acheter PEOPLE

Bienvenue sur HTX.com ! Nous vous permettons d'acheter ConstitutionDAO (PEOPLE) de manière simple et pratique. Suivez notre guide étape par étape pour commencer votre parcours crypto.Étape 1 : Création de votre compte HTXUtilisez votre adresse e-mail ou votre numéro de téléphone pour ouvrir un compte sur HTX gratuitement. L'inscription se fait en toute simplicité et débloque toutes les fonctionnalités.Créer mon compteÉtape 2 : Choix du mode de paiement (rubrique Acheter des cryptosCarte de crédit/débit : utilisez votre carte Visa ou Mastercard pour acheter instantanément ConstitutionDAO (PEOPLE).Solde :utilisez les fonds du solde de votre compte HTX pour trader en toute simplicité.Prestataire tiers :pour accroître la commodité d'utilisation, nous avons ajouté des modes de paiement populaires tels que Google Pay et Apple Pay.P2P :tradez directement avec d'autres utilisateurs sur HTX.OTC (de gré à gré) : nous offrons des services personnalisés et des taux de change compétitifs aux traders.Étape 3 : stockage de vos ConstitutionDAO (PEOPLE)Après avoir acheté vos ConstitutionDAO (PEOPLE), stockez-les sur votre compte HTX. Vous pouvez également les envoyer ailleurs via un transfert sur la blockchain ou les utiliser pour trader d'autres cryptos.Étape 4 : tradez des ConstitutionDAO (PEOPLE)Tradez facilement ConstitutionDAO (PEOPLE) sur le marché Spot de HTX. Il vous suffit d'accéder à votre compte, de sélectionner la paire de trading, d'exécuter vos trades et de les suivre en temps réel. Nous offrons une expérience conviviale aux débutants comme aux traders chevronnés.

562 vues totalesPublié le 2024.12.12Mis à jour le 2026.06.02

Comment acheter PEOPLE

Discussions

Bienvenue dans la Communauté HTX. Ici, vous pouvez vous tenir informé(e) des derniers développements de la plateforme et accéder à des analyses de marché professionnelles. Les opinions des utilisateurs sur le prix de PEOPLE (PEOPLE) sont présentées ci-dessous.

活动图片