La IA de WeChat, finalmente, se pone en movimiento.
El mismo día del WWDC de Apple, WeChat hizo algo que puede ser más importante que Apple: publicó un anuncio sencillo y claro: Guía para desarrolladores sobre cómo integrarse en el ecosistema de IA de WeChat.
A partir de hoy, los desarrolladores de Mini Programas pueden otorgar autorización para que la IA de WeChat complete las funciones de leer, operar e invocar los Mini Programas.
WeChat ofrece dos formas de integración. La primera es el "modo automático", con una barrera de entrada casi nula. El desarrollador activa un interruptor, la plataforma lee automáticamente el código fuente, analiza las páginas y comprende qué puede hacer el Mini Programa, y luego la IA puede empezar a operarlo directamente, sin necesidad de escribir una sola línea de código.
La otra se llama "modo de desarrollo", donde los desarrolladores crean sus propias Skills personalizadas, que son invocadas por la IA después de pasar la revisión. Ambos modos pueden estar activados simultáneamente. Meituan ya ha anunciado su integración.
Esto no debe entenderse simplemente como el lanzamiento de otra nueva función, sino que hay que ver que WeChat está convirtiendo todo su ecosistema—millones de Mini Programas, WeChat Pay, notificaciones de servicio, Cuentas Oficiales—en la capa de ejecución de la IA.
Analizando la documentación de Skills: ¿Cómo invoca la IA de WeChat a los Mini Programas?
La documentación abierta de WeChat ha hecho pública la especificación técnica de Skills para la integración de Mini Programas con IA. Si se mira con detenimiento, se encuentran muchos detalles de diseño.
Enlace a la documentación oficial de skills 👇🏻:
https://developers.weixin.qq.com/miniprogram/dev/ai/best-practices.html
Desde la perspectiva arquitectónica, quienes hayan hecho desarrollo de IA lo reconocerán al instante: esencialmente es MCP. El archivo mcp.json declara la funcionalidad y los parámetros de cada interfaz atómica, SKILL.md describe cómo se ejecuta todo el flujo del proceso empresarial. Esto es prácticamente idéntico a la arquitectura MCP+Skills en Claude, Cursor o VS Code. WeChat no ha creado algo desde cero, sino que ha adoptado directamente el estándar en el que está convergiendo la industria.
En la guía de soluciones, WeChat proporciona un sistema muy claro de "pesos de atención". Cuando la IA decide qué interfaz invocar y qué parámetros generar, lo que prioriza más es el contenido devuelto por la interfaz (cinco estrellas), seguido de la descripción de la interfaz (cuatro estrellas) y la descripción de los parámetros (cuatro estrellas) en el archivo mcp.json, mientras que SKILL.md queda en último lugar (tres estrellas). Esto significa que dónde escribe el desarrollador es más importante que lo que escribe: una misma regla, si se escribe en la respuesta de la interfaz o en SKILL.md, el peso que le da la IA es completamente diferente.
A nivel de respuesta de la interfaz, hay una especificación central: el formato de dos partes "hecho + acción". Primero se le dice a la IA "qué ha sucedido", y luego "qué hacer a continuación". Si solo se escribe la acción sin el hecho, la IA podría entender "mostrar tarjeta" como "prepararse para invocar la siguiente interfaz" y saltarse la confirmación del usuario. Esta es una regla que solo se resume después de haber pasado por muchos problemas.
Cuarto, la transferencia de parámetros prioriza el uso de ID en lugar del lenguaje natural. Tomando como ejemplo la escena de "pedir café" en la imagen, después de que el usuario plantea su demanda, la IA comprende la intención difusa, las opciones, modifica especificaciones y procesa el pago, todo sin salir del cuadro de diálogo.
Este diseño transmite una señal: WeChat ya ha ejecutado suficientes casos en la práctica, sabe dónde están los problemas cuando la IA invoca servicios externos, y ha consolidado esta experiencia en una guía para desarrolladores.
En realidad, si se comparan los Mini Programas de WeChat y las aplicaciones de Apple, ambos conocidos por su "ecosistema", WeChat tiene una "perspectiva divina" sobre su propio ecosistema, y esta es la premisa para que todo se haga realidad.
¿Por qué es más importante que la IA de Apple?
Este año, la nueva Siri con IA que Apple presentó en el WWDC, aunque en su nivel subyacente se integró con Google Gemini y Shortcuts ahora admite la creación con lenguaje natural, no generó mucha discusión.
Si se observa con detalle, se nota la diferencia: lo que hace Apple es permitir que la IA coordine algunas funciones nativas dentro del sistema iOS; una vez que se trata de aplicaciones de terceros, aquellas Apps instaladas en tu teléfono, se queda corta.
Por ejemplo, Ele.me (una app de entrega de comida). Su código se ejecuta en los servidores propios de Ele.me, a los que Apple no puede acceder. Para que Siri invoque a Ele.me, los ingenieros de Ele.me deben tomar la iniciativa de integrarse con el conjunto de interfaces App Intents, negociando y conectando uno por uno, un proceso que consume mucho tiempo y esfuerzo.
Mientras que lo que WeChat hace es permitir que la IA opere directamente millones de servicios de terceros, porque los Mini Programas son diferentes. El código de cada Mini Programa, desde que el desarrollador lo envía, pasa por la revisión de WeChat y finalmente se ejecuta en el teléfono del usuario, todo el proceso está dentro del sistema tecnológico de WeChat. WeChat puede escanear el código en la fase de revisión, analizando automáticamente "qué páginas tiene este Mini Programa, qué puede hacer, cuáles son sus entradas y salidas".
Por eso el "modo automático" puede existir: el desarrollador no necesita escribir ni una línea de código, solo activa un interruptor, y WeChat mismo puede traducir tu Mini Programa a una herramienta que la IA pueda invocar. La infraestructura básica de WeChat soporta naturalmente esto, posee una "perspectiva divina" que le permite lograr la programación basándose en la centralización.
Apple no tiene esta ventaja arquitectónica, ni Google tampoco.
También es digno de atención lo que se rumoreaba hace un tiempo: WeChat está colaborando con Huawei, Honor, Xiaomi, OPPO y vivo para lanzar capacidades de asistente A2A (Agent-to-Agent), permitiendo a los usuarios iniciar videollamadas o enviar mensajes de WeChat directamente a través del asistente por voz del teléfono.
Internamente, la IA de WeChat puede invocar millones de Mini Programas; externamente, los asistentes de IA de los fabricantes de teléfonos pueden invocar a WeChat. WeChat se está convirtiendo en el súper conector de la era de la IA, el centro de servicios al que todas las IAs pueden conectarse.
La antigua profecía del "Sistema Operativo WeChat"
Cuando se lanzaron los Mini Programas, mucha gente bromeó diciendo que WeChat quería crear un "Sistema Operativo WeChat". En ese momento, era más bien una figura retórica: los Mini Programas sustituían parte de la funcionalidad de las Apps, pero en esencia seguían siendo una "plataforma de aplicaciones ligeras".
Más casualmente, el mecanismo de revisión centralizada diseñado en ese entonces tenía el propósito de controlar la calidad y la seguridad. Pero nueve años después, este diseño, que entonces fue criticado por "excesivo control", se ha convertido inesperadamente en una ventaja de infraestructura para la era de la IA. El ecosistema de Apps distribuido (Apple/Android) que en su momento parecía más "libre", ahora resulta ser un obstáculo para el acceso de la IA.
Una vieja profecía, debido a la aparición de una nueva tecnología—la IA—, ha experimentado un cambio revolucionario.
Antes, cuando escribí sobre OpenClaw y Feishu, mencioné un juicio: la mensajería instantánea (IM) es la entrada más natural para un Agente de IA, porque la conversación en sí misma es la forma más natural de interacción entre el humano y la IA, y el ecosistema de servicios inherente al IM (robots, pagos, mini programas) permite que la IA no solo pueda "charlar" sino también "actuar". Feishu ya está avanzando en esta dirección, lanzando la mejora de la API de Bots y los nodos de Agentes de IA.
Sin embargo, Feishu es una herramienta de colaboración empresarial, que cubre escenarios de oficina. WeChat tiene una amplitud completamente diferente: 1.432 mil millones de usuarios activos mensuales, cientos de Mini Programas en sectores específicos, desde pedir comida a domicilio hasta sacar cita médica, comprar billetes de avión o pagar servicios públicos, cubriendo casi todas las necesidades de servicios de la vida diaria de una persona.
Si la IA de WeChat realmente pudiera invocar fluidamente estos Mini Programas para completar tareas, entonces, como dice la profecía, se convertiría en un sistema operativo operable con lenguaje natural.
El usuario dice: "Ayúdame a reservar un tren de alta velocidad de Pekín a Shanghái para mañana a las tres de la tarde", la IA descompone la intención, invoca el Mini Programa de 12306 para buscar billetes, seleccionar asiento, completa la compra con WeChat Pay, todo sin salir de WeChat. Teóricamente, este flujo podría ejecutarse hoy mismo.
Por supuesto, entre la teoría y la realidad hay distancia. La invocación por parte de la IA de servicios que involucran escenarios de pago tiene una tasa de error cercana a cero: pedir una taza de café por error es una cosa pequeña, pero comprar un billete de avión incorrecto es un gran problema. La precisión requerida por el modelo subyacente es mucho mayor que en escenarios de diálogo. Este es también el cuello de botella común que enfrenta la implementación de Agentes de IA en todo el mundo: entre "poder conversar" y "poder actuar" no hay indicadores técnicos, sino confianza.
Pero WeChat al menos ha hecho una cosa correcta: no ha construido una red de servicios desde cero. A lo largo de estos años, lo que ChatGPT ha estado haciendo es tener primero un cerebro inteligente, y luego conectar uno por uno con Shopify, DoorDash, Stripe, cada conexión establecida desde cero, y hasta hoy las consultas relacionadas con transacciones representan menos del 3%.
El verdadero cambio que va a ocurrir, para la mayoría de los usuarios, puede ser silencioso. Un día escribes en WeChat: "Ayúdame a reservar un billete para Shanghái esta noche a las nueve", y luego está reservado, ni siquiera sabes qué Mini Programa se invocó en el fondo, ni qué proceso de pago se siguió.
Esta "finalización imperceptible" es el verdadero signo de madurez de un Agente de IA, y WeChat está más cerca de este paso que cualquier otro.
Este artículo proviene del WeChat Official Account "APPSO", autor: APPSO que descubre los productos del mañana

















