El Agente de WeChat realmente está por llegar.
La Plataforma Abierta de WeChat publicó contenido sobre la guía para desarrolladores de la IA de WeChat.
La guía indica que, para ofrecer a los usuarios una experiencia de interacción más inteligente y ayudarles a descubrir y utilizar los servicios de mini programas de manera más ágil, la Plataforma Abierta de WeChat, respetando plenamente los derechos y la elección autónoma de los desarrolladores, proporciona capacidades para que los desarrolladores se integren de manera conveniente en el ecosistema de IA de WeChat.
Después de la integración, los mini programas tendrán la oportunidad de ser recomendados e invocados por la IA de WeChat. Los mini programas que no completen la integración no podrán ser invocados por la IA de WeChat.
La plataforma ofrece dos modos de integración. Modo automático: autoriza a la plataforma para leer el código fuente del mini programa durante el proceso de revisión, sin necesidad de un desarrollo adicional. Modo de desarrollo: los desarrolladores pueden realizar desarrollos personalizados basados en las características comerciales del mini programa.
El mismo día, Meituan anunció oficialmente que se integraba en el ecosistema de IA de WeChat. Como uno de los primeros equipos en la prueba interna, Meituan ya había colaborado con el equipo de WeChat para desarrollar y probar la integración. En el futuro, los usuarios podrán invocar servicios de vida local como Meituan Waimai a través de la IA de WeChat.
Plataformas de servicios de vida como Ctrip y Tongcheng también han anunciado sucesivamente su integración en WeChat.
Ya unos días antes, el servicio al cliente de Tencent indicó que WeChat estaba colaborando con fabricantes de teléfonos como Huawei, Xiaomi, Honor, OPPO y vivo para lanzar capacidades de asistente A2A, y que varios fabricantes ya habían completado la integración.
Los usuarios pueden iniciar llamadas de audio y video de WeChat o enviar mensajes a contactos específicos a través del asistente de IA del sistema del teléfono correspondiente.
Esta no es la primera vez que se tienen noticias sobre la IA de WeChat. Ya en marzo de este año, medios extranjeros señalaron que Tencent estaba avanzando en un proyecto altamente confidencial de Agente de IA dentro de WeChat.
El 2 de junio, medios extranjeros publicaron información indicando que Tencent estaba probando un prototipo de Agente de IA integrado en WeChat, y que el proceso de aprobación regulatoria podría iniciarse este mismo mes. El día de la publicación del informe, el precio de las acciones de Tencent cerró con un aumento del 10,5%, incrementando su valor de mercado en más de 300 mil millones de HKD en un solo día, marcando el mayor aumento diario desde enero de 2021.
La IA de WeChat podría ser la respuesta definitiva para la segunda mitad del juego de IA de Tencent.
01
El contorno de la IA de WeChat
Personas que han visto las demostraciones tempranas revelan que los usuarios pueden deslizar hacia la derecha en la interfaz principal de WeChat para abrir la ventana de diálogo del Agente de IA. Después de que el usuario ingrese una instrucción, el Agente invocará automáticamente mini programas dentro del ecosistema de WeChat para completar tareas como filtrar, realizar pedidos y reservas.
Por ejemplo, si dices "ayúdame a pedir un café que cueste menos de 30 yuanes, no muy dulce y que pueda recoger cerca", el Agente invocará automáticamente mini programas dentro de WeChat para filtrar cafeterías, coincidir con gustos y precios, e incluso completar el proceso de pedido.
Solo escuchando la descripción, no parece diferente de otros chatbots de IA como Doubao o Qianwen.
Pero lo especial aquí es que la IA de WeChat tiene autoridad de despacho sobre todo el ecosistema de WeChat.
Tencent mencionó claramente en su informe anual de 2025 que el objetivo es construir servicios de Agentes de próxima generación dentro del ecosistema de WeChat, conectando las capacidades de mini programas, contenido, redes sociales y pagos. Hasta el 31 de marzo de 2026, los usuarios activos mensuales combinados de WeChat y WeChat alcanzaron los 1.432 mil millones.
En otras palabras, una vez que la IA de WeChat se lance, para bien o para mal, está destinada a ser una superaplicación.
Hay millones de mini programas dentro de WeChat, cubriendo escenarios de la vida diaria como taxis, comida a domicilio, reserva de entradas, compra de alimentos, etc. Casi todos los servicios principales de Internet en China tienen una entrada de mini programa en este ecosistema.
La capacidad central de la IA de WeChat es permitir que la IA invoque los servicios y capacidades transaccionales dentro de estos mini programas, completando un ciclo completo desde la cognición hasta la decisión y la ejecución.
¿Entonces, cómo lo hará?
Primero, comprender la intención del usuario. Cuando un usuario dice "ayúdame a reservar un restaurante", el significado es completamente diferente si se dice en un grupo familiar o en un grupo de trabajo.
Quién participa, quién puede tomar la decisión, cuál es el presupuesto, qué restricciones alimentarias hay, en qué paso está la tarea, todo esto es el contexto que el Agente necesita comprender. La dificultad radica en que las tareas dentro de WeChat naturalmente abarcan tiempo; una conversación en un grupo familiar sobre las vacaciones de verano puede continuar intermitentemente durante varios días.
Luego, invocar herramientas.
El Agente necesita actuar, usar "Buscar" para buscar información, usar mini programas para completar consultas y comparaciones de precios, usar WeChat Pay para completar transacciones, usar notificaciones de servicio para dar retroalimentación de resultados al usuario.
Según el "Informe de Primavera de Flujo de Ecosistema Panorámico 2026" de QuestMobile, los usuarios activos diarios de mini programas superan los 900 millones, cubriendo cientos de áreas específicas.
Ahora la caja de herramientas es lo suficientemente grande, la pregunta es: ¿la IA de WeChat la entenderá?
Tencent reveló algunos detalles técnicos en un artículo publicado el 18 de marzo. El equipo de WeChat desarrolló UI-Oceanus, un modelo del mundo diseñado específicamente para el ecosistema de mini programas. Su función es predecir los resultados de las operaciones. El Agente encuentra un botón, pero ¿qué sucederá al presionarlo? ¿A dónde saltará la página? ¿Qué ventana emergerá? ¿Se iniciará el proceso de pago?
Los humanos tienen intuición sobre esto al operar una aplicación, pero el Agente no tiene esa intuición, por lo que debe aprenderlo de los datos.
La IA de juegos aprende "cómo se moverá el personaje al presionar esta tecla", mientras que el modelo del mundo de los mini programas aprende "cómo cambiará la página al presionar este botón".
Entrenar directamente en el entorno real de mini programas es demasiado lento e inestable, por lo que UI-Oceanus simula automáticamente operaciones y cambios de página, generando 5 millones de muestras. Esto permite que el Agente aprenda a operar mini programas en un entorno virtual y luego migre a escenarios reales.
También está el problema de los costos. Una entrada con 1.400 millones de usuarios activos mensuales, si cada escenario activa inferencia, el costo es astronómico. Tencent necesita equilibrar entre usar modelos pequeños para tareas básicas e invocar modelos fuertes para tareas complejas. Esta capacidad de despacho de múltiples modelos debe garantizar la efectividad mientras controla los costos.
Finalmente, la coordinación del ecosistema.
Hay demasiados mini programas en WeChat; la calidad del servicio, la estabilidad de las interfaces, la cooperación de los comerciantes, los procesos de pago, el orden de recomendación, la distribución de beneficios, cada uno de estos puntos podría discutirse extensamente por separado.
El Agente de IA debe hacer las cosas por el usuario, realmente completarlas, no prometer suavemente solo para perderse a mitad del pedido.
Por lo tanto, la IA de WeChat es en realidad una ingeniería muy compleja, tiene que enfrentar una variedad de escenarios complejos. Necesita entender lenguaje natural, invocar mini programas, manejar pagos, gestionar contexto, coordinar el ecosistema.
El contorno de la IA de WeChat es claro, solo que este producto será mucho más grande de lo que imaginamos.
02
¿Por qué WeChat es el más adecuado para albergar este Agente?
Cuanto más rico es el contexto, mejor puede la IA comprender tu verdadera intención, y más precisas serán las decisiones que tome.
Y WeChat resulta ser el contenedor de contexto más grande de Tencent.
WeChat tiene cadenas de relaciones: las relaciones sociales, los registros de chat, las conversaciones grupales de sus 1.400 millones de usuarios dentro de WeChat, todo esto es contexto. WeChat tiene mini programas: millones de mini programas que cubren escenarios de servicios, esto también es contexto.
WeChat tiene pagos: los hábitos de consumo, registros de pagos, preferencias transaccionales de los usuarios, esto también es contexto.
WeChat tiene contenido: los flujos de información en las cuentas oficiales, los canales de video, los momentos, esto también es contexto.
Recientemente, Tencent ha lanzado muchos productos de IA, como Yuanbao, Ima, WorkBuddy, Marvis, que parecen independientes. En realidad, todos están acumulando capacidades para la IA de WeChat.
Detrás de esto hay un mecanismo interno de Tencent llamado Co-Diseño.
En resumen, Co-Diseño significa que los equipos de producto y los equipos de modelo diseñan y optimizan juntos.
El enfoque tradicional es que el equipo de modelo entrena primero el modelo y luego se lo entrega al equipo de producto para que lo use. El equipo de producto encuentra problemas y los devuelve, y el equipo de modelo los ajusta.
Este proceso es lento y a menudo resulta en situaciones donde "el modelo es fuerte pero el producto no es fácil de usar".
El enfoque de Co-Diseño es diferente. El equipo de Yuanbao le dice al equipo de Hunyuan cómo los usuarios realmente preguntan y qué problemas encuentran en escenarios reales. El equipo de Hunyuan optimiza ciertas capacidades del modelo basándose en esta retroalimentación real.
Después de la optimización, el equipo de Yuanbao lo prueba inmediatamente, encuentra nuevos problemas y continúa ajustando.
Este proceso es bidireccional y sincrónico. El producto proporciona datos y retroalimentación real al modelo, y el modelo proporciona capacidades más fuertes al producto.
¿Por qué es útil esto? Porque la diferencia más esencial entre la era de los LLM y la IA del pasado es la generalización.
Antes de los LLM, para hacer un producto de traducción solo necesitabas preparar bien los datos de traducción, para hacer un programa de Go solo necesitabas preparar los datos de Go.
Pero hoy la situación es diferente, incluso si solo quieres hacer un Agente de Codificación, también necesitas que el modelo tenga capacidades de chat, búsqueda, seguimiento de instrucciones, razonamiento. Así que finalmente se convierte en un problema interdisciplinario muy complejo.
El Co-Diseño de Tencent y Yuanbao es precisamente para que el modelo Hunyuan desarrolle fuertes capacidades de chat y búsqueda. Estas capacidades pueden luego ser transferidas a otros productos como Ima y WorkBuddy. Las capacidades entrenadas por un producto pueden hacer que otros productos también sean más fáciles de usar.
Específicamente, Yuanbao maneja la distribución de instrucciones (Prompt distribution) del mundo real. Las preguntas que los usuarios hacen en Yuanbao son bastante vagas, tal vez solo una o dos frases, y siguen preguntando.
Las capacidades de diálogo multi-turno y comprensión de intenciones entrenadas en estos escenarios pueden transferirse directamente a la comprensión de contexto de la IA de WeChat cuando maneja tareas en chats grupales.
WorkBuddy acumula datos de escenarios de colaboración en oficinas.
Comprende la semántica de escenarios empresariales como estructuras de documentos, actas de reuniones, asignación de tareas. Estas capacidades pueden permitir que la IA de WeChat sepa cómo extraer información clave e identificar nodos de decisión al manejar tareas.
Ima consolida capacidades de búsqueda. Entrena al modelo en cómo transformar intenciones de consulta vagas en estrategias de búsqueda precisas, cómo filtrar información efectiva entre resultados masivos. Estas capacidades pueden permitir que la IA de WeChat realice una ronda de filtrado de información y aclaración de intenciones antes de invocar mini programas, para que no invoque todos los mini programas posibles desperdiciando tiempo y tokens, sino solo los pocos que sean útiles.
Marvis entrena capacidades de descomposición de tareas y despacho de herramientas.
Marvis descompone las instrucciones del usuario en múltiples subtareas, despacha diferentes Agentes para manipular archivos, sistemas, aplicaciones. Esta capacidad de orquestación de tareas y colaboración multi-Agente puede permitir que la IA de WeChat, al enfrentar tareas que abarcan múltiples escenarios como "ayúdame a pedir café y luego notificar a un colega", sepa cómo concatenar la invocación de mini programas, procesos de pago y notificaciones de mensajes.
Estos productos proporcionan datos diferentes, pero estos datos pueden difundirse y transferirse mutuamente, formando un sistema en red. Los datos entrenados por un producto pueden, a través de mecanismos de generalización de pre-entrenamiento y post-entrenamiento, mejorar el rendimiento de otro producto.
La IA de WeChat ahora está en el centro de una red de IA.
No necesita empezar desde cero, puede invocar directamente estas capacidades que ya han sido validadas.
Lo más importante es que WeChat en sí mismo es un ecosistema completo. Tiene cadenas de relaciones, mini programas, el ciclo transaccional cerrado de WeChat Pay, y el ecosistema de contenido de las cuentas oficiales y canales de video. Todo esto es algo que otros productos Agente no tienen.
03
¿Qué tan grande es el escenario de la IA de WeChat?
Todo esto, por ahora, se implementa a través de A2A.
A2A significa Agente a Agente.
Es un protocolo abierto que especifica cómo los Agentes de IA de diferentes fabricantes se comunican, invocan capacidades y garantizan la seguridad. Lo opuesto es la ruta del Agente GUI, que hace que la IA identifique la interfaz "leyendo la pantalla" como un humano, y luego opere WeChat a través de "clics simulados".
Tencent eligió A2A, no GUI, y esta decisión tiene consideraciones profundas.
En la conferencia telefónica de resultados del Q1 de Tencent en mayo, un analista preguntó al presidente de Tencent, Martin Lau, "¿Cómo ve el potencial a largo plazo o la posible disrupción de los Agentes a nivel de sistema operativo, incluidos los Agentes de iOS, Android o de fabricantes de teléfonos?".
Martin Lau respondió: "Desde la perspectiva del sistema operativo, aquí se mezclan varias cosas diferentes. Hay sistemas operativos reales, como iOS y Android, y luego están aquellas aplicaciones que intentan hacerse pasar por sistemas operativos. Si eres un sistema operativo como iOS o Android, quieres asegurarte de que el ecosistema esté bien protegido y cuidadosamente gestionado, y dar permisos razonables a las aplicaciones. Puedes tener un Agente que intente brindar servicios al usuario, pero necesitas obtener el permiso de diferentes aplicaciones. De lo contrario, como sistema operativo, esencialmente estás saqueando diferentes aplicaciones, lo que no es la mejor manera de gestionar un sistema operativo."
Lo que Martin Lau quiere decir es que está bien usar el Agente del sistema operativo para controlar aplicaciones, pero no sin la autorización de la aplicación, de lo contrario sería un saqueo de la aplicación.
Dicho de manera más directa, Tencent no acepta Agentes GUI, solo acepta A2A.
En los últimos dos años, los fabricantes de teléfonos intentaron usar GUI para abrir WeChat desde el exterior.
Honor YOYO promocionó "enviar un paquete rojo de WeChat con una frase", el punto de venta de los productos de hogar inteligente de Xiaomi era "Xiao Ai se conecta automáticamente a las llamadas de WeChat". Cuando le dices al teléfono "envía un paquete rojo de 10 yuanes a XX", lo que el asistente de IA ejecuta en segundo plano es: desbloquear, hacer clic en el icono de WeChat, buscar XX, hacer clic en el signo más, hacer clic en paquete rojo, ingresar 10, activar el pago.
Este comportamiento fue rápidamente bloqueado por WeChat.
En abril de 2025, el Centro de Seguridad de WeChat emitió un anuncio prohibiendo que herramientas de terceros evadan las medidas de seguridad técnica de WeChat, obteniendo o utilizando ilegalmente datos de usuarios finales de WeChat.
El teléfono Doubao de Byte también sufrió el mismo destino.
En diciembre de 2025, se lanzó la versión de vista previa técnica del asistente del teléfono Doubao, con el punto de venta principal de "IA operando directamente entre aplicaciones". Pronto, muchos usuarios informaron que sus cuentas de WeChat eran forzadas a cerrar sesión, con el sistema indicando un entorno de inicio de sesión anormal. Tencent afirmó que esto activó las estrategias existentes de control de riesgos de seguridad de WeChat.
En la IA de WeChat, Honor es la primera marca en completar la adaptación A2A de WeChat. Actualmente, algunos modelos de Honor ya admiten esta función, y los usuarios pueden activar YOYO para dar instrucciones de voz directamente, como enviar mensajes de WeChat por voz, realizar llamadas de voz o videollamadas de WeChat.
Una persona interna de Tencent comentó que cualquier Agente de teléfono, si no puede invocar WeChat, no es un verdadero Agente a nivel de sistema. Tencent ciertamente abrirá esta puerta, es solo cuestión de tiempo.
WeChat está dispuesto a permitir que los Agentes de los fabricantes de teléfonos invoquen capacidades de WeChat de manera limitada a través de protocolos controlados como A2A, pero no permitirá que Agentes externos entren en WeChat mediante lectura de pantalla y clics simulados.
Esto demuestra que, en última instancia, Tencent quiere mantener el poder de invocación y establecimiento de reglas del ecosistema de WeChat.
Hablando de Doubao, esto plantea otra pregunta: ¿la IA de WeChat cobrará?
Doubao tiene 345 millones de usuarios activos mensuales, y recientemente incluso se rumoreó que comenzará a cobrar por algunas funciones. Con 1.400 millones de usuarios activos mensuales de WeChat, la presión solo será mayor.
Además, la IA de WeChat enfrenta a tantas personas, activar inferencia en cada escenario ciertamente tendría un costo astronómico.
La inversión planificada anteriormente de 10 mil millones por Tencent en DeepSeek puede interpretarse como suministro de modelos y base de costos.
El modelo de gran lenguaje auto-desarrollado de Tencent, Hunyuan, necesita aliados tecnológicos, y el ecosistema de WeChat necesita aún más capacidades de inferencia de bajo costo. La ruta de entrenamiento de bajo costo de DeepSeek coincide precisamente con las necesidades de escenarios de usuarios masivos como la IA de WeChat.
El 2 de junio, Tencent también anunció que los precios de invocación de la serie DeepSeek-V4 en la plataforma Tencent Cloud se equiparan completamente con los precios oficiales de DeepSeek, y que los usuarios no tendrán que asumir ningún sobreprecio de la plataforma en la nube.
Todas estas pistas sugieren que Tencent quiere vincularse profundamente con DeepSeek, y el Agente de WeChat probablemente sea la primera respuesta después de esta vinculación.
Tareas básicas con modelos pequeños, bajo costo, alta velocidad. Tareas complejas invocando modelos fuertes, buen efecto, alta precisión. Esta capacidad de despacho de múltiples modelos debe garantizar la efectividad mientras controla los costos.
Como usuario de WeChat, si la IA de WeChat realmente puede completar una tarea de una vez, estaría dispuesto a pagar por esta capacidad.
Por ejemplo, ayudarme a reservar un vuelo, encontrarme un restaurante, o ayudarme a recordar quién es esta persona que ha estado en mi lista de momentos durante mucho tiempo y con quien no tengo ningún historial de chat. Creo que todas estas funciones tienen mucho valor.
Lo más importante es que la IA de WeChat no solo enfrenta a usuarios individuales, sino también a usuarios empresariales. La automatización empresarial, el servicio al cliente inteligente, el marketing inteligente, estos escenarios tienen una demanda más fuerte de IA y una mayor voluntad de pago.
El escenario de la IA de WeChat es realmente grande. ¿Qué tan grande? La respuesta es: tan grande como sea el ecosistema de WeChat.
El científico jefe de IA de Tencent y responsable del modelo Hunyuan, Yao Shunyu, en la Conferencia de Aplicación Industrial de IA de Tencent Cloud el 5 de junio, ofreció un juicio a más largo plazo.
Él cree que la IA es un juego a largo plazo, no una ventana a corto plazo. Criticó la mentalidad de algunos profesionales del sector en Silicon Valley de "ganar dinero rápido y retirarse en dos años", enfatizando que el momento actual es como "la PC en los años 70", y que en el futuro surgirán continuamente nuevas oportunidades de producto.
Este juicio explica precisamente por qué Tencent está dispuesto a invertir tanto costo en la IA de WeChat. Yao Shunyu enfatizó especialmente que "el valor práctico es mayor que el valor de liderar clasificaciones". Él cree que la metodología de IA ya está altamente madura, y que la verdadera dificultad está en encontrar "buenos problemas" para resolver, no en perseguir números en las listas de clasificación.
Lo que la IA de WeChat quiere resolver son precisamente estos "buenos problemas".
Cómo hacer que estos 1.400 millones de usuarios sientan el valor que aporta la IA en su vida diaria.
Aquí no hay alarde técnico, ni mucho menos liderar clasificaciones, solo resolviendo este buen problema, Tencent realmente entrará en la segunda mitad del juego de la IA.
Este artículo proviene del WeChat público "Faceaibang" (ID: faceaibang), autor: Miao Zheng, editor: Wang Jing








