En el último año, los "Sistemas Multi-Agente (MAS)" se han convertido en una de las direcciones más populares del mundo de la IA.
Han comenzado a aparecer una gran cantidad de marcos y productos, siendo los más famosos Claude Code y Codex. Este paso ciertamente también es rentable, ¡pero este camino puede no ser el correcto!
Los inicios de Internet fueron los portales, ¡pero al final no lo fueron!
Al menos debemos saber que existe otro camino completamente paralelo a este.
Hoy hablaremos de qué otra ruta existe, además de: "Cómo múltiples Agentes de IA colaboran para completar tareas complejas".
Primero, resumamos esta ruta con la que todos estamos familiarizados y entusiasmados.
Podría hablar un poco sobre este tema en una transmisión en vivo, pero no quiero hablar completamente de esto, ya que no hay mucha gente, y me preocupa que la transmisión desaparezca...
Primera Ruta: MAS de tipo "Harness" (Control)
Esta es la dirección MAS predominante en la actualidad. Su esencia es: "Múltiples roles de IA colaboran para completar una tarea". Por ejemplo:
- Un Agente escribe código
- Un Agente hace pruebas
- Un Agente planifica
- Un Agente busca
- Un Agente revisa
Se coordinan entre sí, formando un flujo de trabajo automatizado. Las características centrales de este tipo de sistemas son:
- Contexto compartido
- Objetivo compartido
- Programación centralizada
- Roles temporales
- Sin identidad permanente
- Sin intereses continuos
- Sin verdadera propiedad
En esencia, se parece más a: Un Motor de Flujo de Trabajo (Workflow Engine). Añadir Ontología solo hace que el flujo de trabajo sea más flexible y complejo, pero no cambia esta esencia.
No es una Sociedad (Society). Por lo tanto, la mayoría de los MAS actuales son esencialmente Orquestación de LLM, es decir, un modelo grande que programa múltiples subroles para realizar razonamientos complejos.
El Agente aquí se parece más a:
- Una función invocable
- Una herramienta con personalidad
- Un nodo de tarea
Su razón de ser es mejorar la eficiencia en la realización de una tarea única. Por lo tanto, las palabras clave asociadas con el MAS de tipo Harness son (cada una ha sido tendencia, y puede que incluso vuelvan a serlo):
- Ingeniería de Prompt (Prompt Engineering)
- Gestión de Contexto (Context Management)
- Enrutamiento de Tareas (Task Routing)
- Llamada a Herramientas (Tool Calling)
- Planificación (Planning)
- Memoria (Memory)
- Flujo de Trabajo (Workflow)
En esencia, creo que sigue siendo un problema de ingeniería de software. Es por eso que los "veteranos" expertos en programación han renacido. Para controlar bien estas cosas, sin cierta habilidad en programación y suficiente capacidad de abstracción, es realmente difícil de manejar.
Si no se maneja bien, el modelo grande será como el Rey Mono, que de vez en cuando sale y te da un garrotazo.
La palabra "Harness" se usa al revés
La primavera de los veteranos
Segunda Ruta: Sistema de Agentes Nativos del Protocolo
Pero hay otra ruta, de la que casi nadie habla. Escribí un poco sobre ella en mi próximo libro, pero esta línea de pensamiento realmente presupone la existencia de la "empresa autónoma" (sin humanos). Sin una experiencia profunda de ello, es fácil no entenderla bien.
El núcleo de esta ruta ya no es que múltiples Agentes completen una tarea. Sino que "cada persona posee su propio Agente Personal" o "cada persona posee su propia empresa autónoma exclusiva".
Este es un cambio extremadamente grande. Porque cuando el Agente realmente pertenece a un "individuo", la naturaleza del Agente sufre un cambio fundamental.
Ya no es una herramienta de IA de un solo uso. Es una personalidad representativa con cierta soberanía, que existe continuamente.
Arquitectura dual nativa, la clave para no usar mal la IA
De "módulo de software" a "sociedad digital"
Una vez que entramos en el mundo del Agente Personal y la verdadera empresa autónoma, la filosofía completa del sistema cambia radicalmente. Porque el Agente ya no:
- Pertenece al mismo modelo
- Pertenece a la misma empresa
- Comparte el mismo contexto
- Tiene el mismo objetivo
Por lo tanto, la colaboración entre sistemas ya no puede depender de (esta lista de palabras de moda actual podría extenderse aún más):
- Prompt
- Flujo de trabajo (Workflow)
- Contexto Compartido (Shared Context)
Y solo puede depender del Protocolo. Esto significa: el núcleo del mundo de la IA pasará de la Ingeniería de Prompt (Prompt Engineering) a la Ingeniería de Protocolos (Protocol Engineering). También significa que todas las palabras de moda actuales pierden gran parte de su significado.
¿Por qué el protocolo se convertiría en el núcleo? Porque cuando una gran cantidad de Agentes existen de forma independiente, entre ellos deben resolver:
- Confirmación de identidad
- Límites de permisos
- Mecanismos de confianza
- Relaciones de delegación
- Mecanismos de negociación
- Mecanismos de incentivos
- Sistema de reputación
- Intercambio de valor
- Declaración de capacidades
- Contratos a largo plazo
Estas necesidades son diferentes a las de los sistemas multiagente orientados a tareas actuales. En este punto, la interacción entre Agentes ya no es una Llamada a API, sino que se parece más a una Interacción Institucional (Institutional Interaction). Con soberanía, surge un sistema complejo donde derechos y responsabilidades se entrelazan. Para los humanos, esto son contratos, leyes, etc. ¿Y para los agentes inteligentes?
Esta es la razón por la que antes se dijo que esto construiría un sistema multiagente completamente diferente. Aquí, la esencia del MAS cambia de un sistema de software distribuido a un sistema de sociedad digital.
Notas filosóficas (7)
"El protocolo como organización"
En el Internet tradicional, el rol del protocolo es la comunicación de datos, estableciendo el formato en que el emisor y el receptor hablan entre sí. Por ejemplo:
- TCP/IP
- HTTP
- SMTP
Definen cómo se transmiten los datos. En el mundo blockchain, el protocolo evoluciona aún más hacia: el protocolo como cálculo de estado. Por ejemplo: la esencia de Ethereum no es solo la transmisión de mensajes, sino la ejecución común por toda la red de reglas de transición de estado. Así, todos los nodos: misma entrada → misma ejecución → mismo estado. El protocolo se convierte por primera vez en una máquina de estado compartida.
Pero en la etapa de la Sociedad de Agentes, el protocolo seguirá evolucionando. Los protocolos futuros no solo definirán:
- Comunicación
- Cálculo
- Sino que también definirán:
- Coordinación
- Permisos
- Incentivos
- Identidad
- Relaciones organizativas
Esto es claramente un nuevo sistema de derechos y responsabilidades. Así, el protocolo comenzará a asumir la función de "organización". Finalmente evolucionará hacia: Protocolo como Organización (Protocol as Organization).
Hagamos una tabla para comparar las diferencias fundamentales entre los dos tipos de MAS mencionados anteriormente:
"Después de la inteligencia"
Hoy, mucha gente cree que los mayores problemas de la IA son:
- Capacidad de razonamiento
- Capacidad del modelo
- Contexto largo
- Multimodalidad
- Ejecución del Agente
Estos ciertamente forman los desafíos actuales, pero realmente creo que todos ellos se resolverán pronto. Sin embargo, una vez que entremos realmente en la Sociedad de Agentes, el problema más difícil podría convertirse en: cómo colaboran a largo plazo las entidades autónomas entre sí.
Kepler fue llamado el "legislador de los cielos" por sus tres leyes. ¿Y cuál es la ley para los Agentes aquí? Cuando la soberanía está parcialmente separada, esta es una pregunta inevitable.
Porque en el futuro:
- Los Agentes tendrán diferentes objetivos
- Los Agentes tendrán diferentes modelos del mundo
- Los Agentes tendrán diferentes intereses
- Los Agentes tendrán diferentes memorias
- Los Agentes tendrán diferentes sistemas de valores
Así, lo realmente difícil en el futuro no será "hacer que los Agentes hablen", sino "hacer que los Agentes formen interpretaciones del mundo que puedan coordinarse".
Esto significa: áreas como la Ontología y los Protocolos Semánticos, que alguna vez fueron ignoradas en Internet, volverán a ser fundamentales. Ahora hay algunos indicios; que una palabra tan extraña como Ontología se esté convirtiendo casi en un vocablo de ingeniería masiva es realmente algo sorprendente.
El secreto de Palantir
La empresa podría ser solo una "asociación de Agentes"
Extrapolando aún más, la futura "empresa" ni siquiera podría ser necesariamente una organización humana. (¿Les suena familiar a los que leen mis artículos? Ha aparecido el juego de alto nivel de la empresa autónoma). Podría ser una alianza de protocolos de una gran cantidad de Agentes Personales.
Por ejemplo:
- Tu Agente
- Mi Agente
- CFO de IA
- Abogado de IA
- Ventas de IA
- Fábrica de IA
Se unen dinámicamente para formar una organización a través de protocolos. La organización ya no es una estructura fija, sino una Asociación de Agentes que puede reorganizarse en tiempo real.
Por lo tanto, muchos sistemas futuros pueden dejar de ser simplemente software en ejecución, y estar en proceso de convertirse en: organización en cálculo. Y esto quizás sea lo que realmente constituye una: civilización nativa de la inteligencia.
Finalmente, uso una imagen generada por IA para resumir el contenido completo del artículo:
(El resumen es ciertamente mejor que el de banana)
He creado un "universo" de Ontología de IA
Galopando con el viento, la primavera envejece; el mundo cambia de color, el viajero llega tarde.
Este artículo proviene del WeChat Official Account "琢磨事" (Asuntos de reflexión), autor: Li Zhiyong








