OpenAI y Anthropic podrían estar diciendo las cosas equivocadas

marsbitPublicado a 2026-05-28Actualizado a 2026-05-28

Resumen

En el último año, los sistemas multi-agente (MAS) se han convertido en una de las direcciones más populares en IA. Este artículo argumenta que el enfoque actual liderado por OpenAI y Anthropic, centrado en múltiples agentes de IA colaborando en un flujo de trabajo centralizado para tareas complejas (lo que llama "Harness MAS"), es solo un camino. Este sistema se asemeja más a un motor de orquestación de LLM, donde los agentes actúan como funciones o herramientas temporales sin identidad propia duradera. El autor propone una segunda ruta fundamentalmente diferente: el "Protocol-Native Agent System". Aquí, el núcleo no son agentes para tareas, sino "Agentes Personales" o "compañías autónomas" que pertenecen y representan permanentemente a individuos. Estos agentes tendrían identidad persistente, memoria a largo plazo, preferencias, recursos y soberanía sobre decisiones e intereses. Este cambio transforma la filosofía del sistema: de un problema de ingeniería de software a la creación de una "sociedad digital". La coordinación ya no dependería de prompts o contextos compartidos, sino de protocolos que gestionen identidad, confianza, permisos, incentivos y contratos entre entidades autónomas. El reto futuro no será la capacidad de razonamiento de los agentes, sino cómo logran una interpretación coordinada del mundo y una colaboración a largo plazo con objetivos e intereses diversos. Incluso las "empresas" del futuro podrían ser alianzas dinámicas de estos Agentes Personales uni...

En el último año, los "Sistemas Multi-Agente (MAS)" se han convertido en una de las direcciones más populares del mundo de la IA.

Han comenzado a aparecer una gran cantidad de marcos y productos, siendo los más famosos Claude Code y Codex. Este paso ciertamente también es rentable, ¡pero este camino puede no ser el correcto!

Los inicios de Internet fueron los portales, ¡pero al final no lo fueron!

Al menos debemos saber que existe otro camino completamente paralelo a este.

Hoy hablaremos de qué otra ruta existe, además de: "Cómo múltiples Agentes de IA colaboran para completar tareas complejas".

Primero, resumamos esta ruta con la que todos estamos familiarizados y entusiasmados.

Podría hablar un poco sobre este tema en una transmisión en vivo, pero no quiero hablar completamente de esto, ya que no hay mucha gente, y me preocupa que la transmisión desaparezca...

Primera Ruta: MAS de tipo "Harness" (Control)

Esta es la dirección MAS predominante en la actualidad. Su esencia es: "Múltiples roles de IA colaboran para completar una tarea". Por ejemplo:

  • Un Agente escribe código
  • Un Agente hace pruebas
  • Un Agente planifica
  • Un Agente busca
  • Un Agente revisa

Se coordinan entre sí, formando un flujo de trabajo automatizado. Las características centrales de este tipo de sistemas son:

  • Contexto compartido
  • Objetivo compartido
  • Programación centralizada
  • Roles temporales
  • Sin identidad permanente
  • Sin intereses continuos
  • Sin verdadera propiedad

En esencia, se parece más a: Un Motor de Flujo de Trabajo (Workflow Engine). Añadir Ontología solo hace que el flujo de trabajo sea más flexible y complejo, pero no cambia esta esencia.

No es una Sociedad (Society). Por lo tanto, la mayoría de los MAS actuales son esencialmente Orquestación de LLM, es decir, un modelo grande que programa múltiples subroles para realizar razonamientos complejos.

El Agente aquí se parece más a:

  • Una función invocable
  • Una herramienta con personalidad
  • Un nodo de tarea

Su razón de ser es mejorar la eficiencia en la realización de una tarea única. Por lo tanto, las palabras clave asociadas con el MAS de tipo Harness son (cada una ha sido tendencia, y puede que incluso vuelvan a serlo):

  • Ingeniería de Prompt (Prompt Engineering)
  • Gestión de Contexto (Context Management)
  • Enrutamiento de Tareas (Task Routing)
  • Llamada a Herramientas (Tool Calling)
  • Planificación (Planning)
  • Memoria (Memory)
  • Flujo de Trabajo (Workflow)

En esencia, creo que sigue siendo un problema de ingeniería de software. Es por eso que los "veteranos" expertos en programación han renacido. Para controlar bien estas cosas, sin cierta habilidad en programación y suficiente capacidad de abstracción, es realmente difícil de manejar.

Si no se maneja bien, el modelo grande será como el Rey Mono, que de vez en cuando sale y te da un garrotazo.

La palabra "Harness" se usa al revés

La primavera de los veteranos

Segunda Ruta: Sistema de Agentes Nativos del Protocolo

Pero hay otra ruta, de la que casi nadie habla. Escribí un poco sobre ella en mi próximo libro, pero esta línea de pensamiento realmente presupone la existencia de la "empresa autónoma" (sin humanos). Sin una experiencia profunda de ello, es fácil no entenderla bien.

El núcleo de esta ruta ya no es que múltiples Agentes completen una tarea. Sino que "cada persona posee su propio Agente Personal" o "cada persona posee su propia empresa autónoma exclusiva".

Este es un cambio extremadamente grande. Porque cuando el Agente realmente pertenece a un "individuo", la naturaleza del Agente sufre un cambio fundamental.

  • Tener un historial
  • Tener una red de relaciones
  • Tener límites de intereses
  • Tener representatividad (representarte a "ti")
  • Ya no es una herramienta de IA de un solo uso. Es una personalidad representativa con cierta soberanía, que existe continuamente.

    Arquitectura dual nativa, la clave para no usar mal la IA

    De "módulo de software" a "sociedad digital"

    Una vez que entramos en el mundo del Agente Personal y la verdadera empresa autónoma, la filosofía completa del sistema cambia radicalmente. Porque el Agente ya no:

    • Pertenece al mismo modelo
    • Pertenece a la misma empresa
    • Comparte el mismo contexto
    • Tiene el mismo objetivo

    Por lo tanto, la colaboración entre sistemas ya no puede depender de (esta lista de palabras de moda actual podría extenderse aún más):

    • Prompt
    • Flujo de trabajo (Workflow)
    • Contexto Compartido (Shared Context)

    Y solo puede depender del Protocolo. Esto significa: el núcleo del mundo de la IA pasará de la Ingeniería de Prompt (Prompt Engineering) a la Ingeniería de Protocolos (Protocol Engineering). También significa que todas las palabras de moda actuales pierden gran parte de su significado.

    ¿Por qué el protocolo se convertiría en el núcleo? Porque cuando una gran cantidad de Agentes existen de forma independiente, entre ellos deben resolver:

    • Confirmación de identidad
    • Límites de permisos
    • Mecanismos de confianza
    • Relaciones de delegación
    • Mecanismos de negociación
    • Mecanismos de incentivos
    • Sistema de reputación
    • Intercambio de valor
    • Declaración de capacidades
    • Contratos a largo plazo

    Estas necesidades son diferentes a las de los sistemas multiagente orientados a tareas actuales. En este punto, la interacción entre Agentes ya no es una Llamada a API, sino que se parece más a una Interacción Institucional (Institutional Interaction). Con soberanía, surge un sistema complejo donde derechos y responsabilidades se entrelazan. Para los humanos, esto son contratos, leyes, etc. ¿Y para los agentes inteligentes?

    Esta es la razón por la que antes se dijo que esto construiría un sistema multiagente completamente diferente. Aquí, la esencia del MAS cambia de un sistema de software distribuido a un sistema de sociedad digital.

    Notas filosóficas (7)

    "El protocolo como organización"

    En el Internet tradicional, el rol del protocolo es la comunicación de datos, estableciendo el formato en que el emisor y el receptor hablan entre sí. Por ejemplo:

    • TCP/IP
    • HTTP
    • SMTP

    Definen cómo se transmiten los datos. En el mundo blockchain, el protocolo evoluciona aún más hacia: el protocolo como cálculo de estado. Por ejemplo: la esencia de Ethereum no es solo la transmisión de mensajes, sino la ejecución común por toda la red de reglas de transición de estado. Así, todos los nodos: misma entrada → misma ejecución → mismo estado. El protocolo se convierte por primera vez en una máquina de estado compartida.

    Pero en la etapa de la Sociedad de Agentes, el protocolo seguirá evolucionando. Los protocolos futuros no solo definirán:

    • Comunicación
    • Cálculo
    • Sino que también definirán:
    • Coordinación
    • Permisos
    • Incentivos
    • Identidad
    • Relaciones organizativas

    Esto es claramente un nuevo sistema de derechos y responsabilidades. Así, el protocolo comenzará a asumir la función de "organización". Finalmente evolucionará hacia: Protocolo como Organización (Protocol as Organization).

    Hagamos una tabla para comparar las diferencias fundamentales entre los dos tipos de MAS mencionados anteriormente:

    "Después de la inteligencia"

    Hoy, mucha gente cree que los mayores problemas de la IA son:

    • Capacidad de razonamiento
    • Capacidad del modelo
    • Contexto largo
    • Multimodalidad
    • Ejecución del Agente

    Estos ciertamente forman los desafíos actuales, pero realmente creo que todos ellos se resolverán pronto. Sin embargo, una vez que entremos realmente en la Sociedad de Agentes, el problema más difícil podría convertirse en: cómo colaboran a largo plazo las entidades autónomas entre sí.

    Kepler fue llamado el "legislador de los cielos" por sus tres leyes. ¿Y cuál es la ley para los Agentes aquí? Cuando la soberanía está parcialmente separada, esta es una pregunta inevitable.

    Porque en el futuro:

    • Los Agentes tendrán diferentes objetivos
    • Los Agentes tendrán diferentes modelos del mundo
    • Los Agentes tendrán diferentes intereses
    • Los Agentes tendrán diferentes memorias
    • Los Agentes tendrán diferentes sistemas de valores

    Así, lo realmente difícil en el futuro no será "hacer que los Agentes hablen", sino "hacer que los Agentes formen interpretaciones del mundo que puedan coordinarse".

    Esto significa: áreas como la Ontología y los Protocolos Semánticos, que alguna vez fueron ignoradas en Internet, volverán a ser fundamentales. Ahora hay algunos indicios; que una palabra tan extraña como Ontología se esté convirtiendo casi en un vocablo de ingeniería masiva es realmente algo sorprendente.

    El secreto de Palantir

    La empresa podría ser solo una "asociación de Agentes"

    Extrapolando aún más, la futura "empresa" ni siquiera podría ser necesariamente una organización humana. (¿Les suena familiar a los que leen mis artículos? Ha aparecido el juego de alto nivel de la empresa autónoma). Podría ser una alianza de protocolos de una gran cantidad de Agentes Personales.

    Por ejemplo:

    • Tu Agente
    • Mi Agente
    • CFO de IA
    • Abogado de IA
    • Ventas de IA
    • Fábrica de IA

    Se unen dinámicamente para formar una organización a través de protocolos. La organización ya no es una estructura fija, sino una Asociación de Agentes que puede reorganizarse en tiempo real.

    Por lo tanto, muchos sistemas futuros pueden dejar de ser simplemente software en ejecución, y estar en proceso de convertirse en: organización en cálculo. Y esto quizás sea lo que realmente constituye una: civilización nativa de la inteligencia.

    Finalmente, uso una imagen generada por IA para resumir el contenido completo del artículo:

    (El resumen es ciertamente mejor que el de banana)

    He creado un "universo" de Ontología de IA

    Galopando con el viento, la primavera envejece; el mundo cambia de color, el viajero llega tarde.

    Este artículo proviene del WeChat Official Account "琢磨事" (Asuntos de reflexión), autor: Li Zhiyong

    Preguntas relacionadas

    Q¿Cuáles son las dos rutas principales de los Sistemas Multi-Agente (MAS) discutidas en el artículo?

    AEl artículo describe dos rutas principales para los Sistemas Multi-Agente (MAS). La primera es el 'MAS de Tipo Harness', que se centra en múltiples roles de IA colaborando para completar tareas complejas bajo un contexto y objetivo compartidos, similar a un motor de flujo de trabajo. La segunda es el 'Sistema de Agentes Nativos de Protocolo', donde cada persona posee su Agente Personal o 'empresa sin humanos', con identidad, memoria y soberanía de decisión a largo plazo, cambiando la filosofía del sistema hacia una sociedad digital basada en protocolos.

    QSegún el artículo, ¿por qué los protocolos se vuelven centrales en un sistema de agentes personales?

    AEn un sistema de agentes personales, los protocolos se vuelven centrales porque, cuando una gran cantidad de agentes independientes existen, ya no pueden depender de prompts, flujos de trabajo o contextos compartidos para colaborar. En cambio, deben resolver cuestiones como la confirmación de identidad, los límites de permisos, los mecanismos de confianza, la delegación, la negociación, los incentivos, los sistemas de reputación, el intercambio de valor, las declaraciones de capacidad y los contratos a largo plazo. La interacción se convierte en 'interacción institucional', requiriendo protocolos que definan la coordinación, los derechos, los incentivos y las relaciones organizativas.

    Q¿Qué diferencias clave señala el autor entre un 'Agente Personal' y los agentes en el enfoque MAS tradicional?

    ALas diferencias clave son: los agentes en el enfoque MAS tradicional (Harness) son efímeros, están limitados a tareas, comparten contexto y objetivo, y actúan como herramientas o nodos de tarea programables. En cambio, un Agente Personal es una entidad de identidad a largo plazo con soberanía. Tiene memoria persistente, identidad continua, preferencias, recursos, permisos, historial, red de relaciones, límites de interés y representa al usuario. Es un agente con derechos y responsabilidades, no solo una herramienta de IA desechable.

    Q¿Qué significa la frase 'Protocolo como Organización' en el contexto del futuro de los sistemas de agentes?

    A'Protocolo como Organización' significa que en una futura sociedad de agentes, los protocolos no solo definirán la comunicación de datos (como TCP/IP) o el cálculo del estado (como en blockchain), sino que también definirán la coordinación, los permisos, los incentivos, las identidades y las relaciones organizativas entre agentes autónomos. Los protocolos asumirán la función de estructurar y gobernar las interacciones entre entidades soberanas, actuando esencialmente como el 'pegamento' o marco legal para que las coaliciones dinámicas de agentes formen organizaciones temporales o permanentes.

    Q¿Qué problema fundamental anticipa el autor que surgirá en una 'Sociedad de Agentes', más allá de las capacidades técnicas de la IA?

    AEl autor anticipa que el problema fundamental en una 'Sociedad de Agentes' no será las capacidades técnicas como el razonamiento, el contexto largo o la ejecución de tareas, sino cómo lograr una coordinación a largo plazo entre entidades autónomas. Los agentes tendrán diferentes objetivos, modelos del mundo, intereses, memorias y sistemas de valores. Por lo tanto, el verdadero desafío será 'hacer que los agentes formen interpretaciones del mundo que puedan coordinarse', lo que requerirá avances en áreas como la Ontología y los Protocolos Semánticos para establecer entendimientos y reglas comunes.

    Lecturas Relacionadas

    ¿Por qué más agentes de IA no equivalen a mayor productividad?

    **Resumen: Por qué más agentes de IA no equivalen a mayor productividad** Cuando los agentes de IA se vuelven más baratos y fáciles de ejecutar, el desarrollo de software enfrenta un nuevo desafío: el cuello de botella ya no es lanzar más agentes, sino la capacidad humana de gestionar, evaluar e integrar sus resultados. Este artículo introduce el concepto de "impuesto de orquestación". Iniciar un agente es barato (un prompt o un clic), pero cerrar el ciclo es costoso: verificar resultados, entender su impacto arquitectónico, resolver conflictos entre agentes y decidir qué código integrar. Este trabajo no se puede paralelizar; depende de un recurso en serie: el juicio humano. El desarrollador es el "GIL" (Cerradura Global del Intérprete) del sistema de agentes: el candido de un solo hilo que limita el rendimiento final. Múltiples agentes pueden ejecutarse concurrentemente, pero las fases de juicio arquitectónico, revisión de código y fusión de cambios deben pasar por la mente del desarrollador. Más agentes no siempre significan más producción; pueden solo alargar la cola de tareas pendientes de revisión, llevando a cambios de contexto más frecuentes y fatiga cognitiva. La sensación de eficiencia no equivale a productividad real. Un panel lleno de agentes en ejecución crea una ilusión de "alta producción", pero si el desarrollador no comprende, revisa e integra esos cambios, el sistema puede acumular deuda técnica y cognitiva. La discusión clave no es "cómo usar más agentes", sino "cómo rediseñar el flujo de trabajo en torno a la atención humana". La habilidad crucial es saber qué tareas delegar a la máquina para procesamiento en paralelo y cuáles reservar para el juicio humano, cuándo revisar por lotes y cuándo detener la orquestación para concentrarse en un problema central. La IA amplía la capacidad de concurrencia en la producción de software, pero la atención humana sigue siendo el recurso más escaso e irreplicable. Un flujo de trabajo maduro con agentes no consiste en asignar todas las tareas a la máquina, sino en diseñar cuidadosamente la arquitectura de la propia atención, como se haría con cualquier sistema de producción. La verdadera habilidad es diseñar el sistema respetando ese recurso en serie que no se puede clonar: tu atención.

    marsbitHace 1 hora(s)

    ¿Por qué más agentes de IA no equivalen a mayor productividad?

    marsbitHace 1 hora(s)

    Tres años después: Una revisión de mis predicciones sobre ChatGPT en 2023

    Tres años después: Revisando mis predicciones sobre ChatGPT en 2023 En marzo de 2023, tras el lanzamiento de ChatGPT, Wang Jianshuo hizo 20 predicciones intuitivas sobre la IA. Ahora, en mayo de 2026, un sistema con 41 agentes de IA las ha reevaluado con datos actuales. **Resultados clave:** * **Aciertos (dirección general):** La arquitectura RAG se convirtió en estándar para integrar conocimiento. La Interfaz de Usuario de Lenguaje (LUI) creó una nueva capa de interacción (ej. protocolo MCP). Surgieron redes de agentes autónomos que se comunican. China desarrolló modelos grandes útiles (ej. DeepSeek), cerrando la brecha técnica. Los LLM no tienen conciencia; el Test de Turing solo mide la apariencia. * **Errores/Matices:** La predicción de que GPT-4 tendría 100 billones de parámetros fue incorrecta (≈1.8B). Los LLM **sí** pueden hacer matemáticas complejas sin herramientas externas (ej. medallas IMO 2025). El valor no migró solo a la capa de aplicación; NVIDIA (capa de hardware) capturó gran parte. El contenido generado por IA no evade automáticamente los derechos de autor (multas multimillonarias). La IA personalizada crea, no reduce, "cámaras de eco". Los costes de entrenamiento de modelos líderes superaron con creces la estimación de 5-10 mil millones de dólares. **Lecciones aprendidas:** 1. Predecir **mecanismos y direcciones** es más fiable que dar cifras o declaraciones absolutas. 2. Se tiende a **sobreestimar la velocidad** de cambio a corto plazo y **subestimar su magnitud** a largo plazo. 3. Los promedios generales (ej. "no habrá desempleo masivo") pueden ocultar **impactos distributivos** severos (ej. en jóvenes). 4. Las afirmaciones con **matices y limitaciones** envejecen mejor. 5. Tres años no son suficientes para resolver debates fundamentales (ej. valor final, consciencia de la IA). Este ejercicio subraya la dificultad de hacer predicciones precisas en un campo en rápida evolución y la importancia de la humildad al proyectar el futuro.

    marsbitHace 7 hora(s)

    Tres años después: Una revisión de mis predicciones sobre ChatGPT en 2023

    marsbitHace 7 hora(s)

    Tres años después: Volviendo a mis juicios sobre ChatGPT en 2023

    En marzo de 2023, Wang Jianshuo hizo veinte predicciones sobre ChatGPT. Tres años después, en 2026, un análisis con múltiples agentes de IA evalúa su precisión. Aciertos clave: predijo correctamente el auge de RAG como arquitectura estándar para conocimiento y reducir alucinaciones, la LUI (interfaz de lenguaje natural) como nueva capa de interacción (aunque no reemplaza a la GUI), y la aparición de redes de agentes autónomos con nuevos protocolos de direccionamiento. También acertó en que China desarrollaría modelos de IA útiles (como DeepSeek) cerrando rápidamente la brecha, y en que ChatGPT carece de consciencia real, pasando el test de Turing por mera apariencia. Otras predicciones válidas fueron que no causaría desempleo masivo (aunque afectó a jóvenes), que 2023 sería un gran año para startups de IA, y que el momento fue similar al del navegador web en 1994. Errores notables: su estimación de que GPT-4 tendría 100 billones de parámetros fue incorrecta (tuvo ~1.8 billones). Se equivocó al declarar que era "imposible" que los LLM hicieran matemáticas complejas sin herramientas, ya que luego ganaron medallas en la Olimpiada Internacional de Matemáticas. También erró al sugerir que el valor se capturaría en la capa de aplicación y no en la base, subestimando el dominio de NVIDIA (capa de hardware), y al pensar que el contenido generado por IA "evitaría" problemas de copyright, cuando han surgido multas históricas. Además, la idea de que los LLM promoverían un "consenso mundial" al promediar opiniones se volvió incorrecta, ya que ahora priorizan la personalización y pueden crear nuevas cámaras de eco. Conclusiones: Sus predicciones sobre mecanismos y direcciones fueron mayormente acertadas, pero falló en números específicos (costes, parámetros) y en subestimar la complejidad de la distribución del impacto (ej. quién gana o pierde con la IA). Tendió a ser demasiado optimista a corto plazo pero conservador sobre los límites a largo plazo. El ejercicio subraya la importancia de predecir tendencias en lugar de cifras exactas y de dejar margen para la incertidumbre.

    链捕手Hace 10 hora(s)

    Tres años después: Volviendo a mis juicios sobre ChatGPT en 2023

    链捕手Hace 10 hora(s)

    Trading

    Spot
    Futuros

    Artículos destacados

    Cómo comprar ONE

    ¡Bienvenido a HTX.com! Hemos hecho que comprar Harmony (ONE) sea simple y conveniente. Sigue nuestra guía paso a paso para iniciar tu viaje de criptos.Paso 1: crea tu cuenta HTXUtiliza tu correo electrónico o número de teléfono para registrarte y obtener una cuenta gratuita en HTX. Experimenta un proceso de registro sin complicaciones y desbloquea todas las funciones.Obtener mi cuentaPaso 2: ve a Comprar cripto y elige tu método de pagoTarjeta de crédito/débito: usa tu Visa o Mastercard para comprar Harmony (ONE) al instante.Saldo: utiliza fondos del saldo de tu cuenta HTX para tradear sin problemas.Terceros: hemos agregado métodos de pago populares como Google Pay y Apple Pay para mejorar la comodidad.P2P: tradear directamente con otros usuarios en HTX.Over-the-Counter (OTC): ofrecemos servicios personalizados y tipos de cambio competitivos para los traders.Paso 3: guarda tu Harmony (ONE)Después de comprar tu Harmony (ONE), guárdalo en tu cuenta HTX. Alternativamente, puedes enviarlo a otro lugar mediante transferencia blockchain o utilizarlo para tradear otras criptomonedas.Paso 4: tradear Harmony (ONE)Tradear fácilmente con Harmony (ONE) en HTX's mercado spot. Simplemente accede a tu cuenta, selecciona tu par de trading, ejecuta tus trades y monitorea en tiempo real. Ofrecemos una experiencia fácil de usar tanto para principiantes como para traders experimentados.

    476 Vistas totalesPublicado en 2024.12.12Actualizado en 2025.03.21

    Cómo comprar ONE

    Discusiones

    Bienvenido a la comunidad de HTX. Aquí puedes mantenerte informado sobre los últimos desarrollos de la plataforma y acceder a análisis profesionales del mercado. A continuación se presentan las opiniones de los usuarios sobre el precio de ONE (ONE).

    活动图片