The Scriptures Chanted by OpenAI and Anthropic Might Be Crooked

marsbitPublié le 2026-05-28Dernière mise à jour le 2026-05-28

Résumé

In the current AI landscape, "Harness-style" Multi-Agent Systems (MAS)—where multiple AI agents with temporary roles collaborate under a central workflow for task efficiency—dominates the conversation, championed by players like OpenAI and Anthropic. However, the author argues this approach, focused on orchestration and software engineering, may be misguided. A more transformative, yet less discussed, alternative is the "Protocol-Native Agent System." Here, the core unit shifts from task-specific agents to persistent "Personal Agents" or "unmanned companies" that represent individuals. These agents possess sovereignty, long-term memory, identity, resources, and relationships. This paradigm change transforms MAS from a distributed software system into a digital society. Collaboration can no longer rely on shared prompts or context, but must be built on protocols governing identity, trust, incentives, reputation, and value exchange—essentially, "Protocol as Organization." The future's true challenge lies not in improving single-agent capabilities, but in enabling long-term coordination among autonomous entities with differing goals, world models, and values. The author suggests that future organizations might themselves be dynamic alliances of such sovereign agents, leading to an "intelligence-native civilization."

Over the past year, "Multi-Agent System (MAS)" has become one of the hottest directions in the AI world.

A large number of frameworks and products have emerged simultaneously. The most famous among them are obviously Claude Code and Codex. This step indeed makes money, but this path might not be the right one!

The early internet was about portals, but that wasn't the final form!

At the very least, we should know there is another path entirely parallel to this.

Today, we are talking about what other routes exist besides: "How multiple AI Agents collaborate to complete complex tasks."

Let's first summarize this popular and familiar route.

We can touch on this topic a bit in a live stream, but I don't want to focus entirely on it. There aren't many people watching anyway, and I'm worried it might get the stream taken down...

The First Route: Harness-style MAS

This is the current mainstream direction for MAS. Its essence is: "Multiple AI roles collaborate to complete tasks." For example:

  • One Agent writes code
  • One Agent does testing
  • One Agent does planning
  • One Agent does searching
  • One Agent does review

They cooperate with each other, forming an automated workflow. The core characteristics of such systems are:

  • Shared context
  • Shared goal
  • Centralized scheduling
  • Temporary roles
  • No long-term identity
  • No sustained interests
  • No true ownership

Essentially, it's more like: A Workflow Engine. Adding Ontology merely makes the workflow flexible and complex; it doesn't change this essence.

It is not a Society. So, most of today's MAS is essentially LLM Orchestration, where one large model schedules multiple sub-roles to complete complex reasoning.

The Agent here is more like:

  • A callable function
  • A tool with personality
  • A task node

Their existence is to improve the efficiency of completing individual tasks. Therefore, keywords associated with Harness MAS are (each has been hot, and might even cycle back):

  • Prompt Engineering
  • Context Management
  • Task Routing
  • Tool Calling
  • Planning
  • Memory
  • Workflow

Essentially, I think this still falls under software engineering problems. So, the experienced "old masters" good at programming have been reborn. To control these things well, without solid programming skills and good abstraction ability, it's actually very difficult to manage.

If you can't manage it, the large model will be like the Monkey King, occasionally popping out and hitting you with a stick.

The word "Harness" is used in reverse here.

Springtime for the old masters.

The Second Route: Protocol-Native Agent System

But there is another route, one almost nobody mentions. I've written a bit about it in my upcoming new book, but this line of thinking actually presupposes the concept of an "unmanned company." Without deeply understanding the unmanned company, it's easy to misunderstand.

The core of this route is no longer about multiple Agents completing tasks. Instead, it's "each person owns their own Personal Agent" or "each person owns their own dedicated unmanned company."

This is an extremely huge change. Because when an Agent truly belongs to an "individual," the nature of the Agent undergoes a fundamental transformation.

It is no longer task-scoped, but becomes identity-scoped. These are two terms the model helped me coin; I struggled for a long time to come up with the English words.

The core idea here is actually decision-making sovereignty. The biggest difference between a Personal Agent/an unmanned company and a general system is that they need to have a certain kind of sovereignty. Otherwise, the essence discussed later doesn't hold. The difference between an unmanned company and an unmanned system also lies in the sovereignty over cash flow.

In other words, the future Personal Agent or unmanned company needs to possess the following characteristics:

  • Has long-term memory
  • Has a persistent identity
  • Has preferences
  • Has resources
  • Has permissions
  • Has history
  • Has a relationship network
  • Has interests/boundaries
  • Has representation (represents "you")

It is no longer a one-time AI Tool. It is a continuously existing proxy personality with a certain kind of sovereignty.

Dual-native architecture, the key to not misusing AI.

From "Software Module" to "Digital Society"

Once entering the world of Personal Agents and true unmanned companies, the entire system philosophy changes completely. Because Agents are no longer:

  • Belonging to the same model
  • Belonging to the same company
  • Sharing the same context
  • Sharing the same goal

Therefore, collaboration between systems can no longer rely on (this current hot keyword list can be extended further):

  • Prompt
  • Workflow
  • Shared Context

It can only rely on protocols (Protocol). This means: the core of the AI world will shift from Prompt Engineering to Protocol Engineering. It also means the various current hot keywords become largely meaningless.

Why will protocol become the core? Because when massive Agents exist independently, they must solve among themselves:

  • Identity confirmation
  • Permission boundaries
  • Trust mechanisms
  • Delegation relationships
  • Negotiation mechanisms
  • Incentive mechanisms
  • Reputation systems
  • Value exchange
  • Capability declaration
  • Long-term contracts

These needs are different from the needs of current task-oriented multi-agents. At this point, interactions between Agents are no longer like API Calls, but more like Institutional Interaction. With sovereignty comes a complex intertwined system of rights and responsibilities. For humans, this is contracts, laws, etc. What about for intelligent agents?

This is why it was said earlier that this would build a completely different kind of Multi-Agent System. Here, the essence of MAS changes from a distributed software system to a digital social system.

Philosophical Notes (7)

"Protocol as Organization"

In the traditional internet, the role of protocols is data communication, where the sender and receiver agree on the format for talking to each other. For example:

  • TCP/IP
  • HTTP
  • SMTP

They define how data is transmitted. In the blockchain world, protocols have further evolved into: Protocol as State Computation. For example: The essence of Ethereum is not merely message passing, but the entire network jointly executing state transition rules. Thus all nodes: Same input → Same execution → Same state. For the first time, protocol becomes a shared state machine.

But entering the stage of Agent Society, protocols will continue to evolve. Future protocols will not only define:

  • Communication
  • Computation
  • But also define:
  • Coordination
  • Permissions
  • Incentives
  • Identity
  • Organizational relationships

This is clearly a brand-new system of rights and responsibilities, so protocols will begin to assume the function of "organization." Ultimately evolving into: Protocol as Organization.

Let's make a table to compare the fundamental differences between the two MAS approaches mentioned earlier:

After "Intelligence"

Many people today believe the biggest problems with AI are:

  • Reasoning ability
  • Model capability
  • Long context
  • Multimodality
  • Agent execution

These indeed pose current challenges, but I truly believe all these will be solved soon. However, upon truly entering Agent Society, the most difficult problem might become: how autonomous entities achieve long-term collaboration.

Kepler was revered as the "lawgiver of the heavens" because of his three laws. But what are the laws for Agents here? When sovereignty is partially separated, this is an unavoidable question.

Because in the future:

  • Agents will have different goals
  • Agents will have different world models
  • Agents will have different interests
  • Agents will have different memories
  • Agents will have different value systems

Therefore, the truly difficult thing in the future is not "making Agents talk," but "enabling Agents to form a coherently interpretable world model."

This means: Ontology, Semantic Protocol, these fields once neglected by the internet, will become core again. There are already some signs; Ontology, such an obscure term, is now almost becoming a mainstream engineering vocabulary. It's truly an astonishing thing.

The Secret of Palantir

Companies Might Just Be "Agent Associations"

Pushing this further, future "companies" might not even be human organizations. (Students who often read my articles, does this sound familiar? The high-end game of unmanned companies has appeared.) They could be protocol alliances of numerous Personal Agents.

For example:

  • Your Agent
  • My Agent
  • AI CFO
  • AI Lawyer
  • AI Sales
  • AI Factory

Dynamically forming organizations through protocols. Organizations are no longer fixed structures, but Agent associations that can be reorganized in real-time.

Therefore, many future systems may no longer be software running, but may be transforming into: organizations computing. And this might be the true: Intelligence-Native Civilization.

Finally, I'll use an AI-generated image to summarize the entire article:

(The summary is indeed better than banana)

I have established a "universe" of AI ontology.

Galloping with the wind, spring grows old; The world is fickle, the traveler's steps are slow.

This article is from the WeChat public account "琢磨事," author: Li Zhiyong

Questions liées

QWhat are the two main AI Multi-Agent System (MAS) development paths discussed in the article, and how do they fundamentally differ?

AThe article discusses two main MAS paths. The first is 'Harness-style MAS,' which is currently mainstream. It involves multiple AI agents (like coders, testers) orchestrated by a central system to complete complex tasks. It's essentially a sophisticated workflow or orchestration system. The second path is 'Protocol-Native Agent System.' Here, the focus shifts to personal or sovereign agents (like a Personal Agent or an 'unmanned company') that represent individuals with long-term memory, identity, and resources. The fundamental difference is in their nature: the first is a task-oriented, centrally controlled software system, while the second envisions a society-like system of autonomous entities that must coordinate through protocols.

QAccording to the article, why will 'protocols' become the core challenge in a future populated by autonomous Personal Agents?

AIn a future with many independent, sovereign Personal Agents (each with its own goals, memory, and value systems), central coordination methods like shared context or workflows become impossible. Therefore, protocols will become the core mechanism for enabling coordination. These protocols will need to solve complex social and institutional problems like identity verification, trust establishment, permission boundaries, incentive mechanisms, reputation systems, and long-term contracts between autonomous entities. The core challenge thus shifts from 'prompt engineering' to 'protocol engineering' to manage interactions in this digital society.

QWhat key characteristics define a true 'Personal Agent' or 'unmanned company' as opposed to a task-specific agent in the first MAS path?

AA true Personal Agent or unmanned company is defined by sovereignty and persistent identity, unlike temporary task agents. Its key characteristics include: long-term memory, a continuous identity, personal preferences, owned resources, specific permissions, a personal history, a relationship network, defined interest boundaries, and the ability to represent its owner ('you'). It is an identity-scoped entity, not a task-scoped tool. This sovereignty is what necessitates the complex protocol-based interactions described in the article.

QThe article suggests the concept of 'Protocol as Organization.' What does this mean in the context of Agent Society?

A'Protocol as Organization' means that in an Agent Society, the protocols governing agent interactions will take on the functions traditionally associated with human organizations. Beyond just defining data communication (like HTTP) or shared state computation (like blockchain), these advanced protocols will define coordination rules, permission structures, incentive models, identity management, and the very organizational relationships between agents. In this way, a 'company' or collective entity could be formed dynamically not by legal documents and fixed structures, but by a set of protocols that allow a coalition of Personal Agents and specialized AI agents to collaborate and operate together.

QWhat does the author believe will be the most difficult challenge after basic AI 'intelligence' problems (like reasoning, context) are solved?

AThe author believes the most difficult challenge will be enabling long-term collaboration between autonomous entities (agents). Once agents have different goals, world models, interests, memories, and value systems, the core problem shifts from making agents intelligent to making their interpretations of the world align enough for cooperation. This will make fields like Ontology (defining shared conceptual frameworks) and Semantic Protocols (protocols with shared meaning) critically important, moving the focus from technical execution to social and philosophical coordination within a digital civilization.

Lectures associées

Trois ans plus tard : Retour sur mon jugement de 2023 concernant ChatGPT

Trois ans après ses prédictions sur ChatGPT en mars 2023, Wang Jianshuo revient sur ses vingt affirmations initiales, évaluées en mai 2026 par des agents IA. Sur les vingt points, la majorité des tendances de fond étaient correctes : l'essor du RAG comme architecture dominante pour l'injection de connaissances, le rôle central de l'interface utilisateur en langage naturel (LUI), l'émergence de protocoles pour un "réseau d'agents", et le rattrapage technologique rapide des modèles chinois. Des erreurs notables portent sur des chiffres précis, comme les 100 billions de paramètres supposés de GPT-4 (en réalité environ 1,8 billion) ou une estimation trop basse des coûts de formation des grands modèles. Certaines prévisions se sont révélées trop absolues ("l'IA ne fera jamais de mathématiques pures") ou ont négligé les disparités (aucune vague de chômage massif, mais un impact sévère sur les jeunes diplômés). L'analyse révèle que les intuitions sur les mécanismes et les directions se sont avérées bien plus fiables que les prédictions numériques ou temporelles, souvent trop optimistes à court terme. La prudence dans les formulations et la reconnaissance des incertitudes se sont montrées précieuses avec le recul. Ce bilan offre des leçons pour les futurs pronostics : privilégier les tendances aux chiffres, anticiper les effets distributifs et accepter que certaines questions demandent plus de trois ans pour être tranchées.

marsbitIl y a 7 h

Trois ans plus tard : Retour sur mon jugement de 2023 concernant ChatGPT

marsbitIl y a 7 h

Trois ans plus tard : un retour sur mes prédictions de 2023 concernant ChatGPT

Trois ans après ses prédictions sur le ChatGPT en mars 2023, Wang Jianshuo revient sur ses 20 affirmations initiales. Évaluées en mai 2026 par des agents IA, la plupart de ses intuitions sur les grandes tendances se sont révélées justes : le RAG est devenu l'architecture standard pour intégrer des connaissances, l'Interface Utilisateur en Langage Naturel (LUI) a créé un nouvel écosystème, et les modèles chinois ont presque rattrapé les leaders mondiaux. Des concepts comme les réseaux d'agents et la nature limitée du test de Turing se sont également matérialisés. Cependant, les prévisions quantitatives et les affirmations trop absolues ont souvent échoué. Le paramétrage supposé du GPT-4 (100T) était inexact, et les coûts de développement des modèles ont dépassé les estimations. Il a sous-estimé la vitesse de personnalisation des IA et l'impact distribué sur l'emploi des jeunes. La capture de valeur a surtout bénéficié à la couche matérielle (comme Nvidia), et non aux seules applications. Les leçons clés sont que les mécanismes et les directions sont plus fiables que les chiffres précis, que l'optimisme à court terme doit être tempéré, et que les nuances ("peut-être", "pour l'instant") rendent les prédictions plus robustes. Cette rétrospective souligne l'importance de distinguer les tendances confirmées des questions toujours ouvertes.

链捕手Il y a 10 h

Trois ans plus tard : un retour sur mes prédictions de 2023 concernant ChatGPT

链捕手Il y a 10 h

Du Token à la main-d'œuvre machine : l'IA passe d'outil à « travailleur »

Alors que l'IA écrit du code, traite des tickets clients et révise des documents juridiques, elle ne se contente plus d'être un outil mais devient une source directe de travail. La commercialisation de l'IA évolue ainsi d'un marché de « jetons » (tokens) ou d'heures de GPU vers un nouveau marché : celui de la « main-d'œuvre machine ». Dans ce marché, le jeton n'est qu'une unité de mesure, le GPU un intrant, et le modèle un outil de production. L'objet véritablement tarifé et échangé est le travail économique accompli directement par le logiciel. Le mécanisme de prix de l'IA devrait évoluer des jetons bruts vers des capacités de modèles standardisées, puis vers une main-d'œuvre sectorielle, et enfin vers un marché de résultats programmables. À l'avenir, les entreprises pourraient ne plus se soucier du modèle ou du GPU spécifique utilisé, mais uniquement du fait que la tâche soit livrée dans des délais, avec un taux de précision, une fiabilité et un coût conformes aux standards. Ce changement ne signifie pas un simple remplacement du travail humain. Alors que la machine assume des tâches standardisées et vérifiables, le rôle humain pourrait se déplacer vers la supervision, la responsabilité finale, la gestion du contexte et les jugements critiques. Dans certains cas, les 1% de jugement humain final pourraient gagner en valeur, car ils permettent de débloquer les 99% d'automatisation à grande échelle. Le marché évolue donc vers une couche où le « travail » lui-même devient l'unité stable, standardisée, vérifiable et négociable. La prochaine phase de concurrence ne portera pas seulement sur la puissance des modèles ou le prix du calcul, mais sur la capacité à standardiser, vérifier et tarifer le « travail » accompli, faisant de la main-d'œuvre machine une nouvelle ressource productive que l'on peut acheter, facturer et échanger.

marsbitIl y a 11 h

Du Token à la main-d'œuvre machine : l'IA passe d'outil à « travailleur »

marsbitIl y a 11 h

La réduction de 99% du prix de Xiaomi MiMo n'est pas un coup marketing ! Luo Fuli répond aux détracteurs sur X

Dans un article intitulé "La réduction de 99% du prix de MiMo de Xiaomi n'est pas du marketing ! Luo Fuli répond aux détracteurs sur X", Luo Fuli, responsable de MiMo, a publié un billet de blog technique de 5000 mots pour expliquer la baisse drastique des prix de l'API MiMo-V2.5. Contrairement aux interprétations initiales d'une guerre des prix ou d'une stratégie de perte, cette réduction de 99% concerne spécifiquement le coût des entrées en cache ("Input Cache Hit"), c'est-à-dire la relecture du contexte historique dans les conversations longues. Le billet détaille six piliers d'ingénierie ayant permis cette réduction : 1. **Architecture Hybride SWA** : Réduction du volume de la mémoire cache (KVCache) à 1/7 grâce à une attention par fenêtre glissante sur 60 des 70 couches du modèle. 2. **Gestion en double pool** : Allocation efficace de la mémoire pour matérialiser les gains théoriques du SWA, multipliant par 5 le nombre d'utilisateurs simultanés par GPU. 3. **Cache de préfixe optimisé** : Augmentation du taux de réussite du cache à 93-95% en moyenne, évitant de recalculer les contextes répétés. 4. **Système de cache distribué GCache** : Stockage des données sur les SSD des machines GPU existantes, réduisant les coûts de stockage additionnels à zéro. 5. **Système de routage LLM-Router** : Optimisation de l'acheminement des requêtes pour maximiser l'utilisation du cache et améliorer les performances. 6. **Prédiction Multi-Token (MTP)** : Accélération de la génération des réponses du modèle, réduisant également les coûts de sortie. Cette chaîne d'optimisations systémiques a réduit le temps GPU par requête d'un ordre de grandeur, permettant une baisse de prix de 99% tout en maintenant une marge positive. Luo Fuli souligne qu'il s'agit d'un accomplissement d'ingénierie validé en production, et non d'une simple manœuvre marketing, offrant une référence pour réduire les coûts dans le secteur de l'IA.

marsbitIl y a 13 h

La réduction de 99% du prix de Xiaomi MiMo n'est pas un coup marketing ! Luo Fuli répond aux détracteurs sur X

marsbitIl y a 13 h

Trading

Spot
Futures

Articles tendance

Comment acheter ONE

Bienvenue sur HTX.com ! Nous vous permettons d'acheter Harmony (ONE) de manière simple et pratique. Suivez notre guide étape par étape pour commencer votre parcours crypto.Étape 1 : Création de votre compte HTXUtilisez votre adresse e-mail ou votre numéro de téléphone pour ouvrir un compte sur HTX gratuitement. L'inscription se fait en toute simplicité et débloque toutes les fonctionnalités.Créer mon compteÉtape 2 : Choix du mode de paiement (rubrique Acheter des cryptosCarte de crédit/débit : utilisez votre carte Visa ou Mastercard pour acheter instantanément Harmony (ONE).Solde :utilisez les fonds du solde de votre compte HTX pour trader en toute simplicité.Prestataire tiers :pour accroître la commodité d'utilisation, nous avons ajouté des modes de paiement populaires tels que Google Pay et Apple Pay.P2P :tradez directement avec d'autres utilisateurs sur HTX.OTC (de gré à gré) : nous offrons des services personnalisés et des taux de change compétitifs aux traders.Étape 3 : stockage de vos Harmony (ONE)Après avoir acheté vos Harmony (ONE), stockez-les sur votre compte HTX. Vous pouvez également les envoyer ailleurs via un transfert sur la blockchain ou les utiliser pour trader d'autres cryptos.Étape 4 : tradez des Harmony (ONE)Tradez facilement Harmony (ONE) sur le marché Spot de HTX. Il vous suffit d'accéder à votre compte, de sélectionner la paire de trading, d'exécuter vos trades et de les suivre en temps réel. Nous offrons une expérience conviviale aux débutants comme aux traders chevronnés.

386 vues totalesPublié le 2024.12.12Mis à jour le 2025.03.21

Comment acheter ONE

Discussions

Bienvenue dans la Communauté HTX. Ici, vous pouvez vous tenir informé(e) des derniers développements de la plateforme et accéder à des analyses de marché professionnelles. Les opinions des utilisateurs sur le prix de ONE (ONE) sont présentées ci-dessous.

活动图片