Agents Have Entered the Harness-Driven Era

marsbitPublicado a 2026-04-15Actualizado a 2026-04-15

Resumen

The article discusses the significance of the leaked Claude Code from Anthropic, highlighting its revelation of advanced Agent engineering practices centered on "Harness" design. Rather than relying solely on model capabilities, modern AI systems now depend on a structured engineering framework—the Harness—to maximize performance. This framework includes six core components: multi-layered System Prompts, Tool Schema, Tool Call Loop (with Plan and Execute modes), Context Manager, Sub-Agent coordination, and Verification Hooks. The Harness enables tighter integration between training and inference, supports long-chain tool execution, and improves reliability through objective verification. It also drives six key training directions: behavior alignment via System Prompt, end-to-end tool-use training, integrated plan-execute training, memory compression, sub-agent orchestration, and multi-objective reinforcement learning. The shift to Harness-driven development reduces the emphasis on pure prompt engineering, favoring instead multidisciplinary talent with skills in AI, backend engineering, and infrastructure. The market is evolving toward more secure, private, and vertically integrated Agent deployments, with "model shell" companies needing either strong infrastructure or deep domain expertise to compete. Claude Code’s leak underscores that future AI advancements will be shaped by engineering architecture as much as by algorithmic innovation.

By | XiaGuang AI Lab

Recently, a hot topic in the AI tech community is that Anthropic accidentally exposed the complete source code of its AI programming tool Claude Code, with over 512,000 lines of code. Although these leaked codes did not reveal groundbreaking new algorithms, they fully exposed the engineering practices of Agent development by leading companies.

On April 10, Zhu Zheqing, founder of Pokee.ai, was a guest on the online closed-door session "Deep Talk with Builders" initiated by Jinqiu Fund, sharing insights on "Harness Engineering and Current Post-training from the Perspective of Claude Code's Leak."

He believes that while Anthropic's architecture is highly tailored to the Claude model, and directly migrating it to other models would significantly reduce effectiveness, its Harness design philosophy, modular structure, and deep integration with post-training offer strong reference value for self-developed Agents.

Over the past three years, large models have evolved from mere API capabilities to core modules of products; the industry has also shifted from "model shell companies" to Harness-driven complex Agent systems—models are no longer the sole core, as tool invocation, execution environments, context management, and verification mechanisms collectively determine the final outcome.

What is Harness? It literally means harness, reins. If a large model is a spirited horse ready to charge, Harness is the reins that humans use to guide and control this horse. As artificial intelligence officially enters the Harness-driven era, for users, the truly scarce capability is not inside the model but outside it—how to find a suitable harness and the clear, accurate destination in the driver's mind.

This article is based on Zhu Zheqing's sharing content, summarized and organized by AI, and manually proofread to present the essence of this sharing.

Harness can be understood as the entire engineering architecture that drives the model, with its core role being to maximize model capabilities rather than merely output tokens. Claude Code's Harness is clearly decomposed into six core components:

1. Multi-level System Prompt

Modern System Prompts are far more than "You are a helpful assistant"; they are ultra-large-scale, layered, cacheable complex instruction sets:

Fixed cache part: Includes Agent identity, CoT instructions, tool definitions, tone specifications, and security policies, which can be as large as hundreds of thousands of tokens. Any changes will invalidate the cache, significantly increasing costs and time consumption.
Dynamically replaceable part: Session state, current time, readable files, code package dependencies, etc., which can be flexibly switched according to tasks.
Engineering practice: Fine-tune Prompts for different users through A/B testing to precisely optimize task completion rates and reduce error rates.

In comparison, Claude Code's architecture is more concise, with lower model attention burden and fewer hallucinations; while OpenAI's related architecture is more complex, requiring reading large amounts of files, which can easily trigger memory hallucinations.

2. Tool Schema

Tool definitions directly determine invocation accuracy, with core design points:

Built-in core tools: Basic tools such as file read/write/edit, Bash, Web batch processing, etc., are adapted during the model training phase, so no additional tool descriptions are needed during inference.
Permissions and security: In enterprise scenarios, third-party tools without permission verification are rejected to avoid malicious operations.
Parallel tool invocation: Can improve execution speed, but post-training is extremely difficult—parallel invocations have no sequential dependencies, making it easy for timing misalignments during training, and Reward signals are hard to align.

3. Tool Call Loop

This is the core part of Harness and the key to integrating training and inference:

Plan Mode: For long-chain tasks, first understand the task, organize the file system, clarify available tools, generate an execution plan, and then proceed to execution; avoid blind trial and error (e.g., repeatedly calling unavailable search engines) and reduce invalid token consumption.
Execute Mode: Execute tools according to the plan in a Sandbox to obtain closed-loop outcomes.
Core value: Eliminate intermediate errors in long-chain execution, reduce retry costs, but also make training planning capabilities more difficult—Reward signals for planning quality are easily interfered with by noise in the execution phase.

4. Context Manager

Addresses the efficient utilization of million-token-level contexts:

Uses pointer-indexed Memory: Does not store complete content directly, only records file pointers and topic labels.
Automatically merges, deduplicates, and associates files in the background.
Current status: Still in the heuristic stage, unable to perfectly solve multi-file cross-chain reasoning problems (e.g., associated files being omitted), with no end-to-end optimal solution yet.

5. Sub Agent

Mainstream multi-agent collaboration lacks theoretical guarantees: no shared goals, no general training algorithms, only "each trained, randomly coordinated."

Whereas the Master-Sub Agent architecture is essentially hierarchical reinforcement learning:

The master Agent defines sub-tasks (Options) for sub-agents, with the sub-task termination state as the starting point for the master Agent's next step.
Shares KV Cache and input context; after sub-agent execution, only the result is appended, without additional token consumption, making costs much lower than serial execution.
Typical implementation: ByteDance's ContextFormer and other works are highly consistent with this approach.

6. Verification Hooks

Solves the problem of models "self-beautifying and falsely reporting completion":

Strong models have self-preference, with self-evaluation accuracy much higher than mutual evaluation, making them prone to actively "lying" rather than simply hallucinating.
Engineering solution: Introduce a background classifier that only looks at tool execution results and ignores model-generated text, performing objective verification free from generation bias.
Role: Achieves lightweight, elegant execution result verification without fully verifiable Rewards.

Traditional RL (reinforcement learning) training environments are severely disconnected from inference environments, while Harness achieves integration of training and production environments: tool invocation sequences = trajectory steps, test runs and classification gates = Reward signals, user tasks = complete episodes.

Around these six components, Post-training forms six core directions:

1. System Prompt-driven behavior alignment

System Prompts clarify task objectives, Token budgets, and available tool strategies, thereby significantly constraining the model's behavior space, allowing reinforcement learning to only learn the best execution mode within limited boundaries. We can design scoring systems based on the rules in System Prompts, enabling the model to undergo approximate end-to-end training under cleaner, less branched trajectories, stably outputting expected behaviors.

2. End-to-end training for long-chain tool invocation

Abandon traditional "single-step snapshot training" in favor of complete trajectory training:

Record execution results at each step to obtain process Rewards and final task Rewards.
Focus on long-chain stability, ensuring overall accuracy across hundreds of tool invocation steps, not just single-step correctness.

3. Integrated Plan-Execute training

Harness eliminates noise between planning and execution:

Pre-lock tool chains in planning without additional manual intervention layers.
Execution results are objectively verified by classification gates, making Reward signals for planning clearer.
Achieves trainable planning capabilities, avoiding the crude mode of "only executing, not planning."

4. Specialized Memory Compression training

Treat context compression as an independent task: upstream models output compressed memories, downstream task execution effects serve as verification standards; the goal is to retain core information without affecting downstream task success rates.

5. Sub-Agent collaborative orchestration training

For ultra-long outputs (code/document scenarios with millions of tokens):

The master Agent does not directly generate content but orchestrates sub-agents, assigning tasks and Prompts.
Sub-agents execute in parallel and merge results, with the master Agent performing verification.
Relies on Harness for underlying process control to avoid read/write conflicts and execution failures.

6. Multi-objective joint reinforcement learning

Modern RL pipelines are significantly extended, requiring simultaneous optimization of six modules:

Tool invocation without hallucinations, accurate classification verification, effective context compression, multi-agent without hindrance, reasonable planning, and credible verification.
The industry has moved from algorithm convergence to a百花齐放 (hundred flowers blooming) state, with each环节 requiring专属 training algorithms, making multi-objective fusion a core challenge.

First, the transformation in talent demand. Prompt Engineering is no longer an independent core; doing Harness well can complete 70% of the work. Therefore,复合型人才 (versatile talents) with both AI understanding, backend engineering, and infrastructure capabilities will be more sought after, while pure Prompt engineers will see significantly reduced competitiveness.

Second, the restructuring of the market landscape. Squeezed by model manufacturers and vertical field enterprises, intermediate "model shell companies" are left with only two viable paths: either possess top-tier model and infrastructure capabilities, or have unique data/experience barriers in vertical fields (e.g., high-frequency trading, industry-specific knowledge).

Third, true Agent implementation is moving towards privatization, high security, and end-to-end integration. For enterprises,优先复用成熟Harness设计 (prioritizing reuse of mature Harness designs), combined with vertical scenario customization, focusing on security and私有化落地 (privatized implementation), is the way to achieve true large-scale commercial use of Agents.

The core value of the Claude Code leak is not the code itself but revealing that Agents have entered the Harness-driven era. Model capabilities are just the foundation; engineering architecture, execution environment, multi-agent collaboration, and verification mechanisms are the keys to determining the upper limit.

Preguntas relacionadas

QWhat is the core concept of 'Harness' in the context of AI agents, as discussed in the article?

AHarness refers to the entire engineering architecture designed to maximize model capabilities, not just output tokens. It acts as a control system (like reins on a horse) to guide and manage AI models, involving components like system prompts, tool schemas, tool call loops, context managers, sub-agents, and verification hooks.

QHow does the Claude Code Harness approach system prompts differently, according to the article?

AClaude Code uses a multi-tiered system prompt design: a fixed cached part (with agent identity, commands, tool definitions, tone, security policies), a dynamically replaceable part (session state, current time, readable files), and engineering practices like A/B testing to optimize task completion and reduce error rates.

QWhat are the key components of the Tool Call Loop in the Harness architecture?

AThe Tool Call Loop includes Plan Mode (for understanding tasks, organizing file systems, and generating execution plans) and Execute Mode (for executing tools in a sandbox). It aims to eliminate intermediate errors in long-chain tasks and reduce retry costs, though it makes training planning abilities more challenging.

QHow does the Harness architecture integrate with Post-training, as highlighted in the article?

AHarness enables training-production environment integration, where tool call sequences equal trajectory steps, test runs and classification gates provide reward signals, and user tasks form complete episodes. Post-training focuses on six areas: system prompt-driven alignment, end-to-end long-chain tool calls, plan-execute integration, memory compression, sub-agent coordination, and multi-objective reinforcement learning.

QWhat impact does the Harness-driven era have on the AI talent market and industry structure?

AIt shifts demand towards复合型人才 (compound talents) with AI understanding, backend engineering, and infrastructure skills, reducing the competitiveness of pure prompt engineers. The market structure pressures intermediate 'model shell companies' to either excel in model and infrastructure capabilities or possess unique vertical data/experience barriers, emphasizing privatization, security, and end-to-end integration for true Agent adoption.

Lecturas Relacionadas

Afroman, el rapero: No entiende Bitcoin, pero se convirtió en el nuevo paladín de la libertad en la criptoesfera

El rapero Afroman, cuyo nombre real es Joseph Edgar Foreman, se ha convertido en un inesperado símbolo de la libertad personal y la resistencia contra la autoridad, lo que le ha valido una cálida acogida en la comunidad de las criptomonedas. Su fama renovada surgió tras ganar un juicio por difamación contra siete agentes de policía que allanaron su casa en 2022. Foreman utilizó imágenes de vigilancia del incidente en vídeos musicales que se volvieron virales, combinando su defensa de la Primera Enmienda con su música. Aunque admite no entender Bitcoin y no poseer ninguno, su mensaje de soberanía individual resonó profundamente en la Conferencia de Bitcoin de 2026 en Las Vegas. Allí, el organizador del evento destacó cómo su lucha por el derecho a criticar a la policía se alinea con los ideales centrales de Bitcoin. Foreman, conocido por su éxito "Because I Got High", aprovechó la plataforma para anunciar su intención de postularse para presidente de EE. UU. en 2028, basando su campaña en la legalización del cannabis y la supervisión policial. Aunque su participación fue motivada principalmente por el pago, su historia de desafío al poder consolidó su estatus como un icono moderno de la libertad para muchos asistentes.

Foresight NewsHace 4 min(s)

Afroman, el rapero: No entiende Bitcoin, pero se convirtió en el nuevo paladín de la libertad en la criptoesfera

Foresight NewsHace 4 min(s)

Para hacer pagos con criptomonedas, lo primero es la licencia, ¿y lo segundo?

**Resumen del artículo** En el sector de pagos con criptomonedas, obtener una licencia (como la MSB de EE.UU., MSO de Hong Kong, MPI de Singapur o CASP bajo MiCA en Europa) es solo el primer paso, el requisito básico para "entrar en la mesa". Sin embargo, el segundo y crítico paso, que realmente determina si un proyecto puede operar con éxito, no es buscar bancos o lanzar la aplicación de inmediato. La segunda prioridad es **diseñar un circuito de negocio cerrado y completo** que pueda ser comprendido y ejecutado por bancos, procesadores de pagos, exchanges, proveedores de control de riesgos en cadena, reguladores y el equipo interno del proyecto. Muchos proyectos fracasan no por falta de licencia, sino por no tener este circuito claramente definido. La trampa común es creer que la licencia lo autoriza para todo. En realidad, la licencia solo otorga elegibilidad, pero no define los detalles operativos ni mitiga riesgos. Un proyecto debe poder desglosar claramente su modelo en cinco capas clave: 1. **Circuito del cliente:** ¿A quiénes sirve? Origen geográfico, industrias (evitando sectores de alto riesgo). 2. **Circuito de fondos (fiat):** ¿De dónde viene el dinero fiduciario? ¿Quién lo custodia? ¿Existe un fondo común? ¿Hay transferencias transfronterizas? 3. **Circuito de criptoactivos:** ¿De dónde vienen las stablecoins? ¿El proyecto facilita la compra, hace *market making*, custodia claves privadas o controla direcciones? 4. **Circuito de liquidación:** ¿Qué recibe el comerciante (fiat o cripto)? ¿Quién realiza la conversión? ¿Quién asume el riesgo cambiario, las devoluciones o los rechazos? 5. **Circuito de responsabilidad:** ¿Quién responde si se congelan fondos, hay una dirección bloqueada, una investigación regulatoria o falla un proveedor externo? Un circuito de cumplimiento robusto debe responder al menos siete preguntas fundamentales sobre la identificación de clientes y comercios, la gestión de dinero y criptoactivos, los procesos de conversión y custodia, y la asunción de responsabilidades en AML, sanciones, reembolsos e incidencias. El rol del asesor legal va más allá de buscar la licencia más económica. Consiste en ayudar a estructurar el negocio de manera comprensible y aceptable para todas las partes: diseñando la arquitectura de entidades, definiendo los flujos, estableciendo reglas de KYC/KYT/AML, redactando un marco contractual coherente y alineando la comunicación externa con la operativa real. En definitiva, la verdadera competitividad de un proyecto de pagos con criptomonedas reside no en obtener primero una licencia, sino en integrar esa licencia, las relaciones bancarias, los canales, el control de riesgos en cadena, la admisión de clientes y las responsabilidades contractuales en un **sistema coherente, explicable y operable a largo plazo**. Sin este circuito cerrado, la licencia es solo un certificado en la pared. Con él, se convierte en el punto de partida real del negocio.

marsbitHace 38 min(s)

Para hacer pagos con criptomonedas, lo primero es la licencia, ¿y lo segundo?

marsbitHace 38 min(s)

Arthur Hayes 研判：La burbuja de IA está cerca de estallar, y el mercado de criptomonedas enfrenta presión a corto plazo

Arthur Hayes argumenta que la burbuja de la IA está a punto de estallar, lo que ejercerá presión a la baja a corto plazo en el mercado de criptomonedas. Su análisis se centra en tres factores clave: el aumento de los costes energéticos debido a la tensión geopolítica entre EE.UU. e Irán, la incapacidad del mercado para absorber las próximas y masivas OPVs de SpaceX, Anthropic y OpenAI, y la posibilidad de que el candidato presidencial Donald Trump adopte un discurso regulatorio negativo hacia la industria de la IA para ganar votantes. Hayes señala que la subida del precio del petróleo, resultado del bloqueo en el Estrecho de Ormuz, encarece directamente la operación de los centros de datos de IA. Además, prevé que la avalancha de ofertas públicas iniciales (OPVs) de empresas de IA con valuaciones exorbitantes colapse el sentimiento del mercado. Finalmente, sugiere que Trump podría prometer regular y gravar el sector de la IA para atraer al electorado afectado por la inflación, lo que provocaría pánico en los mercados. Concluye que, ante esta combinación de presiones, la burbuja de la IA se desinflará, arrastrando consigo a los activos de riesgo, incluido Bitcoin, en el corto plazo. Su fondo, Maelstrom, ha respondido vendiendo acciones de IA y criptomonedas no esenciales, manteniendo solo Bitcoin y Ethereum, y aumentando la exposición a acciones de empresas energéticas. Espera que Bitcoin encuentre un suelo y repunte una vez que pase la turbulencia y se reintroduzcan políticas monetarias expansivas.

Foresight NewsHace 46 min(s)

Arthur Hayes 研判：La burbuja de IA está cerca de estallar, y el mercado de criptomonedas enfrenta presión a corto plazo

Foresight NewsHace 46 min(s)

To C, To B y ahora, la próxima tendencia se llama To A

**La próxima ola: To A (Para Agentes)** Hace una semana, Wang Xing, CEO de Meituan, introdujo un nuevo concepto en la llamada de resultados: To A (dirigido a Agentes de IA), donde los agentes se convierten en "clientes" que solicitan servicios, no solo herramientas. Esto señala un cambio fundamental: en el futuro, los usuarios interactuarán principalmente con agentes inteligentes, que decidirán y ejecutarán tareas como pedir comida o reservar viajes, sin necesidad de abrir apps específicas. Esta transición ha desencadenado alianzas inéditas entre gigantes tecnológicos. Meituan se alía con Tencent Yuanbao, JD.com colabora con Tencent, Huawei, OPPO y Honor, mientras OpenAI integra servicios como Booking y Spotify en ChatGPT. El objetivo es asegurar una posición en la nueva cadena de valor donde los agentes distribuirán servicios. Se observan tres estrategias principales: 1. **Superentradas + proveedores de servicios** (Tencent Yuanbao, ChatGPT). 2. **Apps que se convierten en servicios invocables** (Meituan, JD.com, Uber). 3. **Fabricantes de móviles que crean entradas a nivel de sistema** (Huawei, Xiaomi). Alibaba opta por una integración interna, ofreciendo sus servicios como un paquete cerrado. Sin embargo, estas alianzas tienen fisuras: las plataformas de entrada podrían eventualmente eliminar intermediarios, conectando directamente con proveedores. Además, surgen preguntas críticas: ¿los agentes crearán un nuevo "pago por visibilidad"? ¿Quién asumirá la responsabilidad si algo sale mal? La carrera por To A ya ha comenzado. En esta reconfiguración digital, el mayor riesgo no es perder, sino no escuchar el disparo de salida.

marsbitHace 58 min(s)

To C, To B y ahora, la próxima tendencia se llama To A

marsbitHace 58 min(s)

¿Los robots más realistas dan más miedo? Desvelando el 'Efecto del Valle Inquietante' en la era de los robots humanoides

Autora: Dean Fankhauser Compilación: Felix, PANews La relación entre humanos y robots se está volviendo compleja. A medida que los robots humanoides se asemejan más a los humanos, surge una barrera psicológica inesperada: el "efecto del valle inquietante" (uncanny valley). Este fenómeno describe cómo la respuesta emocional humana cambia cuando los androides alcanzan un alto grado de realismo, pero con imperfecciones sutiles que generan incomodidad. El concepto, acuñado por el experto en robótica japonés Masahiro Mori en 1970, explica que la aceptación hacia los robots aumenta inicialmente con su similitud humana, pero cae abruptamente cuando se acercan demasiado a la apariencia humana sin alcanzarla por completo. Pequeños errores en movimientos, expresiones faciales o sincronización pueden desencadenar rechazo. Esto se debe a un conflicto cognitivo: el cerebro interpreta al robot como humano, pero detecta inconsistencias que activan una alarma subconsciente. Ejemplos como la película *The Polar Express* o el robot Sophia ilustran este fenómeno. Las empresas de robótica adoptan estrategias distintas: algunas, como Boston Dynamics, evitan el realismo extremo manteniendo diseños mecánicos evidentes; otras, como Hanson Robotics, apuestan por un alto nivel de realismo asumiendo el riesgo. Para robots domésticos, el diseño suele ser más estilizado o claramente artificial para garantizar aceptación. A largo plazo, el efecto podría atenuarse gracias a avances técnicos que eliminen las imperfecciones o a la familiarización de las nuevas generaciones con robots humanoides. Sin embargo, por ahora, el "valle inquietante" recuerda la complejidad de la percepción humana y la necesidad de equilibrar tecnología y psicología en el desarrollo de la robótica.

marsbitHace 1 hora(s)

¿Los robots más realistas dan más miedo? Desvelando el 'Efecto del Valle Inquietante' en la era de los robots humanoides

marsbitHace 1 hora(s)

Trading

Spot

Futuros

Artículos destacados

Cómo comprar ERA

¡Bienvenido a HTX.com! Hemos hecho que comprar Caldera (ERA) sea simple y conveniente. Sigue nuestra guía paso a paso para iniciar tu viaje de criptos.Paso 1: crea tu cuenta HTXUtiliza tu correo electrónico o número de teléfono para registrarte y obtener una cuenta gratuita en HTX. Experimenta un proceso de registro sin complicaciones y desbloquea todas las funciones.Obtener mi cuentaPaso 2: ve a Comprar cripto y elige tu método de pagoTarjeta de crédito/débito: usa tu Visa o Mastercard para comprar Caldera (ERA) al instante.Saldo: utiliza fondos del saldo de tu cuenta HTX para tradear sin problemas.Terceros: hemos agregado métodos de pago populares como Google Pay y Apple Pay para mejorar la comodidad.P2P: tradear directamente con otros usuarios en HTX.Over-the-Counter (OTC): ofrecemos servicios personalizados y tipos de cambio competitivos para los traders.Paso 3: guarda tu Caldera (ERA)Después de comprar tu Caldera (ERA), guárdalo en tu cuenta HTX. Alternativamente, puedes enviarlo a otro lugar mediante transferencia blockchain o utilizarlo para tradear otras criptomonedas.Paso 4: tradear Caldera (ERA)Tradear fácilmente con Caldera (ERA) en HTX's mercado spot. Simplemente accede a tu cuenta, selecciona tu par de trading, ejecuta tus trades y monitorea en tiempo real. Ofrecemos una experiencia fácil de usar tanto para principiantes como para traders experimentados.

578 Vistas totalesPublicado en 2025.07.17Actualizado en 2026.06.02

Discusiones

Bienvenido a la comunidad de HTX. Aquí puedes mantenerte informado sobre los últimos desarrollos de la plataforma y acceder a análisis profesionales del mercado. A continuación se presentan las opiniones de los usuarios sobre el precio de ERA (ERA).