Fuentes: DeepSeek está formando un equipo de "Harness", que compite directamente con Claude Code

链捕手Publicado a 2026-05-22Actualizado a 2026-05-22

Resumen

DeepSeek está formando un nuevo equipo "Harness" centrado en un producto de agente de código, con el objetivo de competir directamente con Claude Code de Anthropic, según fuentes cercanas a la empresa. Este movimiento va más allá de un simple asistente de código e implica construir una capa intermedia que permita a los modelos de IA integrarse en flujos de trabajo reales de desarrollo. La compañía ha abierto dos puestos clave: Gerente de Producto Harness e Ingeniero de Desarrollo Harness. Un principio central definido es "Modelo + Harness = Agente", donde el "Harness" se refiere al sistema externo que gestiona el contexto, llama a herramientas, planifica tareas y ejecuta acciones en el entorno real, esencialmente dando "manos" al modelo. DeepSeek busca no solo empaquetar su modelo existente, sino lograr una "co-evolución" donde el producto Agente retroalimente y mejore el modelo base. La necesidad surge porque la competencia en codificación con IA está pasando de las capacidades del modelo a la integración en el flujo de trabajo del desarrollador. Un proyecto comunitario llamado DeepSeek-TUI ya demostró la demanda, pero un producto oficial permitiría una integración más profunda, un ciclo de retroalimentación de datos y una evolución coordinada con el equipo del modelo.

Autor: Wang Bo, Jiaziguangnian

"Jiaziguangnian" se enteró por fuentes cercanas a DeepSeek que, internamente, DeepSeek está organizando un nuevo equipo llamado Harness, con el enfoque en productos de agente de código, y competirá internamente con Claude Code de Anthropic.

Chen Deli, investigador senior de DeepSeek, también confirmó esto recientemente en las redes sociales, diciendo: "DeepSeek está organizando un nuevo equipo Harness para trabajar en productos e investigación en la dirección de Harness", y afirmó claramente: "En términos simples, es competir con Claude Code, hacer DeepSeek Code Harness".

Esto no es una contratación ordinaria.

La información de contratación muestra que DeepSeek ha abierto dos puestos clave esta vez: Gerente de Producto de Harness e Ingeniero de Desarrollo de Harness, y la ubicación del trabajo está actualmente limitada a Pekín. La oficina de DeepSeek en Pekín se encuentra en el Centro de Información Rongke, en el distrito de Haidian, muy cerca de la Universidad de Pekín y la Universidad de Tsinghua. En la versión oficial, se encuentra en la "Franja de Innovación AI del Centenario de Jingzhang", y en la versión popular, también se encuentra en el área de "Wang Huiwen", que está muy de moda recientemente.

Definición central: Modelo + Harness = Agente

En la descripción del puesto, una fórmula central se coloca en la posición más destacada:

Esta frase casi puede considerarse como la definición interna de DeepSeek para la ruta de producto de la próxima etapa: el modelo en sí es solo la base del Agente; la gestión del contexto, la invocación de herramientas, la planificación de tareas, la lectura y escritura de archivos, la modificación de código, la ejecución de terminal, la recolección de retroalimentación y el ciclo de evaluación fuera del modelo son las partes clave que permiten que el Agente realmente se integre en el flujo de trabajo.

La información de contratación añade: "Estamos transformando las capacidades de modelo de vanguardia de DeepSeek en productos líderes de Agente. Todos los trabajos, aparte del modelo en sí, pertenecen al ámbito de Harness." Además, este puesto participará en todo el proceso del "producto Agente de escritorio de DeepSeek" y "definirá la comprensión de DeepSeek sobre Harness".

"Jiaziguangnian" analiza que DeepSeek no solo quiere hacer un simple complemento de asistente de código, sino que está completando la capa intermedia que conecta el modelo con el flujo de trabajo real.

El año pasado, la industria ha demostrado: tener una fuerte capacidad de codificación no significa que los desarrolladores realmente la usen; que un modelo pueda escribir código no significa que pueda completar continuamente una tarea de ingeniería.

Lo que realmente cambia la forma de trabajar de los desarrolladores no es solo el modelo Claude, sino Claude Code; no es solo el modelo GPT, sino Codex; no es una respuesta de código en un cuadro de chat, sino un agente de ingeniería que puede entrar en la terminal, entender el proyecto, leer y escribir archivos, ejecutar comandos, corregir errores, gestionar Git e invocar herramientas.

Lo más fuerte de DeepSeek en el pasado era el modelo. Ahora, está comenzando a complementar las "manos" sobre ese modelo.

I. ¿Por qué DeepSeek enfatiza Harness?

En el contexto tradicional de productos de IA, "asistente de código" generalmente se refiere a dos tipos de productos: uno son complementos de autocompletado en el IDE, y el otro son preguntas y respuestas de código en un cuadro de chat.

Pero la palabra que aparece repetidamente en esta contratación de DeepSeek no es "Asistente de Código", sino Harness.

Harness originalmente en el contexto de ingeniería se refiere a "arnés de prueba" o "marco de ejecución". En el contexto de Agentes, se acerca más a un sistema externo que permite que el modelo realmente actúe. El modelo es responsable de la comprensión, el razonamiento y la generación; Harness es responsable de integrar estas capacidades en el entorno real.

La descripción del puesto menciona que este rol necesita planificar la hoja de ruta del producto DeepSeek Harness, conectar investigadores, ingenieros, la comunidad de código abierto y los usuarios finales, y comunicarse en profundidad con los investigadores del equipo de entrenamiento de modelos para lograr la evolución conjunta del modelo y el Harness.

Esta frase es clave.

Indica que lo que DeepSeek quiere hacer no es solo envolver el modelo existente en una capa, sino convertir el producto Agente en parte de la evolución del modelo. En el pasado, la lógica común de producto en las empresas de grandes modelos era: primero el equipo de investigación entrena un modelo, luego el equipo de producto desarrolla aplicaciones basadas en las capacidades del modelo. Pero en la era de los Agentes, este orden está cambiando. El producto ya no es solo la salida de las capacidades del modelo, sino el campo de entrenamiento de las capacidades del modelo.

Que un Agente de código falle en un proyecto real puede deberse no a un problema de interacción del producto, sino a que la forma en que el modelo comprime el contexto largo es incorrecta; puede no ser un problema de la cadena de invocación de herramientas, sino a que la estrategia del modelo para descomponer tareas es inestable; o puede que no sea una falta de capacidad de código, sino que le falta una comprensión continua de las restricciones de ingeniería, la retroalimentación de las pruebas y la intención del usuario.

Por lo tanto, el valor del equipo Harness no es solo "hacer un producto", sino convertir las tareas reales de desarrollo en una fuente de retroalimentación para la evolución continua del modelo.

II. ¿Por qué DeepSeek debe complementar Code Harness?

DeepSeek apostó por la capacidad de código desde muy temprano. Desde DeepSeek-Coder hasta DeepSeek-Coder-V2, la inversión de DeepSeek en modelos de código ha aumentado continuamente, mejorando el soporte de lenguajes, la longitud del contexto y la capacidad para tareas complejas. Su problema no es la falta de capacidad de código, sino que en el pasado esta capacidad se quedó más en la capa del modelo y aún no se ha convertido en un producto de alta frecuencia en el flujo de trabajo diario de los desarrolladores.

La popularidad de Claude Code demuestra una cosa: La competencia en IA de codificación está pasando de una competencia de capacidad de modelo a una competencia por la entrada al flujo de trabajo del desarrollador.

Esta es también una lección que DeepSeek debe complementar ahora. Más sutilmente, antes de que DeepSeek oficialmente tomara medidas, la comunidad de desarrolladores ya había creado una versión de "Claude Code basado en DeepSeek".

Un proyecto de código abierto llamado DeepSeek-TUI se hizo popular anteriormente en la comunidad de desarrolladores. Es un agente de codificación que se ejecuta en la terminal, puede leer y escribir archivos, ejecutar comandos Shell, buscar en la web, gestionar Git y coordinar sub-agentes a través de una interfaz TUI.

La popularidad de DeepSeek-TUI ilustra dos problemas:

  1. Madurez de la mentalidad base: El modelo DeepSeek ya tiene la base para ser un Agente de código en la mentalidad de los desarrolladores. De lo contrario, la comunidad no generaría naturalmente un producto estilo Claude Code alrededor de él.

  2. Falta a nivel oficial: A DeepSeek no le falta atención al modelo, le falta Harness oficial.

Para los desarrolladores, el atractivo de DeepSeek-TUI es directo: bajo costo, disponible en China, contexto largo y umbral de despliegue relativamente bajo. Muchos desarrolladores en China no es que no quieran usar Claude Code, sino que están limitados por el precio, la estabilidad del acceso, el sistema de cuentas y el cumplimiento empresarial.

Pero los proyectos comunitarios también tienen límites naturales:

  • Por muy activo que sea un proyecto de código abierto de terceros, es difícil que realmente controle el ritmo de evolución de las capacidades internas del modelo;

  • Puede adaptarse alrededor de la API, pero no puede decidir inversamente cómo se entrena el modelo;

  • Puede optimizar prompts, cadenas de herramientas e interacciones, pero es difícil inyectar sistemáticamente la retroalimentación de una gran cantidad de tareas reales en la mejora del modelo.

Aquí es precisamente donde reside el significado del Harness oficial.

DeepSeek desarrollando su propio Code Harness tiene varias ventajas que los proyectos comunitarios no poseen: colaboración con el equipo de modelos, derecho de diseño de interfaces, ciclo cerrado de datos de entrenamiento, escenarios de tareas reales internas y capacidad de operación a largo plazo del ecosistema de desarrolladores.

La comunidad de código abierto ya ha allanado el camino primero: los desarrolladores realmente necesitan una versión de DeepSeek de Claude Code. Ahora, DeepSeek quiere recuperar ese camino y convertirlo en su propio producto principal.

Y el hecho de que DeepSeek oficialmente comience a contratar personal significa que finalmente está preparado para tomar medidas directas.

Chen Deli mencionó en noviembre pasado en la Cumbre Mundial de Internet de Wuzhen 2025: "Una de las ventajas centrales de nuestra empresa es el largo plazo, insistir en esta línea principal de avances de inteligencia de vanguardia. Y en este proceso, también hemos renunciado a muchas cosas en líneas secundarias, no hacemos esas cosas rápidas y superficiales en las líneas secundarias."

Después de la guerra de modelos, comienza la verdadera guerra de Agentes. Esta vez, lo que DeepSeek quiere complementar es la capa más crítica entre el modelo y la acción: Harness.

DeepSeek está poniéndole un par de manos a su modelo.

Preguntas relacionadas

Q¿Qué noticia reveló '甲子光年' sobre DeepSeek?

A'甲子光年' reveló, a través de fuentes cercanas a DeepSeek, que la empresa está formando internamente un nuevo equipo llamado 'Harness'. Este equipo se enfocará en desarrollar un producto agente de inteligencia para código, con el objetivo interno de competir con 'Claude Code' de Anthropic.

Q¿Qué significa la fórmula 'Model + Harness = Agent' mencionada en la descripción del puesto de DeepSeek?

AEsta fórmula representa la definición interna de DeepSeek para su camino de desarrollo de productos. Significa que el modelo en sí es solo la base del agente. Los elementos externos al modelo, como la gestión de contexto, invocación de herramientas, planificación de tareas, lectura/escritura de archivos, modificación de código, ejecución en terminal, recolección de retroalimentación y ciclo de evaluación, son las partes clave que permiten que un agente se integre en flujos de trabajo reales. El 'Harness' abarca todo el trabajo necesario para convertir las capacidades del modelo en un producto agente funcional.

QSegún el artículo, ¿por qué es crucial para DeepSeek desarrollar su propio 'Harness' de código en este momento?

AEs crucial porque la competencia en IA para codificación ha evolucionado de una competencia de capacidades del modelo a una competencia por la entrada al flujo de trabajo del desarrollador. El éxito de Claude Code demostró esto. Aunque DeepSeek ya tiene fuertes capacidades de código a nivel de modelo (como DeepSeek-Coder), estas no se han convertido en un producto de alta frecuencia en el flujo de trabajo diario de los desarrolladores. Desarrollar un 'Harness' oficial le permite a DeepSeek cerrar esta brecha, integrar el agente en entornos reales y, lo más importante, utilizar las tareas de desarrollo reales como una fuente de retroalimentación para la evolución continua del modelo.

Q¿Qué proyecto de la comunidad de código abierto demostró la demanda de un 'Claude Code' basado en DeepSeek y qué limitaciones tiene?

AEl proyecto es DeepSeek-TUI, un agente de codificación que se ejecuta en la terminal y puede leer/escribir archivos, ejecutar comandos Shell, buscar en la web, gestionar Git y coordinar sub-agentes a través de una interfaz TUI. Su popularidad demostró que los desarrolladores confían en el modelo DeepSeek para este fin y hay una demanda insatisfecha. Sin embargo, un proyecto comunitario tiene limitaciones: no puede sincronizarse con el ritmo de evolución interna del modelo, no puede influir en cómo se entrena el modelo y tiene dificultades para inyectar retroalimentación de tareas reales a gran escala de manera sistemática en las mejoras del modelo.

Q¿Dónde se ubicará la oficina del nuevo equipo Harness de DeepSeek y qué roles clave están contratando?

AEl equipo Harness estará ubicado en la oficina de Beijing de DeepSeek, específicamente en el Centro Rongke Zixun en el distrito de Haidian, cerca de las universidades de Peking y Tsinghua. Actualmente, están contratando para dos roles clave: Gerente de Producto de Harness e Ingeniero de Desarrollo de Harness.

Lecturas Relacionadas

PA Gráficos | Un gráfico para entender los grandes eventos de Web3 que vale la pena seguir en junio

**Resumen: Eventos clave de Web3 en junio (2026)** El calendario cripto de junio presenta una mezcla de factores macroeconómicos, desbloqueos de tokens y eventos tecnológicos que darán forma al mercado: * **Factores Macro:** Los datos de inflación (IPC) y empleo (no agrícolas) de EE.UU., junto con las decisiones de tipos de interés de la Fed, el BCE y el Banco de Japón, seguirán influyendo en la aversión al riesgo y las expectativas de liquidez global. * **Desbloqueos de Tokens:** Proyectos como SUI y ENA tendrán eventos de desbloqueo, lo que requiere atención al posible impacto en el mercado. * **Dinámicas de Proyectos:** Nuevos productos institucionales llegarán, como los futuros de índices bursátiles perpetuos de Coinbase y los futuros de índices cripto de CME Group. También habrá inclusiones en índices tradicionales (SharpLink en Russell). * **Ajustes del Ecosistema:** Continúa el proceso de consolidación, con el cierre de algunos servicios como el explorador Ord.io de Bitcoin Ordinals. Los usuarios deben estar atentos a la migración de activos. * **Eventos Externos Destacados:** Eventos como el inicio del Mundial, la conferencia WWDC de Apple, la posible OPV de acciones de SpaceX y la audiencia para la IPO de宇树科技en China añaden contexto más amplio. En resumen, junio será un mes donde el mercado buscará una nueva dirección bajo la influencia de expectativas de liquidez, cambios políticos y la rotación dentro del ecosistema.

marsbitHace 1 hora(s)

PA Gráficos | Un gráfico para entender los grandes eventos de Web3 que vale la pena seguir en junio

marsbitHace 1 hora(s)

Alibaba "reabastece", ByteDance "entrena"

**Resumen en español europeo (≈1500 caracteres):** En la última semana de mayo, dos estrategias de IA chinas contrastaron claramente. Alibaba aceleró la **implementación comercial** de la IA. Integró su modelo Qwen con Taobao, permitiendo funciones como probadores virtuales y comparación de precios con IA. Su protocolo ACT busca estandarizar pagos automatizados por agentes de IA. Financieramente, apuesta por ser la "fábrica de IA" de China, con ingresos externos de su nube creciendo un 40%, demostrando un enfoque en **ROI inmediato y monetización**. Su premisa: una brecha de capacidad en modelos base no se ampliará críticamente en 5 años. ByteDance adopta una postura de **investigación a largo plazo**. Su departamento Seed, con líneas separadas para aplicaciones e investigación fundamental, tiene como meta principal "explorar el límite superior de la inteligencia". Su modelo de video Seedance 2.0 lidera benchmarks globales. Invierten masivamente en talento (programa Top Seed) y en investigación pura, como un artículo de 8 meses sobre modelos mundiales. Su presupuesto de capital se revisa al alza de forma agresiva, posible gracias a su condición de empresa **no cotizada**, lo que le otorga paciencia para perseguir avances fundamentales sin presión trimestral por beneficios. La diferencia clave no es filosófica, sino estructural. Las empresas cotizadas como Alibaba deben priorizar la monetización para el mercado. Las no cotizadas como ByteDance pueden permitirse "entrenar" a fondo. El futuro de la estrategia de IA en China depende en gran medida de este estado financiero.

marsbitHace 1 hora(s)

Alibaba "reabastece", ByteDance "entrena"

marsbitHace 1 hora(s)

¿Por qué más agentes de IA no equivalen a mayor productividad?

**Resumen: Por qué más agentes de IA no equivalen a mayor productividad** Cuando los agentes de IA se vuelven más baratos y fáciles de ejecutar, el desarrollo de software enfrenta un nuevo desafío: el cuello de botella ya no es lanzar más agentes, sino la capacidad humana de gestionar, evaluar e integrar sus resultados. Este artículo introduce el concepto de "impuesto de orquestación". Iniciar un agente es barato (un prompt o un clic), pero cerrar el ciclo es costoso: verificar resultados, entender su impacto arquitectónico, resolver conflictos entre agentes y decidir qué código integrar. Este trabajo no se puede paralelizar; depende de un recurso en serie: el juicio humano. El desarrollador es el "GIL" (Cerradura Global del Intérprete) del sistema de agentes: el candido de un solo hilo que limita el rendimiento final. Múltiples agentes pueden ejecutarse concurrentemente, pero las fases de juicio arquitectónico, revisión de código y fusión de cambios deben pasar por la mente del desarrollador. Más agentes no siempre significan más producción; pueden solo alargar la cola de tareas pendientes de revisión, llevando a cambios de contexto más frecuentes y fatiga cognitiva. La sensación de eficiencia no equivale a productividad real. Un panel lleno de agentes en ejecución crea una ilusión de "alta producción", pero si el desarrollador no comprende, revisa e integra esos cambios, el sistema puede acumular deuda técnica y cognitiva. La discusión clave no es "cómo usar más agentes", sino "cómo rediseñar el flujo de trabajo en torno a la atención humana". La habilidad crucial es saber qué tareas delegar a la máquina para procesamiento en paralelo y cuáles reservar para el juicio humano, cuándo revisar por lotes y cuándo detener la orquestación para concentrarse en un problema central. La IA amplía la capacidad de concurrencia en la producción de software, pero la atención humana sigue siendo el recurso más escaso e irreplicable. Un flujo de trabajo maduro con agentes no consiste en asignar todas las tareas a la máquina, sino en diseñar cuidadosamente la arquitectura de la propia atención, como se haría con cualquier sistema de producción. La verdadera habilidad es diseñar el sistema respetando ese recurso en serie que no se puede clonar: tu atención.

marsbitHace 2 hora(s)

¿Por qué más agentes de IA no equivalen a mayor productividad?

marsbitHace 2 hora(s)

Tres años después: Una revisión de mis predicciones sobre ChatGPT en 2023

Tres años después: Revisando mis predicciones sobre ChatGPT en 2023 En marzo de 2023, tras el lanzamiento de ChatGPT, Wang Jianshuo hizo 20 predicciones intuitivas sobre la IA. Ahora, en mayo de 2026, un sistema con 41 agentes de IA las ha reevaluado con datos actuales. **Resultados clave:** * **Aciertos (dirección general):** La arquitectura RAG se convirtió en estándar para integrar conocimiento. La Interfaz de Usuario de Lenguaje (LUI) creó una nueva capa de interacción (ej. protocolo MCP). Surgieron redes de agentes autónomos que se comunican. China desarrolló modelos grandes útiles (ej. DeepSeek), cerrando la brecha técnica. Los LLM no tienen conciencia; el Test de Turing solo mide la apariencia. * **Errores/Matices:** La predicción de que GPT-4 tendría 100 billones de parámetros fue incorrecta (≈1.8B). Los LLM **sí** pueden hacer matemáticas complejas sin herramientas externas (ej. medallas IMO 2025). El valor no migró solo a la capa de aplicación; NVIDIA (capa de hardware) capturó gran parte. El contenido generado por IA no evade automáticamente los derechos de autor (multas multimillonarias). La IA personalizada crea, no reduce, "cámaras de eco". Los costes de entrenamiento de modelos líderes superaron con creces la estimación de 5-10 mil millones de dólares. **Lecciones aprendidas:** 1. Predecir **mecanismos y direcciones** es más fiable que dar cifras o declaraciones absolutas. 2. Se tiende a **sobreestimar la velocidad** de cambio a corto plazo y **subestimar su magnitud** a largo plazo. 3. Los promedios generales (ej. "no habrá desempleo masivo") pueden ocultar **impactos distributivos** severos (ej. en jóvenes). 4. Las afirmaciones con **matices y limitaciones** envejecen mejor. 5. Tres años no son suficientes para resolver debates fundamentales (ej. valor final, consciencia de la IA). Este ejercicio subraya la dificultad de hacer predicciones precisas en un campo en rápida evolución y la importancia de la humildad al proyectar el futuro.

marsbitHace 9 hora(s)

Tres años después: Una revisión de mis predicciones sobre ChatGPT en 2023

marsbitHace 9 hora(s)

Trading

Spot
Futuros
活动图片