Fuentes: DeepSeek está formando un equipo de "Harness", que compite directamente con Claude Code

链捕手Publicado a 2026-05-22Actualizado a 2026-05-22

Resumen

DeepSeek está formando un nuevo equipo "Harness" centrado en un producto de agente de código, con el objetivo de competir directamente con Claude Code de Anthropic, según fuentes cercanas a la empresa. Este movimiento va más allá de un simple asistente de código e implica construir una capa intermedia que permita a los modelos de IA integrarse en flujos de trabajo reales de desarrollo. La compañía ha abierto dos puestos clave: Gerente de Producto Harness e Ingeniero de Desarrollo Harness. Un principio central definido es "Modelo + Harness = Agente", donde el "Harness" se refiere al sistema externo que gestiona el contexto, llama a herramientas, planifica tareas y ejecuta acciones en el entorno real, esencialmente dando "manos" al modelo. DeepSeek busca no solo empaquetar su modelo existente, sino lograr una "co-evolución" donde el producto Agente retroalimente y mejore el modelo base. La necesidad surge porque la competencia en codificación con IA está pasando de las capacidades del modelo a la integración en el flujo de trabajo del desarrollador. Un proyecto comunitario llamado DeepSeek-TUI ya demostró la demanda, pero un producto oficial permitiría una integración más profunda, un ciclo de retroalimentación de datos y una evolución coordinada con el equipo del modelo.

Autor: Wang Bo, Jiaziguangnian

"Jiaziguangnian" se enteró por fuentes cercanas a DeepSeek que, internamente, DeepSeek está organizando un nuevo equipo llamado Harness, con el enfoque en productos de agente de código, y competirá internamente con Claude Code de Anthropic.

Chen Deli, investigador senior de DeepSeek, también confirmó esto recientemente en las redes sociales, diciendo: "DeepSeek está organizando un nuevo equipo Harness para trabajar en productos e investigación en la dirección de Harness", y afirmó claramente: "En términos simples, es competir con Claude Code, hacer DeepSeek Code Harness".

Esto no es una contratación ordinaria.

La información de contratación muestra que DeepSeek ha abierto dos puestos clave esta vez: Gerente de Producto de Harness e Ingeniero de Desarrollo de Harness, y la ubicación del trabajo está actualmente limitada a Pekín. La oficina de DeepSeek en Pekín se encuentra en el Centro de Información Rongke, en el distrito de Haidian, muy cerca de la Universidad de Pekín y la Universidad de Tsinghua. En la versión oficial, se encuentra en la "Franja de Innovación AI del Centenario de Jingzhang", y en la versión popular, también se encuentra en el área de "Wang Huiwen", que está muy de moda recientemente.

Definición central: Modelo + Harness = Agente

En la descripción del puesto, una fórmula central se coloca en la posición más destacada:

Esta frase casi puede considerarse como la definición interna de DeepSeek para la ruta de producto de la próxima etapa: el modelo en sí es solo la base del Agente; la gestión del contexto, la invocación de herramientas, la planificación de tareas, la lectura y escritura de archivos, la modificación de código, la ejecución de terminal, la recolección de retroalimentación y el ciclo de evaluación fuera del modelo son las partes clave que permiten que el Agente realmente se integre en el flujo de trabajo.

La información de contratación añade: "Estamos transformando las capacidades de modelo de vanguardia de DeepSeek en productos líderes de Agente. Todos los trabajos, aparte del modelo en sí, pertenecen al ámbito de Harness." Además, este puesto participará en todo el proceso del "producto Agente de escritorio de DeepSeek" y "definirá la comprensión de DeepSeek sobre Harness".

"Jiaziguangnian" analiza que DeepSeek no solo quiere hacer un simple complemento de asistente de código, sino que está completando la capa intermedia que conecta el modelo con el flujo de trabajo real.

El año pasado, la industria ha demostrado: tener una fuerte capacidad de codificación no significa que los desarrolladores realmente la usen; que un modelo pueda escribir código no significa que pueda completar continuamente una tarea de ingeniería.

Lo que realmente cambia la forma de trabajar de los desarrolladores no es solo el modelo Claude, sino Claude Code; no es solo el modelo GPT, sino Codex; no es una respuesta de código en un cuadro de chat, sino un agente de ingeniería que puede entrar en la terminal, entender el proyecto, leer y escribir archivos, ejecutar comandos, corregir errores, gestionar Git e invocar herramientas.

Lo más fuerte de DeepSeek en el pasado era el modelo. Ahora, está comenzando a complementar las "manos" sobre ese modelo.

I. ¿Por qué DeepSeek enfatiza Harness?

En el contexto tradicional de productos de IA, "asistente de código" generalmente se refiere a dos tipos de productos: uno son complementos de autocompletado en el IDE, y el otro son preguntas y respuestas de código en un cuadro de chat.

Pero la palabra que aparece repetidamente en esta contratación de DeepSeek no es "Asistente de Código", sino Harness.

Harness originalmente en el contexto de ingeniería se refiere a "arnés de prueba" o "marco de ejecución". En el contexto de Agentes, se acerca más a un sistema externo que permite que el modelo realmente actúe. El modelo es responsable de la comprensión, el razonamiento y la generación; Harness es responsable de integrar estas capacidades en el entorno real.

La descripción del puesto menciona que este rol necesita planificar la hoja de ruta del producto DeepSeek Harness, conectar investigadores, ingenieros, la comunidad de código abierto y los usuarios finales, y comunicarse en profundidad con los investigadores del equipo de entrenamiento de modelos para lograr la evolución conjunta del modelo y el Harness.

Esta frase es clave.

Indica que lo que DeepSeek quiere hacer no es solo envolver el modelo existente en una capa, sino convertir el producto Agente en parte de la evolución del modelo. En el pasado, la lógica común de producto en las empresas de grandes modelos era: primero el equipo de investigación entrena un modelo, luego el equipo de producto desarrolla aplicaciones basadas en las capacidades del modelo. Pero en la era de los Agentes, este orden está cambiando. El producto ya no es solo la salida de las capacidades del modelo, sino el campo de entrenamiento de las capacidades del modelo.

Que un Agente de código falle en un proyecto real puede deberse no a un problema de interacción del producto, sino a que la forma en que el modelo comprime el contexto largo es incorrecta; puede no ser un problema de la cadena de invocación de herramientas, sino a que la estrategia del modelo para descomponer tareas es inestable; o puede que no sea una falta de capacidad de código, sino que le falta una comprensión continua de las restricciones de ingeniería, la retroalimentación de las pruebas y la intención del usuario.

Por lo tanto, el valor del equipo Harness no es solo "hacer un producto", sino convertir las tareas reales de desarrollo en una fuente de retroalimentación para la evolución continua del modelo.

II. ¿Por qué DeepSeek debe complementar Code Harness?

DeepSeek apostó por la capacidad de código desde muy temprano. Desde DeepSeek-Coder hasta DeepSeek-Coder-V2, la inversión de DeepSeek en modelos de código ha aumentado continuamente, mejorando el soporte de lenguajes, la longitud del contexto y la capacidad para tareas complejas. Su problema no es la falta de capacidad de código, sino que en el pasado esta capacidad se quedó más en la capa del modelo y aún no se ha convertido en un producto de alta frecuencia en el flujo de trabajo diario de los desarrolladores.

La popularidad de Claude Code demuestra una cosa: La competencia en IA de codificación está pasando de una competencia de capacidad de modelo a una competencia por la entrada al flujo de trabajo del desarrollador.

Esta es también una lección que DeepSeek debe complementar ahora. Más sutilmente, antes de que DeepSeek oficialmente tomara medidas, la comunidad de desarrolladores ya había creado una versión de "Claude Code basado en DeepSeek".

Un proyecto de código abierto llamado DeepSeek-TUI se hizo popular anteriormente en la comunidad de desarrolladores. Es un agente de codificación que se ejecuta en la terminal, puede leer y escribir archivos, ejecutar comandos Shell, buscar en la web, gestionar Git y coordinar sub-agentes a través de una interfaz TUI.

La popularidad de DeepSeek-TUI ilustra dos problemas:

  1. Madurez de la mentalidad base: El modelo DeepSeek ya tiene la base para ser un Agente de código en la mentalidad de los desarrolladores. De lo contrario, la comunidad no generaría naturalmente un producto estilo Claude Code alrededor de él.

  2. Falta a nivel oficial: A DeepSeek no le falta atención al modelo, le falta Harness oficial.

Para los desarrolladores, el atractivo de DeepSeek-TUI es directo: bajo costo, disponible en China, contexto largo y umbral de despliegue relativamente bajo. Muchos desarrolladores en China no es que no quieran usar Claude Code, sino que están limitados por el precio, la estabilidad del acceso, el sistema de cuentas y el cumplimiento empresarial.

Pero los proyectos comunitarios también tienen límites naturales:

  • Por muy activo que sea un proyecto de código abierto de terceros, es difícil que realmente controle el ritmo de evolución de las capacidades internas del modelo;

  • Puede adaptarse alrededor de la API, pero no puede decidir inversamente cómo se entrena el modelo;

  • Puede optimizar prompts, cadenas de herramientas e interacciones, pero es difícil inyectar sistemáticamente la retroalimentación de una gran cantidad de tareas reales en la mejora del modelo.

Aquí es precisamente donde reside el significado del Harness oficial.

DeepSeek desarrollando su propio Code Harness tiene varias ventajas que los proyectos comunitarios no poseen: colaboración con el equipo de modelos, derecho de diseño de interfaces, ciclo cerrado de datos de entrenamiento, escenarios de tareas reales internas y capacidad de operación a largo plazo del ecosistema de desarrolladores.

La comunidad de código abierto ya ha allanado el camino primero: los desarrolladores realmente necesitan una versión de DeepSeek de Claude Code. Ahora, DeepSeek quiere recuperar ese camino y convertirlo en su propio producto principal.

Y el hecho de que DeepSeek oficialmente comience a contratar personal significa que finalmente está preparado para tomar medidas directas.

Chen Deli mencionó en noviembre pasado en la Cumbre Mundial de Internet de Wuzhen 2025: "Una de las ventajas centrales de nuestra empresa es el largo plazo, insistir en esta línea principal de avances de inteligencia de vanguardia. Y en este proceso, también hemos renunciado a muchas cosas en líneas secundarias, no hacemos esas cosas rápidas y superficiales en las líneas secundarias."

Después de la guerra de modelos, comienza la verdadera guerra de Agentes. Esta vez, lo que DeepSeek quiere complementar es la capa más crítica entre el modelo y la acción: Harness.

DeepSeek está poniéndole un par de manos a su modelo.

Preguntas relacionadas

Q¿Qué noticia reveló '甲子光年' sobre DeepSeek?

A'甲子光年' reveló, a través de fuentes cercanas a DeepSeek, que la empresa está formando internamente un nuevo equipo llamado 'Harness'. Este equipo se enfocará en desarrollar un producto agente de inteligencia para código, con el objetivo interno de competir con 'Claude Code' de Anthropic.

Q¿Qué significa la fórmula 'Model + Harness = Agent' mencionada en la descripción del puesto de DeepSeek?

AEsta fórmula representa la definición interna de DeepSeek para su camino de desarrollo de productos. Significa que el modelo en sí es solo la base del agente. Los elementos externos al modelo, como la gestión de contexto, invocación de herramientas, planificación de tareas, lectura/escritura de archivos, modificación de código, ejecución en terminal, recolección de retroalimentación y ciclo de evaluación, son las partes clave que permiten que un agente se integre en flujos de trabajo reales. El 'Harness' abarca todo el trabajo necesario para convertir las capacidades del modelo en un producto agente funcional.

QSegún el artículo, ¿por qué es crucial para DeepSeek desarrollar su propio 'Harness' de código en este momento?

AEs crucial porque la competencia en IA para codificación ha evolucionado de una competencia de capacidades del modelo a una competencia por la entrada al flujo de trabajo del desarrollador. El éxito de Claude Code demostró esto. Aunque DeepSeek ya tiene fuertes capacidades de código a nivel de modelo (como DeepSeek-Coder), estas no se han convertido en un producto de alta frecuencia en el flujo de trabajo diario de los desarrolladores. Desarrollar un 'Harness' oficial le permite a DeepSeek cerrar esta brecha, integrar el agente en entornos reales y, lo más importante, utilizar las tareas de desarrollo reales como una fuente de retroalimentación para la evolución continua del modelo.

Q¿Qué proyecto de la comunidad de código abierto demostró la demanda de un 'Claude Code' basado en DeepSeek y qué limitaciones tiene?

AEl proyecto es DeepSeek-TUI, un agente de codificación que se ejecuta en la terminal y puede leer/escribir archivos, ejecutar comandos Shell, buscar en la web, gestionar Git y coordinar sub-agentes a través de una interfaz TUI. Su popularidad demostró que los desarrolladores confían en el modelo DeepSeek para este fin y hay una demanda insatisfecha. Sin embargo, un proyecto comunitario tiene limitaciones: no puede sincronizarse con el ritmo de evolución interna del modelo, no puede influir en cómo se entrena el modelo y tiene dificultades para inyectar retroalimentación de tareas reales a gran escala de manera sistemática en las mejoras del modelo.

Q¿Dónde se ubicará la oficina del nuevo equipo Harness de DeepSeek y qué roles clave están contratando?

AEl equipo Harness estará ubicado en la oficina de Beijing de DeepSeek, específicamente en el Centro Rongke Zixun en el distrito de Haidian, cerca de las universidades de Peking y Tsinghua. Actualmente, están contratando para dos roles clave: Gerente de Producto de Harness e Ingeniero de Desarrollo de Harness.

Lecturas Relacionadas

Tres años después: Una revisión de mis predicciones sobre ChatGPT en 2023

Tres años después: Revisando mis predicciones sobre ChatGPT en 2023 En marzo de 2023, tras el lanzamiento de ChatGPT, Wang Jianshuo hizo 20 predicciones intuitivas sobre la IA. Ahora, en mayo de 2026, un sistema con 41 agentes de IA las ha reevaluado con datos actuales. **Resultados clave:** * **Aciertos (dirección general):** La arquitectura RAG se convirtió en estándar para integrar conocimiento. La Interfaz de Usuario de Lenguaje (LUI) creó una nueva capa de interacción (ej. protocolo MCP). Surgieron redes de agentes autónomos que se comunican. China desarrolló modelos grandes útiles (ej. DeepSeek), cerrando la brecha técnica. Los LLM no tienen conciencia; el Test de Turing solo mide la apariencia. * **Errores/Matices:** La predicción de que GPT-4 tendría 100 billones de parámetros fue incorrecta (≈1.8B). Los LLM **sí** pueden hacer matemáticas complejas sin herramientas externas (ej. medallas IMO 2025). El valor no migró solo a la capa de aplicación; NVIDIA (capa de hardware) capturó gran parte. El contenido generado por IA no evade automáticamente los derechos de autor (multas multimillonarias). La IA personalizada crea, no reduce, "cámaras de eco". Los costes de entrenamiento de modelos líderes superaron con creces la estimación de 5-10 mil millones de dólares. **Lecciones aprendidas:** 1. Predecir **mecanismos y direcciones** es más fiable que dar cifras o declaraciones absolutas. 2. Se tiende a **sobreestimar la velocidad** de cambio a corto plazo y **subestimar su magnitud** a largo plazo. 3. Los promedios generales (ej. "no habrá desempleo masivo") pueden ocultar **impactos distributivos** severos (ej. en jóvenes). 4. Las afirmaciones con **matices y limitaciones** envejecen mejor. 5. Tres años no son suficientes para resolver debates fundamentales (ej. valor final, consciencia de la IA). Este ejercicio subraya la dificultad de hacer predicciones precisas en un campo en rápida evolución y la importancia de la humildad al proyectar el futuro.

marsbitHace 1 hora(s)

Tres años después: Una revisión de mis predicciones sobre ChatGPT en 2023

marsbitHace 1 hora(s)

Tres años después: Volviendo a mis juicios sobre ChatGPT en 2023

En marzo de 2023, Wang Jianshuo hizo veinte predicciones sobre ChatGPT. Tres años después, en 2026, un análisis con múltiples agentes de IA evalúa su precisión. Aciertos clave: predijo correctamente el auge de RAG como arquitectura estándar para conocimiento y reducir alucinaciones, la LUI (interfaz de lenguaje natural) como nueva capa de interacción (aunque no reemplaza a la GUI), y la aparición de redes de agentes autónomos con nuevos protocolos de direccionamiento. También acertó en que China desarrollaría modelos de IA útiles (como DeepSeek) cerrando rápidamente la brecha, y en que ChatGPT carece de consciencia real, pasando el test de Turing por mera apariencia. Otras predicciones válidas fueron que no causaría desempleo masivo (aunque afectó a jóvenes), que 2023 sería un gran año para startups de IA, y que el momento fue similar al del navegador web en 1994. Errores notables: su estimación de que GPT-4 tendría 100 billones de parámetros fue incorrecta (tuvo ~1.8 billones). Se equivocó al declarar que era "imposible" que los LLM hicieran matemáticas complejas sin herramientas, ya que luego ganaron medallas en la Olimpiada Internacional de Matemáticas. También erró al sugerir que el valor se capturaría en la capa de aplicación y no en la base, subestimando el dominio de NVIDIA (capa de hardware), y al pensar que el contenido generado por IA "evitaría" problemas de copyright, cuando han surgido multas históricas. Además, la idea de que los LLM promoverían un "consenso mundial" al promediar opiniones se volvió incorrecta, ya que ahora priorizan la personalización y pueden crear nuevas cámaras de eco. Conclusiones: Sus predicciones sobre mecanismos y direcciones fueron mayormente acertadas, pero falló en números específicos (costes, parámetros) y en subestimar la complejidad de la distribución del impacto (ej. quién gana o pierde con la IA). Tendió a ser demasiado optimista a corto plazo pero conservador sobre los límites a largo plazo. El ejercicio subraya la importancia de predecir tendencias en lugar de cifras exactas y de dejar margen para la incertidumbre.

链捕手Hace 4 hora(s)

Tres años después: Volviendo a mis juicios sobre ChatGPT en 2023

链捕手Hace 4 hora(s)

La reducción del 99% en el precio del Xiaomi MiMo no es una estrategia de marketing. Luo Fuli publica en X respondiendo a los pesimistas.

**Resumen: El descenso del 99% de Xiaomi MiMo: Una victoria de la ingeniería, no del marketing** El anuncio de Xiaomi de reducir hasta un 99% el precio de las API de su modelo MiMo-V2.5 generó escepticismo, interpretado como una guerra de precios o una maniobra desesperada. Luo Fuli, responsable de MiMo, respondió con un blog técnico detallado, demostrando que la rebaja es el resultado de seis optimizaciones de ingeniería sistemáticas, no una táctica de marketing. La clave es el descuento del 99% aplicado específicamente a la entrada de tipo "Cache Hit" (contexto histórico re-leído). Para lograrlo, el equipo implementó: 1. **Arquitectura Híbrida SWA:** 60 de las 70 capas del modelo solo atienden a los 128 tokens más recientes, reduciendo el volumen de la "memoria" del modelo (KVCache) a 1/7. 2. **Gestión de Memoria en Dos Piscinas:** Asigna memoria por separado para las capas con atención completa y las de ventana deslizante (SWA), liberando realmente la capacidad ahorrada y quintuplicando los usuarios concurrentes por GPU. 3. **Cache de Prefijos Mejorado:** Un nuevo sistema garantiza que solo se reutilicen fragmentos de contexto completos y válidos, logrando una tasa de acierto en caché del 93-95% para peticiones de usuarios frecuentes. 4. **Almacenamiento en SSD Integrado (GCache):** La caché distribuida se aloja en los discos SSD de las propias máquinas con GPU, eliminando costes adicionales de almacenamiento. 5. **Sistema de Enrutamiento Inteligente (LLM-Router):** Dirige peticiones similares a la misma máquina y prioriza las que aciertan en caché, mejorando el rendimiento y la latencia. 6. **Predicción Multi-Token (MTP):** Acelera la generación de respuestas del modelo prediciendo varios tokens a la vez, reduciendo también el coste de la parte de "salida". En conjunto, estas innovaciones redujeron el tiempo de GPU por petición en más de un orden de magnitud, haciendo posible el descuento del 99% manteniendo márgenes positivos. Luo Fuli subraya que este es un logro de ingeniería sistémica, un modelo de reducción de costes verificable que trasciende la mera competencia por precios.

marsbitHace 7 hora(s)

La reducción del 99% en el precio del Xiaomi MiMo no es una estrategia de marketing. Luo Fuli publica en X respondiendo a los pesimistas.

marsbitHace 7 hora(s)

Trading

Spot
Futuros
活动图片