La forma correcta de manejar el contexto en Claude Code: Evitar que las sesiones largas hagan al modelo más "tonto"

marsbitPublicado a 2026-04-16Actualizado a 2026-04-16

Resumen

Hoy presentamos una actualización del comando /usage en Claude Code para gestionar mejor el contexto. Con una ventana de contexto de 1 millón de tokens, es crucial evitar el "context rot" (deterioro del rendimiento por exceso de información). Opciones clave: - **Continuar**: Seguir en la misma sesión. - **Rebobinar (/rewind)**: Volver atrás y corregir errores desde un punto anterior. - **Compactar (/compact)**: Resumir el historial para liberar espacio. - **Nueva sesión (/clear)**: Empezar desde cero con un resumen manual. - **Subagentes**: Delegar tareas en agentes secundarios con contexto limpio. Recomendaciones: Inicia sesiones nuevas para tareas distintas. Usa "rebobinar" en lugar de correcciones largas. La compresión automática puede fallar si el modelo no anticipa tus próximos pasos. Los subagentes son ideales para tareas con resultados intermedios prescindibles. Gestionar activamente el contexto es esencial para mantener la calidad de las respuestas de Claude.

Hoy, lanzamos una nueva actualización para el comando /usage, diseñada para ayudarte a comprender más claramente tu uso de Claude Code. Detrás de esta decisión, están las múltiples y profundas conversaciones que hemos mantenido recientemente con los usuarios.

En estas conversaciones, escuchamos repetidamente un fenómeno: los hábitos de todos al gestionar las sesiones son sumamente variados. Especialmente desde que Claude Code actualizó su ventana de contexto (Context Window) al hito del millón, esta diferencia se ha vuelto más evidente.

¿Eres de los que solo mantienen una o dos sesiones abiertas en el terminal? ¿O abres una sesión nueva cada vez que introduces un prompt? ¿Cuándo sueles usar la compresión (Compact), el retroceso (Rewind) o los subagentes (Subagents)? ¿Y qué causa una compresión desastrosa?

En realidad, hay mucha ciencia detrás de esto. Estos detalles aparentemente insignificantes afectan enormemente tu experiencia usando Claude Code. Y el núcleo de todo esto se reduce a una cosa: cómo gestionar tu ventana de contexto.

Conceptos básicos rápidos: Contexto, Compresión de Contexto y Deterioro del Contexto

La llamada "Ventana de Contexto (Context Window)" es como toda la información que el modelo puede "ver" simultáneamente al generar su próxima respuesta. Incluye tu indicación del sistema (System Prompt), el historial de chat hasta el momento, cada llamada a herramienta (Tool Call) y sus resultados de salida, e incluso cada archivo que ha leído. Actualmente, Claude Code posee una ventana de contexto super grande de hasta 1 millón de tokens(Nota: Un Token es la unidad básica que los modelos de lenguaje grande usan para procesar texto. Normalmente, una palabra en inglés equivale a aproximadamente 1 Token, y un carácter chino puede ocupar 1-2 Tokens).

Pero, lamentablemente, usar el contexto tiene un costo, al que normalmente llamamos Deterioro del Contexto (Context Rot)(Nota: Se refiere al fenómeno por el cual, a medida que el historial de la conversación se vuelve más largo, el modelo necesita procesar una cantidad excesiva de información, lo que hace que su atención se disperse, olvide información importante inicial o se vea interferido por contenido irrelevante). A medida que el contexto se alarga, el rendimiento del modelo suele empeorar porque su atención se dispersa entre más Tokens. Ese contenido residual inicial, que ya no es relevante, comienza a interferir con la tarea que el modelo está ejecutando actualmente.

La ventana de contexto tiene un límite de capacidad fijo. Por lo tanto, cuando estés a punto de llenarla, debes resumir la tarea en la que estás trabajando en una breve descripción y luego continuar trabajando con esa descripción en una nueva ventana de contexto.

Llamamos a este proceso Compresión de Contexto (Compaction)(Nota: El proceso de refinar un historial muy largo en un resumen conciso para liberar espacio en la memoria). Por supuesto, también puedes activar manualmente este proceso de compresión en cualquier momento.

Imagina que acabas de pedirle a Claude que haga algo por ti, y ya lo ha completado. Ahora, tu contexto ya está lleno de cierta información (como llamadas a herramientas, resultados de herramientas, tus instrucciones).

¿Qué hacer a continuación? Te sorprendería descubrir la cantidad de opciones que tienes:

· Continuar (Continue)— En la misma sesión, envía directamente el siguiente mensaje.

· Retroceder (/rewind o presionar dos veces la tecla Esc)— Retroceder en el tiempo, volver a un mensaje anterior e intentarlo de nuevo desde ahí.

· Limpiar (/clear)— Iniciar una sesión completamente nueva, normalmente llevando un breve resumen que hayas extraído de la conversación anterior.

· Comprimir (Compact)— Resumir la conversación actual y luego continuar trabajando basándose en ese resumen.

· Subagente (Subagents)— Delegar la siguiente fase del trabajo a otro agente de IA (AI Agent) que tenga su propio contexto limpio, y solo recuperar su resultado final.

Aunque "Continuar" es la reacción más natural, las otras cuatro opciones están diseñadas precisamente para ayudarte a gestionar mejor tu contexto.

¿Cuándo deberías abrir una nueva sesión?

¿Cuándo se debe mantener una sesión antigua y larga, y cuándo se debe empezar de cero? Nuestra regla general es: cuando empieces una nueva tarea, también deberías iniciar una nueva sesión.

Una ventana de contexto de 1 millón de tokens significa que ahora puedes realizar tareas más largas y complejas de manera muy confiable. Por ejemplo, pedirle a Claude que te construya una aplicación full-stack desde cero.

Pero a veces, puedes estar haciendo tareas que están relacionadas. En ese caso, necesitas conservar parte del contexto anterior, pero no todo. Por ejemplo, acabas de escribir una nueva función y ahora necesitas escribir su documentación de uso. Podrías abrir una nueva sesión, pero eso significaría que Claude tendría que volver a leer todos los archivos de código que acabas de escribir, lo que no solo es más lento, sino también más costoso.

Usa "Retroceder" en lugar de "Corregir"

Si tuviera que elegir un buen hábito que represente una "excelente capacidad de gestión del contexto", definitivamente sería usar bien "Retroceder (Rewind)".

En Claude Code, presionar dos veces la tecla Esc (o ejecutar el comando /rewind) te permite volver a cualquier mensaje anterior y luego enviar un nuevo prompt desde allí. Todo el diálogo que ocurrió después de ese punto será descartado por completo del contexto.

Al corregir errores de la IA, "retroceder" suele ser el enfoque más inteligente. Por ejemplo: Claude leyó cinco archivos, probó un método y falló. Tu reacción instintiva podría ser escribir en el chat: "Eso no funciona, prueba con el método X." Pero la forma más inteligente es retroceder al momento justo después de que leyó esos cinco archivos y decirle, con la lección aprendida: "No uses el método A, el módulo foo no lo soporta. Ve directamente a probar el método B."

Incluso puedes usar la función "resumir desde aquí (summarize from here)" para que Claude mismo resuma las lecciones aprendidas en un "mensaje de traspaso". Se siente como si el "Claude del futuro" que acaba de tropezar le dejara una nota a su yo que aún no ha comenzado.

Compresión de Contexto vs. Sesión Nueva

Cuando una sesión se vuelve demasiado larga, tienes dos formas de "aligerarla": usar /compact (comprimir) o /clear (limpiar y empezar de cero). Estas dos operaciones suenan similares, pero se comportan de manera muy distinta.

Compresión (Compact) es hacer que el modelo resuma la conversación hasta el momento y luego reemplace el historial冗ante con este resumen. Este proceso es "con pérdidas", lo que significa que le estás dando a Claude el poder de decidir "qué contenido es importante".

La ventaja es que no tienes que escribir nada, y Claude podría ser más considerado de lo que piensas al retener lecciones importantes o registros de archivos. También puedes controlar la dirección de la compresión dándole instrucciones (ej: /compact enfócate en la refactorización del módulo de autenticación, descarta el contenido sobre pruebas y depuración).

Usar /clear, por otro lado, requiere que escribas tú mismo los puntos clave (ej: "Estamos refactorizando el middleware de autenticación, las limitaciones actuales son X, los archivos importantes son A y B, y ya hemos descartado el método Y") y luego comenzar de nuevo con un estado completamente limpio. Aunque requiere más esfuerzo, el nuevo contexto resultante está 100% compuesto por lo que tú consideras realmente relevante y esencial.

¿Qué tipo de "compresión" puede salir mal?

Si sueles tener sesiones muy largas, es probable que hayas experimentado situaciones donde la "compresión" sale terriblemente mal. Descubrimos que este "fracaso" suele ocurrir en un momento específico: cuando el modelo de lenguaje grande (LLM) no puede predecir la dirección de tu próximo trabajo.

Por ejemplo, después de una larga depuración de código, el sistema activa la compresión automática y resume el proceso de investigación anterior. Luego, inmediatamente después, envías un mensaje: "Ahora, arregla también la otra advertencia que vimos antes en bar.ts."

Sin embargo, como el enfoque de la sesión anterior estaba completamente en depurar el primer error, es muy probable que esa advertencia sin corregir haya sido descartada durante el resumen por considerarse información irrelevante.

Este es un problema bastante complicado. Porque, limitado por el deterioro del contexto, el momento en que el modelo realiza la compresión suele ser cuando su "inteligencia" está en su punto más bajo. Afortunadamente, con una capacidad de contexto de 1 millón de tokens, ahora tienes un espacio más amplio para ejecutar activamente /compact de antemano, llevando una descripción de "lo que quiero hacer a continuación".

Subagentes y Nueva Ventana de Contexto

Los subagentes también son una excelente manera de gestionar el contexto. Son especialmente útiles cuando anticipas de antemano que un trabajo en particular generará una gran cantidad de resultados intermedios "desechables" (que no volverás a usar).

Cuando Claude deriva un subagente a través de una herramienta de agente (Agent tool), este pequeño obtiene una ventana de contexto completamente nueva. Puede experimentar libremente allí, haciendo todo el trabajo que necesite. Una vez que termine, refinará los resultados y solo devolverá el informe final al Claude "padre".

Nuestra "pregunta crucial" para decidir si usar un subagente es: ¿necesitaré ver en el futuro los resultados detallados de la ejecución de estas herramientas, o solo quiero una conclusión final?

Aunque Claude Code llamará automáticamente a los subagentes en segundo plano, a veces puedes dirigirlo muy explícitamente. Por ejemplo, puedes decirle:

· "Envía un subagente para que, basándose en el siguiente archivo de especificaciones, verifique si el trabajo que acabamos de hacer es correcto."

· "Envía un subagente a leer otro repositorio de código y resume cómo implementa el flujo de autenticación, luego imita ese enfoque e impleméntalo aquí también."

· "Envía un subagente para que, basándose en mi historial de cambios de Git, escriba la documentación de esta nueva función."

En resumen, cuando Claude termina una ronda de respuesta y estás a punto de enviar un nuevo mensaje, te encuentras en una encrucijada de decisiones.

Esperamos que en el futuro, Claude sea lo suficientemente inteligente como para gestionar todo esto por ti. Pero por ahora, dominar estas decisiones es el camino necesario para guiar a Claude hacia la producción de resultados de alta calidad.

Preguntas relacionadas

Q¿Qué es la 'ventana de contexto' (Context Window) en Claude Code y por qué es importante gestionarla correctamente?

ALa 'ventana de contexto' es toda la información que el modelo puede 'ver' simultáneamente al generar su próxima respuesta, incluyendo el prompt del sistema, el historial de chat, llamadas a herramientas y archivos leídos. Claude Code tiene una ventana de contexto de 1 millón de tokens. Gestionarla correctamente es crucial porque el 'desgaste de contexto' (Context Rot) hace que el rendimiento del modelo empeore a medida que el contexto se alarga, ya que su atención se dispersa entre más tokens y la información antigua o irrelevante interfiere con la tarea actual.

Q¿Cuáles son las opciones principales para gestionar el contexto después de que Claude complete una tarea, y cuál se recomienda como el mejor hábito?

ALas opciones principales son: Continuar (Continue), Retroceder (/rewind), Limpiar (/clear), Comprimir (Compact) y Subagentes (Subagents). La opción que se recomienda como el mejor hábito es utilizar 'Retroceder' (/rewind o doble Escape), ya que permite volver a un mensaje anterior y descartar todo el diálogo posterior, lo que es una forma más inteligente de corregir errores sin contaminar el contexto con intentos fallidos.

Q¿En qué se diferencian la 'compresión de contexto' (/compact) y comenzar una 'nueva sesión' (/clear), y cuáles son sus ventajas y desventajas?

ALa 'compresión' (/compact) le pide al modelo que resuma el diálogo hasta el momento y reemplace el historial largo con ese resumen. Es un proceso 'con pérdidas' donde Claude decide qué es importante. La ventaja es que no requiere esfuerzo del usuario. Iniciar una 'nueva sesión' (/clear) requiere que el usuario escriba manualmente los puntos clave para comenzar desde cero. La ventaja es que el nuevo contexto contendrá solo lo que el usuario considera realmente relevante, pero requiere más esfuerzo.

QSegún el artículo, ¿cuándo es más probable que falle el proceso de compresión de contexto (/compact) y por qué?

AEl proceso de compresión suele fallar cuando el modelo de lenguaje grande (LLM) no puede predecir la dirección de tu próximo trabajo. Por ejemplo, si una compresión automática se activa después de una larga depuración, es probable que descarte advertencias no resueltas que parecían irrelevantes en ese momento, pero que luego resultan cruciales para la siguiente tarea. Esto ocurre porque, en el momento de la compresión, el modelo sufre de 'desgaste de contexto' y su 'inteligencia' no está en su punto máximo.

Q¿Qué son los 'subagentes' (Subagents) y en qué tipo de situaciones son particularmente útiles para la gestión del contexto?

ALos 'subagentes' son agentes de IA derivados que obtienen una ventana de contexto completamente nueva y limpia. Son particularmente útiles cuando se anticipa que una tarea generará una gran cantidad de resultados intermedios 'desechables' (que no se volverán a usar). El subagente puede trabajar libremente en su propio contexto y, una vez finalizado, devuelve solo el resultado final o un informe al Claude 'principal'. Esto mantiene el contexto del padre limpio y libre de información transitoria.

Lecturas Relacionadas

¿El fin de la prima cripto? El dilema de Gemini tras su salida a bolsa y el cambio de lógica del mercado

Resumen: En 2025, los exchanges de criptomonedas como Gemini y Bullish protagonizaron una ola de ofertas públicas iniciales (OPI) con valoraciones que superaron los miles de millones de dólares. Sin embargo, en solo seis meses, la realidad ha sido muy diferente. Gemini, por ejemplo, ha visto cómo su precio de las acciones se desplomó más de un 80% desde su máximo, despidió al 30% de su plantilla y enfrenta una deuda significativa en Bitcoin. El artículo argumenta que esto no es solo un problema de una empresa, sino un cambio estructural en el mercado. La "prima de riesgo" que históricamente han tenido los activos crypto se está agotando debido a dos factores principales: el alto y creciente costo del cumplimiento normativo, que erosiona los márgenes de beneficio, y la llegada de productos financieros tradicionales como los ETF de Bitcoin y Ethereum, que ofrecen a los inversores institucionales una forma más fácil y regulada de obtener exposición al mercado, desviando así la liquidez que antes fluía hacia las altcoins. Como resultado, el mercado se está volviendo más maduro y se parece más a las finanzas tradicionales, donde la valoración se basa en fundamentos como la utilidad real y la adopción sostenible, en lugar de narrativas especulativas. La ventaja competitiva de la "cumplimiento normativo" ya no es suficiente para garantizar el éxito en este nuevo panorama.

marsbitHace 5 hora(s)

¿El fin de la prima cripto? El dilema de Gemini tras su salida a bolsa y el cambio de lógica del mercado

marsbitHace 5 hora(s)

Trading

Spot
Futuros
活动图片