Hoy, lanzamos una nueva actualización para el comando /usage, diseñada para ayudarte a comprender más claramente tu uso de Claude Code. Detrás de esta decisión, están las múltiples y profundas conversaciones que hemos mantenido recientemente con los usuarios.
En estas conversaciones, escuchamos repetidamente un fenómeno: los hábitos de todos al gestionar las sesiones son sumamente variados. Especialmente desde que Claude Code actualizó su ventana de contexto (Context Window) al hito del millón, esta diferencia se ha vuelto más evidente.
¿Eres de los que solo mantienen una o dos sesiones abiertas en el terminal? ¿O abres una sesión nueva cada vez que introduces un prompt? ¿Cuándo sueles usar la compresión (Compact), el retroceso (Rewind) o los subagentes (Subagents)? ¿Y qué causa una compresión desastrosa?
En realidad, hay mucha ciencia detrás de esto. Estos detalles aparentemente insignificantes afectan enormemente tu experiencia usando Claude Code. Y el núcleo de todo esto se reduce a una cosa: cómo gestionar tu ventana de contexto.
Conceptos básicos rápidos: Contexto, Compresión de Contexto y Deterioro del Contexto
La llamada "Ventana de Contexto (Context Window)" es como toda la información que el modelo puede "ver" simultáneamente al generar su próxima respuesta. Incluye tu indicación del sistema (System Prompt), el historial de chat hasta el momento, cada llamada a herramienta (Tool Call) y sus resultados de salida, e incluso cada archivo que ha leído. Actualmente, Claude Code posee una ventana de contexto super grande de hasta 1 millón de tokens(Nota: Un Token es la unidad básica que los modelos de lenguaje grande usan para procesar texto. Normalmente, una palabra en inglés equivale a aproximadamente 1 Token, y un carácter chino puede ocupar 1-2 Tokens).
Pero, lamentablemente, usar el contexto tiene un costo, al que normalmente llamamos Deterioro del Contexto (Context Rot)(Nota: Se refiere al fenómeno por el cual, a medida que el historial de la conversación se vuelve más largo, el modelo necesita procesar una cantidad excesiva de información, lo que hace que su atención se disperse, olvide información importante inicial o se vea interferido por contenido irrelevante). A medida que el contexto se alarga, el rendimiento del modelo suele empeorar porque su atención se dispersa entre más Tokens. Ese contenido residual inicial, que ya no es relevante, comienza a interferir con la tarea que el modelo está ejecutando actualmente.
La ventana de contexto tiene un límite de capacidad fijo. Por lo tanto, cuando estés a punto de llenarla, debes resumir la tarea en la que estás trabajando en una breve descripción y luego continuar trabajando con esa descripción en una nueva ventana de contexto.
Llamamos a este proceso Compresión de Contexto (Compaction)(Nota: El proceso de refinar un historial muy largo en un resumen conciso para liberar espacio en la memoria). Por supuesto, también puedes activar manualmente este proceso de compresión en cualquier momento.
Imagina que acabas de pedirle a Claude que haga algo por ti, y ya lo ha completado. Ahora, tu contexto ya está lleno de cierta información (como llamadas a herramientas, resultados de herramientas, tus instrucciones).
¿Qué hacer a continuación? Te sorprendería descubrir la cantidad de opciones que tienes:
· Continuar (Continue)— En la misma sesión, envía directamente el siguiente mensaje.
· Retroceder (/rewind o presionar dos veces la tecla Esc)— Retroceder en el tiempo, volver a un mensaje anterior e intentarlo de nuevo desde ahí.
· Limpiar (/clear)— Iniciar una sesión completamente nueva, normalmente llevando un breve resumen que hayas extraído de la conversación anterior.
· Comprimir (Compact)— Resumir la conversación actual y luego continuar trabajando basándose en ese resumen.
· Subagente (Subagents)— Delegar la siguiente fase del trabajo a otro agente de IA (AI Agent) que tenga su propio contexto limpio, y solo recuperar su resultado final.
Aunque "Continuar" es la reacción más natural, las otras cuatro opciones están diseñadas precisamente para ayudarte a gestionar mejor tu contexto.
¿Cuándo deberías abrir una nueva sesión?
¿Cuándo se debe mantener una sesión antigua y larga, y cuándo se debe empezar de cero? Nuestra regla general es: cuando empieces una nueva tarea, también deberías iniciar una nueva sesión.
Una ventana de contexto de 1 millón de tokens significa que ahora puedes realizar tareas más largas y complejas de manera muy confiable. Por ejemplo, pedirle a Claude que te construya una aplicación full-stack desde cero.
Pero a veces, puedes estar haciendo tareas que están relacionadas. En ese caso, necesitas conservar parte del contexto anterior, pero no todo. Por ejemplo, acabas de escribir una nueva función y ahora necesitas escribir su documentación de uso. Podrías abrir una nueva sesión, pero eso significaría que Claude tendría que volver a leer todos los archivos de código que acabas de escribir, lo que no solo es más lento, sino también más costoso.
Usa "Retroceder" en lugar de "Corregir"
Si tuviera que elegir un buen hábito que represente una "excelente capacidad de gestión del contexto", definitivamente sería usar bien "Retroceder (Rewind)".
En Claude Code, presionar dos veces la tecla Esc (o ejecutar el comando /rewind) te permite volver a cualquier mensaje anterior y luego enviar un nuevo prompt desde allí. Todo el diálogo que ocurrió después de ese punto será descartado por completo del contexto.
Al corregir errores de la IA, "retroceder" suele ser el enfoque más inteligente. Por ejemplo: Claude leyó cinco archivos, probó un método y falló. Tu reacción instintiva podría ser escribir en el chat: "Eso no funciona, prueba con el método X." Pero la forma más inteligente es retroceder al momento justo después de que leyó esos cinco archivos y decirle, con la lección aprendida: "No uses el método A, el módulo foo no lo soporta. Ve directamente a probar el método B."
Incluso puedes usar la función "resumir desde aquí (summarize from here)" para que Claude mismo resuma las lecciones aprendidas en un "mensaje de traspaso". Se siente como si el "Claude del futuro" que acaba de tropezar le dejara una nota a su yo que aún no ha comenzado.
Compresión de Contexto vs. Sesión Nueva
Cuando una sesión se vuelve demasiado larga, tienes dos formas de "aligerarla": usar /compact (comprimir) o /clear (limpiar y empezar de cero). Estas dos operaciones suenan similares, pero se comportan de manera muy distinta.
Compresión (Compact) es hacer que el modelo resuma la conversación hasta el momento y luego reemplace el historial冗ante con este resumen. Este proceso es "con pérdidas", lo que significa que le estás dando a Claude el poder de decidir "qué contenido es importante".
La ventaja es que no tienes que escribir nada, y Claude podría ser más considerado de lo que piensas al retener lecciones importantes o registros de archivos. También puedes controlar la dirección de la compresión dándole instrucciones (ej: /compact enfócate en la refactorización del módulo de autenticación, descarta el contenido sobre pruebas y depuración).
Usar /clear, por otro lado, requiere que escribas tú mismo los puntos clave (ej: "Estamos refactorizando el middleware de autenticación, las limitaciones actuales son X, los archivos importantes son A y B, y ya hemos descartado el método Y") y luego comenzar de nuevo con un estado completamente limpio. Aunque requiere más esfuerzo, el nuevo contexto resultante está 100% compuesto por lo que tú consideras realmente relevante y esencial.
¿Qué tipo de "compresión" puede salir mal?
Si sueles tener sesiones muy largas, es probable que hayas experimentado situaciones donde la "compresión" sale terriblemente mal. Descubrimos que este "fracaso" suele ocurrir en un momento específico: cuando el modelo de lenguaje grande (LLM) no puede predecir la dirección de tu próximo trabajo.
Por ejemplo, después de una larga depuración de código, el sistema activa la compresión automática y resume el proceso de investigación anterior. Luego, inmediatamente después, envías un mensaje: "Ahora, arregla también la otra advertencia que vimos antes en bar.ts."
Sin embargo, como el enfoque de la sesión anterior estaba completamente en depurar el primer error, es muy probable que esa advertencia sin corregir haya sido descartada durante el resumen por considerarse información irrelevante.
Este es un problema bastante complicado. Porque, limitado por el deterioro del contexto, el momento en que el modelo realiza la compresión suele ser cuando su "inteligencia" está en su punto más bajo. Afortunadamente, con una capacidad de contexto de 1 millón de tokens, ahora tienes un espacio más amplio para ejecutar activamente /compact de antemano, llevando una descripción de "lo que quiero hacer a continuación".
Subagentes y Nueva Ventana de Contexto
Los subagentes también son una excelente manera de gestionar el contexto. Son especialmente útiles cuando anticipas de antemano que un trabajo en particular generará una gran cantidad de resultados intermedios "desechables" (que no volverás a usar).
Cuando Claude deriva un subagente a través de una herramienta de agente (Agent tool), este pequeño obtiene una ventana de contexto completamente nueva. Puede experimentar libremente allí, haciendo todo el trabajo que necesite. Una vez que termine, refinará los resultados y solo devolverá el informe final al Claude "padre".
Nuestra "pregunta crucial" para decidir si usar un subagente es: ¿necesitaré ver en el futuro los resultados detallados de la ejecución de estas herramientas, o solo quiero una conclusión final?
Aunque Claude Code llamará automáticamente a los subagentes en segundo plano, a veces puedes dirigirlo muy explícitamente. Por ejemplo, puedes decirle:
· "Envía un subagente para que, basándose en el siguiente archivo de especificaciones, verifique si el trabajo que acabamos de hacer es correcto."
· "Envía un subagente a leer otro repositorio de código y resume cómo implementa el flujo de autenticación, luego imita ese enfoque e impleméntalo aquí también."
· "Envía un subagente para que, basándose en mi historial de cambios de Git, escriba la documentación de esta nueva función."
En resumen, cuando Claude termina una ronda de respuesta y estás a punto de enviar un nuevo mensaje, te encuentras en una encrucijada de decisiones.
Esperamos que en el futuro, Claude sea lo suficientemente inteligente como para gestionar todo esto por ti. Pero por ahora, dominar estas decisiones es el camino necesario para guiar a Claude hacia la producción de resultados de alta calidad.














