La forma correcta de manejar el contexto en Claude Code: Evitar que las sesiones largas hagan al modelo más "tonto"

marsbitPublicado a 2026-04-16Actualizado a 2026-04-16

Resumen

Hoy presentamos una actualización del comando /usage en Claude Code para gestionar mejor el contexto. Con una ventana de contexto de 1 millón de tokens, es crucial evitar el "context rot" (deterioro del rendimiento por exceso de información). Opciones clave: - **Continuar**: Seguir en la misma sesión. - **Rebobinar (/rewind)**: Volver atrás y corregir errores desde un punto anterior. - **Compactar (/compact)**: Resumir el historial para liberar espacio. - **Nueva sesión (/clear)**: Empezar desde cero con un resumen manual. - **Subagentes**: Delegar tareas en agentes secundarios con contexto limpio. Recomendaciones: Inicia sesiones nuevas para tareas distintas. Usa "rebobinar" en lugar de correcciones largas. La compresión automática puede fallar si el modelo no anticipa tus próximos pasos. Los subagentes son ideales para tareas con resultados intermedios prescindibles. Gestionar activamente el contexto es esencial para mantener la calidad de las respuestas de Claude.

Hoy, lanzamos una nueva actualización para el comando /usage, diseñada para ayudarte a comprender más claramente tu uso de Claude Code. Detrás de esta decisión, están las múltiples y profundas conversaciones que hemos mantenido recientemente con los usuarios.

En estas conversaciones, escuchamos repetidamente un fenómeno: los hábitos de todos al gestionar las sesiones son sumamente variados. Especialmente desde que Claude Code actualizó su ventana de contexto (Context Window) al hito del millón, esta diferencia se ha vuelto más evidente.

¿Eres de los que solo mantienen una o dos sesiones abiertas en el terminal? ¿O abres una sesión nueva cada vez que introduces un prompt? ¿Cuándo sueles usar la compresión (Compact), el retroceso (Rewind) o los subagentes (Subagents)? ¿Y qué causa una compresión desastrosa?

En realidad, hay mucha ciencia detrás de esto. Estos detalles aparentemente insignificantes afectan enormemente tu experiencia usando Claude Code. Y el núcleo de todo esto se reduce a una cosa: cómo gestionar tu ventana de contexto.

Conceptos básicos rápidos: Contexto, Compresión de Contexto y Deterioro del Contexto

La llamada "Ventana de Contexto (Context Window)" es como toda la información que el modelo puede "ver" simultáneamente al generar su próxima respuesta. Incluye tu indicación del sistema (System Prompt), el historial de chat hasta el momento, cada llamada a herramienta (Tool Call) y sus resultados de salida, e incluso cada archivo que ha leído. Actualmente, Claude Code posee una ventana de contexto super grande de hasta 1 millón de tokens(Nota: Un Token es la unidad básica que los modelos de lenguaje grande usan para procesar texto. Normalmente, una palabra en inglés equivale a aproximadamente 1 Token, y un carácter chino puede ocupar 1-2 Tokens).

Pero, lamentablemente, usar el contexto tiene un costo, al que normalmente llamamos Deterioro del Contexto (Context Rot)(Nota: Se refiere al fenómeno por el cual, a medida que el historial de la conversación se vuelve más largo, el modelo necesita procesar una cantidad excesiva de información, lo que hace que su atención se disperse, olvide información importante inicial o se vea interferido por contenido irrelevante). A medida que el contexto se alarga, el rendimiento del modelo suele empeorar porque su atención se dispersa entre más Tokens. Ese contenido residual inicial, que ya no es relevante, comienza a interferir con la tarea que el modelo está ejecutando actualmente.

La ventana de contexto tiene un límite de capacidad fijo. Por lo tanto, cuando estés a punto de llenarla, debes resumir la tarea en la que estás trabajando en una breve descripción y luego continuar trabajando con esa descripción en una nueva ventana de contexto.

Llamamos a este proceso Compresión de Contexto (Compaction)(Nota: El proceso de refinar un historial muy largo en un resumen conciso para liberar espacio en la memoria). Por supuesto, también puedes activar manualmente este proceso de compresión en cualquier momento.

Imagina que acabas de pedirle a Claude que haga algo por ti, y ya lo ha completado. Ahora, tu contexto ya está lleno de cierta información (como llamadas a herramientas, resultados de herramientas, tus instrucciones).

¿Qué hacer a continuación? Te sorprendería descubrir la cantidad de opciones que tienes:

· Continuar (Continue)— En la misma sesión, envía directamente el siguiente mensaje.

· Retroceder (/rewind o presionar dos veces la tecla Esc)— Retroceder en el tiempo, volver a un mensaje anterior e intentarlo de nuevo desde ahí.

· Limpiar (/clear)— Iniciar una sesión completamente nueva, normalmente llevando un breve resumen que hayas extraído de la conversación anterior.

· Comprimir (Compact)— Resumir la conversación actual y luego continuar trabajando basándose en ese resumen.

· Subagente (Subagents)— Delegar la siguiente fase del trabajo a otro agente de IA (AI Agent) que tenga su propio contexto limpio, y solo recuperar su resultado final.

Aunque "Continuar" es la reacción más natural, las otras cuatro opciones están diseñadas precisamente para ayudarte a gestionar mejor tu contexto.

¿Cuándo deberías abrir una nueva sesión?

¿Cuándo se debe mantener una sesión antigua y larga, y cuándo se debe empezar de cero? Nuestra regla general es: cuando empieces una nueva tarea, también deberías iniciar una nueva sesión.

Una ventana de contexto de 1 millón de tokens significa que ahora puedes realizar tareas más largas y complejas de manera muy confiable. Por ejemplo, pedirle a Claude que te construya una aplicación full-stack desde cero.

Pero a veces, puedes estar haciendo tareas que están relacionadas. En ese caso, necesitas conservar parte del contexto anterior, pero no todo. Por ejemplo, acabas de escribir una nueva función y ahora necesitas escribir su documentación de uso. Podrías abrir una nueva sesión, pero eso significaría que Claude tendría que volver a leer todos los archivos de código que acabas de escribir, lo que no solo es más lento, sino también más costoso.

Usa "Retroceder" en lugar de "Corregir"

Si tuviera que elegir un buen hábito que represente una "excelente capacidad de gestión del contexto", definitivamente sería usar bien "Retroceder (Rewind)".

En Claude Code, presionar dos veces la tecla Esc (o ejecutar el comando /rewind) te permite volver a cualquier mensaje anterior y luego enviar un nuevo prompt desde allí. Todo el diálogo que ocurrió después de ese punto será descartado por completo del contexto.

Al corregir errores de la IA, "retroceder" suele ser el enfoque más inteligente. Por ejemplo: Claude leyó cinco archivos, probó un método y falló. Tu reacción instintiva podría ser escribir en el chat: "Eso no funciona, prueba con el método X." Pero la forma más inteligente es retroceder al momento justo después de que leyó esos cinco archivos y decirle, con la lección aprendida: "No uses el método A, el módulo foo no lo soporta. Ve directamente a probar el método B."

Incluso puedes usar la función "resumir desde aquí (summarize from here)" para que Claude mismo resuma las lecciones aprendidas en un "mensaje de traspaso". Se siente como si el "Claude del futuro" que acaba de tropezar le dejara una nota a su yo que aún no ha comenzado.

Compresión de Contexto vs. Sesión Nueva

Cuando una sesión se vuelve demasiado larga, tienes dos formas de "aligerarla": usar /compact (comprimir) o /clear (limpiar y empezar de cero). Estas dos operaciones suenan similares, pero se comportan de manera muy distinta.

Compresión (Compact) es hacer que el modelo resuma la conversación hasta el momento y luego reemplace el historial冗ante con este resumen. Este proceso es "con pérdidas", lo que significa que le estás dando a Claude el poder de decidir "qué contenido es importante".

La ventaja es que no tienes que escribir nada, y Claude podría ser más considerado de lo que piensas al retener lecciones importantes o registros de archivos. También puedes controlar la dirección de la compresión dándole instrucciones (ej: /compact enfócate en la refactorización del módulo de autenticación, descarta el contenido sobre pruebas y depuración).

Usar /clear, por otro lado, requiere que escribas tú mismo los puntos clave (ej: "Estamos refactorizando el middleware de autenticación, las limitaciones actuales son X, los archivos importantes son A y B, y ya hemos descartado el método Y") y luego comenzar de nuevo con un estado completamente limpio. Aunque requiere más esfuerzo, el nuevo contexto resultante está 100% compuesto por lo que tú consideras realmente relevante y esencial.

¿Qué tipo de "compresión" puede salir mal?

Si sueles tener sesiones muy largas, es probable que hayas experimentado situaciones donde la "compresión" sale terriblemente mal. Descubrimos que este "fracaso" suele ocurrir en un momento específico: cuando el modelo de lenguaje grande (LLM) no puede predecir la dirección de tu próximo trabajo.

Por ejemplo, después de una larga depuración de código, el sistema activa la compresión automática y resume el proceso de investigación anterior. Luego, inmediatamente después, envías un mensaje: "Ahora, arregla también la otra advertencia que vimos antes en bar.ts."

Sin embargo, como el enfoque de la sesión anterior estaba completamente en depurar el primer error, es muy probable que esa advertencia sin corregir haya sido descartada durante el resumen por considerarse información irrelevante.

Este es un problema bastante complicado. Porque, limitado por el deterioro del contexto, el momento en que el modelo realiza la compresión suele ser cuando su "inteligencia" está en su punto más bajo. Afortunadamente, con una capacidad de contexto de 1 millón de tokens, ahora tienes un espacio más amplio para ejecutar activamente /compact de antemano, llevando una descripción de "lo que quiero hacer a continuación".

Subagentes y Nueva Ventana de Contexto

Los subagentes también son una excelente manera de gestionar el contexto. Son especialmente útiles cuando anticipas de antemano que un trabajo en particular generará una gran cantidad de resultados intermedios "desechables" (que no volverás a usar).

Cuando Claude deriva un subagente a través de una herramienta de agente (Agent tool), este pequeño obtiene una ventana de contexto completamente nueva. Puede experimentar libremente allí, haciendo todo el trabajo que necesite. Una vez que termine, refinará los resultados y solo devolverá el informe final al Claude "padre".

Nuestra "pregunta crucial" para decidir si usar un subagente es: ¿necesitaré ver en el futuro los resultados detallados de la ejecución de estas herramientas, o solo quiero una conclusión final?

Aunque Claude Code llamará automáticamente a los subagentes en segundo plano, a veces puedes dirigirlo muy explícitamente. Por ejemplo, puedes decirle:

· "Envía un subagente para que, basándose en el siguiente archivo de especificaciones, verifique si el trabajo que acabamos de hacer es correcto."

· "Envía un subagente a leer otro repositorio de código y resume cómo implementa el flujo de autenticación, luego imita ese enfoque e impleméntalo aquí también."

· "Envía un subagente para que, basándose en mi historial de cambios de Git, escriba la documentación de esta nueva función."

En resumen, cuando Claude termina una ronda de respuesta y estás a punto de enviar un nuevo mensaje, te encuentras en una encrucijada de decisiones.

Esperamos que en el futuro, Claude sea lo suficientemente inteligente como para gestionar todo esto por ti. Pero por ahora, dominar estas decisiones es el camino necesario para guiar a Claude hacia la producción de resultados de alta calidad.

Preguntas relacionadas

Q¿Qué es la 'ventana de contexto' (Context Window) en Claude Code y por qué es importante gestionarla correctamente?

ALa 'ventana de contexto' es toda la información que el modelo puede 'ver' simultáneamente al generar su próxima respuesta, incluyendo el prompt del sistema, el historial de chat, llamadas a herramientas y archivos leídos. Claude Code tiene una ventana de contexto de 1 millón de tokens. Gestionarla correctamente es crucial porque el 'desgaste de contexto' (Context Rot) hace que el rendimiento del modelo empeore a medida que el contexto se alarga, ya que su atención se dispersa entre más tokens y la información antigua o irrelevante interfiere con la tarea actual.

Q¿Cuáles son las opciones principales para gestionar el contexto después de que Claude complete una tarea, y cuál se recomienda como el mejor hábito?

ALas opciones principales son: Continuar (Continue), Retroceder (/rewind), Limpiar (/clear), Comprimir (Compact) y Subagentes (Subagents). La opción que se recomienda como el mejor hábito es utilizar 'Retroceder' (/rewind o doble Escape), ya que permite volver a un mensaje anterior y descartar todo el diálogo posterior, lo que es una forma más inteligente de corregir errores sin contaminar el contexto con intentos fallidos.

Q¿En qué se diferencian la 'compresión de contexto' (/compact) y comenzar una 'nueva sesión' (/clear), y cuáles son sus ventajas y desventajas?

ALa 'compresión' (/compact) le pide al modelo que resuma el diálogo hasta el momento y reemplace el historial largo con ese resumen. Es un proceso 'con pérdidas' donde Claude decide qué es importante. La ventaja es que no requiere esfuerzo del usuario. Iniciar una 'nueva sesión' (/clear) requiere que el usuario escriba manualmente los puntos clave para comenzar desde cero. La ventaja es que el nuevo contexto contendrá solo lo que el usuario considera realmente relevante, pero requiere más esfuerzo.

QSegún el artículo, ¿cuándo es más probable que falle el proceso de compresión de contexto (/compact) y por qué?

AEl proceso de compresión suele fallar cuando el modelo de lenguaje grande (LLM) no puede predecir la dirección de tu próximo trabajo. Por ejemplo, si una compresión automática se activa después de una larga depuración, es probable que descarte advertencias no resueltas que parecían irrelevantes en ese momento, pero que luego resultan cruciales para la siguiente tarea. Esto ocurre porque, en el momento de la compresión, el modelo sufre de 'desgaste de contexto' y su 'inteligencia' no está en su punto máximo.

Q¿Qué son los 'subagentes' (Subagents) y en qué tipo de situaciones son particularmente útiles para la gestión del contexto?

ALos 'subagentes' son agentes de IA derivados que obtienen una ventana de contexto completamente nueva y limpia. Son particularmente útiles cuando se anticipa que una tarea generará una gran cantidad de resultados intermedios 'desechables' (que no se volverán a usar). El subagente puede trabajar libremente en su propio contexto y, una vez finalizado, devuelve solo el resultado final o un informe al Claude 'principal'. Esto mantiene el contexto del padre limpio y libre de información transitoria.

Lecturas Relacionadas

¿Se acabó Cardano? Charles Hoskinson advierte de una "ola de fracasos" — y su propia comunidad está furiosa

Charles Hoskinson, cofundador de Cardano, ha generado un intenso debate al advertir que la segunda mitad de 2026 traerá una ola de fracasos de proyectos y cierres en el ecosistema. La advertencia se produce tras el anuncio del cierre de TapTools, una plataforma clave de infraestructura, debido a costos insostenibles, y mientras ADA cae por debajo de $0.20, su nivel más bajo en cinco años. Hoskinson señaló que muchos proyectos antiguos ya no son viables y criticó a la comunidad de gobernanza por no implementar un fondo de índice propuesto para apoyarlos. Ante esto, anunció que se "tomaría un descanso", lo que intensificó las críticas. Figuras como Andreas Svanevik de Nansen acusaron a Hoskinson de haber vendido una promesa que Cardano no pudo cumplir. Los datos reflejan los problemas: el valor total bloqueado (TVL) en Cardano es de solo $123.85 millones, muy por detrás de otras cadenas, y la Cumbre Cardano 2026 fue cancelada. La comunidad se pregunta ahora si el ecosistema puede revertir esta trayectoria crítica.

bitcoinistHace 8 min(s)

$¿Se acabó Cardano? Charles Hoskinson advierte de una "ola de fracasos" — y su propia comunidad está furiosa$

bitcoinistHace 8 min(s)

Qué Esperar del Precio del Bitcoin para Fin de Año 2026

El rendimiento de Bitcoin en el último año ha decepcionado a los inversores, con su precio estancado por debajo de los 100.000 dólares. El analista cripto Aralez ha compartido sus predicciones hasta finales de 2026. Para el cierre del segundo trimestre (Q2), anticipa una tendencia bajista significativa, con Bitcoin cayendo potencialmente a alrededor de 58.000 dólares y el mercado de valores también retrocediendo. Sin embargo, el tercer trimestre (Q3) marcaría un cambio. Se prevé que Bitcoin entre en una fase de capitulación, seguida de una acumulación por parte de grandes inversores ("ballenas"). Con la Reserva Federal relajando potencialmente las tasas de interés, se espera que el precio de Bitcoin encuentre un fondo en este período. Para finales de 2026, Aralez pronostica un importante repunte alcista. Impulsado por factores como el dominio de la narrativa de la inteligencia artificial (IA) y un aumento de la liquidez en el mercado cripto, el precio de Bitcoin podría ascender hacia la marca de los 100.000 dólares, registrando un aumento de al menos un 30% respecto a sus mínimos previstos.

bitcoinistHace 1 hora(s)

Qué Esperar del Precio del Bitcoin para Fin de Año 2026

bitcoinistHace 1 hora(s)

Glassnode en Snowflake: Datos de Activos Digitales Entregados Directamente en tu Almacén de Datos

Glassnode, proveedor líder de datos de activos digitales, ahora está disponible en Snowflake, permitiendo a las instituciones acceder directamente a sus métricas analíticas dentro de su propio almacén de datos. Esta integración elimina la necesidad de costosas canalizaciones API y procesos ETL, ofreciendo datos históricos completos y en tiempo real como tablas SQL nativas. La oferta incluye análisis on-chain, datos de derivados (futuros y opciones), información spot y de ETFs, así como tenencias de tesorerías corporativas, todo con resoluciones de 10 minutos, hora y día. Es especialmente relevante para equipos cuantitativos, ya que Glassnode es el primero en ofrecer datos "point-in-time" (PiT) en Snowflake, eliminando el sesgo de retrospectiva en los backtests y garantizando la integridad histórica. Diseñado para flujos de trabajo institucionales como trading sistemático, gestión de riesgos e investigación macro, el servicio se activa compartiendo el identificador de cuenta de Snowflake con Glassnode. Las actualizaciones de datos son automáticas, cubriendo Bitcoin, Ethereum y otras cadenas con la profundidad analítica y el ajuste de entidades propietario de Glassnode. Para una prueba o más información, contactar a sales@glassnode.com.

insights.glassnodeHace 2 hora(s)

Glassnode en Snowflake: Datos de Activos Digitales Entregados Directamente en tu Almacén de Datos

insights.glassnodeHace 2 hora(s)

Emprendimiento Web3 en China: ¿Cuáles son las buenas rutas? (V)

En el anterior artículo se analizó cómo los equipos de Web3 enfocados en infraestructura (datos, identidad, pagos) pueden migrar sus capacidades al ámbito de la IA. Este artículo continúa explorando la migración para otros dos tipos de equipos: seguridad/gestión de riesgos, y productos/comunidades. **Equipos de Seguridad y Gestión de Riesgos: De la Seguridad en Cadena a la Auditoría de Comportamiento de Agentes** Estos equipos, tradicionalmente centrados en auditorías de contratos inteligentes, seguridad de carteras y monitorización de transacciones, pueden trasladar su experiencia a los nuevos riesgos que plantean los Agentes de IA. A medida que los Agentes automatizan tareas (acceso a datos, llamadas a herramientas, pagos), surgen necesidades de seguridad en áreas como permisos, auditoría de comportamientos, trazabilidad de acciones y control de acceso a datos sensibles. La oportunidad reside en ofrecer servicios B2B de gobernanza, auditoría y control de riesgos para implementaciones empresariales de IA, especialmente en sectores regulados como finanzas o legal. La migración requiere complementar el conocimiento en seguridad de Web3 con comprensión de flujos de trabajo empresariales y arquitecturas de IA. **Equipos de Aplicaciones y Comunidades: Productos Web3 Mejorados por IA** Para equipos que desarrollan plataformas de contenido, herramientas de investigación, productos educativos o comunidades, la IA no debe verse como un cambio radical, sino como una capa de mejora. La clave es integrar la IA para resolver problemas existentes de los usuarios dentro de su contexto original: * **Herramientas de investigación/inversión:** Resumir anuncios, analizar datos on-chain, sintetizar información de mercado. * **Plataformas de contenido/comunidad:** Filtrar información, moderar, segmentar usuarios, automatizar respuestas frecuentes, generar resúmenes. * **Productos educativos:** Crear rutas de aprendizaje personalizadas, explicar conceptos complejos. La migración efectiva consiste en usar la IA para aumentar la eficiencia, reducir costos operativos o mejorar la calidad de la decisión del usuario, integrando estas capacidades en flujos de trabajo existentes. **Direcciones que es Mejor Evitar** El artículo advierte contra emprender en áreas con altas barreras de entrada o riesgos significativos para equipos Web3 chinos: 1. **Modelos de lenguaje generalistas (LLMs):** Competencia feroz, requiere enormes recursos y capital. 2. **Plataformas de Agentes de IA demasiado genéricas:** Sin una tarea específica y un cliente claro, es difícil pasar de un demo a un producto útil. 3. **Asesores/gestores de inversión automatizados con IA:** Conllevan riesgos regulatorios complejos relacionados con la gestión de fondos y la promesa de rendimientos. 4. **Simplemente añadir una capa de IA a un producto sin demanda real:** No resuelve problemas fundamentales y suele ser una estrategia superficial. **Conclusión** Para los equipos chinos de Web3, el ciclo de la IA representa una oportunidad para reutilizar capacidades ya consolidadas (datos, pagos, seguridad, operaciones de comunidad) en nuevos escenarios. La migración exitosa depende de identificar problemas reales, usuarios dispuestos a pagar y límites regulatorios claros, no solo de seguir la tendencia.

marsbitHace 2 hora(s)

Emprendimiento Web3 en China: ¿Cuáles son las buenas rutas? (V)

marsbitHace 2 hora(s)

Premu lanza mercados de predicción apalancados y creados por usuarios antes de la Copa del Mundo 2026

Premu, una plataforma descentralizada de mercados de predicción, habilita la creación de mercados personalizados por los usuarios con motivo de la Copa Mundial de la FIFA 2026. Los participantes pueden crear libremente mercados sobre resultados del torneo (como qué equipo avanza o gana un partido), estableciendo una garantía en USDC. Los creadores ganan una comisión por cada operación en su mercado. Las posiciones pueden operarse con un apalancamiento de hasta 2.5x y se liquidan on-chain en USDC a través de Ethereum, Arbitrum y Base. Este enfoque descentralizado permite que la oferta de mercados se adapte rápidamente a la demanda durante eventos de ritmo acelerado como el Mundial. La plataforma también admite mercados sobre criptomonedas, política y otros eventos.

TheNewsCryptoHace 2 hora(s)

Premu lanza mercados de predicción apalancados y creados por usuarios antes de la Copa del Mundo 2026

TheNewsCryptoHace 2 hora(s)

Trading

Spot

Futuros

La forma correcta de manejar el contexto en Claude Code: Evitar que las sesiones largas hagan al modelo más "tonto"

Resumen

Conceptos básicos rápidos: Contexto, Compresión de Contexto y Deterioro del Contexto

¿Cuándo deberías abrir una nueva sesión?

Usa "Retroceder" en lugar de "Corregir"

Compresión de Contexto vs. Sesión Nueva

¿Qué tipo de "compresión" puede salir mal?

Subagentes y Nueva Ventana de Contexto

Preguntas relacionadas

Lecturas Relacionadas

¿Se acabó Cardano? Charles Hoskinson advierte de una "ola de fracasos" — y su propia comunidad está furiosa

Qué Esperar del Precio del Bitcoin para Fin de Año 2026

Glassnode en Snowflake: Datos de Activos Digitales Entregados Directamente en tu Almacén de Datos

Emprendimiento Web3 en China: ¿Cuáles son las buenas rutas? (V)

Premu lanza mercados de predicción apalancados y creados por usuarios antes de la Copa del Mundo 2026

Trading

Categorías populares

Etiquetas Populares