La forma correcta de usar las Skills: 5 reflexiones tras la publicación del método interno de Anthropic

marsbitPublicado a 2026-06-08Actualizado a 2026-06-08

Resumen

Tras leer el blog de Anthropic "Lessons from building Claude Code: How we use skills", se reflexiona sobre cinco puntos clave para utilizar las habilidades (Skills) de manera efectiva en IA: 1. **Evitar contenido innecesario**: Las Skills deben capturar conocimiento tácito y "Gotchas" (errores comunes), no repetir información obvia que el modelo ya conoce. Su valor está en la experiencia interna del equipo. 2. **La Skill como Ingeniería de Contexto**: Una Skill no es solo un archivo, sino una carpeta estructurada (SKILL.md, referencias, scripts, ejemplos, activos). Esta organización permite exponer información de forma progresiva, evitando saturar el contexto en cada interacción y optimizando el rendimiento. 3. **Priorizar el uso de scripts**: Para tareas repetitivas o de ejecución precisa (como consultar datos o verificar estados), es más eficiente y confiable proporcionar scripts que instrucciones detalladas. Los scripts encapsulan la capacidad de ejecución, mientras que las instrucciones guían el razonamiento y la experiencia. 4. **Descripción como regla de enrutamiento**: La descripción de una Skill debe centrarse en *cuándo* debe activarse, describiendo la intención del usuario (ej: "cuando CI falle"), no solo en listar sus funciones. Esto ayuda al modelo a enrutar correctamente la solicitud del usuario a la Skill adecuada. 5. **Gestión y distribución escalable**: Para equipos, gestionar muchas Skills requiere un enfoque ligero. Se recomienda comenzar con Skill...

Autor: AI Product Aying

Leí un blog del equipo de Anthropic titulado "Lessons from building Claude Code: How we use skills". Este es probablemente el resumen práctico más profundo sobre Skills que he visto hasta ahora.

Las Skills no son algo complicado, pero realmente hacerlas bien tampoco me parece fácil.

Recuerdo que cuando las Skills se pusieron de moda, a todos les encantaba crear Skills de estilo literario o de escritura. Parecía que con solo meter su propio estilo de escritura, el modelo podía generar contenido de manera estable siguiendo ese estilo.

Pero luego probé un montón y descubrí que a menudo no funcionaba en absoluto.

Porque una Skill de estilo literario podría meter miles o incluso decenas de miles de palabras de contenido. Al cargar la Skill, el contexto ocupa una gran parte. Con un contexto tan pesado, la capacidad de razonamiento del modelo tiende a disminuir.

Al final, a menudo ocurría lo siguiente: aprendía el estilo, pero el contenido se volvía superficial y su capacidad analítica también se debilitaba.

Hay otra situación común.

Mucha gente, al escribir Skills, le gusta meter todo tipo de instrucciones de operación. Primero hacer qué, luego qué, tercero qué. Al ejecutarlas, descubren que el modelo no las ejecuta de manera estable.

Más tarde, poco a poco fui entendiendo que muchas de estas tareas repetitivas son más adecuadas para convertirse en Scripts, no para escribirlas como instrucciones largas.

Después de leer este artículo de Anthropic, mi mayor sensación es que mucha gente usa Skills, pero no necesariamente las entiende realmente.

En esencia, las Skills hacen Context Engineering. Cuándo debería meterse conocimiento en una Skill, cuándo debería dividirse en References, cuándo debería escribirse como Script, cuándo deberían usarse Gotchas para restringir al modelo; aquí hay mucha experiencia.

Después de entender el principio de funcionamiento de las Skills, al mirar hacia atrás esas Skills excelentes, descubres que lo que resuelven nunca es un problema de prompts, sino que resuelven problemas de contexto, de sedimentación de experiencia y de reutilización de capacidades.

Si quieren investigar las Skills en profundidad, especialmente recomiendo leer estos dos artículos:

https://claude.com/blog/lessons-from-building-claude-code-how-we-use-skills

https://research.perplexity.ai/articles/designing-refining-and-maintaining-agent-skills-at-perplexity

#01 No escribas tonterías

La Skill esencialmente está sedimentando el "conocimiento tácito" dentro de la organización. Por lo tanto, en la Skill no hay que repetir el sentido común que ya conoce. Lo que realmente tiene valor es esa información que el modelo directamente no conoce.

Anthropic enfatiza internamente con frecuencia que lo que realmente hay que escribir en una Skill son los Gotchas, es decir, los errores comunes.

Por ejemplo:

1. Esta tabla no se puede ordenar por created_at

2. Que staging devuelva 200 no significa éxito

3. request_id y trace_id son lo mismo

Porque esta información suele existir en la experiencia de los empleados. Así que hay que recordar siempre cuál es la esencia de una Skill.

Skill = Escribir la experiencia del maestro veterano.

A través de las Skills, sedimentar la experiencia que antes estaba dispersa en la cabeza de diferentes personas.

#02 Las Skills son en realidad Context Engineering

Esta es probablemente una de las perspectivas más profundas de Anthropic.

Una Skill no es un archivo markdown, sino una carpeta. Para quien ha usado Skills, esto suena a obviedad.

Pero estos dos días he estado reflexionando repetidamente y poco a poco me he dado cuenta: justamente quieren usar la forma de carpeta para expresar el concepto de Context Engineering.

Vamos a mirar de nuevo la estructura típica de una Skill:

skill/ ├── SKILL.md ├── references/ (pone explicaciones detalladas, referencias API, condiciones límite) ├── scripts/ (pone scripts ejecutables) ├── examples/ (pone ejemplos) ├── assets/ (pone plantillas, imágenes, materiales fijos)

Cuando se invoca una Skill, el modelo primero lee SKILL.md. Si metemos toda la información en este archivo, rápidamente explotará el contexto.

Supongamos que es una Skill para resolver problemas de pago. Dentro tiene tanto explicaciones de códigos de error de Stripe, como casos históricos de fallos, además de scripts de diagnóstico y plantillas para el informe final.

Si todo este contenido se apila en SKILL.md, cada vez que se invoca la Skill, Claude tendría que leerlo todo de nuevo.

Incluso si el usuario solo quiere confirmar el significado de un código de error, incluso si solo quiere ver por qué no se actualiza cierto estado de pago. Una gran cantidad de información que directamente no se necesita, también será metida en el contexto.

Y el enfoque de Anthropic es completamente diferente.

SKILL.md se parece más a una página de navegación. Su responsabilidad es decirle al modelo que, al encontrar un error de Stripe, busque la explicación correspondiente en references.

Cuando necesita referenciar casos históricos, que busque problemas similares en examples; cuando realmente necesita ejecutar acciones de diagnóstico, que ejecute los scripts en scripts; y finalmente, al generar el informe de resolución de problemas, que use las plantillas en assets.

Todo el proceso es una exposición gradual.

La siguiente imagen, les recomiendo encarecidamente guardarla.

#03 Usa scripts siempre que sea posible

No dejes que el modelo desperdicie su limitado contexto y capacidad de razonamiento en trabajo repetitivo. Confía estas tareas a los scripts.

Por ejemplo. Mucha gente, al escribir Skills, lo escribe así:

1. Consultar datos de registro; 2. Consultar datos de pago; 3. Calcular tasa de conversión; 4. Analizar causa de la anomalía.

Esta forma de escribir no tiene problema. El modelo también puede completarlo. Pero cada vez que lo ejecuta, tiene que recorrer todo el flujo de análisis desde el principio.

Consultar datos, organizar datos, manejar varias situaciones límite, este trabajo es en realidad repetitivo.

Dado que estas capacidades ya han sido verificadas innumerables veces. ¿Por qué hacer que el modelo las reinvente una vez más? Mejor proporcionar directamente los scripts concretos.

Y mediante el uso de scripts, la ejecución de la Skill también será más precisa y ahorrará más Tokens.

Desde esta perspectiva, los Scripts dentro de una Skill están realmente sedimentando la capacidad organizativa. Detrás de cada script, a menudo está la mejor práctica resumida después de que el equipo ha tropezado con innumerables errores.

Después de solidificar estas capacidades. Claude puede trabajar cada vez sobre la base de esta experiencia, en lugar de comenzar de cero una y otra vez.

Por eso, cada vez siento más que, dentro de una Skill, las Instructions y los Scripts resuelven problemas en dos niveles diferentes.

Las Instructions proporcionan experiencia y juicio, los Scripts proporcionan capacidad y ejecución.

Por ejemplo, en una Skill de resolución de problemas de pago podría haber algo así:

Si Stripe devuelve 200, no asumas directamente que el pago fue exitoso, necesitas verificar más a fondo la tabla payment_events.

Esto pertenece a las Instructions. Porque es experiencia. Y check_payment_events() pertenece a Script, porque es capacidad de ejecución.

Si solo hay Script, el modelo sabe cómo consultar, pero no necesariamente sabe por qué consultar.

Si solo hay Instructions, el modelo sabe que debería consultar. Pero cada vez tiene que volver a implementar. Ambos son indispensables.

#04 La Description se parece más a una regla de enrutamiento

Mucha gente escribe la Description de la Skill de una manera que es naturalmente incorrecta.

Porque está acostumbrada a escribirla como una introducción de funciones. Por ejemplo: PR Management Skill ayuda a los usuarios a monitorear el estado de los PR, manejar problemas de CI, completar Merge automáticamente.

Pero el problema es que el modelo no busca Skills a través de funciones. Cuando se inicia Claude Code, primero escanea el nombre y la Description de todas las Skills.

Luego, según el problema actual del usuario, juzga qué Skill debería cargar.

Por lo tanto, la información más importante en la Description no es lo que puede hacer esta Skill, sino en qué situación debería cargarse.

La Description en realidad asume el trabajo de enrutamiento de toda la Skill.

En el mundo real, rara vez alguien dice 'ayúdame a invocar una herramienta de gestión de PR'. Es más probable que digan: ayúdame a vigilar este PR, CI se ha caído de nuevo, etc.

Así que una buena Description debería describir la intención del usuario, no enumerar funciones.

Incluso siento que se puede usar un método muy simple para comprobarlo.

Después de escribir la Description, borra toda la Skill, dejando solo esta línea de Description. Luego pregúntate: después de que el modelo vea el problema del usuario, ¿puede saber cuándo debería cargar esta Skill?

Si no puede, lo más probable es que todavía haya que seguir modificándola.

#05 Gestión y distribución de Skills

Otro punto es sobre la gestión de Skills.

Cuando una persona usa Skills, el asunto es realmente simple. Escribes unas cuantas Skills, las mantienes tú mismo, las actualizas tú mismo. Pero creo que la mayoría de los equipos después se encontrarán con el mismo problema.

Cuando las Skills pasan de ser unas pocas a docenas, incluso cientos, ¿cómo deberían gestionarse estas Skills? ¿Cómo actualizarlas? ¿Cómo distribuirlas a los miembros del equipo?

La experiencia de Anthropic en este aspecto, creo que es bastante digna de referencia.

Cuando el tamaño del equipo es relativamente pequeño, las Skills van directamente con el repositorio de código. Basta con ponerlas en el directorio .claude/skills dentro del proyecto. Todos comparten el mismo conjunto de Skills y también el mismo conjunto de métodos de trabajo.

Pero a medida que la cantidad de Skills aumenta, surge un nuevo problema.

Cuando se inicia Claude Code, escanea el nombre y la Description de todas las Skills, y luego juzga qué Skill debería invocar para la tarea actual. Cuantas más Skills, mayor es el costo de enrutamiento.

Por eso Anthropic luego comenzó a hacer Marketplace. Pero lo más interesante es la forma en que gestionan el Marketplace.

Muchas empresas, al enfrentar este problema, su primera reacción suele ser establecer un proceso de aprobación. Quien escribe una Skill, primero presenta una solicitud; después de aprobarla, entra en la biblioteca oficial de Skills. Internamente, nosotros también lo hicimos así, pero es muy pesado. Gestión por el mero hecho de gestionar.

Descubrí que la organización de Anthropic es muy ligera.

Dejan que las nuevas Skills primero se difundan en un pequeño círculo, que los compañeros las instalen y prueben por sí mismos.

Si cada vez más personas comienzan a usarla, significa que esta Skill realmente resuelve un problema real. En esta etapa, el autor la envía al Marketplace formal.

Así que ellos no discuten primero si la Skill tiene valor o no, sino que primero la dejan someter a la prueba de escenarios de uso real. Si mucha gente la usa, naturalmente entra en el sistema formal. Las Skills que quedan así son básicamente las que el equipo realmente necesita.

Preguntas relacionadas

Q¿Qué es lo más importante que se debe incluir en un Skill según las lecciones de Anthropic?

ALo más importante es incluir 'Gotchas', es decir, los errores comunes o trampas que se aprenden a través de la experiencia y que el modelo no sabría de otra manera. Cosas como 'esta tabla no se puede ordenar por created_at' o 'que staging devuelva 200 no significa éxito'.

Q¿Cómo describe Anthropic la verdadera naturaleza de un Skill en términos de ingeniería?

AAnthropic describe un Skill no como un simple archivo de instrucciones, sino como 'Context Engineering'. Es una carpeta estructurada que gestiona progresivamente la información, con un archivo principal (SKILL.md) que actúa como índice para navegar a referencias, scripts, ejemplos y recursos según sea necesario, evitando así sobrecargar el contexto del modelo.

Q¿Por qué se recomienda usar scripts dentro de un Skill, en lugar de solo instrucciones detalladas?

ASe recomienda usar scripts para automatizar tareas repetitivas y bien definidas, como consultas de datos o procesos de verificación. Esto evita que el modelo gaste tokens de contexto y capacidad de razonamiento 'reinventando la rueda' cada vez, haciendo que la ejecución sea más precisa, eficiente y basada en las mejores prácticas ya consolidadas del equipo.

Q¿Cuál es el propósito correcto de la 'Description' de un Skill según el artículo?

AEl propósito correcto de la 'Description' es actuar como una regla de enrutamiento. Debe describir en qué situación o ante qué intención del usuario se debe cargar el Skill, en lugar de simplemente enumerar sus funciones. Debe responder a la pregunta: '¿Puede el modelo, solo con esta descripción, saber cuándo usarlo?'

Q¿Cómo maneja Anthropic la gestión y distribución de Skills cuando su número crece mucho en un equipo?

AAnthropic promueve un enfoque ligero y orgánico. Los nuevos Skills se prueban y comparten primero en grupos pequeños. Solo si un Skill demuestra su utilidad siendo adoptado por muchos miembros del equipo, entonces se somete para su inclusión en el Marketplace oficial. Evitan procesos de aprobación pesados y priorizan la validación en escenarios reales de uso.

Lecturas Relacionadas

Jensen Huang 'salva' la bolsa de Corea del Sur: asegura la memoria de SK Hynix y la escasez de chips continuará

El 5 de junio, el mercado surcoreano experimentó un 'viernes negro' con una caída del 5.54% en el índice KOSPI. El 7 de junio, Jensen Huang, CEO de NVIDIA, mantuvo una reunión clave con ejecutivos de SK Group, incluido el CEO de SK Hynix, confirmando que la nueva CPU Vera de NVIDIA utilizará DRAM de SK Hynix y que la escasez de chips de memoria continuará durante años. NVIDIA y SK Hynix anunciaron una asociación tecnológica plurianual para desarrollar memoria de próxima generación para la infraestructura de IA de NVIDIA, cubriendo desde supercomputadoras Rubin hasta PC y robots. La colaboración también implica que SK Hynix utilizará tecnologías de IA de NVIDIA, como CUDA-X y Omniverse, para acelerar el diseño de semiconductores (TCAD, litografía computacional) y desarrollar gemelos digitales para sus fábricas, buscando operaciones autónomas. Si bien NVIDIA certificó a SK Hynix, Samsung y Micron para el suministro de HBM4 para su plataforma Vera Rubin, Huang advirtió que la escasez en toda la cadena de suministro de chips persistirá debido a la alta demanda global por la construcción de 'fábricas de IA'. Su visita a Corea del Sur, que incluyó reuniones con empresas como Hyundai, LG y Samsung, refleja el esfuerzo de NVIDIA por profundizar sus vínculos estratégicos con la industria tecnológica coreana.

marsbitHace 20 min(s)

Jensen Huang 'salva' la bolsa de Corea del Sur: asegura la memoria de SK Hynix y la escasez de chips continuará

marsbitHace 20 min(s)

El Nasdaq cae un 4.2% en un día, ¿el 'Viernes Negro' pincha la burbuja bursátil estadounidense?

El 5 de junio de 2026, el Nasdaq cayó un 4.18%, experimentando su mayor caída diaria en más de un año, mientras que el S&P 500 bajó un 2.64%, poniendo fin a nueve semanas consecutivas de ganancias. Este "Viernes Negro" se desencadenó por datos de empleo de EE. UU. mucho más fuertes de lo esperado, que avivaron los temores de inflación y retrasaron las expectativas de recortes de tasas de la Reserva Federal. Esto provocó un aumento en los rendimientos de los bonos y una venta masiva de acciones tecnológicas de alta valoración, especialmente en el sector de la IA, con valores como Nvidia, Micron y AMD sufriendo fuertes pérdidas. El artículo analiza si esta caída marca el fin de la burbuja bursátil. Señala que las valoraciones (como el ratio CAPE y el "índice Buffett") estaban en niveles históricamente altos antes de la corrección, y el sentimiento de los inversores era extremadamente alcista. El excesivo enfoque y la valoración elevada de las acciones de IA se consideran vulnerabilidades clave. Los expertos están divididos: algunos ven esto como el comienzo de un ajuste más profundo, mientras que otros lo consideran una corrección saludable en un mercado impulsado por ganancias corporativas sólidas. Los próximos datos de inflación (IPC) y la próxima reunión de la Fed serán cruciales para determinar la dirección del mercado. El artículo concluye que, aunque no necesariamente significa el fin del mercado alcista, los indicadores de riesgo están aumentando. La era de las ganancias fáciles puede haber terminado, y los inversores deben monitorear de cerca los datos económicos y la política de la Fed, preparándose para una mayor volatilidad y un mercado más selectivo.

marsbitHace 22 min(s)

El Nasdaq cae un 4.2% en un día, ¿el 'Viernes Negro' pincha la burbuja bursátil estadounidense?

marsbitHace 22 min(s)

¿La caída del 4,2% del Nasdaq en un solo día marca el fin de la burbuja de Wall Street?

El 5 de junio de 2026, el mercado bursátil estadounidense experimentó una fuerte corrección. El Nasdaq Composite cayó un 4,18%, registrando su mayor caída diaria desde abril de 2025, impulsado por datos de empleo no agrícolas mucho más fuertes de lo esperado. Esto avivó los temores de una inflación persistente y redujo las expectativas de recortes de tasas por parte de la Reserva Federal, lo que provocó un aumento en los rendimientos de los bonos del Tesoro. El sector tecnológico y de IA, altamente sensible a las tasas de interés, fue el más afectado. El índice de semiconductores de Filadelfia se desplomó más de un 10%, con fuertes caídas en acciones líderes como Nvidia, Broadcom y Micron. Esto refleja una creciente preocupación sobre la sostenibilidad de las valoraciones de la IA y posibles excesos en el mercado. El artículo analiza si esta caída marca un punto de inflexión, señalando múltiples señales de advertencia: valoraciones históricamente altas (como el CAPE de Shiller y el "índice de Buffett"), indicadores de sentimiento de inversores en niveles extremos y advertencias de algunos inversores destacados sobre una posible burbuja en la IA. Los analistas están divididos: algunos ven el inicio de un ajuste más profundo, mientras que otros consideran esto una corrección saludable dentro de un mercado alcista, respaldado por el crecimiento de las ganancias corporativas. La atención se centra ahora en dos eventos clave para determinar el próximo movimiento del mercado: la publicación del índice de precios al consumidor (IPC) de mayo y la próxima reunión de política monetaria de la Fed, cuyas proyecciones (el "dot plot") podrían redefinir las expectativas sobre la trayectoria de las tasas de interés.

Odaily星球日报Hace 28 min(s)

¿La caída del 4,2% del Nasdaq en un solo día marca el fin de la burbuja de Wall Street?

Odaily星球日报Hace 28 min(s)

Primer caso sobre agentes inteligentes: ¿Qué se decidió?

El 30 de abril, el Tribunal de Internet de Cantón emitió un fallo pionero en China contra un software de agente inteligente de código abierto, por eludir las medidas de protección técnica de una plataforma y realizar operaciones automatizadas sin autorización. El tribunal ordenó cesar su distribución, eliminar tutoriales y datos relacionados, estableciendo así un precedente legal clave. Este caso coincide con una demanda similar en EE. UU., donde Amazon demandó a Perplexity por razones análogas, obteniendo una orden judicial restrictiva. Ambas decisiones subrayan un principio emergente en la era de los agentes de IA: la necesidad de una **autorización dual** (usuario y plataforma) para operar legalmente. Los agentes que utilizan permisos de nivel de sistema, como los servicios de accesibilidad, para sortear las reglas de las aplicaciones, enfrentan ahora límites claros. Esto responde a preocupaciones sobre seguridad, privacidad y responsabilidad. El artículo también menciona la evolución del "teléfono Doubao", cuyo modelo inicial, similar al del software sancionado, ha migrado hacia la negociación de autorizaciones con plataformas como Alibaba, buscando la compatibilidad a través de APIs. Este cambio refleja una tendencia global: la **era del crecimiento salvaje de los agentes inteligentes ha terminado**, dando paso a una carrera por la conformidad legal. La conclusión es clara: el futuro de los agentes inteligentes dependerá de la cooperación y los acuerdos con las plataformas, no de eludir sus normas. La regulación está definiendo nuevas reglas del juego, priorizando la seguridad del usuario y la responsabilidad de la plataforma.

marsbitHace 34 min(s)

Primer caso sobre agentes inteligentes: ¿Qué se decidió?

marsbitHace 34 min(s)

Trading

Spot
Futuros
活动图片