Datos de Anthropic: Casi la mitad de las llamadas de AI Agent se concentran en ingeniería de software, estas 16 áreas verticales siguen siendo aguas vírgenes

marsbitPublicado a 2026-02-24Actualizado a 2026-02-24

Resumen

Anthropic ha publicado un estudio exhaustivo sobre el uso real de los agentes de IA, revelando que casi el 50% de las llamadas a herramientas de agentes se concentran en ingeniería de software. Mientras tanto, 16 sectores verticales —como salud, legal, finanzas, educación y logística— representan menos del 5% cada uno, lo que indica un enorme potencial sin explotar. Un hallazgo clave es la brecha entre la capacidad de los modelos y la confianza de los usuarios: Claude puede realizar tareas que tomarían casi 5 horas a un humano, pero la duración media de una sesión es de solo 42 minutos. Esta "brecha de confianza" representa una oportunidad clave para nuevos productos. La confianza aumenta con el uso: los usuarios nuevos aprueban automáticamente el 20% de las acciones, mientras que los experimentados superan el 40%. Además, los agentes suelen pedir aclaraciones en tareas complejas, lo que refleja un diseño seguro y colaborativo. Según Aaron Levie, fundador de Box, el futuro está en los agentes verticales con datos propios, conocimiento experto del sector y capacidad para gestionar el cambio organizacional. El estudio sugiere que podrían surgir 300 nuevos "unicornios" de IA vertical, transformando industrias que aún no han adoptado estas herramientas masivamente.

Autor: Garry's List

Compilación: Deep Tide TechFlow

Guía de Deep Tide: Anthropic acaba de publicar el estudio más completo hasta la fecha sobre el uso real de AI Agent. El dato central es: la ingeniería de software representa casi el 50% del volumen de llamadas a herramientas de Agent, mientras que 16 áreas verticales como salud, derecho, educación, etc., juntas suman menos de la mitad del resto, cada una con una participación inferior al 5%.

No es una señal de saturación del mercado, sino un mapa de 300 unicornios verticales de IA; lo más valioso es un hallazgo contraintuitivo citado en el artículo: el modelo ya puede trabajar de forma independiente durante casi 5 horas, pero los usuarios solo lo dejan trabajar 42 minutos en la práctica. Este "déficit de confianza" en sí mismo es la próxima oportunidad de producto.

Texto completo a continuación:

La ingeniería de software representa casi el 50% de todas las llamadas a herramientas de AI Agent. Áreas verticales como salud, derecho, finanzas, entre otras 16, están casi intactas, cada una por debajo del 5%. Esto significa que hay 300 unicornios verticales de IA esperando ser construidos.

Si hoy empezara una empresa, miraría fijamente el área roja del gráfico de barras de arriba hasta ver mi futuro.

Aaron Levie, fundador de Box, dijo:

Este gráfico es un buen recordatorio de la gran oportunidad que existe ahora en el campo de los AI Agents.

Por supuesto, habrá muchas oportunidades de Agent en el sentido horizontal, pero también hay muchos flujos de trabajo que requieren un profundo conocimiento experto del dominio para poder ayudar realmente a los usuarios a automatizar los procesos únicos de su área vertical.

La plantilla es: construir software Agent que acceda a datos propietarios, para conectar eficazmente a los usuarios con la colaboración del Agent en el manejo de flujos de trabajo, junto con capacidades de ingeniería de contexto profundamente específicas del dominio, y la capacidad de impulsar la gestión del cambio en el lado del cliente.

Actualmente, todavía existen enormes vacíos en muchas áreas.

La ingeniería de software ocupa la mitad de toda la actividad de AI Agent. La otra mitad se distribuye en 16 áreas verticales, ninguna supera el 9%. Salud representa el 1%, derecho el 0.9%, educación el 1.8%. Estos no son mercados saturados, son mercados que casi ni existen.

Anthropic acaba de publicar el estudio más completo hasta la fecha sobre el uso real de AI Agent. El hallazgo central es: la ingeniería de software representa el 49.7% del volumen de llamadas a herramientas de Agent en su API. La conclusión central enterrada detrás es: todo lo demás son aguas vírgenes.

Despliegue rezagado

Hay un dato que debería emocionar a los emprendedores: la capacidad del modelo ya supera con creces lo que los usuarios están dispuestos a confiarle.

La evaluación de capacidades de METR muestra que Claude puede resolver tareas que requieren casi cinco horas de trabajo humano. Pero en el uso real, la duración de la sesión en el percentil 99.9 es de solo unos 42 minutos. Esta brecha —lo que la IA puede hacer versus lo que le permitimos hacer— es una gran oportunidad.

Figura: La duración máxima de entrenamiento de Claude Code casi se duplicó en tres meses. Esto no solo mejoró la capacidad, sino también la confianza.

Fuente:x.com

Desde octubre de 2025 hasta enero de 2026, la duración de una sola sesión en el percentil 99.9 casi se duplicó, pasando de menos de 25 minutos a más de 45 minutos. El crecimiento fue constante entre versiones del modelo. No es solo que el modelo se haya vuelto más fuerte, sino que los usuarios, una y otra vez, aprenden usándolo, extendiendo gradualmente su confianza en el Agent.

"De agosto a diciembre, la tasa de éxito de Claude Code en las tareas más desafiantes de los usuarios internos se duplicó, mientras tanto, el número de intervenciones humanas por sesión se redujo de 5.4 a 3.3."

La capacidad ya está ahí, el despliegue no ha seguido el ritmo. Esto no es un problema, es una oportunidad de producto.

Cómo evoluciona la confianza

El 20% de los nuevos usuarios aprueban automáticamente las operaciones de Claude Code. A las 750 sesiones, más del 40% de las sesiones se ejecutan en modo de aprobación automática completa. Pero hay un hallazgo contraintuitivo: los usuarios experimentados intervienen más, no menos. Los nuevos usuarios intervienen en el 5% de las rondas, los usuarios veteranos en el 9%.

Figura: La confianza es una habilidad que se acumula constantemente. Los nuevos usuarios aprueban automáticamente el 20% de las sesiones. A las 750 sesiones, esta proporción supera el 40%.

Imagen: Anthropic

Fuente: x.com

Esto no es contradictorio, sino un cambio en la estrategia de supervisión. Los principiantes aprueban paso a paso antes de que ocurra la operación, los usuarios veteranos autorizan primero e intervienen si surge un problema —han pasado de la aprobación previa a la monitorización activa.

Aquí hay un hallazgo que merece atención a nivel de seguridad: en tareas complejas, Claude Code solicita aclaraciones activamente con una frecuencia más del doble que la frecuencia de intervención humana activa. El Agent se detiene para confirmar, en lugar de avanzar a toda velocidad. Esto es una característica, no un defecto.

"La revelación central de este estudio es: la autonomía que ejerce el Agent en la práctica es construida conjuntamente por el modelo, el usuario y el producto. Claude hace pausas para preguntar cuando está inseguro, limitando así su propia independencia. Los usuarios construyen confianza al colaborar con el modelo y ajustan su estrategia de supervisión en consecuencia."

El enfoque de Levie para la IA vertical

Aaron Levie señaló la enorme riqueza y valor esperando ser desbloqueados: construir software Agent que acceda a datos propietarios, que realmente resuelva problemas y personas reales, llenar el contexto para maximizar la salida inteligente, y —esta es la parte que la mayoría de los emprendedores ignora— impulsar la gestión del cambio en el lado del cliente.

Este último punto es precisamente por qué la IA vertical es tan difícil de replicar. Cualquiera puede hacer un wrapper de API, pero pocos pueden navegar realmente los flujos de trabajo específicos, las restricciones regulatorias y la resistencia organizacional inherentes a la facturación médica, la discovery legal o la aprobación de permisos de construcción.

El SaaS ha crecido diez veces por década en las últimas décadas. En los últimos 20 años, más del 40% de la financiación de capital riesgo fluyó hacia empresas SaaS. Esta industria dio a luz a más de 170 unicornios SaaS. La lógica es simple: cada uno de estos unicornios tiene una versión de IA vertical esperando aparecer. Y la versión de IA podría ser diez veces más grande, porque reemplaza no solo software, sino también operadores.

La naturaleza de la construcción conjunta

El hallazgo central de Anthropic merece una atención seria por parte de cualquier persona involucrada en la formulación de políticas de IA. La autonomía no es un atributo inherente del modelo, sino construido conjuntamente por el modelo, el usuario y el producto. Las evaluaciones previas al despliegue no pueden capturar esto, debes medirlo en el uso real.

Anthropic declaró oficialmente:

La ingeniería de software representa aproximadamente el 50% del volumen de llamadas a herramientas de Agent en nuestra API, pero también estamos viendo surgir otras industrias. A medida que los límites de riesgo y autonomía continúan expandiéndose, el monitoreo posterior al despliegue se vuelve crucial. Alentamos a otros desarrolladores de modelos a ampliar este estudio.

Los números a nivel de seguridad son tranquilizadores: el 73% de las llamadas a herramientas tienen un humano en el circuito participando, solo el 0.8% de las operaciones son irreversibles. Los escenarios de despliegue de mayor riesgo —como filtraciones de claves API o transacciones cifradas autónomas— son en su mayoría evaluaciones de seguridad, no entornos de producción reales.

"Los requisitos regulatorios que prescriben modos de interacción específicos —por ejemplo, requerir aprobación humana para cada operación— solo crearían fricción, sin necesariamente aportar beneficios de seguridad."

Las políticas que exigen "aprobar cada operación" matarían los beneficios de productividad, sin aumentar la seguridad. Un objetivo mejor es asegurar que los humanos puedan monitorear e intervenir, en lugar de prescribir flujos de trabajo de aprobación específicos.

Dónde se esconden los unicornios

El mapa ya está dibujado. La ingeniería de software ya la está haciendo alguien. Salud, derecho, finanzas, educación, servicio al cliente, logística —16 áreas verticales, cada una con participación de mercado de un solo dígito— están esperando que alguien incruste realmente el conocimiento experto del dominio en el Agent.

Anteriormente nacieron 300 unicornios SaaS, los próximos 300 unicornios de IA vertical están por aparecer. Los fundadores que elijan un área vertical, incrusten el conocimiento experto del dominio en el Agent y descubran cómo impulsar la gestión del cambio, poseerán el mercado de software empresarial de la próxima década.

El modelo ya puede trabajar cinco horas, los usuarios solo lo dejan trabajar 42 minutos. Esta es la señal: todavía estamos en una etapa muy temprana, hay muchas cosas por construir, y en innumerables lugares que aún no han visto ni un minuto de inteligencia en acción.

Preguntas relacionadas

Q¿Qué porcentaje de las llamadas a herramientas de Agent de IA se concentra en ingeniería de software según el estudio de Anthropic?

ASegún el estudio de Anthropic, la ingeniería de software concentra casi el 50% (49.7%) de las llamadas a herramientas de Agent de IA.

Q¿Cuál es la duración máxima que Claude puede trabajar de forma autónoma frente a lo que los usuarios permiten en la práctica?

AClaude puede resolver tareas que requerirían casi 5 horas de trabajo humano, pero en el percentil 99.9, las sesiones de usuarios reales solo duran alrededor de 42 minutos, mostrando una brecha de confianza.

Q¿Cómo evoluciona la confianza de los usuarios con la experiencia en el uso de Agent de IA como Claude Code?

ALos usuarios nuevos aprueban automáticamente el 20% de las sesiones, pero después de 750 sesiones, más del 40% se ejecutan en modo de aprobación automática. Sin embargo, los usuarios experimentados intervienen más (9% de las veces) que los nuevos (5%), cambiando de aprobación previa a supervisión activa.

Q¿Qué áreas verticales se mencionan como oportunidades de mercado sin explotar para Agent de IA?

ALas áreas verticales con menos del 5% de participación cada una incluyen salud (1%), legal (0.9%), educación (1.8%), así como finanzas, servicio al cliente, logística y otras entre un total de 16 sectores identificados como mercados prácticamente inexistentes para Agent de IA.

Q¿Qué enfoque sugiere Aaron Levie para construir Agent de IA exitosos en verticales específicas?

AAaron Levie sugiere construir software Agent que acceda a datos propietarios, se integre en flujos de trabajo específicos del sector, tenga capacidad de contextualización profunda en el dominio y, crucialmente, impulse la gestión del cambio en el lado del cliente para abordar restricciones regulatorias y resistencias organizativas únicas.

Lecturas Relacionadas

Trading

Spot
Futuros
活动图片