Datos de Anthropic: Casi la mitad de las llamadas de AI Agent se concentran en ingeniería de software, estas 16 áreas verticales siguen siendo aguas vírgenes

marsbitPublicado a 2026-02-24Actualizado a 2026-02-24

Resumen

Anthropic ha publicado un estudio exhaustivo sobre el uso real de los agentes de IA, revelando que casi el 50% de las llamadas a herramientas de agentes se concentran en ingeniería de software. Mientras tanto, 16 sectores verticales —como salud, legal, finanzas, educación y logística— representan menos del 5% cada uno, lo que indica un enorme potencial sin explotar. Un hallazgo clave es la brecha entre la capacidad de los modelos y la confianza de los usuarios: Claude puede realizar tareas que tomarían casi 5 horas a un humano, pero la duración media de una sesión es de solo 42 minutos. Esta "brecha de confianza" representa una oportunidad clave para nuevos productos. La confianza aumenta con el uso: los usuarios nuevos aprueban automáticamente el 20% de las acciones, mientras que los experimentados superan el 40%. Además, los agentes suelen pedir aclaraciones en tareas complejas, lo que refleja un diseño seguro y colaborativo. Según Aaron Levie, fundador de Box, el futuro está en los agentes verticales con datos propios, conocimiento experto del sector y capacidad para gestionar el cambio organizacional. El estudio sugiere que podrían surgir 300 nuevos "unicornios" de IA vertical, transformando industrias que aún no han adoptado estas herramientas masivamente.

Autor: Garry's List

Compilación: Deep Tide TechFlow

Guía de Deep Tide: Anthropic acaba de publicar el estudio más completo hasta la fecha sobre el uso real de AI Agent. El dato central es: la ingeniería de software representa casi el 50% del volumen de llamadas a herramientas de Agent, mientras que 16 áreas verticales como salud, derecho, educación, etc., juntas suman menos de la mitad del resto, cada una con una participación inferior al 5%.

No es una señal de saturación del mercado, sino un mapa de 300 unicornios verticales de IA; lo más valioso es un hallazgo contraintuitivo citado en el artículo: el modelo ya puede trabajar de forma independiente durante casi 5 horas, pero los usuarios solo lo dejan trabajar 42 minutos en la práctica. Este "déficit de confianza" en sí mismo es la próxima oportunidad de producto.

Texto completo a continuación:

La ingeniería de software representa casi el 50% de todas las llamadas a herramientas de AI Agent. Áreas verticales como salud, derecho, finanzas, entre otras 16, están casi intactas, cada una por debajo del 5%. Esto significa que hay 300 unicornios verticales de IA esperando ser construidos.

Si hoy empezara una empresa, miraría fijamente el área roja del gráfico de barras de arriba hasta ver mi futuro.

Aaron Levie, fundador de Box, dijo:

Este gráfico es un buen recordatorio de la gran oportunidad que existe ahora en el campo de los AI Agents.

Por supuesto, habrá muchas oportunidades de Agent en el sentido horizontal, pero también hay muchos flujos de trabajo que requieren un profundo conocimiento experto del dominio para poder ayudar realmente a los usuarios a automatizar los procesos únicos de su área vertical.

La plantilla es: construir software Agent que acceda a datos propietarios, para conectar eficazmente a los usuarios con la colaboración del Agent en el manejo de flujos de trabajo, junto con capacidades de ingeniería de contexto profundamente específicas del dominio, y la capacidad de impulsar la gestión del cambio en el lado del cliente.

Actualmente, todavía existen enormes vacíos en muchas áreas.

La ingeniería de software ocupa la mitad de toda la actividad de AI Agent. La otra mitad se distribuye en 16 áreas verticales, ninguna supera el 9%. Salud representa el 1%, derecho el 0.9%, educación el 1.8%. Estos no son mercados saturados, son mercados que casi ni existen.

Anthropic acaba de publicar el estudio más completo hasta la fecha sobre el uso real de AI Agent. El hallazgo central es: la ingeniería de software representa el 49.7% del volumen de llamadas a herramientas de Agent en su API. La conclusión central enterrada detrás es: todo lo demás son aguas vírgenes.

Despliegue rezagado

Hay un dato que debería emocionar a los emprendedores: la capacidad del modelo ya supera con creces lo que los usuarios están dispuestos a confiarle.

La evaluación de capacidades de METR muestra que Claude puede resolver tareas que requieren casi cinco horas de trabajo humano. Pero en el uso real, la duración de la sesión en el percentil 99.9 es de solo unos 42 minutos. Esta brecha —lo que la IA puede hacer versus lo que le permitimos hacer— es una gran oportunidad.

Figura: La duración máxima de entrenamiento de Claude Code casi se duplicó en tres meses. Esto no solo mejoró la capacidad, sino también la confianza.

Fuente:x.com

Desde octubre de 2025 hasta enero de 2026, la duración de una sola sesión en el percentil 99.9 casi se duplicó, pasando de menos de 25 minutos a más de 45 minutos. El crecimiento fue constante entre versiones del modelo. No es solo que el modelo se haya vuelto más fuerte, sino que los usuarios, una y otra vez, aprenden usándolo, extendiendo gradualmente su confianza en el Agent.

"De agosto a diciembre, la tasa de éxito de Claude Code en las tareas más desafiantes de los usuarios internos se duplicó, mientras tanto, el número de intervenciones humanas por sesión se redujo de 5.4 a 3.3."

La capacidad ya está ahí, el despliegue no ha seguido el ritmo. Esto no es un problema, es una oportunidad de producto.

Cómo evoluciona la confianza

El 20% de los nuevos usuarios aprueban automáticamente las operaciones de Claude Code. A las 750 sesiones, más del 40% de las sesiones se ejecutan en modo de aprobación automática completa. Pero hay un hallazgo contraintuitivo: los usuarios experimentados intervienen más, no menos. Los nuevos usuarios intervienen en el 5% de las rondas, los usuarios veteranos en el 9%.

Figura: La confianza es una habilidad que se acumula constantemente. Los nuevos usuarios aprueban automáticamente el 20% de las sesiones. A las 750 sesiones, esta proporción supera el 40%.

Imagen: Anthropic

Fuente: x.com

Esto no es contradictorio, sino un cambio en la estrategia de supervisión. Los principiantes aprueban paso a paso antes de que ocurra la operación, los usuarios veteranos autorizan primero e intervienen si surge un problema —han pasado de la aprobación previa a la monitorización activa.

Aquí hay un hallazgo que merece atención a nivel de seguridad: en tareas complejas, Claude Code solicita aclaraciones activamente con una frecuencia más del doble que la frecuencia de intervención humana activa. El Agent se detiene para confirmar, en lugar de avanzar a toda velocidad. Esto es una característica, no un defecto.

"La revelación central de este estudio es: la autonomía que ejerce el Agent en la práctica es construida conjuntamente por el modelo, el usuario y el producto. Claude hace pausas para preguntar cuando está inseguro, limitando así su propia independencia. Los usuarios construyen confianza al colaborar con el modelo y ajustan su estrategia de supervisión en consecuencia."

El enfoque de Levie para la IA vertical

Aaron Levie señaló la enorme riqueza y valor esperando ser desbloqueados: construir software Agent que acceda a datos propietarios, que realmente resuelva problemas y personas reales, llenar el contexto para maximizar la salida inteligente, y —esta es la parte que la mayoría de los emprendedores ignora— impulsar la gestión del cambio en el lado del cliente.

Este último punto es precisamente por qué la IA vertical es tan difícil de replicar. Cualquiera puede hacer un wrapper de API, pero pocos pueden navegar realmente los flujos de trabajo específicos, las restricciones regulatorias y la resistencia organizacional inherentes a la facturación médica, la discovery legal o la aprobación de permisos de construcción.

El SaaS ha crecido diez veces por década en las últimas décadas. En los últimos 20 años, más del 40% de la financiación de capital riesgo fluyó hacia empresas SaaS. Esta industria dio a luz a más de 170 unicornios SaaS. La lógica es simple: cada uno de estos unicornios tiene una versión de IA vertical esperando aparecer. Y la versión de IA podría ser diez veces más grande, porque reemplaza no solo software, sino también operadores.

La naturaleza de la construcción conjunta

El hallazgo central de Anthropic merece una atención seria por parte de cualquier persona involucrada en la formulación de políticas de IA. La autonomía no es un atributo inherente del modelo, sino construido conjuntamente por el modelo, el usuario y el producto. Las evaluaciones previas al despliegue no pueden capturar esto, debes medirlo en el uso real.

Anthropic declaró oficialmente:

La ingeniería de software representa aproximadamente el 50% del volumen de llamadas a herramientas de Agent en nuestra API, pero también estamos viendo surgir otras industrias. A medida que los límites de riesgo y autonomía continúan expandiéndose, el monitoreo posterior al despliegue se vuelve crucial. Alentamos a otros desarrolladores de modelos a ampliar este estudio.

Los números a nivel de seguridad son tranquilizadores: el 73% de las llamadas a herramientas tienen un humano en el circuito participando, solo el 0.8% de las operaciones son irreversibles. Los escenarios de despliegue de mayor riesgo —como filtraciones de claves API o transacciones cifradas autónomas— son en su mayoría evaluaciones de seguridad, no entornos de producción reales.

"Los requisitos regulatorios que prescriben modos de interacción específicos —por ejemplo, requerir aprobación humana para cada operación— solo crearían fricción, sin necesariamente aportar beneficios de seguridad."

Las políticas que exigen "aprobar cada operación" matarían los beneficios de productividad, sin aumentar la seguridad. Un objetivo mejor es asegurar que los humanos puedan monitorear e intervenir, en lugar de prescribir flujos de trabajo de aprobación específicos.

Dónde se esconden los unicornios

El mapa ya está dibujado. La ingeniería de software ya la está haciendo alguien. Salud, derecho, finanzas, educación, servicio al cliente, logística —16 áreas verticales, cada una con participación de mercado de un solo dígito— están esperando que alguien incruste realmente el conocimiento experto del dominio en el Agent.

Anteriormente nacieron 300 unicornios SaaS, los próximos 300 unicornios de IA vertical están por aparecer. Los fundadores que elijan un área vertical, incrusten el conocimiento experto del dominio en el Agent y descubran cómo impulsar la gestión del cambio, poseerán el mercado de software empresarial de la próxima década.

El modelo ya puede trabajar cinco horas, los usuarios solo lo dejan trabajar 42 minutos. Esta es la señal: todavía estamos en una etapa muy temprana, hay muchas cosas por construir, y en innumerables lugares que aún no han visto ni un minuto de inteligencia en acción.

Preguntas relacionadas

Q¿Qué porcentaje de las llamadas a herramientas de Agent de IA se concentra en ingeniería de software según el estudio de Anthropic?

ASegún el estudio de Anthropic, la ingeniería de software concentra casi el 50% (49.7%) de las llamadas a herramientas de Agent de IA.

Q¿Cuál es la duración máxima que Claude puede trabajar de forma autónoma frente a lo que los usuarios permiten en la práctica?

AClaude puede resolver tareas que requerirían casi 5 horas de trabajo humano, pero en el percentil 99.9, las sesiones de usuarios reales solo duran alrededor de 42 minutos, mostrando una brecha de confianza.

Q¿Cómo evoluciona la confianza de los usuarios con la experiencia en el uso de Agent de IA como Claude Code?

ALos usuarios nuevos aprueban automáticamente el 20% de las sesiones, pero después de 750 sesiones, más del 40% se ejecutan en modo de aprobación automática. Sin embargo, los usuarios experimentados intervienen más (9% de las veces) que los nuevos (5%), cambiando de aprobación previa a supervisión activa.

Q¿Qué áreas verticales se mencionan como oportunidades de mercado sin explotar para Agent de IA?

ALas áreas verticales con menos del 5% de participación cada una incluyen salud (1%), legal (0.9%), educación (1.8%), así como finanzas, servicio al cliente, logística y otras entre un total de 16 sectores identificados como mercados prácticamente inexistentes para Agent de IA.

Q¿Qué enfoque sugiere Aaron Levie para construir Agent de IA exitosos en verticales específicas?

AAaron Levie sugiere construir software Agent que acceda a datos propietarios, se integre en flujos de trabajo específicos del sector, tenga capacidad de contextualización profunda en el dominio y, crucialmente, impulse la gestión del cambio en el lado del cliente para abordar restricciones regulatorias y resistencias organizativas únicas.

Lecturas Relacionadas

El Mercado de Deuda Japonesa se Dirige a la Cadena de Bloques

El mercado de deuda pública japonés (JGB), valorado en más de 9 billones de dólares, se prepara para una transformación crucial mediante la tokenización en blockchain. Instituciones clave como JSCC, Mizuho, Nomura y Digital Asset han iniciado una prueba de concepto en la red Canton para mover garantías JGB a la cadena. Este cambio responde a la urgencia de modernizar un sistema anticuado, donde las transferencias de colateral pueden tardar días y están limitadas al horario de Tokio, lo que pone en riesgo la competitividad del JGB frente a los Bonos del Tesoro de EE.UU., que ya avanzan hacia una liquidación tokenizada 24/7. La red Canton, elegida por su arquitectura que cumple con estrictos requisitos legales y de privacidad, permite liquidaciones atómicas e instantáneas entre instituciones, sincronizando solo los datos autorizados para cada parte. Este sistema "siempre activo" podría liberar billones en colateral inmovilizado, reducir costes operativos y mitigar riesgos sistémicos, como los ciclos de ventas forzosas durante crisis de mercado, al permitir el uso directo de bonos como garantía. Este movimiento representa una revolución en la eficiencia de la infraestructura financiera global, aunque consolida el papel de los actores tradicionales en una nueva capa tecnológica. La convergencia de los principales bonos soberanos en Canton apunta a que esta red podría convertirse en un estándar fundamental para el movimiento de colateral a nivel mundial.

marsbitHace 59 min(s)

El Mercado de Deuda Japonesa se Dirige a la Cadena de Bloques

marsbitHace 59 min(s)

Resumen de Financiación Semanal | 14 Eventos de Financiación Pública, Kalshi Cierra una Nueva Ronda de $10 Mil Millones con una Valoración de $220 Mil Millones, Liderada por Coatue Management

**Resumen semanal de financiación: 14 rondas recaudan más de 10.490 millones de dólares** Esta semana (4-10 de mayo) se registraron 14 eventos de financiación en el sector blockchain, con un volumen total superior a los 10.490 millones de dólares, según datos recopilados por PANews. **Desglose por sectores:** * **DeFi (4):** Destaca OnRe, una reaseguradora regulada en cadena, que completó una ronda Serie A de 5 millones de dólares. * **Infraestructura y herramientas (4):** OpenTrade lideró con una ronda estratégica de 17 millones para expandir su infraestructura de rendimiento para stablecoins. * **Mercados de predicción (3):** La plataforma Kalshi recaudó 1.000 millones de dólares en una nueva ronda liderada por Coatue Management, alcanzando una valoración de 22.000 millones. * **Finanzas centralizadas (1):** La plataforma de trading impulsada por IA Stockcoin.ai completó una ronda semilla. * **Otras aplicaciones Web3 (2):** SC Ventures, de Standard Chartered, realizó una inversión estratégica en el creador de mercado de cripto GSR. **Inversiones institucionales relevantes:** * Coinbase realizó una inversión estratégica "de siete cifras" en Centrifuge, designándola como socio clave para la tokenización de activos reales (RWA) en su ecosistema Base. * Haun Ventures, fundada por Katie Haun, completó la captación de un nuevo fondo de 1.000 millones de dólares para invertir en cripto, IA y activos alternativos. * La firma suiza Multi Investment recaudó ~616 millones de dólares para aumentar sus inversiones en blockchain, Web3 y fintech.

marsbitHace 1 hora(s)

Resumen de Financiación Semanal | 14 Eventos de Financiación Pública, Kalshi Cierra una Nueva Ronda de $10 Mil Millones con una Valoración de $220 Mil Millones, Liderada por Coatue Management

marsbitHace 1 hora(s)

El prototipo de 'El gran golpe' duplica su apuesta contra la burbuja de la IA: mantiene posiciones cortas en NVIDIA y Palantir y compra acciones de software tradicional

El inversor Michael Burry, famoso por apostar contra la burbuja inmobiliaria en 2008, está incrementando sus posiciones en contra del entusiasmo actual por la IA. Según su blog 'Cassandra Unchained', mantiene y amplía sus apuestas bajistas contra Nvidia y Palantir, añadiendo posiciones cortas en ETFs de semiconductores (SOXX) y del Nasdaq 100 (QQQ). Simultáneamente, está comprando acciones de empresas de software tradicional como Adobe, Autodesk y Salesforce, cuyos precios han caído, argumentando que se han visto perjudicadas injustamente por la narrativa de la IA. Burry comenzó a apostar contra Palantir y Nvidia en el tercer trimestre de 2025. Aunque su posición contra Palantir ya es rentable, espera que la acción caiga más del 60% desde sus niveles actuales. Su apuesta contra Nvidia, sin embargo, está en pérdidas, ya que la acción sigue cerca de máximos históricos. Su tesis central es que la actual euforia por la infraestructura de IA es una burbuja comparable a la de internet en los años 90. Al combinar ventas en corto de los "ganadores de la IA" con compras de los "perdedores" castigados, Burry construye una cartera que busca beneficiarse de una corrección en los precios excesivos. Aunque sus opiniones contrastan fuertemente con el mercado alcista, insiste en su análisis de que la valoración del sector de la IA está desconectada de los fundamentos reales.

marsbitHace 1 hora(s)

El prototipo de 'El gran golpe' duplica su apuesta contra la burbuja de la IA: mantiene posiciones cortas en NVIDIA y Palantir y compra acciones de software tradicional

marsbitHace 1 hora(s)

“El Gran Corto” Burry y el legendario magnate Jones advierten: la fiebre por la IA se parece mucho a la víspera del desplome del 2000

El famoso inversor Michael Burry, conocido por predecir el colapso del mercado inmobiliario estadounidense, ha advertido que la actual obsesión del mercado bursátil con la inteligencia artificial comienza a parecerse a las últimas etapas previas al estallido de la burbuja puntocom en 2000. En un artículo publicado en Substack, Burry señaló que, durante un largo viaje en coche, escuchó programas financieros en los que solo se hablaba de la IA todo el día. Criticó que el mercado ya no reacciona de manera lógica a datos económicos como los informes de empleo o la confianza del consumidor, atribuyendo el alza de las acciones simplemente a un "impulso alcista" alimentado por una narrativa de dos letras (IA). Comparó el reciente rendimiento del índice de semiconductores de Filadelfia (SOX) con el aumento previo al desplome tecnológico de marzo de 2000. Por su parte, el legendario trader macro Paul Tudor Jones, de Tudor Investment Corporation, también comparó el actual auge impulsado por la IA con el período anterior al estallido de la burbuja de internet. Sin embargo, Jones cree que este mercado alcista podría tener aún espacio para seguir subiendo durante uno o dos años. No obstante, advirtió que si las valoraciones continúan inflándose, el eventual ajuste podría ser extremadamente severo, imaginando un escenario donde la capitalización del mercado en relación con el PIB alcance niveles insostenibles.

marsbitHace 1 hora(s)

“El Gran Corto” Burry y el legendario magnate Jones advierten: la fiebre por la IA se parece mucho a la víspera del desplome del 2000

marsbitHace 1 hora(s)

Trading

Spot
Futuros
活动图片