¿OpenAI devorará la capa de aplicaciones? a16z dice que la verdadera oportunidad está más allá de los modelos genéricos

marsbitPublicado a 2026-05-28Actualizado a 2026-05-28

Resumen

El artículo de a16z analiza las oportunidades en la capa de aplicaciones de IA frente al dominio de modelos fundacionales como OpenAI y Anthropic. Utiliza la metáfora del "Camino de Ladrillos Amarillos" (áreas horizontales como generación de código o texto, donde los laboratorios de modelos tienen ventaja) frente al "resto de Oz" (escenarios verticales profundos). La tesis principal es que la verdadera oportunidad para las startups está en este "resto de Oz": problemas complejos, específicos de industrias como ventas, seguros o legal. Allí, el valor no reside solo en el modelo, sino en el andamiaje que lo rodea: flujos de trabajo multi-paso, integración con sistemas heredados, gobierno, cumplimiento normativo y gestión de la complejidad de los datos. El artículo argumenta que estas empresas verticales pueden construir defensas sostenibles a través de: 1. **Ruedas de aprendizaje y datos:** Capturar conocimiento tácito y casos límite de la industria. 2. **Gestión de la complejidad del modelo:** Enrutar tareas entre múltiples modelos (incluidos los de código abierto) y absorber el coste de las migraciones. 3. **Optimización de costes:** Utilizar el modelo más adecuado y económico para cada subtarea. 4. **Gobierno y cumplimiento:** Proporcionar un plano de control con garantías auditables para industrias reguladas. Se concluye que el software empresarial de próxima generación se construirá en estos ámbitos verticales, donde el sistema que ejecuta el trabajo (con sus datos,...

Nota del editor: Con la mejora continua de las capacidades de los modelos grandes, la capa de aplicaciones de IA está enfrentando una ansiedad generalizada: si empresas de modelos como OpenAI y Anthropic dominan tanto los modelos base como los canales de distribución y tienen ventajas de marca, ¿qué pueden hacer las startups en la capa de aplicaciones?

Esta es precisamente la pregunta que el socio de a16z, Joe Schmidt, intenta responder en este artículo. Utilizando la metáfora del «Camino de Ladrillos Amarillos» de *El Mago de Oz*, divide las oportunidades de aplicaciones de IA en dos categorías: una es la ruta principal que las empresas de modelos grandes están entrando directamente, como generación de código, escritura, generación de imágenes, agentes universales y asistentes horizontales de oficina; la otra es «el resto de la tierra de Oz», es decir, aquellos escenarios verticales que profundizan en los procesos de la industria, dependen de flujos de trabajo complejos, acumulación de datos, gestión de cumplimiento y capacidades de integración de sistemas.

En su opinión, la verdadera oportunidad para las startups está en esta última.

Desde ventas hasta seguros, Joe Schmidt enfatiza repetidamente la misma lógica: lo que las empresas realmente están dispuestas a pagar no es una ventana de chat más inteligente, sino un sistema que pueda responsabilizarse de los resultados del negocio. Necesita entender el estado caótico de los datos del cliente, manejar aprobaciones de múltiples personas y casos límite, asumir responsabilidades de cumplimiento y auditoría, y también realizar la migración, el enrutamiento y la optimización de costos para el cliente cuando los modelos se actualicen continuamente.

Este es también el juicio central de este artículo sobre el próximo software empresarial: los modelos base serán cada vez más potentes y también más reemplazables; pero lo que realmente es insustituible son los datos, procesos, capacidades de gobierno y memoria operativa acumulados en torno a industrias y flujos de trabajo específicos. La oportunidad para las empresas de aplicaciones de IA no está en competir con las empresas de modelos por el «Camino de Ladrillos Amarillos», sino en adentrarse en aquellos lugares más complejos, más sucios, más lentos, pero también más cercanos al valor comercial real.

A continuación, el texto original:

Últimamente, escucho constantemente la misma pregunta de fundadores y posibles empleados: ¿Hay algo que hacer aún en la capa de aplicaciones de IA? ¿O es que OpenAI y Anthropic finalmente acabarán con todo?

Detrás de esta pregunta hay una ansiedad típica de la IA. Algunos ya han llegado a la conclusión: si no quieres terminar como una capa base permanente, las únicas posiciones con valor a largo plazo están dentro de los laboratorios de modelos grandes, o emprendiendo en robótica, hard tech o campos similares de vanguardia, es decir, teóricamente, hacer aquellas cosas que «los laboratorios no tocan». Porque si cada tipo de software va a ser devorado, ya sea porque Codex o Claude absorban directamente el trabajo correspondiente, o porque algún modelo futuro lo vuelva innecesario, la mejor opción parece ser: ¡corre!

Admito que yo casi soy un maximalista de IA, y creo que tienen razón a medias. Los laboratorios de modelos grandes efectivamente están entrando en grandes áreas de la capa de aplicaciones. Pero la «capa de aplicaciones» no es un conjunto homogéneo de oportunidades. El criterio de juicio verdaderamente importante es: ¿estás en el «Camino de Ladrillos Amarillos» o en el resto de la tierra de Oz?

El llamado «Camino de Ladrillos Amarillos» es la ruta que usamos para describir la que los laboratorios de modelos grandes están siguiendo e invirtiendo enormes recursos. Problemas como la generación de código, escritura y creación de imágenes son naturalmente adecuados para los laboratorios porque mejoran con el aumento de la capacidad bruta del modelo: cada dólar invertido en pre-entrenamiento y post-entrenamiento mejora directamente la calidad del producto.

Pero en el resto de la tierra de Oz, existen problemas más complejos, y generalmente más verticales. No se trata simplemente de dar a un usuario empresarial una herramienta horizontal y hacer que se conecte a herramientas estándar y capacidades informáticas para resolverlo. Aquí el valor proviene más del andamiaje que rodea al modelo: ese andamiaje hace que la salida sea confiable, cumpla las normativas y realmente ingrese en los flujos de trabajo del negocio dentro de una industria específica. La capacidad bruta del modelo base sigue siendo importante, por supuesto, pero ya no lo es todo.

Estamos viendo esto en tiempo real. OpenAI y Anthropic están admitiendo esencialmente al mercado: no pueden resolver todos los problemas con un asistente de IA universal. Han anunciado grandes inversiones en empresas conjuntas de despliegue en primera línea, construyendo compañías completas en torno a configurar y personalizar modelos para empresas. Si realmente creyeran que el próximo lanzamiento de un modelo resolvería estos problemas, no invertirían miles de millones de dólares en este tipo de proyectos.

Entonces, si quieres ganar dinero haciendo aplicaciones de IA, no vayas por el Camino de Ladrillos Amarillos, ve a construir en el resto de la tierra de Oz. A continuación, algunas lecciones aprendidas en la práctica por nosotros y por algunos fundadores de nuestra cartera de inversiones.

Camino de Ladrillos Amarillos

Si vas a fundar una empresa, el Camino de Ladrillos Amarillos es el más obvio, pero también el más peligroso. Toma un modelo de alto rendimiento, conéctalo a algunos conectores listos para usar, como Google Drive, Slack, Salesforce, Notion, GitHub, y construye una capa de orquestación de agentes encima. Parece magia.

El problema es que esto es precisamente lo que los laboratorios de modelos grandes están haciendo con Coworker y Codex. Claramente, ellos poseen el modelo, lo que significa que tienen mejores márgenes, mayor control y pueden ejercer poder de fijación de precios sobre todos los actores aguas abajo. Pero quizás lo más importante es que también controlan las decisiones arquitectónicas que determinan para qué es adecuado el producto resolver. Hasta ahora, han sido muy intencionales en adoptar el patrón «modelo + llamada a herramientas», que es precisamente el modo necesario para esos trabajos horizontales y de pocos pasos en el Camino de Ladrillos. Incluso si una startup lograra de alguna manera superar a Codex o Claude Code, los laboratorios de modelos grandes aún poseen una enorme capacidad de distribución y el aura de marca más fuerte en el campo de la IA.

Si eres una empresa de aplicaciones de IA y sigues el mismo juego: conectarte a los mismos conectores, sin subagentes o configuración debajo, y sin canales de distribución, probablemente estés en un camino hacia la nada.

El resto de la tierra de Oz

Para las startups, la situación no es del todo pesimista. Fuera del Camino de Ladrillos Amarillos, todavía existen enormes oportunidades. Las startups pueden tener clientes y resolver problemas complejos en estos lugares.

Estas empresas están construyendo experiencias de agentes: los modelos están entrelazados en redes complejas de herramientas, automatización e integraciones, en otras palabras, software. Esto también hace que la mayoría de estas startups sean naturalmente verticales. Pueden enfocarse en flujos de trabajo de múltiples pasos y múltiples participantes, diseñar subagentes para diferentes roles y escenarios verticales, y abordar problemas difíciles de alcanzar para las plataformas horizontales de Anthropic y OpenAI: recolectar contexto a través de sistemas y luego enrutar tareas a múltiples personas que necesitan aprobación en diferentes etapas.

Este tipo de trabajo a menudo involucra uno o más sistemas heredados, a menudo requiere resultados deterministas porque la ambigüedad es inaceptable, y a veces está directamente vinculado a un resultado comercial importante. Los laboratorios de modelos grandes ciertamente saben cuán valiosos son estos problemas: por eso están construyendo sus propios equipos de configuración externalizados y por qué está surgiendo toda una categoría de empresas de servicios de aprendizaje por refuerzo para grandes clientes.

Por qué el resto de la tierra de Oz no será completamente ocupado por el «Mago»

Un contraargumento a lo anterior es: hasta ahora, apostar a que los modelos o laboratorios no seguirán mejorando ha sido una mala apuesta. Es probable que continúen volviéndose más fuertes y eventualmente devoren los mercados servidos por estas empresas de aplicaciones.

Los laboratorios de modelos grandes ciertamente seguirán progresando. Pero creo que las empresas en el resto de la tierra de Oz todavía tienen varias formas de defenderse a largo plazo.

Datos y rueda de aprendizaje

Muchas de las cosas que realmente internalizas en un negocio no existen en ningún conjunto de entrenamiento: convenciones de la industria no escritas, estándares no documentados, conocimiento tribal que existe en las mentes de los profesionales. No están en la internet pública. No importa cuánto poder de cómputo de entrenamiento se invierta, no puede reemplazar realmente entrar en el flujo de trabajo donde reside ese conocimiento.

Aquí se superponen dos ruedas: una es la rueda entre clientes, es decir, cuando ves más variaciones del mismo tipo de problema, los patrones se capitalizan continuamente; la otra es la rueda interna del cliente, es decir, las razones detrás de decisiones específicas, esas excepciones no dichas, las reglas empíricas de la propia empresa, que solo surgen cuando los usuarios interactúan realmente con el sistema.

Incluso si los datos del cliente no se pueden usar entre clientes, las empresas de aplicaciones aún pueden aprovechar el reconocimiento de patrones de diferentes tipos de problemas de clientes y usarlo para guiar el diseño arquitectónico de problemas futuros. Una empresa que ya ha hecho que sus agentes manejen cien revisiones de líneas rojas legales, mil ciclos de suscripción de seguros o diez mil actividades de desarrollo de ventas SDR, tiene una comprensión de la forma del problema que un recién llegado que inicia un nuevo agente por primera vez no puede replicar.

Teóricamente, un agente horizontal también podría construir la misma infraestructura de aprendizaje. Pero la razón por la que no lo hace, además de la falta de enfoque, es más importante, la experiencia del usuario. Capturar este conocimiento depende completamente de qué tipo de interfaz de flujo de trabajo le proporciones al usuario. Los jugadores verticales pueden diseñar estas interfaces en torno a la información que realmente necesita exponer un flujo de trabajo específico, algo que las herramientas horizontales no pueden hacer. Los conjuntos de evaluación, las salidas etiquetadas, los sistemas de clasificación de casos límite pueden combinarse en una rueda de datos de dominio vertical que, a su vez, soporta el ajuste fino. Para un recién llegado sin una exposición equivalente en entorno de producción, es difícil generar esta rueda. Su viabilidad depende de los derechos de datos, el volumen de uso en producción acumulado y la estructura contractual con los clientes, pero el reconocimiento de patrones en sí mismo continuará acumulándose.

Gestionar la volatilidad y complejidad del modelo

Los laboratorios de modelos grandes ya hacen enrutamiento internamente: llaman a diferentes categorías de modelos para diferentes solicitudes, utilizando conjuntos de modelos en el backend. Pero lo que no pueden hacer es enrutar entre proveedores, también es difícil evaluar modelos de la competencia para una subtarea concreta, o usar un modelo de ajuste fino de código abierto verdaderamente más adecuado en un paso estrecho.

Las empresas en el resto de la tierra de Oz elegirán el modelo más adecuado para cada subtarea en todo el mercado de modelos, no solo el modelo lanzado por un laboratorio madre. También asumirán el trabajo que nadie más quiere hacer: volver a ejecutar evaluaciones con cada nuevo lanzamiento de modelo, recalibrar indicaciones para los casos límite de los clientes, poner en línea sin romper el entorno de producción. Los laboratorios de modelos grandes no harán esto por sus clientes. Te venden el nuevo modelo y te dicen que migres. Las empresas en el resto de la tierra de Oz absorben el costo de migración. El cliente obtiene la mejor capacidad inteligente de todo el mercado, junto con la continuidad durante cada actualización.

Optimización de costos

Enviar cada consulta a Opus 4.7 es la forma más rápida de hacer que el margen bruto sea negativo. Las mejores empresas de Oz enrutarán entre diferentes niveles de modelos: las tareas más difíciles para modelos de vanguardia, la mayoría de las tareas para modelos medios, modelos personalizados más pequeños o modelos de ajuste fino donde ya se haya demostrado que funcionan.

Algunas de estas empresas ahora hacen su propio post-entrenamiento sobre esto, optimizando el modelo en ese pequeño segmento de trabajo que realmente le importa al cliente, y ofreciendo el servicio a un costo muy inferior al de las llamadas API de vanguardia. Los laboratorios de modelos grandes fijan precios para el «precio mínimo»: el nivel mínimo de inteligencia que puedes obtener por X dólares. Las empresas de Oz venden lo contrario: el costo en dólares más bajo para el nivel de inteligencia realmente requerido por un flujo de trabajo específico. Esto solo es posible cuando sabes exactamente qué nivel de inteligencia necesita cada subtarea. Y los laboratorios de modelos grandes, estructuralmente, no pueden conocer cada tarea en cada industria vertical. Finalmente, esto se traduce directamente en precios de resultados más bajos y más controlables.

Gobernanza

Convertirse en el plano de control donde un cliente ejecuta IA en un dominio vertical genera un valor considerable. Este plano de control es donde convergen los permisos, la auditoría, lo que se permite que haga el agente y lo que el agente realmente hizo.

Este plano de control se construye sobre barreras de protección para casos de uso específicos, y las barreras son completamente diferentes en diferentes industrias y tipos de roles. Debido a que estas empresas poseen de extremo a extremo las herramientas, flujos de trabajo y datos que tocan los agentes, pueden proporcionar resultados deterministas de formas difíciles de lograr para herramientas horizontales. También absorben la complejidad regulatoria para el comprador final: las Reglas Federales de Procedimiento Civil de EE.UU. y las reglas de ética profesional en el ámbito legal, HIPAA en el ámbito sanitario, las reglas de la SEC y FINRA en el ámbito financiero, la regulación estatal de seguros, etc. Los jugadores horizontales no pueden hacer esto de manera creíble sin convertirse en cien industrias verticales diferentes. Un CIO necesita un socio que pueda comprometerse claramente en un contrato: asumirá la responsabilidad del manejo del cumplimiento normativo para los agentes que proporciona.

Todos estos puntos finalmente regresan a lo mismo: enfoque.

Este enfoque puede ser una industria vertical, como seguros, legal, contabilidad; o puede ser una función que se lleve a una profundidad suficiente, como ventas, servicio al cliente, finanzas. Cualquiera que sea, este trabajo requiere que un equipo se sumerja a largo plazo en el mismo tipo de base de clientes, entendiendo sus flujos de trabajo, casos límite y requisitos regulatorios. Los laboratorios de modelos grandes no están construidos para esto. Deben servir a todos, cubrir todos los lugares, y esa es la razón por la que construyeron el Camino de Ladrillos Amarillos en primer lugar. La misma compensación hará que sea difícil para ellos entrar en el resto de la tierra de Oz: puedes estar en todas partes a la vez, o puedes hacer una cosa extremadamente bien, pero no ambas.

Tomando las ventas como ejemplo: Consejos prácticos del CEO tecnológico de 11x

En la práctica, ¿cómo se debe entender esto? A continuación, algunos consejos prácticos de Prabhav Jain, CEO de 11x.

Enfócate en los resultados

Un camino táctico viable para construir una empresa que pueda resistir el impacto de los laboratorios de modelos grandes es comenzar desde los resultados específicos que realmente le importan al cliente. Para nosotros, ese resultado es ayudar a las empresas a generar más leads y más pipeline de ventas.

Desde aquí, el problema se vuelve muy específico: ¿Qué actividades queremos poseer de extremo a extremo y que realmente impulsen el crecimiento del pipeline de ventas? Desglosa cada actividad en tareas. ¿Qué tareas son adecuadas para un agente y cuáles no? ¿Cuáles requieren una comprensión compleja del dominio y cuáles no? Los laboratorios de modelos grandes también lanzarán flujos de trabajo, pero cuando un paso del flujo de trabajo tiene muchos pasos, entradas desordenadas, estados difíciles de interpretar o existen restricciones del mundo real, simplemente tener un mejor modelo no lo logrará. Entonces, el trabajo vuelve a la ingeniería de software tradicional, y en ese nivel, los laboratorios de modelos grandes no tienen ventaja sobre una empresa de aplicaciones enfocada.

Por ejemplo, algunas de las tareas que manejamos incluyen: prospección de leads basada en señales personalizadas, enriquecimiento de información de leads, investigación profunda de cuentas, extracción de contexto del CRM, redacción de mensajes para diferentes canales, agente de calificación de leads y sistema de entrega de correos. Algunas de estas son tareas de agente, otras no. Estas tareas no se completan con un solo prompt, sino que requieren capacidades de ingeniería profundas.

La idea clave en la analogía de Oz es: En cualquier flujo de trabajo real, aproximadamente la mitad son tareas no de agente, y esa mitad no aporta ventaja de laboratorio. Debajo de la capa del modelo, su capacidad para escribir software determinista no es mejor que la tuya. Y la otra mitad de tareas de agente todavía te exigen ajustar, entrenar y restringir el modelo en torno al resultado que realmente deseas.

El conocimiento del dominio a menudo no está en los datos de entrenamiento genéricos. Estas capacidades deben construirse de abajo hacia arriba desde la industria vertical o función específica, y alimentarse al modelo en el momento adecuado dentro del flujo de trabajo. Cuando nuestro agente califica una lead entrante por teléfono, debe ser entrenado para entender: para una industria específica, un perfil de usuario específico, qué constituye una buena conversación de ventas. Este es el trabajo de la empresa de aplicaciones, y esta capacidad se capitaliza.

Lo más importante es que estas capacidades se vuelven obsoletas continuamente, porque la propia empresa está evolucionando. Por lo tanto, tu capacidad para evolucionar continuamente el flujo de trabajo y el contexto se convierte en sí misma en una ventaja competitiva. Por ejemplo, cuando comenzamos con el producto de outreach de correo escalable, los «correos escritos por IA» recién comenzaban a aparecer. Avanza rápido hasta hoy, la gente ha desarrollado un sentido agudo para distinguir qué correos están escritos por IA y cuáles se sienten más humanos, y lo clave es que este juicio cambia cada pocos meses. Nuestros agentes deben ajustarse continuamente con la dinámica del mercado, pero la ventaja competitiva también se construye aquí. De hecho, a pesar de esta dinámica, nuestra tasa de respuesta positiva ha aumentado 4 veces en los últimos meses y ha creado cientos de millones de dólares en pipeline de ventas para los clientes.

Aborda problemas de alta complejidad

Los problemas complejos son donde se libera el verdadero valor comercial. De lo contrario, fácilmente te encontrarás haciendo solo una capa delgada de envoltura.

Al desglosar cualquier problema comercial lo suficientemente complejo, rápidamente aparece el caos. Aquí hay un ejemplo del ámbito de GTM (Go-To-Market) que suena simple: si una empresa ya es tu cliente, no deberías contactar a un contacto dentro de esa empresa. Pero esto no es nada simple.

Tal vez tu CRM tiene el dominio correspondiente a esa empresa. Entonces, ¿qué pasa con esas empresas que tienen docenas de subsidiarias? ¿Y si el registro del CRM es el dominio de la empresa matriz? ¿Y si un campo de coincidencia desactualizado en Salesforce hace que envíes un correo de ventas en frío al Chief Revenue Officer de un cliente existente? Los datos del mundo real son desordenados. A los humanos les cuesta manejarlos, y los modelos no superarán mágicamente este umbral. Para crear orden a partir de este caos, se necesita diseñar agentes especializados en torno a la forma específica del problema, no simplemente apuntar un copiloto genérico al CRM y terminar. De hecho, basándonos en los datos que tenemos, encontramos que nuestra calidad y frescura de datos ya es más alta que la del propio cliente, por lo que, por defecto, nos anclamos en nuestros propios datos.

Las barreras de protección no solo son para evitar que sucedan cosas malas. El cliente paga exactamente por esto

Las barreras de protección están tremendamente subestimadas. Incluso dentro del mismo producto, cada caso de uso necesita sus propias barreras. Para nosotros, las garantías requeridas para un lead de servicios financieros regulado son completamente diferentes a las de un cliente de SaaS mediano. Y estas garantías se transmiten en capas a cómo escribe el agente, a quién puede contactar, a qué datos puede acceder, qué puede decir en una llamada y cómo se registra cada decisión.

Un sistema «único para todos» colapsaría ante esta variación. Las barreras de protección deben construirse por caso de uso, configurarse por cliente y auditarse continuamente, y este trabajo recae completamente en la empresa de aplicaciones. Es por eso que necesitamos ingenieros de despliegue en primera línea y estrategas técnicos de implementación para ajustar según los requisitos de cada cliente.

Por ejemplo, trabajamos con una institución Fortune 1000 para realizar llamadas salientes autorizadas por voz a su enorme base de clientes PYME. En los primeros intentos, la tasa de respuesta fue baja. Tuvimos que iterar rápidamente, aprendiendo cómo lograr que este público específico se involucrara dentro de los primeros 10 segundos de la llamada. Los propietarios de PYME se comportan de manera completamente diferente a los compradores B2B grandes o a los consumidores. Ahora, creamos más oportunidades de ventas para ellos en un día de las que todo su equipo de ventas podría generar en un mes en ese segmento.

Tomando los seguros como ejemplo: Consejos prácticos del CEO de FurtherAI

Las ventas son solo un ejemplo. Los seguros son otro ejemplo que ilustra lo mismo desde un ángulo diferente. A continuación, la comprensión de Aman Gour, CEO de FurtherAI, sobre «construir fuera del Camino de Ladrillos Amarillos».

Cuando comenzamos a desplegar IA en las operaciones reales de seguros, escuchamos repetidamente una suposición: el modelo es la inteligencia, el flujo de trabajo es solo el andamiaje construido alrededor del modelo.

Pero cuantas más aseguradoras colaboramos, más nos convencimos de que es exactamente lo contrario.

En la industria de seguros, mucha inteligencia reside en el propio flujo de trabajo. Dos aseguradoras pueden hacer que una presentación siga un camino que parece idéntico: presentación, revisión, cotización, suscripción. El camino en sí es fácil. Lo que realmente distingue a dos aseguradoras es todo lo que hay dentro del camino: qué riesgos necesitan escalarse, qué señales de pérdida son importantes, cuál regla de preferencia de suscripción tiene prioridad cuando dos entran en conflicto, cuándo debe firmar un humano, qué datos externos deben recuperarse y cómo se registra la decisión final.

Esta lógica no existe en un motor de reglas limpio. Está dispersa en procedimientos operativos estándar, revisiones de gerentes, filosofías de suscripción, preferencias de riesgo específicas de la aseguradora y años de experiencia operativa. Mucho de esto no está escrito de una forma que el modelo pueda leer directamente.

Es por eso que no creemos en el agente puro que razona desde cero cada vez, ni en el flujo de trabajo rígido que se rompe ante la complejidad del mundo real. En cambio, hemos estado construyendo flujos de trabajo de agentes. El flujo de trabajo aporta repetibilidad, auditabilidad y control de costos; el agente maneja la variabilidad y recupera el proceso cuando se interrumpe la ruta ideal; los humanos permanecen en el circuito donde hay juicio y responsabilidad involucrados.

El primer día, este sistema automatiza el trabajo manual. Pero con el tiempo, cada escalada se convierte en una señal, cada excepción es una retroalimentación, cada corrección humana te dice dónde está incompleto el manual operativo original. Con el tiempo, el flujo de trabajo deja de ser solo un script y se convierte en la memoria operativa de la aseguradora.

Esto es precisamente la parte difícil de alcanzar para los laboratorios de modelos grandes. Continuarán lanzando mejores modelos y mejores agentes genéricos, y deberían hacerlo. Pero no se quedarán a largo plazo en el flujo de trabajo de producción de una aseguradora para aprender por qué se escaló una cuenta, por qué se rechazó un riesgo, o por qué un suscriptor anuló la guía de preferencia de riesgo y resultó tener razón.

Esta comprensión solo puede provenir de ejecutar el mismo flujo de trabajo miles y miles de veces en un entorno de producción. El flujo de trabajo que entregas el primer día no es la ventaja competitiva. El ciclo que se forma con el uso en producción a lo largo del tiempo es la ventaja competitiva.

Para nosotros, esto es lo que significa «construir fuera del Camino de Ladrillos Amarillos».

Cómo determinar si estás en el resto de la tierra de Oz o aún en el Camino de Ladrillos Amarillos

Prueba de herramientas y pasos

¿Cuántos pasos requiere este trabajo? ¿Qué tan complejas son las herramientas que necesitas construir para soportarlo?

Compara una búsqueda de IA horizontal en Google Drive: es una operación de un paso sobre una herramienta, y la tolerancia al error en los resultados es alta. El usuario lee el resumen, si está mal, pregunta de nuevo.

Ahora mira una tarea de múltiples pasos para modificar líneas rojas legales basada en precedentes de los últimos tres años de un bufete de abogados: puede involucrar docenas de pasos, múltiples herramientas, la salida debe pasar la revisión de un socio, e incluso puede necesitar defenderse en un tribunal. Ambos pueden parecer «un agente haciendo algo», pero solo este último requiere ese software profundo construido por un equipo enfocado durante años.

Prueba del sistema

¿Estás construyendo un sistema que el cliente usa para ejecutar el trabajo, o estás agregando una herramienta sobre el sistema existente del cliente?

Un sistema posee el flujo de trabajo de extremo a extremo: captura de datos, gobernanza, registro del trabajo completado. El cliente señala este sistema al describir cómo ocurre realmente el trabajo. Una herramienta simplemente agrega una capa de inteligencia al flujo de trabajo que el cliente ya está ejecutando.

Los productos tipo herramienta también pueden generar ingresos reales, pero los laboratorios de modelos grandes pueden quitárselos más fácilmente, porque el cliente no depende de ti como capa de orquestación. Un ACV (valor de contrato anual) alto suele ser una señal de producto tipo sistema, porque el sistema reemplaza mano de obra real y, por lo tanto, obtiene el pago correspondiente. Pero esto no es una garantía absoluta. Debes preguntarte: Si un laboratorio de modelos grandes lanza un producto que parece competir directamente contigo, ¿el cliente aún necesitaría tu herramienta? Si la respuesta es sí, estás construyendo un sistema. Si la respuesta es no, eres una herramienta, incluso si tu ACV es alto.

Prueba del fondo de cobertura / estado de resultados

El desempeño de los laboratorios de modelos grandes se juzga por puntos de referencia (benchmarks); el desempeño de las empresas en el resto de la tierra de Oz se juzga por el estado de resultados del cliente.

Al cliente no le importa cuántos puntos obtuvo tu modelo en SWE-Bench o MMLU. Les importa: ¿tu agente cerró el trato, modificó correctamente las líneas rojas del contrato, suscribió la póliza correcta? Si el cliente se enfoca en resultados específicos del flujo de trabajo, no en puntajes de capacidad genérica, estás en el resto de la tierra de Oz. Si el cliente paga por capacidad genérica, entonces estás vendiendo algo que podrían obtener con un asiento de Claude o Codex.

Las mejores empresas de agentes necesitan ejecutar como un fondo de cobertura: ganan por el alfa, y el alfa se mide en el estado de resultados del cliente, no en los puntajes de los puntos de referencia.

Ambos pueden ganar, y lo harán

Veremos grandes ganadores tanto en el Camino de Ladrillos Amarillos como fuera de él. Los modelos seguirán ganando, porque poseen el modelo y también tienen la capacidad de distribución diseñada para herramientas horizontales.

El resto de la tierra de Oz también puede ganar, siempre que posean el sistema de trabajo: es decir, la interfaz donde la empresa realmente ejecuta el trabajo y los datos que fluyen y se capturan a través de ella. Estas empresas poseen la captura de datos, el sistema de acciones del flujo de trabajo y la gobernanza. A medida que los flujos de trabajo complejos en un dominio vertical maduran, se combinan en una experiencia central de la que el cliente no puede prescindir. A medida que los actores existentes y los nuevos participantes lanzan continuamente nuevas generaciones de modelos, esta empresa se convierte en la capa que integra y entrega esos modelos al cliente. El modelo subyacente es reemplazable, pero el sistema de trabajo no lo es.

El próximo software empresarial se construirá fuera del Camino de Ladrillos Amarillos.

Preguntas relacionadas

Q¿Cómo distingue a16z entre las oportunidades en la capa de aplicaciones de IA, utilizando la metáfora de ‘El Mago de Oz’?

Aa16z utiliza la metáfora del 'Camino de Baldosas Amarillas' para referirse a las áreas en las que las grandes empresas de modelos (como OpenAI y Anthropic) están entrando directamente, como la generación de código, escritura o imágenes. En contraste, 'el resto de Oz' representa las oportunidades verticales y complejas, profundamente integradas en flujos de trabajo específicos de la industria, que dependen de la gestión de datos, cumplimiento normativo e integración de sistemas, y donde las startups tienen una ventaja real.

QSegún el artículo, ¿por qué las empresas en 'el resto de Oz' pueden defenderse a largo plazo de las grandes compañías de modelos?

ALas empresas en 'el resto de Oz' pueden defenderse a largo plazo gracias a cuatro factores principales: 1) La creación de volantes de aprendizaje basados en datos y conocimientos tácitos de la industria no disponibles en conjuntos de entrenamiento públicos. 2) La gestión de la volatilidad y complejidad de los modelos, incluyendo el enrutamiento entre proveedores y la absorción de costes de migración para el cliente. 3) La optimización de costes mediante el uso de modelos de diferentes capacidades y costes para sub-tareas específicas. 4) La provisión de gobernanza, cumplimiento normativo y un plano de control auditado para casos de uso verticales específicos.

Q¿Qué es la 'prueba del sistema' que propone el artículo para evaluar si una empresa de IA está en 'el resto de Oz'?

ALa 'prueba del sistema' pregunta: ¿Estás construyendo un sistema que el cliente utiliza para ejecutar su trabajo, o solo añades una herramienta sobre un sistema existente del cliente? Un sistema posee el flujo de trabajo de extremo a extremo: captura de datos, gobernanza y registro del trabajo completado. Si el cliente puede describir cómo se realiza realmente el trabajo señalando tu sistema, estás en 'el resto de Oz'. Una herramienta solo añade una capa de inteligencia a un flujo que el cliente ya tiene, lo que la hace más vulnerable a ser absorbida por las grandes compañías de modelos.

Q¿Cómo ejemplifica el caso de FurtherAI en el sector de seguros la idea de construir 'fuera del Camino de Baldosas Amarillas'?

AFurtherAI en el sector de seguros ejemplifica que la inteligencia clave reside a menudo en el flujo de trabajo mismo (procesos, preferencias de suscripción, conocimiento operativo tácito), no solo en el modelo. En lugar de agentes puros o flujos de trabajo rígidos, construyen 'flujos de trabajo de agentes' que combinan repetibilidad, manejo de variabilidad y supervisión humana. Con el tiempo, este sistema se convierte en la 'memoria operativa' de la aseguradora, aprendiendo de cada excepción y corrección. Este conocimiento profundo, acumulado tras ejecutar el mismo flujo miles de veces en producción, es una ventaja que los laboratorios de modelos genéricos no pueden replicar fácilmente.

QSegún el artículo, ¿cuál es la diferencia fundamental en cómo se mide el éxito entre las empresas de modelos y las empresas de aplicaciones en 'el resto de Oz'?

AEl éxito de las grandes empresas de modelos se mide mediante puntos de referencia (benchmarks) en pruebas estándar como SWE-Bench o MMLU. En cambio, el éxito de las empresas en 'el resto de Oz' se mide directamente en la cuenta de resultados (P&L) de sus clientes. Los clientes no pagan por una puntuación de benchmark, sino por resultados comerciales concretos: si el agente cerró ventas, redactó correctamente un contrato o suscribió la póliza adecuada. Estas empresas deben ejecutar como un 'fondo de cobertura', ganando por el 'alfa' que generan en los resultados empresariales del cliente.

Lecturas Relacionadas

OpenAI y Anthropic podrían estar diciendo las cosas equivocadas

En el último año, los sistemas multi-agente (MAS) se han convertido en una de las direcciones más populares en IA. Este artículo argumenta que el enfoque actual liderado por OpenAI y Anthropic, centrado en múltiples agentes de IA colaborando en un flujo de trabajo centralizado para tareas complejas (lo que llama "Harness MAS"), es solo un camino. Este sistema se asemeja más a un motor de orquestación de LLM, donde los agentes actúan como funciones o herramientas temporales sin identidad propia duradera. El autor propone una segunda ruta fundamentalmente diferente: el "Protocol-Native Agent System". Aquí, el núcleo no son agentes para tareas, sino "Agentes Personales" o "compañías autónomas" que pertenecen y representan permanentemente a individuos. Estos agentes tendrían identidad persistente, memoria a largo plazo, preferencias, recursos y soberanía sobre decisiones e intereses. Este cambio transforma la filosofía del sistema: de un problema de ingeniería de software a la creación de una "sociedad digital". La coordinación ya no dependería de prompts o contextos compartidos, sino de protocolos que gestionen identidad, confianza, permisos, incentivos y contratos entre entidades autónomas. El reto futuro no será la capacidad de razonamiento de los agentes, sino cómo logran una interpretación coordinada del mundo y una colaboración a largo plazo con objetivos e intereses diversos. Incluso las "empresas" del futuro podrían ser alianzas dinámicas de estos Agentes Personales unidos por protocolos.

marsbitHace 21 min(s)

OpenAI y Anthropic podrían estar diciendo las cosas equivocadas

marsbitHace 21 min(s)

Oro, dinero fiat, Bitcoin: ¿Quién dominará las finanzas globales en 10 años?

La autora, escribiendo desde una perspectiva futura en 2026, explora el retorno a un mundo multipolar y su impacto en el sistema monetario global. Argumenta que la era unipolar dominada por el dólar estadounidense, una anomalía histórica, está llegando a su fin debido a sus desequilibrios internos (como el dilema de Triffin) y a la resistencia de otras naciones a la dependencia excesiva. Frente a esto, prevé tres vías para la próxima década hasta 2036: 1. **Oro:** Sigue siendo un refugio de valor clave por su escasez, liquidez e inmunidad frente a la devaluación o confiscación unilateral, aunque su velocidad de transacción es limitada. 2. **Diversificación en monedas fiduciarias:** Una solución práctica pero imperfecta, que implica distribuir reservas entre varias divisas principales para diversificar riesgos, aunque carece de los fuertes efectos de red de una moneda dominante. 3. **Bitcoin:** Presentado como un libro mayor descentralizado, rápido y global. Su potencial es enorme, pero enfrenta desafíos críticos: demostrar su seguridad a largo plazo, superar su volatilidad durante una fase de adopción que podría durar décadas y, sobre todo, construir efectos de red masivos. El éxito de Bitcoin, concluye, no depende principalmente de gobiernos o tecnología rival, sino de la voluntad humana. Para que sea dominante en 2036, millones de personas deben valorar activamente la soberanía financiera, los pagos sin permiso y la privacidad que ofrece, y optar por adoptar estas herramientas frente a posibles fricciones. La pregunta central es si la sociedad estará preparada para elegir y defender este nuevo paradigma.

marsbitHace 57 min(s)

Oro, dinero fiat, Bitcoin: ¿Quién dominará las finanzas globales en 10 años?

marsbitHace 57 min(s)

El consumo toca fondo, la correlación macroeconómica colapsa: ¿Hasta dónde llegará la fiesta en solitario de Wall Street?

El mercado de valores de EE. UU. muestra una división inusual: mientras la confianza del consumidor toca mínimos históricos y se rompen las correlaciones macroeconómicas tradicionales, los principales índices, impulsados por la IA y los semiconductores, marcan máximos récord. La atención se centra ahora en cuánto tiempo puede sostenerse este repunte altamente concentrado ante posibles impactos del petróleo, las tasas de interés y posiciones sobresaturadas. El impulso actual proviene del sector de semiconductores, especialmente los chips de memoria, con una rotación de capital desde líderes como Nvidia hacia activos de mayor elasticidad. Sin embargo, advierten expertos de Goldman Sachs, el S&P 500 refleja una realidad distorsionada: sus correlaciones con tipos de interés, oro, VIX y petróleo se desvían extremadamente de sus medias históricas, lo que sugiere una menor estabilidad del modelo de mercado. Aunque los datos económicos siguen siendo sólidos y el comportamiento del consumidor no se ha deteriorado al mismo ritmo que su pesimismo, la estructura del mercado se vuelve más frágil. El entorno de Gamma negativo y la saturación de posiciones en factores de momentum y semiconductores aumentan la sensibilidad a un cambio de sentimiento. El futuro de este "auge en solitario" del mercado estadounidense depende de tres factores clave: la evolución del precio del petróleo y la geopolítica, la sostenibilidad de las posiciones masivas en semiconductores y el momento en que las correlaciones macro distorsionadas vuelvan a la normalidad, lo que podría desencadenar una repreciación abrupta.

marsbitHace 58 min(s)

El consumo toca fondo, la correlación macroeconómica colapsa: ¿Hasta dónde llegará la fiesta en solitario de Wall Street?

marsbitHace 58 min(s)

¿El Bitcoin, tras perder los 75.000 USD, afrontará su última caída?

**Resumen en Español Europeo:** El Bitcoin ha caído por debajo de los 75.000 dólares, situándose cerca de los 74.000 dólares, mientras que el ETH se mantiene alrededor de los 2.000 dólares. Otros criptoactivos destacados como NEAR, WLD y ONDO también han retrocedido. El índice de miedo del mercado ha bajado a 34, indicando temor, y en las últimas 24 horas se han liquidado 470 millones de dólares en contratos de futuros, principalmente posiciones largas. Factores clave que influyen en el mercado: 1. **Geopolítica:** Las tensiones entre EE.UU. e Irán, con nuevos ataques reportados cerca del estrecho de Ormuz, están aumentando la aversión al riesgo a nivel global. En este contexto, el Bitcoin ha actuado más como un activo de riesgo que como refugio, enfrentando presiones de venta. 2. **ETF:** Los fondos ETF estadounidenses de Bitcoin y Ethereum han registrado salidas netas de capital significativas durante mayo, lo que sugiere que los inversores institucionales están tomando ganancias tras la fuerte subida anterior. Esto ha reducido un importante motor de la demanda. **Perspectivas:** Los analistas señalan que el rango de 75.000-76.000 dólares es un nivel técnico crucial para el BTC. Si se mantiene, podría intentar nuevamente alcanzar los 80.000 dólares; una ruptura a la baja podría llevar el precio hacia la zona de 70.000-72.000 dólares. * **Wintermute** sugiere que el flujo de capital a corto plazo es actualmente negativo. * **BIT** indica que el mercado probablemente se mantendrá en consolidación hasta que los ETF recuperen entradas netas estables. * **glassnode** observa que muchos bitcoins están actualmente en pérdida, una condición típica que suele resolverse con la "rendición" de los vendedores débiles. * **Analista Murphy** apunta que los indicadores de actividad de corto plazo sugieren que el mercado podría estar cerca de un fondo, ya sea final o previo a una última caída, y recomienda una estrategia de cartera diversificada. En resumen, el mercado de criptomonedas enfrenta presión por la toma de ganancias institucional y la incertidumbre geopolítica, encontrándose en una fase de posible consolidación o corrección antes de un próximo movimiento direccional significativo.

marsbitHace 1 hora(s)

¿El Bitcoin, tras perder los 75.000 USD, afrontará su última caída?

marsbitHace 1 hora(s)

Trading

Spot
Futuros

Artículos destacados

Cómo comprar LAYER

¡Bienvenido a HTX.com! Hemos hecho que comprar Solayer (LAYER) sea simple y conveniente. Sigue nuestra guía paso a paso para iniciar tu viaje de criptos.Paso 1: crea tu cuenta HTXUtiliza tu correo electrónico o número de teléfono para registrarte y obtener una cuenta gratuita en HTX. Experimenta un proceso de registro sin complicaciones y desbloquea todas las funciones.Obtener mi cuentaPaso 2: ve a Comprar cripto y elige tu método de pagoTarjeta de crédito/débito: usa tu Visa o Mastercard para comprar Solayer (LAYER) al instante.Saldo: utiliza fondos del saldo de tu cuenta HTX para tradear sin problemas.Terceros: hemos agregado métodos de pago populares como Google Pay y Apple Pay para mejorar la comodidad.P2P: tradear directamente con otros usuarios en HTX.Over-the-Counter (OTC): ofrecemos servicios personalizados y tipos de cambio competitivos para los traders.Paso 3: guarda tu Solayer (LAYER)Después de comprar tu Solayer (LAYER), guárdalo en tu cuenta HTX. Alternativamente, puedes enviarlo a otro lugar mediante transferencia blockchain o utilizarlo para tradear otras criptomonedas.Paso 4: tradear Solayer (LAYER)Tradear fácilmente con Solayer (LAYER) en HTX's mercado spot. Simplemente accede a tu cuenta, selecciona tu par de trading, ejecuta tus trades y monitorea en tiempo real. Ofrecemos una experiencia fácil de usar tanto para principiantes como para traders experimentados.

407 Vistas totalesPublicado en 2025.02.11Actualizado en 2025.03.21

Cómo comprar LAYER

Discusiones

Bienvenido a la comunidad de HTX. Aquí puedes mantenerte informado sobre los últimos desarrollos de la plataforma y acceder a análisis profesionales del mercado. A continuación se presentan las opiniones de los usuarios sobre el precio de LAYER (LAYER).

活动图片