14 de mayo de 2026, Microsoft ya ha comenzado a cancelar las licencias internas de Claude Code para la mayoría de sus empleados. La fecha límite es el 30 de junio, también el último día del año fiscal de Microsoft.
Solo hace 6 meses, Microsoft estaba haciendo exactamente lo contrario: en diciembre de 2025, abrió Claude Code a miles de empleados, incluidos ingenieros, gerentes de producto y diseñadores, animando a todos a remodelar sus flujos de trabajo con el enfoque de "vibe coding". A los empleados les encantaba la herramienta, quizás demasiado.
Pero 6 meses después, Microsoft se retractó.
Casi en la misma semana, Tom Blomfield, socio de Y Combinator (YC), dijo algo diferente en una charla del batch: "Si tu factura de API no te duele, es que no estás quemando suficiente."
En la misma primavera, Silicon Valley estaba dando dos respuestas completamente opuestas al mismo problema: ¿el uso de la IA, en última instancia, es más caro o más barato que una persona?
01 El lugar del fracaso del "vibe coding"
Microsoft no está cancelando el modelo Claude. Los modelos de Anthropic seguirán estando disponibles para los empleados de Microsoft a través de Copilot CLI. Lo que está cancelando es el propio punto de acceso del producto Claude Code.
El departamento más afectado es "Experiences + Devices" (Experiencias y Dispositivos), el equipo de ingeniería detrás de Windows, Microsoft 365, Outlook, Teams y Surface. En un memorándum interno, el Vicepresidente Ejecutivo Rajesh Jha enmarcó esta decisión como una "unificación de la cadena de herramientas" (toolchain unification), pero según fuentes internas de Microsoft citadas por The Verge, es más claro: los empleados generalmente consideraban que Claude Code era mejor que Copilot CLI, y la popularidad de la herramienta de Anthropic dentro de Microsoft incluso hizo que el propio Copilot CLI de Microsoft quedara "marginado".
En otras palabras, Microsoft retira Claude Code no porque no funcione, sino porque funciona demasiado bien.
Esa fecha límite del 30 de junio tampoco es una coincidencia: es el último día del año fiscal de Microsoft. Eliminar una herramienta ampliamente preferida por los empleados, volver al producto propio y ajustar el momento al cierre del año fiscal: todos saben cuánto de esto es un juicio sobre el producto y cuánto es una consideración financiera.
Microsoft no es un caso aislado.
Hace un mes, el Director de Tecnología (CTO) de Uber, Praveen Neppalli Naga, reveló a The Information: El presupuesto anual de la compañía para 2026 en herramientas de programación con IA se agotó en los primeros 4 meses. Uber incluso había creado una tabla de clasificación interna, motivando a los empleados a usar más IA mediante competencias, lo que resultó en un colapso del presupuesto.
Más directo aún fue lo que Bryan Catanzaro, Vicepresidente de Aprendizaje Profundo Aplicado de NVIDIA, dijo en una entrevista con Axios: "Para mi equipo, el costo del poder de cómputo excede con creces el costo de los empleados." Esto proviene de un alto ejecutivo de una empresa de hardware, cuyo producto central es vender poder de cómputo.
Fortune unió estas pistas y tituló su artículo de una manera muy característica: "Los informes de Microsoft exponen el verdadero problema de costos de la IA: usar esto es más caro que tener empleados".
Si solo se lee hasta este punto, la conclusión es simple: el "vibe coding" ha fracasado, la historia de que la IA reemplaza a las personas puede darse por concluida.
Pero esta conclusión es prematura.
02 El modo "Copilot" ya ha "chocado contra el muro"
Para explicar la retirada de Microsoft, primero hay que aclarar qué es el "vibe coding".
Este término fue propuesto por Andrej Karpathy a principios de 2025. Describió una nueva forma de programación: los desarrolladores ya no escriben código línea por línea, sino que describen su intención en lenguaje natural para que un LLM genere el código. Los desarrolladores ni siquiera leen el código, solo observan los resultados: si funciona, lo aceptan; si no, le piden a la IA que lo modifique de nuevo.
Esta es la promesa de productividad más seductora de la era de la IA. Significa: un ingeniero que no sabe Rust puede hacer que la IA lo escriba por él; un gerente de producto puede hacer que la IA cree un prototipo; un diseñador puede hacer que la IA genere código ejecutable. El grupo al que Microsoft abrió Claude Code en diciembre de 2025 - ingenieros, PMs, diseñadores - coincide precisamente con estos tres tipos de roles. Esto no es una coincidencia, es la postura clásica de implementación del "vibe coding".
Pero cuando el "vibe coding" llega a una gran empresa, se convierte en algo estructuralmente incómodo.
Supongamos que Microsoft tiene un ingeniero con un salario anual de 300,000 dólares. Después de equiparlo con Claude Code, su productividad aumenta un 20%: este es el estado ideal del "vibe coding". Pero al mismo tiempo, ¿cuál es el costo mensual en tokens que quema? ¿200 dólares, 500 dólares o 2000 dólares? Esta cifra aumentará monótonamente a medida que su dependencia de la IA se profundice.
Lo más problemático es que no lo despedirán por "usar IA" - su salario de 300,000 sigue intacto, sus beneficios también, su puesto de trabajo sigue allí.
Es decir, la estructura total de costos de Microsoft se convierte en "salario original del empleado + factura adicional de tokens". Esta fórmula solo tiene una dirección: costos disparados.
¿Y ese "+20% de productividad del empleado" se refleja financieramente como "+20% de ingresos"? No. Es "los ingresos se mantienen constantes, pero la estructura de costos tiene un nuevo elemento: la factura de IA". Porque la productividad de la mayoría de los empleados no se traduce directamente en nuevos ingresos; escribir más rápido no significa que la empresa venda más.
Este es el verdadero significado de la frase de Catanzaro, "el poder de cómputo es más caro que los empleados". No es que la IA sea tonta; es que cuando equipas a los empleados existentes con IA, la ecuación financiera simplemente no cuadra.
Esta lógica también tiene respaldo de datos.
En una predicción reciente de Gartner se dice: para 2030, el costo de inferencia de los modelos grandes con un billón de parámetros caerá casi un 90% en comparación con 2025. Suena como si la IA fuera cada vez más barata, pero la verdadera conclusión de Gartner es: esto no hará que la factura total de IA de las empresas sea más barata. Will Sommer, Director Analista Senior de Gartner, dijo una cosa: "Los Directores de Producto (CPO) no deben confundir 'la deflación de los tokens commodity' con 'la democratización de las capacidades de inferencia de vanguardia'".
La predicción de Goldman Sachs es más directa: para 2030, la IA "agentic" impulsará un crecimiento de 24 veces en el consumo de tokens, alcanzando los 120 cuatrillones mensuales. El precio por token cae un 90%, el consumo crece 24 veces: el resultado es que la factura total sigue aumentando.
Jensen Huang, CEO de NVIDIA, tiene una versión más radical. Hace unos meses dijo en público que en el futuro, cada empleado de NVIDIA tendría 100 agentes de IA trabajando junto a él.
Suena hermoso. Pero si eres el Director Financiero (CFO), ¿qué escuchas? Escuchas 100 hornos de tokens, quemando sin parar las 24 horas del día.
El problema no es que la IA sea demasiado cara. El problema es el supuesto mismo de "dar a cada empleado un copiloto de IA".
Esta postura tiene un nombre popular en la industria tecnológica: "modo copiloto" (copilot mode). Su premisa central es: la persona sigue en el asiento del conductor, la IA en el asiento del copiloto dando sugerencias. No te reemplaza, solo te hace más rápido.
Este supuesto es muy amable a nivel retórico: "la IA no te quitará tu trabajo, la IA solo te ayuda". Pero a nivel financiero, su implicación es: todos los salarios originales permanecen igual, pero se agrega un costo adicional de tokens.
Y los tokens no son un costo fijo; se facturan por consumo. Cuanto más usen los empleados, más paga la empresa. Esta es exactamente la estructura de costos que las empresas menos desean ver: variable, sin límite superior, amplificándose de manera inversa a la productividad.
Cuando Microsoft abrió Claude Code en diciembre de 2025, puede que no se diera cuenta completamente de esto. Quizás solo pensó: dejar que los empleados lo prueben, ver cuánto puede mejorar la IA la eficiencia laboral. Pero 6 meses después, los empleados realmente se volvieron adictos, Claude Code se hizo demasiado popular dentro de Microsoft, y el resultado fue que la factura de tokens superó con creces las expectativas, excediendo la productividad adicional que Microsoft podía recuperar de esa popularidad.
Microsoft se retiró. Pero no se retiró de la IA; se retiró de la estructura de "el empleado sigue en el asiento del conductor, la IA en el asiento del copiloto".
Este es un fracaso estructural. No desaparecerá porque los modelos sean más baratos, ni porque los empleados sean más hábiles; empeorará a medida que los empleados se vuelvan más hábiles con la IA.
03 Quemar tokens, porque no se queman "cabezas" (empleados)
Casi en la misma semana que la retirada de Microsoft, Tom Blomfield propuso una perspectiva completamente diferente en la charla del batch de YC. No discutió "cómo debe usarse la IA"; discutió "cómo debería ser una empresa en la era de la IA".
El juicio de Blomfield es directo: la mayoría de las empresas hoy siguen teniendo una estructura de "legión romana": la información fluye hacia arriba nivel por nivel, los comandos se distribuyen hacia abajo nivel por nivel, y la persona es el núcleo de la coordinación. Agregar IA a esta estructura es como dar armas de fuego a la infantería romana: las usarán con más fuerza, pero la táctica no cambiará.
Una verdadera empresa nativa de la IA (AI-native) debería tener otra forma.
Blomfield usó una descripción muy concreta: cada acción debería producir un resultado registrable y utilizable, haciendo todo legible para la IA (legible to AI); la empresa debería estar diseñada como un "ciclo de IA de auto-mejora", donde el sistema pueda percibir el entorno, tomar decisiones, usar herramientas, recibir retroalimentación y autocorregirse.
En este tipo de empresa, las personas solo tienen dos roles. Primero, contribuidores individuales (IC): cada persona, sin importar el departamento, es creador (builder) y operador (operator), lleva prototipos a las reuniones, no solo ideas. Segundo, Responsables Directos (DRI, Directly Responsible Individual): cada resultado tiene un responsable claro, "no puedes esconderte detrás de la IA".
Luego Blomfield dijo esa frase memorable: "Si tu factura de API no te duele, es que no estás quemando suficiente."
Si esta frase apareciera en la oficina del CFO de Microsoft, sería considerada una broma; pero ante una sala llena de fundadores de startups en YC, nadie la encontró descabellada.
¿Por qué?
Diana Hu, otra socia de YC, dio la respuesta a principios de mayo en Startup School. Dijo una frase: "Lo que se maximiza no es el número de personas, es el consumo de tokens". Incluso tenía una versión más clara: "Una persona equipada con herramientas de IA equivale a lo que antes era un gran equipo de ingeniería".
Nota la palabra clave aquí: "equivale". No es "es comparable a", no es "se parece a" - es reemplazo.
En el grupo de primavera 2026 del batch P26 de YC, ya hay varias empresas que están haciendo con 5 o 6 personas lo que antes requería 20 o 30. Su factura de tokens, por supuesto, es alta, pero su factura de personal es extremadamente baja; la ecuación general resulta en ganancias.
Un caso más radical es Block. Esta empresa de tecnología financiera de Jack Dorsey recientemente despidió al 40% de sus empleados. Esto no es "eficiencia de costos" en el sentido tradicional; Block simultáneamente aumentó la inversión interna en herramientas de IA. La nueva estructura es exactamente la descrita por Diana Hu: IC + DRI + agente de IA.
En el contexto de YC, quemar tokens no es un gasto, es un reemplazo. Reemplaza no otros gastos aparte de la IA, sino los salarios de los puestos de trabajo. La ecuación cuadra porque la empresa eliminó simultáneamente aquellos puestos que originalmente habrían requerido salarios.
Esta es la razón fundamental por la que Microsoft y YC ven lo mismo pero dan respuestas opuestas: no están quemando el mismo tipo de tokens. Los tokens de Microsoft son combustible para el copiloto del equipo original; los tokens de YC son reemplazo del conductor original.
04 El verdadero activo está siendo redefinido
En la conversación, Tom Blomfield dijo otra cosa aún más significativa: "Las personas son efímeras; la documentación del contexto es lo importante".
Este es un juicio a nivel contable.
¿Cómo se escribe el balance de una empresa tradicional? En el lado izquierdo están los activos fijos, las cuentas por cobrar, el fondo de comercio, la propiedad intelectual; en el derecho, los pasivos y el patrimonio. Los empleados no están en la columna de activos: los empleados son un costo. Pero cada empresa sabe, en el fondo, que los empleados son en realidad el verdadero activo: las relaciones con los clientes están en la mente del vendedor, la intuición del negocio en la mente del gerente de producto, el know-how técnico en la mente del ingeniero.
La característica de este tipo de "activo" es que se va. Cuando un empleado se marcha, el activo desaparece.
Y lo que Blomfield describe como una empresa nativa de la IA está haciendo algo: extraer todos estos activos que antes solo existían en la mente de las personas, y convertirlos en "activos de contexto" legibles, utilizables e iterables por la IA.
¿Cuál es la forma concreta? Son documentos de requisitos detallados; es documentar el proceso de cada decisión, cada intercambio de correos, cada discusión en Slack; son interfaces MCP abiertas y APIs; es el "artefacto" generado por cada herramienta interna. Todas estas cosas constituyen una nueva capa de activos de una empresa, heredable, que no se evapora cuando los empleados se van.
En este tipo de empresa, las personas se convierten en la "variable": pueden integrarse rápidamente y también pueden irse rápidamente, porque el activo central de la empresa no está en sus mentes, sino en la documentación.
Si esta estructura se sostiene, significa no solo un nuevo modelo organizacional; significa que el balance general de las empresas está siendo reescrito. Una empresa nativa de la IA con 6 personas y una factura de tokens asombrosa puede parecer financieramente insalubre, pero sus verdaderos activos pueden ser más sólidos que los de una empresa tradicional de 60 personas; solo que este tipo de activos, los principios contables actuales aún no han aprendido a calcularlos.
En otras palabras, el "vibe coding" no ha muerto. Simplemente no pertenece a las empresas tradicionales.
El día que Microsoft retiró Claude Code no fue un día de fracaso para la economía de la IA; fue el día en que una postura de encajar la IA en viejas organizaciones fue refutada por sí misma.
Y en esa sala llena de startups de YC, está surgiendo otra postura: son pequeñas, queman tokens, no tienen una "tasa de uso de IA por empleado" en sus tablas de KPI, y su CFO tampoco entra en pánico cuando la factura de tokens se dispara, porque lo que están quemando no es el "copiloto del empleado", sino su "reemplazo".
En los próximos años, todas las empresas medianas que todavía insten a sus empleados a "usar un poco más de IA" chocarán contra el mismo muro que ya chocó Microsoft: la factura de tokens estructuralmente destinada a aumentar.
Pero la verdadera razón del choque no es que la IA sea demasiado cara; es que la organización aún no ha cambiado.
Y la gran mayoría de las empresas, probablemente, no cambiarán en mucho tiempo.









