Microsoft presiona el botón de pausa en la programación "vibe": "Quemar tokens" ya es más caro que los empleados

marsbitPublicado a 2026-05-26Actualizado a 2026-05-26

Resumen

En mayo de 2026, Microsoft comenzó a cancelar la mayoría de las licencias internas de Claude Code para sus empleados, marcando un giro tras solo seis meses de alentar su uso para la "programación por vibes" (vibe coding). La razón principal no fue la falta de eficacia, sino su éxito excesivo: los empleados lo preferían sobre la propia herramienta de Microsoft, Copilot CLI, generando una factura de tokens de IA insostenible. Este caso expone el problema estructural del "modo copiloto": añadir costes variables de IA a costes fijos de salarios sin reemplazar puestos lleva a un aumento neto de costes, como también observaron empresas como Uber y NVIDIA. Mientras tanto, en el ecosistema de startups de Y Combinator, líderes como Tom Blomfield proponen un enfoque opuesto y más radical: construir compañías nativas de IA donde un pequeño equipo, equipado con agentes de IA, reemplace a departamentos enteros. Aquí, una factura elevada de tokens no es un gasto, sino una inversión que sustituye costosos salarios, haciendo viable el modelo. La clave está en rediseñar la organización para que los activos críticos (conocimiento, procesos) residan en documentos y sistemas legibles por IA, no solo en las personas. En resumen, el retroceso de Microsoft no significa el fracaso de la IA en la programación, sino el de intentar implantarla en estructuras organizativas tradicionales sin cambios profundos. El futuro pertenecerá a las empresas que reemplacen roles, no solo que asistan a empleados, t...

14 de mayo de 2026, Microsoft ya ha comenzado a cancelar las licencias internas de Claude Code para la mayoría de sus empleados. La fecha límite es el 30 de junio, también el último día del año fiscal de Microsoft.

Solo hace 6 meses, Microsoft estaba haciendo exactamente lo contrario: en diciembre de 2025, abrió Claude Code a miles de empleados, incluidos ingenieros, gerentes de producto y diseñadores, animando a todos a remodelar sus flujos de trabajo con el enfoque de "vibe coding". A los empleados les encantaba la herramienta, quizás demasiado.

Pero 6 meses después, Microsoft se retractó.

Casi en la misma semana, Tom Blomfield, socio de Y Combinator (YC), dijo algo diferente en una charla del batch: "Si tu factura de API no te duele, es que no estás quemando suficiente."

En la misma primavera, Silicon Valley estaba dando dos respuestas completamente opuestas al mismo problema: ¿el uso de la IA, en última instancia, es más caro o más barato que una persona?

01 El lugar del fracaso del "vibe coding"

Microsoft no está cancelando el modelo Claude. Los modelos de Anthropic seguirán estando disponibles para los empleados de Microsoft a través de Copilot CLI. Lo que está cancelando es el propio punto de acceso del producto Claude Code.

El departamento más afectado es "Experiences + Devices" (Experiencias y Dispositivos), el equipo de ingeniería detrás de Windows, Microsoft 365, Outlook, Teams y Surface. En un memorándum interno, el Vicepresidente Ejecutivo Rajesh Jha enmarcó esta decisión como una "unificación de la cadena de herramientas" (toolchain unification), pero según fuentes internas de Microsoft citadas por The Verge, es más claro: los empleados generalmente consideraban que Claude Code era mejor que Copilot CLI, y la popularidad de la herramienta de Anthropic dentro de Microsoft incluso hizo que el propio Copilot CLI de Microsoft quedara "marginado".

En otras palabras, Microsoft retira Claude Code no porque no funcione, sino porque funciona demasiado bien.

Esa fecha límite del 30 de junio tampoco es una coincidencia: es el último día del año fiscal de Microsoft. Eliminar una herramienta ampliamente preferida por los empleados, volver al producto propio y ajustar el momento al cierre del año fiscal: todos saben cuánto de esto es un juicio sobre el producto y cuánto es una consideración financiera.

Microsoft no es un caso aislado.

Hace un mes, el Director de Tecnología (CTO) de Uber, Praveen Neppalli Naga, reveló a The Information: El presupuesto anual de la compañía para 2026 en herramientas de programación con IA se agotó en los primeros 4 meses. Uber incluso había creado una tabla de clasificación interna, motivando a los empleados a usar más IA mediante competencias, lo que resultó en un colapso del presupuesto.

Más directo aún fue lo que Bryan Catanzaro, Vicepresidente de Aprendizaje Profundo Aplicado de NVIDIA, dijo en una entrevista con Axios: "Para mi equipo, el costo del poder de cómputo excede con creces el costo de los empleados." Esto proviene de un alto ejecutivo de una empresa de hardware, cuyo producto central es vender poder de cómputo.

Fortune unió estas pistas y tituló su artículo de una manera muy característica: "Los informes de Microsoft exponen el verdadero problema de costos de la IA: usar esto es más caro que tener empleados".

Si solo se lee hasta este punto, la conclusión es simple: el "vibe coding" ha fracasado, la historia de que la IA reemplaza a las personas puede darse por concluida.

Pero esta conclusión es prematura.

02 El modo "Copilot" ya ha "chocado contra el muro"

Para explicar la retirada de Microsoft, primero hay que aclarar qué es el "vibe coding".

Este término fue propuesto por Andrej Karpathy a principios de 2025. Describió una nueva forma de programación: los desarrolladores ya no escriben código línea por línea, sino que describen su intención en lenguaje natural para que un LLM genere el código. Los desarrolladores ni siquiera leen el código, solo observan los resultados: si funciona, lo aceptan; si no, le piden a la IA que lo modifique de nuevo.

Esta es la promesa de productividad más seductora de la era de la IA. Significa: un ingeniero que no sabe Rust puede hacer que la IA lo escriba por él; un gerente de producto puede hacer que la IA cree un prototipo; un diseñador puede hacer que la IA genere código ejecutable. El grupo al que Microsoft abrió Claude Code en diciembre de 2025 - ingenieros, PMs, diseñadores - coincide precisamente con estos tres tipos de roles. Esto no es una coincidencia, es la postura clásica de implementación del "vibe coding".

Pero cuando el "vibe coding" llega a una gran empresa, se convierte en algo estructuralmente incómodo.

Supongamos que Microsoft tiene un ingeniero con un salario anual de 300,000 dólares. Después de equiparlo con Claude Code, su productividad aumenta un 20%: este es el estado ideal del "vibe coding". Pero al mismo tiempo, ¿cuál es el costo mensual en tokens que quema? ¿200 dólares, 500 dólares o 2000 dólares? Esta cifra aumentará monótonamente a medida que su dependencia de la IA se profundice.

Lo más problemático es que no lo despedirán por "usar IA" - su salario de 300,000 sigue intacto, sus beneficios también, su puesto de trabajo sigue allí.

Es decir, la estructura total de costos de Microsoft se convierte en "salario original del empleado + factura adicional de tokens". Esta fórmula solo tiene una dirección: costos disparados.

¿Y ese "+20% de productividad del empleado" se refleja financieramente como "+20% de ingresos"? No. Es "los ingresos se mantienen constantes, pero la estructura de costos tiene un nuevo elemento: la factura de IA". Porque la productividad de la mayoría de los empleados no se traduce directamente en nuevos ingresos; escribir más rápido no significa que la empresa venda más.

Este es el verdadero significado de la frase de Catanzaro, "el poder de cómputo es más caro que los empleados". No es que la IA sea tonta; es que cuando equipas a los empleados existentes con IA, la ecuación financiera simplemente no cuadra.

Esta lógica también tiene respaldo de datos.

En una predicción reciente de Gartner se dice: para 2030, el costo de inferencia de los modelos grandes con un billón de parámetros caerá casi un 90% en comparación con 2025. Suena como si la IA fuera cada vez más barata, pero la verdadera conclusión de Gartner es: esto no hará que la factura total de IA de las empresas sea más barata. Will Sommer, Director Analista Senior de Gartner, dijo una cosa: "Los Directores de Producto (CPO) no deben confundir 'la deflación de los tokens commodity' con 'la democratización de las capacidades de inferencia de vanguardia'".

La predicción de Goldman Sachs es más directa: para 2030, la IA "agentic" impulsará un crecimiento de 24 veces en el consumo de tokens, alcanzando los 120 cuatrillones mensuales. El precio por token cae un 90%, el consumo crece 24 veces: el resultado es que la factura total sigue aumentando.

Jensen Huang, CEO de NVIDIA, tiene una versión más radical. Hace unos meses dijo en público que en el futuro, cada empleado de NVIDIA tendría 100 agentes de IA trabajando junto a él.

Suena hermoso. Pero si eres el Director Financiero (CFO), ¿qué escuchas? Escuchas 100 hornos de tokens, quemando sin parar las 24 horas del día.

El problema no es que la IA sea demasiado cara. El problema es el supuesto mismo de "dar a cada empleado un copiloto de IA".

Esta postura tiene un nombre popular en la industria tecnológica: "modo copiloto" (copilot mode). Su premisa central es: la persona sigue en el asiento del conductor, la IA en el asiento del copiloto dando sugerencias. No te reemplaza, solo te hace más rápido.

Este supuesto es muy amable a nivel retórico: "la IA no te quitará tu trabajo, la IA solo te ayuda". Pero a nivel financiero, su implicación es: todos los salarios originales permanecen igual, pero se agrega un costo adicional de tokens.

Y los tokens no son un costo fijo; se facturan por consumo. Cuanto más usen los empleados, más paga la empresa. Esta es exactamente la estructura de costos que las empresas menos desean ver: variable, sin límite superior, amplificándose de manera inversa a la productividad.

Cuando Microsoft abrió Claude Code en diciembre de 2025, puede que no se diera cuenta completamente de esto. Quizás solo pensó: dejar que los empleados lo prueben, ver cuánto puede mejorar la IA la eficiencia laboral. Pero 6 meses después, los empleados realmente se volvieron adictos, Claude Code se hizo demasiado popular dentro de Microsoft, y el resultado fue que la factura de tokens superó con creces las expectativas, excediendo la productividad adicional que Microsoft podía recuperar de esa popularidad.

Microsoft se retiró. Pero no se retiró de la IA; se retiró de la estructura de "el empleado sigue en el asiento del conductor, la IA en el asiento del copiloto".

Este es un fracaso estructural. No desaparecerá porque los modelos sean más baratos, ni porque los empleados sean más hábiles; empeorará a medida que los empleados se vuelvan más hábiles con la IA.

03 Quemar tokens, porque no se queman "cabezas" (empleados)

Casi en la misma semana que la retirada de Microsoft, Tom Blomfield propuso una perspectiva completamente diferente en la charla del batch de YC. No discutió "cómo debe usarse la IA"; discutió "cómo debería ser una empresa en la era de la IA".

El juicio de Blomfield es directo: la mayoría de las empresas hoy siguen teniendo una estructura de "legión romana": la información fluye hacia arriba nivel por nivel, los comandos se distribuyen hacia abajo nivel por nivel, y la persona es el núcleo de la coordinación. Agregar IA a esta estructura es como dar armas de fuego a la infantería romana: las usarán con más fuerza, pero la táctica no cambiará.

Una verdadera empresa nativa de la IA (AI-native) debería tener otra forma.

Blomfield usó una descripción muy concreta: cada acción debería producir un resultado registrable y utilizable, haciendo todo legible para la IA (legible to AI); la empresa debería estar diseñada como un "ciclo de IA de auto-mejora", donde el sistema pueda percibir el entorno, tomar decisiones, usar herramientas, recibir retroalimentación y autocorregirse.

En este tipo de empresa, las personas solo tienen dos roles. Primero, contribuidores individuales (IC): cada persona, sin importar el departamento, es creador (builder) y operador (operator), lleva prototipos a las reuniones, no solo ideas. Segundo, Responsables Directos (DRI, Directly Responsible Individual): cada resultado tiene un responsable claro, "no puedes esconderte detrás de la IA".

Luego Blomfield dijo esa frase memorable: "Si tu factura de API no te duele, es que no estás quemando suficiente."

Si esta frase apareciera en la oficina del CFO de Microsoft, sería considerada una broma; pero ante una sala llena de fundadores de startups en YC, nadie la encontró descabellada.

¿Por qué?

Diana Hu, otra socia de YC, dio la respuesta a principios de mayo en Startup School. Dijo una frase: "Lo que se maximiza no es el número de personas, es el consumo de tokens". Incluso tenía una versión más clara: "Una persona equipada con herramientas de IA equivale a lo que antes era un gran equipo de ingeniería".

Nota la palabra clave aquí: "equivale". No es "es comparable a", no es "se parece a" - es reemplazo.

En el grupo de primavera 2026 del batch P26 de YC, ya hay varias empresas que están haciendo con 5 o 6 personas lo que antes requería 20 o 30. Su factura de tokens, por supuesto, es alta, pero su factura de personal es extremadamente baja; la ecuación general resulta en ganancias.

Un caso más radical es Block. Esta empresa de tecnología financiera de Jack Dorsey recientemente despidió al 40% de sus empleados. Esto no es "eficiencia de costos" en el sentido tradicional; Block simultáneamente aumentó la inversión interna en herramientas de IA. La nueva estructura es exactamente la descrita por Diana Hu: IC + DRI + agente de IA.

En el contexto de YC, quemar tokens no es un gasto, es un reemplazo. Reemplaza no otros gastos aparte de la IA, sino los salarios de los puestos de trabajo. La ecuación cuadra porque la empresa eliminó simultáneamente aquellos puestos que originalmente habrían requerido salarios.

Esta es la razón fundamental por la que Microsoft y YC ven lo mismo pero dan respuestas opuestas: no están quemando el mismo tipo de tokens. Los tokens de Microsoft son combustible para el copiloto del equipo original; los tokens de YC son reemplazo del conductor original.

04 El verdadero activo está siendo redefinido

En la conversación, Tom Blomfield dijo otra cosa aún más significativa: "Las personas son efímeras; la documentación del contexto es lo importante".

Este es un juicio a nivel contable.

¿Cómo se escribe el balance de una empresa tradicional? En el lado izquierdo están los activos fijos, las cuentas por cobrar, el fondo de comercio, la propiedad intelectual; en el derecho, los pasivos y el patrimonio. Los empleados no están en la columna de activos: los empleados son un costo. Pero cada empresa sabe, en el fondo, que los empleados son en realidad el verdadero activo: las relaciones con los clientes están en la mente del vendedor, la intuición del negocio en la mente del gerente de producto, el know-how técnico en la mente del ingeniero.

La característica de este tipo de "activo" es que se va. Cuando un empleado se marcha, el activo desaparece.

Y lo que Blomfield describe como una empresa nativa de la IA está haciendo algo: extraer todos estos activos que antes solo existían en la mente de las personas, y convertirlos en "activos de contexto" legibles, utilizables e iterables por la IA.

¿Cuál es la forma concreta? Son documentos de requisitos detallados; es documentar el proceso de cada decisión, cada intercambio de correos, cada discusión en Slack; son interfaces MCP abiertas y APIs; es el "artefacto" generado por cada herramienta interna. Todas estas cosas constituyen una nueva capa de activos de una empresa, heredable, que no se evapora cuando los empleados se van.

En este tipo de empresa, las personas se convierten en la "variable": pueden integrarse rápidamente y también pueden irse rápidamente, porque el activo central de la empresa no está en sus mentes, sino en la documentación.

Si esta estructura se sostiene, significa no solo un nuevo modelo organizacional; significa que el balance general de las empresas está siendo reescrito. Una empresa nativa de la IA con 6 personas y una factura de tokens asombrosa puede parecer financieramente insalubre, pero sus verdaderos activos pueden ser más sólidos que los de una empresa tradicional de 60 personas; solo que este tipo de activos, los principios contables actuales aún no han aprendido a calcularlos.

En otras palabras, el "vibe coding" no ha muerto. Simplemente no pertenece a las empresas tradicionales.

El día que Microsoft retiró Claude Code no fue un día de fracaso para la economía de la IA; fue el día en que una postura de encajar la IA en viejas organizaciones fue refutada por sí misma.

Y en esa sala llena de startups de YC, está surgiendo otra postura: son pequeñas, queman tokens, no tienen una "tasa de uso de IA por empleado" en sus tablas de KPI, y su CFO tampoco entra en pánico cuando la factura de tokens se dispara, porque lo que están quemando no es el "copiloto del empleado", sino su "reemplazo".

En los próximos años, todas las empresas medianas que todavía insten a sus empleados a "usar un poco más de IA" chocarán contra el mismo muro que ya chocó Microsoft: la factura de tokens estructuralmente destinada a aumentar.

Pero la verdadera razón del choque no es que la IA sea demasiado cara; es que la organización aún no ha cambiado.

Y la gran mayoría de las empresas, probablemente, no cambiarán en mucho tiempo.

Preguntas relacionadas

Q¿Por qué Microsoft está cancelando las licencias internas de Claude Code para la mayoría de sus empleados?

AMicrosoft está cancelando las licencias de Claude Code principalmente por razones financieras y de unificación de herramientas. Aunque los empleados preferían Claude Code por ser más efectivo, su uso masivo generó una factura de tokens mucho más alta de lo esperado, y la empresa busca consolidar su cadena de herramientas en torno a su propio producto, Copilot CLI, antes del cierre del año fiscal.

Q¿Qué es el 'vibe coding' y por qué plantea un problema estructural para las grandes empresas?

AEl 'vibe coding' es un método de programación donde el desarrollador describe su intención en lenguaje natural y un LLM genera el código. El problema para las grandes empresas es que aumenta la productividad de los empleados existentes, pero no sustituye sus salarios, por lo que el coste total de la empresa se convierte en 'salarios originales + nueva factura de tokens', una estructura de costes que solo puede aumentar.

QSegún el artículo, ¿cuál es la principal diferencia entre cómo Microsoft y las startups de YC utilizan y asumen los costes de la IA?

AMicrosoft utiliza la IA en 'modo copiloto', como una herramienta para aumentar la productividad de su plantilla existente, añadiendo el coste de los tokens a su estructura de costes actual. Las startups de YC, en cambio, construyen empresas 'AI-native' donde la IA sustituye a puestos de trabajo. Para ellas, una factura alta de tokens no es un gasto adicional, sino una inversión que reemplaza costosos salarios, haciendo que la ecuación financiera sea viable.

Q¿Qué significa la frase de Tom Blomfield: 'Si tu factura de la API no te duele, es que no estás quemando suficiente'?

AEn el contexto de las startups 'AI-native', esta frase significa que un alto consumo de tokens es una señal de que la IA está realizando un trabajo sustancial que de otro modo requeriría muchos empleados humanos. Para estas empresas, una factura elevada es una métrica deseable, ya que indica que están maximizando el uso de la IA para sustituir costes laborales y escalar sus operaciones con un equipo humano muy reducido.

QSegún la visión 'AI-native' descrita, ¿cómo se está redefiniendo el activo más valioso de una empresa?

AEn una empresa 'AI-native', el activo más valioso ya no reside principalmente en el conocimiento tácito de los empleados, sino en la capa de 'activos de contexto': documentación exhaustiva, registros de decisiones, interfaces MCP, artefactos de herramientas internas y todos los datos que hacen que el conocimiento y los procesos de la empresa sean legibles, accesibles y mejorables por la IA. Esto crea un activo duradero y transferible que no desaparece cuando un empleado se marcha.

Lecturas Relacionadas

NEAR se duplica: 3 grandes tendencias que impulsan su precio

NEAR ha experimentado un notable repunte, duplicando su valor desde principios de mayo de 2026 hasta alcanzar los 2.37 dólares, con una capitalización que supera nuevamente los 30 mil millones. Este desempeño destaca frente a la volatilidad general del mercado y se atribuye a tres impulsores clave. En primer lugar, la narrativa de IA juega un papel crucial. El cofundador Illia Polosukhin, codesarrollador de la arquitectura Transformer, fundamento de modelos como ChatGPT, ha posicionado a NEAR como una infraestructura líder para IA descentralizada. Esto se materializa en la aplicación Near.com, que integra capacidades de IA y agentes autónomos. En segundo lugar, NEAR está evolucionando hacia una cadena de bloques con fuertes capacidades de privacidad. Con el lanzamiento de NEAR Intents para transacciones cross-chain, se han introducido funciones como "Confidential Payments" e "Intents Confidenciales". Estas herramientas, que utilizan entornos de ejecución confiable (TEE), permiten transferencias privadas de activos entre más de 35 cadenas, protegiendo datos del remitente, el monto y la ruta, lo que aborda problemas como los ataques MEV. Finalmente, el modelo económico de NEAR aporta estabilidad. Tras completar sus desbloqueos de tokens, la red implementa un mecanismo de recompra: todos los ingresos por tarifas de protocolo de NEAR Intents (que genera unos 10.000 dólares diarios) se utilizan para recomprar tokens NEAR en el mercado, reduciendo la presión de venta y apoyando el precio. Además, la inflación anual se redujo permanentemente al 2.5%.

链捕手Hace 11 min(s)

NEAR se duplica: 3 grandes tendencias que impulsan su precio

链捕手Hace 11 min(s)

Trading

Spot
Futuros
活动图片