Autor: Haseeb
Compilación: Jiahuan, ChainCatcher
@SemiAnalysis_ descubrió recientemente un fenómeno increíble en la economía de las suscripciones de programación con IA. Si se utiliza al máximo la capacidad incluida, en realidad pagas entre 20 y 70 veces menos que comprar tokens a través de la API.
Muchos al ver esto dicen: "Dios mío, mira cuánto están subsidiando estas grandes empresas de modelos en tokens, la burbuja seguro que estalla pronto".
Esta reacción es errónea. Las empresas de grandes modelos ofrecen paquetes tan generosos porque, naturalmente, la mayoría de los usuarios rara vez alcanzan el límite máximo. Este producto es como una membresía de gimnasio: hay límites amplios porque la gran mayoría de la gente apenas los utiliza.
Pero le he dado muchas vueltas a esto, y sí hay algo extraño en este asunto.
No sabemos su margen de beneficio real en suscripciones, pero según las estimaciones de SemiAnalysis, con un 20% de utilización promedio, el plan Max 5x de Anthropic apenas alcanza el punto de equilibrio. Un 20% de utilización podría incluso ser elevado, especialmente en organizaciones donde todos (incluidos los no programadores) tienen una suscripción pero solo la usan ocasionalmente. La mayoría de las instituciones que conozco, incluida Dragonfly, reparten generosamente suscripciones a Claude Code y animan a los no programadores a probarlas.
Pero lo que SemiAnalysis no profundizó es que esto es un fenómeno exclusivo de las pequeñas empresas. Las grandes empresas no utilizan este modelo de precios por suscripción.
La razón es la siguiente: cuando superas las 150 personas, te ves obligado a salir del modo de suscripción llamado "Team" (Equipo). Debes cambiar a la versión "Enterprise" (Empresa), cuyo precio es una tarifa base de 20 dólares por usuario, más las tarifas de API calculadas según el uso real de tokens. Las empresas solo pueden pagar linealmente por el costo de los tokens, y SemiAnalysis estima que el margen bruto de los tokens de la API es de aproximadamente el 75%. Este es un aumento de precio enorme que se activa abruptamente al llegar a las 150 personas.
Por lo tanto, si eres una pequeña empresa o una startup (o un usuario individual), tu percepción del gasto en IA está distorsionada. Tu precio de los tokens es realmente muy favorable; es probable que Anthropic mantenga márgenes extremadamente bajos o incluso negativos contigo.
Te preguntarás por qué Microsoft y Uber se preocupan tanto por el gasto en tokens y hablan de "token-mining" (minería de tokens). Ahí está la razón. Su costo estructural por token es mucho mayor que el de las startups y los individuos.
¡Pero a Anthropic no le importa! Para una empresa B2B, extraer el máximo valor de pequeñas empresas o individuos no tiene mucho sentido. Mira empresas como Datadog o Cloudflare: del 80% al 90% de sus ingresos proviene de grandes contratos (ingresos recurrentes anuales superiores a 100.000 dólares). Obtener márgenes cero de la larga cola es simplemente un costo de adquisición de clientes.
Es el clásico pensamiento de ventas B2B.
Pero hay otra forma de ver la misma situación: desde la perspectiva de la política fiscal.
Porque si los tokens están reemplazando la mano de obra, entonces el margen bruto que OpenAI y Anthropic cobran por los tokens es, en efecto, un impuesto sobre la mano de obra de IA.
Ver los precios de los tokens de esta manera conduce a dos consecuencias principales.
El precio de los tokens como política fiscal
Suponiendo que los márgenes del artículo de SemiAnalysis sean correctos: las suscripciones alcanzan el punto de equilibrio, el margen bruto de la API para grandes empresas es del 75%. La primera reacción es llamar a esto un impuesto del 75% sobre la mano de obra de IA para las grandes organizaciones y del 0% para las startups.
El análisis fiscal estándar diría que esto desincentiva el uso interno de mano de obra de IA por parte de las grandes empresas, empujando marginalmente a las empresas a reducir la automatización y retener más mano de obra humana. (Obviamente, también fomenta el uso de modelos más pequeños o de código abierto, pero el efecto neto es que ambos están incentivados. Recuerda, aquí estamos hablando en el margen).
Sin embargo, lo que más impulsa el comportamiento no es la tasa impositiva promedio. En la política fiscal, nunca lo es. Lo que realmente nos importa es la tasa impositiva marginal.
Para una startup con una suscripción de precio fijo, el precio marginal del siguiente token es cero hasta que alcanza el límite. Y un precio marginal de cero es la mayor distorsión posible que puede crear una política.
Para las startups, el modelo de suscripción es básicamente una subvención a la innovación. El incentivo más abrumador es averiguar cómo gastar todo el presupuesto de tokens de la manera más eficiente posible. Esto significa ejecutar bucles de Ralph, llenar pantallas con sesiones de Claude Code, programar enjambres de agentes para que trabajen juntos.
Hasta alcanzar el límite, la exploración es gratuita. Por lo tanto, las startups están esencialmente compitiendo para exprimir hasta la última gota de valor de su suscripción, superando a la competencia en producción. Paradójicamente, cuanto más usan, menor es su precio promedio por token. Cada startup quiere ser la que hace que Anthropic pierda más dinero en su suscripción.
Los incentivos para las grandes empresas son exactamente opuestos. Si superas las 150 plazas, cada token adicional en la exploración se cobra al precio completo con recargo (¡con una tarifa adicional del 75%!), por lo que su castigo aumenta linealmente con cada paso adicional en la frontera.
Las grandes empresas seguirán automatizando las tareas masivas obvias, pero la automatización marginal, experimental y riesgosa nunca se descubrirá porque el costo de descubrirla es demasiado alto. Esta estructura fiscal finalmente los lleva a retener más mano de obra humana, manteniendo su estructura organizativa general intacta.
Esto es exactamente lo contrario de Japón. Debido a la disminución de la población, Japón enfrenta una enorme escasez de mano de obra. Históricamente, esto significaba que Japón buscaba una alta automatización porque el alto costo de la mano de obra incentivaba la automatización. Es por eso que hay robots en restaurantes, fábricas, hoteles y hospitales de Japón.
Pero, curiosamente, las grandes empresas se encuentran en la situación opuesta a la de Japón: si tienen que pagar impuestos extremadamente altos por usar IA, eso en realidad reduce el incentivo para automatizar y fortalece la motivación para retener a los empleados existentes (especialmente si los salarios se estancan durante este período).
Entonces, ¿hacia dónde fluye el reemplazo de la mano de obra en este modelo?
Todo el mundo está mirando a las grandes empresas, esperando que llegue la ola de despidos por IA. Pero con una tasa impositiva del 75%, puede que simplemente no sea rentable reemplazar agresivamente a sus propios empleados con IA; el presupuesto de tokens explotaría.
Pero eso no significa que el reemplazo no ocurrirá; simplemente se manifestará de otra manera.
Cuando las grandes empresas pierden participación de mercado frente a startups nativas de IA con costos laborales totales extremadamente bajos, la caída de sus ingresos y el precio de sus acciones desencadena despidos. Pero esos puestos de trabajo eliminados nunca reaparecerán en las startups ganadoras. El efecto neto de reducción de personal es el mismo; este déficit de empleo simplemente se transfiere a otra parte de la economía con una tasa impositiva más baja.
Esta es también la razón por la que el "AI-washing" (presentar despidos ordinarios como una nueva eficiencia descubierta gracias a la IA) puede no ser un fenómeno pasajero. El AI-washing se refiere a que una empresa atribuye los despidos a la eficiencia de la IA cuando, en realidad, solo está encubriendo una debilidad comercial ordinaria.
Mucha gente piensa que esto es solo una moda pasajera en el ciclo actual de expectativas sobre la IA. Pero, aunque todos estén preparados para ver a las grandes empresas realizar despidos reales por IA y "reemplazar puestos" con IA, eso puede que nunca ocurra a gran escala.
El reemplazo de la mano de obra podría desarrollarse de otra manera: las startups derrotan a las grandes empresas, las grandes empresas disimulan su declive con el nombre de la IA hasta que quiebran, y las startups nunca reconstruyen esos viejos puestos de trabajo. El reemplazo de puestos de trabajo todavía ocurre, solo que no donde todos están mirando.
Esta es la primera consecuencia de este modelo. Pero hay una segunda consecuencia aún más extraña.
El acantilado de las 150 personas
Un "notch regulatorio" (punto de quiebre regulatorio) es un límite regulatorio que induce un cambio brusco en el comportamiento. Por ejemplo: el estándar de empleo a tiempo completo de 30 horas por semana generó una gran cantidad de puestos de trabajo de exactamente 29 horas semanales.
Como es bien sabido, Francia tiene regulaciones laborales extremadamente estrictas que entran en vigor una vez que una empresa alcanza los 50 empleados (comité de empresa, participación obligatoria en los beneficios, protección contra despidos), mientras que las pequeñas empresas están exentas. Esto da a los empleadores un gran incentivo para mantener desesperadamente el tamaño por debajo de los 50.
Extraído de: Garicano, Luis, Claire Lelarge, y John Van Reenen, 2016, "Firm Size Distortions and the Productivity Distribution: Evidence from France".
Extendiendo esta analogía a la IA. Las empresas de grandes modelos han establecido un umbral fiscal que castiga a las empresas que superan las 150 plazas. Esto significa que debes mantenerte pequeño para conservar esos maravillosos precios de suscripción subsidiados, que gravan los tokens con aproximadamente un 0% (o incluso negativo) de impuestos, en lugar del 75%.
Esto podría dar lugar a una filosofía de gestión empresarial completamente nueva. Las startups se obsesionarán cada vez más con resolver todo con agentes, con equipos más pequeños, despidos más frecuentes, más subcontratación, haciendo todo lo posible para que los elementos que requieren personas sean lo mínimo indispensable.
Esto no se debe a que sea el grado "óptimo" de automatización, sino porque los incentivos los empujan hacia allí. Si el número mágico es 149, entonces cada plaza es crucial, y no puedes desperdiciar a nadie fuera de los engranajes centrales de la empresa.
Esta discontinuidad podría ser vista por personas como las de Harvard Business School como la "nueva gestión prioritaria de IA". Pero, entendido correctamente, es simplemente una respuesta racional al esquema de precios empresariales.
Esto puede sonar exagerado. Pero ya se pueden ver las diferencias de comportamiento entre organizaciones. Habla con desarrolladores de grandes empresas; están contando tokens con pinzas, cada vez más nerviosos por los recortes presupuestarios de tokens por parte de la gerencia. Mientras tanto, los desarrolladores de startups están "tokenmaxxing" (maximizando el uso de tokens) como locos, iniciando enjambres de agentes durante la noche y revisando los registros por la mañana. Espero que esta tendencia se acelere.
Nadie diseñó esto intencionalmente. Ningún comité decidió subsidiar la innovación para las startups y gravar a las empresas establecidas. Todo esto surge directamente de las probadas y verdaderas estrategias de precios empresariales tradicionales.
Pero así es como siempre ha sido la ley tributaria: un montón de reglas colaterales que finalmente determinan qué empresas se pueden construir y cómo esas empresas se distorsionan para minimizar su carga fiscal.
Podrías argumentar que esto es temporal, que las empresas de grandes modelos eventualmente cobrarán por uso medido a todos. GitHub Copilot ya hizo esa transición. Quizás, o quizás no. Pero antes de que los precios vuelvan a la normalidad, las empresas de 149 personas y esta nueva gestión prioritaria de IA podrían haber estallado, absorbido una gran participación de mercado y escrito el guión para la próxima generación de startups.
La política fiscal importa. El concepto de "economía gig" (trabajos ocasionales) existe precisamente debido al límite legal entre el empleado W-2 y el contratista independiente 1099. A medida que más y más mano de obra sea consumida por la IA, la fijación de precios de los tokens podría convertirse en la política fiscal más influyente de la próxima década. Sin embargo, nunca nadie votará al respecto.
(No te sorprendas si las empresas de mayor crecimiento en el próximo ciclo están visiblemente estancadas en 149 plazas).









