Haseeb de Dragonfly: Las empresas de mayor crecimiento del futuro podrían estancarse en 149 personas

marsbitPublicado a 2026-06-24Actualizado a 2026-06-24

Resumen

El socio de Dragonfly, Haseeb, analiza cómo las estrategias de precios de empresas de IA como Anthropic actúan como una política fiscal no oficial que distorsiona el mercado laboral. Según un análisis de SemiAnalysis, las suscripciones planas (p.ej., para equipos de menos de 150 usuarios) ofrecen tokens de IA con un coste marginal de casi cero, subsidiando fuertemente a startups y pequeños equipos. En cambio, las grandes empresas (más de 150 usuarios) pagan un modelo "Enterprise" con un margen estimado del 75% sobre el coste por token, lo que equivale a un impuesto elevado sobre la mano de obra de IA. Esta diferencia crea incentivos opuestos: las startups se ven impulsadas a maximizar el uso de IA ("tokenmaxxing") para automatizar agresivamente, ya que la exploración es esencialmente gratuita hasta el límite de suscripción. Las grandes empresas, sin embargo, desincentivan la automatización marginal y experimental debido al alto coste incremental, lo que puede llevarles a retener más empleados humanos. Haseeb argumenta que esto podría no resultar en despidos masivos directos por IA en grandes corporaciones, sino en una pérdida de cuota de mercado frente a startups ágiles y nativas de IA, que operan con costes laborales humanos mucho más bajos. La consecuencia más llamativa es la creación de un "acantilado regulatorio" en 150 empleados, similar a las distorsiones por normativas laborales en países como Francia. Las empresas de alto crecimiento podrían tener un fuerte incentiv...

Autor: Haseeb

Compilación: Jiahuan, ChainCatcher

@SemiAnalysis_ descubrió recientemente un fenómeno increíble en la economía de las suscripciones de programación con IA. Si se utiliza al máximo la capacidad incluida, en realidad pagas entre 20 y 70 veces menos que comprar tokens a través de la API.

Muchos al ver esto dicen: "Dios mío, mira cuánto están subsidiando estas grandes empresas de modelos en tokens, la burbuja seguro que estalla pronto".

Esta reacción es errónea. Las empresas de grandes modelos ofrecen paquetes tan generosos porque, naturalmente, la mayoría de los usuarios rara vez alcanzan el límite máximo. Este producto es como una membresía de gimnasio: hay límites amplios porque la gran mayoría de la gente apenas los utiliza.

Pero le he dado muchas vueltas a esto, y sí hay algo extraño en este asunto.

No sabemos su margen de beneficio real en suscripciones, pero según las estimaciones de SemiAnalysis, con un 20% de utilización promedio, el plan Max 5x de Anthropic apenas alcanza el punto de equilibrio. Un 20% de utilización podría incluso ser elevado, especialmente en organizaciones donde todos (incluidos los no programadores) tienen una suscripción pero solo la usan ocasionalmente. La mayoría de las instituciones que conozco, incluida Dragonfly, reparten generosamente suscripciones a Claude Code y animan a los no programadores a probarlas.

Pero lo que SemiAnalysis no profundizó es que esto es un fenómeno exclusivo de las pequeñas empresas. Las grandes empresas no utilizan este modelo de precios por suscripción.

La razón es la siguiente: cuando superas las 150 personas, te ves obligado a salir del modo de suscripción llamado "Team" (Equipo). Debes cambiar a la versión "Enterprise" (Empresa), cuyo precio es una tarifa base de 20 dólares por usuario, más las tarifas de API calculadas según el uso real de tokens. Las empresas solo pueden pagar linealmente por el costo de los tokens, y SemiAnalysis estima que el margen bruto de los tokens de la API es de aproximadamente el 75%. Este es un aumento de precio enorme que se activa abruptamente al llegar a las 150 personas.

Por lo tanto, si eres una pequeña empresa o una startup (o un usuario individual), tu percepción del gasto en IA está distorsionada. Tu precio de los tokens es realmente muy favorable; es probable que Anthropic mantenga márgenes extremadamente bajos o incluso negativos contigo.

Te preguntarás por qué Microsoft y Uber se preocupan tanto por el gasto en tokens y hablan de "token-mining" (minería de tokens). Ahí está la razón. Su costo estructural por token es mucho mayor que el de las startups y los individuos.

¡Pero a Anthropic no le importa! Para una empresa B2B, extraer el máximo valor de pequeñas empresas o individuos no tiene mucho sentido. Mira empresas como Datadog o Cloudflare: del 80% al 90% de sus ingresos proviene de grandes contratos (ingresos recurrentes anuales superiores a 100.000 dólares). Obtener márgenes cero de la larga cola es simplemente un costo de adquisición de clientes.

Es el clásico pensamiento de ventas B2B.

Pero hay otra forma de ver la misma situación: desde la perspectiva de la política fiscal.

Porque si los tokens están reemplazando la mano de obra, entonces el margen bruto que OpenAI y Anthropic cobran por los tokens es, en efecto, un impuesto sobre la mano de obra de IA.

Ver los precios de los tokens de esta manera conduce a dos consecuencias principales.

El precio de los tokens como política fiscal

Suponiendo que los márgenes del artículo de SemiAnalysis sean correctos: las suscripciones alcanzan el punto de equilibrio, el margen bruto de la API para grandes empresas es del 75%. La primera reacción es llamar a esto un impuesto del 75% sobre la mano de obra de IA para las grandes organizaciones y del 0% para las startups.

El análisis fiscal estándar diría que esto desincentiva el uso interno de mano de obra de IA por parte de las grandes empresas, empujando marginalmente a las empresas a reducir la automatización y retener más mano de obra humana. (Obviamente, también fomenta el uso de modelos más pequeños o de código abierto, pero el efecto neto es que ambos están incentivados. Recuerda, aquí estamos hablando en el margen).

Sin embargo, lo que más impulsa el comportamiento no es la tasa impositiva promedio. En la política fiscal, nunca lo es. Lo que realmente nos importa es la tasa impositiva marginal.

Para una startup con una suscripción de precio fijo, el precio marginal del siguiente token es cero hasta que alcanza el límite. Y un precio marginal de cero es la mayor distorsión posible que puede crear una política.

Para las startups, el modelo de suscripción es básicamente una subvención a la innovación. El incentivo más abrumador es averiguar cómo gastar todo el presupuesto de tokens de la manera más eficiente posible. Esto significa ejecutar bucles de Ralph, llenar pantallas con sesiones de Claude Code, programar enjambres de agentes para que trabajen juntos.

Hasta alcanzar el límite, la exploración es gratuita. Por lo tanto, las startups están esencialmente compitiendo para exprimir hasta la última gota de valor de su suscripción, superando a la competencia en producción. Paradójicamente, cuanto más usan, menor es su precio promedio por token. Cada startup quiere ser la que hace que Anthropic pierda más dinero en su suscripción.

Los incentivos para las grandes empresas son exactamente opuestos. Si superas las 150 plazas, cada token adicional en la exploración se cobra al precio completo con recargo (¡con una tarifa adicional del 75%!), por lo que su castigo aumenta linealmente con cada paso adicional en la frontera.

Las grandes empresas seguirán automatizando las tareas masivas obvias, pero la automatización marginal, experimental y riesgosa nunca se descubrirá porque el costo de descubrirla es demasiado alto. Esta estructura fiscal finalmente los lleva a retener más mano de obra humana, manteniendo su estructura organizativa general intacta.

Esto es exactamente lo contrario de Japón. Debido a la disminución de la población, Japón enfrenta una enorme escasez de mano de obra. Históricamente, esto significaba que Japón buscaba una alta automatización porque el alto costo de la mano de obra incentivaba la automatización. Es por eso que hay robots en restaurantes, fábricas, hoteles y hospitales de Japón.

Pero, curiosamente, las grandes empresas se encuentran en la situación opuesta a la de Japón: si tienen que pagar impuestos extremadamente altos por usar IA, eso en realidad reduce el incentivo para automatizar y fortalece la motivación para retener a los empleados existentes (especialmente si los salarios se estancan durante este período).

Entonces, ¿hacia dónde fluye el reemplazo de la mano de obra en este modelo?

Todo el mundo está mirando a las grandes empresas, esperando que llegue la ola de despidos por IA. Pero con una tasa impositiva del 75%, puede que simplemente no sea rentable reemplazar agresivamente a sus propios empleados con IA; el presupuesto de tokens explotaría.

Pero eso no significa que el reemplazo no ocurrirá; simplemente se manifestará de otra manera.

Cuando las grandes empresas pierden participación de mercado frente a startups nativas de IA con costos laborales totales extremadamente bajos, la caída de sus ingresos y el precio de sus acciones desencadena despidos. Pero esos puestos de trabajo eliminados nunca reaparecerán en las startups ganadoras. El efecto neto de reducción de personal es el mismo; este déficit de empleo simplemente se transfiere a otra parte de la economía con una tasa impositiva más baja.

Esta es también la razón por la que el "AI-washing" (presentar despidos ordinarios como una nueva eficiencia descubierta gracias a la IA) puede no ser un fenómeno pasajero. El AI-washing se refiere a que una empresa atribuye los despidos a la eficiencia de la IA cuando, en realidad, solo está encubriendo una debilidad comercial ordinaria.

Mucha gente piensa que esto es solo una moda pasajera en el ciclo actual de expectativas sobre la IA. Pero, aunque todos estén preparados para ver a las grandes empresas realizar despidos reales por IA y "reemplazar puestos" con IA, eso puede que nunca ocurra a gran escala.

El reemplazo de la mano de obra podría desarrollarse de otra manera: las startups derrotan a las grandes empresas, las grandes empresas disimulan su declive con el nombre de la IA hasta que quiebran, y las startups nunca reconstruyen esos viejos puestos de trabajo. El reemplazo de puestos de trabajo todavía ocurre, solo que no donde todos están mirando.

Esta es la primera consecuencia de este modelo. Pero hay una segunda consecuencia aún más extraña.

El acantilado de las 150 personas

Un "notch regulatorio" (punto de quiebre regulatorio) es un límite regulatorio que induce un cambio brusco en el comportamiento. Por ejemplo: el estándar de empleo a tiempo completo de 30 horas por semana generó una gran cantidad de puestos de trabajo de exactamente 29 horas semanales.

Como es bien sabido, Francia tiene regulaciones laborales extremadamente estrictas que entran en vigor una vez que una empresa alcanza los 50 empleados (comité de empresa, participación obligatoria en los beneficios, protección contra despidos), mientras que las pequeñas empresas están exentas. Esto da a los empleadores un gran incentivo para mantener desesperadamente el tamaño por debajo de los 50.

Extraído de: Garicano, Luis, Claire Lelarge, y John Van Reenen, 2016, "Firm Size Distortions and the Productivity Distribution: Evidence from France".

Extendiendo esta analogía a la IA. Las empresas de grandes modelos han establecido un umbral fiscal que castiga a las empresas que superan las 150 plazas. Esto significa que debes mantenerte pequeño para conservar esos maravillosos precios de suscripción subsidiados, que gravan los tokens con aproximadamente un 0% (o incluso negativo) de impuestos, en lugar del 75%.

Esto podría dar lugar a una filosofía de gestión empresarial completamente nueva. Las startups se obsesionarán cada vez más con resolver todo con agentes, con equipos más pequeños, despidos más frecuentes, más subcontratación, haciendo todo lo posible para que los elementos que requieren personas sean lo mínimo indispensable.

Esto no se debe a que sea el grado "óptimo" de automatización, sino porque los incentivos los empujan hacia allí. Si el número mágico es 149, entonces cada plaza es crucial, y no puedes desperdiciar a nadie fuera de los engranajes centrales de la empresa.

Esta discontinuidad podría ser vista por personas como las de Harvard Business School como la "nueva gestión prioritaria de IA". Pero, entendido correctamente, es simplemente una respuesta racional al esquema de precios empresariales.

Esto puede sonar exagerado. Pero ya se pueden ver las diferencias de comportamiento entre organizaciones. Habla con desarrolladores de grandes empresas; están contando tokens con pinzas, cada vez más nerviosos por los recortes presupuestarios de tokens por parte de la gerencia. Mientras tanto, los desarrolladores de startups están "tokenmaxxing" (maximizando el uso de tokens) como locos, iniciando enjambres de agentes durante la noche y revisando los registros por la mañana. Espero que esta tendencia se acelere.

Nadie diseñó esto intencionalmente. Ningún comité decidió subsidiar la innovación para las startups y gravar a las empresas establecidas. Todo esto surge directamente de las probadas y verdaderas estrategias de precios empresariales tradicionales.

Pero así es como siempre ha sido la ley tributaria: un montón de reglas colaterales que finalmente determinan qué empresas se pueden construir y cómo esas empresas se distorsionan para minimizar su carga fiscal.

Podrías argumentar que esto es temporal, que las empresas de grandes modelos eventualmente cobrarán por uso medido a todos. GitHub Copilot ya hizo esa transición. Quizás, o quizás no. Pero antes de que los precios vuelvan a la normalidad, las empresas de 149 personas y esta nueva gestión prioritaria de IA podrían haber estallado, absorbido una gran participación de mercado y escrito el guión para la próxima generación de startups.

La política fiscal importa. El concepto de "economía gig" (trabajos ocasionales) existe precisamente debido al límite legal entre el empleado W-2 y el contratista independiente 1099. A medida que más y más mano de obra sea consumida por la IA, la fijación de precios de los tokens podría convertirse en la política fiscal más influyente de la próxima década. Sin embargo, nunca nadie votará al respecto.

(No te sorprendas si las empresas de mayor crecimiento en el próximo ciclo están visiblemente estancadas en 149 plazas).

Preguntas relacionadas

Q¿Por qué el modelo de suscripción de las empresas de IA como Anthropic genera una distorsión en los costos para las pequeñas empresas frente a las grandes corporaciones?

AEl modelo de suscripción ofrece precios fijos con límites generosos para pequeñas empresas y startups, permitiendo un costo marginal cercano a cero hasta alcanzar el límite. Esto actúa como un subsidio para la innovación. En cambio, las empresas con más de 150 empleados deben cambiar al plan 'Enterprise', que cobra por token con un margen estimado del 75%, lo que eleva significativamente el costo marginal y desincentiva la experimentación con IA.

Q¿Qué paralelismo establece el autor entre la política fiscal y la fijación de precios de tokens de IA?

AEl autor compara la fijación de precios de tokens con una política fiscal: las grandes empresas pagan un 'impuesto' alto (75% de margen) por usar IA, lo que desalienta la automatización marginal, mientras que las startups disfrutan de un 'subsidio' (costo marginal cercano a cero) que incentiva la adopción agresiva y la innovación. Esta diferencia crea una distorsión similar a la de un sistema tributario que grava más a las organizaciones grandes.

Q¿Cómo afecta el 'umbral de 150 empleados' al comportamiento de las empresas según el artículo?

AEl límite de 150 empleados actúa como un 'punto de quiebre regulatorio' (notch). Las empresas tienen un fuerte incentivo para mantenerse por debajo de este número para conservar los planes de suscripción subsidiados. Esto podría impulsar una filosofía de gestión 'AI-first', donde las empresas optimizan al máximo el uso de agentes de IA y minimizan la contratación humana para evitar superar el umbral y enfrentar costos mucho más altos.

QSegún el análisis, ¿por qué es posible que las grandes corporaciones no lleven a cabo despidos masivos directamente relacionados con la IA?

ADebido al alto 'impuesto' (costo marginal) sobre los tokens de IA que pagan las grandes empresas, puede no ser rentable reemplazar agresivamente a los empleados humanos con IA. En su lugar, la sustitución de mano de obra podría ocurrir indirectamente: las startups, con costos de IA subsidiados, pueden ganar cuota de mercado y hacer que las grandes empresas reduzcan personal por pérdida de competitividad, no por una automatización directa. Esto explica fenómenos como el 'AI-washing', donde se atribuyen despidos a la IA para encubrir problemas comerciales.

Q¿Qué analogía utiliza el autor con la economía gig y por qué es relevante para el futuro del trabajo con la IA?

AEl autor compara la situación con la economía gig, que surgió de la distinción legal entre empleados (W-2) y contratistas independientes (1099). De manera similar, la fijación de precios de tokens de IA podría convertirse en la 'política fiscal' más influyente de la próxima década, moldeando cómo las empresas estructuran su fuerza laboral y adoptan la automatización, sin que esta política sea decidida por votación, sino por las estrategias de precios de las empresas de IA.

Lecturas Relacionadas

JD.com y Mira Murati, ex CTO de Open AI, apuestan por la misma pista de IA

Imagina que una persona mayor que vive sola se cae en casa y no puede pedir ayuda. Su dispositivo inteligente o una cámara, impulsado por IA, detecta la situación de forma autónoma y alerta a emergencias. Este no es un escenario futurista, sino el tipo de problema que busca resolver **JoyAI-VL-Interaction**, el primer modelo de interacción visiolingüística de código abierto del mundo, presentado por JD.com. En la industria de la IA, la interacción ha estado dominada por un formato de turnos: el usuario pregunta, el modelo responde. JD.com y otros, como Thinking Machines Lab de Mira Murati, identificaron la misma limitación y convergieron en una idea: la IA debe evolucionar de ser un procesador pasivo de información a un **participante activo** que "prediga el siguiente estado físico". JoyAI-VL-Interaction observa el flujo continuo de video de una cámara y decide *autónomamente* cuándo responder, cuándo guardar silencio y cuándo derivar tareas complejas a otros modelos. Su ventaja clave es colocar al **lenguaje visual como el motor principal** para la toma de decisiones, desacoplándolo del audio. Esto lo hace ideal para aplicaciones como asistencia a personas mayores o con discapacidad visual, comentarios automáticos en eventos deportivos, inspección de almacenes o robots colaborativos, donde los eventos ocurren demasiado rápido para una orden verbal. JD.com ha optado por una estrategia de **cód abierto integral** y un diseño ligero (8B parámetros), que permite ejecutar el modelo incluso con una tarjeta gráfica NVIDIA 3090. El objetivo es democratizar el acceso y acelerar la innovación. Este movimiento refleja la estrategia más amplia de JD.com: utilizar su vasta red de operaciones en el mundo físico (logística, retail, salud) como un campo de entrenamiento y una fuente de datos única para entrenar IAs que comprendan y actúen en entornos reales. Al abrir su modelo, JD.com apuesta a que la **interacción activa y proactiva** se convierta en la principal vía para que la IA entre en el mundo físico.

marsbitHace 13 min(s)

JD.com y Mira Murati, ex CTO de Open AI, apuestan por la misma pista de IA

marsbitHace 13 min(s)

Google comienza a vender TPU, las grandes tecnológicas buscan producir "tokens baratos" con chips de IA

Google ha anunciado la venta directa de sus chips TPU autodiseñados y hardware de computación de IA a centros de datos y clientes externos. Los TPU, o Unidades de Procesamiento de Tensores, son chips especializados en operaciones matemáticas de matrices, fundamentales para los modelos de IA actuales. Al combinar miles de TPU en clústeres, Google logra centros de cómputo de alta eficiencia. Esto permite a servicios como Gemini ofrecer precios más bajos por token, haciéndolo competitivo frente a alternativas como OpenAI y algunos modelos chinos. La estrategia de Google no se centra solo en vender hardware, sino en ofrecer un ecosistema completo similar al de Nvidia con CUDA, apuntando a empresas que buscan controlar su propia infraestructura de cómputo. Aunque Nvidia sigue siendo el estándar dominante en entrenamiento de modelos gracias a su ecosistema consolidado, el enfoque de Google es más atractivo para la inferencia, donde la eficiencia de costos es crucial. La industria está evolucionando hacia tratar la potencia de cómputo como un recurso básico, como la electricidad, donde el precio final por token se vuelve un factor clave de competitividad. En China, proveedores en la nube como Huawei Cloud y Alibaba Cloud están siguiendo un camino similar, desarrollando sus propios ecosistemas de chips (como Ascend y Zhenwu) y soluciones integrales. La competencia ya no se trata solo de tener el chip más potente, sino de quién puede ofrecer el sistema más eficiente y económico para convertir el hardware en productividad. La venta de TPU por parte de Google señala que la batalla por la infraestructura de IA es ahora una guerra de sistemas.

marsbitHace 16 min(s)

Google comienza a vender TPU, las grandes tecnológicas buscan producir "tokens baratos" con chips de IA

marsbitHace 16 min(s)

Interpretación de Informe de Investigación: El Sector Semiconductores Subió un 155%, Bernstein Dice que NVDA y AVGO Siguen "Absurdamente Baratas"

Análisis del informe: El sector de semiconductores subió un 155%, y Bernstein dice que NVDA y AVGO siguen "absurdamente baratas" Bernstein publicó una revisión trimestral del sector el 23 de junio. Su tesis central es que la IA es ahora el "único juego" que impulsa al sector, con fundamentales sólidos, aunque las valoraciones y la concentración de inversión están en máximos históricos. El índice SOX ha subido un 155,6% en el último año, impulsado principalmente por un crecimiento de los beneficios (EPS) del 75%, no por una burbuja de valoración. Bernstein recomienda **NVDA y AVGO** (calificación: "Outperform"), considerándolas los principales beneficiarios de la cadena de suministro de IA. A pesar del fuerte desempeño del sector, estas acciones han tenido un rendimiento relativamente atrasado este año. El analista Stacy Rasgon las describe como "absurdamente baratas", señalando que NVDA cotiza a un P/E de 25x para 2027 frente al 34x del sector, y que AVGO tiene un camino claro hacia los 100.000 millones de dólares en ingresos relacionados con la IA para 2030. **AMD** fue actualizada a "Outperform" debido a su oportunidad dual en GPU para IA y CPU. Por el contrario, **QCOM** mantiene una calificación "Market-Perform" debido a la debilidad persistente en el mercado de smartphones, que presiona su negocio principal. Los fabricantes de equipos semiconductores (como AMAT, LRCX, KLAC) siguen siendo favorecidos ("Outperform") por la fuerte demanda de construcción de capacidad. Sin embargo, Bernstein es cauteloso con los chips analógicos (ADI, TXN, calificación "Market-Perform"), cuyas valoraciones parecen elevadas. El informe advierte sobre dos riesgos clave: 1) La **congestión** del sector está en niveles históricamente altos. 2) Los niveles de **inventario** siguen siendo elevados, lo que podría generar presión si la demanda flaquea. La conclusión es que, en este entorno, la selección de acciones individuales es más crucial que nunca.

marsbitHace 1 hora(s)

Interpretación de Informe de Investigación: El Sector Semiconductores Subió un 155%, Bernstein Dice que NVDA y AVGO Siguen "Absurdamente Baratas"

marsbitHace 1 hora(s)

Entrevista de 10,000 palabras con el CEO de Anthropic: Cuando la IA se convierte en un arma súper potente, ¿cómo encontrar el equilibrio entre negocios y seguridad?

**Fuente:** Bloomberg **Resumen de la entrevista al CEO de Anthropic, Dario Amodei** Dario Amodei, CEO de Anthropic, habla sobre la trayectoria de su empresa en el centro del universo de la IA. Explica que su enfoque en aplicaciones empresariales (como Claude Code y Claude Cowork) se debe a su compatibilidad con sus valores de seguridad y responsabilidad, a diferencia de los modelos de negocio orientados al consumo. Reconoce que la IA podría eliminar muchos trabajos de cuello blanco junior, pero subraya la necesidad de una transición manejada y de que las empresas busquen una "suma positiva" utilizando las ganancias de eficiencia para nuevas tareas. Amodei aborda su salida de OpenAI, citando diferencias en valores y una falta de confianza. Aunque compite con empresas como OpenAI y Google, enfatiza la importancia de la colaboración en seguridad entre actores confiables para elevar los estándares de la industria. En cuanto a la seguridad nacional, justifica el trabajo de Anthropic con el Departamento de Defensa de EE. UU. como una necesidad para contrarrestar amenazas de regímenes autoritarios, pero establece límites claros, como no participar en vigilancia masiva o armas autónomas. También explica la decisión de no lanzar públicamente el potente modelo "Mythos", considerado un "súper arma" cibernética, hasta que existan salvaguardias defensivas más robustas. Finalmente, Amodei discute los riesgos a largo plazo de la IA y la necesidad de un equilibrio de poder entre el sector privado y la regulación gubernamental para gestionar esta tecnología transformadora de manera segura.

marsbitHace 1 hora(s)

Entrevista de 10,000 palabras con el CEO de Anthropic: Cuando la IA se convierte en un arma súper potente, ¿cómo encontrar el equilibrio entre negocios y seguridad?

marsbitHace 1 hora(s)

Trading

Spot
Futuros
活动图片