Nota de la redacción: Cuando la IA empieza a escribir código, gestionar incidencias de atención al cliente o revisar documentos legales, surge una cuestión más fundamental: ¿qué compran realmente las empresas: tokens, horas de GPU o trabajo terminado?
Este artículo plantea un marco digno de atención: la comercialización de la IA no debe entenderse solo como un "mercado de capacidad de cómputo" o un "mercado de uso de modelos", sino que está evolucionando hacia un nuevo "mercado de mano de obra maquinal". En este mercado, los tokens son solo una unidad de medida, las GPU son insumos, los modelos son herramientas de producción, y el objeto real de precios y transacciones es el trabajo económico completado directamente por el software.
La tesis central del artículo es que el mecanismo de precios de la IA evolucionará desde los tokens básicos, pasando por capacidades de modelo estandarizadas y mano de obra sectorial, hasta un mercado de resultados programables. Dicho de otro modo, en el futuro las empresas podrían dejar de importarles qué modelo o qué GPU realizó una tarea, sino si entregó el resultado esperado dentro de un margen de latencia, precisión, fiabilidad y coste establecido.
Esto implica que el impacto de la IA en el mercado laboral humano no se limitará necesariamente a una sustitución simple. A medida que las máquinas asuman más trabajo estandarizable y verificable, el papel humano podría desplazarse hacia la supervisión, la asunción de responsabilidades, la gestión del contexto y la toma de decisiones finales. En algunos escenarios, ese 1% final de juicio humano podría ganar aún más valor, porque permite liberar el 99% de la automatización a gran escala.
Desde esta perspectiva, la competencia en la siguiente fase del mercado de la IA quizás ya no sea solo una lucha por la capacidad de los modelos, ni una simple guerra de precios en capacidad de cómputo, sino quién es el primero en estandarizar, verificar y poner precio al "trabajo", convirtiendo finalmente la mano de obra maquinal en un nuevo factor de producción que pueda ser adquirido, liquidado y transaccionado.
A continuación, el texto original:
Las oleadas de productividad del pasado siempre procedían de herramientas y software creados para humanos, destinados a optimizar la forma de completar el trabajo. Las hojas de cálculo ayudaban a contables y analistas, las cintas transportadoras aumentaban el rendimiento, los martillos amplificaban el poder humano. Pero el verdadero trabajo siempre procedía de las personas.
Ahora, la IA está produciendo resultados de trabajo de extremo a extremo, ejecutando directamente el trabajo en sí. Puede escribir código, gestionar incidencias de atención al cliente, revisar documentos legales. El extremo de toda la pila tecnológica se está comprimiendo: la antigua pila tecnológica apoyaba el trabajo; la nueva pila tecnológica comienza a producir trabajo.
Si has oído recientemente discusiones sobre la financiación de la IA, probablemente hayas escuchado a Jensen y otros decir que los tokens de LLM y/o las horas de GPU se están convirtiendo en las nuevas materias primas. Esta intuición es comprensible, porque los tokens son medibles, facturables y fáciles de graficar; detrás de las horas de GPU también fluyen miles de millones de dólares en inversión. Pero los tokens siguen siendo solo un contador, las horas de GPU solo son insumos; nadie los compra por sí mismos. Lo que la gente realmente quiere es que el trabajo se haga. La IA está convirtiendo la propia pila tecnológica en una fuente de mano de obra.
Mano de obra maquinal: trabajo ejecutado por software, con propósito económico, y vendido en el proceso productivo.
El mercado ya se está moviendo en esta dirección. Sarah Tavel, de Benchmark, prefiere entender esta oportunidad a través del mercado de mano de obra externalizada, en lugar de categorías de software. Si una tarea repetible ya era realizada por un equipo especializado en el extranjero o una empresa de servicios profesionales, a menudo también es un trabajo apto para ser entregado por IA. Alex Rampell, de a16z, lo llama "el software devora el trabajo": el próximo acto del software es realizar el trabajo personalmente. Julien Bek, de Sequoia, describe el mismo cambio desde otro ángulo: los servicios se están convirtiendo en software, los copilotos venden herramientas, y los pilotos automáticos venden trabajo.
El mercado ausente detrás de la fijación de precios por resultados
La fijación de precios por licencias cobra por acceso, la fijación por tokens cobra por uso. La fijación por resultados cobra cuando se completa el trabajo. La fijación por resultados nos da un paso adelante, pero aún no responde a una pregunta: ¿quién decide el precio?
Si la mano de obra maquinal puede comprarse directamente, el precio debe surgir de la competencia entre proveedores. Estos proveedores deben poder cumplir con el mismo tipo de tarea o estándar de terminación del trabajo, lo que requiere establecer una estandarización dentro de cada sector y tarea.
La práctica actual es usar tokens de LLM, pero los tokens básicos son solo el nivel más bajo. Un barril de petróleo es solo una unidad de medida; lo que realmente se negocia son barriles de un grado específico, con calidad, términos de entrega y precio de mercado definidos. Un barril de crudo Brent y un barril de crudo pesado con alto contenido de azufre no son el mismo producto. Lo mismo ocurre con los tokens de LLM. Los tokens son solo unidades de medida; lo importante es la inteligencia que hay detrás: calidad del modelo, límite en pruebas de referencia, latencia, ventana de contexto, fiabilidad y garantías de entrega. Un millón de tokens de un modelo de código puntero, y un millón de tokens de un modelo genérico barato, no son el mismo producto. El mercado necesita grados de inferencia estandarizados, igual que el mercado energético necesita grados de petróleo estandarizados.
Anjali Shriva lo señala directamente: un token no es una unidad de coste fija. Su economía varía según la longitud del contexto, la estructura de la tarea, la proporción entrada/salida, el número de reintentos, las llamadas a herramientas y los flujos de trabajo de agentes. Un token en un prompt corto y un token enterrado en un bucle largo de un agente no son el mismo objeto económico.
Ya hacemos esto en el mercado laboral humano. Nadie contrata a un radiólogo como una "hora humana" genérica. Se mira la formación, las certificaciones, la especialización, los años de experiencia, la disponibilidad, la reputación, la asunción de responsabilidades, etc. Diferentes especificaciones en los contratos humanos corresponden a diferentes estándares mínimos y niveles de expectativa.
El mercado laboral humano ya funciona con estas especificaciones, solo que a menudo están mezcladas, son cualitativas y llenas de indicadores proxy. La mano de obra maquinal hará que estas especificaciones sean más explícitas y cuantificables.
Para un LLM o un agente, métricas como habilidad, experiencia, velocidad y fiabilidad pueden escribirse directamente en el contrato: puntuaciones en pruebas de referencia, latencia, rendimiento, ventana de contexto, longitud máxima de salida, precisión en el uso de herramientas, tiempo de actividad, tasa de error. Podemos adquirir mano de obra según expectativas y resultados cuantificables.
La especificación de contrato de TheGrid.ai es esencialmente un filtro de calificación, seguido de una competencia de precios por la salida del LLM. Los proveedores pueden entrar en competencia siempre que cumplan la especificación:
Prueba de referencia de inteligencia ≥ Límite inferior
Latencia ≤ Límite superior
Rendimiento ≥ Límite inferior
Tiempo de actividad ≥ Límite inferior
Tasa de error ≤ Límite superior
Una vez que los proveedores alcanzan el mismo umbral mínimo, compiten en precio. La pregunta del comprador es: ¿qué proveedor puede entregar la mano de obra necesaria al mejor precio?
La contratación de un radiólogo, en el contexto de los LLM, se convierte en un problema medible: qué LLMs pueden leer radiografías con alta competencia, y completar la tarea dentro de una latencia, ventana de contexto y otras especificaciones de contrato basadas en resultados claramente definidas.
El resultado es la forma en que el comprador mide el éxito; el trabajo es la actividad económica suministrada; los tokens son el combustible que consume la máquina mientras realiza el trabajo.
The Grid es el mercado de mano de obra maquinal.
De los tokens al mercado de mano de obra maquinal
El mercado puede poner precio a los insumos de la pila tecnológica, pero para poner precio a los resultados, necesita un mercado de mano de obra maquinal. A los compradores no les importan las horas de GPU. Los endpoints de los modelos tampoco son estables: se renombran, dejan de usarse, se encapsulan o se retiran directamente.
A usuarios y liquidez les disgustan los cambios frecuentes. Las GPU y los modelos evolucionarán continuamente, pero la unidad estable es el trabajo en sí.
Creo que el mercado evolucionará siguiendo esta ruta. Cada nivel que se asciende representa una compra más abstracta, más valiosa, pero también más difícil de verificar. The Grid debería ascender progresivamente por esta escalera:
Tokens básicos → Mercado de capacidades de LLM estandarizadas → Mercado de mano de obra estandarizada → Mercado de resultados programables
Fase 1: Tokens básicos
Claude 4.7, GPT 5.5, Kimi 2.6, DeepSeek V4, GLM 5, etc.
Hoy, los compradores adquieren la salida básica de los modelos a proveedores de inferencia. Envían sus prompts, reciben el resultado de la inferencia y pagan por uso. Es fácil de verificar, pero sigue siendo solo materia prima. Lo que los compradores realmente quieren no son tokens, sino obtener inteligencia útil al mejor precio.
Fase 2: Mercado de capacidades de LLM estandarizadas
Por ejemplo: text/usd, code/usd, agent/usd, etc.
El comprador ya no elige un modelo concreto, sino la categoría de inteligencia que necesita. El comprador sigue controlando el flujo de trabajo, los prompts, los datos y la lógica de aplicación. The Grid solo enruta cada solicitud al modelo calificado que cumple la especificación del contrato y tiene el precio más bajo.
Nota: Este es el primer nivel de abstracción real por encima de los tokens básicos, y es donde se encuentra actualmente TheGrid.ai.
Fase 3: Mercado de mano de obra estandarizada
Por ejemplo: accounting/usd, support_agent/usd, legal/usd, healthcare/usd, radiology/usd, etc.
A medida que los modelos se vuelven más especializados, el mercado de capacidades puede evolucionar aún más hacia mercados específicos por sectores. Es similar a la división del trabajo especializada en los distintos mercados laborales humanos.
En este nivel, vendemos capacidad de inferencia adaptada a flujos de trabajo de verticales laborales específicas. A medida que los modelos especializados por sectores se vuelvan más comunes, este tipo de mercado se expandirá rápidamente. Ejemplos incluyen Composer de Cursor, Harvey para trabajo legal, y EvidenceOpen para salud.
Fase 4: Mercado de RFQ programables y resultados para agentes
Por ejemplo: support_ticket_resolved/usd, pr_merged/usd, claim_processed/usd, etc.
El último nivel es donde The Grid pasa de ser un mercado de inferencia a un mercado de mano de obra maquinal.
Este nivel requiere mecanismos como RFQ (Solicitud de ofertas), cuentas de custodia, liquidación diferida, confirmación del comprador, reputación del proveedor, mecanismos de retención, resolución de disputas, etc. Probablemente comience con RFQs, no directamente con libros de órdenes. El comprador define el trabajo, las restricciones, los criterios de aceptación y los términos de liquidación; los agentes pujan para completar la tarea. The Grid ayuda a enrutar, fijar precios, verificar y liquidar este trabajo.
Este es el nivel más valioso, pero también el más difícil de verificar, porque los resultados pueden ser diferidos, subjetivos y fácilmente manipulables. Una incidencia de atención al cliente puede reabrirse; una PR puede pasar las pruebas pero aún así crear una arquitectura deficiente.
Precio total = coste de completar el trabajo + coste de asumir el riesgo
Un flujo de trabajo no se convierte automáticamente en mercado solo porque la inteligencia tenga un mercado, o porque la inteligencia se abarate. Algunos trabajos dependen en gran medida de contexto privado, como el historial del cliente o políticas internas. Cuanto más dependa el trabajo del contexto, menos probable será que se liquide limpiamente en un mercado abierto. [@hypersoren https://hypersoren.xyz/posts/cybernetic-arbitrage/]
El mercado necesita revelar qué categorías de mano de obra se expandirán y cuáles se contraerán.
"Mano de obra maquinal vs. mano de obra humana", o "Mano de obra maquinal & mano de obra humana"
Anjali Shriva señala en su borrador de diseño de mecanismos que la narrativa de la IA se describe demasiado a menudo como sustitución. Pero en realidad, se parece más a un problema de coordinación: cómo se reorganizan el trabajo, la atribución, los incentivos y el valor cuando humanos y máquinas participan en la producción.
Hoy, gran parte del uso interno de IA en las empresas sigue atascado, porque los empleados la usan en privado, los flujos de trabajo siguen bloqueados en individuos, y las empresas no pueden poner precio a estas mejoras de productividad ni escalar sus beneficios.
La mayor parte del trabajo automatizable probablemente pasará a las máquinas. Una parte del trabajo se convertirá en supervisión humana, asunción de responsabilidades, entrenamiento y gestión de contexto. En algunos casos, ese 1% final de juicio humano se volverá más valioso, porque puede desbloquear a gran escala ese 99% de trabajo automatizado.
"Brave New World of AI Markets" de Rachel Su Park señala que el TAM de la IA no debe modelarse simplemente como una sustitución del gasto actual en mano de obra humana, porque cambia simultáneamente el precio y la cantidad. A medida que baja el coste del trabajo, el precio unitario puede caer, pero la cantidad consumida puede expandirse, porque el trabajo existente se consumirá con más frecuencia, y nuevo trabajo que antes no era económico se volverá viable. El artículo lo resume así:
P × Q: Tamaño del mercado = precio unitario del trabajo × cantidad de trabajo consumida
Si la IA abarata las interacciones de atención al cliente, las empresas pueden ofrecer servicio 24/7. Este mercado no será solo una versión barata del antiguo mercado laboral de atención al cliente, sino que puede convertirse en un mercado de interacción con el cliente mucho más grande.
La IA es un mercado expansivo, porque cuando baja el coste del trabajo, la demanda no se mantiene constante.
La capa de mano de obra
El mercado de mano de obra maquinal debe comenzar por trabajos cuyas especificaciones puedan definirse claramente. Las horas de GPU contienen demasiada información de insumos, solo te dicen qué soporta el trabajo; y poner precio al resultado completo es demasiado complejo, depende demasiado del contexto. A medida que la verificación, la reputación y la fijación de precios de riesgo/seguros sean gradualmente asumidos por las máquinas, el mercado avanzará hacia la capa de resultados puros.
La mano de obra maquinal puede volverse transaccionable porque a los compradores les importará cada vez menos qué modelo o qué GPU produjo el trabajo, y más si el trabajo en sí alcanzó los estándares mínimos y niveles especificados en el contrato al precio correcto. A los agentes les importará aún menos estos orígenes subyacentes.
Las máquinas ya pueden ejecutar directamente trabajo con propósito económico, y ese trabajo puede definirse, medirse, tasarse, adquirirse y, finalmente, transaccionarse. La electricidad, la capacidad de cómputo, los modelos y los tokens siguen siendo importantes, por supuesto, pero siguen estando aguas arriba.
Aguas abajo es donde el trabajo realmente se completa, y el mercado se está moviendo hacia un objeto más simple: la mano de obra maquinal.








