Un exdirector de Oracle llamado Michael Hahn se ha dedicado recientemente al negocio de auditar facturas de IA.
Su empresa, Vaudit, ha examinado las facturas de IA de 60 empresas, por un monto aproximado de 34 millones de dólares, principalmente por el uso de Claude Code, y ha detectado cobros excesivos de aproximadamente 1,7 millones de dólares.

Según un informe de The Information: la empresa auditora Vaudit afirma haber detectado alrededor de 1,7 millones de dólares en cargos sospechosamente excesivos en las facturas de IA de empresas que ha revisado, principalmente relacionados con Claude Code.
En la lista de clientes auditados figuran empresas como Panasonic, HP y Honda.
Sin embargo, si se pregunta a los dos gigantes de la IA que figuran al otro lado de la factura, la respuesta es otra versión.
Anthropic dice que no cobra por solicitudes no completadas o por errores, ni redirige secretamente las solicitudes a modelos antiguos, y que el sobrecobro no parece ser un fenómeno generalizado.
OpenAI es aún más directo: no hay evidencia de que estos problemas hayan ocurrido a sus clientes.
Ambas partes dicen que no hay problema.
Pero tras sucesivas reclamaciones de Vaudit y sus clientes, aproximadamente el 80% de estos montos en disputa fueron finalmente reembolsados por Amazon, Google, Microsoft, Anthropic y OpenAI.
Hahn afirma que estas empresas cooperaron mucho cuando surgieron los problemas, accediendo a devolver el dinero, pero no a reconocer el error.
Así, la situación se vuelve extraña: la empresa auditora muestra los registros y dice "lo he descubierto", aproximadamente el 80% de los cargos excesivos fueron reembolsados, y los proveedores de modelos colectivamente niegan diciendo "eso no es cierto".
Si todos dicen que no hay error, ¿cómo es que se devolvió este dinero?
¿Cómo salieron estos "excesos" de 1,7 millones?
Veamos primero qué encontró Vaudit.
Michael describe las tres formas más comunes de sobrecobro, cada una escondida en rincones insignificantes de la factura, donde normalmente nadie verificaría cada línea.
Primera, confusión de modelos.
El cliente realmente llama a un modelo más antiguo y económico, pero la factura se calcula según la tarifa de un modelo más nuevo y caro.
Es como si compraras un asiento en clase económica y te cobraran el precio de primera clase. Una o dos veces no se nota, pero tras millones de llamadas, la diferencia de precio se acumula.
Segunda, pagar por fallos.
Un agente o chatbot no completa la solicitud, o incluso directamente reporta un error, y esta parte igualmente entra en la factura.
La tercera es la más oculta, Hahn la llama "tormenta de reintentos" (retry storm). Una tarea de agente falla, este silenciosamente vuelve a intentarlo una y otra vez por sí mismo, el usuario no tiene idea de que se está quemando dinero en segundo plano, y los costos se van acumulando capa tras capa.
Ninguna de estas tres formas es causada por un "uso excesivo activo" del usuario.

La más aterradora es la tercera.
En el pasado, cuando usabas software, avanzabas paso a paso, vigilando tú mismo, y si algo se descontrolaba podías detenerlo de inmediato.
Pero el punto de venta de los agentes de IA es precisamente "dejar que actúen por sí mismos", el humano se retira del proceso.
Esto significa que cuando un agente de IA choca contra una pared en segundo plano, reintenta, vuelve a chocar y quema tokens de forma descontrolada, la persona que normalmente pediría detenerlo ni siquiera lo sabe, y la factura solo llega a final de mes.
Anthropic, OpenAI: "No cobramos de más"
El punto clave de esto no es "quién engañó a quién".
Vaudit lo detectó, pero Anthropic y OpenAI no lo reconocen. Esta es la versión de la empresa auditora; no se puede acusar a ambas empresas de cobros excesivos solo con la frase "detectamos 1,7 millones".
Pero en cuanto al reembolso, cada una cooperó. Que se pueda reembolsar el 80% de una vez precisamente demuestra que ese 80% no debería haberse cobrado en primer lugar.
El reembolso es una corrección de errores, el dinero se devuelve, pero las cuentas siguen siendo confusas.
La raíz de este "impasse de devolver dinero sin reconocer el error" está en el algoritmo mismo del negocio de facturación de la IA.
¿Por qué las facturas de IA son inherentemente incomprensibles?
El problema puede no estar en "calcular mal", sino en "ser inherentemente incalculables".
Porque se cobra según el uso de tokens: usas más, pagas más; usas algo más complejo, pagas aún más. Pero los tokens son básicamente invisibles en los paneles de control de la infraestructura que sueles usar.
Lo que es aún más problemático es que también fluctúan drásticamente. Preguntando lo mismo, dependiendo del modelo usado, cómo se escribe el prompt, cómo se organiza el agente, la cantidad de tokens consumidos puede diferir en varios órdenes de magnitud.
Cuanto más avanza el modelo hacia lo "agentico" (agentic), más tokens consume. Un agente que realiza una tarea por ti puede implicar decenas o cientos de llamadas al modelo en segundo plano, cada una consumiendo dinero.
Inherentemente difíciles de predecir y explicar, así es como surge esta zona gris del "sobrecobro".
Las palabras de Hahn dan en el clavo: las facturas de IA se están volviendo cada vez menos transparentes. Esta frase justo toca el punto débil de toda la industria.
La IA ha pasado de los primeros días de "facturación por llamada" hasta el actual modelo de "múltiples modelos + múltiples agentes + intermediación en la nube". La cadena de facturación se ha alargado cada vez más: el proveedor del modelo cobra una parte, el proveedor de la nube cobra otra, y el intermediario del SDK en medio añade otra capa.
Cada parte por separado parece razonable, pero cuando las tres se superponen, es difícil ver a simple vista en qué se gastó realmente ese dinero.
Lo que es aún más grave es que el dinero a menudo no se quema donde puedes verlo.
Los escenarios que realmente consumen las facturas casi siempre están ocultos en segundo plano, y cada uno tiene issues públicos en GitHub o informes de incidentes que se pueden consultar.

Después de ver estos ocho tipos, te darás cuenta de que o bien el contexto se retransmite una y otra vez, o bien los subagentes funcionan toda la noche sin supervisión, y la factura crece por sí sola donde no la ves.
Suscripción de 200 dólares, factura de 50.000
No es la primera vez que Anthropic enfrenta desafíos con sus facturas de IA.
Justo el 15 de junio, un cliente de Washington D.C., Karl Kahn, demandó a Anthropic en un tribunal federal, acusándola de "no cumplir con lo ofrecido" en sus suscripciones de alto precio.

Según el Wall Street Journal, Anthropic Max 5x cuesta 100 dólares al mes y Max 20x cuesta 200 dólares al mes. El punto de venta en la publicidad era que ofrecían 5 y 20 veces el límite de uso del plan Pro.
Pero Kahn afirma que la cantidad realmente utilizable está muy por debajo de lo publicitado.
Él actualizó a Max 20x en abril de este año, y en cuestión de semanas se topó con el límite de uso semanal. Un sprint de 5 horas consumió directamente el 15% de su cuota semanal.
O deja de trabajar, o usa con moderación, o paga más para añadir capacidad. Se vio forzado a elegir solo entre estas tres opciones.
La base de esta demanda son principalmente algunos correos electrónicos enviados por Anthropic en julio de 2025 a suscriptores de diferentes niveles, que especificaban aproximadamente cuánto podía usarse cada nivel por semana.
El demandante comparó estos datos por escrito con la cuota que realmente recibió, llegando a la conclusión de que es "muy inferior a lo publicitado".
La demanda solicita el estatus de acción colectiva, cubriendo a todas las personas que han comprado estos dos planes desde abril de 2025.
Buscar errores en las facturas de IA se está convirtiendo en un negocio
Vaudit, la empresa que "audita" facturas de IA, se fundó en 2023 y tiene un equipo de unos 30 empleados.
Su fundador, Hahn, es exdirector de Oracle, y su profesión original era la auditoría de facturas de logística, transporte, publicidad y servicios en la nube. Básicamente, se dedica a ayudar a las personas a "revisar cuentas y ahorrar dinero".
A principios de este año, trasladó exactamente este oficio a las facturas de IA.

El sitio web de Vaudit dice: "Monitorea y recupera cada gasto en IA", y afirma haber auditado montos acumulados superiores a 1.000 millones de dólares.
El enfoque de Vaudit es simple y directo:
El cliente instala un software en su entorno de IA, generalmente a través de un kit de desarrollo de software (SDK), que captura sigilosamente los datos brutos del uso de IA, luego los compara línea por línea con las facturas y recibos. Si no coinciden, Vaudit reclama en nombre del cliente.
La forma de cobrar también es directa: cobra el 1% del monto auditado, y luego el 30% del dinero recuperado. Cuanto más recupera para ti, más gana.
Que buscar errores específicamente en las facturas de IA pueda convertirse en un negocio en sí mismo demuestra que la facturación de IA ya es tan compleja que se necesita una "tercera parte para revisar cuentas".
Y todo esto llega en un momento delicado.
Anthropic y OpenAI están en la carrera por su OPI (Oferta Pública Inicial), apresurándose por ofrecer nuevas funciones a los clientes. Por un lado, la valoración e ingresos galopan; por el otro, los usuarios de pago fruncen el ceño ante facturas incomprensibles.
Así surge una profesión completamente nueva: el "asesor fiscal de facturas" de la era de la IA.
Y esa factura de IA que tienes en la mano, ¿quién te la ha revisado?
Referencias:
https://www.theinformation.com/newsletters/applied-ai/anthropic-customers-find-errant-charges-auditing-startup-says?rc=epv9gi
Este artículo proviene del WeChat público "新智元", autor: ASI启示录






