Escrito por: Xu Chao
La contradicción entre la oferta y la demanda en la infraestructura de inteligencia artificial se está intensificando entre las principales empresas tecnológicas mundiales. Según informaron personas familiarizadas con el asunto, Google informó a Meta alrededor de marzo de este año que no podía satisfacer todas sus necesidades de capacidad de computación para Gemini, e impuso un límite de uso a este gigante de las redes sociales; incluso el mayor proveedor mundial de servicios de IA no puede hacer frente a la abrumadora demanda de capacidad de computación.
Según informó el Financial Times británico, esta restricción aún no se ha levantado y ha causado interrupciones y retrasos en varios proyectos internos de IA de Meta. Como resultado, Meta ha pedido a sus empleados que mejoren la eficiencia en el uso de la capacidad de computación de IA, implementando internamente un cálculo minucioso de los tokens de IA. Tanto Google como Meta se negaron a comentar al respecto.
Esta situación ha obligado a Google a acelerar su expansión. A principios de este mes, Google firmó un contrato de arrendamiento de capacidad de computación por 920 millones de dólares mensuales con SpaceX, propiedad de Elon Musk. Sundar Pichai, CEO de Google, admitió durante la conferencia de resultados del primer trimestre: "Recientemente, ciertamente hemos enfrentado limitaciones en capacidad de computación. Si pudiéramos satisfacer la demanda, los ingresos del negocio en la nube serían mayores."
Meta no es un caso aislado. Varias fuentes familiarizadas señalaron que otros clientes corporativos de Google también han sufrido restricciones en diversos grados, siendo Meta la más afectada debido a la escala excepcionalmente grande de su demanda. Este incidente refleja que el crecimiento explosivo de la carga de trabajo de inferencia de IA se ha convertido en uno de los mayores desafíos que enfrenta toda la industria.
La presión sobre el cuello de botella de la capacidad de computación continúa, los grandes clientes son los primeros afectados
Aunque las grandes empresas tecnológicas ya han invertido cientos de miles de millones de dólares en chips, centros de datos y suministro eléctrico, la oferta de capacidad de computación para IA aún no puede mantenerse al ritmo del crecimiento de la demanda.
Los ingresos del negocio en la nube de Google superaron por primera vez los 20 mil millones de dólares en el primer trimestre, y la acumulación de contratos en la nube firmados pero aún no entregados casi se duplicó en comparación con el trimestre anterior, superando los 460 mil millones de dólares. Pichai dejó claro que las restricciones en capacidad de computación persistirán en el corto plazo.
En este contexto, el impacto en Meta es particularmente notable. Según fuentes familiarizadas, fue precisamente la alta demanda de grandes clientes corporativos como Meta lo que impulsó directamente a Google a buscar aceleradamente fuentes externas de capacidad de computación. A medida que las empresas despliegan a gran escala chatbots, asistentes de programación y agentes de IA, la carga de trabajo de inferencia (es decir, el consumo de capacidad de computación al ejecutar tareas en aplicaciones prácticas después del entrenamiento del modelo) se está convirtiendo en el cuello de botella central de la industria.
Proyectos internos de Meta obstaculizados, acelerando la transición hacia modelos propios
Meta utiliza ampliamente Gemini internamente, cubriendo la revisión de seguridad de la plataforma (incluyendo la identificación de contenido fraudulento y la eliminación de información perjudicial), chatbots de servicio al cliente y asistencia publicitaria, así como parte de los flujos de trabajo internos y el desarrollo de código, complementándose al mismo tiempo con el uso de otros modelos como Claude de Anthropic.
Según fuentes familiarizadas, Meta inicialmente eligió Gemini porque su rendimiento superaba al de su modelo propio de código abierto, Llama. Sin embargo, con el endurecimiento de las restricciones de capacidad de computación, Meta está acelerando la migración hacia sus modelos propios. Varias fuentes indicaron que Meta recientemente ha comenzado a priorizar la promoción de su nuevo modelo Muse Spark, que se considera que ya puede competir en rendimiento con Gemini, ayudando a reducir la dependencia de modelos externos.
Mark Zuckerberg, CEO de Meta, ha continuado aumentando las inversiones en talento e infraestructura de IA, dedicándose a construir lo que él llama "superinteligencia personal". A diferencia de Google, Meta no tiene un negocio en la nube y está acelerando la construcción de su propio sistema de centros de datos, comprometiéndose a invertir un total de 600 mil millones de dólares en Estados Unidos para 2028.
Google se expande recurriendo a SpaceX, la industria busca soluciones
Ante la presión en capacidad de computación, Google firmó este mes con SpaceX un contrato de arrendamiento de capacidad de computación por 920 millones de dólares mensuales para suplir la brecha en infraestructura. El laboratorio de IA Anthropic también llegó a un acuerdo similar con SpaceX el mes pasado.
El hecho de que Google haya aplicado medidas restrictivas a Meta ofrece una ventana poco común para vislumbrar las presiones reales que enfrentan los principales proveedores mundiales de servicios de IA en la distribución de capacidad de computación. Actualmente, el cuello de botella de infraestructura de toda la industria de IA se está extendiendo desde el lado del entrenamiento hacia el de la inferencia, y la resolución de la contradicción entre oferta y demanda aún depende de la materialización de una nueva ronda de inversiones de capital a gran escala.





