Diálogo con Mai-Lan de Amazon Web Services: El próximo campo de batalla de S3, cómo enfrentar la ola de consumo de datos en la era de los Agentes

marsbitPublicado a 2026-05-08Actualizado a 2026-05-08

Resumen

Al comienzo del año, el éxito de OpenClaw en el mercado chino reveló el enorme potencial de los agentes de IA. Sin embargo, esto planteó una pregunta crucial para todos los proveedores de servicios en la nube: ¿está preparada la infraestructura subyacente, especialmente la capa de datos, para manejar la proliferación y el consumo masivo de datos por parte de estos agentes? Mai-Lan Tomsen Bukovec, Vicepresidenta de Tecnología de Amazon Web Services, destaca que los agentes consumen datos de manera "extremadamente activa y agresiva", con una frecuencia de consultas que supera en varios órdenes de magnitud a la de los humanos. Este modelo de trabajo paralelo y masivo convierte el costo-efectividad en un factor decisivo para la infraestructura de agentes. Para abordar esta demanda en la era de la IA, Amazon S3 ha evolucionado con tres innovaciones clave: S3 Table (con soporte nativo para Apache Iceberg, facilitando la interacción de los agentes mediante SQL), S3 Vector (introduciendo vectores como tipo de dato nativo para contextualizar datos y actuar como memoria compartida) y S3 Files (permitiendo a los agentes interactuar con datos en S3 a través de un sistema de archivos POSIX familiar). Estas capacidades, basadas en los principios de disponibilidad, durabilidad y resiliencia de S3, posicionan al servicio como un pilar fundamental para soportar las cargas de trabajo de IA y el consumo intensivo de datos por parte de los agentes en los próximos años.

A principios de año, el éxito de OpenClaw en el mercado chino permitió que todos vieran el enorme potencial de los Agentes. Pero a esto le siguió una pregunta que todos los proveedores de la nube deben responder: cuando los Agentes empiezan a reproducirse como langostas cibernéticas y a invocar datos a alta frecuencia, ¿está preparada la infraestructura de la nube de IA, especialmente la capa de datos?

Por ejemplo, al desplegar Agentes en entornos de producción, los equipos de datos empresariales a menudo encuentran cuellos de botella a nivel de datos. La construcción de Agentes en diferentes plataformas como bases de datos vectoriales, relacionales, de grafos y data lakes/warehouses requiere de pipelines de sincronización de datos para mantener la actualidad de la información contextual. Sin embargo, en entornos de producción reales, esta información contextual se desactualiza gradualmente.

La urgencia de este problema radica en el patrón de consumo de datos de los Agentes, radicalmente distinto al de los ingenieros humanos.

"Los Agentes están consumiendo datos de una manera extremadamente activa y agresiva; su frecuencia de invocación a los data warehouses o data lakes es asombrosa."

Mai-Lan Tomsen Bukovec, Vicepresidenta de Tecnología de Amazon Web Services, señaló recientemente en una conversación con el autor que los Agentes operan en un modo de "selección paralela", es decir: no realizan una consulta a la vez, sino docenas o cientos simultáneamente en paralelo, comparando para encontrar la mejor ruta. Esto convierte a los Agentes en consumidores de datos mucho más agresivos que los humanos: con una frecuencia de invocación varios órdenes de magnitud mayor y un volumen de procesamiento de datos que crece exponencialmente.

Mai-Lan señaló además: "Ahora los clientes tienen un gran deseo de construir infraestructura para Agentes. El costo, o mejor dicho, la relación costo-beneficio, ya no es un factor secundario, sino decisivo. En los próximos seis meses a un año, con la explosión de los Agentes, la elección de los servicios de datos subyacentes será crucial."

La euforia por OpenClaw ahora está disminuyendo, dejando precisamente una advertencia sobre las pruebas de estrés a la capacidad de almacenamiento y cómputo subyacente de los proveedores de la nube. Mai-Lan cree que Amazon Web Services tiene una ventaja natural en este campo; la escala de Amazon S3 (Amazon Simple Storage Service) y la eficiencia de costo de Amazon Redshift y Amazon Athena bajo alta concurrencia están precisamente preparadas para esta forma de interacción de datos de los Agentes, de escala masiva y frecuencia ultraelevada.

Coincidiendo con el 20º aniversario del producto Amazon S3, y en torno a las demandas de los clientes en la era de la IA para el procesamiento de datos, Amazon S3 ha implementado recientemente tres grandes transformaciones: S3 Table (formato de tabla), S3 Files (archivos) y S3 Vector (vectorial).

Como el soporte nativo de S3 Table para Apache Iceberg. Mai-Lan señala que los Agentes tienden a interactuar directamente con datos en formato Iceberg a través de SQL. La lógica subyacente es que los Agentes se construyen sobre modelos de lenguaje grandes (LLMs), y estos LLMs han desarrollado una capacidad madura para manejar sintaxis SQL y formato de datos Iceberg durante su entrenamiento. Almacenar todos los datos de las tablas en formato Iceberg en S3 permite que los Agentes procesen datos de manera eficiente sin necesidad de aprender múltiples y complejas API de acceso. Actualmente, los Agentes muestran un alto grado de compatibilidad con S3 e Iceberg.

Cuando la capacidad Iceberg se introdujo en S3, desencadenó una nueva ola de innovación. Fuentes de datos como Postgres, Oracle, etc., comenzaron a escribir directamente en Iceberg, y los sistemas de Agentes pueden interactuar directamente con estas tablas. Y con el lanzamiento de S3 Vectors, cada vez más aplicaciones de IA están utilizando vectores como portadores de memoria compartida, inyectando así "estado" en la experiencia de interacción con la IA.

Mai-Lan también señala que los vectores se han introducido como un tipo de dato nativo de S3. La aplicación de vectores se concentra principalmente en dos dimensiones: primero, usar vectores para construir información contextual para los datos almacenados en S3; y segundo, usar vectores como memoria compartida. En los cinco meses posteriores al lanzamiento de S3 Vectors, la retroalimentación del mercado ha estado en línea con las expectativas. Muchos clientes comenzaron a usar esta funcionalidad, generando vectores a través de modelos de embedding para enriquecer el contexto de los datos. El uso de S3 Vectors como espacio de memoria para sistemas de Agentes ha experimentado un crecimiento explosivo.

Vale la pena destacar que S3 Files se lanzó hace unas semanas, permitiendo que los Agentes procesen datos en S3 a través del estándar POSIX, es decir, de la manera del sistema de archivos. En los sistemas de Agentes, los LLMs prestan gran atención a la "forma de archivo"; tanto las bibliotecas de Python como los scripts de Shell son contenidos familiares durante el entrenamiento de los LLMs. Los Agentes tienden naturalmente a utilizar archivos como interfaz de datos.

Por ello, el enfoque de diseño de S3 Files es montar un sistema de archivos EFS en un bucket de S3. A través de este mecanismo, los usuarios pueden procesar datos de S3 en el sistema de archivos basándose en el estándar POSIX: los archivos pequeños pueden accederse más rápido mediante la caché de EFS, mientras que los archivos grandes se transmiten directamente desde S3 en flujo. Esto permite que los Agentes interactúen de forma nativa con los datos de S3 usando el lenguaje familiar del sistema de archivos, y vean el sistema de archivos compartido como un "espacio de memoria compartida" proveniente de S3.

Desde la perspectiva del desarrollo de la capacidad de memoria de los LLMs, este avance es significativo. La experiencia actual de IA está introduciendo gradualmente contextos de conversación más profundos e interacciones personalizadas, ya sea entre Agentes, entre personas y Agentes, o entre Agentes y datos, el rendimiento del modelo continúa evolucionando. Al expandir aún más esta interfaz natural del sistema de archivos, se espera que la capacidad de memoria de los sistemas de Agentes obtenga una mejora más profunda.

El autor observa que, desde 2006, cuando predominaban datos semiestructurados como imágenes, pasando por los datos analíticos posteriores, y desde los primeros data warehouses hasta el auge de los data lakes, Amazon Web Services está impulsando actualmente con fuerza que Amazon S3 se convierta en una base clave para las cargas de trabajo de IA, adaptándose a las demandas actuales de los clientes. Mai-Lan cree que el núcleo del diseño de Amazon S3 es impulsar el crecimiento de los tipos de datos principales de manera económica, y siempre adherirse a principios como la disponibilidad, durabilidad y resiliencia de los datos. Y esta es precisamente la razón por la cual los clientes han confiado sus operaciones de datos a S3 durante 20 años, y lo que también sustentará sus posibilidades durante los próximos 20 años.

(Autor | Yang Li, Editor | Yang Lin)

Preguntas relacionadas

Q¿Cómo describe Mai-Lan Tomsen Bukovec el patrón de consumo de datos de los Agent en comparación con los ingenieros humanos?

AMai-Lan señala que los Agent consumen datos de manera extremadamente activa y agresiva, con una frecuencia de consulta a los lagos o almacenes de datos que es asombrosa. Su patrón de trabajo es de 'selección paralela óptima', ejecutando decenas o cientos de consultas simultáneas para encontrar la mejor ruta, lo que los convierte en consumidores de datos mucho más agresivos que los humanos, con una frecuencia de llamadas varios órdenes de magnitud mayor y un crecimiento exponencial en el rendimiento de datos.

Q¿Qué tres transformaciones principales se mencionan en el artículo que Amazon S3 ha implementado recientemente para adaptarse a la era de la IA y los Agent?

ALas tres transformaciones principales de Amazon S3 mencionadas son: S3 Table (formato tabular con soporte nativo para Apache Iceberg), S3 Files (acceso a datos vía sistema de archivos POSIX) y S3 Vectors (vectores como tipo de datos nativo para enriquecer contexto y actuar como memoria compartida).

QSegún el artículo, ¿qué ventaja clave ofrece el soporte de Apache Iceberg en S3 Table para la interacción de los Agent con los datos?

AEl soporte nativo de Apache Iceberg en S3 Table permite a los Agent interactuar eficientemente con los datos mediante SQL, ya que los modelos de lenguaje grande (LLM) en los que se basan están entrenados para manejar sintaxis SQL y el formato Iceberg. Esto elimina la necesidad de que los Agent aprendan múltiples API complejas para acceder a los datos almacenados en S3.

Q¿Cómo funciona S3 Files para permitir que los Agent interactúen con los datos de S3, y por qué este enfoque es natural para ellos?

AS3 Files permite a los Agent acceder a los datos en S3 a través del estándar POSIX, montando un sistema de archivos EFS en un bucket de S3. Los Agent pueden interactuar con los datos como archivos, ya sea accediendo a archivos pequeños desde la caché de EFS o transmitiendo archivos grandes directamente desde S3. Este enfoque es natural para los Agent porque los LLM están familiarizados con el concepto de 'archivos' (como bibliotecas de Python o scripts de Shell) durante su entrenamiento.

Q¿Qué papel juegan los vectores (S3 Vectors) en los sistemas de Agent según las observaciones de Mai-Lan tras su lanzamiento?

ATras el lanzamiento de S3 Vectors, Mai-Lan observa que los vectores se utilizan principalmente en dos dimensiones: para construir información de contexto alrededor de los datos almacenados en S3, y para actuar como una memoria compartida en los sistemas de Agent. En los cinco meses posteriores a su lanzamiento, el uso de S3 Vectors como espacio de memoria para los Agent ha experimentado un crecimiento explosivo, permitiendo experiencias de IA con mayor contexto conversacional e interacciones personalizadas.

Lecturas Relacionadas

Agent se hace cargo del derecho a la distribución del tráfico, ¿qué están disputando Tencent, ByteDance y Alibaba?

Los gigantes tecnológicos chinos Tencent, ByteDance y Alibaba están compitiendo intensamente por dominar el futuro acceso a la IA, específicamente a través de agentes de inteligencia artificial (Agent), buscando controlar la distribución del tráfico en la nueva era de la IA. Alibaba está transformando su aplicación Qianwen en un "superagente" capaz de gestionar múltiples servicios dentro de su ecosistema (como Taobao, Alipay) y, recientemente, ha abierto su plataforma para que marcas externas como Luckin Coffee y KFC creen sus propios Agent, pasando de un enfoque cerrado a uno abierto. Su estrategia se basa en un "dúo" con la app Quark para tareas de información y Qianwen para tareas complejas de la vida diaria. ByteDance, con su aplicación Doubao que supera los 300 millones de usuarios activos mensuales, está adoptando una estrategia integral. Su plataforma Kouzi permite crear agentes personalizados, y está expandiendo su presencia a hardware, como teléfonos AI y gafas inteligentes, buscando que Doubao sea omnipresente. Tencent, por su parte, está preparando su movimiento más estratégico: integrar un Agent directamente en WeChat, la aplicación con 1.400 millones de usuarios. Este agente, accesible deslizando la pantalla, podrá entender órdenes naturales y ejecutarlas automáticamente utilizando los millones de mini-programas del ecosistema de WeChat, transformando la aplicación en un sistema operativo de servicios. La competencia subyacente es por el control del "punto de contacto primario" con la intención del usuario. La lógica comercial está cambiando de una "economía de la atención" (maximizar el tiempo en pantalla) a una "economía de la intención" (satisfacer la necesidad del usuario con la máxima eficiencia). El derecho a distribuir el tráfico ya no lo decide el clic humano, sino la recomendación o ejecución por parte del Agent. Quien controle esta capa de ejecución por defecto para las solicitudes de IA dominará el valor comercial en la nueva era, redefiniendo cómo los usuarios se conectan con los servicios digitales.

marsbitHace 1 hora(s)

Agent se hace cargo del derecho a la distribución del tráfico, ¿qué están disputando Tencent, ByteDance y Alibaba?

marsbitHace 1 hora(s)

De bloquear Doubao a abrazar Honor: ¿Por qué WeChat cambió repentinamente su postura?

**Resumen: ¿Por qué WeChat cambió su postura, de bloquear a 'Doubao' a colaborar con Honor?** WeChat, la superapp de Tencent, ha dado un giro radical al abrir su ecosistema a los asistentes de IA de los fabricantes de teléfonos mediante el protocolo A2A (Agente a Agente). Anteriormente, en 2025, bloqueó agresivamente intentos de control externo, como el del teléfono 'Doubao' de ByteDance, que usaba la ruta GUI (simulación de clics), por considerarlo una "invasión". Esta colaboración, ya activa en dispositivos Honor (50% de modelos activos) y en proceso con Xiaomi, OPPO y vivo, permite que asistentes como YOYO envíen mensajes o hagan llamadas por WeChat por comando de voz, pero bajo estricto control de WeChat. El cambio se debe a la presión competitiva de Tencent en IA. Su modelo 'Yuanbao' (57 millones de usuarios activos mensuales) está muy por detrás de 'Doubao' (345 millones) o 'Tongyi Qianwen' de Alibaba. WeChat, con 1.400 millones de usuarios y su vasto ecosistema de mini-programas, es su baza clave. La nueva estrategia busca convertir a WeChat en un "sistema operativo de servicios" de IA, utilizando los asistentes del teléfono como puerta de entrada, sin ceder el control. Para los fabricantes, A2A es una opción pragmática. La ruta GUI está bloqueada, mientras que A2A les da acceso controlado y les permite centrarse en otros escenarios de IA propios (recomendaciones, servicios locales), enriqueciendo sus datos y ecología. La seguridad se basa en una autorización doble (usuario + aplicación). En esencia, es una alianza táctica de conveniencia. Tencent gana un canal de distribución crucial para su futuro agente de IA interno. Los fabricantes resuelven un cuello de botella de interoperabilidad. A largo plazo, sus objetivos chocan: Tencent quiere centralizar los servicios en WeChat, los fabricantes quieren que su asistente del sistema sea el centro. La batalla por la entrada a la era de la IA acaba de comenzar.

marsbitHace 3 hora(s)

De bloquear Doubao a abrazar Honor: ¿Por qué WeChat cambió repentinamente su postura?

marsbitHace 3 hora(s)

Cifras en la cadena de bloques en la víspera del inicio: 1.600 millones negociados antes de que comience el Mundial

Antes del inicio del Mundial 2026, los mercados de predicción en cadena ya han acumulado un volumen de operaciones significativo. Solo el contrato "Campeón del Mundial" en Polymarket alcanzó aproximadamente 16 mil millones de dólares en volumen total antes de que comience el torneo. La curva de actividad ha aumentado drásticamente en los meses previos, pasando de unos 368 millones a finales de marzo a superar los 12 mil millones en mayo. El ecosistema es amplio: existen alrededor de 100 mercados en Polymarket que cubren todas las partidas, y junto con plataformas como Kalshi, ofrecen contratos para resultados de partidos, clasificaciones de grupo y hasta eventos no deportivos, como riesgos logísticos. Los precios de estos contratos, que fluctúan entre 0,01 y 0,99 dólares, reflejan probabilidades implícitas en tiempo real según el desarrollo de los eventos. La infraestructura subyacente ha madurado, utilizando stablecoins reguladas como USDC para garantías y oráculos descentralizados como Chainlink para la resolución de resultados. Incluso la FIFA ha reconocido formalmente esta categoría, nombrando a ADI Predictstreet como su primer socio oficial en mercados de predicción. En vísperas del pitido inicial, las criptomonedas relacionadas con el fútbol, como los fan tokens, ya cotizan activamente. A pesar de la variada regulación entre jurisdicciones, queda claro que la tecnología blockchain ya se ha integrado profundamente en las capas de liquidación, predicción y asociaciones oficiales del mayor evento futbolístico, marcando una transformación fundamental en su relación con el deporte.

marsbitHace 4 hora(s)

Cifras en la cadena de bloques en la víspera del inicio: 1.600 millones negociados antes de que comience el Mundial

marsbitHace 4 hora(s)

Trading

Spot
Futuros

Artículos destacados

Cómo comprar ERA

¡Bienvenido a HTX.com! Hemos hecho que comprar Caldera (ERA) sea simple y conveniente. Sigue nuestra guía paso a paso para iniciar tu viaje de criptos.Paso 1: crea tu cuenta HTXUtiliza tu correo electrónico o número de teléfono para registrarte y obtener una cuenta gratuita en HTX. Experimenta un proceso de registro sin complicaciones y desbloquea todas las funciones.Obtener mi cuentaPaso 2: ve a Comprar cripto y elige tu método de pagoTarjeta de crédito/débito: usa tu Visa o Mastercard para comprar Caldera (ERA) al instante.Saldo: utiliza fondos del saldo de tu cuenta HTX para tradear sin problemas.Terceros: hemos agregado métodos de pago populares como Google Pay y Apple Pay para mejorar la comodidad.P2P: tradear directamente con otros usuarios en HTX.Over-the-Counter (OTC): ofrecemos servicios personalizados y tipos de cambio competitivos para los traders.Paso 3: guarda tu Caldera (ERA)Después de comprar tu Caldera (ERA), guárdalo en tu cuenta HTX. Alternativamente, puedes enviarlo a otro lugar mediante transferencia blockchain o utilizarlo para tradear otras criptomonedas.Paso 4: tradear Caldera (ERA)Tradear fácilmente con Caldera (ERA) en HTX's mercado spot. Simplemente accede a tu cuenta, selecciona tu par de trading, ejecuta tus trades y monitorea en tiempo real. Ofrecemos una experiencia fácil de usar tanto para principiantes como para traders experimentados.

573 Vistas totalesPublicado en 2025.07.17Actualizado en 2026.06.02

Cómo comprar ERA

Discusiones

Bienvenido a la comunidad de HTX. Aquí puedes mantenerte informado sobre los últimos desarrollos de la plataforma y acceder a análisis profesionales del mercado. A continuación se presentan las opiniones de los usuarios sobre el precio de ERA (ERA).

活动图片