Diálogo con Mai-Lan de Amazon Web Services: El próximo campo de batalla de S3, cómo enfrentar la ola de consumo de datos en la era de los Agentes

marsbitPublicado a 2026-05-08Actualizado a 2026-05-08

Resumen

Al comienzo del año, el éxito de OpenClaw en el mercado chino reveló el enorme potencial de los agentes de IA. Sin embargo, esto planteó una pregunta crucial para todos los proveedores de servicios en la nube: ¿está preparada la infraestructura subyacente, especialmente la capa de datos, para manejar la proliferación y el consumo masivo de datos por parte de estos agentes? Mai-Lan Tomsen Bukovec, Vicepresidenta de Tecnología de Amazon Web Services, destaca que los agentes consumen datos de manera "extremadamente activa y agresiva", con una frecuencia de consultas que supera en varios órdenes de magnitud a la de los humanos. Este modelo de trabajo paralelo y masivo convierte el costo-efectividad en un factor decisivo para la infraestructura de agentes. Para abordar esta demanda en la era de la IA, Amazon S3 ha evolucionado con tres innovaciones clave: S3 Table (con soporte nativo para Apache Iceberg, facilitando la interacción de los agentes mediante SQL), S3 Vector (introduciendo vectores como tipo de dato nativo para contextualizar datos y actuar como memoria compartida) y S3 Files (permitiendo a los agentes interactuar con datos en S3 a través de un sistema de archivos POSIX familiar). Estas capacidades, basadas en los principios de disponibilidad, durabilidad y resiliencia de S3, posicionan al servicio como un pilar fundamental para soportar las cargas de trabajo de IA y el consumo intensivo de datos por parte de los agentes en los próximos años.

A principios de año, el éxito de OpenClaw en el mercado chino permitió que todos vieran el enorme potencial de los Agentes. Pero a esto le siguió una pregunta que todos los proveedores de la nube deben responder: cuando los Agentes empiezan a reproducirse como langostas cibernéticas y a invocar datos a alta frecuencia, ¿está preparada la infraestructura de la nube de IA, especialmente la capa de datos?

Por ejemplo, al desplegar Agentes en entornos de producción, los equipos de datos empresariales a menudo encuentran cuellos de botella a nivel de datos. La construcción de Agentes en diferentes plataformas como bases de datos vectoriales, relacionales, de grafos y data lakes/warehouses requiere de pipelines de sincronización de datos para mantener la actualidad de la información contextual. Sin embargo, en entornos de producción reales, esta información contextual se desactualiza gradualmente.

La urgencia de este problema radica en el patrón de consumo de datos de los Agentes, radicalmente distinto al de los ingenieros humanos.

"Los Agentes están consumiendo datos de una manera extremadamente activa y agresiva; su frecuencia de invocación a los data warehouses o data lakes es asombrosa."

Mai-Lan Tomsen Bukovec, Vicepresidenta de Tecnología de Amazon Web Services, señaló recientemente en una conversación con el autor que los Agentes operan en un modo de "selección paralela", es decir: no realizan una consulta a la vez, sino docenas o cientos simultáneamente en paralelo, comparando para encontrar la mejor ruta. Esto convierte a los Agentes en consumidores de datos mucho más agresivos que los humanos: con una frecuencia de invocación varios órdenes de magnitud mayor y un volumen de procesamiento de datos que crece exponencialmente.

Mai-Lan señaló además: "Ahora los clientes tienen un gran deseo de construir infraestructura para Agentes. El costo, o mejor dicho, la relación costo-beneficio, ya no es un factor secundario, sino decisivo. En los próximos seis meses a un año, con la explosión de los Agentes, la elección de los servicios de datos subyacentes será crucial."

La euforia por OpenClaw ahora está disminuyendo, dejando precisamente una advertencia sobre las pruebas de estrés a la capacidad de almacenamiento y cómputo subyacente de los proveedores de la nube. Mai-Lan cree que Amazon Web Services tiene una ventaja natural en este campo; la escala de Amazon S3 (Amazon Simple Storage Service) y la eficiencia de costo de Amazon Redshift y Amazon Athena bajo alta concurrencia están precisamente preparadas para esta forma de interacción de datos de los Agentes, de escala masiva y frecuencia ultraelevada.

Coincidiendo con el 20º aniversario del producto Amazon S3, y en torno a las demandas de los clientes en la era de la IA para el procesamiento de datos, Amazon S3 ha implementado recientemente tres grandes transformaciones: S3 Table (formato de tabla), S3 Files (archivos) y S3 Vector (vectorial).

Como el soporte nativo de S3 Table para Apache Iceberg. Mai-Lan señala que los Agentes tienden a interactuar directamente con datos en formato Iceberg a través de SQL. La lógica subyacente es que los Agentes se construyen sobre modelos de lenguaje grandes (LLMs), y estos LLMs han desarrollado una capacidad madura para manejar sintaxis SQL y formato de datos Iceberg durante su entrenamiento. Almacenar todos los datos de las tablas en formato Iceberg en S3 permite que los Agentes procesen datos de manera eficiente sin necesidad de aprender múltiples y complejas API de acceso. Actualmente, los Agentes muestran un alto grado de compatibilidad con S3 e Iceberg.

Cuando la capacidad Iceberg se introdujo en S3, desencadenó una nueva ola de innovación. Fuentes de datos como Postgres, Oracle, etc., comenzaron a escribir directamente en Iceberg, y los sistemas de Agentes pueden interactuar directamente con estas tablas. Y con el lanzamiento de S3 Vectors, cada vez más aplicaciones de IA están utilizando vectores como portadores de memoria compartida, inyectando así "estado" en la experiencia de interacción con la IA.

Mai-Lan también señala que los vectores se han introducido como un tipo de dato nativo de S3. La aplicación de vectores se concentra principalmente en dos dimensiones: primero, usar vectores para construir información contextual para los datos almacenados en S3; y segundo, usar vectores como memoria compartida. En los cinco meses posteriores al lanzamiento de S3 Vectors, la retroalimentación del mercado ha estado en línea con las expectativas. Muchos clientes comenzaron a usar esta funcionalidad, generando vectores a través de modelos de embedding para enriquecer el contexto de los datos. El uso de S3 Vectors como espacio de memoria para sistemas de Agentes ha experimentado un crecimiento explosivo.

Vale la pena destacar que S3 Files se lanzó hace unas semanas, permitiendo que los Agentes procesen datos en S3 a través del estándar POSIX, es decir, de la manera del sistema de archivos. En los sistemas de Agentes, los LLMs prestan gran atención a la "forma de archivo"; tanto las bibliotecas de Python como los scripts de Shell son contenidos familiares durante el entrenamiento de los LLMs. Los Agentes tienden naturalmente a utilizar archivos como interfaz de datos.

Por ello, el enfoque de diseño de S3 Files es montar un sistema de archivos EFS en un bucket de S3. A través de este mecanismo, los usuarios pueden procesar datos de S3 en el sistema de archivos basándose en el estándar POSIX: los archivos pequeños pueden accederse más rápido mediante la caché de EFS, mientras que los archivos grandes se transmiten directamente desde S3 en flujo. Esto permite que los Agentes interactúen de forma nativa con los datos de S3 usando el lenguaje familiar del sistema de archivos, y vean el sistema de archivos compartido como un "espacio de memoria compartida" proveniente de S3.

Desde la perspectiva del desarrollo de la capacidad de memoria de los LLMs, este avance es significativo. La experiencia actual de IA está introduciendo gradualmente contextos de conversación más profundos e interacciones personalizadas, ya sea entre Agentes, entre personas y Agentes, o entre Agentes y datos, el rendimiento del modelo continúa evolucionando. Al expandir aún más esta interfaz natural del sistema de archivos, se espera que la capacidad de memoria de los sistemas de Agentes obtenga una mejora más profunda.

El autor observa que, desde 2006, cuando predominaban datos semiestructurados como imágenes, pasando por los datos analíticos posteriores, y desde los primeros data warehouses hasta el auge de los data lakes, Amazon Web Services está impulsando actualmente con fuerza que Amazon S3 se convierta en una base clave para las cargas de trabajo de IA, adaptándose a las demandas actuales de los clientes. Mai-Lan cree que el núcleo del diseño de Amazon S3 es impulsar el crecimiento de los tipos de datos principales de manera económica, y siempre adherirse a principios como la disponibilidad, durabilidad y resiliencia de los datos. Y esta es precisamente la razón por la cual los clientes han confiado sus operaciones de datos a S3 durante 20 años, y lo que también sustentará sus posibilidades durante los próximos 20 años.

(Autor | Yang Li, Editor | Yang Lin)

Preguntas relacionadas

Q¿Cómo describe Mai-Lan Tomsen Bukovec el patrón de consumo de datos de los Agent en comparación con los ingenieros humanos?

AMai-Lan señala que los Agent consumen datos de manera extremadamente activa y agresiva, con una frecuencia de consulta a los lagos o almacenes de datos que es asombrosa. Su patrón de trabajo es de 'selección paralela óptima', ejecutando decenas o cientos de consultas simultáneas para encontrar la mejor ruta, lo que los convierte en consumidores de datos mucho más agresivos que los humanos, con una frecuencia de llamadas varios órdenes de magnitud mayor y un crecimiento exponencial en el rendimiento de datos.

Q¿Qué tres transformaciones principales se mencionan en el artículo que Amazon S3 ha implementado recientemente para adaptarse a la era de la IA y los Agent?

ALas tres transformaciones principales de Amazon S3 mencionadas son: S3 Table (formato tabular con soporte nativo para Apache Iceberg), S3 Files (acceso a datos vía sistema de archivos POSIX) y S3 Vectors (vectores como tipo de datos nativo para enriquecer contexto y actuar como memoria compartida).

QSegún el artículo, ¿qué ventaja clave ofrece el soporte de Apache Iceberg en S3 Table para la interacción de los Agent con los datos?

AEl soporte nativo de Apache Iceberg en S3 Table permite a los Agent interactuar eficientemente con los datos mediante SQL, ya que los modelos de lenguaje grande (LLM) en los que se basan están entrenados para manejar sintaxis SQL y el formato Iceberg. Esto elimina la necesidad de que los Agent aprendan múltiples API complejas para acceder a los datos almacenados en S3.

Q¿Cómo funciona S3 Files para permitir que los Agent interactúen con los datos de S3, y por qué este enfoque es natural para ellos?

AS3 Files permite a los Agent acceder a los datos en S3 a través del estándar POSIX, montando un sistema de archivos EFS en un bucket de S3. Los Agent pueden interactuar con los datos como archivos, ya sea accediendo a archivos pequeños desde la caché de EFS o transmitiendo archivos grandes directamente desde S3. Este enfoque es natural para los Agent porque los LLM están familiarizados con el concepto de 'archivos' (como bibliotecas de Python o scripts de Shell) durante su entrenamiento.

Q¿Qué papel juegan los vectores (S3 Vectors) en los sistemas de Agent según las observaciones de Mai-Lan tras su lanzamiento?

ATras el lanzamiento de S3 Vectors, Mai-Lan observa que los vectores se utilizan principalmente en dos dimensiones: para construir información de contexto alrededor de los datos almacenados en S3, y para actuar como una memoria compartida en los sistemas de Agent. En los cinco meses posteriores a su lanzamiento, el uso de S3 Vectors como espacio de memoria para los Agent ha experimentado un crecimiento explosivo, permitiendo experiencias de IA con mayor contexto conversacional e interacciones personalizadas.

Lecturas Relacionadas

Nuevo campo de batalla en la competencia de IA: la memoria a largo plazo se convierte en un punto crítico, ¿cómo pueden los usuarios proteger su propiedad del contexto?

**Resumen: La propiedad de la memoria a largo plazo, el nuevo campo de batalla en la IA** El papel de la IA está evolucionando de una herramienta de chat a un asistente digital personal que colabora a largo plazo en flujos de trabajo. Este cambio revela un nuevo punto crítico: la gestión de la **memoria a largo plazo** y el **contexto del usuario**. Actualmente, las principales plataformas de IA (como ChatGPT, Claude, Gemini) están desarrollando funciones de memoria, pero estas permanecen como "islas" cerradas dentro de cada ecosistema. Si un usuario cambia de modelo o plataforma, pierde todo el contexto acumulado: sus preferencias, hábitos de trabajo e historial de interacciones. Ante esto, **ZetaChain**, una infraestructura originalmente de interoperabilidad entre cadenas de bloques, ha girado su estrategia hacia la IA. Su objetivo es construir una **Capa de Memoria Privada** (Private Memory Layer) independiente de las plataformas. A través de su producto de consumo, Anuma, busca que los usuarios sean dueños de su memoria, contexto e identidad digital cifrados. Esto permitiría llevar este perfil personalizado a diferentes modelos y agentes de IA sin depender de una sola compañía. La visión de ZetaChain va más allá, planteando un futuro "**Capa de Consumo de IA**" (AI Consumer Layer). En este escenario, múltiples agentes de IA especializados trabajarían para el usuario, compartiendo un contexto unificado y un sistema de **permisos programables y revocables** registrados en cadena de bloques. Esto otorgaría al usuario control total sobre qué datos accede cada agente y por cuánto tiempo. Finalmente, el proyecto propone que su token, **ZETA**, evolucione para actuar como "token de infraestructura de IA", facilitando el pago por acceso a modelos, la compensación entre agentes y la economía para creadores que empaqueten su conocimiento en herramientas de IA. El núcleo de su propuesta es una cuestión de propiedad: en un futuro dominado por asistentes de IA, ¿pertenecen la memoria, el contexto y la identidad digital al usuario o a la plataforma? ZetaChain apuesta por devolver el control al usuario.

marsbitHace 5 min(s)

Nuevo campo de batalla en la competencia de IA: la memoria a largo plazo se convierte en un punto crítico, ¿cómo pueden los usuarios proteger su propiedad del contexto?

marsbitHace 5 min(s)

Fin del mito de "acumular criptomonedas": Strategy vende BTC por primera vez en 3 años

El "mito de acumular bitcoins" llega a su fin: Strategy, conocida como la "mayor mano de diamante de BTC" y "primera acción DAT", ha vendido bitcoins por primera vez en tres años. Según sus divulgaciones, la empresa vendió 32 BTC la semana pasada a un precio promedio de 77,135 dólares, obteniendo 2.5 millones de dólares. Esta venta, destinada principalmente a pagar dividendos de su producto de crédito digital STRC, contrasta con su histórica postura de acumulación. A pesar de esta venta menor, Strategy aún posee 843,706 BTC, con un costo promedio de 75,699 dólares, registrando actualmente una pérdida flotante de aproximadamente 2,932 millones de dólares. El movimiento ha impactado negativamente al mercado, contribuyendo a que el BTC cayera por debajo de los 71,000 dólares y afectando las acciones relacionadas con criptomonedas. El evento también generó polémica en el mercado de predicciones Polymarket, donde se resolvió que no hubo venta en mayo debido a la falta de un anuncio oficial, destacando las peculiaridades de estos mercados. La acción de Strategy ha reavivado el debate sobre la narrativa del BTC como "oro digital" y activo refugio, con figuras como Peter Schiff y Mark Cuban expresando escepticismo. Analistas como JPMorgan señalan un debilitamiento en el interés por activos refugio tradicionales y alternativos. El mercado ahora observa si futuras políticas, como las de una administración Trump, podrían impulsar nuevamente al sector.

Odaily星球日报Hace 31 min(s)

Fin del mito de "acumular criptomonedas": Strategy vende BTC por primera vez en 3 años

Odaily星球日报Hace 31 min(s)

Vitalik: Construir activos de seguimiento de índices basados en opciones en lugar de deuda

Vitalik Buterin propone un nuevo enfoque para crear activos sintéticos que rastreen un índice de precios (como USD/ETH) sin depender de emisores centralizados, resolviendo el problema fundamental de los activos de deuda subyacente que requieren liquidaciones en tiempo real. La idea central es sustituir la deuda por **opciones sintéticas**. Se definen dos activos, **P** y **N**, que se pueden crear o fusionar por 1 ETH. Al vencimiento, un oráculo determina el valor del índice T. P recibe `min(1, S / x)` ETH y N recibe el resto, garantizando que P + N siempre iguale 1 ETH sin riesgo de liquidación. Para obtener exposición estable al índice (ej., USD), los usuarios deben mantener opciones P con precios de ejercicio (S) muy por debajo del precio actual y **rebalancearlas** periódicamente antes de que el precio se acerque demasiado a S, evitando así la deriva cuadrática en su valor. Este rebalanceo puede ser automatizado por el usuario o un DAO. Las **ventajas clave** son: * Elimina la dependencia de **oráculos en tiempo real** y de liquidaciones forzosas. * Reduce el riesgo de MEV y ataques a oráculos, ya que los usuarios controlan el momento y la fuente de datos para rebalancear. * Ofrece mayor flexibilidad, aunque acepta una pequeña deriva de volatilidad (ej., 1-4% anual) a cambio de una mayor estabilidad y seguridad. El principal desafío es minimizar el deslizamiento (slippage) durante el rebalanceo. Buterin argumenta que esta deriva controlada es aceptable para muchos casos de uso que buscan estabilidad de precios, a diferencia de una réplica contable perfecta de una moneda fiduciaria.

marsbitHace 1 hora(s)

Vitalik: Construir activos de seguimiento de índices basados en opciones en lugar de deuda

marsbitHace 1 hora(s)

“Escasez de agua”: el punto débil oculto de la infraestructura de IA

En junio de 2026, SpaceX destacó en su prospecto de OPV un riesgo inesperado: la escasez de agua para refrigerar sus centros de datos de IA, elevando el agua al nivel de la electricidad y los procesadores como limitación clave para el crecimiento de la capacidad computacional. Estudios revelan la enorme huella hídrica de la industria. Solo en EE. UU., los centros de datos consumieron directamente 170.000 millones de galones de agua en 2023, cifra que podría cuadruplicarse para 2028. Gigantes como Google y Meta reportan consumos anuales de miles de millones de galones, principalmente por torres de refrigeración por evaporación que consumen el agua de forma irreversible. Este consumo masivo genera conflictos en regiones áridas como Querétaro (México) o Arizona (EE. UU.), donde proyectos enfrentan una fuerte oposición comunitaria por competir con el suministro local. La presión aumenta: desde 2024, proyectos por valor de 640.000 millones de dólares se han retrasado o cancelado en EE. UU., siendo el agua una razón principal. Inversores y reguladores prestan ahora atención. Accionistas exigen mayor transparencia sobre el uso del agua, transformándola de un tema ESG a un riesgo financiero operativo. Aunque se exploran soluciones técnicas como la refrigeración líquida, estas implican compensaciones de coste y energía. La paradoja es evidente: mientras los líderes de la IA la presentan como un servicio público omnipresente como el agua, su infraestructura física depende críticamente de un recurso cada vez más escaso y disputado. La carrera por la capacidad de computación ya no está impulsada solo por la tecnología y el capital, sino también por la disponibilidad de un recurso básico: el agua.

marsbitHace 2 hora(s)

“Escasez de agua”: el punto débil oculto de la infraestructura de IA

marsbitHace 2 hora(s)

Trading

Spot
Futuros

Artículos destacados

Cómo comprar ERA

¡Bienvenido a HTX.com! Hemos hecho que comprar Caldera (ERA) sea simple y conveniente. Sigue nuestra guía paso a paso para iniciar tu viaje de criptos.Paso 1: crea tu cuenta HTXUtiliza tu correo electrónico o número de teléfono para registrarte y obtener una cuenta gratuita en HTX. Experimenta un proceso de registro sin complicaciones y desbloquea todas las funciones.Obtener mi cuentaPaso 2: ve a Comprar cripto y elige tu método de pagoTarjeta de crédito/débito: usa tu Visa o Mastercard para comprar Caldera (ERA) al instante.Saldo: utiliza fondos del saldo de tu cuenta HTX para tradear sin problemas.Terceros: hemos agregado métodos de pago populares como Google Pay y Apple Pay para mejorar la comodidad.P2P: tradear directamente con otros usuarios en HTX.Over-the-Counter (OTC): ofrecemos servicios personalizados y tipos de cambio competitivos para los traders.Paso 3: guarda tu Caldera (ERA)Después de comprar tu Caldera (ERA), guárdalo en tu cuenta HTX. Alternativamente, puedes enviarlo a otro lugar mediante transferencia blockchain o utilizarlo para tradear otras criptomonedas.Paso 4: tradear Caldera (ERA)Tradear fácilmente con Caldera (ERA) en HTX's mercado spot. Simplemente accede a tu cuenta, selecciona tu par de trading, ejecuta tus trades y monitorea en tiempo real. Ofrecemos una experiencia fácil de usar tanto para principiantes como para traders experimentados.

570 Vistas totalesPublicado en 2025.07.17Actualizado en 2026.06.02

Cómo comprar ERA

Discusiones

Bienvenido a la comunidad de HTX. Aquí puedes mantenerte informado sobre los últimos desarrollos de la plataforma y acceder a análisis profesionales del mercado. A continuación se presentan las opiniones de los usuarios sobre el precio de ERA (ERA).

活动图片