Diálogo con Mai-Lan de Amazon Web Services: El próximo campo de batalla de S3, cómo enfrentar la ola de consumo de datos en la era de los Agentes

marsbitPublicado a 2026-05-08Actualizado a 2026-05-08

Resumen

Al comienzo del año, el éxito de OpenClaw en el mercado chino reveló el enorme potencial de los agentes de IA. Sin embargo, esto planteó una pregunta crucial para todos los proveedores de servicios en la nube: ¿está preparada la infraestructura subyacente, especialmente la capa de datos, para manejar la proliferación y el consumo masivo de datos por parte de estos agentes? Mai-Lan Tomsen Bukovec, Vicepresidenta de Tecnología de Amazon Web Services, destaca que los agentes consumen datos de manera "extremadamente activa y agresiva", con una frecuencia de consultas que supera en varios órdenes de magnitud a la de los humanos. Este modelo de trabajo paralelo y masivo convierte el costo-efectividad en un factor decisivo para la infraestructura de agentes. Para abordar esta demanda en la era de la IA, Amazon S3 ha evolucionado con tres innovaciones clave: S3 Table (con soporte nativo para Apache Iceberg, facilitando la interacción de los agentes mediante SQL), S3 Vector (introduciendo vectores como tipo de dato nativo para contextualizar datos y actuar como memoria compartida) y S3 Files (permitiendo a los agentes interactuar con datos en S3 a través de un sistema de archivos POSIX familiar). Estas capacidades, basadas en los principios de disponibilidad, durabilidad y resiliencia de S3, posicionan al servicio como un pilar fundamental para soportar las cargas de trabajo de IA y el consumo intensivo de datos por parte de los agentes en los próximos años.

A principios de año, el éxito de OpenClaw en el mercado chino permitió que todos vieran el enorme potencial de los Agentes. Pero a esto le siguió una pregunta que todos los proveedores de la nube deben responder: cuando los Agentes empiezan a reproducirse como langostas cibernéticas y a invocar datos a alta frecuencia, ¿está preparada la infraestructura de la nube de IA, especialmente la capa de datos?

Por ejemplo, al desplegar Agentes en entornos de producción, los equipos de datos empresariales a menudo encuentran cuellos de botella a nivel de datos. La construcción de Agentes en diferentes plataformas como bases de datos vectoriales, relacionales, de grafos y data lakes/warehouses requiere de pipelines de sincronización de datos para mantener la actualidad de la información contextual. Sin embargo, en entornos de producción reales, esta información contextual se desactualiza gradualmente.

La urgencia de este problema radica en el patrón de consumo de datos de los Agentes, radicalmente distinto al de los ingenieros humanos.

"Los Agentes están consumiendo datos de una manera extremadamente activa y agresiva; su frecuencia de invocación a los data warehouses o data lakes es asombrosa."

Mai-Lan Tomsen Bukovec, Vicepresidenta de Tecnología de Amazon Web Services, señaló recientemente en una conversación con el autor que los Agentes operan en un modo de "selección paralela", es decir: no realizan una consulta a la vez, sino docenas o cientos simultáneamente en paralelo, comparando para encontrar la mejor ruta. Esto convierte a los Agentes en consumidores de datos mucho más agresivos que los humanos: con una frecuencia de invocación varios órdenes de magnitud mayor y un volumen de procesamiento de datos que crece exponencialmente.

Mai-Lan señaló además: "Ahora los clientes tienen un gran deseo de construir infraestructura para Agentes. El costo, o mejor dicho, la relación costo-beneficio, ya no es un factor secundario, sino decisivo. En los próximos seis meses a un año, con la explosión de los Agentes, la elección de los servicios de datos subyacentes será crucial."

La euforia por OpenClaw ahora está disminuyendo, dejando precisamente una advertencia sobre las pruebas de estrés a la capacidad de almacenamiento y cómputo subyacente de los proveedores de la nube. Mai-Lan cree que Amazon Web Services tiene una ventaja natural en este campo; la escala de Amazon S3 (Amazon Simple Storage Service) y la eficiencia de costo de Amazon Redshift y Amazon Athena bajo alta concurrencia están precisamente preparadas para esta forma de interacción de datos de los Agentes, de escala masiva y frecuencia ultraelevada.

Coincidiendo con el 20º aniversario del producto Amazon S3, y en torno a las demandas de los clientes en la era de la IA para el procesamiento de datos, Amazon S3 ha implementado recientemente tres grandes transformaciones: S3 Table (formato de tabla), S3 Files (archivos) y S3 Vector (vectorial).

Como el soporte nativo de S3 Table para Apache Iceberg. Mai-Lan señala que los Agentes tienden a interactuar directamente con datos en formato Iceberg a través de SQL. La lógica subyacente es que los Agentes se construyen sobre modelos de lenguaje grandes (LLMs), y estos LLMs han desarrollado una capacidad madura para manejar sintaxis SQL y formato de datos Iceberg durante su entrenamiento. Almacenar todos los datos de las tablas en formato Iceberg en S3 permite que los Agentes procesen datos de manera eficiente sin necesidad de aprender múltiples y complejas API de acceso. Actualmente, los Agentes muestran un alto grado de compatibilidad con S3 e Iceberg.

Cuando la capacidad Iceberg se introdujo en S3, desencadenó una nueva ola de innovación. Fuentes de datos como Postgres, Oracle, etc., comenzaron a escribir directamente en Iceberg, y los sistemas de Agentes pueden interactuar directamente con estas tablas. Y con el lanzamiento de S3 Vectors, cada vez más aplicaciones de IA están utilizando vectores como portadores de memoria compartida, inyectando así "estado" en la experiencia de interacción con la IA.

Mai-Lan también señala que los vectores se han introducido como un tipo de dato nativo de S3. La aplicación de vectores se concentra principalmente en dos dimensiones: primero, usar vectores para construir información contextual para los datos almacenados en S3; y segundo, usar vectores como memoria compartida. En los cinco meses posteriores al lanzamiento de S3 Vectors, la retroalimentación del mercado ha estado en línea con las expectativas. Muchos clientes comenzaron a usar esta funcionalidad, generando vectores a través de modelos de embedding para enriquecer el contexto de los datos. El uso de S3 Vectors como espacio de memoria para sistemas de Agentes ha experimentado un crecimiento explosivo.

Vale la pena destacar que S3 Files se lanzó hace unas semanas, permitiendo que los Agentes procesen datos en S3 a través del estándar POSIX, es decir, de la manera del sistema de archivos. En los sistemas de Agentes, los LLMs prestan gran atención a la "forma de archivo"; tanto las bibliotecas de Python como los scripts de Shell son contenidos familiares durante el entrenamiento de los LLMs. Los Agentes tienden naturalmente a utilizar archivos como interfaz de datos.

Por ello, el enfoque de diseño de S3 Files es montar un sistema de archivos EFS en un bucket de S3. A través de este mecanismo, los usuarios pueden procesar datos de S3 en el sistema de archivos basándose en el estándar POSIX: los archivos pequeños pueden accederse más rápido mediante la caché de EFS, mientras que los archivos grandes se transmiten directamente desde S3 en flujo. Esto permite que los Agentes interactúen de forma nativa con los datos de S3 usando el lenguaje familiar del sistema de archivos, y vean el sistema de archivos compartido como un "espacio de memoria compartida" proveniente de S3.

Desde la perspectiva del desarrollo de la capacidad de memoria de los LLMs, este avance es significativo. La experiencia actual de IA está introduciendo gradualmente contextos de conversación más profundos e interacciones personalizadas, ya sea entre Agentes, entre personas y Agentes, o entre Agentes y datos, el rendimiento del modelo continúa evolucionando. Al expandir aún más esta interfaz natural del sistema de archivos, se espera que la capacidad de memoria de los sistemas de Agentes obtenga una mejora más profunda.

El autor observa que, desde 2006, cuando predominaban datos semiestructurados como imágenes, pasando por los datos analíticos posteriores, y desde los primeros data warehouses hasta el auge de los data lakes, Amazon Web Services está impulsando actualmente con fuerza que Amazon S3 se convierta en una base clave para las cargas de trabajo de IA, adaptándose a las demandas actuales de los clientes. Mai-Lan cree que el núcleo del diseño de Amazon S3 es impulsar el crecimiento de los tipos de datos principales de manera económica, y siempre adherirse a principios como la disponibilidad, durabilidad y resiliencia de los datos. Y esta es precisamente la razón por la cual los clientes han confiado sus operaciones de datos a S3 durante 20 años, y lo que también sustentará sus posibilidades durante los próximos 20 años.

(Autor | Yang Li, Editor | Yang Lin)

Preguntas relacionadas

Q¿Cómo describe Mai-Lan Tomsen Bukovec el patrón de consumo de datos de los Agent en comparación con los ingenieros humanos?

AMai-Lan señala que los Agent consumen datos de manera extremadamente activa y agresiva, con una frecuencia de consulta a los lagos o almacenes de datos que es asombrosa. Su patrón de trabajo es de 'selección paralela óptima', ejecutando decenas o cientos de consultas simultáneas para encontrar la mejor ruta, lo que los convierte en consumidores de datos mucho más agresivos que los humanos, con una frecuencia de llamadas varios órdenes de magnitud mayor y un crecimiento exponencial en el rendimiento de datos.

Q¿Qué tres transformaciones principales se mencionan en el artículo que Amazon S3 ha implementado recientemente para adaptarse a la era de la IA y los Agent?

ALas tres transformaciones principales de Amazon S3 mencionadas son: S3 Table (formato tabular con soporte nativo para Apache Iceberg), S3 Files (acceso a datos vía sistema de archivos POSIX) y S3 Vectors (vectores como tipo de datos nativo para enriquecer contexto y actuar como memoria compartida).

QSegún el artículo, ¿qué ventaja clave ofrece el soporte de Apache Iceberg en S3 Table para la interacción de los Agent con los datos?

AEl soporte nativo de Apache Iceberg en S3 Table permite a los Agent interactuar eficientemente con los datos mediante SQL, ya que los modelos de lenguaje grande (LLM) en los que se basan están entrenados para manejar sintaxis SQL y el formato Iceberg. Esto elimina la necesidad de que los Agent aprendan múltiples API complejas para acceder a los datos almacenados en S3.

Q¿Cómo funciona S3 Files para permitir que los Agent interactúen con los datos de S3, y por qué este enfoque es natural para ellos?

AS3 Files permite a los Agent acceder a los datos en S3 a través del estándar POSIX, montando un sistema de archivos EFS en un bucket de S3. Los Agent pueden interactuar con los datos como archivos, ya sea accediendo a archivos pequeños desde la caché de EFS o transmitiendo archivos grandes directamente desde S3. Este enfoque es natural para los Agent porque los LLM están familiarizados con el concepto de 'archivos' (como bibliotecas de Python o scripts de Shell) durante su entrenamiento.

Q¿Qué papel juegan los vectores (S3 Vectors) en los sistemas de Agent según las observaciones de Mai-Lan tras su lanzamiento?

ATras el lanzamiento de S3 Vectors, Mai-Lan observa que los vectores se utilizan principalmente en dos dimensiones: para construir información de contexto alrededor de los datos almacenados en S3, y para actuar como una memoria compartida en los sistemas de Agent. En los cinco meses posteriores a su lanzamiento, el uso de S3 Vectors como espacio de memoria para los Agent ha experimentado un crecimiento explosivo, permitiendo experiencias de IA con mayor contexto conversacional e interacciones personalizadas.

Lecturas Relacionadas

Del sistema financiero paralelo al principal: llega la ventana histórica de la era de los valores en cadena

Del ecosistema paralelo a las finanzas principales: llega la ventana histórica para la era de los valores tokenizados. En la última década, la industria cripto ha funcionado como un experimento financiero paralelo, construyendo su propio ecosistema con monedas, mercados y narrativas. Sin embargo, una barrera lo separaba del sistema financiero tradicional. Ahora, esa barrera se está derribando. La primera fase, desde las ICO hasta DeFi y NFT, fue una evolución interna dentro de un ecosistema cerrado. Atrajo capital y usuarios, pero seguía siendo un circuito aparte. Incluso los ETF de Bitcoin, que abren una vía para que el capital tradicional compre activos cripto, no integran los activos del mundo real en la cadena. La verdadera transformación, más grande que los ETF, es la tokenización de valores del mundo real: acciones, bonos, fondos y otros activos financieros tradicionales representados en blockchain. Esto podría rediseñar la infraestructura financiera, fusionando funciones de custodia, liquidación y comercio en redes automatizadas, reduciendo tiempos y complejidad. El próximo gran cambio no será la guerra entre cadenas de bloques por velocidad, sino la competencia para construir el nuevo sistema financiero global. La clave ya no será el rendimiento técnico, sino la calidad de los activos y la liquidez. Si los principales activos globales, como acciones de empresas líderes, se tokenizan, la frontera entre las finanzas tradicionales y las cripto desaparecerá. El futuro no está en crear un mundo nuevo, sino en integrarse plenamente en el sistema financiero global existente. La fusión entre las finanzas tradicionales y el ecosistema cripto podría marcar el comienzo de la mayor historia de crecimiento de la industria.

marsbitHace 28 min(s)

Del sistema financiero paralelo al principal: llega la ventana histórica de la era de los valores en cadena

marsbitHace 28 min(s)

Wang Chuan: Cuando Wang de al lado ganó treinta veces invirtiendo en acciones de almacenamiento, ¿cómo puede aún no estar ansioso? (Seis) - La trampa de los productos homogéneos

El artículo analiza los riesgos de invertir en acciones de empresas de almacenamiento, un sector de productos altamente homogeneizados y cíclicos. Utiliza el ejemplo de Iomega, cuyo precio de las acciones subió 160 veces entre 1994 y 1996, para luego caer más del 97% tras la llegada de competidores como los CD-R. Explica que la dinámica del sector se basa en una demanda elástica frente a una oferta rígida, lo que provoca volatilidad extrema en los precios, como se ha visto históricamente con los chips DRAM. Actualmente (2026), los precios y márgenes de empresas como Sandisk y Micron se han disparado debido a la fuerte demanda de memoria para IA. Sin embargo, el autor advierte que estos altos márgenes atraerán nueva capacidad productiva, lo que eventualmente hará caer los precios y beneficios. Cuestiona la eficacia de los contratos a largo plazo para fijar precios, comparándolos con pactos frágiles, y señala la asimetría de riesgo: múltiples factores (recesión, recortes en IA, nueva capacidad china, innovaciones técnicas) podrían desequilibrar la oferta y la demanda. Concluye que un PER bajo en el pico del ciclo es una trampa mortal, ya que los beneficios pueden evaporarse rápidamente, advirtiendo contra la inversión simplista en este sector volátil.

marsbitHace 35 min(s)

Wang Chuan: Cuando Wang de al lado ganó treinta veces invirtiendo en acciones de almacenamiento, ¿cómo puede aún no estar ansioso? (Seis) - La trampa de los productos homogéneos

marsbitHace 35 min(s)

Wang Chuan: Cómo mantener la calma cuando el vecino Lao Wang multiplicó por treinta su inversión en acciones de almacenamiento (6) - La trampa de los productos homogéneos

**Resumen: Las trampas de los productos básicos en la industria del almacenamiento** Este artículo analiza los riesgos cíclicos y las características de los productos básicos en la industria del almacenamiento de datos, utilizando casos históricos y la situación actual para advertir sobre los peligros de invertir en acciones del sector. El autor comienza con el ejemplo de Iomega en los años 90. Su unidad Zip fue un éxito inicial, haciendo que su acción subiera más de 160 veces en año y medio, antes de colapsar un 97% tras la llegada de tecnologías competidoras más baratas (CD-R). Este patrón se repite en toda la industria: productos como la memoria DRAM son altamente homogéneos, sin valor de marca, lo que genera volatilidad extrema en los precios. Empresas como Micron han visto su acción estancada durante 25 años, y son comunes las quiebras (Mostek, Qimonda, etc.). La esencia del problema es la **demanda elástica frente a una oferta rígida, de capital intensivo y largo plazo de ampliación**. Cuando los precios suben (como desde 2025 debido a la demanda de memoria para IA), los fabricantes obtienen márgenes brutos enormes (ej: SanDisk pasó de 22.5% a 78.3%), principalmente por el aumento de precios, no de volumen. Sin embargo, estos altos márgenes destruyen la demanda marginal y atraen nueva capacidad. Para 2027, se espera que una nueva ola de capacidad entre en el mercado. El autor desmonta argumentos alcistas: los acuerdos de suministro a largo plazo (LTA) son frágiles y se pueden romper cuando cambian las condiciones del mercado. Además, la situación es asimétrica: basta un nuevo competidor (como empresas chinas), una recesión, una reducción en la inversión en IA o una innovación que reduzca la necesidad de memoria para desequilibrar el mercado. Una **trampa fatal** es que, en el pico del ciclo, las acciones de almacenamiento a menudo muestran bajos ratios P/E (relación precio-beneficio), atrayendo a inversores incautos que creen que es una "inversión en valor". En realidad, es el momento de mayor riesgo, ya que una caída en los precios de las materias primas puede hacer desaparecer esas ganancias rápidamente. En conclusión, la industria del almacenamiento está sujeta a ciclos brutales donde la alta rentabilidad contiene las semillas de su propia destrucción, lo que la convierte en una arena peligrosa para los inversores desprevenidos.

链捕手Hace 54 min(s)

Wang Chuan: Cómo mantener la calma cuando el vecino Lao Wang multiplicó por treinta su inversión en acciones de almacenamiento (6) - La trampa de los productos homogéneos

链捕手Hace 54 min(s)

Llega el AI PC: ¡Modelos masivos de 120B locales ahora son posibles! NVIDIA redefine la base de la "computadora personal con IA" con RTX Spark

En la conferencia GTC 2026, NVIDIA presentó el chip RTX Spark, redefiniendo el estándar de hardware para los "PCs personales de IA". Integrando una GPU Blackwell, una CPU Grace de 20 núcleos y una arquitectura de memoria unificada de hasta 128GB, el SoC ofrece un rendimiento de 1 petaflop (1000 TOPS) para IA. Esto permite ejecutar localmente modelos de lenguaje de hasta 120B parámetros con ventanas de contexto de hasta un millón de tokens, superando ampliamente las capacidades de los NPU actuales en PCs con IA. Principales fabricantes de equipos originales (OEM) como ASUS, Dell, HP, Lenovo, Microsoft Surface y MSI lanzarán portátiles delgados y equipos de sobremesa compactos con este chip en otoño. NVIDIA y Microsoft colaboran en seguridad, integrando el entorno de ejecución en sandbox OpenShell en Windows para aislar y gestionar de forma segura los agentes de IA locales. Adobe anunció una reestructuración desde el núcleo de Photoshop y Premiere para adaptarse a la arquitectura de memoria unificada, prometiendo mejoras de rendimiento. La llegada de RTX Spark marca un cambio en la industria del PC, donde la GPU se convierte en el componente central del sistema, desafiando el dominio tradicional de las CPU x86. Quedan por ver detalles clave como el precio final, la gestión térmica en portátiles y el rendimiento real en tareas no relacionadas con la IA.

marsbitHace 1 hora(s)

Llega el AI PC: ¡Modelos masivos de 120B locales ahora son posibles! NVIDIA redefine la base de la "computadora personal con IA" con RTX Spark

marsbitHace 1 hora(s)

Trading

Spot
Futuros

Artículos destacados

Cómo comprar ERA

¡Bienvenido a HTX.com! Hemos hecho que comprar Caldera (ERA) sea simple y conveniente. Sigue nuestra guía paso a paso para iniciar tu viaje de criptos.Paso 1: crea tu cuenta HTXUtiliza tu correo electrónico o número de teléfono para registrarte y obtener una cuenta gratuita en HTX. Experimenta un proceso de registro sin complicaciones y desbloquea todas las funciones.Obtener mi cuentaPaso 2: ve a Comprar cripto y elige tu método de pagoTarjeta de crédito/débito: usa tu Visa o Mastercard para comprar Caldera (ERA) al instante.Saldo: utiliza fondos del saldo de tu cuenta HTX para tradear sin problemas.Terceros: hemos agregado métodos de pago populares como Google Pay y Apple Pay para mejorar la comodidad.P2P: tradear directamente con otros usuarios en HTX.Over-the-Counter (OTC): ofrecemos servicios personalizados y tipos de cambio competitivos para los traders.Paso 3: guarda tu Caldera (ERA)Después de comprar tu Caldera (ERA), guárdalo en tu cuenta HTX. Alternativamente, puedes enviarlo a otro lugar mediante transferencia blockchain o utilizarlo para tradear otras criptomonedas.Paso 4: tradear Caldera (ERA)Tradear fácilmente con Caldera (ERA) en HTX's mercado spot. Simplemente accede a tu cuenta, selecciona tu par de trading, ejecuta tus trades y monitorea en tiempo real. Ofrecemos una experiencia fácil de usar tanto para principiantes como para traders experimentados.

568 Vistas totalesPublicado en 2025.07.17Actualizado en 2025.07.17

Cómo comprar ERA

Discusiones

Bienvenido a la comunidad de HTX. Aquí puedes mantenerte informado sobre los últimos desarrollos de la plataforma y acceder a análisis profesionales del mercado. A continuación se presentan las opiniones de los usuarios sobre el precio de ERA (ERA).

活动图片