Dialogue avec Mai-Lan d'Amazon Web Services : Le prochain champ de bataille de S3, comment répondre au raz-de-marée de consommation de données à l'ère des Agents

marsbitPublié le 2026-05-08Dernière mise à jour le 2026-05-08

Résumé

Le récent engouement en Chine pour OpenClaw a mis en lumière le potentiel des Agents IA, mais aussi un défi crucial pour les fournisseurs de cloud : leurs infrastructures de données sont-elles prêtes pour la consommation frénétique de données par ces Agents ? Mai-Lan Tomsen Bukovec, vice-présidente technique d'Amazon Web Services, explique que les Agents consomment les données de manière "agressive" et parallèle, avec des appels aux entrepôts de données qui augmentent de façon exponentielle en fréquence et en volume. Face à cela, le choix des services de données sous-jacents devient déterminant pour le coût et la performance. Amazon S3, à l'occasion de ses 20 ans, se positionne comme socle clé pour ces charges de travail IA grâce à trois évolutions majeures. S3 Table, avec son support natif d'Apache Iceberg, permet aux Agents d'interagir facilement via SQL. S3 Vectors, en faisant du vecteur un type de données natif, sert à la fois à contextualiser les données et de "mémoire partagée" pour les Agents. Enfin, S3 Files permet aux Agents d'accéder aux données via une interface système de fichiers POSIX familière. Ces innovations visent à permettre aux Agents d'interagir de manière native et efficace avec les données, en utilisant S3 comme un espace de mémoire partagé et durable. La philosophie de S3 – économie, disponibilité, résilience – qui a fidélisé les clients pendant 20 ans, est ainsi adaptée pour soutenir l'ère des Agents IA.

Début d'année, le succès retentissant d'OpenClaw en Chine a permis à tout le monde d'entrevoir l'immense potentiel des Agents. Cependant, cela a aussi soulevé une question cruciale à laquelle tous les fournisseurs de cloud doivent répondre : lorsque les Agents commencent à se multiplier comme des écrevisses cybernétiques et à interroger les données à haute fréquence, l'infrastructure cloud de l'IA, en particulier la couche de données, est-elle prête ?

Par exemple, les équipes de données des entreprises rencontrent souvent des goulots d'étranglement au niveau des données lorsqu'elles déploient des Agents en environnement de production. Construire des Agents sur différentes plateformes (bases de données vectorielles, relationnelles, orientées graphes, lacs de données, etc.) nécessite de synchroniser les pipelines de données pour maintenir l'actualité des informations contextuelles. Mais dans des environnements de production réels, ces informations contextuelles deviennent progressivement obsolètes.

L'urgence de ce problème vient du mode de consommation des données radicalement différent entre les Agents et les ingénieurs humains.

« Les Agents consomment les données d'une manière extrêmement active et agressive, leur fréquence d'interrogation des entrepôts de données ou des lacs de données est stupéfiante. »

Mai-Lan Tomsen Bukovec, Vice-Présidente Technique chez Amazon Web Services, a récemment indiqué lors d'un échange avec l'auteur que les Agents fonctionnent selon un mode opératoire de « sélection parallèle optimale ». C'est-à-dire qu'au lieu d'une requête à la fois, ils en exécutent des dizaines, voire des centaines, en parallèle, en comparant les résultats pour trouver le meilleur chemin. Cela fait des Agents des consommateurs de données bien plus agressifs que les humains, avec une fréquence d'appel supérieure de plusieurs ordres de grandeur et une augmentation exponentielle du débit de données.

Mai-Lan ajoute : « Actuellement, les clients souhaitent vivement construire une infrastructure pour Agents, et le coût, ou plutôt le rapport qualité-prix, n'est plus un facteur secondaire, il devient déterminant. Dans les six mois à un an à venir, avec l'explosion des Agents, le choix des services de données sous-jacents deviendra crucial. »

Aujourd'hui, l'euphorie autour d'OpenClaw retombe, laissant place à un avertissement sous forme de test de résistance sur les capacités de stockage et de calcul de base des fournisseurs de cloud. Mai-Lan estime qu'Amazon Web Services possède un avantage naturel dans ce domaine : l'échelle d'Amazon S3 (Amazon Simple Storage Service), ainsi que l'efficacité en termes de coût d'Amazon Redshift et d'Amazon Athena sous haute concurrence, sont précisément conçues pour ce type d'interaction avec les données, à très grande échelle et très haute fréquence, propre aux Agents.

À l'occasion du 20ème anniversaire d'Amazon S3, ce service a récemment connu trois évolutions majeures pour répondre aux besoins des clients à l'ère de l'IA en matière de traitement des données : S3 Table (format table), S3 Files (fichiers) et S3 Vector (vecteur).

Comme le support natif d'Apache Iceberg par S3 Table. Mai-Lan souligne que lorsqu'ils traitent des données, les Agents ont tendance à interagir directement via SQL avec des données au format Iceberg. La logique sous-jacente est que les Agents sont construits sur des grands modèles linguistiques, et ces derniers, pendant leur entraînement, ont développé une capacité mature à traiter la syntaxe SQL et le format de données Iceberg. Stocker toutes les données tabulaires au format Iceberg dans S3 permet aux Agents de traiter efficacement les données sans avoir à apprendre de multiples API d'accès complexes. Actuellement, les Agents, S3 et Iceberg présentent une compatibilité remarquable.

L'introduction de la fonctionnalité Iceberg dans S3 a déclenché une nouvelle vague d'innovation. Des sources de données comme Postgres, Oracle, etc., commencent à écrire directement en Iceberg, et les systèmes d'Agents peuvent interagir directement avec ces tables. Avec le lancement de S3 Vectors, de plus en plus d'applications d'IA utilisent les vecteurs comme support de mémoire partagée, injectant ainsi un « état » dans l'expérience d'interaction avec l'IA.

Mai-Lan note également que le type de données « vecteur » a été introduit en natif dans S3. L'application des vecteurs se concentre principalement sur deux dimensions : premièrement, utiliser les vecteurs pour construire un contexte informationnel pour les données stockées dans S3 ; deuxièmement, utiliser les vecteurs comme mémoire partagée. Cinq mois après le lancement de S3 Vectors, les retours du marché sont conformes aux attentes. De nombreux clients ont commencé à utiliser cette fonctionnalité, générant des vecteurs via des modèles d'embedding pour enrichir le contexte de leurs données. L'utilisation de S3 Vectors comme espace mémoire pour les systèmes d'Agents connaît une croissance explosive.

Il est à noter que S3 Files a été lancé il y a quelques semaines, permettant aux Agents de traiter les données dans S3 via le standard POSIX, c'est-à-dire de manière système de fichiers. Dans les systèmes d'Agents, les grands modèles linguistiques accordent une grande attention à la forme « fichier ». Que ce soient les bibliothèques Python ou les scripts Shell, ce sont des contenus familiers pendant l'entraînement des grands modèles, et les Agents ont naturellement tendance à considérer les fichiers comme interface de données.

Dans cet esprit, le concept de S3 Files est de monter un système de fichiers EFS (Elastic File System) sur un bucket S3. Grâce à ce mécanisme, les utilisateurs peuvent traiter les données S3 dans le système de fichiers selon le standard POSIX : les petits fichiers peuvent être accélérés via le cache EFS, tandis que les gros fichiers sont transmis en flux directement depuis S3. Cela permet aux Agents d'interagir nativement avec les données S3 via le langage familier du système de fichiers et de considérer le système de fichiers partagé comme un « espace de mémoire partagée » provenant de S3.

Du point de vue de l'évolution des capacités de mémoire des grands modèles linguistiques, cette avancée est significative. L'expérience d'IA actuelle introduit progressivement des contextes de conversation plus profonds et des interactions plus personnalisées, que ce soit entre Agents, entre humains et Agents, ou entre Agents et données, les performances des modèles évoluent constamment. En étendant encore cette interface naturelle qu'est le système de fichiers, les capacités de mémoire des systèmes d'Agents pourraient connaître une amélioration plus profonde.

L'auteur constate qu'Amazon Web Services, depuis ses débuts en 2006 avec des données semi-structurées comme les images, puis les données analytiques, depuis les premiers entrepôts de données jusqu'à l'essor des lacs de données, s'efforce aujourd'hui vigoureusement de faire d'Amazon S3 la pierre angulaire pour supporter les charges de travail de l'IA, adaptée aux demandes actuelles des clients. Mai-Lan considère que le cœur de la conception d'Amazon S3 est de favoriser la croissance des principaux types de données de manière économique, tout en restant fidèle à des principes tels que la disponibilité, la durabilité et la résilience des données. Et c'est précisément pour ces raisons que les clients continuent de confier leurs activités données à S3 depuis 20 ans, et c'est aussi ce qui portera ses possibilités pour les 20 prochaines années.

(Auteur | Yang Li, Éditeur | Yang Lin)

Questions liées

QQuels sont les trois principaux changements récents apportés à Amazon S3 pour répondre aux besoins des clients à l'ère de l'IA ?

AAmazon S3 a récemment introduit trois évolutions majeures : S3 Table (prise en charge native d'Apache Iceberg), S3 Files (accès via le standard POSIX) et S3 Vector (vecteur en tant que type de données natif).

QPourquoi Mai-Lan Tomsen Bukovec souligne-t-elle que les Agents consomment les données de manière 'extrêmement active et agressive' ?

AParce que les Agents fonctionnent sur un mode de 'sélection parallèle', exécutant des dizaines voire des centaines de requêtes simultanément pour comparer et trouver le meilleur chemin, ce qui entraîne une fréquence d'appel et un débit de données exponentiellement plus élevés que ceux des humains.

QComment S3 Files permet-il aux Agents d'interagir plus naturellement avec les données ?

AS3 Files permet de monter un système de fichiers EFS sur un compartiment S3. Les Agents peuvent ainsi traiter les données via l'interface familière du système de fichiers POSIX : les petits fichiers sont accélérés par le cache EFS, et les gros fichiers sont diffusés en flux directement depuis S3.

QQuel rôle le format Apache Iceberg joue-t-il dans l'interaction entre les Agents et Amazon S3 ?

AApache Iceberg permet aux Agents d'interagir directement avec les données via SQL, un langage que les grands modèles maîtrisent déjà. Stocker toutes les données tabulaires au format Iceberg dans S3 évite aux Agents d'apprendre des API complexes et rend le traitement des données plus efficace.

QQuelle est l'importance des vecteurs (S3 Vectors) dans le contexte des systèmes d'Agents selon l'article ?

ALes vecteurs sont utilisés dans deux dimensions clés : pour construire un contexte informationnel autour des données stockées dans S3, et comme 'mémoire partagée' pour les systèmes d'Agents, permettant des interactions conversationnelles plus profondes et personnalisées.

Lectures associées

Du financement parallèle au financement traditionnel : l’ère des titres financiers sur chaîne entre dans une fenêtre historique

Auteur : Climber, CryptoPulse Labs Depuis plus de dix ans, le secteur de la cryptographie a mené une expérience financière parallèle au monde réel, avec son propre système monétaire, ses marchés et sa logique d'évaluation. Des ICO à la finance décentralisée (DeFi), en passant par les NFT et les dérivés sur chaîne, un écosystème financier quasi complet s'est construit. Cependant, un mur séparait toujours la cryptographie de la finance traditionnelle. Aujourd'hui, ce mur commence à s'effondrer. La prochaine décennie verra l'émergence d'une ère de courtage en titres natifs sur chaîne, fusionnant les systèmes financiers mondiaux. La première phase de la cryptographie était une évolution en circuit fermé, où capitaux et utilisateurs circulaient majoritairement à l'intérieur de l'écosystème, limitant l'afflux de capitaux externes massifs. L'arrivée des ETF Bitcoin a ouvert une porte, mais l'histoire la plus significative est ailleurs : la tokenisation des actifs réels (actions, obligations, fonds) sur la blockchain. Cette innovation pourrait révolutionner l'infrastructure financière en simplifiant radicalement les processus complexes de transaction, de règlement et de garde, les rendant quasi instantanés via des contrats intelligents. Le prochain enjeu majeur ne sera pas la guerre des blockchains pour la vitesse, mais la bataille pour attirer des actifs de qualité et de la liquidité. Si des actifs mondiaux comme des actions de grandes entreprises viennent sur chaîne, la frontière entre finance traditionnelle et cryptographique disparaîtra. Le marché potentiel passe alors des billions de dollars de la cryptographie aux centaines de billions des marchés actions et obligataires mondiaux. En conclusion, après avoir tenté de créer un nouveau monde, le secteur de la cryptographie est sur le point de s'intégrer directement au système financier existant. La plus grande histoire de croissance commence peut-être seulement maintenant, avec la fusion réelle de la finance traditionnelle et de l'écosystème cryptographique.

marsbitIl y a 28 mins

Du financement parallèle au financement traditionnel : l’ère des titres financiers sur chaîne entre dans une fenêtre historique

marsbitIl y a 28 mins

Wang Chuan : Quand Lao Wang, le voisin, a gagné trente fois sur les actions de stockage, comment ne pas s'inquiéter encore (6) - Le piège des produits homogènes

**Résumé : Le piège des produits homogènes dans l’industrie du stockage** L’article utilise l’exemple historique d’Iomega, dont l’action a chuté de plus de 97% après un pic spéculatif dans les années 1990, pour illustrer les risques inhérents aux investissements dans le secteur du stockage. Ce secteur est caractérisé par des produits très homogènes (comme la DRAM), sans prime de marque, où les prix sont extrêmement volatils en raison du décalage entre une demande élastique et une offre rigide à fort investissement et long cycle de production. L’auteur explique que la forte hausse des actions du secteur observée à partir de septembre 2025 est principalement due à une demande AI soudaine (notamment pour la HBM) face à une offre limitée à court terme, permettant aux fabricants comme SanDisk et Micron d’afficher des marges bénéficiaires très élevées (près de 80%). Cependant, ces marges élevées contiennent les germes de leur propre disparition : elles incitent à d’importantes augmentations de capacités (débutées en 2026) et poussent les clients à trouver des alternatives technologiques pour réduire leur besoin en mémoire. L’article met en garde contre plusieurs pièges : la fausse sécurité des accords à long terme signés en période de tension (comparés au pacte germano-soviétique de 1939), le risque asymétrique où les facteurs pouvant faire chuter les prix (nouveaux entrants, récession, innovation) sont nombreux et imprévisibles, et l’illusion de la faible valorisation (FAIBLE P/E) au sommet du cycle, qui précède souvent un effondrement des bénéfices. En conclusion, le secteur du stockage, malgré ses périodes de profits exceptionnels, reste un piège pour les investisseurs naïfs en raison de sa nature cyclique brutale et de l’absence de barrières durables contre la concurrence par les prix.

链捕手Il y a 53 mins

Wang Chuan : Quand Lao Wang, le voisin, a gagné trente fois sur les actions de stockage, comment ne pas s'inquiéter encore (6) - Le piège des produits homogènes

链捕手Il y a 53 mins

AI PC arrive, défie localement un grand modèle de 120B ! Nvidia redéfinit le socle de l’« ordinateur personnel IA » avec le RTX Spark

Ces deux dernières années, les fabricants de PC ont largement mis en avant la puissance des NPU (processeurs neuronaux) pour les "AI PC", mais leurs performances restaient modestes (environ 45 à 50 TOPS). Lors du GTC 2026, NVIDIA a présenté la puce RTX Spark, qui repousse radicalement cette limite avec une puissance annoncée de 1 pétaflop (1000 TOPS) pour l'IA. Cette SoC intègre un GPU Blackwell et un CPU Arm Grace conçu avec MediaTek, et surtout, elle adopte une architecture de mémoire unifiée allant jusqu'à 128 GB, partagée entre le CPU et le GPU. L'objectif principal est de permettre l'exécution locale de grands modèles de langage (LLM) de 120 milliards de paramètres, avec des fenêtres de contexte pouvant atteindre un million de tokens, ce qui redéfinit les capacités de l'IA de bord. NVIDIA a également annoncé des collaborations majeures avec Microsoft pour renforcer la sécurité Windows et intégrer le bac à sable OpenShell, ainsi qu'avec Adobe qui adapte en profondeur des logiciels comme Photoshop pour tirer parti de cette nouvelle architecture. Plusieurs grands fabricants d'ordinateurs (ASUS, Dell, HP, Lenovo, Microsoft Surface, MSI) prévoient de commercialiser des PC portables fins et des mini-desktops équipés du RTX Spark dès l'automne. Cette initiative marque un changement potentiel dans l'industrie du PC, faisant passer l'accent du processeur x86 traditionnel à une plateforme SoC centrée sur le GPU. Cependant, des questions pratiques concernant la dissipation thermique, l'autonomie, les performances réelles et la stratégie de tarification des OEM restent en suspens et détermineront le succès final de cette nouvelle norme matérielle.

marsbitIl y a 1 h

AI PC arrive, défie localement un grand modèle de 120B ! Nvidia redéfinit le socle de l’« ordinateur personnel IA » avec le RTX Spark

marsbitIl y a 1 h

Trading

Spot
Futures

Articles tendance

Comment acheter ERA

Bienvenue sur HTX.com ! Nous vous permettons d'acheter Caldera (ERA) de manière simple et pratique. Suivez notre guide étape par étape pour commencer votre parcours crypto.Étape 1 : Création de votre compte HTXUtilisez votre adresse e-mail ou votre numéro de téléphone pour ouvrir un compte sur HTX gratuitement. L'inscription se fait en toute simplicité et débloque toutes les fonctionnalités.Créer mon compteÉtape 2 : Choix du mode de paiement (rubrique Acheter des cryptosCarte de crédit/débit : utilisez votre carte Visa ou Mastercard pour acheter instantanément Caldera (ERA).Solde :utilisez les fonds du solde de votre compte HTX pour trader en toute simplicité.Prestataire tiers :pour accroître la commodité d'utilisation, nous avons ajouté des modes de paiement populaires tels que Google Pay et Apple Pay.P2P :tradez directement avec d'autres utilisateurs sur HTX.OTC (de gré à gré) : nous offrons des services personnalisés et des taux de change compétitifs aux traders.Étape 3 : stockage de vos Caldera (ERA)Après avoir acheté vos Caldera (ERA), stockez-les sur votre compte HTX. Vous pouvez également les envoyer ailleurs via un transfert sur la blockchain ou les utiliser pour trader d'autres cryptos.Étape 4 : tradez des Caldera (ERA)Tradez facilement Caldera (ERA) sur le marché Spot de HTX. Il vous suffit d'accéder à votre compte, de sélectionner la paire de trading, d'exécuter vos trades et de les suivre en temps réel. Nous offrons une expérience conviviale aux débutants comme aux traders chevronnés.

545 vues totalesPublié le 2025.07.17Mis à jour le 2025.07.17

Comment acheter ERA

Discussions

Bienvenue dans la Communauté HTX. Ici, vous pouvez vous tenir informé(e) des derniers développements de la plateforme et accéder à des analyses de marché professionnelles. Les opinions des utilisateurs sur le prix de ERA (ERA) sont présentées ci-dessous.

活动图片