Dialogue avec Mai-Lan d'Amazon Web Services : Le prochain champ de bataille de S3, comment répondre au raz-de-marée de consommation de données à l'ère des Agents

marsbitPublié le 2026-05-08Dernière mise à jour le 2026-05-08

Résumé

Le récent engouement en Chine pour OpenClaw a mis en lumière le potentiel des Agents IA, mais aussi un défi crucial pour les fournisseurs de cloud : leurs infrastructures de données sont-elles prêtes pour la consommation frénétique de données par ces Agents ? Mai-Lan Tomsen Bukovec, vice-présidente technique d'Amazon Web Services, explique que les Agents consomment les données de manière "agressive" et parallèle, avec des appels aux entrepôts de données qui augmentent de façon exponentielle en fréquence et en volume. Face à cela, le choix des services de données sous-jacents devient déterminant pour le coût et la performance. Amazon S3, à l'occasion de ses 20 ans, se positionne comme socle clé pour ces charges de travail IA grâce à trois évolutions majeures. S3 Table, avec son support natif d'Apache Iceberg, permet aux Agents d'interagir facilement via SQL. S3 Vectors, en faisant du vecteur un type de données natif, sert à la fois à contextualiser les données et de "mémoire partagée" pour les Agents. Enfin, S3 Files permet aux Agents d'accéder aux données via une interface système de fichiers POSIX familière. Ces innovations visent à permettre aux Agents d'interagir de manière native et efficace avec les données, en utilisant S3 comme un espace de mémoire partagé et durable. La philosophie de S3 – économie, disponibilité, résilience – qui a fidélisé les clients pendant 20 ans, est ainsi adaptée pour soutenir l'ère des Agents IA.

Début d'année, le succès retentissant d'OpenClaw en Chine a permis à tout le monde d'entrevoir l'immense potentiel des Agents. Cependant, cela a aussi soulevé une question cruciale à laquelle tous les fournisseurs de cloud doivent répondre : lorsque les Agents commencent à se multiplier comme des écrevisses cybernétiques et à interroger les données à haute fréquence, l'infrastructure cloud de l'IA, en particulier la couche de données, est-elle prête ?

Par exemple, les équipes de données des entreprises rencontrent souvent des goulots d'étranglement au niveau des données lorsqu'elles déploient des Agents en environnement de production. Construire des Agents sur différentes plateformes (bases de données vectorielles, relationnelles, orientées graphes, lacs de données, etc.) nécessite de synchroniser les pipelines de données pour maintenir l'actualité des informations contextuelles. Mais dans des environnements de production réels, ces informations contextuelles deviennent progressivement obsolètes.

L'urgence de ce problème vient du mode de consommation des données radicalement différent entre les Agents et les ingénieurs humains.

« Les Agents consomment les données d'une manière extrêmement active et agressive, leur fréquence d'interrogation des entrepôts de données ou des lacs de données est stupéfiante. »

Mai-Lan Tomsen Bukovec, Vice-Présidente Technique chez Amazon Web Services, a récemment indiqué lors d'un échange avec l'auteur que les Agents fonctionnent selon un mode opératoire de « sélection parallèle optimale ». C'est-à-dire qu'au lieu d'une requête à la fois, ils en exécutent des dizaines, voire des centaines, en parallèle, en comparant les résultats pour trouver le meilleur chemin. Cela fait des Agents des consommateurs de données bien plus agressifs que les humains, avec une fréquence d'appel supérieure de plusieurs ordres de grandeur et une augmentation exponentielle du débit de données.

Mai-Lan ajoute : « Actuellement, les clients souhaitent vivement construire une infrastructure pour Agents, et le coût, ou plutôt le rapport qualité-prix, n'est plus un facteur secondaire, il devient déterminant. Dans les six mois à un an à venir, avec l'explosion des Agents, le choix des services de données sous-jacents deviendra crucial. »

Aujourd'hui, l'euphorie autour d'OpenClaw retombe, laissant place à un avertissement sous forme de test de résistance sur les capacités de stockage et de calcul de base des fournisseurs de cloud. Mai-Lan estime qu'Amazon Web Services possède un avantage naturel dans ce domaine : l'échelle d'Amazon S3 (Amazon Simple Storage Service), ainsi que l'efficacité en termes de coût d'Amazon Redshift et d'Amazon Athena sous haute concurrence, sont précisément conçues pour ce type d'interaction avec les données, à très grande échelle et très haute fréquence, propre aux Agents.

À l'occasion du 20ème anniversaire d'Amazon S3, ce service a récemment connu trois évolutions majeures pour répondre aux besoins des clients à l'ère de l'IA en matière de traitement des données : S3 Table (format table), S3 Files (fichiers) et S3 Vector (vecteur).

Comme le support natif d'Apache Iceberg par S3 Table. Mai-Lan souligne que lorsqu'ils traitent des données, les Agents ont tendance à interagir directement via SQL avec des données au format Iceberg. La logique sous-jacente est que les Agents sont construits sur des grands modèles linguistiques, et ces derniers, pendant leur entraînement, ont développé une capacité mature à traiter la syntaxe SQL et le format de données Iceberg. Stocker toutes les données tabulaires au format Iceberg dans S3 permet aux Agents de traiter efficacement les données sans avoir à apprendre de multiples API d'accès complexes. Actuellement, les Agents, S3 et Iceberg présentent une compatibilité remarquable.

L'introduction de la fonctionnalité Iceberg dans S3 a déclenché une nouvelle vague d'innovation. Des sources de données comme Postgres, Oracle, etc., commencent à écrire directement en Iceberg, et les systèmes d'Agents peuvent interagir directement avec ces tables. Avec le lancement de S3 Vectors, de plus en plus d'applications d'IA utilisent les vecteurs comme support de mémoire partagée, injectant ainsi un « état » dans l'expérience d'interaction avec l'IA.

Mai-Lan note également que le type de données « vecteur » a été introduit en natif dans S3. L'application des vecteurs se concentre principalement sur deux dimensions : premièrement, utiliser les vecteurs pour construire un contexte informationnel pour les données stockées dans S3 ; deuxièmement, utiliser les vecteurs comme mémoire partagée. Cinq mois après le lancement de S3 Vectors, les retours du marché sont conformes aux attentes. De nombreux clients ont commencé à utiliser cette fonctionnalité, générant des vecteurs via des modèles d'embedding pour enrichir le contexte de leurs données. L'utilisation de S3 Vectors comme espace mémoire pour les systèmes d'Agents connaît une croissance explosive.

Il est à noter que S3 Files a été lancé il y a quelques semaines, permettant aux Agents de traiter les données dans S3 via le standard POSIX, c'est-à-dire de manière système de fichiers. Dans les systèmes d'Agents, les grands modèles linguistiques accordent une grande attention à la forme « fichier ». Que ce soient les bibliothèques Python ou les scripts Shell, ce sont des contenus familiers pendant l'entraînement des grands modèles, et les Agents ont naturellement tendance à considérer les fichiers comme interface de données.

Dans cet esprit, le concept de S3 Files est de monter un système de fichiers EFS (Elastic File System) sur un bucket S3. Grâce à ce mécanisme, les utilisateurs peuvent traiter les données S3 dans le système de fichiers selon le standard POSIX : les petits fichiers peuvent être accélérés via le cache EFS, tandis que les gros fichiers sont transmis en flux directement depuis S3. Cela permet aux Agents d'interagir nativement avec les données S3 via le langage familier du système de fichiers et de considérer le système de fichiers partagé comme un « espace de mémoire partagée » provenant de S3.

Du point de vue de l'évolution des capacités de mémoire des grands modèles linguistiques, cette avancée est significative. L'expérience d'IA actuelle introduit progressivement des contextes de conversation plus profonds et des interactions plus personnalisées, que ce soit entre Agents, entre humains et Agents, ou entre Agents et données, les performances des modèles évoluent constamment. En étendant encore cette interface naturelle qu'est le système de fichiers, les capacités de mémoire des systèmes d'Agents pourraient connaître une amélioration plus profonde.

L'auteur constate qu'Amazon Web Services, depuis ses débuts en 2006 avec des données semi-structurées comme les images, puis les données analytiques, depuis les premiers entrepôts de données jusqu'à l'essor des lacs de données, s'efforce aujourd'hui vigoureusement de faire d'Amazon S3 la pierre angulaire pour supporter les charges de travail de l'IA, adaptée aux demandes actuelles des clients. Mai-Lan considère que le cœur de la conception d'Amazon S3 est de favoriser la croissance des principaux types de données de manière économique, tout en restant fidèle à des principes tels que la disponibilité, la durabilité et la résilience des données. Et c'est précisément pour ces raisons que les clients continuent de confier leurs activités données à S3 depuis 20 ans, et c'est aussi ce qui portera ses possibilités pour les 20 prochaines années.

(Auteur | Yang Li, Éditeur | Yang Lin)

Questions liées

QQuels sont les trois principaux changements récents apportés à Amazon S3 pour répondre aux besoins des clients à l'ère de l'IA ?

AAmazon S3 a récemment introduit trois évolutions majeures : S3 Table (prise en charge native d'Apache Iceberg), S3 Files (accès via le standard POSIX) et S3 Vector (vecteur en tant que type de données natif).

QPourquoi Mai-Lan Tomsen Bukovec souligne-t-elle que les Agents consomment les données de manière 'extrêmement active et agressive' ?

AParce que les Agents fonctionnent sur un mode de 'sélection parallèle', exécutant des dizaines voire des centaines de requêtes simultanément pour comparer et trouver le meilleur chemin, ce qui entraîne une fréquence d'appel et un débit de données exponentiellement plus élevés que ceux des humains.

QComment S3 Files permet-il aux Agents d'interagir plus naturellement avec les données ?

AS3 Files permet de monter un système de fichiers EFS sur un compartiment S3. Les Agents peuvent ainsi traiter les données via l'interface familière du système de fichiers POSIX : les petits fichiers sont accélérés par le cache EFS, et les gros fichiers sont diffusés en flux directement depuis S3.

QQuel rôle le format Apache Iceberg joue-t-il dans l'interaction entre les Agents et Amazon S3 ?

AApache Iceberg permet aux Agents d'interagir directement avec les données via SQL, un langage que les grands modèles maîtrisent déjà. Stocker toutes les données tabulaires au format Iceberg dans S3 évite aux Agents d'apprendre des API complexes et rend le traitement des données plus efficace.

QQuelle est l'importance des vecteurs (S3 Vectors) dans le contexte des systèmes d'Agents selon l'article ?

ALes vecteurs sont utilisés dans deux dimensions clés : pour construire un contexte informationnel autour des données stockées dans S3, et comme 'mémoire partagée' pour les systèmes d'Agents, permettant des interactions conversationnelles plus profondes et personnalisées.

Lectures associées

Ripple Se Dirige Vers la Confidentialité : Comment une Réorganisation du Registre XRP Affectera le Réseau

David Schwartz, émérite CTO de Ripple, a évoqué la résilience potentielle du XRP Ledger face à des pressions étatiques. Selon lui, un régime autoritaire pourrait tenter de perturber temporairement le réseau en ciblant ses validateurs, mais un contrôle à long terme serait difficile. Il souligne que les validateurs gérés par Ripple représentent moins de 20% du réseau, limitant l'impact d'une attaque ciblée. La survie du réseau dépendrait surtout de sa capacité à remplacer les opérateurs compromis. Schwartz décrit aussi une réorganisation possible pour renforcer la sécurité : un algorithme de consensus à deux couches. Une couche interne gérerait l'activité quotidienne, tandis qu'une couche externe, plus légère et discrète, interviendrait uniquement pour modifier la liste des nœuds de validation. Ces validateurs externes pourraient opérer de manière intermittente et via des services d'anonymisation, les rendant plus difficiles à cibler.

bitcoinistIl y a 4 mins

Ripple Se Dirige Vers la Confidentialité : Comment une Réorganisation du Registre XRP Affectera le Réseau

bitcoinistIl y a 4 mins

NYDIG affirme que la transaction de 1,3 milliard de dollars de l'ETF IBIT révèle une sortie urgente du Bitcoin ETF

NYDIG estime qu'une vente hors bourse de 1,26 milliard de dollars de l'ETF Bitcoin IBIT de BlackRock constitue très probablement la sortie urgente d'un gros détenteur directionnel, et non le débouclage d'un arbitrage. Cette transaction du 26 mai s'est distinguée par son ampleur et la décote de 29,5 millions de dollars acceptée par le vendeur pour exécution immédiate. L'analyse de NYDIG, s'appuyant sur les flux d'ETF, l'activité des futures et les données de transaction, écarte la thèse d'un unwind de basis trade, car aucune activité correspondante n'a été observée sur le marché des futures CME. Elle souligne plutôt le contexte de faiblesse du marché des ETF spot Bitcoin américains, marqué par plusieurs sessions de sorties nettes, et la détérioration de la configuration technique du Bitcoin. Les codes de transaction indiquent une transaction de bloc négociée privément, conçue pour privilégier la certitude de l'exécution par rapport au prix. Le vendeur, qui reste non identifié, a manifestement privilégié la rapidité, au coût d'une concession de prix significative.

bitcoinistIl y a 1 h

NYDIG affirme que la transaction de 1,3 milliard de dollars de l'ETF IBIT révèle une sortie urgente du Bitcoin ETF

bitcoinistIl y a 1 h

Fidelity Mid-Year Review: 6 Tendances Clés des Actifs Numériques pour 2026

Fidelity Digital Assets, dans sa revue de mi-année 2026, souligne six tendances clés pour les actifs numériques. L'intégration des actifs numériques aux marchés de capitaux traditionnels se poursuit rapidement, avec un développement des produits comme les options sur ETP Bitcoin et la tokenisation. Les droits des détenteurs de tokens gagnent en attention, mais leur impact sur les prix reste limité. La croissance du taux de hachage Bitcoin ralentit, potentiellement en raison de la concurrence des centres de données d'IA pour l'énergie. Le réseau Bitcoin, bien que stable après l'augmentation de la limite OP_RETURN, fait face à des risques de fragmentation liés aux nœuds Bitcoin Knots et se prépare aux menaces quantiques. Le marché est actuellement baissier, avec des pressions macroéconomiques, mais des fondamentaux structurels solides persistent. L'or surperformé, soutenu par les banques centrales et la dédollarisation, tandis que le Bitcoin n'a pas encore montré la surperformance anticipée par la suite. En conclusion, malgré la volatilité à court terme, les fondations structurelles pour la croissance future des actifs numériques se renforcent.

marsbitIl y a 2 h

Fidelity Mid-Year Review : 6 Tendances Clés des Actifs Numériques pour 2026

Synthèse mi-année de Fidelity : les 6 tendances clés des actifs numériques pour 2026 À mi-parcours 2026, l'écosystème des actifs numériques montre une dynamique de fond structurelle malgré la volatilité des prix. La fusion avec les marchés de capitaux traditionnels s'accélère, avec une demande institutionnelle soutenue pour les ETP Bitcoin et des progrès réglementaires. Le développement de la tokenisation dépasse les attentes. Les droits des détenteurs de jetons gagnent en importance, mais leur valorisation par le marché reste limitée. La concurrence de l'IA pour les ressources énergétiques semble ralentir la croissance du hashrate Bitcoin, indiquant un possible repositionnement des mineurs. Le réseau Bitcoin est stable malgré l'augmentation de la capacité de données OP_RETURN, mais une attention est portée aux risques de fragmentation potentiels liés aux nœuds Bitcoin Knots. Les améliorations de sécurité à long terme, notamment post-quantiques, progressent. Le marché est dominé par les pressions baissières à court terme (inflation, géopolitique), mais les fondamentaux structurels restent solides. L'or performe, soutenu par les banques centrales et une dédollarisation croissante, bien que le rôle de Bitcoin comme actif refuge émerge dans les périodes de stress. En conclusion, les fondations pour la prochaine phase de croissance se consolident discrètement sous la surface.

链捕手Il y a 2 h

La crise de la quarantaine des GP dans la Crypto : Sans PMF, pas de nouveau chèque des LP

**La crise de la quarantaine des GP crypto : sans PMF, pas de prochain chèque des LP** Dans le marché crypto actuel, les investisseurs (LP) ne veulent plus acheter des rêves, mais des produits concrets. Les gestionnaires de fonds (GP) doivent désormais proposer des offres claires correspondant aux besoins du marché (PMF) pour survivre. Cet article classe les produits de levée de fonds crypto en trois catégories : Primary (investissements directs), Liquid (marché liquide), et CeFi/DeFi Native Yield (rendements natifs). Le marché primaire (Primary) est particulièrement touché. Les investisseurs ont perdu confiance dans les "visions futuristes" et les fonds "blind pool" (sans pipeline d'investissements clair). Les raisons historiques d'investir dans des VC crypto — accéder au beta du secteur, obtenir du deal flow, profiter du jugement des GP — se sont largement érodées face à l'émergence d'alternatives plus liquides (ETF, ETP) et à la déception des rendements du cycle précédent. Désormais, seuls quelques acteurs peuvent rester à la table du primaire : les fonds suffisamment grands pour les capitaux patients (endowments), les family offices investissant leur propre argent, les rares GP ayant démontré des rendements exceptionnels récents, et ceux possédant une réelle capacité à "monter des deals" et à offrir des ressources stratégiques aux LP. Pour les autres, la voie à suivre est de reconstruire la confiance en se spécialisant sur un créneau (niche) et en prouvant à nouveau leur capacité à générer de la surperformance ou à fournir une valeur tangible spécifique. La période où l'on vendait un avenir lointain est révolue.

链捕手Il y a 4 h

La crise de la quarantaine des GP dans la Crypto : Sans PMF, pas de nouveau chèque des LP

链捕手Il y a 4 h

Trading

Spot

Futures

Articles tendance

Comment acheter ERA

Bienvenue sur HTX.com ! Nous vous permettons d'acheter Caldera (ERA) de manière simple et pratique. Suivez notre guide étape par étape pour commencer votre parcours crypto.Étape 1 : Création de votre compte HTXUtilisez votre adresse e-mail ou votre numéro de téléphone pour ouvrir un compte sur HTX gratuitement. L'inscription se fait en toute simplicité et débloque toutes les fonctionnalités.Créer mon compteÉtape 2 : Choix du mode de paiement (rubrique Acheter des cryptosCarte de crédit/débit : utilisez votre carte Visa ou Mastercard pour acheter instantanément Caldera (ERA).Solde ：utilisez les fonds du solde de votre compte HTX pour trader en toute simplicité.Prestataire tiers ：pour accroître la commodité d'utilisation, nous avons ajouté des modes de paiement populaires tels que Google Pay et Apple Pay.P2P ：tradez directement avec d'autres utilisateurs sur HTX.OTC (de gré à gré) : nous offrons des services personnalisés et des taux de change compétitifs aux traders.Étape 3 : stockage de vos Caldera (ERA)Après avoir acheté vos Caldera (ERA), stockez-les sur votre compte HTX. Vous pouvez également les envoyer ailleurs via un transfert sur la blockchain ou les utiliser pour trader d'autres cryptos.Étape 4 : tradez des Caldera (ERA)Tradez facilement Caldera (ERA) sur le marché Spot de HTX. Il vous suffit d'accéder à votre compte, de sélectionner la paire de trading, d'exécuter vos trades et de les suivre en temps réel. Nous offrons une expérience conviviale aux débutants comme aux traders chevronnés.

545 vues totalesPublié le 2025.07.17Mis à jour le 2026.06.01

Discussions

Bienvenue dans la Communauté HTX. Ici, vous pouvez vous tenir informé(e) des derniers développements de la plateforme et accéder à des analyses de marché professionnelles. Les opinions des utilisateurs sur le prix de ERA (ERA) sont présentées ci-dessous.