Диалог с Mai-Lan из AWS: следующее поле битвы для S3 и как справиться с бумом потребления данных в эпоху агентов

marsbitОпубликовано 2026-05-08Обновлено 2026-05-08

Введение

В начале года популярность OpenClaw на китайском рынке показала огромный потенциал агентов. Однако вместе с этим возник серьёзный вызов для облачных провайдеров: готовы ли инфраструктурные слои, особенно уровень данных, к тому, что агенты начнут массово размножаться и часто обращаться к данным? В ходе обсуждения с вице-президентом по технологиям Amazon Web Services Май-Лан Томсен Буковец было отмечено, что агенты работают в режиме «параллельного выбора лучшего» — они выполняют десятки или сотни запросов одновременно, сравнивая результаты для поиска оптимального пути. Это делает их гораздо более активными потребителями данных, чем люди, с частотой обращений на несколько порядков выше. В условиях роста числа агентов стоимость инфраструктуры становится ключевым фактором. Amazon S3, отмечающий 20-летие, предлагает решения для удовлетворения потребностей эпохи ИИ: S3 Table (с поддержкой Apache Iceberg), S3 Vector (для векторных данных) и S3 Files (для работы с файлами через POSIX-интерфейс). Например, S3 Table позволяет агентам эффективно взаимодействовать с данными через SQL и Iceberg, что упрощает обработку. Векторные данные в S3 используются для создания контекста и как общая память для агентов. S3 Files, в свою очередь, предоставляет агентам знакомый файловый интерфейс для работы с данными в S3. По словам Май-Лан, S3 изначально проектировался для экономичного хранения данных с фокусом на доступности, долговечности и отказоустойчивости, что объясняет его надежность на протя...

В начале года взрывная популярность OpenClaw на китайском рынке позволила всем увидеть огромный потенциал агентов. Но вместе с этим возникла проблема, на которую всем облачным провайдерам необходимо ответить: готовы ли облачные инфраструктуры для ИИ, особенно уровень данных, когда агенты начинают размножаться, как киберлобстеры, и с высокой частотой обращаться к данным?

Например, при развертывании агентов в производственной среде команды по работе с данными предприятий часто сталкиваются с узкими местами на уровне данных. Построение агентов на разных платформах — векторных, реляционных, графовых базах данных, озерно-складских системах — требует синхронизации каналов данных для поддержания актуальности контекстной информации. Но в реальной производственной среде эта контекстная информация со временем устаревает.

Срочность этой проблемы проистекает из принципиально иного, по сравнению с человеком-инженером, режима потребления данных агентами.

«Агенты потребляют данные чрезвычайно активно и агрессивно, частота их обращений к хранилищам или озерам данных ошеломляет.»

Как отметила в недавней беседе с автором вице-президент по технологиям Amazon Web Services Май-Лан Томсен Буковец, агенты работают по модели «параллельного выбора лучшего варианта»: вместо одного запроса за раз они одновременно выполняют десятки и сотни параллельных запросов, сравнивая результаты для поиска оптимального пути. Это делает агентов гораздо более агрессивными потребителями данных, чем люди — частота обращений на несколько порядков выше, а пропускная способность данных растет экспоненциально.

Май-Лан далее указала: «Сейчас клиенты очень хотят строить инфраструктуру для агентов, и стоимость, или, иными словами, ценность, уже не второстепенный, а решающий фактор. В ближайшие полгода-год, с взрывным ростом числа агентов, выбор базовых сервисов данных станет критически важным.»

Карнавал OpenClaw сходит на нет, оставляя после себя предупреждение об стресс-тесте базовых вычислительных и хранительных возможностей облачных провайдеров. Май-Лан считает, что у Amazon Web Services в этой области есть естественные преимущества: масштаб Amazon S3, а также эффективность Amazon Redshift и Amazon Athena в условиях высокой параллельной нагрузки и с точки зрения стоимости — все это создано именно для таких сверхмасштабных и сверхчастых способов взаимодействия агентов с данными.

В год 20-летия продукта Amazon S3, учитывая потребности клиентов в обработке данных в эпоху ИИ, недавно в S3 также были реализованы три основные трансформации: S3 Table (табличный формат), S3 Files (файлы) и S3 Vector (векторы).

Например, нативная поддержка Apache Iceberg в S3 Table. Май-Лан отмечает, что при обработке данных агенты предпочитают напрямую взаимодействовать с данными в формате Iceberg через SQL. Основная логика заключается в том, что агенты построены на больших моделях, а те в процессе обучения уже сформировали зрелые способности по обработке синтаксиса SQL и формата данных Iceberg. Хранение всех табличных данных в формате Iceberg в S3 позволяет агентам эффективно обрабатывать данные без необходимости изучения множества сложных API для доступа. В настоящее время наблюдается высокая степень совместимости между агентами, S3 и Iceberg.

Когда возможности Iceberg были интегрированы в S3, это вызвало новую волну инноваций: источники данных, такие как Postgres, Oracle, начали напрямую записывать данные в Iceberg, а агентные системы могут напрямую взаимодействовать с этими таблицами. А с выходом S3 Vectors все больше приложений ИИ начинают использовать векторы в качестве носителей общей памяти, тем самым привнося «состояние» в опыт взаимодействия с ИИ.

Май-Лан также указала, что вектор был введен как собственный тип данных S3. Применение векторов в основном сосредоточено в двух измерениях: во-первых, построение контекстной информации для данных, хранящихся в S3, с помощью векторов, и, во-вторых, использование векторов в качестве общей памяти. За пять месяцев после выпуска S3 Vectors отклик рынка соответствовал ожиданиям. Множество клиентов начали использовать эту функцию, генерируя векторы через модели эмбеддингов для обогащения контекста данных. Использование S3 Vectors в качестве пространства памяти для агентных систем растет взрывными темпами.

Стоит отметить, что S3 Files был выпущен несколько недель назад, позволяя агентам обрабатывать данные в S3 через стандарт POSIX, то есть способом файловой системы. В агентных системах большие модели уделяют большое внимание форме «файла» — будь то библиотеки Python или скрипты Shell, это знакомый контент из процесса обучения больших моделей, агенты от природы склонны использовать файлы в качестве интерфейса данных.

Поэтому S3 Files был спроектирован так, чтобы монтировать файловую систему EFS на корзину S3. С помощью этого механизма пользователи могут обрабатывать данные S3 в файловой системе на основе стандарта POSIX: доступ к маленьким файлам ускоряется за счет кэширования через EFS, а большие файлы передаются потоково прямо из S3. Это позволяет агентам нативно взаимодействовать с данными S3 на знакомом языке файловой системы и рассматривать общую файловую систему как «общее пространство памяти» из S3.

С точки зрения развития возможностей памяти больших моделей этот прогресс имеет важное значение. Текущий опыт взаимодействия с ИИ постепенно внедряет более глубокий контекст диалога и персонализированное взаимодействие — будь то между агентами, между человеком и агентом или между агентом и данными, производительность моделей постоянно эволюционирует. Благодаря дальнейшему расширению этого естественного интерфейса файловой системы, способности памяти агентных систем могут получить более глубокое улучшение.

Автор заметил, что, начиная с 2006 года с преимущественно полуструктурированных данных, таких как изображения, затем аналитических данных, от первоначальных хранилищ данных до расцвета озер данных, Amazon Web Services сейчас активно продвигает Amazon S3 в качестве ключевой основы для рабочих нагрузок ИИ, чтобы соответствовать текущим запросам клиентов. Май-Лан считает, что основная идея дизайна Amazon S3 — стимулировать рост основных типов данных экономичным способом, постоянно придерживаясь таких принципов, как доступность, долговечность и устойчивость данных. Именно поэтому клиенты доверяли свои бизнес-данные S3 на протяжении 20 лет, и это же станет основой для его возможностей в следующие 20 лет.

(Автор статьи | Ян Ли, редактор | Ян Линь)

Трендовые криптовалюты

CitreaCTR

wrapped stUSDTWSTUSDT

Связанные с этим вопросы

QКакие три основных изменения были недавно реализованы в Amazon S3 для адаптации к эпохе искусственного интеллекта?

AAmazon S3 недавно реализовал три основных изменения: S3 Table (табличный формат с нативной поддержкой Apache Iceberg), S3 Files (обработка данных через файловую систему по стандарту POSIX) и S3 Vector (векторы как нативный тип данных для контекста и общей памяти).

QСогласно Mai-Lan Tomsen Bukovec, чем отличается режим потребления данных агентом от человеческого инженера?

AАгенты потребляют данные гораздо более агрессивно и активно, чем люди. Они работают в режиме 'параллельного выбора наилучшего варианта', выполняя десятки или сотни запросов одновременно для сравнения и поиска оптимального пути. Это приводит к частоте вызовов и объёму пропускной способности данных на несколько порядков выше.

QКакую роль играет формат Apache Iceberg в контексте взаимодействия агентов с данными в S3?

AАгенты, построенные на больших языковых моделях, имеют зрелую способность обрабатывать SQL и формат Iceberg. Нативное хранение табличных данных в формате Iceberg в S3 позволяет агентам эффективно взаимодействовать с данными, не изучая множество сложных API доступа, что обеспечивает высокую степень совместимости.

QДля каких двух основных целей используются векторы как нативный тип данных в S3 Vectors?

AВекторы в S3 Vectors используются в двух основных направлениях: 1) для создания контекстной информации данных, хранящихся в S3, и 2) в качестве общей памяти (shared memory) для систем агентов, что позволяет привносить 'состояние' в опыт взаимодействия с ИИ.

QКак функция S3 Files позволяет агентам взаимодействовать с данными в S3 и какова выгода от этого подхода?

AS3 Files позволяет агентам обращаться к данным в S3 через стандартную файловую систему POSIX, монтируя файловую систему EFS на корзине S3. Это позволяет агентам использовать знакомый интерфейс файловой системы (как Python библиотеки или shell-скрипты) для нативной работы с данными, рассматривая общую файловую систему как 'общее пространство памяти' из S3.

Похожее

Южная Корея нацелилась на 40 незарегистрированных операторов криптовалют в рамках усиления регулирования

Финансовая разведывательная служба Южной Кореи (FIU) передала в полицию данные о примерно 40 незарегистрированных поставщиках услуг виртуальных активов. В соответствии с законодательством страны все криптобиржи должны получить сертификат ISMS и регистрацию в FIU. В настоящее время зарегистрированы только 28 компаний. Расследование выявило, что нелегальные зарубежные платформы привлекают местных клиентов через мессенджеры, а также используют частных обменщиков и платных авторов контента для продвижения. Эти платформы не находятся под защитой корейских законов. Этот шаг является частью более широкой кампании Южной Кореи по усилению глобальных стандартов соответствия в криптосфере через меры FATF. Директор FIU Ли Хён Джу призвал страны-члены FATF отменить пороговые суммы для применения «Правила поездок» (Travel Rule) к криптовалютам. С августа Южная Корея намерена ввести проверку личности для всех криптовалютных транзакций. Власти также активизировали уголовное преследование за схемы «памп и дамп» и усилили сотрудничество с финансовыми организациями для предотвращения незаконных трансграничных операций.

TheNewsCrypto26 мин. назад

Южная Корея нацелилась на 40 незарегистрированных операторов криптовалют в рамках усиления регулирования

TheNewsCrypto26 мин. назад

История серьёзного мошенничества в недрах криптогиганта Blockstream

С начала года компания Blockstream, основанная пионером биткойна Адамом Бэком, оказывалась в центре внимания криптосообщества. В июне расследовательский аккаунт NatInfoSec выдвинул серьёзные обвинения в её адрес, поставив под сомнение легитимность её майнинговых операций и выпущенных ею майнинговых облигаций (BMN). Основные обвинения включают: 1. **Сомнения в вычислительной мощности и способности выполнять обязательства**: Согласно анализу NatInfoSec, для выполнения обязательств по BMN Blockstream необходимо иметь мощность более 20 EH/s, в то время как её собственный дашборд показывает лишь 15 EH/s. В открытых источниках (данные о подключении к сетям, импорте оборудования, долях в пулах) не найдено свидетельств, соответствующих заявленным масштабам. Условия BMN позволяют компании использовать биткойны из любых источников для выплат, что ставит вопрос о проверяемости происхождения средств. 2. **Высокая доходность и риски**: Доходность по различным выпускам облигаций достигает около 20% годовых. В высокоциклической индустрии майнинга такая фиксированная доходность требует прозрачных объяснений. 3. **Судимость ключевого сотрудника и проблемы с раскрытием информации**: Кристофер Кук, бывший руководитель майнингового подразделения Blockstream, а ныне CEO связанной компании Exacore, в 2008 году был осуждён за мошенничество с почтой. Эта информация не была раскрыта в документах по BMN. Также оспариваются некоторые детали его биографии в маркетинговых материалах. 4. **Связь с готовящимся к IPO BSTR**: Высказываются опасения, что потенциальные обязательства по BMN и судимость Кука не отражены в документах SEC для Bitcoin Standard Treasury Company (BSTR), связанной с Адамом Бэком, хотя юридическая связь между этими структурами неочевидна. BitMEX Research в своём обзоре частично подтвердил факт судимости Кука и выразил озабоченность по поводу высокой доходности, однако посчитал другие доказательства неубедительными или вводящими в заблуждение. В сообществе развернулась дискуссия, сосредоточенная на ключевом вопросе: могут ли инвесторы и наблюдатели независимо проверить заявленную вычислительную мощность, источники дохода и выплат по облигациям BMN. На момент публикации официального системного ответа от Blockstream на эти обвинения не последовало. Остаются открытыми вопросы о реальном масштабе обязательств BMN, достаточности майнинговых активов, источнике высокой доходности и степени вовлечённости Кристофера Кука.

链捕手1 ч. назад

История серьёзного мошенничества в недрах криптогиганта Blockstream

链捕手1 ч. назад

Крипто-лобби призывает Конгресс сохранить налоговый законопроект для стейкинга и майнинга без изменений

Криптоиндустрия лоббирует в Конгрессе США принятие законопроекта H.R. 9175 («Закон о налоговой ясности для майнинга и стейкинга») без изменений. Законопроект призван урегулировать ключевой вопрос налогообложения: должны ли вознаграждения майнеров и валидаторов облагаться налогом немедленно в момент получения или только при продаже актива. Индустрия выступает за отсрочку налогообложения до момента продажи, рассматривая новые токены как созданную сетью ценность, а не как обычный денежный доход. Однако банковский сектор выступает против такого подхода, считая, что отсрочка предоставит криптопродуктам несправедливое преимущество перед традиционными сберегательными инструментами и дивидендами. Исход дебатов важен не только для бухгалтерии, но и для экономики сетей безопасности блокчейнов. Четкие правила снизят операционные издержки и помогут сохранить децентрализацию, предотвратив уход мелких участников из-за высоких затрат на соблюдение сложных налоговых требований. В настоящее время законопроект остается на стадии обсуждения. Криптоиндустрия стремится закрепить благоприятные налоговые правила, расширяя свою политическую повестку за рамки вопросов регулирования рынков и бирж. Скорость принятия закона будет зависеть от того, пройдет ли он как отдельный акт или станет частью более масштабного пакета законов о налогообложении цифровых активов.

bitcoinist1 ч. назад

Крипто-лобби призывает Конгресс сохранить налоговый законопроект для стейкинга и майнинга без изменений

bitcoinist1 ч. назад

Уязвимость в устаревшем контракте роялти Polygon позволила вывести $261 тыс. из-за ошибки в логике вознаграждений

Хакер воспользовался уязвимостью в устаревшем контракте для выплаты авторских вознаграждений (royalties) на блокчейне Polygon и похитил криптовалтиву на сумму около 261 200 долларов США. Атака, выявленная 23 июня, стала возможной из-за ошибки в механизме расчёта и учёта наград в контракте. Уязвимость, связанная с функцией `beforeLdaTransfer()`, позволяла манипулировать данными о владении и балансах путём совершения транзакций с нулевой стоимостью. Это привело к некорректному завышению баланса токенов, что позволило злоумышленнику незаконно вывести средства. Для усиления атаки также использовался flash-кредит. Данный инцидент подчёркивает сохраняющиеся риски, связанные с устаревшими или "спящими" смарт-контрактами, в которых остаются средства. Эксперты рекомендуют разработчикам регулярно аудировать, обновлять или отключать такие контракты. При этом безопасность основной сети Polygon не была поставлена под угрозу.

TheNewsCrypto1 ч. назад

Уязвимость в устаревшем контракте роялти Polygon позволила вывести $261 тыс. из-за ошибки в логике вознаграждений

TheNewsCrypto1 ч. назад

a16z: В эпоху ИИ борьба компаний за таланты начинается с наименования должностей

В статье a16z обсуждается стратегическая важность присвоения названий должностям в эпоху ИИ как инструмента привлечения талантов и формирования организационного нарратива. На примере Palantir, которая ввела термин FDE (forward-deployed engineer), показывается, как переименование роли, связанной с внедрением решений на стороне клиента, позволило переосмыслить её ценность — с периферийной поддержки на ключевую компетенцию, связывающую продукт с реальными бизнес-процессами. Автор вводит понятие «арбитража названий должностей» (title arbitrage): когда организация первой даёт имя новой важной компетенции, она получает преимущество в привлечении специалистов и захвате рыночного восприятия. Название должности — это организационный язык, который сигнализирует о статусе, полномочиях и признании ценности работы. В контексте ИИ это особенно актуально: трансформация приводит к появлению новых высокоэффективных ролей (например, legal engineer или GTM engineer), которые сочетают знание предметной области с навыками автоматизации. Успешное именование таких ролей легитимизирует их внутри компаний-клиентов и создает ментальную связь с продуктом, который эти роли поддерживает. Ключевой вывод: для B2B-компаний в сфере ИИ создание новых названий должностей — это часть стратегии, помогающая не только привлекать таланты, но и переосмысливать границы между продуктом и сервисом, где внедренческие команды становятся частью цикла обучения продукта. Однако переименование должно отражать реальные изменения в содержании работы и организационной структуре, а не быть простой инфляцией титулов.

marsbit2 ч. назад

a16z: В эпоху ИИ борьба компаний за таланты начинается с наименования должностей

marsbit2 ч. назад

Торговля

Спот

Фьючерсы

Обсуждения

Добро пожаловать в Сообщество HTX. Здесь вы сможете быть в курсе последних новостей о развитии платформы и получить доступ к профессиональной аналитической информации о рынке. Мнения пользователей о цене на ERA (ERA) представлены ниже.