Đối thoại với Mai-Lan của Amazon Web Services: Mặt trận tiếp theo của S3, làm thế nào để ứng phó với làn sóng tiêu thụ dữ liệu điên cuồng thời kỳ Agent

marsbitXuất bản vào 2026-05-08Cập nhật gần nhất vào 2026-05-08

Tóm tắt

Đầu năm, sự bùng nổ của OpenClaw tại thị trường Trung Quốc đã cho thấy tiềm năng to lớn của Agent (tác nhân AI). Tuy nhiên, điều này đặt ra một thách thức cho các nhà cung cấp điện toán đám mây: cơ sở hạ tầng dữ liệu có sẵn sàng cho làn sóng Agent tiêu thụ dữ liệu cực kỳ mạnh mẽ và thường xuyên hay không? Mai-Lan Tomsen Bukovec, Phó chủ tịch kỹ thuật tại Amazon Web Services, chỉ ra rằng Agent hoạt động theo mô hình "lựa chọn tối ưu song song", thực hiện hàng chục, thậm chí hàng trăm truy vấn đồng thời. Điều này biến Agent thành những người tiêu dùng dữ liệu cực kỳ tích cực, với tần suất và khối lượng dữ liệu tăng theo cấp số nhân. Vì vậy, hiệu quả chi phí của các dịch vụ dữ liệu cơ bản ngày càng trở nên quyết định. Nhân dịp kỷ niệm 20 năm Amazon S3, dịch vụ này đã có ba bước phát triển lớn để đáp ứng nhu cầu xử lý dữ liệu trong kỷ nguyên AI: S3 Table (định dạng bảng), S3 Files (tệp) và S3 Vectors (vector). S3 Table hỗ trợ gốc Apache Iceberg, một định dạng mà Agent có thể tương tác trực tiếp qua SQL. S3 Vectors đưa vector trở thành kiểu dữ liệu gốc, được sử dụng để xây dựng ngữ cảnh cho dữ liệu hoặc làm bộ nhớ chia sẻ cho hệ thống Agent, với mức độ sử dụng tăng mạnh. S3 Files cho phép Agent xử lý dữ liệu trong S3 thông qua tiêu chuẩn hệ thống tệp POSIX quen thuộc, coi đó như một "không gian bộ nhớ chia sẻ". Mai-Lan nhấn mạnh rằng thiết kế cốt lõi của Amazon S3 là thúc đẩy sự phát triển của các loại dữ liệu chính một cách kinh tế, trong khi vẫn tuân thủ các nguyên tắc về kh...

Đầu năm, sự bùng nổ của OpenClaw tại thị trường Trung Quốc đã cho mọi người thấy tiềm năng khổng lồ của Agent. Nhưng đi kèm theo đó là một câu hỏi mà tất cả các nhà cung cấp dịch vụ đám mây đều phải trả lời: Khi Agent bắt đầu sinh sôi nảy nở như tôm hùm cyber và gọi dữ liệu với tần suất cao, thì tầng cơ sở hạ tầng AI, đặc biệt là tầng dữ liệu, đã sẵn sàng chưa?

Ví dụ, khi các đội ngũ dữ liệu doanh nghiệp triển khai Agent vào môi trường sản xuất, họ thường gặp phải nút thắt ở cấp độ dữ liệu. Việc xây dựng Agent trên các nền tảng khác nhau như cơ sở dữ liệu vector, cơ sở dữ liệu quan hệ, cơ sở dữ liệu đồ thị và hồ dữ liệu, đòi hỏi phải đồng bộ hóa các đường ống dữ liệu để duy trì tính kịp thời của thông tin ngữ cảnh. Nhưng trong môi trường sản xuất thực tế, những thông tin ngữ cảnh này sẽ dần trở nên lỗi thời.

Sự cấp bách của vấn đề này bắt nguồn từ mô hình tiêu thụ dữ liệu hoàn toàn khác biệt giữa Agent và kỹ sư con người.

"Agent đang tiêu thụ dữ liệu một cách cực kỳ năng động và cực đoan, tần suất gọi dữ liệu đến kho dữ liệu hoặc hồ dữ liệu của nó là đáng kinh ngạc."

Phó chủ tịch kỹ thuật của Amazon Web Services, Mai-Lan Tomsen Bukovec, gần đây trong cuộc trao đổi với tác giả đã chỉ ra rằng, Agent hoạt động theo mô hình "tối ưu hóa song song": không phải một truy vấn tại một thời điểm, mà là hàng chục, hàng trăm truy vấn cùng lúc, thông qua so sánh để tìm ra con đường tối ưu nhất. Điều này khiến Agent trở thành một đối tượng tiêu thụ dữ liệu cực kỳ cực đoan so với con người — tần suất gọi dữ liệu cao hơn nhiều cấp số, lượng thông lượng dữ liệu tăng theo cấp số nhân.

Mai-Lan nói thêm, "Hiện tại khách hàng rất mong muốn xây dựng cơ sở hạ tầng Agent, chi phí hay nói cách khác là giá trị trên chi phí, không còn là yếu tố thứ yếu, mà đã trở thành yếu tố quyết định. Trong nửa năm đến một năm tới, cùng với sự bùng nổ của Agent, việc lựa chọn dịch vụ dữ liệu nền tảng sẽ trở nên cực kỳ quan trọng."

Ngày nay, không khí lễ hội của OpenClaw đang dần lắng xuống, để lại cảnh báo về bài kiểm tra áp lực đối với năng lực lưu trữ và xử lý nền tảng của các nhà cung cấp dịch vụ đám mây. Mai-Lan cho rằng, Amazon Web Services có lợi thế tự nhiên trong lĩnh vực này. Quy mô của Amazon S3 (Amazon Simple Storage Service), hiệu quả chi phí của Amazon Redshift và Amazon Athena dưới điều kiện tải cao, chính là được chuẩn bị cho cách thức tương tác dữ liệu siêu quy mô và tần suất siêu cao này của Agent.

Nhân kỷ niệm 20 năm ra đời sản phẩm Amazon S3, xoay quanh nhu cầu xử lý dữ liệu của khách hàng trong thời đại AI, Amazon S3 gần đây cũng đã thực hiện ba thay đổi lớn: S3 Table (định dạng bảng), S3 Files (tệp) và S3 Vector (vector).

Như việc S3 Table hỗ trợ natively cho Apache Iceberg. Mai-Lan chỉ ra rằng, khi xử lý dữ liệu, Agent có xu hướng tương tác trực tiếp với dữ liệu định dạng Iceberg thông qua SQL. Logic cơ bản nằm ở chỗ, Agent được xây dựng trên nền tảng mô hình lớn, và mô hình lớn trong quá trình huấn luyện đã hình thành khả năng xử lý trưởng thành đối với cú pháp SQL và định dạng dữ liệu Iceberg. Việc lưu trữ tất cả dữ liệu bảng dưới định dạng Iceberg trong S3 cho phép Agent xử lý dữ liệu hiệu quả mà không cần học nhiều API truy cập phức tạp khác nhau. Hiện tại, sự ăn khớp giữa Agent với S3 và Iceberg đang thể hiện ở mức độ cao.

Khi khả năng Iceberg được tích hợp vào S3, nó đã tạo ra một làn sóng sáng tạo Sina mới. Các nguồn dữ liệu như Postgres, Oracle bắt đầu ghi trực tiếp vào Iceberg, và hệ thống Agent có thể tương tác trực tiếp với các bảng này. Và với sự ra mắt của S3 Vectors, ngày càng nhiều ứng dụng AI bắt đầu sử dụng vector làm vật chứa bộ nhớ chia sẻ, từ đó truyền "trạng thái" vào trải nghiệm tương tác AI.

Mai-Lan cũng chỉ ra rằng, vector đã được giới thiệu như một kiểu dữ liệu gốc của S3. Ứng dụng của vector chủ yếu tập trung vào hai chiều: một là sử dụng vector để xây dựng thông tin ngữ cảnh cho dữ liệu được lưu trữ trong S3, hai là sử dụng vector như bộ nhớ chia sẻ. Trong năm tháng sau khi S3 Vectors được phát hành, phản hồi thị trường đúng như kỳ vọng. Một lượng lớn khách hàng bắt đầu sử dụng tính năng này, thông qua mô hình nhúng để tạo ra vector làm phong phú thêm ngữ cảnh của dữ liệu. Việc sử dụng S3 Vectors như không gian bộ nhớ cho hệ thống Agent đang tăng trưởng bùng nổ.

Đáng chú ý, S3 Files được phát hành vài tuần trước, cho phép Agent xử lý dữ liệu trong S3 thông qua tiêu chuẩn POSIX, tức là cách thức hệ thống tệp. Trong hệ thống Agent, mô hình lớn rất chú trọng đến hình thái "tệp", cho dù là thư viện Python hay tập lệnh Shell, đều là những nội dung quen thuộc trong quá trình huấn luyện mô hình lớn. Agent có xu hướng tự nhiên coi tệp là giao diện dữ liệu.

Vì lý do này, ý tưởng thiết kế của S3 Files là gắn kết một hệ thống tệp EFS lên bucket lưu trữ S3. Thông qua cơ chế này, người dùng có thể xử lý dữ liệu S3 trong hệ thống tệp dựa trên tiêu chuẩn POSIX: các tệp nhỏ có thể được truy cập nhanh hơn nhờ bộ nhớ đệm EFS, còn các tệp lớn thì được truyền trực tiếp từ S3 theo luồng. Điều này cho phép Agent tương tác nguyên bản với dữ liệu S3 bằng ngôn ngữ hệ thống tệp quen thuộc, và coi hệ thống tệp chia sẻ như "không gian bộ nhớ chia sẻ" từ S3.

Xét từ sự phát triển khả năng ghi nhớ của mô hình lớn, bước tiến này có ý nghĩa quan trọng. Trải nghiệm AI hiện tại đang dần được đưa vào ngữ cảnh hội thoại sâu hơn và tương tác cá nhân hóa — cho dù là giữa các Agent với nhau, giữa người và Agent, hay giữa Agent và dữ liệu, hiệu suất của mô hình đều đang không ngừng tiến hóa. Thông qua việc mở rộng hơn nữa giao diện tự nhiên này là hệ thống tệp, khả năng ghi nhớ của hệ thống Agent có triển vọng được nâng cao ở mức độ sâu hơn.

Tác giả lưu ý rằng, từ năm 2006 chủ yếu là dữ liệu bán cấu trúc như hình ảnh, đến dữ liệu phân tích sau này, từ kho dữ liệu ban đầu đến sự trỗi dậy của hồ dữ liệu, hiện tại Amazon Web Services đang tích cực thúc đẩy Amazon S3 trở thành nền tảng then chốt đảm nhận tải công việc AI, để đáp ứng nhu cầu của khách hàng hiện tại. Mai-Lan cho rằng, thiết kế cốt lõi của Amazon S3 là thúc đẩy sự phát triển của các kiểu dữ liệu chủ đạo một cách kinh tế, và luôn kiên trì các nguyên tắc về tính khả dụng, độ bền và khả năng phục hồi của dữ liệu. Và đây cũng chính là lý do khách hàng trong 20 năm qua tiếp tục giao phó hoạt động dữ liệu của họ cho S3, và nó cũng sẽ đảm nhận khả năng trong 20 năm tiếp theo.

(Tác giả | Dương Lệ, Biên tập | Dương Lâm)

Câu hỏi Liên quan

QTheo Mai-Lan, đặc điểm nổi bật nào trong cách tiêu thụ dữ liệu của Agent khiến nó trở thành 'người tiêu dùng dữ liệu cực kỳ tích cực và mạnh mẽ'?

AAgent hoạt động theo mô hình 'lựa chọn tối ưu song song', thực hiện hàng chục, thậm chí hàng trăm truy vấn đồng thời để so sánh và tìm ra đường đi tốt nhất. Điều này dẫn đến tần suất gọi dữ liệu cao hơn nhiều lần và lượng dữ liệu thông qua tăng theo cấp số nhân so với con người.

QAmazon S3 gần đây đã có ba thay đổi lớn để đáp ứng nhu cầu xử lý dữ liệu trong thời đại AI là gì?

ABa thay đổi lớn là: S3 Table (hỗ trợ native cho định dạng Apache Iceberg), S3 Files (cho phép Agent xử lý dữ liệu trong S3 thông qua tiêu chuẩn POSIX như một hệ thống tệp) và S3 Vectors (đưa vector vào như một kiểu dữ liệu gốc của S3).

QTại sao việc hỗ trợ Apache Iceberg cho S3 Table lại quan trọng đối với tương tác của Agent với dữ liệu?

AVì Agent được xây dựng trên mô hình lớn (LLM), vốn đã được đào tạo để xử lý thành thạo cú pháp SQL và định dạng dữ liệu Iceberg. Lưu trữ tất cả dữ liệu bảng dưới dạng Iceberg trong S3 cho phép Agent xử lý dữ liệu hiệu quả mà không cần học nhiều API truy cập phức tạp khác nhau, thể hiện sự tương thích cao.

QS3 Vectors được sử dụng chủ yếu cho những mục đích nào trong hệ thống Agent?

AS3 Vectors được sử dụng chủ yếu ở hai khía cạnh: 1) Xây dựng ngữ cảnh (context) cho dữ liệu được lưu trữ trong S3. 2) Sử dụng vector như một bộ nhớ chia sẻ (shared memory) cho hệ thống Agent, góp phần tạo ra trải nghiệm tương tác AI có 'trạng thái'.

QCơ chế hoạt động của S3 Files giúp Agent tương tác với dữ liệu như thế nào?

AS3 Files cho phép gắn kết một hệ thống tệp EFS lên bucket S3. Thông qua cơ chế này, Agent có thể xử lý dữ liệu S3 bằng ngôn ngữ hệ thống tệp quen thuộc (POSIX): tệp nhỏ được truy cập nhanh qua bộ nhớ đệm EFS, tệp lớn được truyền trực tiếp từ S3. Điều này cho phép Agent coi hệ thống tệp chia sẻ như một 'không gian bộ nhớ chia sẻ' từ S3.

Nội dung Liên quan

Cardano Hay Solana? Lựa Chọn Hàng Đầu Của Chuyên Gia Sau Khi ADA, SOL Giảm 10%

Thị trường tiền điện tử sụt giảm khi Bitcoin (BTC) tạm thời xuống dưới 67.000 USD, kéo theo Solana (SOL) và Cardano (ADA) mất giá khoảng 10%. Chuyên gia Anders Bylund so sánh hai nền tảng. Solana được thiết kế cho tốc độ cao và phí giao dịch rẻ, nhưng có lịch sử gặp sự cố ngừng hoạt động. Mặc dù mạng lưới đã ổn định hơn kể từ đầu năm 2024, bài viết cho rằng độ tin cậy lâu dài vẫn là một câu hỏi. Ngược lại, Cardano theo đuổi triết lý chú trọng nghiên cứu học thuật và xác minh chính thức, nhằm tạo ra một blockchain ổn định hơn, dù có thể phát triển tính năng mới chậm hơn. Về hoạt động thực tế, Solana thể hiện rõ hơn với khối lượng giao dịch trên các sàn phi tập trung (DEX) cao gấp hơn 400 lần so với Cardano. Kết luận, chuyên gia cho rằng Solana là lựa chọn mạnh hơn hiện tại, do lợi thế về mức độ sử dụng trong thực tế. Tuy nhiên, cả hai đều là khoản đầu tư rủi ro. Nếu Bitcoin giảm 30%, các altcoin như SOL và ADA có thể giảm từ 50-70%. Thời điểm bài viết, ADA giao dịch quanh 0,21 USD và SOL ở 76 USD, cả hai đều giảm hơn 5% trong 24h. ADA hiện thấp hơn 92% so với mức đỉnh mọi thời đại, trong khi SOL thấp hơn 73%.

bitcoinist35 phút trước

Cardano Hay Solana? Lựa Chọn Hàng Đầu Của Chuyên Gia Sau Khi ADA, SOL Giảm 10%

bitcoinist35 phút trước

Morningstar định giá SpaceX chỉ 7800 tỷ USD, chưa bằng một nửa mục tiêu IPO, "IPO lớn nhất lịch sử" định giá quá cao?

SpaceX đang chuẩn bị cho đợt IPO có thể là lớn nhất lịch sử với mục tiêu định giá 1.750 tỷ USD. Tuy nhiên, Morningstar đưa ra định giá hợp lý chỉ 780 tỷ USD, tương đương 45% mục tiêu, và nhận định công ty bị định giá quá cao. Theo phân tích, Morningstar định giá riêng lõi kinh doanh phóng tên lửa và Starlink khoảng 611 tỷ USD. Phần định giá 170 tỷ USD còn lại dành cho hoạt động AI (bao gồm xAI và nền tảng X), được tính trọng số xác suất với kịch bản bi quan chiếm ưu thế. Starlink là mảng duy nhất có lãi với doanh thu 2025 đạt 11,3 tỷ USD. Dù đánh giá cao, Morningstar thừa nhận giá cổ phiếu SpaceX có thể tăng ngắn hạn sau IPO nhờ lượng cổ phiếu lưu hành thấp (chỉ ~3%), nhu cầu cao với cổ phiếu hạ tầng AI và cơ chế đưa nhanh vào chỉ số Nasdaq 100 sau 15 phiên giao dịch. Tuy nhiên, áp lực bán từ cơ cấu giải ngân cổ phiếu nội bộ theo tầng và rủi ro tái cấp vốn cho khoản vay cầu nối 200 tỷ USD đáo hạn sau 15 tháng là những điểm cần lưu ý. Rủi ro quản trị cũng được nêu do cấu trúc cổ phần cho phép Elon Musk nắm ~85% quyền biểu quyết. Lộ trình dự kiến: SpaceX bắt đầu roadshow vào tuần ngày 8/6, định giá ngày 11/6 và niêm yết trên Nasdaq (mã SPCX) vào ngày 12/6.

marsbit38 phút trước

Morningstar định giá SpaceX chỉ 7800 tỷ USD, chưa bằng một nửa mục tiêu IPO, "IPO lớn nhất lịch sử" định giá quá cao?

marsbit38 phút trước

a16z: Tại sao thị trường dự đoán sẽ trở thành cơ sở hạ tầng của 'xác suất tương lai'

Thị trường dự đoán đang phát triển từ công cụ giao dịch nhỏ thành cơ sở hạ tầng cung cấp tín hiệu xác suất cho các sự kiện tương lai. Về bản chất, chúng là thị trường thuần túy, tận dụng khả năng tổng hợp thông tin phân tán thông qua cơ chế giá, biến các sự kiện như bầu cử hay biến động địa chính trị thành tài sản có thể giao dịch với mức giá phản ánh xác suất xảy ra. Ưu điểm chính của thị trường dự đoán so với thăm dò truyền thống là cơ chế khuyến khích bằng tiền thật, buộc người tham gia phải cân nhắc kỹ lưỡng dựa trên thông tin họ có, từ đó tạo ra tín hiệu xác suất động, cập nhật theo thời gian thực. Chúng cũng linh hoạt, có thể áp dụng cho các vấn đề chuyên biệt như đánh giá hiệu suất AI mà thị trường truyền thống không phản ánh được. Tuy nhiên, hiệu quả của thị trường dự đoán không tự động đạt được. Nó phụ thuộc vào việc người có thông tin có tham gia hay không, thiết kế hợp đồng, cơ chế xác định kết quả và nguy cơ bị thao túng bởi nội gián hoặc các nhóm muốn định hướng nhận thức công chúng. Do đó, bước phát triển tiếp theo là xây dựng cơ sở hạ tầng thị trường đáng tin cậy: quy tắc minh bạch, thiết kế hợp đồng rõ ràng, cơ chế thanh toán có thể kiểm toán và các biện pháp ngăn chặn thao túng. Giá trị cốt lõi của chúng không nằm ở việc "đặt cược vào tương lai", mà ở việc cung cấp một tín hiệu xác suất công cộng mới trong môi trường đầy bất định.

marsbit50 phút trước

a16z: Tại sao thị trường dự đoán sẽ trở thành cơ sở hạ tầng của 'xác suất tương lai'

marsbit50 phút trước

WSJ: Hyperliquid đang trở thành 'cửa hàng tiện lợi' tiền mã hóa cho Phố Wall

Hyperliquid, một nền tảng giao dịch phi tập trung (DEX) hoạt động 24/7, đang trở thành điểm đến cho các nhà giao dịch Wall Street để đặt cược vào nhiều loại tài sản – từ Bitcoin, dầu thô đến chỉ số S&P 500 hay các công ty chưa niêm yết như SpaceX – thông qua hợp đồng phái sinh vĩnh viễn (perpetual futures). Bài báo từ WSJ kể câu chuyện của nhà giao dịch Vala Zeinali, người đã thu lợi nhuận 243% trên Hyperliquid sau khi tin tức về cuộc không kích vào Iran làm giá dầu tăng vọt. Nền tảng này, được sáng lập bởi Jeff Yan – cựu giao dịch định lượng – sau sự sụp đổ của FTX, nhấn mạnh vào việc tự giám sát tài sản (self-custody) và hiệu suất cao. Mặc dù chưa khả dụng cho người dùng Mỹ, nhiều nhà giao dịch vẫn sử dụng VPN để truy cập, bị thu hút bởi giao diện thân thiện, không cần xác minh danh tính nghiêm ngặt và sự lựa chọn tài sản đa dạng. Đồng thời, một cộng đồng mạnh mẽ đã hình thành xung quanh đồng native token HYPE (vốn hóa ~160 tỷ USD) và linh vật "Hypurr". Tuy nhiên, sản phẩm hợp đồng vĩnh viễn đòn bẩy cao này tiềm ẩn rủi ro lớn, như đã thấy trong một đợt bán tháo hồi tháng 10 làm xóa sổ 10 tỷ USD vị thế trên Hyperliquid. Dù vậy, nền tảng vẫn có kế hoạch mở rộng sang thị trường dự đoán và quyền chọn, với mục tiêu cuối cùng là trở thành nơi giao dịch cho toàn bộ ngành tài chính.

marsbit59 phút trước

WSJ: Hyperliquid đang trở thành 'cửa hàng tiện lợi' tiền mã hóa cho Phố Wall

marsbit59 phút trước

Giao dịch

Giao ngay
Hợp đồng Tương lai

Bài viết Nổi bật

Làm thế nào để Mua ERA

Chào mừng bạn đến với HTX.com! Chúng tôi đã làm cho mua Caldera (ERA) trở nên đơn giản và thuận tiện. Làm theo hướng dẫn từng bước của chúng tôi để bắt đầu hành trình tiền kỹ thuật số của bạn.Bước 1: Tạo Tài khoản HTX của BạnSử dụng email hoặc số điện thoại của bạn để đăng ký tài khoản miễn phí trên HTX. Trải nghiệm hành trình đăng ký không rắc rối và mở khóa tất cả tính năng. Nhận Tài khoản của tôiBước 2: Truy cập Mua Crypto và Chọn Phương thức Thanh toán của BạnThẻ Tín dụng/Ghi nợ: Sử dụng Visa hoặc Mastercard của bạn để mua Caldera (ERA) ngay lập tức.Số dư: Sử dụng tiền từ số dư tài khoản HTX của bạn để giao dịch liền mạch.Bên thứ ba: Chúng tôi đã thêm những phương thức thanh toán phổ biến như Google Pay và Apple Pay để nâng cao sự tiện lợi.P2P: Giao dịch trực tiếp với người dùng khác trên HTX.Thị trường mua bán phi tập trung (OTC): Chúng tôi cung cấp những dịch vụ được thiết kế riêng và tỷ giá hối đoái cạnh tranh cho nhà giao dịch.Bước 3: Lưu trữ Caldera (ERA) của BạnSau khi mua Caldera (ERA), lưu trữ trong tài khoản HTX của bạn. Ngoài ra, bạn có thể gửi đi nơi khác qua chuyển khoản blockchain hoặc sử dụng để giao dịch những tiền kỹ thuật số khác.Bước 4: Giao dịch Caldera (ERA)Giao dịch Caldera (ERA) dễ dàng trên thị trường giao ngay của HTX. Chỉ cần truy cập vào tài khoản của bạn, chọn cặp giao dịch, thực hiện giao dịch và theo dõi trong thời gian thực. Chúng tôi cung cấp trải nghiệm thân thiện với người dùng cho cả người mới bắt đầu và người giao dịch dày dạn kinh nghiệm.

Tổng lượt xem 518Xuất bản vào 2025.07.17Cập nhật vào 2026.06.02

Làm thế nào để Mua ERA

Thảo luận

Chào mừng đến với Cộng đồng HTX. Tại đây, bạn có thể được thông báo về những phát triển nền tảng mới nhất và có quyền truy cập vào thông tin chuyên sâu về thị trường. Ý kiến ​​của người dùng về giá của ERA (ERA) được trình bày dưới đây.

活动图片