Đối thoại với Mai-Lan của Amazon Web Services: Mặt trận tiếp theo của S3, làm thế nào để ứng phó với làn sóng tiêu thụ dữ liệu điên cuồng thời kỳ Agent

marsbitXuất bản vào 2026-05-08Cập nhật gần nhất vào 2026-05-08

Tóm tắt

Đầu năm, sự bùng nổ của OpenClaw tại thị trường Trung Quốc đã cho thấy tiềm năng to lớn của Agent (tác nhân AI). Tuy nhiên, điều này đặt ra một thách thức cho các nhà cung cấp điện toán đám mây: cơ sở hạ tầng dữ liệu có sẵn sàng cho làn sóng Agent tiêu thụ dữ liệu cực kỳ mạnh mẽ và thường xuyên hay không? Mai-Lan Tomsen Bukovec, Phó chủ tịch kỹ thuật tại Amazon Web Services, chỉ ra rằng Agent hoạt động theo mô hình "lựa chọn tối ưu song song", thực hiện hàng chục, thậm chí hàng trăm truy vấn đồng thời. Điều này biến Agent thành những người tiêu dùng dữ liệu cực kỳ tích cực, với tần suất và khối lượng dữ liệu tăng theo cấp số nhân. Vì vậy, hiệu quả chi phí của các dịch vụ dữ liệu cơ bản ngày càng trở nên quyết định. Nhân dịp kỷ niệm 20 năm Amazon S3, dịch vụ này đã có ba bước phát triển lớn để đáp ứng nhu cầu xử lý dữ liệu trong kỷ nguyên AI: S3 Table (định dạng bảng), S3 Files (tệp) và S3 Vectors (vector). S3 Table hỗ trợ gốc Apache Iceberg, một định dạng mà Agent có thể tương tác trực tiếp qua SQL. S3 Vectors đưa vector trở thành kiểu dữ liệu gốc, được sử dụng để xây dựng ngữ cảnh cho dữ liệu hoặc làm bộ nhớ chia sẻ cho hệ thống Agent, với mức độ sử dụng tăng mạnh. S3 Files cho phép Agent xử lý dữ liệu trong S3 thông qua tiêu chuẩn hệ thống tệp POSIX quen thuộc, coi đó như một "không gian bộ nhớ chia sẻ". Mai-Lan nhấn mạnh rằng thiết kế cốt lõi của Amazon S3 là thúc đẩy sự phát triển của các loại dữ liệu chính một cách kinh tế, trong khi vẫn tuân thủ các nguyên tắc về kh...

Đầu năm, sự bùng nổ của OpenClaw tại thị trường Trung Quốc đã cho mọi người thấy tiềm năng khổng lồ của Agent. Nhưng đi kèm theo đó là một câu hỏi mà tất cả các nhà cung cấp dịch vụ đám mây đều phải trả lời: Khi Agent bắt đầu sinh sôi nảy nở như tôm hùm cyber và gọi dữ liệu với tần suất cao, thì tầng cơ sở hạ tầng AI, đặc biệt là tầng dữ liệu, đã sẵn sàng chưa?

Ví dụ, khi các đội ngũ dữ liệu doanh nghiệp triển khai Agent vào môi trường sản xuất, họ thường gặp phải nút thắt ở cấp độ dữ liệu. Việc xây dựng Agent trên các nền tảng khác nhau như cơ sở dữ liệu vector, cơ sở dữ liệu quan hệ, cơ sở dữ liệu đồ thị và hồ dữ liệu, đòi hỏi phải đồng bộ hóa các đường ống dữ liệu để duy trì tính kịp thời của thông tin ngữ cảnh. Nhưng trong môi trường sản xuất thực tế, những thông tin ngữ cảnh này sẽ dần trở nên lỗi thời.

Sự cấp bách của vấn đề này bắt nguồn từ mô hình tiêu thụ dữ liệu hoàn toàn khác biệt giữa Agent và kỹ sư con người.

"Agent đang tiêu thụ dữ liệu một cách cực kỳ năng động và cực đoan, tần suất gọi dữ liệu đến kho dữ liệu hoặc hồ dữ liệu của nó là đáng kinh ngạc."

Phó chủ tịch kỹ thuật của Amazon Web Services, Mai-Lan Tomsen Bukovec, gần đây trong cuộc trao đổi với tác giả đã chỉ ra rằng, Agent hoạt động theo mô hình "tối ưu hóa song song": không phải một truy vấn tại một thời điểm, mà là hàng chục, hàng trăm truy vấn cùng lúc, thông qua so sánh để tìm ra con đường tối ưu nhất. Điều này khiến Agent trở thành một đối tượng tiêu thụ dữ liệu cực kỳ cực đoan so với con người — tần suất gọi dữ liệu cao hơn nhiều cấp số, lượng thông lượng dữ liệu tăng theo cấp số nhân.

Mai-Lan nói thêm, "Hiện tại khách hàng rất mong muốn xây dựng cơ sở hạ tầng Agent, chi phí hay nói cách khác là giá trị trên chi phí, không còn là yếu tố thứ yếu, mà đã trở thành yếu tố quyết định. Trong nửa năm đến một năm tới, cùng với sự bùng nổ của Agent, việc lựa chọn dịch vụ dữ liệu nền tảng sẽ trở nên cực kỳ quan trọng."

Ngày nay, không khí lễ hội của OpenClaw đang dần lắng xuống, để lại cảnh báo về bài kiểm tra áp lực đối với năng lực lưu trữ và xử lý nền tảng của các nhà cung cấp dịch vụ đám mây. Mai-Lan cho rằng, Amazon Web Services có lợi thế tự nhiên trong lĩnh vực này. Quy mô của Amazon S3 (Amazon Simple Storage Service), hiệu quả chi phí của Amazon Redshift và Amazon Athena dưới điều kiện tải cao, chính là được chuẩn bị cho cách thức tương tác dữ liệu siêu quy mô và tần suất siêu cao này của Agent.

Nhân kỷ niệm 20 năm ra đời sản phẩm Amazon S3, xoay quanh nhu cầu xử lý dữ liệu của khách hàng trong thời đại AI, Amazon S3 gần đây cũng đã thực hiện ba thay đổi lớn: S3 Table (định dạng bảng), S3 Files (tệp) và S3 Vector (vector).

Như việc S3 Table hỗ trợ natively cho Apache Iceberg. Mai-Lan chỉ ra rằng, khi xử lý dữ liệu, Agent có xu hướng tương tác trực tiếp với dữ liệu định dạng Iceberg thông qua SQL. Logic cơ bản nằm ở chỗ, Agent được xây dựng trên nền tảng mô hình lớn, và mô hình lớn trong quá trình huấn luyện đã hình thành khả năng xử lý trưởng thành đối với cú pháp SQL và định dạng dữ liệu Iceberg. Việc lưu trữ tất cả dữ liệu bảng dưới định dạng Iceberg trong S3 cho phép Agent xử lý dữ liệu hiệu quả mà không cần học nhiều API truy cập phức tạp khác nhau. Hiện tại, sự ăn khớp giữa Agent với S3 và Iceberg đang thể hiện ở mức độ cao.

Khi khả năng Iceberg được tích hợp vào S3, nó đã tạo ra một làn sóng sáng tạo Sina mới. Các nguồn dữ liệu như Postgres, Oracle bắt đầu ghi trực tiếp vào Iceberg, và hệ thống Agent có thể tương tác trực tiếp với các bảng này. Và với sự ra mắt của S3 Vectors, ngày càng nhiều ứng dụng AI bắt đầu sử dụng vector làm vật chứa bộ nhớ chia sẻ, từ đó truyền "trạng thái" vào trải nghiệm tương tác AI.

Mai-Lan cũng chỉ ra rằng, vector đã được giới thiệu như một kiểu dữ liệu gốc của S3. Ứng dụng của vector chủ yếu tập trung vào hai chiều: một là sử dụng vector để xây dựng thông tin ngữ cảnh cho dữ liệu được lưu trữ trong S3, hai là sử dụng vector như bộ nhớ chia sẻ. Trong năm tháng sau khi S3 Vectors được phát hành, phản hồi thị trường đúng như kỳ vọng. Một lượng lớn khách hàng bắt đầu sử dụng tính năng này, thông qua mô hình nhúng để tạo ra vector làm phong phú thêm ngữ cảnh của dữ liệu. Việc sử dụng S3 Vectors như không gian bộ nhớ cho hệ thống Agent đang tăng trưởng bùng nổ.

Đáng chú ý, S3 Files được phát hành vài tuần trước, cho phép Agent xử lý dữ liệu trong S3 thông qua tiêu chuẩn POSIX, tức là cách thức hệ thống tệp. Trong hệ thống Agent, mô hình lớn rất chú trọng đến hình thái "tệp", cho dù là thư viện Python hay tập lệnh Shell, đều là những nội dung quen thuộc trong quá trình huấn luyện mô hình lớn. Agent có xu hướng tự nhiên coi tệp là giao diện dữ liệu.

Vì lý do này, ý tưởng thiết kế của S3 Files là gắn kết một hệ thống tệp EFS lên bucket lưu trữ S3. Thông qua cơ chế này, người dùng có thể xử lý dữ liệu S3 trong hệ thống tệp dựa trên tiêu chuẩn POSIX: các tệp nhỏ có thể được truy cập nhanh hơn nhờ bộ nhớ đệm EFS, còn các tệp lớn thì được truyền trực tiếp từ S3 theo luồng. Điều này cho phép Agent tương tác nguyên bản với dữ liệu S3 bằng ngôn ngữ hệ thống tệp quen thuộc, và coi hệ thống tệp chia sẻ như "không gian bộ nhớ chia sẻ" từ S3.

Xét từ sự phát triển khả năng ghi nhớ của mô hình lớn, bước tiến này có ý nghĩa quan trọng. Trải nghiệm AI hiện tại đang dần được đưa vào ngữ cảnh hội thoại sâu hơn và tương tác cá nhân hóa — cho dù là giữa các Agent với nhau, giữa người và Agent, hay giữa Agent và dữ liệu, hiệu suất của mô hình đều đang không ngừng tiến hóa. Thông qua việc mở rộng hơn nữa giao diện tự nhiên này là hệ thống tệp, khả năng ghi nhớ của hệ thống Agent có triển vọng được nâng cao ở mức độ sâu hơn.

Tác giả lưu ý rằng, từ năm 2006 chủ yếu là dữ liệu bán cấu trúc như hình ảnh, đến dữ liệu phân tích sau này, từ kho dữ liệu ban đầu đến sự trỗi dậy của hồ dữ liệu, hiện tại Amazon Web Services đang tích cực thúc đẩy Amazon S3 trở thành nền tảng then chốt đảm nhận tải công việc AI, để đáp ứng nhu cầu của khách hàng hiện tại. Mai-Lan cho rằng, thiết kế cốt lõi của Amazon S3 là thúc đẩy sự phát triển của các kiểu dữ liệu chủ đạo một cách kinh tế, và luôn kiên trì các nguyên tắc về tính khả dụng, độ bền và khả năng phục hồi của dữ liệu. Và đây cũng chính là lý do khách hàng trong 20 năm qua tiếp tục giao phó hoạt động dữ liệu của họ cho S3, và nó cũng sẽ đảm nhận khả năng trong 20 năm tiếp theo.

(Tác giả | Dương Lệ, Biên tập | Dương Lâm)

Câu hỏi Liên quan

QTheo Mai-Lan, đặc điểm nổi bật nào trong cách tiêu thụ dữ liệu của Agent khiến nó trở thành 'người tiêu dùng dữ liệu cực kỳ tích cực và mạnh mẽ'?

AAgent hoạt động theo mô hình 'lựa chọn tối ưu song song', thực hiện hàng chục, thậm chí hàng trăm truy vấn đồng thời để so sánh và tìm ra đường đi tốt nhất. Điều này dẫn đến tần suất gọi dữ liệu cao hơn nhiều lần và lượng dữ liệu thông qua tăng theo cấp số nhân so với con người.

QAmazon S3 gần đây đã có ba thay đổi lớn để đáp ứng nhu cầu xử lý dữ liệu trong thời đại AI là gì?

ABa thay đổi lớn là: S3 Table (hỗ trợ native cho định dạng Apache Iceberg), S3 Files (cho phép Agent xử lý dữ liệu trong S3 thông qua tiêu chuẩn POSIX như một hệ thống tệp) và S3 Vectors (đưa vector vào như một kiểu dữ liệu gốc của S3).

QTại sao việc hỗ trợ Apache Iceberg cho S3 Table lại quan trọng đối với tương tác của Agent với dữ liệu?

AVì Agent được xây dựng trên mô hình lớn (LLM), vốn đã được đào tạo để xử lý thành thạo cú pháp SQL và định dạng dữ liệu Iceberg. Lưu trữ tất cả dữ liệu bảng dưới dạng Iceberg trong S3 cho phép Agent xử lý dữ liệu hiệu quả mà không cần học nhiều API truy cập phức tạp khác nhau, thể hiện sự tương thích cao.

QS3 Vectors được sử dụng chủ yếu cho những mục đích nào trong hệ thống Agent?

AS3 Vectors được sử dụng chủ yếu ở hai khía cạnh: 1) Xây dựng ngữ cảnh (context) cho dữ liệu được lưu trữ trong S3. 2) Sử dụng vector như một bộ nhớ chia sẻ (shared memory) cho hệ thống Agent, góp phần tạo ra trải nghiệm tương tác AI có 'trạng thái'.

QCơ chế hoạt động của S3 Files giúp Agent tương tác với dữ liệu như thế nào?

AS3 Files cho phép gắn kết một hệ thống tệp EFS lên bucket S3. Thông qua cơ chế này, Agent có thể xử lý dữ liệu S3 bằng ngôn ngữ hệ thống tệp quen thuộc (POSIX): tệp nhỏ được truy cập nhanh qua bộ nhớ đệm EFS, tệp lớn được truyền trực tiếp từ S3. Điều này cho phép Agent coi hệ thống tệp chia sẻ như một 'không gian bộ nhớ chia sẻ' từ S3.

Nội dung Liên quan

Báo cáo tài chính Quý 1 của Coinbase: Thua lỗ gần 400 triệu USD, khối lượng giao dịch giảm một nửa, Liệu AI+RWA có thể lật ngược tình thế?

Coinbase vừa công bố báo cáo tài chính Quý 1/2026 với tổng doanh thu 1,41 tỷ USD, giảm 31% so với cùng kỳ. Công ty ghi nhận lỗ ròng 394 triệu USD, chủ yếu do khoản lỗ chưa thực hiện 482 triệu USD từ tài sản tiền mã hóa nắm giữ. Nếu loại trừ khoản này, lỗ điều chỉnh là 45,6 triệu USD. Do thị trường tiền mã hóa trầm lắng, khối lượng giao dịch toàn cầu giảm khoảng 44%, dẫn đến doanh thu giao dịch của Coinbase giảm 40%, còn 756 triệu USD. Tuy nhiên, thị phần giao ngay toàn cầu của họ đã tăng lên mức kỷ lục 8,6%. Mảng thể chế và phái sinh cho thấy tín hiệu tích cực: doanh thu giao dịch thể chế tăng 37%, còn khối lượng phái sinh tăng 169% nhờ sáp nhập Deribit. Doanh thu từ dịch vụ đăng ký và ổn định tiền tệ (stablecoin) là điểm sáng, đạt 584 triệu USD (giảm 14%) và 305 triệu USD (tăng 11%) tương ứng. Trước đó, Coinbase đã cắt giảm khoảng 700 nhân viên (14% lực lượng lao động) để tái cấu trúc thành tổ chức "AI-native", nhằm tăng tốc độ và hiệu quả hoạt động. Về chiến lược, công ty đang mở rộng sang "Everything Exchange", một nền tảng đa tài sản, với khối lượng phái sinh lần đầu vượt giao ngay. Hợp đồng chia sẻ doanh thu stablecoin USDC với Circle tiếp tục là hào rào thu nhập quan trọng, dù chịu tác động từ biến động lãi suất và quá trình xây dựng luật CLARITY Act. Mặc dù kết quả quý chịu ảnh hưởng nặng nề từ chu kỳ thị trường, Coinbase đang tập trung vào việc xây dựng nền tảng cơ sở hạ tầng tài chính trên chuỗi (on-chain) dài hạn.

链捕手2 phút trước

Báo cáo tài chính Quý 1 của Coinbase: Thua lỗ gần 400 triệu USD, khối lượng giao dịch giảm một nửa, Liệu AI+RWA có thể lật ngược tình thế?

链捕手2 phút trước

Mastercard và Ripple Hoàn Tất Giao Dịch Lịch Sử, Đây Có Phải Là Trường Hợp Sử Dụng Mới Cho XRP?

Ondo Finance, Kinexys của J.P. Morgan, Mastercard và Ripple đã cùng hoàn thành giao dịch cổ phiếu Kho bạc được token hóa xuyên biên giới, liên ngân hàng đầu tiên gần như theo thời gian thực. Sổ cái XRP đóng vai trò là blockchain thanh toán, lần đầu tiên kết nối trực tiếp cơ sở hạ tầng blockchain công khai với hệ thống ngân hàng toàn cầu. Giao dịch thí điểm, được thực hiện trong vòng chưa đầy năm giây, diễn ra ngoài giờ ngân hàng truyền thống, cho thấy một bước tiến tới hệ thống tài chính hoạt động 24/7. Trong giao dịch, Ripple đã mua lại một phần cổ phần OUSG trên XRP Ledger. Ondo xử lý việc mua lại và kích hoạt lệnh thanh toán tiền pháp định thông qua Mạng lưới Đa Token của Mastercard, sau đó được định tuyến tới Kinexys để chuyển tiền USD vào tài khoản ngân hàng của Ripple ở Singapore. Sự kiện này diễn ra trong bối cảnh thị trường tài sản thế giới thực được token hóa (RWA) đang tăng trưởng mạnh, nhưng cơ sở hạ tầng mua lại vẫn còn chậm phát triển. Thí điểm chứng minh khả năng thực hiện các giao dịch xuyên biên giới như một luồng tích hợp duy nhất, đánh dấu một bước ngoặt quan trọng cho lĩnh vực non trẻ này và vị thế của XRP Ledger trong tài chính thể chế.

bitcoinist8 phút trước

Mastercard và Ripple Hoàn Tất Giao Dịch Lịch Sử, Đây Có Phải Là Trường Hợp Sử Dụng Mới Cho XRP?

bitcoinist8 phút trước

Bitcoin Tăng Mạnh, Nhưng Các Nhà Giao Dịch Vẫn Đang Ghi Nhận Khoản Lỗ 479 Triệu USD Mỗi Ngày

Bitcoin (BTC) đã có đợt tăng giá gần đây, nhưng dữ liệu on-chain từ Glassnode cho thấy một xu hướng trái ngược: chỉ số "Thiệt hại Thực tế" (Realized Loss) của mạng lưới vẫn ở mức cao. Cụ thể, chỉ số Thiệt hại Thực tế, đo lường tổng số lỗ mà các nhà đầu tư Bitcoin ghi nhận thông qua các giao dịch bán ra, hiện đang ở mức trung bình 479 triệu USD mỗi ngày. Con số này cao hơn khoảng 140% so với mức cơ bản 200 triệu USD thường thấy trong các giai đoạn ổn định của chu kỳ Bitcoin hiện tại. Điều đáng chú ý là sự gia tăng này xảy ra ngay cả khi giá Bitcoin đang hồi phục, cho thấy một lượng lớn nhà đầu tư vẫn đang chốt lỗ. Điều này có thể phản ánh tâm lý lo ngại rằng đợt tăng giá hiện tại sẽ không kéo dài, thúc đẩy họ thoát vị ở mức tổn thất thấp hơn thay vì chờ đợi. Glassnode lưu ý rằng, một dấu hiệu cho thấy thị trường thực sự chuyển sang trạng thái lành mạnh hơn sẽ là khi chỉ số Thiệt hại Thực tế này giảm bền vững xuống dưới ngưỡng 200 triệu USD mỗi ngày, chứng tỏ áp lực bán đã cạn kiệt. Tại thời điểm báo cáo, Bitcoin được giao dịch quanh mức 80.100 USD.

bitcoinist19 phút trước

Bitcoin Tăng Mạnh, Nhưng Các Nhà Giao Dịch Vẫn Đang Ghi Nhận Khoản Lỗ 479 Triệu USD Mỗi Ngày

bitcoinist19 phút trước

Đối tác a16z Crypto: Công nghệ mã hóa đang được các tổ chức tài chính tái đóng gói, tiềm năng vượt xa tưởng tượng

Tác giả Guy Wuollet, đối tác tại a16z Crypto, chỉ ra rằng trong khi hầu hết ngành công nghiệp đã số hóa, lĩnh vực tài chính vẫn còn tụt hậu, vận hành trên các hệ thống cô lập và phụ thuộc vào việc đối chiếu thủ công. Công nghệ blockchain đang được các định chế tài chính lớn áp dụng không phải vì lý tưởng phi tập trung ban đầu của crypto, mà để giải quyết vấn đề phối hợp thực tế: tạo ra một hệ thống trung lập cho nhiều bên cùng vận hành mà không cần giao quyền kiểm soát cho một chủ thể duy nhất. Việc chuyển tài sản lên blockchain biến bản thân tài sản thành hồ sơ gốc, loại bỏ nhu cầu sổ sách bên ngoài. Sự chuyển đổi cơ sở hạ tầng này mang lại lợi ích trực tiếp như thanh toán nhanh hơn và chi phí thấp hơn. Quan trọng hơn, nó mở ra khả năng kết hợp (composability), cho phép các tài sản và dịch vụ tài chính kỹ thuật số được tích hợp và xây dựng lẫn nhau một cách dễ dàng. Do đó, công nghệ crypto đang được đóng gói lại và trở thành nền tảng cho sự chuyển đổi số của ngành tài chính truyền thống, với tiềm năng vượt xa những gì chúng ta tưởng tượng.

marsbit29 phút trước

Đối tác a16z Crypto: Công nghệ mã hóa đang được các tổ chức tài chính tái đóng gói, tiềm năng vượt xa tưởng tượng

marsbit29 phút trước

Giao dịch

Giao ngay
Hợp đồng Tương lai

Bài viết Nổi bật

Làm thế nào để Mua ERA

Chào mừng bạn đến với HTX.com! Chúng tôi đã làm cho mua Caldera (ERA) trở nên đơn giản và thuận tiện. Làm theo hướng dẫn từng bước của chúng tôi để bắt đầu hành trình tiền kỹ thuật số của bạn.Bước 1: Tạo Tài khoản HTX của BạnSử dụng email hoặc số điện thoại của bạn để đăng ký tài khoản miễn phí trên HTX. Trải nghiệm hành trình đăng ký không rắc rối và mở khóa tất cả tính năng. Nhận Tài khoản của tôiBước 2: Truy cập Mua Crypto và Chọn Phương thức Thanh toán của BạnThẻ Tín dụng/Ghi nợ: Sử dụng Visa hoặc Mastercard của bạn để mua Caldera (ERA) ngay lập tức.Số dư: Sử dụng tiền từ số dư tài khoản HTX của bạn để giao dịch liền mạch.Bên thứ ba: Chúng tôi đã thêm những phương thức thanh toán phổ biến như Google Pay và Apple Pay để nâng cao sự tiện lợi.P2P: Giao dịch trực tiếp với người dùng khác trên HTX.Thị trường mua bán phi tập trung (OTC): Chúng tôi cung cấp những dịch vụ được thiết kế riêng và tỷ giá hối đoái cạnh tranh cho nhà giao dịch.Bước 3: Lưu trữ Caldera (ERA) của BạnSau khi mua Caldera (ERA), lưu trữ trong tài khoản HTX của bạn. Ngoài ra, bạn có thể gửi đi nơi khác qua chuyển khoản blockchain hoặc sử dụng để giao dịch những tiền kỹ thuật số khác.Bước 4: Giao dịch Caldera (ERA)Giao dịch Caldera (ERA) dễ dàng trên thị trường giao ngay của HTX. Chỉ cần truy cập vào tài khoản của bạn, chọn cặp giao dịch, thực hiện giao dịch và theo dõi trong thời gian thực. Chúng tôi cung cấp trải nghiệm thân thiện với người dùng cho cả người mới bắt đầu và người giao dịch dày dạn kinh nghiệm.

Tổng lượt xem 480Xuất bản vào 2025.07.17Cập nhật vào 2025.07.17

Làm thế nào để Mua ERA

Thảo luận

Chào mừng đến với Cộng đồng HTX. Tại đây, bạn có thể được thông báo về những phát triển nền tảng mới nhất và có quyền truy cập vào thông tin chuyên sâu về thị trường. Ý kiến ​​của người dùng về giá của ERA (ERA) được trình bày dưới đây.

活动图片