Đối thoại với Mai-Lan của Amazon Web Services: Mặt trận tiếp theo của S3, làm thế nào để ứng phó với làn sóng tiêu thụ dữ liệu điên cuồng thời kỳ Agent

marsbitXuất bản vào 2026-05-08Cập nhật gần nhất vào 2026-05-08

Tóm tắt

Đầu năm, sự bùng nổ của OpenClaw tại thị trường Trung Quốc đã cho thấy tiềm năng to lớn của Agent (tác nhân AI). Tuy nhiên, điều này đặt ra một thách thức cho các nhà cung cấp điện toán đám mây: cơ sở hạ tầng dữ liệu có sẵn sàng cho làn sóng Agent tiêu thụ dữ liệu cực kỳ mạnh mẽ và thường xuyên hay không? Mai-Lan Tomsen Bukovec, Phó chủ tịch kỹ thuật tại Amazon Web Services, chỉ ra rằng Agent hoạt động theo mô hình "lựa chọn tối ưu song song", thực hiện hàng chục, thậm chí hàng trăm truy vấn đồng thời. Điều này biến Agent thành những người tiêu dùng dữ liệu cực kỳ tích cực, với tần suất và khối lượng dữ liệu tăng theo cấp số nhân. Vì vậy, hiệu quả chi phí của các dịch vụ dữ liệu cơ bản ngày càng trở nên quyết định. Nhân dịp kỷ niệm 20 năm Amazon S3, dịch vụ này đã có ba bước phát triển lớn để đáp ứng nhu cầu xử lý dữ liệu trong kỷ nguyên AI: S3 Table (định dạng bảng), S3 Files (tệp) và S3 Vectors (vector). S3 Table hỗ trợ gốc Apache Iceberg, một định dạng mà Agent có thể tương tác trực tiếp qua SQL. S3 Vectors đưa vector trở thành kiểu dữ liệu gốc, được sử dụng để xây dựng ngữ cảnh cho dữ liệu hoặc làm bộ nhớ chia sẻ cho hệ thống Agent, với mức độ sử dụng tăng mạnh. S3 Files cho phép Agent xử lý dữ liệu trong S3 thông qua tiêu chuẩn hệ thống tệp POSIX quen thuộc, coi đó như một "không gian bộ nhớ chia sẻ". Mai-Lan nhấn mạnh rằng thiết kế cốt lõi của Amazon S3 là thúc đẩy sự phát triển của các loại dữ liệu chính một cách kinh tế, trong khi vẫn tuân thủ các nguyên tắc về kh...

Đầu năm, sự bùng nổ của OpenClaw tại thị trường Trung Quốc đã cho mọi người thấy tiềm năng khổng lồ của Agent. Nhưng đi kèm theo đó là một câu hỏi mà tất cả các nhà cung cấp dịch vụ đám mây đều phải trả lời: Khi Agent bắt đầu sinh sôi nảy nở như tôm hùm cyber và gọi dữ liệu với tần suất cao, thì tầng cơ sở hạ tầng AI, đặc biệt là tầng dữ liệu, đã sẵn sàng chưa?

Ví dụ, khi các đội ngũ dữ liệu doanh nghiệp triển khai Agent vào môi trường sản xuất, họ thường gặp phải nút thắt ở cấp độ dữ liệu. Việc xây dựng Agent trên các nền tảng khác nhau như cơ sở dữ liệu vector, cơ sở dữ liệu quan hệ, cơ sở dữ liệu đồ thị và hồ dữ liệu, đòi hỏi phải đồng bộ hóa các đường ống dữ liệu để duy trì tính kịp thời của thông tin ngữ cảnh. Nhưng trong môi trường sản xuất thực tế, những thông tin ngữ cảnh này sẽ dần trở nên lỗi thời.

Sự cấp bách của vấn đề này bắt nguồn từ mô hình tiêu thụ dữ liệu hoàn toàn khác biệt giữa Agent và kỹ sư con người.

"Agent đang tiêu thụ dữ liệu một cách cực kỳ năng động và cực đoan, tần suất gọi dữ liệu đến kho dữ liệu hoặc hồ dữ liệu của nó là đáng kinh ngạc."

Phó chủ tịch kỹ thuật của Amazon Web Services, Mai-Lan Tomsen Bukovec, gần đây trong cuộc trao đổi với tác giả đã chỉ ra rằng, Agent hoạt động theo mô hình "tối ưu hóa song song": không phải một truy vấn tại một thời điểm, mà là hàng chục, hàng trăm truy vấn cùng lúc, thông qua so sánh để tìm ra con đường tối ưu nhất. Điều này khiến Agent trở thành một đối tượng tiêu thụ dữ liệu cực kỳ cực đoan so với con người — tần suất gọi dữ liệu cao hơn nhiều cấp số, lượng thông lượng dữ liệu tăng theo cấp số nhân.

Mai-Lan nói thêm, "Hiện tại khách hàng rất mong muốn xây dựng cơ sở hạ tầng Agent, chi phí hay nói cách khác là giá trị trên chi phí, không còn là yếu tố thứ yếu, mà đã trở thành yếu tố quyết định. Trong nửa năm đến một năm tới, cùng với sự bùng nổ của Agent, việc lựa chọn dịch vụ dữ liệu nền tảng sẽ trở nên cực kỳ quan trọng."

Ngày nay, không khí lễ hội của OpenClaw đang dần lắng xuống, để lại cảnh báo về bài kiểm tra áp lực đối với năng lực lưu trữ và xử lý nền tảng của các nhà cung cấp dịch vụ đám mây. Mai-Lan cho rằng, Amazon Web Services có lợi thế tự nhiên trong lĩnh vực này. Quy mô của Amazon S3 (Amazon Simple Storage Service), hiệu quả chi phí của Amazon Redshift và Amazon Athena dưới điều kiện tải cao, chính là được chuẩn bị cho cách thức tương tác dữ liệu siêu quy mô và tần suất siêu cao này của Agent.

Nhân kỷ niệm 20 năm ra đời sản phẩm Amazon S3, xoay quanh nhu cầu xử lý dữ liệu của khách hàng trong thời đại AI, Amazon S3 gần đây cũng đã thực hiện ba thay đổi lớn: S3 Table (định dạng bảng), S3 Files (tệp) và S3 Vector (vector).

Như việc S3 Table hỗ trợ natively cho Apache Iceberg. Mai-Lan chỉ ra rằng, khi xử lý dữ liệu, Agent có xu hướng tương tác trực tiếp với dữ liệu định dạng Iceberg thông qua SQL. Logic cơ bản nằm ở chỗ, Agent được xây dựng trên nền tảng mô hình lớn, và mô hình lớn trong quá trình huấn luyện đã hình thành khả năng xử lý trưởng thành đối với cú pháp SQL và định dạng dữ liệu Iceberg. Việc lưu trữ tất cả dữ liệu bảng dưới định dạng Iceberg trong S3 cho phép Agent xử lý dữ liệu hiệu quả mà không cần học nhiều API truy cập phức tạp khác nhau. Hiện tại, sự ăn khớp giữa Agent với S3 và Iceberg đang thể hiện ở mức độ cao.

Khi khả năng Iceberg được tích hợp vào S3, nó đã tạo ra một làn sóng sáng tạo Sina mới. Các nguồn dữ liệu như Postgres, Oracle bắt đầu ghi trực tiếp vào Iceberg, và hệ thống Agent có thể tương tác trực tiếp với các bảng này. Và với sự ra mắt của S3 Vectors, ngày càng nhiều ứng dụng AI bắt đầu sử dụng vector làm vật chứa bộ nhớ chia sẻ, từ đó truyền "trạng thái" vào trải nghiệm tương tác AI.

Mai-Lan cũng chỉ ra rằng, vector đã được giới thiệu như một kiểu dữ liệu gốc của S3. Ứng dụng của vector chủ yếu tập trung vào hai chiều: một là sử dụng vector để xây dựng thông tin ngữ cảnh cho dữ liệu được lưu trữ trong S3, hai là sử dụng vector như bộ nhớ chia sẻ. Trong năm tháng sau khi S3 Vectors được phát hành, phản hồi thị trường đúng như kỳ vọng. Một lượng lớn khách hàng bắt đầu sử dụng tính năng này, thông qua mô hình nhúng để tạo ra vector làm phong phú thêm ngữ cảnh của dữ liệu. Việc sử dụng S3 Vectors như không gian bộ nhớ cho hệ thống Agent đang tăng trưởng bùng nổ.

Đáng chú ý, S3 Files được phát hành vài tuần trước, cho phép Agent xử lý dữ liệu trong S3 thông qua tiêu chuẩn POSIX, tức là cách thức hệ thống tệp. Trong hệ thống Agent, mô hình lớn rất chú trọng đến hình thái "tệp", cho dù là thư viện Python hay tập lệnh Shell, đều là những nội dung quen thuộc trong quá trình huấn luyện mô hình lớn. Agent có xu hướng tự nhiên coi tệp là giao diện dữ liệu.

Vì lý do này, ý tưởng thiết kế của S3 Files là gắn kết một hệ thống tệp EFS lên bucket lưu trữ S3. Thông qua cơ chế này, người dùng có thể xử lý dữ liệu S3 trong hệ thống tệp dựa trên tiêu chuẩn POSIX: các tệp nhỏ có thể được truy cập nhanh hơn nhờ bộ nhớ đệm EFS, còn các tệp lớn thì được truyền trực tiếp từ S3 theo luồng. Điều này cho phép Agent tương tác nguyên bản với dữ liệu S3 bằng ngôn ngữ hệ thống tệp quen thuộc, và coi hệ thống tệp chia sẻ như "không gian bộ nhớ chia sẻ" từ S3.

Xét từ sự phát triển khả năng ghi nhớ của mô hình lớn, bước tiến này có ý nghĩa quan trọng. Trải nghiệm AI hiện tại đang dần được đưa vào ngữ cảnh hội thoại sâu hơn và tương tác cá nhân hóa — cho dù là giữa các Agent với nhau, giữa người và Agent, hay giữa Agent và dữ liệu, hiệu suất của mô hình đều đang không ngừng tiến hóa. Thông qua việc mở rộng hơn nữa giao diện tự nhiên này là hệ thống tệp, khả năng ghi nhớ của hệ thống Agent có triển vọng được nâng cao ở mức độ sâu hơn.

Tác giả lưu ý rằng, từ năm 2006 chủ yếu là dữ liệu bán cấu trúc như hình ảnh, đến dữ liệu phân tích sau này, từ kho dữ liệu ban đầu đến sự trỗi dậy của hồ dữ liệu, hiện tại Amazon Web Services đang tích cực thúc đẩy Amazon S3 trở thành nền tảng then chốt đảm nhận tải công việc AI, để đáp ứng nhu cầu của khách hàng hiện tại. Mai-Lan cho rằng, thiết kế cốt lõi của Amazon S3 là thúc đẩy sự phát triển của các kiểu dữ liệu chủ đạo một cách kinh tế, và luôn kiên trì các nguyên tắc về tính khả dụng, độ bền và khả năng phục hồi của dữ liệu. Và đây cũng chính là lý do khách hàng trong 20 năm qua tiếp tục giao phó hoạt động dữ liệu của họ cho S3, và nó cũng sẽ đảm nhận khả năng trong 20 năm tiếp theo.

(Tác giả | Dương Lệ, Biên tập | Dương Lâm)

Câu hỏi Liên quan

QTheo Mai-Lan, đặc điểm nổi bật nào trong cách tiêu thụ dữ liệu của Agent khiến nó trở thành 'người tiêu dùng dữ liệu cực kỳ tích cực và mạnh mẽ'?

AAgent hoạt động theo mô hình 'lựa chọn tối ưu song song', thực hiện hàng chục, thậm chí hàng trăm truy vấn đồng thời để so sánh và tìm ra đường đi tốt nhất. Điều này dẫn đến tần suất gọi dữ liệu cao hơn nhiều lần và lượng dữ liệu thông qua tăng theo cấp số nhân so với con người.

QAmazon S3 gần đây đã có ba thay đổi lớn để đáp ứng nhu cầu xử lý dữ liệu trong thời đại AI là gì?

ABa thay đổi lớn là: S3 Table (hỗ trợ native cho định dạng Apache Iceberg), S3 Files (cho phép Agent xử lý dữ liệu trong S3 thông qua tiêu chuẩn POSIX như một hệ thống tệp) và S3 Vectors (đưa vector vào như một kiểu dữ liệu gốc của S3).

QTại sao việc hỗ trợ Apache Iceberg cho S3 Table lại quan trọng đối với tương tác của Agent với dữ liệu?

AVì Agent được xây dựng trên mô hình lớn (LLM), vốn đã được đào tạo để xử lý thành thạo cú pháp SQL và định dạng dữ liệu Iceberg. Lưu trữ tất cả dữ liệu bảng dưới dạng Iceberg trong S3 cho phép Agent xử lý dữ liệu hiệu quả mà không cần học nhiều API truy cập phức tạp khác nhau, thể hiện sự tương thích cao.

QS3 Vectors được sử dụng chủ yếu cho những mục đích nào trong hệ thống Agent?

AS3 Vectors được sử dụng chủ yếu ở hai khía cạnh: 1) Xây dựng ngữ cảnh (context) cho dữ liệu được lưu trữ trong S3. 2) Sử dụng vector như một bộ nhớ chia sẻ (shared memory) cho hệ thống Agent, góp phần tạo ra trải nghiệm tương tác AI có 'trạng thái'.

QCơ chế hoạt động của S3 Files giúp Agent tương tác với dữ liệu như thế nào?

AS3 Files cho phép gắn kết một hệ thống tệp EFS lên bucket S3. Thông qua cơ chế này, Agent có thể xử lý dữ liệu S3 bằng ngôn ngữ hệ thống tệp quen thuộc (POSIX): tệp nhỏ được truy cập nhanh qua bộ nhớ đệm EFS, tệp lớn được truyền trực tiếp từ S3. Điều này cho phép Agent coi hệ thống tệp chia sẻ như một 'không gian bộ nhớ chia sẻ' từ S3.

Nội dung Liên quan

Đánh giá giữa năm của Fidelity: 6 xu hướng chính cho tài sản số vào năm 2026

Bài đánh giá giữa năm của Fidelity Digital Assets nhấn mạnh 6 xu hướng cốt lõi cho tài sản số vào năm 2026 đang hình thành, bất chấp biến động giá ngắn hạn. 1. **Tích hợp với thị trường vốn:** Xu hướng này tiến triển nhanh hơn dự kiến, với nhu cầu tiếp cận tài sản số qua kênh truyền thống vững chắc, sản phẩm phái sinh ETP Bitcoin tăng trưởng mạnh, và hoạt động token hóa ngày càng sôi động. Khung pháp lý cũng dần rõ ràng hơn. 2. **Quyền lợi người nắm giữ token:** Các cơ chế như mua lại token và cải tổ quản trị (ví dụ Aave) đang được thử nghiệm, nhưng "mức giá ưu đãi" cho quyền lợi này chưa thể hiện đầy đủ trong định giá thị trường. 3. **AI tác động đến khai thác Bitcoin:** Nhu cầu điện cho trí tuệ nhân tạo (AI) có thể đang khiến một số thợ đào chuyển hướng, dẫn đến tốc độ tăng hashrate và độ khó khai thác Bitcoin chậm lại, phù hợp với dự báo ban đầu. 4. **Bitcoin tại điểm ngoặt:** Việc tăng dữ liệu ghi trên OP_RETURN không làm tắc nghẽn mạng. Tuy nhiên, sự biến động lớn của các node Bitcoin Knots làm dấy lên lo ngại về rủi ro chia tách mạng tiềm ẩn, dù tỷ lệ phần trăm thấp. Các nỗ lực nâng cấp bảo mật lâu dài (như chống lượng tử) cũng đang được đẩy mạnh. 5. **Phe bán khống chiếm ưu thế tạm thời:** Bối cảnh vĩ mô (lạm phát, bất ổn địa chính trị) khiến giá Bitcoin giảm, phù hợp với kịch bản thị trường gấu. Tuy nhiên, trong các đợt bán tháo, Bitcoin đã phục hồi và vượt trội hơn một số tài sản truyền thống, cho thấy nhu cầu về tài sản trung lập, thanh khoản cao. Các lợi thế cấu trúc dài hạn vẫn tồn tại. 6. **Vàng duy trì sức mạnh:** Giá vàng được hỗ trợ bởi nhu cầu mua mạnh mẽ từ các ngân hàng trung ương và xu hướng phi đô la hóa, phù hợp với dự báo. Tuy nhiên, màn thể hiện vượt trội tiếp theo dự kiến của Bitcoin so với vàng vẫn chưa xuất hiện. **Kết luận:** Thị trường tài sản số năm 2026 đang cân bằng giữa áp lực ngắn hạn và tiến bộ cấu trúc dài hạn. Nền tảng cho giai đoạn tăng trưởng tiếp theo đang được củng cố, dù chưa thể hiện đầy đủ ra bên ngoài. Nhà đầu tư cần nhìn xa hơn biến động giá để nắm bắt những chuyển đổi nền tảng này.

marsbit5 giờ trước

Đánh giá giữa năm của Fidelity: 6 xu hướng chính cho tài sản số vào năm 2026

marsbit5 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai

Bài viết Nổi bật

Làm thế nào để Mua ERA

Chào mừng bạn đến với HTX.com! Chúng tôi đã làm cho mua Caldera (ERA) trở nên đơn giản và thuận tiện. Làm theo hướng dẫn từng bước của chúng tôi để bắt đầu hành trình tiền kỹ thuật số của bạn.Bước 1: Tạo Tài khoản HTX của BạnSử dụng email hoặc số điện thoại của bạn để đăng ký tài khoản miễn phí trên HTX. Trải nghiệm hành trình đăng ký không rắc rối và mở khóa tất cả tính năng. Nhận Tài khoản của tôiBước 2: Truy cập Mua Crypto và Chọn Phương thức Thanh toán của BạnThẻ Tín dụng/Ghi nợ: Sử dụng Visa hoặc Mastercard của bạn để mua Caldera (ERA) ngay lập tức.Số dư: Sử dụng tiền từ số dư tài khoản HTX của bạn để giao dịch liền mạch.Bên thứ ba: Chúng tôi đã thêm những phương thức thanh toán phổ biến như Google Pay và Apple Pay để nâng cao sự tiện lợi.P2P: Giao dịch trực tiếp với người dùng khác trên HTX.Thị trường mua bán phi tập trung (OTC): Chúng tôi cung cấp những dịch vụ được thiết kế riêng và tỷ giá hối đoái cạnh tranh cho nhà giao dịch.Bước 3: Lưu trữ Caldera (ERA) của BạnSau khi mua Caldera (ERA), lưu trữ trong tài khoản HTX của bạn. Ngoài ra, bạn có thể gửi đi nơi khác qua chuyển khoản blockchain hoặc sử dụng để giao dịch những tiền kỹ thuật số khác.Bước 4: Giao dịch Caldera (ERA)Giao dịch Caldera (ERA) dễ dàng trên thị trường giao ngay của HTX. Chỉ cần truy cập vào tài khoản của bạn, chọn cặp giao dịch, thực hiện giao dịch và theo dõi trong thời gian thực. Chúng tôi cung cấp trải nghiệm thân thiện với người dùng cho cả người mới bắt đầu và người giao dịch dày dạn kinh nghiệm.

Tổng lượt xem 516Xuất bản vào 2025.07.17Cập nhật vào 2026.06.01

Làm thế nào để Mua ERA

Thảo luận

Chào mừng đến với Cộng đồng HTX. Tại đây, bạn có thể được thông báo về những phát triển nền tảng mới nhất và có quyền truy cập vào thông tin chuyên sâu về thị trường. Ý kiến ​​của người dùng về giá của ERA (ERA) được trình bày dưới đây.

活动图片