Đội ngũ NVIDIA để lập trình viên Agent tiếp quản thí nghiệm robot thực, tỷ lệ thành công đạt 99%

marsbitXuất bản vào 2026-06-18Cập nhật gần nhất vào 2026-06-18

Tóm tắt

Nghiên cứu tự động hóa đã vượt ra khỏi môi trường mô phỏng để bước vào thế giới vật lý thực tế. NVIDIA GEAR Lab mới đây giới thiệu dự án ENPIRE - một hệ thống lần đầu tiên cho phép các Agent lập trình (Codex Agent) tự động tiến hành nghiên cứu trực tiếp trên phần cứng robot. Chỉ với mục tiêu chung là giải quyết nhiệm vụ nhanh chóng, giữ robot hoạt động an toàn và không lãng phí tài nguyên tính toán, 8 Agent được triển khai trong một đội robot và tự động vận hành toàn bộ vòng lặp khép kín: tự đặt lại môi trường, tìm kiếm tài liệu, lập ý tưởng và xây dựng cơ sở hạ tầng, đào tạo và triển khai chiến lược, tự xác minh, phân tích nhật ký và cải thiện mã code. Quá trình này lặp lại cho đến khi robot hoàn thành đáng tin cậy các nhiệm vụ khéo léo phức tạp trong thực tế như buộc dây rút, sắp xếp kim vào hộp hay lắp đặt GPU, với tỷ lệ thành công lên tới 99%. Hệ thống ENPIRE được xây dựng dựa trên bốn mô-đun cốt lõi tạo thành vòng phản hồi vật lý có thể lặp lại. Một phát hiện quan trọng là việc đặt lại môi trường thường dễ dàng hơn việc hoàn thành nhiệm vụ chính. Do đó, ENPIRE tập trung vào việc để Agent tự xây dựng quy trình đặt lại môi trường tự động trước. Nghiên cứu cũng chỉ ra "định luật mở rộng vật lý": tăng số lượng robot chạy song song (ví dụ lên 8 robot) giúp tăng tốc độ giải quyết nhiệm vụ đáng kể. Để đo lường hiệu quả, nhóm nghiên cứu đề xuất hai chỉ số mới: Tỷ lệ sử dụng robot trung bình (MRU) và Tỷ lệ sử dụng token trung bình (MTU). Mục tiêu tương lai là hệ thống có thể tự ...

Nghiên cứu tự động hóa, lần này thực sự bước ra khỏi hộp cát mã nguồn, tiến vào thế giới vật lý thực tế.

Gần đây, Jim Fan, người đứng đầu phòng thí nghiệm NVIDIA GEAR, đã giới thiệu một dự án mới nhất có tên ENPIRE. Đây là lần đầu tiên họ thực hiện nghiên cứu tự động hóa trên phần cứng robot.

Họ đặt 8 Agent Codex vào một đội tàu robot, phân bổ sức mạnh tính toán GPU và ngân sách token dồi dào, chỉ đưa ra một mục tiêu đơn giản: giải quyết nhiệm vụ càng nhanh càng tốt, giữ cho robot luôn bận rộn nhưng đảm bảo an toàn, không lãng phí sức mạnh tính toán.

Sau đó, con người về cơ bản rút khỏi can thiệp. Agent tự chủ điều khiển toàn bộ vòng lặp khép kín, bao gồm tự động thiết lập lại cảnh, tìm kiếm tài liệu, hiện thực hóa ý tưởng và xây dựng cơ sở hạ tầng, đào tạo và triển khai chiến lược, tự xác minh, phân tích nhật ký và sửa mã, lặp đi lặp lại, cho đến khi hoàn thành một cách đáng tin cậy các nhiệm vụ khéo léo độ chính xác cao trên phần cứng thực, chẳng hạn như buộc dây rút, sắp xếp hộp đựng chốt cắm, lắp đặt GPU, v.v.

Họ cũng quan sát thấy một "định luật scaling vật lý": tăng số lượng robot song song (ví dụ: từ một ít lên 8 cái) có thể tăng tốc độ giải quyết nhiệm vụ một cách đáng kể.

Hiện tại, một số hệ thống của phòng thí nghiệm này đã đạt được sự lặp lại tự chủ qua đêm mà không có sự can thiệp của con người, nhà nghiên cứu chỉ cần xem báo cáo vào buổi sáng là đủ.

Jim Fan tuyên bố, mục tiêu trong tương lai là để các thành viên trong đội ngũ yên tâm nghỉ phép, thậm chí ngay cả CEO của NVIDIA Jensen Huang cũng không nhận ra phòng thí nghiệm vẫn đang tự chủ vận hành.

Dự án ENPIRE dự kiến sẽ hoàn toàn mã nguồn mở, lúc đó các nhà phát triển thông thường cũng có thể hy vọng xây dựng hệ thống nghiên cứu robot tự chủ tương tự tại nhà.

Địa chỉ dự án: https://research.nvidia.com/labs/gear/enpire/

Kiến trúc hệ thống ENPIRE: Bốn mô-đun tạo thành vòng lặp khép kín

ENPIRE là một hệ thống khung được thiết kế dành riêng cho Agent mã hóa, xây dựng vòng phản hồi vật lý có thể lặp lại thông qua bốn mô-đun lõi: Mô-đun môi trường (EN) chịu trách nhiệm tự động thiết lập lại và xác minh, Mô-đun cải thiện chiến lược (PI) khởi động tối ưu hóa chiến lược, Mô-đun Rollout (R) hỗ trợ đánh giá chiến lược song song trên một hoặc nhiều robot, Mô-đun tiến hóa (E) thì để Agent mã hóa phân tích nhật ký, tra cứu tài liệu, cải thiện cơ sở hạ tầng đào tạo và mã thuật toán để giải quyết các mô hình thất bại.

Hệ thống vòng lặp khép kín này chuyển đổi việc học robot thế giới thực thành một quá trình tối ưu hóa có thể kiểm soát được, do Agent quản lý, nhằm giảm thiểu tối đa sự đầu tư thủ công, đồng thời hỗ trợ thực hiện các thí nghiệm ablation công bằng giữa các công thức đào tạo và biến thể Agent khác nhau.

Với sự hỗ trợ của ENPIRE, các Agent lập trình tiên tiến có thể tự chủ phát triển chiến lược và đạt được tỷ lệ thành công 99% trong các nhiệm vụ thao tác khéo léo thế giới thực đầy thách thức như PushT, xếp chốt cắm vào hộp đựng chốt, sử dụng dao cắt để cắt dây rút, v.v.

Phát hiện then chốt: Thiết lập lại môi trường dễ hơn bản thân việc hoàn thành nhiệm vụ

Một trong những quan sát then chốt là: Đối với nhiều nhiệm vụ robot, việc thiết lập lại môi trường thường dễ dàng hơn chính việc hoàn thành nhiệm vụ.

Do đó, cách làm của ENPIRE là trước tiên để Agent xây dựng môi trường tự động thiết lập lại thông qua Chính-sách-như-Mã (Code-as-Policy). Trong nhiều trường hợp, cái gọi là thiết lập lại thực chất là một nhiệm vụ nhặt-và-đặt, có thể được giải quyết bởi Cap-X.

Sau đó, tác nhân thông minh sẽ viết hàm thưởng dựa trên quy tắc heuristic. Nhóm nghiên cứu sau đó đặt môi trường này vào hộp cát và khởi động Agent tiến hành nghiên cứu tự động hóa xoay quanh điểm số.

Điều này cũng tương đồng với định nghĩa của Karpathy về nghiên cứu tự động hóa: nghiên cứu tự động hóa được nói đến ở đây không phải là đơn giản điều chỉnh một siêu tham số hoặc sửa đổi một đoạn mã nhỏ. Agent sẽ khám phá các mô hình khác nhau từ internet và viết lại mọi phần có thể thúc đẩy hiệu suất, bao gồm thuật toán, mục tiêu đào tạo, thậm chí cả trình tải dữ liệu.

Trong nhiệm vụ xếp chốt cắm, một Agent thậm chí còn tự viết bộ điều khiển an toàn lực tiếp xúc, hiệu quả của nó vượt trội hơn so với việc chỉ đơn thuần điều chỉnh một số tham số học tăng cường.

Chỉ số mới MRU và MTU

Khả năng mở rộng của ENPIRE phụ thuộc vào quy mô đội ngũ Agent và tài nguyên sức mạnh tính toán, chỉ có điều ở đây, tài nguyên thực sự khan hiếm không phải là GPU, mà là thời gian robot.

Khi nhóm nghiên cứu cung cấp cho Agent 8 robot, thay vì 1 robot, thời gian cần thiết để nhiệm vụ xếp chốt đạt được hiệu suất gần hoàn hảo đã giảm từ hơn 1,5 giờ xuống còn khoảng 40 phút. Các Agent này phối hợp thông qua Git: chia sẻ mã, từ bỏ ý tưởng không lý tưởng và tự chủ lựa chọn kết quả chạy tốt nhất của nhau.

Điều này chỉ ra một sự thay đổi lớn hơn: nghiên cứu robot đang trở thành một công việc thiết kế môi trường, tức là xây dựng môi trường mà coding Agent có thể tiến hành nghiên cứu tự động hóa trong đó; công việc thuật toán thì dịch chuyển lên một tầng cao hơn, chuyển hướng sang xây dựng một loại vòng phản hồi mà Agent có thể tự khép kín.

Và vòng lặp này sẽ liên tục tích lũy theo lãi kép: Một kỹ năng mà Agent nắm vững hôm nay, ngày mai sẽ trở thành mô-đun cơ sở để xây dựng và thiết lập lại môi trường nhiệm vụ khó khăn hơn. Năng lực sẽ tự sinh ra năng lực mới.

Trong mô hình này, ràng buộc cứng thực sự là ngân sách tương tác thế giới thực.

Do đó, nhóm nghiên cứu đã đề xuất hai chỉ số:

  • Tỷ lệ sử dụng robot trung bình (Mean Robot Utilization, MRU): Tỷ lệ thời gian robot thực sự chạy thí nghiệm so với tổng thời gian thực tế tiêu thụ.
  • Tỷ lệ sử dụng Token trung bình (Mean Token Utilization, MTU): Đo lường hiệu quả của Agent trong việc chuyển đổi token thành tiến triển nghiên cứu.

Trong thí nghiệm của họ, MRU luôn thấp hơn 50%. Nghĩa là, robot có một nửa thời gian ở trạng thái nhàn rỗi, đang chờ Agent suy nghĩ. Do đó, harness tốt hơn và mô hình nhanh hơn sẽ trực tiếp chuyển hóa thành lợi ích thực tế.

PushT là một điểm chuẩn thao tác robot đã được sử dụng từ lâu. Thông thường, để hoàn thành nhiệm vụ này cần một lượng lớn dữ liệu minh họa của con người, cộng với vài giờ đào tạo sao chép hành vi.

Nhưng họ nhận thấy, Codex, Claude Code và Kimi Code đều sử dụng một bộ phương pháp heuristic dựa trên quy tắc để "giải quyết" nhiệm vụ này trong vòng chưa đầy 2 giờ: không sử dụng mạng nơ-ron, không tiến hành đào tạo và cũng không dựa vào bất kỳ dữ liệu con người nào.

Để nhiều người hơn có thể thử nghiệm nghiên cứu tự động hóa trong thế giới vật lý tại nhà, họ đã phát triển một hệ thống full-stack dựa trên bộ kit SO-101 của @LeRobotHF + NVIDIA Jetson Thor. Hệ thống này có thể hoàn thành nhiệm vụ PushT.

Liên kết tham khảo:

https://x.com/_wenlixiao/status/2066913334994358342

https://x.com/DrJimFan/status/2066921736369766762

Bài viết này từ tài khoản WeChat công chúng "机器之心" (ID: almosthuman2014), tác giả: Dương Văn (杨文)

Câu hỏi Liên quan

QDự án ENPIRE của NVIDIA đã đạt được thành công gì đáng chú ý trong lĩnh vực robot?

ADự án ENPIRE của NVIDIA đã thành công trong việc để các Agent lập trình (Codex Agent) tự động điều khiển một đội robot thực hiện các nhiệm vụ khéo léo trong thế giới thực, như buộc dây rút, sắp xếp kim vào hộp và lắp đặt GPU, với tỷ lệ thành công lên tới 99%.

QHệ thống ENPIRE hoạt động dựa trên những module chính nào?

AHệ thống ENPIRE được xây dựng dựa trên bốn module cốt lõi tạo thành một vòng lặp phản hồi vật lý: Môi trường (EN - Environment), Cải tiến Chiến lược (PI - Policy Improvement), Triển khai (R - Rollout) và Tiến hóa (E - Evolution).

QPhát hiện quan trọng nào về việc thiết lập lại môi trường so với hoàn thành nhiệm vụ được đề cập trong bài viết?

AMột phát hiện quan trọng là đối với nhiều nhiệm vụ robot, việc thiết lập lại (reset) môi trường thường dễ dàng hơn so với việc hoàn thành chính nhiệm vụ đó. Vì vậy, ENPIRE tập trung để Agent đầu tiên xây dựng môi trường tự động reset thông qua 'Code-as-Policy'.

QCác chỉ số MRU và MTU được giới thiệu trong bài nhằm mục đích gì?

AMRU (Mean Robot Utilization - Tỷ lệ sử dụng Robot trung bình) và MTU (Mean Token Utilization - Tỷ lệ sử dụng Token trung bình) là hai chỉ số mới được đề xuất để đo lường hiệu quả trong nghiên cứu tự động hóa. MRU đo thời gian robot thực sự chạy thí nghiệm, trong khi MTU đo hiệu quả chuyển đổi token (từ các Agent) thành tiến độ nghiên cứu. MRU thấp cho thấy robot thường xuyên rảnh rỗi chờ Agent 'suy nghĩ'.

QMục tiêu tương lai của nhóm nghiên cứu NVIDIA GEAR với dự án ENPIRE là gì?

AMục tiêu tương lai của nhóm là xây dựng một hệ thống hoàn toàn tự chủ, nơi các nhà nghiên cứu có thể yên tâm nghỉ phép và ngay cả CEO NVIDIA Jensen Huang cũng không nhận ra phòng thí nghiệm vẫn đang tự vận hành. Họ cũng có kế hoạch mã nguồn mở hoàn toàn dự án để các nhà phát triển có thể tự xây dựng hệ thống tương tự tại nhà.

Nội dung Liên quan

Nvidia CPU áp sát, RISC-V Trung Quốc đối đầu: Quan sát sâu về bán dẫn (Phần 4)

Tuần này, tin tức về việc NVIDIA chuẩn bị cung cấp CPU Vera cho khách hàng Trung Quốc từ tháng 8, với giá hơn 20.000 USD mỗi chip, một lần nữa làm nổi bật bài toán về sự phụ thuộc vào kiến trúc Arm và nhu cầu cấp thiết về một lựa chọn thay thế tự chủ, kiểm soát được cho hạ tầng AI. Trong bối cảnh đó, RISC-V đang nổi lên như một con đường tiềm năng, được thúc đẩy mạnh mẽ tại Trung Quốc đại lục bởi nhu cầu an ninh chuỗi cung ứng, giảm chi phí, chủ quyền công nghệ và làn sóng ứng dụng AI. Mặc dù đã thành công trong lĩnh vực nhúng, RISC-V đang chinh phục thách thức lớn nhất: điện toán hiệu năng cao (HPC) cho máy chủ và trung tâm dữ liệu. Ngành công nghiệp coi điểm chuẩn SPECint 15 (trên mỗi GHz) là "tấm vé vào cửa" cho câu lạc bộ HPC. Nhiều công ty Trung Quốc, cả từ cộng đồng mã nguồn mở lẫn thương mại, tuyên bố đã đạt hoặc vượt ngưỡng này, với xung nhịp vượt 3 GHz. Sự tiến bộ không chỉ dừng ở lõi đơn lẻ; trọng tâm đã chuyển sang toàn bộ "hệ thống con tính toán", bao gồm mạng NoC nhất quán, các tính năng RAS, quản lý từ xa (BMC/IPMI) và khả năng chịu lỗi (Partial Goods). Một bước ngoặt quan trọng là sự xuất hiện của bộ xử lý máy chủ RISC-V 40 lõi, tuân thủ 100% tiêu chuẩn RVA23 mà không có tập lệnh tùy chỉnh, thể hiện cam kết về khả năng tương thích phần mềm lâu dài thay vì tối ưu hóa điểm chuẩn ngắn hạn. Lợi thế cốt lõi của RISC-V nằm ở kiến trúc mô-đun mở, cho phép tùy chỉnh sâu cho các tải AI đa dạng và tiềm năng thống nhất ngăn xếp phần mềm, giảm gánh nặng trùng lặp cho các nhà phát triển chip AI. Tuy nhiên, con đường phía trước vẫn còn nhiều thách thức "cứng": hệ sinh thái phần mềm chưa hoàn thiện và bị phân mảnh, công cụ EDA và xác minh thiết kế còn hạn chế, hiệu suất và hiệu suất năng lượng trên mỗi lõi cần được cải thiện, cùng với những ràng buộc về công nghệ bán dẫn tiên tiến. Tóm lại, khi NVIDIA với Vera tiếp tục thống trị, RISC-V đại diện cho một con đường chiến lược dài hạn cho Trung Quốc. Cánh cửa vào thị trường HPC đã mở với những tiến bộ đáng kể về phần cứng và tư duy hệ thống. Tuy nhiên, hành trình để phá vỡ "tam giác bất khả thi" (thịnh vượng, kiểm soát, tự chủ) và xây dựng một hệ sinh thái cạnh tranh với các pháo đài như CUDA của NVIDIA vẫn còn dài và đòi hỏi sự kiên trì giải quyết những công việc khó khăn, kém hào nhoáng trong nhiều năm tới.

marsbit26 phút trước

Nvidia CPU áp sát, RISC-V Trung Quốc đối đầu: Quan sát sâu về bán dẫn (Phần 4)

marsbit26 phút trước

Stratosphere, Pudgy Penguins và Streamex Đồng Tổ Chức Bữa Tối VIP Founders Table Trong Khuôn Khổ ETHConf 2026 và NYC Tech Week

Vào ngày 9 tháng 6 năm 2026 tại New York, Stratosphere cùng với Pudgy Penguins và Streamex đã tổ chức bữa tối VIP Founders Table kín trong khuôn khổ ETHConf 2026 và NYC Tech Week. Sự kiện chỉ dành cho khách mời đã quy tụ các nhà lãnh đạo từ nhiều lĩnh vực bao gồm tài sản kỹ thuật số, công nghệ, AI, tài chính truyền thống và vốn tổ chức. Các khách mời tham dự đến từ các tổ chức hàng đầu như Citi, BitMine, BitGo, Pyth Network, Delphi Digital và nhiều công ty khác. Mục tiêu của hình thức Founders Table là tạo một không gian riêng tư, không có chương trình nghị sự sân khấu, để các cuộc trò chuyện diễn ra tự nhiên giữa những người có ảnh hưởng. Stratosphere đóng vai trò kết nối mạng lưới nhà sáng lập và nhà đầu tư, Pudgy Penguins mang thương hiệu cộng đồng mạnh mẽ, trong khi Streamex tập trung vào chủ đề token hóa vàng và hàng hóa. CEO Stratosphere, Hassan Shaikh, chia sẻ lạc quan về giai đoạn phát triển tiếp theo của tài sản kỹ thuật số, đặc biệt là token hóa hàng hóa. Bữa tối này củng cố vị thế của Stratosphere như một đối tác hệ sinh thái, giúp các dự án kết nối và phát triển bền vững. Chuỗi sự kiện Founders Table dự kiến sẽ tiếp tục được tổ chức xung quanh các hội nghị lớn trên toàn cầu.

TheNewsCrypto2 giờ trước

Stratosphere, Pudgy Penguins và Streamex Đồng Tổ Chức Bữa Tối VIP Founders Table Trong Khuôn Khổ ETHConf 2026 và NYC Tech Week

TheNewsCrypto2 giờ trước

Phân Tích Tăng Trưởng Notion: Từ Công Cụ Ghi Chú Đến 100 Triệu Người Dùng, Notion Xây Dựng Ba Vòng Xoáy Tăng Trưởng Về Sản Phẩm, Mẫu Và Cộng Đồng Như Thế Nào

Trong suốt hành trình 10 năm, Notion đã phát triển từ một công cụ ghi chú thành một nền tảng quản lý tri thức và cộng tác với 100 triệu người dùng, nhờ vào một hệ thống tăng trưởng phức tạp nhưng tự nhiên. Bài viết phân tích ba bánh đà tăng trưởng chồng lớp của Notion. **Bánh đà 1: Tăng trưởng dẫn dắt bởi Sản phẩm (Product-Led Growth):** Notion giảm thiểu rào cản bằng chiến lược miễn phí, cho phép người dùng cá nhân dễ dàng trải nghiệm giá trị ngay lập tức. Sản phẩm có tính lan truyền tự nhiên qua chia sẻ trang, mẫu và đặc biệt là cơ chế cộng tác, khiến người dùng tự mời đồng nghiệp tham gia, tạo ra hiệu ứng viral dựa trên nhu cầu công việc thực tế. **Bánh đà 2: Kinh tế Mẫu (Template Economy):** Để giải quyết vấn đề người dùng mới bối rối trước sự tự do của công cụ, hệ sinh thái mẫu đã ra đời. Các mẫu (từ chính thức và cộng đồng) biến khả năng trừu tượng thành giải pháp cụ thể, giảm chi phí kích hoạt và tạo kênh tăng trưởng SEO hiệu quả. Nó cũng tạo ra một cộng đồng người sáng tạo có lợi ích gắn liền với sự thành công của Notion. **Bánh đà 3: Tăng trưởng được Cộng đồng Thúc đẩy:** Cộng đồng Notion vượt xa một diễn đàn hỗ trợ, trở thành một tổ chức tăng trưởng phân tán. Người dùng không chỉ học hỏi mà còn cùng nhau sản xuất hướng dẫn, mẫu mã, case study và dịch thuật địa phương. Các chương trình như Đại sứ giúp Notion mở rộng toàn cầu một cách tự nhiên và đáng tin cậy. Cộng đồng biến người dùng thành nhà giáo dục và người truyền bá, tạo ra vòng tuần hoàn tự củng cố. **Mở rộng và Tương lai:** Notion tiến vào thị trường doanh nghiệp một cách tự nhiên theo hướng "từ dưới lên", thông qua việc thâm nhập từ các nhóm nhỏ và người dùng cá nhân trước. Trong thời đại AI, Notion tích hợp AI trực tiếp vào luồng công việc hiện có, nâng cấp giá trị sản phẩm và mẫu mã, mở ra cơ hội trở thành hệ điều hành công việc trong kỷ nguyên AI. Điều khó sao chép nhất ở Notion không phải là chức năng, mà là hệ sinh thái tổng thể đã được xây dựng: tài sản tri thức khổng lồ của người dùng, mạng lưới người sáng tạo, văn hóa cộng đồng và ba bánh đà tăng trưởng liên kết chặt chẽ, biến người dùng thành động lực phát triển liên tục cho chính nền tảng.

marsbit6 giờ trước

Phân Tích Tăng Trưởng Notion: Từ Công Cụ Ghi Chú Đến 100 Triệu Người Dùng, Notion Xây Dựng Ba Vòng Xoáy Tăng Trưởng Về Sản Phẩm, Mẫu Và Cộng Đồng Như Thế Nào

marsbit6 giờ trước

Hướng dẫn trải nghiệm thực tế thẻ AI WeChat: Liệu kỷ nguyên AI Shopping đã tới?

Tác giả: Alan | Biteye Content Team Ngày 17/6, WeChat chính thức ra mắt thẻ AI chuyên dụng. Theo mô tả, người dùng có thể đưa ra nhu cầu chi tiêu trong cuộc trò chuyện với Workbuddy (một Agent AI) và hoàn thành thanh toán qua thẻ này. Trải nghiệm thực tế cho thấy, đây không phải là tính năng "chi tiêu tự động hoàn toàn", mà là một lớp khả năng thanh toán được mở ra cho AI Agent, với mỗi giao dịch vẫn cần người dùng xác nhận. **Thẻ AI là gì?** Thẻ hoạt động như một "ví nhỏ" tách biệt với ví WeChat chính. Người dùng cần liên kết và nạp tiền vào thẻ này. Các giao dịch do AI khởi tạo sẽ ưu tiên trừ từ số dư độc lập này. **Cách kích hoạt:** Trong chat với Workbuddy, hỏi "Làm thế nào để sử dụng thẻ thanh toán AI chuyên dụng của WeChat?" -> Nhấp liên kết được cung cấp -> Quét mã QR bằng WeChat để liên kết và nạp tiền. **Các tình huống sử dụng được đề xuất:** Mua nội dung trả phí (báo cáo, dữ liệu), gọi API/tools trả phí, đăng ký/gia hạn dịch vụ. Tuy nhiên, tính năng này vẫn đang trong giai đoạn thử nghiệm và chưa dễ dàng tìm thấy các ứng dụng cụ thể. **Kiểm tra thực tế: Dùng Workbuddy đặt trà sữa Hi Tea (THẤT BẠI)** - Workbuddy không thể tự đặt hàng mà cần gọi Skill "Trợ lý sống Meituan". - Chỉ riêng việc tạo mã QR đăng nhập tài khoản Meituan đã tiêu tốn 185.37 điểm (vượt quá 150 điểm miễn phí nhận được mỗi ngày). - Sau khi đăng nhập và yêu cầu đặt trà, AI tạo được liên kết thanh toán qua thẻ AI. - Tuy nhiên, sau khi thanh toán, phát hiện AI đã mua nhầm một loại phiếu mua hàng (deal) trên Meituan không đúng với nhu cầu. **Nguyên nhân thất bại:** Vấn đề không nằm ở khả năng thanh toán của thẻ AI, mà ở chuỗi thực thi của Agent. Một tác vụ như "đặt trà sữa" đòi hỏi nhiều bước: hiểu nhu cầu, gọi đúng nền tảng, ủy quyền tài khoản, chọn đúng sản phẩm, xác nhận phương thức giao hàng,... Thẻ AI chỉ giải quyết được bước "thanh toán". Phần còn lại phụ thuộc hoàn toàn vào năng lực của Agent và Skill bên thứ ba. **Cơ chế an toàn hiện tại:** - **Nguồn tiền:** Chỉ sử dụng số dư trong thẻ AI. - **Xác nhận thanh toán:** Mỗi giao dịch đều cần người dùng xác nhận trên điện thoại. - **Tài khoản chính:** Không trực tiếp trừ tiền từ ví WeChat chính. - **Sản phẩm tại cửa hàng:** Sau thanh toán, người dùng vẫn cần đến cửa hàng để xác nhận sử dụng. **Kết luận:** Thẻ AI chuyên dụng của WeChat hiện giống một "ví nhỏ" có hạn mức kiểm soát được, cần xác nhận từng giao dịch và tách biệt với tài khoản chính. Nó đánh dấu một bước tiến trong việc tích hợp thanh toán cho AI, nhưng kỷ nguyên "AI Shopping" thực sự vẫn chưa bắt đầu, vì khả năng thực thi nhiệm vụ phức tạp của Agent vẫn còn nhiều hạn chế. Người dùng muốn trải nghiệm nên bắt đầu với số tiền nhỏ, các dịch vụ số và luôn kiểm tra kỹ thông tin sản phẩm trước khi xác nhận thanh toán.

marsbit6 giờ trước

Hướng dẫn trải nghiệm thực tế thẻ AI WeChat: Liệu kỷ nguyên AI Shopping đã tới?

marsbit6 giờ trước

100 tỷ USD, Qualcomm định mua lại công ty của huyền thoại chip Jim Keller

Theo tin từ The Information, gã khổng lồ chip di động Qualcomm đang đàm phán mua lại startup chip AI Tenstorrent với định giá khoảng 80-100 tỷ USD, mức định giá này cao gấp 4 lần so với cuối năm ngoái. Thương vụ này có thể trở thành một trong những vụ mua lại lớn nhất trong lĩnh vực chip AI toàn cầu 3 năm trở lại đây. Động lực chính của Qualcomm là sự cấp thiết phải đa dạng hóa để thoát khỏi sự phụ thuộc vào chip điện thoại thông minh. Bằng cách mua Tenstorrent, do huyền thoại thiết kế chip Jim Keller dẫn dắt, Qualcomm có thể nhanh chóng bổ sung năng lực cho thị trường điện toán đám mây và trung tâm dữ liệu AI cao cấp, bỏ qua giai đoạn tự nghiên cứu tốn thời gian. Tenstorrent thu hút Qualcomm nhờ lộ trình công nghệ "phản-NVIDIA" với kiến trúc hiệu quả chi phí, sử dụng bộ nhớ GDDR6 và SRAM thay vì HBM đắt đỏ, cùng kết nối Ethernet tiêu chuẩn. Điều này hứa hẹn một giải pháp thay thế hấp dẫn về giá. Ngoài ra, năng lực của Tenstorrent trong lĩnh vực CPU RISC-V hiệu suất cao, như TT-Ascalon có thể cạnh tranh với nhân Arm Neoverse, mang đến cho Qualcomm một lựa chọn thay thế kiến trúc mới. Sản phẩm CPU RISC-V phiên bản ô tô "Alexandria" của Tenstorrent cũng phù hợp với chiến lược "Snapdragon Digital Chassis" của Qualcomm trong lĩnh vực xe thông minh và điện toán biên. Tuy nhiên, thương vụ này cũng đối mặt với thách thức. Định giá cao đã khiến cổ phiếu Qualcomm giảm nhẹ và các nhà đầu tư tỏ ra thận trọng. Việc tích hợp công nghệ, giữ chân nhân tài và chuyển đổi thành doanh thu thành công trong một thị trường AI biến động nhanh là những rào cản. Bản chất nguồn mở và tính độc lập của Tenstorrent cũng đặt ra bài toán hòa nhập với tập đoàn Qualcomm. Cơ cấu thanh toán dựa trên cột mốc kinh doanh có thể được áp dụng để giảm thiểu rủi ro.

marsbit6 giờ trước

100 tỷ USD, Qualcomm định mua lại công ty của huyền thoại chip Jim Keller

marsbit6 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片