Đột phá mới trong Trí tuệ thể hiện: AutoNomy mở nguồn toàn bộ mô hình nền tảng robot đa năng ABot-M0

marsbitXuất bản vào 2026-04-01Cập nhật gần nhất vào 2026-04-01

Tóm tắt

Lĩnh vực trí tuệ thể hiện (Embodied AI) đạt bước tiến đột phá: AutoNomy (Gaode) chính thức mở nguồn toàn bộ mô hình nền tảng robot đa năng ABot-M0 - mô hình kiến trúc thống nhất đầu tiên trên toàn cầu dành cho thao tác của robot. ABot-M0 hướng tới mục tiêu "một bộ não đa năng phù hợp với nhiều loại robot", phá vỡ rào cản giữa các phần cứng khác nhau, thúc đẩy ứng dụng trí tuệ thể hiện từ phòng thí nghiệm vào công nghiệp và gia đình. Về hiệu suất: ABot-M0 đạt tỷ lệ hoàn thành nhiệm vụ 80.5% trên benchmark Libero-Plus, vượt trội hơn 30% so với phương án tiêu chuẩn trước đó là Pi0, đồng thời thiết lập kỷ lục mới (SOTA) trên cả Libero và RoboCasa. AutoNomy mở nguồn toàn diện 3 khía cạnh: 1. **Dữ liệu:** Bộ dữ liệu UniACT với hơn 6 triệu đường dẫn thao tác thực tế. 2. **Thuật toán:** Công bố kiến trúc mô hình, framework huấn luyện, bao gồm thuật toán học đa tạp hành động (AML) sáng tạo và kiến trúc cảm nhận hai luồng. 3. **Mô hình:** Cung cấp mô hình đã tiền huấn luyện end-to-end và bộ công cụ đầy đủ, cho phép sử dụng ngay lập tức. Việc mở nguồn ABot-M0 nhằm giải quyết các vấn đề "ốc đảo dữ liệu" và "triển khai khó khăn", giảm đáng kể ngưỡng ứng dụng cho robot hợp tác công nghiệp và robot dịch vụ gia đình, xây dựng cầu nối giữa nghiên cứu học thuật và ứng dụng công nghiệp.

Lĩnh vực trí tuệ thể hiện đón nhận bước tiến mang tính bước ngoặt. AutoNomy hôm nay chính thức công bố mở nguồn toàn bộ mô hình nền tảng vận hành thể hiện robot đầu tiên trên thế giới dựa trên kiến trúc thống nhất ABot-M0. Trọng tâm cốt lõi của mô hình này nhằm hiện thực hóa "một bộ não đa năng thích ứng với nhiều hình thái robot", hướng tới phá vỡ rào cản giữa các phần cứng không đồng nhất, đẩy nhanh tốc độ phát triển của trí tuệ thể hiện từ phòng thí nghiệm đến các ứng dụng công nghiệp và gia đình.

Hiệu suất và Công nghệ cốt lõi

ABot-M0 thể hiện hiệu suất vượt trội trong nhiều bài kiểm tra chuẩn ngành. Dữ liệu cho thấy, tỷ lệ hoàn thành nhiệm vụ của mô hình này trên chuẩn Libero-Plus đạt tới 80.5%, tăng gần 30% so với giải pháp tiêu biểu trước đó là Pi0. Hơn nữa, nó đã thiết lập kỷ lục SOTA (state-of-the-art, tiên tiến nhất ngành) mới trong các bài kiểm tra như Libero và RoboCasa.

Mở nguồn toàn bộ trên ba phương diện

Để giải quyết các điểm khó lâu nay trong lĩnh vực trí tuệ thể hiện là "ốc đảo dữ liệu" và "triển khai phức tạp", AutoNomy lần này mở nguồn bao gồm ba phương diện: dữ liệu nền tảng, thuật toán cốt lõi và mô hình tiền huấn luyện:

  • Về dữ liệu: Mở nguồn bộ dữ liệu robot đa năng có quy mô lớn nhất hiện nay UniACT. Bộ dữ liệu này tích hợp hơn 6 triệu đường chuyển động thao tác thực tế, và đi kèm cung cấp quy trình xử lý đầy đủ từ dữ liệu không đồng nhất đến dữ liệu huấn luyện tiêu chuẩn hóa.

  • Về thuật toán: Đồng thời công khai kiến trúc mô hình và framework huấn luyện, điểm nhấn cốt lõi bao gồm thuật toán Học đa tạp hành động (AML) sáng tạo của AutoNomy và Kiến trúc cảm nhận hai luồng, trao cho robot khả năng hiểu không gian và thực thi hành động xuất sắc.

  • Về mô hình: Cung cấp mô hình tiền huấn luyện end-to-end và đầy đủ toolchain. Các nhà phát triển có thể "sử dụng ngay", không cần xây dựng framework từ đầu, giảm đáng kể ngưỡng thích ứng cho robot hợp tác công nghiệp hoặc robot dịch vụ gia đình.

Tác động đến ngành

Trưởng nhóm kỹ thuật ABot-M0 của AutoNomy cho biết, trí tuệ thể hiện đa năng thực sự cần sự mài giũa chung của các nhà phát triển toàn cầu. Việc mở nguồn ABot-M0 không chỉ là chia sẻ công nghệ, mà hơn hết là hy vọng xây dựng cầu nối kết nối nghiên cứu học thuật và ứng dụng công nghiệp, để mỗi robot với hình thái khác nhau đều có thể sở hữu một "bộ não" thông minh, đáng tin cậy và đa năng.

Câu hỏi Liên quan

QMô hình cơ sở robot phổ thông ABot-M0 do AutoNamon phát triển đã đạt được thành tích gì nổi bật trong bài kiểm tra chuẩn Libero-Plus?

AABot-M0 đạt tỷ lệ hoàn thành nhiệm vụ lên tới 80.5% trên bài kiểm tra chuẩn Libero-Plus, vượt trội hơn 30% so với giải pháp tiêu biểu trước đó là Pi0.

QAutoNamon đã mở nguồn những gì trong bộ dữ liệu UniACT?

AAutoNamon mở nguồn bộ dữ liệu UniACT với hơn 6 triệu đường dẫn hoạt động thực tế, cùng quy trình xử lý đầy đủ từ dữ liệu dị thể đến dữ liệu huấn luyện tiêu chuẩn.

QCông nghệ cốt lõi nào của ABot-M0 giúp robot có khả năng hiểu không gian và thực hiện hành động xuất sắc?

AĐó là thuật toán Học đa tạp hành động (AML) và kiến trúc cảm nhận luồng kép (Dual-stream Perception Architecture) do AutoNamon sáng tạo.

QMục tiêu cốt lõi của mô hình ABot-M0 là gì?

AMục tiêu cốt lõi của ABot-M0 là thực hiện 'một bộ não phổ thông phù hợp với nhiều loại hình robot', nhằm phá vỡ rào cản giữa các phần cứng dị thể.

QTác động của việc mở nguồn ABot-M0 đối với ngành công nghiệp là gì theo chia sẻ của nhà phụ trách kỹ thuật?

AViệc mở nguồn nhằm xây dựng cầu nối giữa nghiên cứu học thuật và ứng dụng công nghiệp, giúp mọi robot có hình thái khác nhau đều sở hữu một 'bộ não' thông minh, đáng tin cậy và phổ thông.

Nội dung Liên quan

Nhóm của Lý Phi Phi làm rõ khái niệm 'Mô hình thế giới', Sora chỉ có thể tính là trình kết xuất

Nhóm của Giáo sư Lý Phi Phi từ World Labs và Đại học Stanford đã công bố một bài phân tích khái niệm, chỉ ra sự lạm dụng thuật ngữ "mô hình thế giới" trong AI. Bài viết phân loại các hệ thống được gọi là "mô hình thế giới" thành ba chức năng chiếu theo vòng lặp nhận thức POMDP: bộ kết xuất, bộ mô phỏng và bộ lập kế hoạch. Theo phân loại này, các mô hình tạo video như Sora của OpenAI thuộc nhóm "bộ kết xuất". Chúng tập trung tạo ra đầu ra pixel chân thực cho thị giác con người từ trạng thái hoặc mô tả, nhưng không thực sự tính toán các quy luật vật lý chính xác để dự đoán sự thay đổi trạng thái dựa trên hành động. Do đó, chúng không phải là mô hình thế giới đầy đủ hay bộ mô phỏng thế giới. Ngược lại, "bộ mô phỏng" (ví dụ: NVIDIA Omniverse) tập trung vào việc tạo ra trạng thái vật lý-chính xác cho các tính toán, còn "bộ lập kế hoạch" chuyển đổi quan sát thành hành động. Sự nhầm lẫn khái niệm này, thường được thúc đẩy bởi tiếp thị, có thể dẫn đến đánh giá sai lệch về khả năng công nghệ, ảnh hưởng đến lựa chọn kỹ thuật và đầu tư. Việc làm rõ này có giá trị thực tiễn, giúp các doanh nghiệp và nhà đầu tư đánh giá đúng năng lực của từng loại hệ thống. Tương lai có thể hướng tới sự hợp nhất của ba chức năng, nhưng hiện tại, việc nhận biết ranh giới của chúng là rất quan trọng.

marsbit1 giờ trước

Nhóm của Lý Phi Phi làm rõ khái niệm 'Mô hình thế giới', Sora chỉ có thể tính là trình kết xuất

marsbit1 giờ trước

Từ Web3 đến AI Agent, Quỹ đầu tư mạo hiểm tiền mã hóa lâu đời Variant cược 2 tỷ đồng vào chuyển đổi

Tác giả: Variant Fund. Biên dịch: Deep Tide TechFlow. Quỹ đầu tư mạo hiểm tiền mã hóa Variant đã công bố Quỹ mới Variant 4 trị giá 222 triệu USD. Quỹ sẽ tập trung vào đầu tư giai đoạn sớm và tham gia vào các vòng tăng trưởng sau này. Thay vì chủ đề "quyền sở hữu kỹ thuật số" như trước đây, triết lý đầu tư cốt lõi của Variant giờ đây đã nâng cấp thành "quyền tự chủ". Quyền tự chủ là về khả năng chủ động của người dùng: mức độ kiểm soát của họ đối với cuộc sống, tài sản và danh tính của chính mình. Một cách để đạt được quyền tự chủ là sở hữu các thị trường, dữ liệu, sản phẩm và cơ sở hạ tầng mà họ sử dụng hàng ngày. Variant phân biệt rõ ràng giữa quyền tự chủ và tự động hóa đơn thuần. Tự động hóa thông minh là một trong những lĩnh vực công nghệ quan trọng nhất, nhưng việc nó có tăng cường quyền tự chủ hay không phụ thuộc vào việc nó phục vụ ai: người dùng hay một thực thể khác. Lý thuyết đầu tư mới của Variant là: đầu tư vào công nghệ mở rộng quyền tự chủ, tập trung vào các thị trường, cơ sở hạ tầng và ứng dụng mới trao quyền chủ động hơn cho người dùng thông qua việc tăng cường khả năng tiếp cận, kiến thức và quyền sở hữu. Lý thuyết này bao trùm các khoản đầu tư trước đây của họ vào các blockchain hàng đầu, cơ sở hạ tầng cho nhà phát triển, thị trường tài chính mới và sản phẩm tiêu dùng, đồng thời cũng phản ánh các khoản đầu tư gần đây vào các lĩnh vực như đại lý AI và danh tính kỹ thuật số. Variant tin rằng, các tác nhân thông minh (AI Agent) và các hệ thống tài chính toàn cầu mở sẽ thay đổi cấu trúc internet: từ một nơi người dùng thường là sản phẩm, trở thành một nơi người dùng có được khả năng chủ động chưa từng có. Sự thay đổi này sẽ không chỉ dừng lại ở người dùng cá nhân mà còn bao gồm các thị trường, công cụ và dịch vụ mới dành cho nhà phát triển và doanh nghiệp.

marsbit1 giờ trước

Từ Web3 đến AI Agent, Quỹ đầu tư mạo hiểm tiền mã hóa lâu đời Variant cược 2 tỷ đồng vào chuyển đổi

marsbit1 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片