# Bài viết Liên quan Mô Hình Thế Giới

Trung tâm Tin tức HTX cung cấp những bài viết mới nhất và phân tích chuyên sâu về "Mô Hình Thế Giới", bao gồm xu hướng thị trường, cập nhật dự án, phát triển công nghệ và chính sách quản lý trong ngành tiền kỹ thuật số.

Nhóm của Lý Phi Phi làm rõ khái niệm 'Mô hình thế giới', Sora chỉ có thể tính là trình kết xuất

Nhóm của Giáo sư Lý Phi Phi từ World Labs và Đại học Stanford đã công bố một bài phân tích khái niệm, chỉ ra sự lạm dụng thuật ngữ "mô hình thế giới" trong AI. Bài viết phân loại các hệ thống được gọi là "mô hình thế giới" thành ba chức năng chiếu theo vòng lặp nhận thức POMDP: bộ kết xuất, bộ mô phỏng và bộ lập kế hoạch. Theo phân loại này, các mô hình tạo video như Sora của OpenAI thuộc nhóm "bộ kết xuất". Chúng tập trung tạo ra đầu ra pixel chân thực cho thị giác con người từ trạng thái hoặc mô tả, nhưng không thực sự tính toán các quy luật vật lý chính xác để dự đoán sự thay đổi trạng thái dựa trên hành động. Do đó, chúng không phải là mô hình thế giới đầy đủ hay bộ mô phỏng thế giới. Ngược lại, "bộ mô phỏng" (ví dụ: NVIDIA Omniverse) tập trung vào việc tạo ra trạng thái vật lý-chính xác cho các tính toán, còn "bộ lập kế hoạch" chuyển đổi quan sát thành hành động. Sự nhầm lẫn khái niệm này, thường được thúc đẩy bởi tiếp thị, có thể dẫn đến đánh giá sai lệch về khả năng công nghệ, ảnh hưởng đến lựa chọn kỹ thuật và đầu tư. Việc làm rõ này có giá trị thực tiễn, giúp các doanh nghiệp và nhà đầu tư đánh giá đúng năng lực của từng loại hệ thống. Tương lai có thể hướng tới sự hợp nhất của ba chức năng, nhưng hiện tại, việc nhận biết ranh giới của chúng là rất quan trọng.

marsbit14 giờ trước

Nhóm của Lý Phi Phi làm rõ khái niệm 'Mô hình thế giới', Sora chỉ có thể tính là trình kết xuất

marsbit14 giờ trước

Từ một bàn ăn trưa đến vũ trụ vô tận: Fei-Fei Li đặt cược vào chiều kích tiếp theo của AI

**Tóm tắt bài viết:** Giáo sư Li Fei-Fei từ Đại học Stanford và nhà sáng lập World Labs tin rằng **Trí tuệ Không gian (Spatial Intelligence)** chính là biên giới tiếp theo của AI, vượt xa các mô hình ngôn ngữ lớn hiện tại. Cô lập luận rằng ngôn ngữ chỉ là một cách mã hóa thế giới với nhiều mất mát thông tin, trong khi sự hiểu biết và tương tác trong không gian vật lý 3D/4D mới là nền tảng cho trí thông minh, như lịch sử tiến hóa đã chứng minh (thị giác và nhận thức không gian có từ 540 triệu năm trước, so với ngôn ngữ chỉ khoảng 500.000 năm). World Labs đã phát triển mô hình **Marble** để chuyển hóa đầu vào (văn bản, hình ảnh, video) thành các thế giới 3D có thể điều hướng và tương tác hoàn chỉnh. Mặc dù quy mô nhỏ hơn nhiều so với các LLM hàng đầu như GPT-5, Marble đã có các ứng dụng thực tế trong phát triển game, sản xuất phim (giảm 40 lần thời gian), đào tạo robot, thiết kế nội thất và thậm chí trị liệu sức khỏe tâm thần (ví dụ: rối loạn ám ảnh cưỡng chế OCD, chứng sợ độ cao). Li Fei-Fei hình dung một tương lai nơi công nghệ này cho phép chúng ta tạo ra "vũ trụ vô hạn" và sống trong "đa vũ trụ" số. Tuy nhiên, cô nhấn mạnh tầm quan trọng của việc phát triển AI có trách nhiệm, lấy phẩm giá và quyền tự chủ của con người làm trung tâm, giống như cách điện đã thay đổi nền văn minh một cách tích cực. Hành trình phát triển trí tuệ không gian cho AI có thể dài, nhưng nó là bước tiến hóa cần thiết để AI thực sự "hiểu" và "hành động" trong thế giới.

marsbit05/27 00:17

Từ một bàn ăn trưa đến vũ trụ vô tận: Fei-Fei Li đặt cược vào chiều kích tiếp theo của AI

marsbit05/27 00:17

Trí tuệ Nhân tạo Vật lý Nổi lên, Những Suy nghĩ Mới của Tôi

"Trí tuệ nhân tạo vật lý" (Physical AI) đang bùng nổ, đánh dấu sự chuyển đổi từ AI trên màn hình sang việc hiểu và tác động lên thế giới thực. Khái niệm này được định nghĩa là các hệ thống có thể thực hiện nhiệm vụ gắn với sinh vật thông minh, tích hợp sâu các quy luật vật lý. Năm 2026 là "năm nguyên khai triển", trọng tâm chuyển từ "có thể động" sang "biết làm việc". Các công ty như Trí Nguyên (Trung Quốc) đã triển khai robot vào dây chuyền sản xuất thực tế và hướng tới sản xuất hàng loạt. Figure AI (Mỹ) phát triển kiến trúc hệ thần kinh tự trị ba lớp. Nvidia hợp tác với các gã khổng lồ robot công nghiệp để định hình nền tảng tương lai. Lực đẩy quan trọng là sự đột phá trong kỹ thuật hóa "Mô hình Thế giới", cho phép tạo dữ liệu đào tạo tổng hợp quy mô lớn trong môi trường mô phỏng, giảm đáng kể chi phí và thời gian huấn luyện robot. Kiến trúc ngành cũng thay đổi, từ "Cảm nhận - Lập kế hoạch - Điều khiển" truyền thống sang "Cảm nhận - Suy luận - Thực thi" dựa trên AI, giúp robot tự hiểu và phản ứng với thế giới vật lý. Một hiện tượng đáng chú ý là sự tham gia mạnh mẽ của các nhà cung ứng ô tô, tận dụng công nghệ và kinh nghiệm sản xuất từ lĩnh vực xe tự hành để đẩy nhanh tốc độ phát triển robot thể hiện. Cuộc đua đã bắt đầu, nhưng câu chuyện còn dài. Khả năng sản xuất hàng loạt, quản lý chuỗi cung ứng và thu thập dữ liệu thế giới thực sẽ là những yếu tố then chốt quyết định người chiến thắng, với cơ hội lớn dành cho các nhà cung cấp cơ sở hạ tầng.

marsbit05/18 04:46

Trí tuệ Nhân tạo Vật lý Nổi lên, Những Suy nghĩ Mới của Tôi

marsbit05/18 04:46

Thời khắc 'ChatGPT' của robot: AI tiến vào thế giới vật lý, blockchain thúc đẩy nền kinh tế máy móc

Các tiến bộ trong AI và robot đang hợp nhất, đưa trí tuệ nhân tạo từ môi trường kỹ thuật số vào thế giới vật lý. Robot hình người như Figure 03 của Tesla và Optimus đang phát triển nhanh, thực hiện các tác vụ gia đình và công nghiệp. Sự bùng nổ này được thúc đẩy bởi phần cứng rẻ hơn (cảm biến, pin, bộ truyền động), chip xử lý biên mạnh mẽ và các mô hình AI "thế giới" có thể học từ video để hiểu vật lý thực tế. Tuy nhiên, thách thức lớn nhất là thu thập dữ liệu đào tạo từ thế giới thực, vì robot cần trải nghiệm vật lý trực tiếp. Blockchain và token hóa xuất hiện như một giải pháp, tạo ra nền kinh tế máy móc phi tập trung nơi người dùng được thưởng token vì đóng góp dữ liệu hoặc điều khiển robot từ xa. Robot cũng có thể trở thành chủ thể kinh tế tự động, kiếm tiền và phân phối lợi nhuận cho chủ sở hữu token. Đến năm 2030, sự hội tụ của phần cứng giá rẻ, AI thông minh hơn và điện toán biên dự kiến sẽ đưa robot thông minh vào mọi ngành công nghiệp và cuộc sống gia đình, có thể dẫn đến "cửa hàng ứng dụng cho robot" nơi người dùng đăng ký các kỹ năng cụ thể thay vì mua robot chuyên dụng.

marsbit04/17 01:20

Thời khắc 'ChatGPT' của robot: AI tiến vào thế giới vật lý, blockchain thúc đẩy nền kinh tế máy móc

marsbit04/17 01:20

Năm Khai Mở Physical AI: Một Vụ Cá Cược Nghìn Tỷ Đô Về 'Thế Giới Vận Hành Như Thế Nào'

Năm 2026 được coi là năm khởi đầu của Physical AI (AI vật lý), đánh dấu bước chuyển AI từ việc "hiểu thế giới số" sang "hiểu và tác động lên thế giới vật lý". Các sự kiện lớn như AMI Labs của Yann LeCun huy động 1,03 tỷ USD, World Labs của Fei-Fei Li nhận đầu tư 1 tỷ USD, và Tesla triển khai robot Optimus trong nhà máy cho thấy xu hướng này. Physical AI không chỉ thay đổi công nghệ mà còn tái định hình cơ sở hạ tầng, mở rộng cạnh tranh sang phần cứng, tích hợp hệ thống và dữ liệu. Đây là cơ hội cho các đội ngũ đa năng, kết hợp sâu về kỹ thuật, phần cứng và hiểu biết ngành. Cuộc chiến giữa mô hình ngôn ngữ lớn (LLM) và mô hình thế giới (World Model) nổi bật, với World Model tập trung vào dự đoán trạng thái vật lý thay vì văn bản. Phần cứng, đặc biệt là bàn tay linh hoạt, là thách thức then chốt, trong khi NVIDIA trở thành nền tảng cơ sở cho ngành. Dữ liệu tương tác vật lý là tài nguyên quý giá, được thu thập qua robot thật, mô phỏng và điều khiển từ xa. Các khoản đầu tư lớn trong quý 1/2026, vượt 6,4 tỷ USD, chứng tỏ Physical AI đang ở giai đoạn xây dựng cơ sở hạ tầng. Dù còn thách thức như demo khác triển khai thực tế, khoảng cách mô phỏng-thực tế, và thiếu khung quản lý, các tiến bộ công nghệ vẫn rõ rệt. Physical AI được xem là hình thái cuối cùng của AI, định hình lại ngành và giá trị, tạo cơ hội cho cộng đồng toàn cầu tham gia sâu vào các tầng quan trọng.

marsbit04/03 09:43

Năm Khai Mở Physical AI: Một Vụ Cá Cược Nghìn Tỷ Đô Về 'Thế Giới Vận Hành Như Thế Nào'

marsbit04/03 09:43

活动图片