Bài viết mới của Lý Phi Phi: Khi tạo video, robot và NVIDIA đều tự xưng là mô hình thế giới, chúng ta cần một phân loại học

链捕手Xuất bản vào 2026-07-05Cập nhật gần nhất vào 2026-07-05

Tóm tắt

Tác giả Lý Phi Phi đưa ra một phân loại rõ ràng cho khái niệm "mô hình thế giới" (world model) đang bị sử dụng lộn xộn trong AI hiện nay. Dựa trên vòng lặp POMDP cơ bản (tác nhân → hành động → trạng thái → quan sát), bà chia các hệ thống tự xưng là mô hình thế giới thành ba loại chức năng: 1. **Bộ kết xuất (Renderer)**: Đầu ra là quan sát (pixel), tập trung vào độ trung thực thị giác. Ví dụ: các mô hình tạo video như Sora. Hạn chế: hình ảnh đẹp nhưng có thể không đúng vật lý. 2. **Bộ mô phỏng (Simulator)**: Đầu ra là trạng thái thế giới (mô hình hình học, vật lý, động lực học chính xác). Đây là trung tâm then chốt, có thể phục vụ cả con người (thiết kế, mô phỏng) và máy móc (đào tạo robot, xe tự lái). Ví dụ: NVIDIA Omniverse. 3. **Bộ lập kế hoạch (Planner)**: Đầu ra là hành động. Dựa trên quan sát và mục tiêu, nó quyết định tác nhân nên làm gì tiếp theo. Ví dụ: các mô hình Ngôn ngữ-Thị giác-Hành động (VLA) cho robot. Bài viết nhấn mạnh **bộ mô phỏng là trung tâm bị đánh giá thấp**, vì nó hoạt động ở cấp độ cấu trúc nền tảng (hình học, vật lý), từ đó có thể suy ra đầu ra cho cả bộ kết xuất và bộ lập kế hoạch. Trong khi bộ kết xuất thương mại hóa tốt nhưng có trần vật lý, và bộ lập kế hoạch hứa hẹn nhưng chưa trưởng thành, thì bộ mô phỏng là cầu nối thiết yếu. Xu hướng tương lai là sự hội tụ của ba loại này hướng tới một **mô hình thế giới thống nhất**, có thể chuyển đổi linh hoạt giữa kết xuất, mô phỏng và lập kế hoạch dựa trên cùng một hiểu biết cơ bản về thế giới. Điều...

Tác giả: Lý Phi Phi

Biên dịch: Gia Dương

"Mô hình thế giới" có lẽ là khái niệm nóng nhất và hỗn loạn nhất trong lĩnh vực AI kể từ năm 2025. Khi Sora ra mắt, OpenAI gọi nó là bộ mô phỏng thế giới; Genie cho phép bạn đi lại trong khung cảnh được tạo ra, cũng được gọi là mô hình thế giới; công ty robot nói họ đang làm mô hình thế giới, NVIDIA nói Omniverse là cơ sở hạ tầng cho mô hình thế giới, ngay cả động cơ game cũng bị lôi vào câu chuyện này. Mọi người đều dùng cùng một từ, nhưng mỗi người lại nói về những thứ hoàn toàn khác nhau.

Hôm nay, Lý Phi Phi đã đăng một bài viết mới trên Substack cá nhân, làm sáng tỏ khái niệm này. Cô ấy bắt đầu bằng việc quay lại với biểu đồ kinh điển nhất trong sách giáo khoa về học tăng cường (POMDP vòng khép kín: tác nhân → hành động → trạng thái → quan sát → tác nhân), sau đó chỉ ra: những thứ hiện được gọi là "mô hình thế giới", thực chất là ba hình chiếu khác nhau của vòng khép kín này. Thứ xuất ra pixel (quan sát) là trình kết xuất, xuất ra trạng thái là trình mô phỏng, xuất ra hành động là trình lập kế hoạch. Tiêu chuẩn phân loại rất đơn giản, chỉ xem bạn xuất ra phần nào trong vòng khép kín.

(Nguồn: MIT Technology Review)

Cô ấy đánh giá, trong ba loại, trình kết xuất thương mại hóa chín muồi nhất nhưng có giới hạn (đẹp mắt không đồng nghĩa với đúng đắn về vật lý), trình lập kế hoạch thú vị nhất nhưng cũng xa rời triển khai thực tế nhất (khoảng cách giữa demo phòng thí nghiệm và khả năng sử dụng thực tế vẫn rất lớn), còn trình mô phỏng là trung tâm then chốt bị đánh giá thấp nghiêm trọng. Bởi vì trình mô phỏng hoạt động ở cấp độ hình học, vật lý và động lực học, vừa có thể chiếu lên thành pixel cho con người tiêu thụ, cũng có thể suy luận ra hậu quả hành động cho robot sử dụng. Nắm được mô phỏng, đồng thời đã có nền tảng cho kết xuất và lập kế hoạch; ngược lại thì không.

Bài viết này tất nhiên cũng là tuyên ngôn sản phẩm của World Labs. Marble của họ đã đồng thời xuất ra Gaussian splatting và lưới va chạm, cố gắng thống nhất trình kết xuất và trình mô phỏng vào một mô hình duy nhất. Phần cuối bài viết phác họa viễn cảnh cuối cùng là một mô hình nền tảng thế giới thống nhất, có thể tự do chuyển đổi giữa kết xuất, mô phỏng và lập kế hoạch dựa trên nhu cầu hạ nguồn. Liệu viễn cảnh này có thành hiện thực hay không là chuyện khác, nhưng với tư cách là một khung phân tích, cách phân ba loại trình kết xuất/mô phỏng/lập kế hoạch có lẽ thực sự giúp xuyên thấu một phần nhiễu loạn trong khái niệm "mô hình thế giới" hiện tại.

Toàn văn dịch ra như sau.

"Thế giới là tổng hợp của tất cả những gì đang xảy ra." — Wittgenstein, Tractatus Logico-Philosophicus, 1921

Thế giới không được cấu thành từ chữ viết.

Trong một bài viết trước đó, chúng tôi đề xuất rằng trí tuệ không gian là biên giới tiếp theo của AI, và mô hình thế giới là con đường dẫn tới nó. Ở đây, nhóm World Labs và tôi muốn đi sâu hơn một tầng: trong số nhiều thứ hiện được gán cho cái tên "mô hình thế giới", những mô-đun chức năng nào thực sự cấu thành năng lực này? Công dụng của chúng lần lượt là gì?

Mô hình ngôn ngữ trao cho máy móc sự kiểm soát mạnh mẽ đối với khái niệm, từ vựng và suy luận, nhưng thế giới vật lý, dù ảo hay thực, vận hành trên một nền tảng hoàn toàn khác. Mô hình ngôn ngữ học cấu trúc thống kê của văn bản, mô hình thế giới học cấu trúc thống kê của không gian và thời gian: ánh sáng rơi trên một bề mặt như thế nào, một khu vườn trông ra sao từ một góc chưa từng được máy ảnh chụp lại, vật thể phản ứng với lực và tuân theo định luật vật lý ra sao.

Điều này khiến "mô hình thế giới" trở thành thuật ngữ quan trọng nhất và cũng bị lạm dụng nhiều nhất trong lĩnh vực AI hiện nay. Thị giác máy tính, robot học, học tăng cường và AI tạo sinh đều tuyên bố mình đang xây dựng mô hình thế giới, nhưng mỗi bên lại chỉ những thứ hoàn toàn khác biệt. Một mô hình video có thể tạo ra ngọn lửa tráng lệ nhưng vật lý không thể xảy ra, một mô hình ngôn ngữ ngẫu hứng tạo ra trò chơi có thể chơi được, một động cơ vật lý mô phỏng trung thực quá trình đốt cháy, tất cả đều được gọi bằng cùng một cái tên.

Người Hy Lạp cổ đại không bao giờ có thể thống nhất thế giới được cấu thành từ gì, dù là lửa, nước hay nguyên tử không thể phân chia, bởi vì "thế giới" không bao giờ là một thứ duy nhất. Nó luôn là từ thay thế mà một nhà tư tưởng sử dụng để suy luận về một tổng thể nào đó. AI thừa hưởng vấn đề tương tự, và nó xảy ra đúng lúc lĩnh vực này cần sự chính xác nhất.

Vòng khép kín đằng sau phân loại học

Để làm sáng tỏ sự hỗn loạn này, có thể bắt đầu từ một biểu đồ còn cổ xưa hơn tất cả các công nghệ trên. Tất cả sách giáo khoa về học tăng cường, bao gồm Sutton và Barto kinh điển, hàng chục năm qua vẫn sử dụng các biến thể của cùng một biểu đồ để mô tả cách tác nhân tương tác với thế giới. Tên chính thức của biểu đồ này là Quá trình quyết định Markov có thể quan sát một phần (POMDP), và định nghĩa ban đầu của thuật ngữ "mô hình thế giới" thuộc về truyền thống này.

Một tác nhân (có thể là người, robot hoặc hệ thống phần mềm) thực hiện hành động. Những hành động này thay đổi trạng thái của thế giới. Nhưng tác nhân không bao giờ có thể trực tiếp nhìn thấy trạng thái đó, những gì nó nhận được là quan sát: photon rơi trên võng mạc, số đọc cảm biến, pixel trong khung hình video. Quan sát mới dẫn dắt hành động mới, lặp đi lặp lại.

Từ "trạng thái" cần được tách ra để xem xét, bởi vì trong các lĩnh vực khác nhau ý nghĩa của nó có sự dịch chuyển. Ở đây không nói về trạng thái của nhà hóa học, không phải sự khác biệt giữa rắn, lỏng và khí. Đây là trạng thái của nhà vật lý và nhà robot học: mô tả đầy đủ mọi thứ đang xảy ra trên thế giới tại một thời điểm nhất định, bao gồm mọi vật thể, mọi vị trí, mọi vận tốc, mọi thuộc tính. Trạng thái là hiện thực cơ bản của thế giới, về nguyên tắc là hoàn chỉnh, nhưng đối với bất kỳ tác nhân nào trong đó thì không thể quan sát trực tiếp. Quan sát là góc nhìn cục bộ của tác nhân đối với hiện thực này. Hành động là phản hồi của tác nhân dựa trên đó.

Vòng khép kín này (tác nhân → hành động → trạng thái → quan sát → tác nhân) chính là cấu trúc mang lại ý nghĩa kỹ thuật cho thuật ngữ "mô hình thế giới". Cụm từ này bản thân còn cổ xưa hơn, có thể truy ngược về đề xuất của Kenneth Craik năm 1943, ông cho rằng tâm trí suy luận bằng cách chạy các "mô hình thu nhỏ" của hiện thực, và đến cuối những năm 1980, đầu những năm 1990, khái niệm này được đưa vào lĩnh vực mạng nơ-ron. Vòng khép kín này cũng giải thích ý nghĩa khi mọi người sử dụng thuật ngữ này ngày nay. Những thứ hiện được gọi là mô hình thế giới, thực chất là các hình chiếu khác nhau của cùng một vòng khép kín, mỗi loại xuất ra các thành phần khác nhau trong vòng khép kín.

Ba chức năng của mô hình thế giới

Loại mô hình thế giới đầu tiên là **trình kết xuất**. Trình kết xuất xuất ra quan sát, cụ thể là pixel hướng tới mắt người, và chỉ số chất lượng quan trọng nhất là độ trung thực thị giác. Một mô hình video chuyển đổi lời nhắc văn bản thành cảnh quay từ trên không đạt cấp độ điện ảnh chính là trình kết xuất; các hệ thống tương tác như Genie 3 của Google hoặc RTFM của chính World Labs cũng là trình kết xuất, chúng tạo ra hình ảnh theo thời gian thực dựa trên đầu vào người dùng. Loại mô hình này không có hiểu biết rõ ràng về cấu trúc ba chiều. Nó tạo ra những hình ảnh người xem sẽ thấy, chứ không phải cách thức bản thân sự vật trông như thế nào. Các tòa nhà trong cảnh quay từ trên không có thể hoàn hảo khi nhìn từ trên cao, nhưng hãy thử di chuyển xuyên qua thành phố bên dưới, chúng sẽ sụp đổ.

Loại thứ hai là **trình mô phỏng**. Trình mô phỏng xuất ra trạng thái: một biểu diễn thế giới trung thực về mặt hình học, vật lý hoặc động lực học, nơi cả con người và chương trình máy tính đều có thể tính toán và tương tác trên đó. Hợp đồng của trình kết xuất là thuần túy thị giác, còn hợp đồng của trình mô phỏng là cấu trúc, nó yêu cầu hình học phải đứng vững trước kiểm tra, vật lý tuân theo định luật Newton, hành vi động lực học đáp ứng kỳ vọng của các định luật vật lý. Trình mô phỏng đồng thời phục vụ hai loại người dùng. Các chuyên gia như kiến trúc sư, nhà thiết kế, nhà làm phim, nhà phát triển trò chơi cần độ chính xác vượt xa sự tin cậy thị giác. Các chương trình máy tính như tác nhân học tăng cường, bộ điều khiển robot, phương tiện tự lái thì coi trình mô phỏng như một bãi tập, tương tác với thế giới ở quy mô lớn, thử nghiệm những kịch bản hoặc nguy hiểm, hoặc đắt đỏ, hoặc đơn giản là không thể thực hiện trong thực tế.

Loại thứ ba là **trình lập kế hoạch**. Trình lập kế hoạch xuất ra hành động. Cho trước một quan sát và một mục tiêu, câu hỏi trình lập kế hoạch trả lời là: tác nhân nên làm gì tiếp theo. Theo nhiều ý nghĩa, trình lập kế hoạch là quá trình ngược lại của trình kết xuất. Trình kết xuất lấy hành động làm đầu vào, tạo ra quan sát, trình lập kế hoạch lấy quan sát làm đầu vào, tạo ra hành động, từ đó khép lại vòng lặp nhận thức - hành động. Mô hình Thị giác - Ngôn ngữ - Hành động (VLA), hệ thống dựa trên mô hình, và làn sóng mới của các mô hình Hành động Thế giới (World Action Models), đều là những nỗ lực khác nhau của trình lập kế hoạch: cho phép hệ thống quyết định robot nên làm gì trong một thế giới phi cấu trúc.

Ba loại trên bao phủ phần lớn công việc hiện đang được triển khai trên thực tế, và sự phân biệt giữa chúng rất hữu ích trong thực hành. Nhưng ba loại này không cơ bản tách biệt nhau. Chúng chia sẻ cùng một tập hợp kiến thức cơ bản về cách thế giới vận hành: hình học, vật lý, động lực học. Một mô hình có thể kết xuất một chiếc cốc từ bất kỳ góc độ nào, về nguyên tắc cũng nên có thể mô phỏng điều gì sẽ xảy ra khi chiếc cốc bị đẩy, và lập kế hoạch cho một bàn tay nhấc nó lên. Ngày càng nhiều nghiên cứu thú vị nhất đang cố ý làm mờ ranh giới giữa ba thứ này.

Hình 丨 Ba loại mô hình thế giới (Nguồn: Substack)

Tại sao mô phỏng là trung tâm then chốt

Trong ba loại, trình mô phỏng nhận được ít sự chú ý của công chúng nhất, nhưng lại là quan trọng nhất trong ba loại. Bài viết này muốn sửa chữa sự bất đối xứng đó.

Trình kết xuất hiện là loại thương mại hóa cao nhất. Một lượng lớn sản phẩm chuyển đổi hình ảnh hoặc văn bản thành video đang mở rộng nhanh chóng trên thị trường tiêu dùng và doanh nghiệp. Mô hình Nano Banana của Google đã đưa khả năng tạo hình ảnh cấp độ trình kết xuất đến với có thể hàng trăm triệu người dùng. Công nghệ là thực, thị trường cũng thực. Tuy nhiên, mục tiêu tối ưu hóa của trình kết xuất là độ tin cậy thị giác chứ không phải độ chính xác vật lý, giới hạn này rất quan trọng. Đầu ra của chúng rất đẹp, nhưng bạn không thể dùng chúng để thiết kế một tòa nhà hoặc huấn luyện một robot.

Trình lập kế hoạch là thú vị nhất và cũng non trẻ nhất, nó liên quan chặt chẽ đến lĩnh vực học robot đang phát triển nhanh chóng. Hai năm qua, lĩnh vực này đã sản xuất ra không ít bản demo robot trông ấn tượng trong video, nhưng chúng ta cần thành thật đối mặt với việc những bản demo này thực sự cho thấy điều gì. Hầu như tất cả các demo đều bị giới hạn trong môi trường phòng thí nghiệm bị hạn chế cao, loại vật thể hạn chế, thời lượng nhiệm vụ ngắn. Không có bản demo nào đã trải qua sự kiểm chứng về độ phức tạp, đa dạng và thời lượng liên tục mà việc triển khai thực tế yêu cầu. Khoảng cách giữa một video demo tuyệt vời và một robot có thể làm việc đáng tin cậy trong nhà bếp, nhà kho hay phòng phẫu thuật vẫn rất lớn.

Tuy nhiên, quy mô đặt cược thương mại vẫn đáng kể. Một làn sóng những người mới tham gia được tài trợ tốt đang tranh nhau ra mắt hệ thống lập kế hoạch tổng quát, trong khi các ông lớn về cơ sở hạ tầng thì đang đặt khả năng lập kế hoạch lên trên các ngăn xếp mô phỏng rộng hơn.

Mô phỏng là cầu nối giữa hai loại. Nếu ngôn ngữ là sự trừu tượng hóa của thế giới, pixel là hình chiếu của thế giới, thì hình học, vật lý và động lực học chính là bản thân thế giới. Trình mô phỏng phải hoạt động ở cấp độ này: nó là bộ xương cấu trúc, từ đó biểu hiện thị giác (cho trình kết xuất sử dụng) và hậu quả hành động (cho trình lập kế hoạch sử dụng) đều có thể được suy ra.

Một mô hình nắm được mô phỏng, có thể chiếu sự hiểu biết của nó thành pixel cho con người tiêu thụ, cũng có thể chiếu thành dự đoán hành động cho tác nhân hiện thân sử dụng. Còn một mô hình chỉ nắm được kết xuất hoặc chỉ nắm được lập kế hoạch, thì không làm được cả hai. Không gian thương mại ở đây cực kỳ rộng lớn. Chỉ riêng Omniverse của NVIDIA, quy mô thị trường mục tiêu của nó được công ty ước tính vượt quá nghìn tỷ đô la, bao phủ nhà máy, nhà kho, chuỗi cung ứng và bản sao kỹ thuật số. Huấn luyện robot, kiểm tra xe tự lái, hình ảnh hóa kiến trúc, thiết kế kỹ thuật, khám phá dược phẩm, tất cả đều phụ thuộc vào một dạng mô phỏng nào đó.

Những vấn đề mở khó khăn nhất của lĩnh vực này cũng tập trung ở đây. Dữ liệu ba chiều với chú thích hình học rõ ràng, thuộc tính vật liệu và vật lý, khan hiếm hơn vài bậc độ lớn so với video internet được dùng để huấn luyện trình kết xuất. Khoảng cách sim-to-real (sự khác biệt giữa hành vi vật thể trong mô phỏng và hành vi trong thế giới thực) vẫn tồn tại. Trình mô phỏng tạo sinh trên cơ sở đó còn giới thiệu thêm rủi ro mới: hình học được AI tạo ra có thể trông đúng, nhưng thực tế chứa các vấn đề tự giao nhau hoặc tỷ lệ sai, dẫn đến kết quả mô phỏng vật lý vô lý. Chi phí tính toán cho mô phỏng đa vật lý quy mô lớn (vật thể rắn, vật thể biến dạng, chất lỏng, vải cùng tương tác đồng thời) vẫn cao hơn vài bậc độ lớn so với mô phỏng lĩnh vực đơn lẻ.

Tại World Labs, Marble là bước đầu tiên của chúng tôi theo hướng này. Nó nhận đầu vào đa phương thức (văn bản, hình ảnh, video hoặc phác thảo không gian), tạo ra môi trường 3D có thể khám phá, đồng thời xuất ra Gaussian splatting cho khám phá thị giác và lưới va chạm cho động cơ vật lý vận hành. Nhưng Marble chỉ là chương đầu tiên của một cung dài. Khi ranh giới giữa kết xuất, mô phỏng và lập kế hoạch bắt đầu tan biến, toàn bộ lĩnh vực đang viết nên câu chuyện này.

Ranh giới đang tan biến, và điều gì sẽ xảy ra tiếp theo

Xu hướng quan trọng nhất của lĩnh vực hiện tại là ba loại đang bắt đầu hợp nhất. Sự đồng thuận đằng sau là: kiến thức cần thiết để kết xuất một thế giới, mô phỏng nó, hành động trong đó, phần lớn là giống nhau. Sử dụng lại ví dụ trước, một mô hình thực sự hiểu cách một chiếc cốc đặt trên bàn (hình dạng hình học, thuộc tính vật liệu, phản ứng với lực, v.v.), lẽ ra phải có thể kết xuất chiếc cốc đó từ bất kỳ góc độ nào, mô phỏng điều gì sẽ xảy ra khi chiếc cốc bị đẩy, và lập kế hoạch cho một bàn tay nhấc nó lên. Ba loại là ba hình chiếu của cùng một hiểu biết cơ bản.

Ví dụ, gần đây đã có một lượng nhỏ nhưng đang tăng lên các công việc từ các phòng thí nghiệm robot khác nhau, chúng cho thấy một khả năng ít nhất về mặt khái niệm là đúng: một trình kết xuất video được huấn luyện trước có thể đóng vai trò là mạng xương sống cho dự đoán thế giới kết hợp và dự đoán hành động, cho phép một mô hình duy nhất đồng thời tưởng tượng "điều gì sẽ xảy ra" và "nên làm gì", từ đó bắc cầu giữa trình kết xuất và trình lập kế hoạch. Marble của World Labs đã có thể từ một mô hình duy nhất đồng thời xuất ra Gaussian splatting và lưới va chạm, xóa nhòa ranh giới giữa trình kết xuất và trình mô phỏng. Mỗi cấp độ đang chuyển từ đầu ra thụ động sang hệ thống tương tác: trình kết xuất trở nên có thể phản hồi điều kiện hành động, thế giới do trình mô phỏng tạo ra trở nên kiểm soát và chỉnh sửa được nhiều hơn, trình lập kế hoạch bắt đầu suy luận thận trọng hơn là chỉ phản ứng.

Điểm kết thúc logic là một mô hình thế giới thống nhất: một mô hình nền tảng, có thể kết xuất khung nhìn chân thực như ảnh chụp, tạo ra cấu trúc chính xác về mặt vật lý, lập kế hoạch chuỗi hành động, và chuyển đổi giữa các phương thức đầu ra khác nhau dựa trên nhu cầu của người dùng hạ nguồn. Chúng ta vẫn sẽ đối mặt với một loạt thách thức nghiêm trọng. Cảnh quan dữ liệu cực kỳ không cân bằng, trình kết xuất sở hữu lượng lớn video internet, trong khi trình mô phỏng và trình lập kế hoạch phải đối mặt với sự khan hiếm nghiêm trọng của dữ liệu tài sản 3D và dữ liệu trình diễn robot. Tối ưu hóa cho vẻ đẹp thị giác có thể hy sinh độ chính xác mà robot hoặc mô phỏng độ trung thực cao cần. Hòa giải những căng thẳng này trong kiến trúc đơn nhất, là vấn đề mở cốt lõi của nghiên cứu mô hình thế giới ngày nay, cũng là điều World Labs cam kết giải quyết trong quá trình phát triển liên tục Marble.

(Nguồn: Substack)

Nhưng hướng đi lớn đã rõ ràng. Từ cuối những năm 1980 đến nay, lĩnh vực này luôn đặt cược vào cùng một ván cược: miễn là mô hình thế giới đủ phong phú, mọi thứ tác nhân cần để nhìn thấy thế giới, xây dựng thế giới, hành động trong đó đều nằm trong đó. Ván cược này hiện đang thúc đẩy nghiên cứu của cả một thế hệ. Và điều thực sự thêm sức nặng cho nó, là sự hợp nhất đã và đang diễn ra: ba đường thẳng kết xuất, mô phỏng, lập kế hoạch, mỗi đường đã tự đứng vững thành một ngành công nghiệp trị giá hàng chục tỷ đô la, ban đầu chúng là các hướng nghiên cứu độc lập, giờ bắt đầu hợp lại với nhau. Khi ranh giới biến mất, sự hợp lưu của ba thứ sẽ định nghĩa lại một điều lớn hơn: mối quan hệ giữa trí tuệ máy móc và thế giới vật lý mà nó cư trú, tức là hướng đi dài hạn của trí tuệ không gian.

Ngôn ngữ cho máy móc một cách nói về thế giới này. Mô hình thế giới, là con đường cuối cùng để máy móc hiểu, tưởng tượng, suy luận và tương tác với nó.

Tài liệu tham khảo:1.https://drfeifei.substack.com/p/a-functional-taxonomy-of-world-models

Tiền kỹ thuật số thịnh hành

CitreaCTR

wrapped stUSDTWSTUSDT

Velodrome FinanceVELODROME

BrevisBREV

ZRX（0X）ZRX

PancakeSwapCAKE

Câu hỏi Liên quan

QTheo bài viết của Lý Phi Phi, tại sao thuật ngữ 'mô hình thế giới' (world model) hiện nay lại gây nhầm lẫn trong lĩnh vực AI?

AThuật ngữ 'mô hình thế giới' hiện đang bị sử dụng một cách hỗn loạn vì nhiều lĩnh vực như thị giác máy tính, robot học, học tăng cường và AI sinh thành (generative AI) đều sử dụng nó, nhưng để chỉ những thứ hoàn toàn khác nhau. Ví dụ, một mô hình video tạo ra cảnh đẹp nhưng phi vật lý, một mô hình ngôn ngữ tạo ra trò chơi, hay một động cơ vật lý mô phỏng chính xác quá trình đốt cháy, tất cả đều có thể được gọi chung là 'mô hình thế giới' dù chức năng và mục đích khác biệt.

QLý Phi Phi phân loại các 'mô hình thế giới' hiện tại thành ba loại chức năng chính nào? Hãy nêu tên và định nghĩa ngắn gọn của từng loại.

ABài viết phân loại ba loại mô hình thế giới dựa trên đầu ra của chúng trong vòng lặp POMDP (Agent → Hành động → Trạng thái → Quan sát → Agent): 1. **Renderer (Bộ kết xuất)**: Đầu ra là 'quan sát' (observation), cụ thể là pixel cho mắt người. Chất lượng chính là độ trung thực hình ảnh. Ví dụ: các mô hình tạo video từ văn bản. 2. **Simulator (Bộ mô phỏng)**: Đầu ra là 'trạng thái' (state) - một biểu diễn thế giới trung thực về mặt hình học, vật lý, động lực học. Nó phục vụ cả con người (thiết kế) và chương trình máy tính (huấn luyện robot). 3. **Planner (Bộ hoạch định)**: Đầu ra là 'hành động' (action). Dựa trên một quan sát và mục tiêu, nó quyết định tác nhân nên làm gì tiếp theo để đạt mục tiêu. Ví dụ: mô hình VLA (Vision-Language-Action).

QTại sao bài viết lại cho rằng Simulator (Bộ mô phỏng) là trung tâm then chốt bị đánh giá thấp trong ba loại mô hình?

ABài viết cho rằng Simulator là trung tâm then chốt vì nó hoạt động ở cấp độ cấu trúc nền tảng (hình học, vật lý, động lực học) - vốn là 'bản thân thế giới'. Từ một mô hình mô phỏng tốt, có thể suy ra cả hình ảnh cho renderer lẫn hậu quả của hành động cho planner. Ngược lại, một renderer chỉ tạo hình ảnh đẹp không thể dùng để thiết kế hay huấn luyện robot, và một planner non trẻ cần môi trường mô phỏng để luyện tập trước khi ra thế giới thực. Hơn nữa, thị trường cho mô phỏng (như NVIDIA Omniverse) được ước tính rất lớn, phục vụ nhiều ngành công nghiệp.

QXu hướng quan trọng nhất mà bài viết chỉ ra trong lĩnh vực mô hình thế giới hiện nay là gì? Được minh họa bằng ví dụ nào?

AXu hướng quan trọng nhất là ba loại mô hình (Renderer, Simulator, Planner) đang bắt đầu hội tụ và xóa nhòa ranh giới. Nhận thức chung là kiến thức cần thiết để kết xuất, mô phỏng và hành động trong một thế giới về cơ bản là giống nhau. Ví dụ, một mô hình thực sự hiểu chiếc cốc (hình học, vật chất, phản ứng với lực) thì về nguyên tắc có thể: kết xuất cốc từ mọi góc (Renderer), mô phỏng điều gì xảy ra khi đẩy cốc (Simulator), và lên kế hoạch cho một bàn tay nhặt cốc lên (Planner).

QSản phẩm Marble của World Labs được mô tả là đang thử nghiệm điều gì trong bức tranh tổng thể về mô hình thế giới?

AMarble của World Labs là bước đầu tiên nhằm dung hợp ranh giới giữa Renderer và Simulator. Nó nhận đầu vào đa phương thức (văn bản, hình ảnh, video) và tạo ra môi trường 3D có thể khám phá, đồng thời xuất ra cả hai thứ: 'Gaussian splats' cho khám phá hình ảnh chất lượng cao (thuộc về Renderer) và 'collision mesh' cho các công cụ vật lý thao tác (thuộc về Simulator). Điều này cho thấy hướng đi hướng tới một mô hình thế giới thống nhất có thể chuyển đổi đầu ra linh hoạt.

Nội dung Liên quan

Tại sao 14,336 giao dịch ETH của hacker UXLINK đặt ra câu hỏi mới cho DeFi

Hoạt động gần đây trên blockchain cho thấy kẻ khai thác lỗ hổng UXLINK đang tích cực rửa số tiền đánh cắp để gây khó khăn cho việc truy vết. Vụ việc xảy ra vào tháng 9/2025, khi hacker lợi dụng lỗ hổng 'delegateCall' để chiếm quyền ví đa chữ ký của dự án, tạo ra hàng tỷ token UXLINK bất hợp pháp và rút khoảng 4,5 triệu USD tài sản tiền mã hóa. Sau đó, kẻ tấn công đã chuyển đổi phần lớn số tiền sang DAI và ETH. Đáng chú ý, trong hai tuần qua, họ đã gửi tổng cộng 14.336,6 ETH vào Tornado Cash – một dịch vụ trộn tiền – để che giấu nguồn gốc, với lần gửi gần đây nhất trị giá hơn 8,1 triệu USD. Song song đó, một ví liên quan đến Mining Express – một dự án được cho là mô hình Ponzi đã sụp đổ – cũng bắt đầu tái phân bổ tài sản bằng cách chuyển đổi 5.004 ETH lấy 8,8 triệu DAI và sau đó chuyển một phần vào Tornado Cash. Các sự việc này làm nổi bật một khoảng trống lớn trong hệ sinh thái DeFi: mặc dù cho phép chuyển tài sản không cần cấp phép một cách trơn tru, nhưng vẫn thiếu các cơ chế hiệu quả để ngăn chặn hoặc xử lý các dòng tiền bất hợp pháp một khi chúng đã được đưa vào hệ thống. Điều này đặt ra yêu cầu cấp thiết về việc tăng cường phối hợp liên mạng và triển khai các hệ thống phát hiện đe dọa thời gian thực để bảo vệ tính phi tập trung và quyền riêng tư của người dùng.

ambcrypto1 giờ trước

Tại sao 14,336 giao dịch ETH của hacker UXLINK đặt ra câu hỏi mới cho DeFi

ambcrypto1 giờ trước

Bài viết mới nhất của Lý Phi Phi: Khi video tạo sinh, robot và NVIDIA đều tự xưng là mô hình thế giới, chúng ta cần một phân loại học

Trong bài viết mới nhất của mình, giáo sư Lý Phi Phi đã phân loại và làm rõ khái niệm "mô hình thế giới" đang bị sử dụng một cách lộn xộn trong lĩnh vực AI hiện nay. Bà đề xuất một cách phân loại chức năng dựa trên vòng lặp POMDP cổ điển (tác nhân → hành động → trạng thái → quan sát → tác nhân), chia các hệ thống được gọi là "mô hình thế giới" thành ba loại chính: 1. **Bộ kết xuất (Renderer):** Đầu ra là các quan sát (pixel). Mục tiêu là độ trung thực về mặt thị giác. Ví dụ: các mô hình tạo video từ văn bản như Sora, hay hệ thống tương tác như Genie. Chúng tạo ra hình ảnh đẹp nhưng không nhất thiết tuân thủ vật lý chính xác. 2. **Bộ mô phỏng (Simulator):** Đầu ra là trạng thái thế giới. Mục tiêu là độ chính xác về cấu trúc hình học, vật lý và động lực học. Chúng phục vụ cả con người (kiến trúc sư, nhà thiết kế) và các chương trình máy tính (robot, xe tự hành) để tính toán và đào tạo. Đây được coi là trung tâm then chốt bị đánh giá thấp. 3. **Bộ lập kế hoạch (Planner):** Đầu ra là các hành động. Cho một quan sát và mục tiêu, nó quyết định tác nhân nên làm gì tiếp theo. Ví dụ: các mô hình VLA (Vision-Language-Action). Đây là lĩnh vực thú vị nhất nhưng cũng non trẻ nhất, với khoảng cách lớn giữa demo trong phòng thí nghiệm và ứng dụng thực tế. Bài viết nhấn mạnh ba loại này không tách biệt mà chia sẻ hiểu biết cơ bản chung về thế giới. Xu hướng quan trọng hiện nay là sự hợp nhất giữa chúng, hướng tới một **mô hình thế giới thống nhất** có thể chuyển đổi linh hoạt giữa kết xuất, mô phỏng và lập kế hoạch tùy theo nhu cầu. Sản phẩm Marble của World Labs là một bước đi theo hướng này, cùng lúc tạo ra cả dữ liệu hình ảnh (Gaussian splatting) và dữ liệu vật lý (collision mesh) từ một mô hình duy nhất. Tóm lại, trong khi mô hình ngôn ngữ cho phép máy móc "nói" về thế giới, thì mô hình thế giới chính là con đường để chúng thực sự hiểu, tưởng tượng, suy luận và tương tác với thế giới vật lý.

marsbit2 giờ trước

Bài viết mới nhất của Lý Phi Phi: Khi video tạo sinh, robot và NVIDIA đều tự xưng là mô hình thế giới, chúng ta cần một phân loại học

marsbit2 giờ trước

Đặc trưng của Forbes: Thanh toán xuyên biên giới bằng stablecoin nhanh hơn, nhưng vẫn chưa rẻ hơn

Tiêu điểm của Forbes: Thanh toán xuyên biên giới bằng stablecoin đã nhanh hơn, nhưng chưa rẻ hơn Ngành thanh toán xuyên biên giới bằng stablecoin đang tăng trưởng mạnh, với công nghệ sẵn sàng, môi trường pháp lý được cải thiện và khối lượng giao dịch tăng. Tuy nhiên, lời hứa về chi phí thấp hơn đáng kể so với các phương thức truyền thống (60-70 điểm cơ bản) vẫn chưa thành hiện thực, hiện ở mức 2-5 điểm cơ bản. Nguyên nhân chính là thiếu các nhóm thanh khoản sâu và quy mô lớn. Rào cản lớn nhất không phải là công nghệ mà là vấn đề tin cậy. Các doanh nghiệp thường gắn bó với đối tác ngoại hối truyền thống đã có mối quan hệ lâu dài và đáng tin cậy. Sự thay đổi chỉ diễn ra khi chênh lệch chi phí trở nên quá lớn hoặc một thế hệ doanh nhân mới xuất hiện. Các công ty thành công trong lĩnh vực này, như Caliza, không tìm cách thay thế hệ thống cũ (ví dụ: SWIFT) mà bổ sung và tích hợp với nó, đảm bảo độ chính xác và tuân thủ trong các khoản thanh toán phức tạp cho nhà cung cấp. Tăng trưởng mạnh mẽ (trên 40% hàng tháng) được thúc đẩy nhờ việc tự xây dựng giấy phép, quan hệ đối tác ngân hàng và kênh chuyển đổi pháp định. Tương lai của ngành sẽ chứng kiến sự sàng lọc tự nhiên. Các công ty tồn tại và phát triển được sẽ là những đơn vị sở hữu ba yếu tố then chốt: giấy phép đầy đủ, kênh tiếp cận pháp định vững chắc và khả năng cung cấp thanh khoản. Thiếu chúng, họ chỉ đơn thuần là những trung gian.

marsbit2 giờ trước

Đặc trưng của Forbes: Thanh toán xuyên biên giới bằng stablecoin nhanh hơn, nhưng vẫn chưa rẻ hơn

marsbit2 giờ trước

Forbes: Thanh toán xuyên biên giới bằng stablecoin đã nhanh hơn, nhưng chưa rẻ hơn

Bài viết của Forbes nhấn mạnh ngành thanh toán xuyên biên giới bằng stablecoin đang tăng trưởng nhanh chóng, với những cải thiện về công nghệ và môi trường quản lý. Tuy nhiên, lời hứa về chi phí thấp hơn vẫn chưa thành hiện thực. Trong khi các nhà môi giới ngoại hối truyền thống thu phí từ 60 đến 70 điểm cơ bản, stablecoin hướng tới mức chỉ 2-5 điểm, nhưng lợi thế này chủ yếu vẫn chỉ là lý thuyết. Nguyên nhân chính là thiếu các nhóm thanh khoản sâu, quy mô lớn. Theo Imran Ahmad của Bitso Business, ưu thế về giá sẽ chỉ xuất hiện khi có dòng thanh khoản thể chế đổ vào. Một rào cản quan trọng khác là vấn đề niềm tin. Các doanh nghiệp thường gắn bó lâu dài với đại lý ngoại hối đáng tin cậy, khiến việc chuyển đổi sang giải pháp mới diễn ra chậm. Các công ty thành công như Caliza không tìm cách thay thế hệ thống cũ (như Swift) mà bổ sung cho nó, kết hợp tính nhanh chóng của stablecoin với độ tin cậy và tiêu chuẩn hóa của cơ sở hạ tầng truyền thống. Chiến lược này giúp họ đạt mức tăng trưởng ấn tượng. Tương lai của ngành được dự báo sẽ chứng kiến sự sàng lọc, nơi các công ty nắm giữ được giấy phép, kênh tiền pháp định và thanh khoản mới có thể tồn tại lâu dài.

链捕手2 giờ trước

Forbes: Thanh toán xuyên biên giới bằng stablecoin đã nhanh hơn, nhưng chưa rẻ hơn

链捕手2 giờ trước

Bitcoin: Đây là lý do tại sao đợt tăng giá Q3 của Bitcoin có thể đối mặt với bài kiểm tra thanh khoản

Dữ liệu on-chain của Bitcoin cho thấy thị trường có thể đang ở giai đoạn cuối của chu kỳ giảm giá, với tỷ lệ Lợi nhuận/Thua lỗ Thực tế (Realized P/L Ratio) xuống mức thấp nhất trong 43 tháng, thường báo hiệu đáy. Áp lực bán dường như đang giảm dần, được củng cố bởi dòng tiền ròng chảy vào các ETF Bitcoin tại Mỹ, cho thấy nhu cầu từ các tổ chức đang quay trở lại. Tuy nhiên, sự phục hồi tiềm ẩn của Bitcoin trong quý III có thể đối mặt với một thách thức lớn: thanh khoản. Bất chấp dòng tiền vào ETF, vốn hóa của các stablecoin chính như USDT và USDC vẫn tiếp tục thu hẹp, với hơn 1 tỷ USD rút khỏi thị trường chỉ trong tuần qua. Điều này cho thấy thiếu vốn mới thực sự chảy vào hệ sinh thái tiền điện tử. Trong khi đó, các nhà giao dịch đang bắt đầu xây dựng lại các vị thế có đòn bẩy. Nếu tình trạng thanh khoản yếu không được cải thiện, có thể sẽ không có đủ nhu cầu giao ngay để hỗ trợ đà tăng, khiến Bitcoin dễ bị tổn thương trước các đợt điều chỉnh mạnh do thanh lý đòn bẩy gây ra. Do đó, đợt tăng giá dự kiến trong quý III có thể gặp khó khăn trong việc duy trì đà tăng.

ambcrypto2 giờ trước

Bitcoin: Đây là lý do tại sao đợt tăng giá Q3 của Bitcoin có thể đối mặt với bài kiểm tra thanh khoản

ambcrypto2 giờ trước

Giao dịch

Giao ngay

Bài viết Nổi bật

HTX Learn: Tìm hiểu Về Conflux để Chia sẻ 8000 USDT

Để giúp bạn nắm bắt bản chất của Conflux, HTX Learn đã ra mắt chiến dịch Tìm hiểu & Kiếm tiền này.

Tổng lượt xem 960Xuất bản vào 2024.12.23Cập nhật vào 2024.12.23

HTX Learn: Tìm hiểu Về Conflux để Chia sẻ 8000 USDT

AGENT S là gì

Agent S: Tương Lai của Tương Tác Tự Động trong Web3 Giới thiệu Trong bối cảnh không ngừng phát triển của Web3 và tiền điện tử, các đổi mới đang liên tục định nghĩa lại cách mà cá nhân tương tác với các nền tảng kỹ thuật số. Một dự án tiên phong như vậy, Agent S, hứa hẹn sẽ cách mạng hóa tương tác giữa con người và máy tính thông qua khung tác nhân mở của nó. Bằng cách mở đường cho các tương tác tự động, Agent S nhằm đơn giản hóa các nhiệm vụ phức tạp, cung cấp các ứng dụng chuyển đổi trong trí tuệ nhân tạo (AI). Cuộc khám phá chi tiết này sẽ đi sâu vào những phức tạp của dự án, các tính năng độc đáo của nó và những tác động đối với lĩnh vực tiền điện tử. Agent S là gì? Agent S đứng vững như một khung tác nhân mở đột phá, được thiết kế đặc biệt để giải quyết ba thách thức cơ bản trong việc tự động hóa các nhiệm vụ máy tính: Thu thập Kiến thức Cụ thể theo Miền: Khung này học một cách thông minh từ nhiều nguồn kiến thức bên ngoài và kinh nghiệm nội bộ. Cách tiếp cận kép này giúp nó xây dựng một kho lưu trữ phong phú về kiến thức cụ thể theo miền, nâng cao hiệu suất của nó trong việc thực hiện nhiệm vụ. Lập Kế Hoạch Qua Các Tầm Nhìn Nhiệm Vụ Dài Hạn: Agent S sử dụng lập kế hoạch phân cấp tăng cường kinh nghiệm, một cách tiếp cận chiến lược giúp phân chia và thực hiện các nhiệm vụ phức tạp một cách hiệu quả. Tính năng này nâng cao đáng kể khả năng quản lý nhiều nhiệm vụ con một cách hiệu quả và hiệu suất. Xử Lý Các Giao Diện Động, Không Đều: Dự án giới thiệu Giao Diện Tác Nhân-Máy Tính (ACI), một giải pháp đổi mới giúp nâng cao tương tác giữa các tác nhân và người dùng. Sử dụng các Mô Hình Ngôn Ngữ Lớn Đa Phương Thức (MLLMs), Agent S có thể điều hướng và thao tác các giao diện người dùng đồ họa đa dạng một cách liền mạch. Thông qua những tính năng tiên phong này, Agent S cung cấp một khung vững chắc giải quyết các phức tạp liên quan đến việc tự động hóa tương tác giữa con người với máy móc, mở ra nhiều ứng dụng trong AI và hơn thế nữa. Ai là Người Tạo ra Agent S? Mặc dù khái niệm về Agent S là hoàn toàn đổi mới, thông tin cụ thể về người sáng lập vẫn còn mơ hồ. Người sáng lập hiện vẫn chưa được biết đến, điều này làm nổi bật giai đoạn sơ khai của dự án hoặc sự lựa chọn chiến lược để giữ kín các thành viên sáng lập. Bất chấp sự ẩn danh, sự chú ý vẫn tập trung vào khả năng và tiềm năng của khung này. Ai là Các Nhà Đầu Tư của Agent S? Vì Agent S còn tương đối mới trong hệ sinh thái mã hóa, thông tin chi tiết về các nhà đầu tư và những người tài trợ tài chính của nó không được ghi chép rõ ràng. Sự thiếu vắng thông tin công khai về các nền tảng đầu tư hoặc tổ chức hỗ trợ dự án dấy lên câu hỏi về cấu trúc tài trợ và lộ trình phát triển của nó. Hiểu biết về sự hỗ trợ là rất quan trọng để đánh giá tính bền vững và tác động tiềm năng của dự án. Agent S Hoạt Động Như Thế Nào? Tại cốt lõi của Agent S là công nghệ tiên tiến cho phép nó hoạt động hiệu quả trong nhiều bối cảnh khác nhau. Mô hình hoạt động của nó được xây dựng xung quanh một số tính năng chính: Tương Tác Giống Như Con Người: Khung này cung cấp lập kế hoạch AI tiên tiến, cố gắng làm cho các tương tác với máy tính trở nên trực quan hơn. Bằng cách bắt chước hành vi của con người trong việc thực hiện nhiệm vụ, nó hứa hẹn nâng cao trải nghiệm người dùng. Ký Ức Tường Thuật: Được sử dụng để tận dụng các trải nghiệm cấp cao, Agent S sử dụng ký ức tường thuật để theo dõi lịch sử nhiệm vụ, từ đó nâng cao quy trình ra quyết định của nó. Ký Ức Tình Huống: Tính năng này cung cấp cho người dùng hướng dẫn từng bước, cho phép khung này cung cấp hỗ trợ theo ngữ cảnh khi các nhiệm vụ diễn ra. Hỗ Trợ OpenACI: Với khả năng chạy cục bộ, Agent S cho phép người dùng duy trì quyền kiểm soát đối với các tương tác và quy trình làm việc của họ, phù hợp với tinh thần phi tập trung của Web3. Tích Hợp Dễ Dàng với Các API Bên Ngoài: Tính linh hoạt và khả năng tương thích với nhiều nền tảng AI khác nhau đảm bảo rằng Agent S có thể hòa nhập liền mạch vào các hệ sinh thái công nghệ hiện có, làm cho nó trở thành lựa chọn hấp dẫn cho các nhà phát triển và tổ chức. Những chức năng này cùng nhau góp phần vào vị trí độc đáo của Agent S trong không gian tiền điện tử, khi nó tự động hóa các nhiệm vụ phức tạp, nhiều bước với sự can thiệp tối thiểu của con người. Khi dự án phát triển, các ứng dụng tiềm năng của nó trong Web3 có thể định nghĩa lại cách mà các tương tác kỹ thuật số diễn ra. Thời Gian Phát Triển của Agent S Sự phát triển và các cột mốc của Agent S có thể được tóm tắt trong một dòng thời gian nêu bật các sự kiện quan trọng của nó: 27 tháng 9, 2024: Khái niệm về Agent S được ra mắt trong một bài nghiên cứu toàn diện mang tên “Một Khung Tác Nhân Mở Sử Dụng Máy Tính Như Một Con Người,” trình bày nền tảng cho dự án. 10 tháng 10, 2024: Bài nghiên cứu được công bố công khai trên arXiv, cung cấp một cái nhìn sâu sắc về khung và đánh giá hiệu suất của nó dựa trên tiêu chuẩn OSWorld. 12 tháng 10, 2024: Một video trình bày được phát hành, cung cấp cái nhìn trực quan về khả năng và tính năng của Agent S, thu hút thêm sự quan tâm từ người dùng và nhà đầu tư tiềm năng. Những dấu mốc trong dòng thời gian không chỉ minh họa sự tiến bộ của Agent S mà còn chỉ ra cam kết của nó đối với sự minh bạch và sự tham gia của cộng đồng. Những Điểm Chính Về Agent S Khi khung Agent S tiếp tục phát triển, một số thuộc tính chính nổi bật, nhấn mạnh tính đổi mới và tiềm năng của nó: Khung Đổi Mới: Được thiết kế để cung cấp cách sử dụng máy tính trực quan giống như tương tác của con người, Agent S mang đến một cách tiếp cận mới cho việc tự động hóa nhiệm vụ. Tương Tác Tự Động: Khả năng tương tác tự động với máy tính thông qua GUI đánh dấu một bước tiến tới các giải pháp tính toán thông minh và hiệu quả hơn. Tự Động Hóa Nhiệm Vụ Phức Tạp: Với phương pháp mạnh mẽ của nó, nó có thể tự động hóa các nhiệm vụ phức tạp, nhiều bước, làm cho các quy trình nhanh hơn và ít sai sót hơn. Cải Tiến Liên Tục: Các cơ chế học tập cho phép Agent S cải thiện từ các trải nghiệm trước đó, liên tục nâng cao hiệu suất và hiệu quả của nó. Tính Linh Hoạt: Khả năng thích ứng của nó trên các môi trường hoạt động khác nhau như OSWorld và WindowsAgentArena đảm bảo rằng nó có thể phục vụ một loạt các ứng dụng rộng rãi. Khi Agent S định vị mình trong bối cảnh Web3 và tiền điện tử, tiềm năng của nó để nâng cao khả năng tương tác và tự động hóa quy trình đánh dấu một bước tiến quan trọng trong công nghệ AI. Thông qua khung đổi mới của mình, Agent S minh họa cho tương lai của các tương tác kỹ thuật số, hứa hẹn một trải nghiệm liền mạch và hiệu quả hơn cho người dùng trên nhiều ngành công nghiệp khác nhau. Kết luận Agent S đại diện cho một bước nhảy vọt táo bạo trong sự kết hợp giữa AI và Web3, với khả năng định nghĩa lại cách chúng ta tương tác với công nghệ. Mặc dù vẫn còn ở giai đoạn đầu, những khả năng cho ứng dụng của nó là rộng lớn và hấp dẫn. Thông qua khung toàn diện của mình giải quyết các thách thức quan trọng, Agent S nhằm đưa các tương tác tự động lên hàng đầu trong trải nghiệm kỹ thuật số. Khi chúng ta tiến sâu hơn vào các lĩnh vực tiền điện tử và phi tập trung, các dự án như Agent S chắc chắn sẽ đóng một vai trò quan trọng trong việc định hình tương lai của công nghệ và sự hợp tác giữa con người với máy tính.

Tổng lượt xem 913Xuất bản vào 2025.01.14Cập nhật vào 2025.01.14

Làm thế nào để Mua S

Chào mừng bạn đến với HTX.com! Chúng tôi đã làm cho mua Sonic (S) trở nên đơn giản và thuận tiện. Làm theo hướng dẫn từng bước của chúng tôi để bắt đầu hành trình tiền kỹ thuật số của bạn.Bước 1: Tạo Tài khoản HTX của BạnSử dụng email hoặc số điện thoại của bạn để đăng ký tài khoản miễn phí trên HTX. Trải nghiệm hành trình đăng ký không rắc rối và mở khóa tất cả tính năng. Nhận Tài khoản của tôiBước 2: Truy cập Mua Crypto và Chọn Phương thức Thanh toán của BạnThẻ Tín dụng/Ghi nợ: Sử dụng Visa hoặc Mastercard của bạn để mua Sonic (S) ngay lập tức.Số dư: Sử dụng tiền từ số dư tài khoản HTX của bạn để giao dịch liền mạch.Bên thứ ba: Chúng tôi đã thêm những phương thức thanh toán phổ biến như Google Pay và Apple Pay để nâng cao sự tiện lợi.P2P: Giao dịch trực tiếp với người dùng khác trên HTX.Thị trường mua bán phi tập trung (OTC): Chúng tôi cung cấp những dịch vụ được thiết kế riêng và tỷ giá hối đoái cạnh tranh cho nhà giao dịch.Bước 3: Lưu trữ Sonic (S) của BạnSau khi mua Sonic (S), lưu trữ trong tài khoản HTX của bạn. Ngoài ra, bạn có thể gửi đi nơi khác qua chuyển khoản blockchain hoặc sử dụng để giao dịch những tiền kỹ thuật số khác.Bước 4: Giao dịch Sonic (S)Giao dịch Sonic (S) dễ dàng trên thị trường giao ngay của HTX. Chỉ cần truy cập vào tài khoản của bạn, chọn cặp giao dịch, thực hiện giao dịch và theo dõi trong thời gian thực. Chúng tôi cung cấp trải nghiệm thân thiện với người dùng cho cả người mới bắt đầu và người giao dịch dày dạn kinh nghiệm.

Tổng lượt xem 1.7kXuất bản vào 2025.01.15Cập nhật vào 2026.06.02

Thảo luận

Chào mừng đến với Cộng đồng HTX. Tại đây, bạn có thể được thông báo về những phát triển nền tảng mới nhất và có quyền truy cập vào thông tin chuyên sâu về thị trường. Ý kiến của người dùng về giá của S (S) được trình bày dưới đây.

Bài viết mới của Lý Phi Phi: Khi tạo video, robot và NVIDIA đều tự xưng là mô hình thế giới, chúng ta cần một phân loại học

Tóm tắt

Vòng khép kín đằng sau phân loại học

Ba chức năng của mô hình thế giới

Tại sao mô phỏng là trung tâm then chốt

Ranh giới đang tan biến, và điều gì sẽ xảy ra tiếp theo

Tiền kỹ thuật số thịnh hành

Câu hỏi Liên quan

Nội dung Liên quan

Tại sao 14,336 giao dịch ETH của hacker UXLINK đặt ra câu hỏi mới cho DeFi

Bài viết mới nhất của Lý Phi Phi: Khi video tạo sinh, robot và NVIDIA đều tự xưng là mô hình thế giới, chúng ta cần một phân loại học

Đặc trưng của Forbes: Thanh toán xuyên biên giới bằng stablecoin nhanh hơn, nhưng vẫn chưa rẻ hơn

Forbes: Thanh toán xuyên biên giới bằng stablecoin đã nhanh hơn, nhưng chưa rẻ hơn

Bitcoin: Đây là lý do tại sao đợt tăng giá Q3 của Bitcoin có thể đối mặt với bài kiểm tra thanh khoản

Giao dịch

Bài viết Nổi bật

HTX Learn: Tìm hiểu Về Conflux để Chia sẻ 8000 USDT

AGENT S là gì

Làm thế nào để Mua S

Thảo luận

Danh mục Phổ biến

Thẻ Nổi bật