Robot đã bắt đầu 'ăn' dữ liệu: Từ nhà máy dữ liệu Ấn Độ đến chuỗi sản xuất ngầm của robot hình người trị giá hàng tỷ USD

marsbitXuất bản vào 2026-06-13Cập nhật gần nhất vào 2026-06-13

Tóm tắt

Ngành công nghiệp robot đang đối mặt với một điểm nghẽn lớn: dữ liệu huấn luyện. Khác với mô hình ngôn ngữ lớn (LLM) có sẵn kho dữ liệu khổng lồ trên internet, robot thể hiện (embodied AI) cần học hỏi từ thế giới vật lý - một "sa mạc dữ liệu". Để lấp đầy khoảng trống này, một chuỗi cung ứng dữ liệu mới đang hình thành nhanh chóng. Trọng tâm là thu thập dữ liệu góc nhìn thứ nhất (Ego Data). Tại các "nhà máy dữ liệu" ở Ấn Độ hay Đông Nam Á, công nhân đeo camera trên đầu hoặc găng tay cảm biến để ghi lại quy trình làm các công việc như sắp xếp quần áo, thu dọn bếp, cầm nắm đồ vật. Những video này, sau khi được xử lý và gắn nhãn, được bán cho các công ty robot như Figure, Tesla để huấn luyện mô hình, giúp robot hiểu được logic không gian và quy tắc tương tác vật lý từ con người. Các loại dữ liệu tạo thành một "kim tự tháp" với giá trị khác nhau. Đáy là dữ liệu internet miễn phí nhưng ít giá trị thực thi. Cao hơn là Ego Data (vài chục USD/giờ), rồi đến dữ liệu với găng tay cảm biến và dữ liệu mô phỏng. Đỉnh kim tự tháp là dữ liệu từ robot thật (teleoperation) - quý giá nhưng đắt đỏ, có thể lên tới hàng trăm hoặc nghìn USD/giờ do chi phí thiết bị và vận hành cao. Thị trường phía sau bao gồm nhiều nhóm: nhà máy dữ liệu chi phí thấp chuyên Ego Data; công ty tập trung vào ánh xạ cử động để dịch hành động người sang robot; nhà cung cấp dịch vụ thu thập dữ liệu từ robot thật; công ty dữ liệu tổng hợp mô phỏng; và các nền tảng hướng tới chuẩn hóa dữ liệu. Các công ty robot có xu hướn...

Tại một nhà máy gia công quần áo ở Ấn Độ, công nhân đang phân loại vải như thường lệ, nhưng lần này khác biệt là trên đầu họ đeo thêm một camera, dùng để quay video góc nhìn thứ nhất khi họ làm việc.


Những video này, sau khi được xử lý, sẽ trở thành tài sản dữ liệu, được bán cho các công ty trí tuệ thể hóa (embodied AI) cần lượng dữ liệu lớn để huấn luyện robot.


Những hoạt động kinh doanh tương tự từ đầu năm nay đang hình thành một chuỗi ngành công nghiệp mới, và sự trỗi dậy của chuỗi này bắt nguồn từ điểm nghẽn lớn nhất mà ngành trí tuệ thể hóa hiện đang gặp phải: dữ liệu.


"Năm nay nhu cầu tăng lên rõ rệt." Một chuyên gia trong ngành thu thập dữ liệu robot chia sẻ với 42 Megahertz, rằng các công ty robot ở Âu Mỹ mà nhóm anh phục vụ đang mua sắm lượng lớn dữ liệu công việc của con người. Hiện tại, nhóm đã có gần một trăm người thu thập tham gia sản xuất dữ liệu huấn luyện robot, mỗi tháng có thể ổn định sản xuất hàng nghìn giờ video dữ liệu góc nhìn thứ nhất của con người.


Người thu thập cần hoàn thành nhiệm vụ theo quy trình tiêu chuẩn, như phân loại quần áo, sắp xếp nhà bếp, cầm nắm đồ vật... Trong quá trình đó, họ đeo camera trên đầu, một số nhiệm vụ còn cần găng tay dữ liệu để ghi lại các cử động tay chi tiết hơn.


"Trước đây, ngành này thảo luận về mô hình, về phần cứng, giờ ngày càng nhiều người bắt đầu hỏi: dữ liệu có thể cung cấp ổn định không?"


Mọi người bắt đầu nhận thức rõ ràng rằng, khả năng của mô hình mãi không thể đột phá, quy mô dữ liệu không đủ chính là vấn đề lớn nhất.


Và trong bối cảnh khoảng trống dữ liệu khổng lồ của mô hình thể hóa, hoạt động kinh doanh mới - thu thập dữ liệu, cũng bắt đầu hình thành nhanh chóng.


Tại sao robot bắt đầu thiếu dữ liệu?


Nếu quay ngược thời gian ba năm trước, robot giống ngành tự động hóa truyền thống hơn.


Đa số robot được cố định trong nhà máy, quy trình làm việc có cấu trúc cao: hàn, vận chuyển, phun sơn, lắp ráp. Chúng không cần hiểu môi trường phức tạp, cũng không cần học khả năng tổng quát hóa, chỉ cần lặp lại động tác trên quỹ đạo đã định.


Nhưng hiện nay, nhiều công ty muốn làm không còn là robot công nghiệp truyền thống. Từ Tesla, Figure đến PI, ngành công nghiệp đang thử nghiệm để robot được huấn luyện như mô hình lớn (large model), và có khả năng tổng quát.


Vì vậy, con đường mà mô hình thể hóa đi cũng ngày càng giống với mô hình ngôn ngữ lớn (LLM), chỉ có điều con đường của mô hình thể hóa còn gian nan hơn LLM, đặc biệt là trong lĩnh vực dữ liệu.


Đối với LLM, bản thân Internet là một mỏ vàng dữ liệu tự nhiên, hàng chục năm tích lũy các trang web, sách, luận văn, kho mã nguồn... tạo thành kho ngữ liệu huấn luyện khổng lồ. Các công ty mô hình thường chỉ cần giải quyết vấn đề lọc và làm sạch dữ liệu, ít khi phải tạo dữ liệu từ con số không.


Nhưng mô hình thể hóa thì khác, nó đối mặt với thế giới vật lý - một vùng hoang mạc dữ liệu. Dữ liệu động tác của robot không tự sinh ra, ngay cả khi Internet có nhiều video con người làm việc, nhưng đối với robot, quy mô dữ liệu như vậy vẫn không đủ, và chất lượng tổng thể cũng không đủ cao.


Nếu nói LLM sinh ra trong thư viện, thì robot giống như sinh ra trong một vùng hoang mạc.


Vì vậy, khi AI đã bước vào giai đoạn cạnh tranh về sức mạnh tính toán và tối ưu hóa suy luận, ngành trí tuệ thể hóa vẫn bị kẹt ở vấn đề cơ bản nhất: dữ liệu đến từ đâu.


Đây cũng là lý do tại sao, ngay cả khi kiến trúc mô hình ngày càng phức tạp, robot vẫn còn rất xa mới thực sự bước vào gia đình và các tình huống phức tạp.


Bởi vì mô hình thiếu kinh nghiệm thực tế đủ nhiều.


Trước đây, người sáng lập Figure - Brett Adcock từng đưa ra một quan điểm rất thẳng thắn: "Nếu búng tay, lượng dữ liệu khổng lồ thực sự cần thiết có thể nhét vào mô hình Helix, chúng tôi sẽ lập tức giải quyết được robot tổng quát."


Nhưng vấn đề là, dữ liệu đến từ đâu?


Một giờ dữ liệu được sản xuất như thế nào?


Tháng 2 năm nay, một kết quả nghiên cứu khiến ngành công nghiệp trở nên phấn khích.


Đội ngũ Nvidia công bố EgoScale, thông qua việc tiền huấn luyện mô hình với hơn 20.000 giờ video góc nhìn thứ nhất của con người có chú thích động tác, sau đó tinh chỉnh với một lượng nhỏ dữ liệu robot, có thể khiến bàn tay khéo léo Sharpa Wave 22 bậc tự do hoàn thành các nhiệm vụ như vặn nắp chai, gấp quần áo.



Quan trọng hơn, nghiên cứu phát hiện rằng, cùng với sự tăng lên của quy mô dữ liệu con người, biểu hiện của mô hình sẽ ổn định tăng lên, sự tăng lên này có thể dự đoán được.


Nghiên cứu này rất quan trọng với ngành thể hóa, bởi vì một đường dữ liệu có thể mở rộng (Scaling) nghĩa là sự tăng trưởng năng lực của robot có cơ hội giống như mô hình lớn, bước vào một vòng lặp tích cực "nhiều dữ liệu hơn, mang lại năng lực mạnh hơn".


Trong thời gian dài trước đây, ngành thể hóa luôn có một sự lo lắng, dù đầu tư nhiều vốn hơn, sự nâng cao năng lực mô hình vẫn rất khó dự đoán. Bởi vì dữ liệu thế giới thực quá ít, chi phí quá cao, rất ít người dám đầu tư khổng lồ vào lĩnh vực dữ liệu.


Nhưng EgoScale ở một mức độ nào đó đã chứng minh một điều, ít nhất là đối với dữ liệu góc nhìn thứ nhất của con người (Ego Data), quy mô thực sự có thể mang lại lợi ích ổn định cho thao tác của bàn tay khéo léo.



Đồng thời, ngày càng nhiều công ty robot bắt đầu đi theo con đường lượng lớn dữ liệu con người + lượng nhỏ dữ liệu bản thân robot.


Video góc nhìn thứ nhất của con người, chịu trách nhiệm cho mô hình biết con người hoàn thành nhiệm vụ như thế nào, dữ liệu robot thì chịu trách nhiệm để mô hình học cơ thể của mình nên làm gì.


Vì vậy, giá trị chính của Ego Data là như một loại tri thức tiên nghiệm dễ mở rộng hơn, để robot hiểu thế giới vật lý trước, sau đó hoàn thành việc thích ứng thông qua một lượng nhỏ dữ liệu thiết bị thực.


Do đó, chuỗi ngành công nghiệp mới xoay quanh Ego Data cũng bắt đầu tăng tốc rõ ràng trong năm nay.


Con người đeo một camera trên đầu hoặc trước ngực, sau đó thực hiện nhiệm vụ cụ thể, như phân loại quần áo, sắp xếp nhà bếp, phân loại bưu kiện... camera sẽ ghi lại video góc nhìn thứ nhất khi con người làm việc.


Ở một mức độ nào đó, bản thân con người chính là robot tổng quát trưởng thành nhất thế giới. Khi vào nhà bếp, con người tự nhiên phán đoán đặt gì trước, gì sau, khi không gian không đủ, sẽ dùng tay kia. Khi chạm vào đồ dễ vỡ, sẽ vô thức điều chỉnh lực.


Đằng sau những động tác tưởng như bản năng này, thực chất ẩn chứa lượng lớn logic hiểu không gian, lập kế hoạch nhiệm vụ và tương tác vật thể.


Mà trước đây, robot hầu như chưa từng nhận được những kinh nghiệm này một cách có hệ thống.



Nhưng Ego Data không phải là quay video tùy tiện, và quay đủ quy mô video cũng không phải là khó khăn lớn nhất, mấu chốt là làm thế nào biến những kinh nghiệm này thành một sản phẩm dữ liệu có thể thực sự được mô hình sử dụng.


Một người trong ngành bắt đầu tăng tốc bố trí dữ liệu Ego trong năm nay cho biết với 42 Megahertz, việc thu thập dữ liệu thực sự thường bắt đầu từ một tài liệu đặc tả nhiệm vụ (specification) do khách hàng gửi đến.


Loại tài liệu này, sẽ không đơn giản viết một câu "thu thập dữ liệu sắp xếp nhà bếp", mà thường có quy định rõ ràng:


Loại nhiệm vụ là gì, hai tay có phải hoàn toàn vào khung hình không, camera cần đặt ở đầu hay ngực, động tác có cho phép gián đoạn không, môi trường cần bao nhiêu loại biến đổi, có cần mẫu thất bại không, định dạng giao hàng cuối cùng có cần tương thích với khung huấn luyện không.


Ví dụ, cùng là sắp xếp nhà bếp, khách hàng có thể yêu cầu: hoàn thành liên tục nhiều bước như mở cửa tủ, tìm hộp chứa, dọn không gian, lấy đặt đồ vật, đóng cửa..., giữa chừng không được bỏ khung hình, cũng không được xuất hiện che khuất nghiêm trọng.


Ở một mức độ nào đó, điều này giống như sản xuất một loại hàng công nghiệp, toàn bộ quá trình tại hiện trường thu thập cũng "công nghiệp hóa" hơn nhiều so với tưởng tượng.


Trong một số trung tâm thu thập số liệu, người thu thập sẽ lần lượt vào khu vực nhà bếp, phòng để đồ, kệ hàng được bố trí sẵn, lặp lại thực hiện nhiệm vụ theo SOP thống nhất.


Có người chịu trách nhiệm phân loại quần áo, có người lặp lại luyện tập cầm nắm đồ vật kích thước khác nhau, cũng có người chuyên thu thập dữ liệu sắp xếp nhà bếp và vận chuyển.


Cùng một động tác, thường cần được hoàn thành lặp lại bởi người có chiều cao khác nhau, tay thuận khác nhau, thói quen thao tác khác nhau, cố gắng khám phá hết các tình huống có thể xuất hiện trong thế giới vật lý, bởi vì cuối cùng robot đối mặt là thế giới thực phức tạp, không phải một đáp án tiêu chuẩn duy nhất.


Cũng là đặt cốc vào tủ, có người dọn không gian trước, có người đổi tay, có người quen mở cửa tủ trước, những khác biệt tinh tế này chính là một phần tạo nên khả năng tổng quát hóa của robot.


Vì vậy, đối với nhiều mô hình thể hóa, điều chúng cần học là logic "con người thường hoàn thành việc này như thế nào".


Loại dữ liệu này so với dữ liệu thiết bị thực, dễ đạt được sản xuất hàng loạt hơn, trước nhu cầu khổng lồ của ngành, chỉ cần quy mô theo kịp, chi phí nhân lực thấp, thì có cơ sở lợi nhuận, và cũng tương đối dễ tạo ra dòng tiền.


Nhưng nếu dữ liệu không đáp ứng yêu cầu của khách hàng thì cần làm lại, thời lượng dữ liệu thực sự được khách hàng nghiệm thu, ít hơn nhiều so với thời lượng quay gốc, thời lượng hiệu quả có thể trực tiếp vào quy trình huấn luyện quan trọng hơn.


Từ đây, ngành công nghiệp dần xuất hiện sự phân tầng ngày càng rõ ràng. Bởi vì dữ liệu khác nhau, giá trị khác biệt rất lớn, từ góc độ tổng hợp như chi phí, giá trị..., đại thể có thể hình thành một "kim tự tháp dữ liệu".


Giá trị khác biệt lớn giữa các loại dữ liệu khác nhau


Trong "kim tự tháp dữ liệu", tầng dưới cùng là dữ liệu Internet, gần như không có chi phí thu thập, đồng thời cũng có quy mô không nhỏ.


Robot có thể học từ đó vật thể trông như thế nào, bố cục đại thể của nhà bếp. Nhưng vấn đề cũng rất rõ ràng, nó chỉ có thể giúp robot "biết", rất khó giúp robot "làm". Chỗ thực sự khó khăn của thế giới thực, là động tác, lực ma sát, trọng lượng, biến đổi chất liệu, hạn chế không gian, rủi ro va chạm, những điều này không thể chỉ học qua video thông thường.


Lên trên một tầng nữa là dữ liệu con người cấp cao hơn, trong đó Ego Data là phần quan trọng nhất, nó có thể từ góc nhìn thứ nhất cho mô hình biết con người thao tác như thế nào, phần dữ liệu video này có thể sử dụng quy mô lớn cho tiền huấn luyện, giống như trong EgoScale đã làm.


Nhưng robot cuối cùng vẫn cần giải quyết vấn đề cơ thể mình nên làm như thế nào. Cũng là vặn nắp chai, tay người hoàn thành dễ dàng, robot có thể thất bại lặp đi lặp lại.


Do đó, dữ liệu cảm nhận do găng tay dữ liệu mang lại ngày càng quan trọng, Ego Data thông thường chỉ có thể cho mô hình biết con người nhìn thấy gì, hoàn thành nhiệm vụ gì. Nhưng robot cuối cùng còn cần biết khi nào nên tăng lực, khi nào cần thả lỏng.


Những động tác tinh tế này, rất khó chỉ suy luận qua video, vì vậy ngày càng nhiều công ty bắt đầu thử nghiệm căn chỉnh dữ liệu hình ảnh với bắt chuyển động tay, ước tính tư thế, quỹ đạo khớp.


Video chịu trách nhiệm cung cấp hiểu không gian, găng tay chịu trách nhiệm cung cấp chi tiết động tác, còn dữ liệu thiết bị thực từ điều khiển từ xa thì giúp robot hiểu cơ thể mình nên thực hiện như thế nào.



Tuy nhiên, hiện tại ngành công nghiệp vẫn tồn tại một vấn đề rất thực tế, tiêu chuẩn găng tay vẫn rất không thống nhất. Tần số lấy mẫu, định nghĩa khớp, độ chính xác và cách biểu đạt động tác của thiết bị khác nhau rất lớn, làm thế nào để ánh xạ ổn định động tác con người lên cơ thể robot khác nhau, vẫn là một điểm nghẽn không nhỏ.


Vì vậy, nếu không đeo găng tay dữ liệu, chỉ dùng camera đội đầu quay, lúc này giá của Ego Data không quá cao, nhưng một khi thêm găng tay dữ liệu, giá sẽ nhanh chóng tăng lên.


Tiếp tục lên trên kim tự tháp là dữ liệu mô phỏng, thông qua môi trường song sinh kỹ thuật số, robot có thể huấn luyện tốc độ cao trong thế giới ảo, trải qua hàng triệu lần lặp lại cầm nắm, định hướng và tránh vật cản. Lượng dữ liệu mất một tháng mới hoàn thành trong thực tế, trong môi trường mô phỏng có thể chỉ cần vài ngày.


Tuy nhiên, mô phỏng rốt cuộc không phải là thế giới thực, dù lượng lớn và chi phí thấp, nhưng các yếu tố ngẫu nhiên như lực ma sát, biến đổi chất liệu, phản quang... trong thực tế rất khó được sao chép hoàn toàn, đây cũng là "Khoảng cách Mô phỏng - Thực tế (Sim-to-Real Gap)" thường được nhắc đến trong ngành, robot học rất tốt trong mô phỏng, nhưng một khi bước vào môi trường thực, năng lực thường bị giảm sút nhiều.


Còn tầng đỉnh của kim tự tháp, là dữ liệu thiết bị thực chất lượng cao nhất, cũng đắt và khan hiếm nhất, chủ yếu dựa vào cách thức như người vận hành điều khiển từ xa..., điều khiển robot hoàn thành nhiệm vụ cụ thể, robot sẽ đồng bộ ghi lại hình ảnh, động tác, tín hiệu điều khiển và trạng thái cảm biến.


Khác với dữ liệu con người, nó tự nhiên nằm trong không gian động tác của robot, mô hình không cần tốn sức hiểu động tác con người ánh xạ lên cơ thể robot như thế nào. Ngoài ra, dữ liệu thiết bị thực cũng bao gồm dữ liệu công việc tự chủ mà nó tạo ra khi ứng dụng, nhưng robot hiện tại phổ biến chưa ứng dụng quy mô lớn, dữ liệu tạo ra cũng khan hiếm tương tự.


Hơn nữa, vấn đề then chốt của dữ liệu thiết bị thực là hiệu suất sản xuất rất thấp, muốn nâng cao quy mô dữ liệu thì cần tăng thêm nhiều robot và người vận hành, đồng thời chi phí hao mòn địa điểm và thiết bị cao, đều sẽ nhanh chóng đẩy giá lên.


Tình hình giá cả do nhiều người trong ngành đưa ra đại khái là, Ego Data đơn giản nhất thường chỉ cần vài chục tệ một giờ, còn dữ liệu bản thân robot liên quan đến điều khiển từ xa, giá thường tăng lên hàng trăm thậm chí hàng nghìn tệ một giờ.


Trong quá trình huấn luyện mô hình robot của các nhà sản xuất khác nhau, các tầng của kim tự tháp dữ liệu phát huy tác dụng cũng khác nhau, do đó toàn ngành cũng xuất hiện các công ty dữ liệu thượng nguồn có trọng điểm khác nhau như mô phỏng, dữ liệu góc nhìn thứ nhất của con người...


Ai đang giao dịch những dữ liệu này?


Khi một ngành công nghiệp quy mô khổng lồ trỗi dậy, người đầu tiên có lợi nhuận thường là "người bán nước" thượng nguồn.


Ngành trí tuệ thể hóa cũng như vậy, trong một hai năm qua, trên phạm vi toàn cầu đã xuất hiện rất nhiều công ty khởi nghiệp robot, nhân tài các ngành đều tập trung vào lĩnh vực này.


Gần như mỗi ngày đều có công ty mới tuyên bố hoàn thành gọi vốn, các công ty định giá trăm tỷ trong nước ngày càng nhiều, một số công ty thậm chí đã đi trên con đường IPO, chuyển ánh mắt ra nước ngoài, Figure sau khi hoàn thành vòng gọi vốn C năm ngoái, định giá đã đạt 39 tỷ USD, đứng đầu trong các công ty robot hình người.


Mọi người đều muốn làm robot hình người tổng quát, và đều cần lượng dữ liệu khổng lồ, đồng thời do vốn không ngừng đổ vào, toàn bộ đường đua vẫn trong tình trạng không thiếu tiền.


Vì vậy, đằng sau những công ty có nhu cầu dữ liệu mạnh mẽ, lại có đủ vốn nghiên cứu phát triển này, "người bán nước" thượng nguồn của ngành robot ngày càng nhiều, do đó dần hình thành chuỗi sản xuất dữ liệu của ngành công nghiệp robot.


Hơn nữa, cùng với sự phát triển của ngành, xoay quanh dữ liệu cần thiết cho huấn luyện robot, những công ty thượng nguồn này cũng bắt đầu hình thành sự phân tầng rõ ràng, từ cấu trúc ngành hiện tại, đại khái có thể chia thành năm loại người chơi.



Loại thứ nhất là nhà máy dữ liệu chi phí thấp, trọng điểm thu thập là Ego Data, ở Ấn Độ, Thái Lan..., đã có ngày càng nhiều nhóm bắt đầu tổ chức lao động chi phí thấp, xây dựng mạng lưới thu thập dữ liệu.


Ví dụ, gần đây có một công ty khởi nghiệp tên Neocambrian AI, đã khởi động một dự án nhà máy dữ liệu robot tại Ấn Độ, thu thập dữ liệu động tác con người cho mô hình thể hóa, đặc biệt là Ego Data, người sáng lập của nó cũng đặc biệt nhấn mạnh Ấn Độ có lực lượng lao động khổng lồ, cũng là một lợi thế lớn cho việc phát triển bộ dữ liệu AI vật lý của họ.


Người thu thập dữ liệu đeo thiết bị camera đầu, găng tay bắt chuyển động, hoàn thành công việc theo quy trình nhiệm vụ, sau đó nhóm hậu cần tiến hành làm sạch, chú thích, nghiệm thu, cuối cùng giao hàng cho công ty robot.


Xét về mô hình kinh doanh, chúng rất giống với công ty chú thích dữ liệu phục vụ mô hình lớn những năm trước, chỉ là trước đây chú thích văn bản, hình ảnh và giọng nói, giờ bắt đầu sản xuất kinh nghiệm thế giới vật lý.


Một người trong ngành cũng nói với chúng tôi, trong năm qua, cảm thấy rõ ràng nhu cầu khách hàng nước ngoài đang tăng lên. Đặc biệt là các công ty robot Âu Mỹ, "họ đối với quy cách dữ liệu sẽ rõ ràng hơn, biết mình cần gì."


Bởi vì dữ liệu robot không đơn giản là "quay video", nhiều khách hàng thực sự cần là một bộ dữ liệu có thể trực tiếp vào đường ống huấn luyện, bao gồm chuỗi thời gian, hình ảnh đa góc nhìn, quỹ đạo động tác, trạng thái cảm biến, tư thế tay, metadata môi trường, và định dạng huấn luyện thích ứng cuối cùng.


Trong quá trình này, ngày càng nhiều công ty cũng phát hiện, chỉ dựa vào nhân lực chi phí thấp, thực sự rất khó hình thành rào cản lâu dài. Trong tương lai, những nhà máy dữ liệu chi phí thấp này, rào cản cạnh tranh lớn nhất vẫn là xem dữ liệu giao hàng có thể dễ dàng được sử dụng trực tiếp hơn không.


Và vấn đề cũng rất thực tế, loại hình kinh doanh này tự nhiên dễ hàng hóa hóa, một nhóm làm được, nhóm khác về lý thuyết cũng có thể làm, giá dần minh bạch, không gian lợi nhuận thường bị nén.


Vì vậy, khả năng giao hàng chi phí thấp, là ưu thế lớn nhất của họ, nhưng cũng có thể trở thành trần nhà.


Loại thứ hai là tầng thu thập và căn chỉnh động tác, so với chỉ thu video đơn thuần, loại người chơi này cố gắng giải quyết vấn đề "động tác được máy thực sự hiểu như thế nào", trọng điểm của họ không chỉ là lượng dữ liệu, biểu đạt động tác quan trọng hơn.


Ví dụ, găng tay dữ liệu, bắt chuyển động, theo dõi tay, chuyển hướng động tác, giao diện thu thập thao tác.


Bởi vì phần thực sự khó khăn của robot, nhiều lúc không phải là có nhìn hiểu không, mà là làm thế nào để động. Cũng là cầm một cái cốc, bàn tay khéo léo của robot khác nhau có bậc tự do khác nhau, cấu trúc đốt ngón tay khác nhau, khả năng điều khiển lực khác nhau.


Điều này sẽ tạo ra một vấn đề then chốt, động tác con người, làm thế nào để ánh xạ ổn định lên cơ thể robot khác nhau?


Vì vậy, ngày càng nhiều công ty bắt đầu quan tâm hơn đến chuyển hướng động tác, trong quá trình này, video chịu trách nhiệm cho robot biết con người đã làm gì, tầng động tác, thì trả lời thêm robot tự mình nên làm như thế nào.


Giá trị thực sự của tầng này, thường không phải là phần cứng bản thân, hoàn thành "dịch động tác" ổn định hơn là cốt lõi.


Loại thứ ba là tầng dữ liệu Robot-Native, thường là nhà cung cấp dịch vụ điều khiển từ xa bên thứ ba và dữ liệu thiết bị thực, đặc điểm cốt lõi nhất của loại người chơi này là gần với bản thân robot hơn, thậm chí nhiều lúc, bản thân cần liên kết sâu với công ty robot.


Bởi vì so với các phân khúc thu số liệu khác, dữ liệu thiết bị thực phụ thuộc cao vào lượng lớn robot cụ thể, và phần cứng robot của các công ty khác nhau không giống nhau, bậc tự do, không gian động tác, giao diện điều khiển có sự khác biệt lớn, cùng là một nhiệm vụ cầm nắm, đổi một robot khác có thể cần thu lại.


Trong quá trình đó, họ sẽ cung cấp, người điều khiển từ xa, địa điểm và khả năng thu thập thiết bị thực, giúp công ty robot tích lũy nhanh dữ liệu huấn luyện, đặc biệt là trong giai đoạn xác minh sớm của mô hình, khi công ty robot tự mình chưa có đủ đội ngũ và địa điểm, nhà cung cấp dịch vụ bên ngoài thường có thể khởi động nhanh hơn.


Loại thứ tư là công ty dữ liệu tổng hợp mô phỏng, họ không chỉ bán dữ liệu, trọng điểm là thử xây dựng một loại năng lực dữ liệu hoàn chỉnh hơn.



Trong khi sản xuất dữ liệu, cũng giúp khách hàng trả lời tại sao robot nhiệm vụ thất bại, và đợt dữ liệu tiếp theo nên thu như thế nào, đây là con đường mới nhiều công ty đang đi hiện nay.


Logic rất đơn giản, robot huấn luyện một ngày, có thể chỉ đủ tích lũy vài giờ quỹ đạo hiệu quả. Nhưng trong thế giới mô phỏng, cùng thời gian đó robot có thể thất bại hàng triệu lần, cầm nắm thất bại, lập kế hoạch đường đi sai, va chạm, ngã, đều có thể được lặp lại vô hạn.


Vì vậy, ngành công nghiệp cũng bắt đầu dần hình thành một cách kết hợp mới, dữ liệu thực tế chịu trách nhiệm neo đậu hiện thực, dữ liệu tổng hợp mô phỏng chịu trách nhiệm mở rộng quy mô nhiệm vụ.


Nvidia trong lộ trình GR00T cũng nhiều lần nhấn mạnh, mô hình cơ bản robot không chỉ cần dữ liệu trình diễn con người, cũng cần lượng lớn dữ liệu tổng hợp. Nhà phát triển có thể thông qua thu thập thế giới thực để có được tri thức tiên nghiệm trước, sau đó nhờ mô phỏng mở rộng quy mô nhiệm vụ.


Mô hình trong mô phỏng thất bại càng nhiều, càng biết thiếu dữ liệu gì, và ai có thể sản xuất nhanh nhất những dữ liệu này, ai càng có cơ hội chiếm ưu thế.


Loại người chơi thứ năm thiên về tầng tiêu chuẩn và nền tảng dữ liệu, trong khi mở rộng quy mô dữ liệu, khám phá làm thế nào để bản thân việc cung cấp dữ liệu trở nên tiêu chuẩn hơn, dễ lưu thông hơn.


Bởi vì công ty robot ngày càng nhiều, dữ liệu cũng trở nên phân mảnh cao, cách thức thu thập khác nhau, biểu đạt động tác khác nhau, tiêu chuẩn định dạng khác nhau, cùng một bộ dữ liệu, nhiều lúc thậm chí khó trực tiếp tái sử dụng.


Trong bối cảnh này, các nỗ lực xung quanh tiêu chuẩn hóa dữ liệu thể hóa, thu thập phối hợp trong năm nay cũng bắt đầu tăng lên rõ ràng.


Đối với ngành robot hiện tại, thiếu dữ liệu chỉ là một trong các vấn đề, dữ liệu có thể tiếp tục ổn định sản sinh không, dễ vào quy trình huấn luyện hơn, cũng rất quan trọng.


Tuy nhiên, bất kể là người chơi dữ liệu con người, dữ liệu thiết bị thực hay mô phỏng..., cuối cùng đều phải trả lời một câu hỏi như vậy: công ty robot có giao những năng lực cốt lõi này cho nhà cung cấp bên ngoài không?


Bởi vì đối với hầu hết công ty thể hóa ngày nay, dữ liệu không chỉ là chi phí, mà còn là rào cản.


Công ty robot, rốt cuộc nên mua dữ liệu hay tự thu?


Bước vào năm nay, vị trí của dữ liệu trong ngành robot vô cùng quan trọng, mọi người đều biết robot thiếu dữ liệu.


So với trước đây, lựa chọn cung cấp dữ liệu trên thị trường ngày nay bắt đầu ngày càng nhiều, các loại dữ liệu khác nhau đều có nhà cung cấp để chọn, đối với công ty robot, việc mua dữ liệu bắt đầu ngày càng dễ dàng.


Nhưng tình hình thực tế lại có chút khác, một mặt là ngày càng nhiều công ty robot bắt đầu mua sắm dữ liệu, mặt khác là các công ty hàng đầu lại cố gắng xây dựng đội ngũ dữ liệu của riêng mình.



Nếu tách ra phía dưới, sẽ phát hiện dữ liệu khác nhau, quyết định cách thức tổ chức hoàn toàn khác nhau.


Ở một mức độ nào đó, công ty robot thực sự hình thành là logic "mua sắm phân tầng".


Trong đó, tầng thứ nhất là dữ liệu tổng quát cơ bản, đây là tầng dễ bị thuê ngoài nhất.


Ví dụ, sắp xếp nhà bếp, dọn dẹp bàn, cầm nắm cơ bản, phân loại, vận chuyển... những hành vi này, loại dữ liệu này có một đặc điểm chung, bất kể robot trông như thế nào, cuối cùng đều cần hiểu con người hoàn thành nhiệm vụ như thế nào.


Ví dụ, một robot vào nhà bếp sau, khi nào thì dọn một tay trước, khi nào thì sắp xếp vật lớn trước, rồi sắp xếp vật nhỏ, khi đồ vật quá nhiều, không gian làm thế nào lập kế hoạch lại?


Những năng lực này về bản chất thuộc về nhận thức thế giới vật lý tổng quát, không phải là năng lực độc chiếm của một robot nào đó.


Loại dữ liệu Ego tương tự như vậy nếu tự thu từ đầu, cần dựng đội ngũ, chi phí quản lý tương đối cao.


Trong khi đó, đội ngũ bên ngoài có thể mở rộng quy mô thu thập nhanh ở các khu vực như Đông Nam Á, Ấn Độ..., một tháng có thể ổn định sản xuất hàng nghìn giờ.


Đối với công ty robot, nhiều lúc mua trước, so với tự xây đội ngũ thì hợp lý hơn. Bởi vì ở giai đoạn này mục tiêu không phải là để robot làm việc ổn định, mà là hiểu thế giới trước.


Vì vậy, loại dữ liệu này thuê ngoài là hợp lý, thậm chí là lựa chọn hiệu quả hơn.


Tầng thứ hai là dữ liệu thích ứng thể hóa, công ty robot sẽ có xu hướng tự thu hơn.


Sau khi tiền huấn luyện thông qua lượng lớn dữ liệu cơ bản, lúc này huấn luyện bắt đầu liên quan đến liên kết cốt lõi thực sự robot triển khai, căn chỉnh nhiệm vụ.


Vì vậy, logic bắt đầu xuất hiện thay đổi, bởi vì bản thân robot của mỗi công ty có sự khác biệt lớn, bậc tự do khác nhau, bàn tay khéo léo khác nhau, năng lực các khía cạnh như khớp cũng khác nhau. Logic động tác mà robot cuối cùng cần học, cũng sẽ có sự khác biệt lớn.


Càng gần tầng thực hiện động tác, dữ liệu càng khó tổng quát. Vì vậy, nhiều công ty dù mua lượng lớn Ego Data, nhưng vẫn xây dựng đội ngũ thu số liệu nội bộ, tiến hành thu thập dữ liệu thiết bị thực. Bởi vì tầng này, đã bắt đầu tiếp cận sức cạnh tranh thực sự của mô hình.


Tầng thứ ba là dữ liệu triển khai và dữ liệu thất bại, đây là tầng khá then chốt, thường sinh ra sau khi triển khai thực tế.


Sau khi robot được triển khai vào môi trường ứng dụng thực tế, môi trường làm việc thực sự của nó thường gặp phải các tình huống ngẫu nhiên đa dạng, những dữ liệu triển khai sinh ra trong các tình huống thực tế này, bất kể là thành công hay thất bại, đều cực kỳ có giá trị, và trong việc thu thập dữ liệu tiền trạm rất ít gặp, khó được thiết kế trước, chỉ có thể tích lũy từng chút một trong môi trường thực tế.


Hơn nữa, nhiều công ty cũng khó triển khai robot của mình với số lượng lớn vào tình huống thực tế, vì vậy dữ liệu triển khai thực tế thì không cần bàn đến.


Trong quá trình triển khai, robot trong môi trường biến đổi không ngừng tích lũy, ngay cả dữ liệu thất bại, cũng giúp đội ngũ tìm ra nguyên nhân có trọng điểm, và đưa ra đối sách, từ đó tối ưu hóa mô hình, rồi thúc đ đẩy việc triển khai quy mô của robot.


Những điều này thuộc về dữ liệu cốt lõi của công ty robot hàng đầu, cũng là rào cản phân biệt họ với đối thủ cạnh tranh.


Điều này ở một mức độ nhất định cũng hạn chế trần nhà của công ty dữ liệu, chúng có thể giúp robot "nhập môn", dữ liệu thực sự quyết định trần năng lực, nhiều công ty hàng đầu cuối cùng vẫn sẽ chọn tự nắm giữ.


Vì vậy, hai con đường khác nhau phân hóa của ngành dữ liệu cũng có dấu vết để theo, một là nhà máy dữ liệu, một là động cơ dữ liệu.


Nhà máy dữ liệu là loại công ty xuất hiện nhanh nhất, số lượng nhiều nhất, cũng dễ hình thành dòng tiền nhất hiện nay trong ngành.


Trong đó, nhà máy dữ liệu chi phí thấp coi trọng hơn dữ liệu hành vi con người, dựa vào ưu thế lao động chi phí thấp, tính phí theo giờ, theo đuổi quy mô và khả năng giao hàng, dòng tiền có thể nhanh chóng chuyển dương, nhưng rào cản hạn chế, người cạnh tranh tham gia đang nhanh chóng tăng lên, đặc biệt là sau EgoScale, lượng lớn công ty khởi nghiệp bắt đầu đổ vào dữ liệu con người.


Nhà máy dữ liệu phức tạp cao hơn, trên cơ sở bao phủ dữ liệu hành vi con người, triển khai hàng loạt robot, thông qua cách thức điều khiển từ xa hoặc bản thân vận hành độc lập, thu thập lượng lớn dữ liệu thiết bị thực.


Một con đường khác, cố gắng làm động cơ dữ liệu, sắp xếp hệ thống phân loại nhiệm vụ, xây dựng cấu trúc dữ liệu, thực hiện chuyển hướng động tác, kết nối nền tảng mô phỏng, triển khai đánh giá mô hình, và dựa vào mẫu thất bại của mô hình lặp lại sản xuất ngược bộ dữ liệu.


Nói cách khác, việc họ đang làm không chỉ là bán dữ liệu, trọng điểm là để robot có khả năng tiếp tục trở nên thông minh.


Scale AI phiên bản robot, sẽ xuất hiện không?


Đặt ngành robot ngày nay, quay lại mô hình lớn năm 2022, sẽ phát hiện một cảm giác tương tự.


Ngành công nghiệp lúc đó cũng phát hiện, thứ thực sự quyết định trần năng lực của mô hình, là dữ liệu.


Do đó, xoay quanh các lĩnh vực như làm sạch dữ liệu, RLHF, đánh giá, hậu huấn luyện..., một loạt công ty mới cũng bắt đầu nhanh chóng trỗi dậy, kinh điển nhất là Scale AI.


Công ty này trong giai đoạn đầu giúp công ty lái xe tự động gắn nhãn dữ liệu, từ năm 2019, Scale AI trong giai đoạn GPT-2 đã liên kết sâu với OpenAI, nhận gắn nhãn phản hồi con người RLHF, đánh giá mô hình lớn, kiểm tra đội đỏ, tạo dữ liệu ngược trường hợp biên.


Sau khi ChatGPT bùng nổ, Meta Llama, Anthropic, Microsoft Azure... nhanh chóng kết nối, nhu cầu gắn nhãn chất lượng cao, đánh giá, dữ liệu tổng hợp của mô hình lớn tăng mạnh, doanh thu của công ty này trong 3 năm tăng hơn 4 lần.


Sau này, công ty này cũng bắt đầu dần đi vào tầng cơ sở hạ tầng sâu hơn, quản lý dữ liệu, đánh giá mô hình, quy trình làm việc AI.


Bởi vì kinh nghiệm thành công của Scale AI, nhiều người cũng mong mỏi, ngành robot, có sẽ xuất hiện một công ty tương tự không?


Từ mức độ thiếu hụt dữ liệu hiện tại, rất có thể, nhưng cũng sẽ không hoàn toàn sao chép.


Bởi vì dữ liệu cần thiết của robot phức tạp hơn nhiều so với văn bản, đối với mô hình lớn, một câu trả lời đúng sai tương đối dễ phán đoán. Nhưng trong thế giới robot, một động tác có thành công không, thường đầy mơ hồ.


Cốc cầm lên rồi, nhưng góc độ không đúng. Đồ đặt lại rồi, nhưng làm đổ vật thể khác, và nhiều lúc bản thân hoàn thành nhiệm vụ tồn tại nhiều đường đúng.


Vì vậy, ngành robot thực sự cần, không phải là một nền tảng dữ liệu đơn giản, trọng điểm là toàn bộ vòng lặp khép kín dữ liệu từ thu thập, gắn nhãn, ánh xạ động tác, mở rộng mô phỏng, đánh giá mô hình, phản hồi thất bại.


Robot thực sự thiếu không chỉ là dữ liệu, khả năng sản xuất liên tục kinh nghiệm hiệu quả càng khan hiếm hơn.


Vì vậy, ngày càng nhiều công ty bắt đầu chuyển trọng tâm cạnh tranh, từ bản thân robot, kiến trúc mô hình sang hệ thống dữ liệu.


Từ đầu năm nay, bất kể là Figure, 1X, PI, hay lộ trình GR00T do NVIDIA thúc đẩy, đều lặp đi lặp lại nhấn mạnh một hướng chung, sự tăng trưởng năng lực của robot, nâng cấp phần cứng chỉ là một phần, nhiều dữ liệu hơn và huấn luyện hiệu quả hơn bắt đầu trở thành nhân vật chính.


Ở một mức độ nào đó, trong giai đoạn ngành robot mở ra sản xuất hàng loạt và triển khai, mọi người cũng đang từ "chế tạo máy" bước vào thời kỳ mới "cho máy ăn".


Trong giai đoạn robot còn chưa đứng lên, chưa đi được, sức cạnh tranh lớn nhất của công ty thể hóa là có thể làm tốt phần cứng và điều khiển vận động không.


Nhưng khi robot có thể chạy có thể nhảy, thành tích trên nhiều cuộc thi có thể vượt qua con người, năng lực làm việc tự chủ lại trở thành mục tiêu lớn nhất của ngành, dưới sự thúc đẩy của mục tiêu này, chủ âm của ngành trở thành dữ liệu chất lượng cao quy mô lớn.


Robot muốn tiếp tục thành công trong thế giới thực phức tạp, cần thấy đủ nhiều nhiệm vụ tồn tại thực sự trong không gian vật lý, biết cốc có thể đổ, quần áo có thể vướng, không gian có thể không đủ, những kinh nghiệm này, không tự nhiên tồn tại trong Internet, nó chỉ có thể được sản xuất ra từng chút.


Vì vậy, chuỗi ngành công nghiệp dữ liệu này, cũng đằng sau cơn sốt robot hai năm nay, lặng lẽ định hình.


Ở một đầu chuỗi, là con người đeo camera trong nhà máy Ấn Độ, là robot không ngừng ngã trong mô phỏng.


Đầu kia, là các công ty robot định giá hàng chục tỷ, trăm tỷ, thậm chí nghìn tỷ, họ đang cố gắng để robot thực sự bước vào gia đình, bước vào nhà máy.


Từ nhà máy dữ liệu Ấn Độ, robot trong mô phỏng, đến các công ty robot lớn trên toàn cầu, một chuỗi sản xuất mới đã bắt đầu hình thành, chỉ là lần này, thứ được sản xuất không còn là linh kiện, mà là dữ liệu.

Bài viết này đến từ tài khoản công chúng WeChat: 42 Megahertz , tác giả: Lanbo, biên tập: James, tiêu đề gốc: 《Robot đã bắt đầu 'ăn' dữ liệu: Từ nhà máy dữ liệu Ấn Độ đến chuỗi sản xuất ngầm của robot hình người trị giá hàng tỷ USD》

Câu hỏi Liên quan

QTại sao dữ liệu đóng vai trò quan trọng trong quá trình huấn luyện mô hình thể hiện cho robot?

ABởi vì mô hình thể hiện (embodied AI) hoạt động trong thế giới vật lý, một 'sa mạc dữ liệu' so với kho dữ liệu khổng lồ trên internet dành cho mô hình ngôn ngữ. Robot cần một lượng lớn dữ liệu video góc nhìn thứ nhất (Ego Data) từ con người để học cách hiểu không gian, lập kế hoạch tác vụ và tương tác với vật thể, những kinh nghiệm mà trước đây chúng hầu như chưa được tiếp cận một cách có hệ thống. Thiếu dữ liệu chất lượng và quy mô là điểm nghẽn chính kìm hãm khả năng tổng quát và ứng dụng thực tế của robot.

QEgo Data (dữ liệu góc nhìn thứ nhất) là gì và nó được sản xuất như thế nào để huấn luyện robot?

AEgo Data là dữ liệu video được ghi lại từ góc nhìn thứ nhất (thường thông qua camera gắn trên đầu hoặc ngực) khi con người thực hiện các tác vụ cụ thể như sắp xếp quần áo, dọn dẹp nhà bếp, phân loại hàng hóa. Quá trình sản xuất mang tính 'công nghiệp': người thu thập dữ liệu làm việc trong các trung tâm được bố trí sẵn, tuân theo quy trình chuẩn (SOP) và bản mô tả chi tiết từ khách hàng (như loại tác vụ, góc quay, yêu cầu về tính liên tục, môi trường đa dạng). Dữ liệu thô sau đó được làm sạch, gắn nhãn, kiểm tra chất lượng để tạo ra sản phẩm dữ liệu có thể đưa trực tiếp vào pipeline huấn luyện.

QBài viết đề cập đến 'kim tự tháp dữ liệu' gồm những tầng nào và giá trị của chúng ra sao?

AKim tự tháp dữ liệu cho robot gồm 4 tầng chính, từ đáy lên đỉnh: 1) Dữ liệu internet: chi phí thấp, quy mô lớn, giúp robot 'biết' vật thể/thế giới trông như thế nào, nhưng khó học 'cách làm'. 2) Dữ liệu con người (như Ego Data): có thể mở rộng quy mô để huấn luyện trước, dạy robot logic hoàn thành tác vụ của con người. Dữ liệu găng tay (với thông tin lực, cử chỉ) càng có giá trị cao hơn. 3) Dữ liệu mô phỏng: khối lượng rất lớn, chi phí thấp, cho phép robot thử nghiệm-sai hàng triệu lần trong thế giới ảo, nhưng tồn tại khoảng cách 'mô phỏng - thực tế' (Sim-to-Real Gap). 4) Dữ liệu thực tế từ robot (ví dụ qua điều khiển từ xa): chất lượng cao nhất, đắt đỏ và khan hiếm nhất, vì nó trực tiếp trong không gian hành động của robot và chứa kinh nghiệm triển khai thực tế, tạo nên rào cản cạnh tranh.

QCó những loại hình công ty nào đang hoạt động trong chuỗi sản xuất dữ liệu cho ngành robot theo bài viết?

ABài viết chia thành 5 nhóm chính: 1) Nhà máy dữ liệu chi phí thấp: tập trung thu thập Ego Data ở các khu vực như Ấn Độ, Thái Lan, dựa vào lực lượng lao động giá rẻ để sản xuất hàng loạt. 2) Lớp thu thập và căn chỉnh hành động: giải quyết vấn đề 'dịch' hành động con người sang cơ thể robot thông qua găng tay dữ liệu, ghi hình chuyển động, ánh xạ lại hành động. 3) Nhà cung cấp dữ liệu bản địa cho robot (Robot-Native): cung cấp dịch vụ thu thập dữ liệu thực tế từ robot (điều khiển từ xa), thường gắn kết chặt chẽ với từng loại robot cụ thể. 4) Công ty dữ liệu tổng hợp/mô phỏng: tạo ra lượng dữ liệu ảo khổng lồ để bù đắp cho sự khan hiếm dữ liệu thực. 5) Lớp nền tảng và tiêu chuẩn hóa dữ liệu: hướng tới việc tạo ra các chuẩn chung để dữ liệu dễ lưu thông và sử dụng lại giữa các công ty robot khác nhau.

QCác công ty robot đang áp dụng chiến lược nào về việc tự thu thập hay mua dữ liệu bên ngoài?

AHọ áp dụng chiến lược 'mua theo tầng' (layered sourcing). 1) Dữ liệu cơ bản, phổ quát (như Ego Data cho các tác vụ gia đình cơ bản): thường được mua ngoài vì hiệu quả về chi phí và khả năng mở rộng, giúp robot 'hiểu thế giới' nhanh chóng. 2) Dữ liệu thích ứng thể hiện (embodied adaptation): liên quan đến việc ánh xạ hành động lên cơ thể robot cụ thể, các công ty có xu hướng tự thu thập (dữ liệu từ robot thật) vì đây là yếu tố then chốt tạo nên lợi thế cạnh tranh riêng. 3) Dữ liệu triển khai và thất bại: được sinh ra từ môi trường làm việc thực tế sau khi triển khai, đây là tài sản cốt lõi tạo ra rào cản và chỉ có thể tích lũy nội bộ. Vì vậy, các công ty hàng đầu thường xây dựng năng lực thu thập dữ liệu then chốt cho riêng mình.

Nội dung Liên quan

Sự kiện Raydium bị đánh cắp gợi mở: Mối nguy mới trong DeFi, ẩn giấu trong các hợp đồng cũ bị lãng quên

Bài viết cảnh báo về một rủi ro bảo mật mới nổi trong lĩnh vực DeFi: các hợp đồng thông minh cũ đã ngừng hoạt động nhưng vẫn tồn tại trên chuỗi. Sự kiện Raydium mất 1.34 triệu USD gần đây là một ví dụ, khi hacker khai thác lỗ hổng trong nhóm thanh khoát AMM V3 cũ của giao thức, vốn đã bị bỏ quên sau khi Serum đóng cửa. Bài báo chỉ ra rằng đây không phải là trường hợp cá biệt. Từ tháng 3/2025, đã có ít nhất 8 vụ tấn công tương tự nhắm vào các hợp đồng cũ bị bỏ quên, gây tổng thiệt hại khoảng 22.5 triệu USD. Vấn đề cốt lõi nằm ở việc quản lý vòng đời hợp đồng kém: các dự án thường chỉ tuyên bố ngừng hỗ trợ một phiên bản trên tài liệu mà không thực sự vô hiệu hóa hợp đồng, chuyển tài sản còn sót lại, hoặc liên tục giám sát chúng. Những "nghĩa trang hợp đồng" này trở thành mục tiêu dễ dàng cho hacker. Để giải quyết, bài viết đề xuất cần phân loại "hợp đồng ma" (zombie contract) thành một nhóm rủi ro riêng biệt trong thống kê an ninh và thiết lập quy trình tiêu chuẩn gồm 7 bước để tắt hợp đồng an toàn, bao gồm thu hồi ủy quyền, chuyển tài sản, vô hiệu hóa chức năng chính và giám sát liên tục. Việc này phải được coi trọng ngang với kiểm tra mã nguồn.

Foresight News13 phút trước

Sự kiện Raydium bị đánh cắp gợi mở: Mối nguy mới trong DeFi, ẩn giấu trong các hợp đồng cũ bị lãng quên

Foresight News13 phút trước

Solayer Ra Mắt Giao Dịch Ký Quỹ Nhằm Củng Cố Giao Dịch Đa Tài Sản Vĩnh Cửu Trên Mainnet

Solayer - mạng lưới blockchain Lớp 1 tương thích với Solana Virtual Machine (SVM) - đã chính thức triển khai mainnet cho Margin Trade, một nền tảng giao dịch perpetual đa tài sản thống nhất, kết nối tài chính truyền thống và số. Được xây dựng bởi Solayer Labs với sự đóng góp từ các nhà giao dịch dày dạn kinh nghiệm, Margin Trade được thiết kế để cạnh tranh trong lĩnh vực tài chính phi tập trung (DeFi). Nền tảng này nổi bật nhờ tính bao trùm thị trường, cho phép giao dịch song song cả tài sản truyền thống (như vàng, bạc, dầu, chỉ số chứng khoán MT500) và tiền điện tử trên chuỗi. Margin Trade hỗ trợ giao dịch ký quỹ chéo (cross-margin) và khớp lệnh thời gian thực trong một môi trường được tối ưu thanh khoản, giúp cải thiện hiệu quả sử dụng vốn. Người dùng được hưởng lợi từ tính minh bạch và quyền sở hữu phi lưu ký, với mọi giao dịch từ ký quỹ, mở vị thế đến thanh lý đều được xử lý trên chuỗi. Trong đợt ra mắt, nền tảng đã giới thiệu giao dịch perpetual cho dự án Pearl Research ($PRL). Kế hoạch tương lai bao gồm mở rộng danh sách tài sản và bổ sung tính năng ký quỹ riêng lẻ (isolated margin). Được xây dựng trên giao thức Solayer với tốc độ 330,000 giao dịch/giây, Margin Trade hướng tới việc thống nhất thị trường vốn truyền thống và tiền điện tử trên chuỗi với quy mô thể chế.

TheNewsCrypto48 phút trước

Solayer Ra Mắt Giao Dịch Ký Quỹ Nhằm Củng Cố Giao Dịch Đa Tài Sản Vĩnh Cửu Trên Mainnet

TheNewsCrypto48 phút trước

Phê bình gắt gao|Michael Saylor đưa ra 'tuyên bố của gã Sở Khanh'; Bà lão 60 tuổi 'lừa đảo thanh niên' sau khi vị thế hợp đồng bị xóa sổ

Đánh Giá Cay: Michael Saylor Tuyên Bố 'Sói Già', Cụ Bà 60 Tuổi Lừa Tiền 'Thanh Niên' Sau Khi Hợp Đồng Bị Thanh Lý Tuần này, "Lạc Bình" điểm lại ba tình huống đáng chú ý trong thế giới tiền mã hóa. Đầu tiên, Michael Saylor - nhà sáng lập MicroStrategy - đã làm rõ về việc công ty bán Bitcoin tại hội nghị BTC Prague. Ông nói: "Tôi chưa từng nói công ty không được bán Bitcoin. Tôi nói với *các bạn* là đừng bao giờ bán Bitcoin cá nhân của mình. Công ty đương nhiên sẽ bán khi cần thiết." Cộng đồng mạng lập tức chỉ ra sự mâu thuẫn, cho rằng đây là "đỉnh cao của nghệ thuật ngôn ngữ" khi phân biệt giữa "bạn" và "tôi". Thứ hai, một vụ án lừa đảo hy hữu ở Bắc Kinh: một cụ bà họ Mạnh 60 tuổi, muốn đầu tư vào tiền ảo nhưng không dùng tiền riêng, đã lừa một thanh niên hơn 20 vạn tệ (khoảng 20,000 USD). Bà ta giả làm "mẹ nuôi" của một cô gái trẻ tên Tiểu Hồng, rồi tự mình đóng giả Tiểu Hồng qua WeChat để yêu đương với nạn nhân. Số tiền lừa được, bà ta dùng để giao dịch tiền mã hóa với đòn bẩy 10x, và cuối cùng bị thanh lý hợp đồng (cháy tài khoản). Cụ bà đã bị kết án 4 năm tù vì tội lừa đảo. Thứ ba, một câu chuyện đau lòng trên Reddit: một trader chia sẻ rằng tài sản ròng đỉnh cao của anh ta từng đạt 45 triệu USD nhờ nắm giữ meme coin, nhưng giờ chỉ còn khoảng 17,200 USD. Bài viết "Hãy hỏi tôi bất cứ điều gì" thu hút nhiều bình luận, từ sự đồng cảm đến những lời khuyên về việc chốt lời và đa dạng hóa đầu tư. Nhiều người cho rằng đây là một bài học đắt giá về việc không nên nắm giữ các tài sản có tính đầu cơ cao quá lâu. Từ lời nói của Saylor, vụ lừa đảo của cụ bà, đến câu chuyện thăng trầm của trader Reddit, tuần này quả thực có người chơi chữ, có người chơi tâm lý, và có người chơi với nhịp tim.

Foresight News3 giờ trước

Phê bình gắt gao|Michael Saylor đưa ra 'tuyên bố của gã Sở Khanh'; Bà lão 60 tuổi 'lừa đảo thanh niên' sau khi vị thế hợp đồng bị xóa sổ

Foresight News3 giờ trước

Run rẩy đi con người, AI vẫn đang phi nước đại

Con người run rẩy đi, AI vẫn đang tăng tốc. Bài viết tổng hợp từ Hội nghị Trí tuệ Nhân tạo BAAI 2026, nhấn mạnh AI đang tăng tốc mạnh mẽ, không chỉ trong thế giới kỹ thuật số mà còn tiến vào thế giới vật lý. **Scaling Law vẫn tiếp tục, AI tự hoàn thiện:** Dù có lo ngại về việc dữ liệu văn bản chất lượng cao cạn kiệt, nhiều chuyên gia tại hội nghị khẳng định Định luật Mở rộng (Scaling Law) chưa chạm trần, mà đang trở nên đa dạng hơn, tiếp tục thúc đẩy hiệu suất của các mô hình ngôn ngữ lớn (LLM) và đa phương thức. Đồng thời, với sự trưởng thành của AI Coding và tác nhân AI (Agent), xu hướng tự hoàn thiện của AI ngày càng rõ, từ viết code đến tự động cập nhật sản phẩm. **Mô hình Thế giới: Mặt trận then chốt tiếp theo:** Cộng đồng đang tập trung vào việc phát triển Mô hình Thế giới (World Model) để AI hiểu và tương tác với thế giới vật lý. Tuy nhiên, lộ trình công nghệ chưa hội tụ, với nhiều hướng tiếp cận khác nhau (lấy ngôn ngữ, pixel, cấu trúc 3D hoặc biểu diễn hình ảnh làm trung tâm). Các vấn đề như dữ liệu đào tạo (video, mô phỏng hay dữ liệu thực) vẫn cần được giải quyết. Viện Nghiên cứu Trí tuệ Nhân tạo Bắc Kinh (BAAI) dự đoán cần 3-5 năm nữa để mô hình này phát triển và đang nghiên cứu một con đường tích hợp. **Tác nhân AI (Agent): Từ 'Khả dụng' đến 'Dễ dùng':** Agent, cầu nối đưa AI vào cuộc sống, đã có những bước tiến đáng kể, trở nên chủ động và xử lý được các nhiệm vụ phức tạp hơn (như chẩn đoán y tế hỗ trợ, nghiên cứu, ghi chú hội nghị). Để từ "khả dụng" tiến tới "dễ dùng", trọng tâm hiện nay là phát triển "Harness" - khung công nghệ hoặc môi trường bao quanh Agent - nhằm cải thiện khả năng hiểu ý định, thiết kế quy trình, xác minh và phản hồi, nâng cao độ tin cậy và hiệu quả tổng thể. Tóm lại, ngành AI đang trên đà phát triển nhanh chóng với sức mạnh mô hình tiếp tục được mở rộng, cuộc đua chinh phục Mô hình Thế giới đã bắt đầu và các Agent đang dần được hoàn thiện để thực sự hữu ích trong các tình huống thực tế.

marsbit3 giờ trước

Run rẩy đi con người, AI vẫn đang phi nước đại

marsbit3 giờ trước

Mặt khuất của khối tài sản nghìn tỷ USD của Elon Musk: 85% không thể bán

Elon Musk đã trở thành tỷ phú nghìn tỷ USD đầu tiên trên thế giới sau đợt IPO kỷ lục của SpaceX với định giá 1.77 nghìn tỷ USD. Tuy nhiên, sự giàu có này chủ yếu là trên giấy tờ. Báo cáo S-1 tiết lộ Musk nắm giữ ~85.1% quyền biểu quyết nhưng quyền lợi kinh tế thực tế có thể chỉ từ 35-55%, phần lớn là cổ phiếu siêu biểu quyết kém thanh khoản. Hơn nữa, chỉ 4.2% tổng số cổ phiếu (~5.556 tỷ cổ) được lưu hành công khai, khiến giá cổ phiếu rất nhạy cảm với dòng tiền giao dịch nhỏ. Khoảng 4.400 nhân viên SpaceX sẽ trở thành triệu phú USD nhờ kế hoạch cổ phiếu, nhưng của cải thực tế bị giới hạn bởi thời gian khóa, giá thực hiện và thuế. Mặt khác, các công ty AI như Anthropic và OpenAI, nếu IPO, có thể tạo ra khối tài sản cho nhân viên lớn hơn nhiều lần so với SpaceX do cơ cấu vốn phân tán hơn. Một thách thức cốt lõi là sự phụ thuộc của SpaceX vào doanh thu cho thuê năng lực tính toán AI (260 tỷ USD/năm từ Anthropic và Google). Bộ phận xAI của công ty vẫn đang lỗ 64 tỷ USD (2025) và cần vốn đầu tư hàng năm ~308 tỷ USD, vượt xa doanh thu hiện tại. Sự bền vững của dòng doanh thu này cùng với áp lực bán ra khi 96% cổ phiếu hết hạn khóa sẽ là bài toán then chốt quyết định hiệu suất cổ phiếu SpaceX sau IPO.

链捕手3 giờ trước

Mặt khuất của khối tài sản nghìn tỷ USD của Elon Musk: 85% không thể bán

链捕手3 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片