Đối thủ lâu năm của Unitree, Zhiyuan, lại tách ra một công ty khác.
Khi Mifeng Technology tuyên bố hoàn thành vòng gọi vốn chiến lược "Angel+" hàng trăm triệu nhân dân tệ, công ty dữ liệu do Zhiyuan khởi xướng thành lập này một lần nữa lộ diện. Sau điểm tới hạn của công ty tay khéo léo, Zhiyuan lại tách một năng lực cốt lõi thành một công ty riêng, bước vào con đường vận hành và huy động vốn độc lập.
Nhắc đến Zhiyuan, nhiều người sẽ vô thức coi nó là đối thủ số một của Unitree.
Xét cho cùng, chỉ riêng năm 2025, sản lượng thực tế robot hình người thuần túy của Unitree đã vượt quá 5500 máy, được cho là số một thế giới về sản lượng; tháng 3 năm nay, Zhiyuan tuyên bố chính thức xuất xưởng robot hiện thân thông dụng thứ 10.000.
Từ quy mô sản xuất đến thương mại hóa, hai bên luôn được đem ra so sánh cùng nhau.
Lần này, với tư cách là một trong những đối thủ trực tiếp nhất của Unitree, Zhiyuan lại mở rộng lợi thế cạnh tranh của mình ra ngoài bản thân robot.
Bởi vì Mifeng Technology được tách độc lập từ Zhiyuan, làm chính là một trong những mảng kinh doanh sôi động nhất trong lĩnh vực trí tuệ hiện thân hiện nay: thu thập, quản lý và lưu thông dữ liệu. Mục tiêu mà nó đề ra cũng rất hoành tráng: đạt được năng lực sản xuất dữ liệu cấp độ triệu giờ vào năm 2026.
Mô hình cơ sở, năng lực tính toán, phần cứng, những thuật ngữ gắn liền với trí tuệ hiện thân này, chúng ta đều nghe nhiều. Nhưng có thể nhiều người chưa nhận ra, tầm quan trọng của "dữ liệu" trong ngành công nghiệp trí tuệ hiện thân đang tăng lên nhanh chóng.
Ngay cả Peng Zhihui, đồng sáng lập, chủ tịch kiêm CTO của Zhiyuan, trước đây cũng thẳng thắn nói rằng Zhiyuan không thiếu tiền, mà hiện nay thiếu dữ liệu hơn.
Đằng sau việc Zhiyuan thiếu dữ liệu, là toàn bộ ngành công nghiệp trí tuệ hiện thân đang trải qua một "nạn đói dữ liệu" chưa được đa số nhìn thấy, nhưng lại vô cùng cấp bách.
Thứ quan trọng hơn năng lực tính toán, bắt đầu lộ diện
Đến thời đại trí tuệ hiện thân, tầm quan trọng của dữ liệu đang tiến gần đến năng lực tính toán của thời đại mô hình lớn.
Mô hình lớn chủ yếu học từ thế giới internet, còn robot phải học từ thế giới vật lý. Cái trước có thể lấy tư liệu huấn luyện từ các trang web, sách vở và luận văn, cái sau phải nhấc ly, đẩy cửa, gấp quần áo mới có thể hiểu được hành động và phản hồi trong môi trường thực tế.
Ngoài thông tin thị giác, robot còn cần thông tin đa phương thức bao gồm xúc giác, lực giác, quỹ đạo vận động,... Đối với dữ liệu máy thực chất lượng cao, mỗi dòng dữ liệu đằng sau thường tương ứng với một lần tương tác vật lý thực sự.
Theo ước tính từ phía Mifeng tại buổi công bố, lượng ngữ liệu cần thiết để huấn luyện hệ thống cấp GPT-5 đạt đến hàng chục tỷ giờ, trong khi dữ liệu hiệu quả chất lượng cao trên toàn cầu có thể dùng để huấn luyện trí tuệ hiện thân chỉ khoảng 500.000 giờ.
Mặt khác, Báo cáo chỉ số AI năm 2026 do HAI của Đại học Stanford công bố liệt kê hai thành tích chênh lệch: tỷ lệ thành công cao nhất của robot trên tiêu chuẩn hoạt động mô phỏng RLBench đạt 89,4%; trong tiêu chuẩn mô phỏng BEHAVIOR-1K hướng đến nhu cầu gia đình thực tế, với chuỗi nhiệm vụ phức tạp hơn, tỷ lệ hoàn thành nhiệm vụ đầy đủ cao nhất chỉ là 12,4%.
Hai thành tích đến từ các tiêu chuẩn khác nhau, nhưng ít nhất chúng cho thấy robot tiến bộ nhanh trong các nhiệm vụ ngắn, được kiểm soát, nhưng khi đối mặt với các nhiệm vụ gia đình phức tạp, khả năng vẫn còn hạn chế rõ rệt.
Dữ liệu huấn luyện chất lượng cao, đa dạng không đủ, chính là một nguyên nhân quan trọng trong số đó.
Nói cách khác, điểm yếu về khả năng của robot ngày nay, phần lớn đến từ việc chưa thấy nhiều thế giới thực.
Vì vậy, ngành thu thập dữ liệu trí tuệ hiện thân mới nổi này bắt đầu trỗi dậy nhanh chóng.
Cách phổ biến nhất hiện nay là điều khiển từ xa bằng máy thực (Teleoperation), người thật điều khiển từ xa robot hoàn thành nhiệm vụ, sau đó ghi lại thông tin hình ảnh, hành động và trạng thái trong quá trình thực hiện. Chất lượng dữ liệu tương đối cao, chi phí cũng không thấp.
Giám đốc điều hành Mifeng Yao Maoqing từng giới thiệu, giá một giờ dữ liệu máy thực trong nước thường dao động từ 500 đến 1000 nhân dân tệ, hơn nữa cần sự phối hợp của bản thân robot, người vận hành và bối cảnh, tốc độ mở rộng có hạn.
Con đường khác là dữ liệu mô phỏng. Doanh nghiệp sử dụng song sinh kỹ thuật số và động cơ vật lý, để robot hoàn thành một lượng lớn nhiệm vụ huấn luyện trong môi trường ảo, có thể giảm chi phí thu thập. Nhưng kỹ năng robot học được trong thế giới ảo, vẫn có thể không chuyển giao hoàn chỉnh sang thế giới thực, đây cũng là "khoảng cách Sim-to-Real" mà ngành công nghiệp lâu nay phải đối mặt.
Sau khi thu thập dữ liệu về, còn có vấn đề cơ bản hơn.
Các doanh nghiệp khác nhau sử dụng nền tảng robot, cảm biến và định dạng dữ liệu khác nhau, cùng một hành động cầm nắm, có thể được ghi lại thành cấu trúc dữ liệu hoàn toàn khác nhau. Một lượng lớn dữ liệu thô còn phải trải qua quá trình làm sạch, gán nhãn và xử lý cấu trúc, mới có thể vào được huấn luyện mô hình.
Vì vậy, nhiều doanh nghiệp vẫn đang ở giai đoạn "tự thu thập, tự sử dụng, tự huấn luyện", dữ liệu bị phân tán ở các công ty và nền tảng khác nhau.
Khi tầm quan trọng của dữ liệu tăng lên, cạnh tranh cũng bắt đầu mở rộng từ bản thân robot, sang cơ sở hạ tầng như thu thập, quản lý và lưu thông.
Nhưng ngành công nghiệp thiếu bao nhiêu dữ liệu, hiện chưa có thống kê chung. Có thể xác định rằng, chỉ dựa vào một doanh nghiệp tự thu thập và sử dụng, rất khó bao phủ các tình huống phức tạp mà robot thông dụng cần đối mặt.
Ai có thể xây dựng mạng lưới cung cấp dữ liệu chuẩn hóa, quy mô hóa trước, người đó có nhiều cơ hội hơn để trở thành "người bán xẻng" trong đợt mở rộng ngành công nghiệp này.
Mifeng Technology nhắm vào chính cơ hội này.
Biến dữ liệu thành nền tảng
Tất nhiên, thu thập dữ liệu rất quan trọng, nhưng Mifeng Technology không chỉ muốn dừng lại ở đó.
Hiện nay, việc thu thập dữ liệu chất lượng cao của ngành vẫn phụ thuộc nhiều vào bản thân robot. Doanh nghiệp cần mua robot, triển khai bối cảnh, tổ chức người vận hành, sau đó hoàn thành việc thu thập thông qua điều khiển từ xa, trong đó bản thân robot là một trong những khâu tốn kém nhất.
Mifeng giữ lại phương án dữ liệu máy thực, đồng thời ra mắt sản phẩm thu thập không có bản thể MEgo, bao gồm thiết bị thu thập dạng đeo đầu MEgo View và kẹp thu thập MEgo Gripper.
Người vận hành đeo hoặc cầm thiết bị, có thể ghi lại quá trình thao tác trong các bối cảnh thực như siêu thị, nhà máy, gia đình, không cần để robot tham gia toàn bộ quá trình thu thập.
So với điều khiển từ xa bằng máy thực, việc thu thập không có bản thể dễ dàng hơn trong việc giảm chi phí, mở rộng quy mô. Theo kế hoạch được Mifeng tiết lộ, năng lực sản xuất dữ liệu năm 2026 của họ, 60% đến 70% sẽ đến từ việc thu thập không có bản thể.
Nhưng thu thập được dữ liệu chỉ là bước đầu, liệu nó có thể được quản lý và đưa vào khâu huấn luyện hay không, phần lớn quyết định cuối cùng nó có giá trị hay không.
Dữ liệu thô thường chứa nhiễu và nội dung không hiệu quả, còn phải trải qua các quy trình như căn chỉnh thời gian, tái tạo quỹ đạo, gán nhãn, sàng lọc chất lượng,... Doanh nghiệp dù nắm giữ lượng dữ liệu thô lớn, cũng chưa chắc có thể chuyển hóa trực tiếp thành tập huấn luyện hiệu quả.
Vì vậy, Mifeng dành nhiều nỗ lực cho khâu quản lý dữ liệu.
Động cơ quản lý dữ liệu tự nghiên cứu MEgo Engine của họ, bao phủ các quy trình làm sạch dữ liệu, tái tạo quỹ đạo 6D, tái tạo nhận thức không gian, kiểm tra chất lượng, chấm điểm thông minh và gán nhãn tự động. Theo cách nói của phía Mifeng, hiệu quả gán nhãn tự động của họ so với cách truyền thống có thể tăng hơn 10 lần, mục tiêu là để dữ liệu sau khi thu thập nhanh chóng vào khâu huấn luyện hơn.
Ngoài việc bán dữ liệu, Mifeng cũng hy vọng cung cấp năng lực xử lý dữ liệu thô thành tập huấn luyện.
Ở tầng cao hơn, Mifeng còn xây dựng thương trường dữ liệu, hy vọng đóng gói chuẩn hóa các nguồn tài nguyên dữ liệu phân tán, mở cửa cung cấp cho toàn ngành.
Ý tưởng như vậy hơi giống với điện toán đám mây thời kỳ đầu: nhà cung cấp đám mây biến năng lực tính toán thành dịch vụ điều chỉnh theo nhu cầu, Mifeng hy vọng cũng biến dữ liệu thành một nguồn tài nguyên cơ sở có thể giao dịch, tái sử dụng.
Theo kế hoạch của công ty, Mifeng sẽ đạt được năng lực sản xuất dữ liệu cấp độ triệu giờ vào năm 2026, và thông qua "Hành động đồng sáng tạo dữ liệu tổ ong" phối hợp với nhà cung cấp đám mây, bên sở hữu bối cảnh và tổ chức ngành, hướng tới quy mô dữ liệu cấp độ chục tỷ giờ trước năm 2030.
Những điều này hiện vẫn là mục tiêu sản lượng, liệu có thực hiện đúng hạn hay không, còn phải xem sản lượng phần cứng, mạng lưới thu thập và đơn hàng thực tế.
Nhưng ngay cả như vậy, vốn đã sẵn sàng chi trả cho ý tưởng này.
Tháng 2 năm nay, Mifeng Technology hoàn thành vòng gọi vốn Seed và Angel hàng trăm triệu nhân dân tệ, do Sequoia China dẫn đầu;
Tháng 6 lại hoàn thành vòng gọi vốn chiến lược Angel+ hàng trăm triệu nhân dân tệ, do Guofang Chuangtou dẫn đầu, nhiều vốn ngành công nghiệp và tổ chức nhà nước cùng tham gia;
Alibaba Cloud, Baidu Cloud, JD Cloud và các doanh nghiệp khác cũng đã đạt được hợp tác chiến lược với Mifeng, hướng hợp tác liên quan đến hệ sinh thái dữ liệu, phối hợp bối cảnh và hỗ trợ năng lực tính toán.
Đến đây, hai công ty tách ra từ Zhiyuan là Tipping Point và Mifeng, cũng đã có hướng kinh doanh riêng:
Tipping Point nhắm vào khâu phần cứng là bàn tay khéo léo, còn Mifeng nhắm vào khâu dữ liệu của trí tuệ hiện thân.
Chỉ là, việc vận hành và huy động vốn độc lập để lại không gian dịch vụ đối ngoại cho Mifeng, nhưng không tự động giải quyết được vấn đề tin tưởng của các đối thủ.
Đối thủ của Zhiyuan, dám dùng Mifeng không?
Vấn đề đầu tiên Mifeng phải giải quyết, là tính trung lập.
"Hành động đồng sáng tạo dữ liệu tổ ong" mà nó đề xuất, là đang thử xây dựng một mạng lưới dữ liệu cấp ngành. Nhưng để nhiều công ty robot tham gia hơn, Mifeng cần chứng minh rằng dữ liệu riêng của khách hàng sẽ không chảy về Zhiyuan, cũng không bị đối thủ cạnh tranh khác sử dụng vượt quyền.
Yao Maoqing từng công khai phản hồi vấn đề này. Ông nói, giao dịch dữ liệu của Mifeng chia thành hai chế độ "quyền sử dụng" và "quyền sở hữu"; đối với khách hàng mua quyền sở hữu, công ty sẽ hoàn thành chuyển giao tài sản, và hủy dữ liệu liên quan tại chỗ.
Thậm chí cách duy nhất để Zhiyuan lấy dữ liệu từ Mifeng, cũng là đặt hàng theo cơ chế thị trường, không tồn tại việc điều miễn phí, những sắp xếp này ít nhất đã làm rõ nguyên tắc cách ly dữ liệu.
Chỉ là, để đối thủ của Zhiyuan mua lâu dài, Mifeng còn cần thông qua thỏa thuận, cách ly quyền hạn, quy trình giao hàng và kiểm toán bên thứ ba, liên tục chứng minh tính trung lập của mình.
Xét cho cùng, đối với các đối thủ của Zhiyuan, Mifeng không phải là "bắt buộc phải chọn", nó cũng không phải là công ty duy nhất nhắm vào mảng kinh doanh dữ liệu.
JD đã ra mắt thiết bị đầu cuối thu thập JoyEgoCam, cơ sở hạ tầng dữ liệu hiện thân và nền tảng giao dịch dữ liệu, đồng thời đề xuất mục tiêu tích lũy hơn 10 triệu giờ dữ liệu video bối cảnh thực trong hai năm tới.
Luming Robot cũng đang bố trí thu thập không có bản thể, Lingchu Intelligent chủ yếu làm dữ liệu thao tác thực của con người, còn Guanglun Intelligent tập trung vào dữ liệu tổng hợp và cơ sở hạ tầng mô phỏng.
Chúng đều cạnh tranh cùng một việc: biến bối cảnh phân tán và dữ liệu thô, thành các tập dữ liệu có thể tiếp tục sử dụng cho huấn luyện.
Mifeng còn đồng thời đối mặt với hai bài toán quy mô và chất lượng.
Triệu giờ hiện chỉ là kế hoạch sản lượng, chưa phải là dữ liệu đã giao hàng hoàn thành; dù là thu thập máy thực hay không có bản thể, mở rộng quy mô đều có nghĩa là đầu tư liên tục vào thiết bị, nhân sự và bối cảnh. Không giải quyết được vấn đề chất lượng và khái quát hóa dữ liệu, tập dữ liệu lớn đến đâu cũng chỉ có thể là tích lũy lặp lại.
Cuối cùng quyết định Mifeng có thể hình thành hiệu ứng mạng hay không, vẫn là sự tin tưởng của các đối thủ dành cho nó.
Tuy nhiên, việc Zhiyuan để Mifeng vận hành và huy động vốn độc lập, ít nhất đã giành được không gian dịch vụ đối ngoại cho mảng kinh doanh này.
Dữ liệu nếu luôn ở lại bên trong Zhiyuan, chỉ có thể nâng cao năng lực mô hình của một công ty; sau khi được chuẩn hóa, thương phẩm hóa, và được các nhà sản xuất robot khác công nhận, mới có cơ hội trở thành cơ sở hạ tầng ngành.
Xét cho cùng, đối với Mifeng, năng lực sản xuất triệu giờ chỉ là ngưỡng cửa.
Đợi đến khi đối thủ của Zhiyuan cũng sẵn sàng mua lâu dài từ nó, thậm chí giao dữ liệu cốt lõi cho nó xử lý, mảng kinh doanh này mới thực sự đứng vững.
Bài viết này đến từ tài khoản WeChat công chúng: Kế hoạch chữ xanh , tác giả: Chester








