Qiānxún Zhìnéng một lần nữa kéo dài nhịp điệu gọi vốn.
Vào ngày 7 tháng 4 năm 2026, Qiānxún Zhìnéng thông báo hoàn thành vòng gọi vốn mới trị giá 1 tỷ nhân dân tệ. Vòng này do Shunwei Capital và Yunfeng Fund đồng dẫn đầu, với sự tham gia của Dachen Caizhi, một quỹ nhân dân tệ hàng đầu, Galaxy Yuanhui, Turing Fund, Xinding Capital, Gengxin Capital và những nhà đầu tư nặng ký khác.
Đây đã là khoản đầu tư lớn thứ hai trong vòng 30 ngày của công ty. Ngay trước đó không lâu vào tháng 2, công ty vừa hoàn thành vòng gọi vốn gần 2 tỷ nhân dân tệ. Cộng dồn hai vòng, tổng số tiền huy động được đã lên tới 3 tỷ nhân dân tệ.
Điều thú vị hơn nữa là trong vòng này xuất hiện một sự kết hợp đầy tính tranh luận: Lôi Quân (Shunwei) + Mã Vân (Yunfeng), lần đầu tiên cùng đồng lĩnh vực đầu tư vào lĩnh vực embodied AI (trí tuệ thể hiện).
Trước đây, họ đã từng đặt cược vào các chu kỳ then chốt như Internet di động, thương mại điện tử, phần cứng thông minh, điện toán đám mây. Lần này, việc cùng nhau đầu tư vào lĩnh vực robot, đặc biệt là embodied AI vẫn còn non trẻ, cho thấy hướng đi này đang chuyển từ tưởng tượng công nghệ sang sự đồng thuận của vốn, bắt đầu bước vào vòng loại với sự bảo trợ của các gã khổng lồ và sự tập trung vốn cao độ.
Qiānxún Zhìnéng được thành lập vào tháng 1 năm 2024, do các nhà sáng lập liên tiếp trong lĩnh vực robot Hàn Phong Thao, nhà khoa học AI đỉnh cao Cao Dương, và người tiên phong trong việc đưa robot ra nước ngoài Trịnh Linh Ân cùng sáng lập.
Nhà sáng lập kiêm CEO Hàn Phong Thao từng là Đồng sáng lập kiêm CTO của Luoshi Robot, chủ trì việc giao hàng gần trăm mẫu robot, có năng lực kỹ thuật hóa và sản xuất hàng loạt sâu sắc. Đồng sáng lập Cao Dương tốt nghiệp Đại học California, Berkeley, theo học giáo sư thị giác máy tính Trevor Darrell, hiện là trợ lý giáo sư tại Viện Nghiên cứu Thông tin Giao thoa Đại học Thanh Hoa, đội ngũ của ông đã open-source mô hình Spirit v1.5 vượt qua mô hình hàng đầu của Mỹ Pi0.5 trong bảng xếp hạng RoboChallenge, trở thành mô hình embodied open-source đầu tiên của Trung Quốc đứng đầu. Đồng sáng lập Trịnh Linh Ân là người tiên phong trong việc xuất khẩu robot công nghiệp, từng xây dựng bộ phận kinh doanh nước ngoài từ 0 đến 1, dẫn dắt đội ngũ đào sâu nhiều thị trường nước ngoài và nhanh chóng chuyển đổi thành quả thương mại hóa.
Ba nhà sáng lập lần lượt bao phủ ba năng lực cốt lõi AI, robot, thương mại hóa, cùng tạo thành đội ngũ "chiến binh lục giác" hiếm có trong ngành, đây cũng là nền tảng niềm tin để họ nhận được 3 tỷ nhân dân tệ đầu tư trong 30 ngày, Shunwei Capital và Yunfeng Fund cùng đầu tư nặng. Sự kết hợp như vậy giúp Qiānxún Zhìnéng ngay từ khi thành lập đã có cả tầm nhìn công nghệ đẳng cấp thế giới và gen thương mại hóa.
Hàn Phong Thao từng chỉ ra, năm 2026, cạnh tranh là quy mô dữ liệu và hiệu suất mô hình. Việc quan trọng nhất năm nay không phải là mở rộng场景 (scenario), mà là đưa mô hình embodied lên top 3 toàn cầu. Để làm được điều đó, trên sổ sách phải có đủ tiền.
Vì vậy, việc gọi vốn liên tục như chiến tranh chớp nhoáng về bản chất là dùng mật độ vốn để đổi lấy lợi thế thời gian, nhanh chóng chất đống tài nguyên, kéo dài khoảng cách hiệu suất, khóa chặt vị trí đầu bảng sớm. Đồng thời, các cổ đông cũ tiếp tục gia tăng đầu tư trong vòng này, có nghĩa là các nhà đầu tư đã chuyển từ quan sát xác minh sang đặt cược gia tốc.
Vậy, Qiānxún Zhìnéng, rốt cuộc dựa vào cái gì để nhận được tấm vé vào cửa gia tốc này? Hào thành bảo vệ của nó, đã đào sâu đến mức nào rồi?
Logic cơ bản của việc đặt cược vốn, một con đường giống mô hình lớn hơn được xác minh
Tại sao vốn sẵn sàng tiếp tục gia tăng đầu tư? Câu trả lời: mô hình, đã đưa ra câu trả lời giai đoạn.
Vào tháng 1 năm nay, Qiānxún Zhìnéng đã open-source mô hình embodied Spirit v1.5. Trong đánh giá công khai, mô hình này trực tiếp vượt qua mô hình open-source mạnh nhất lúc đó là Pi0.5.
Nhưng điều khiến vốn cảm động nhất, vẫn là điểm uốn của đường cong năng lực.
Spirit v1.5 đã thể hiện khả năng tổng quát hóa zero-shot (mẫu không) tương đối ổn định — không cần huấn luyện bổ sung, có thể hoàn thành một loạt thao tác phức tạp như lau chùi, mở đóng bản lề, xử lý vật thể mềm dẻo.
Nói cách khác, robot bắt đầu không chỉ học một nhiệm vụ, mà đã có khả năng chuyển đổi xuyên nhiệm vụ, cho con người thấy khả năng giải phóng sức lao động của embodied AI.
Đằng sau đó, tương ứng với một con đường kỹ thuật rất giống với mô hình ngôn ngữ lớn (LLM): làm mô hình lớn hơn, cho dữ liệu đầy đủ, lặp lại liên tục, và sau đó tin tưởng vào sự "xuất hiện" của năng lực.
Cụ thể, Spirit v1.5 là một mô hình thống nhất end-to-end VLA (Vision-Language-Action). Nó không quá chú trọng vào việc khôi phục toàn bộ chi tiết của thế giới, cũng không nhấn mạnh lớp mô phỏng thế giới hiển thị ở giữa, mà trực tiếp học ánh xạ từ nhận thức đến hành động.
Cách thức huấn luyện cũng rất LLM hóa. Chỉ có điều, thay dữ liệu văn bản bằng dữ liệu robot. Đầu tiên sử dụng video Internet khối lượng lớn để pre-training (huấn luyện trước), thiết lập sự hiểu biết cơ bản về thế giới, sau đó sử dụng dữ liệu tương tác thực tế để alignment (căn chỉnh) — trước tiên đạt được khả năng tổng quát hóa, sau đó tiếp cận nhiệm vụ cụ thể.
Kết quả, với quy mô tính toán và tham số thấp hơn, lại chạy ra hiệu suất tổng quát hóa mạnh hơn.
Ngay vài ngày trước, con đường này cũng nhận được "cộng hưởng cùng tần số" từ đồng nghiệp Silicon Valley.
Ngày 3 tháng 4, công ty embodied AI Silicon Valley Generallist AI phát hành mô hình cơ bản GEN-1, sử dụng 500.000 giờ dữ liệu tương tác vật lý thực tế, xác minh Scaling Law trong lĩnh vực embodied AI. Hiệu quả mạnh mẽ đến mức nào?
Những robot này đã nâng tỷ lệ thành công trung bình của nhiều nhiệm vụ vật lý từ 64% lên đáng kể đến 99%; tốc độ thực hiện gần như nhanh như con người, đạt khoảng 3 lần so với hệ thống tiên tiến nhất hiện có, và còn có thể ứng biến tại chỗ. Kinh khủng hơn nữa, việc đạt được mỗi năng lực chỉ cần khoảng 1 giờ dữ liệu robot.
CEO Pete Florence chỉ ra, những gì đang xảy ra trong lĩnh vực robot hiện nay, rất giống với khi mọi người mở GPT-3 và yêu cầu nó viết một bài thơ limerick (thơ năm dòng hài hước) hoàn toàn mới.
Quan sát tương tự, cũng từng được đội ngũ Qiānxún xác minh. "Đội ngũ chúng tôi cũng phát hiện ra Scaling Law trong lĩnh vực embodied AI, dữ liệu cứ tăng 10 lần, trong kết quả sẽ thêm một số 9." Cao Dương từng mô tả mức độ dốc của đường cong này như vậy. Chúng ta đang ở thời điểm Scaling Law của embodied AI, bởi vì dữ liệu robot khó kiếm hơn một chút, nên tôi nghĩ GPT-4 của robot sẽ lâu hơn một chút, có thể cần 4-5 năm.
Có thể nói, vốn gia tăng đầu tư vào một con đường kỹ thuật đã được xác minh sơ bộ, đồng thời có tiềm năng mở rộng và tỷ lệ chi phí-hiệu quả cao hơn.
Động cơ dữ liệu, chìa khóa cho sự thành lập của con đường
Trong lĩnh vực embodied AI, hầu như tất cả mọi người đều có một sự đồng thuận: thu thập dữ liệu là một nút thắt cổ chai cơ bản.
Mô hình lớn có thể ăn lượng dữ liệu khổng lồ từ Internet, nhưng robot thì không — trong thế giới lao động chân tay, không có Wikipedia. Bề ngoài, mọi người đều đang cuốn vào mô hình, nhưng cạnh tranh sâu xa hơn thực chất là động cơ dữ liệu. "Để đạt được mở rộng, chúng tôi sẽ không tiếc bất cứ giá nào." Pete Florence nói thẳng.
Vì tin vào Scaling Law, vậy thì hệ thống dữ liệu nào vừa có thể thu thập chi phí thấp, vừa có thể mở rộng liên tục, lại có đủ tính đa dạng?
Trước đây, các mô hình robot tổng quát có tỷ lệ thành công vượt quá 90% phụ thuộc vào tập dữ liệu điều khiển từ xa quy mô lớn cực kỳ đắt đỏ và khó mở rộng (ví dụ: Physical Intelligence). Nhưng Generallist AI đã tự nghiên cứu "data hands" (bàn tay dữ liệu) — một thiết bị đeo hai ngón tay đeo trên cổ tay, biến đôi tay con người thành kẹp giống robot, từ đó thu thập dữ liệu thị giác và cảm giác.
Kết quả, tiến triển của GEN-0, GEN-1 xác minh rằng động cơ dữ liệu này cũng có thể đạt được sự tinh thông trình độ cao — chúng không sử dụng dữ liệu robot, mà chỉ sử dụng dữ liệu do con người đeo thiết bị đeo chi phí thấp thực hiện hàng triệu hoạt động tạo ra.
Qiānxún Zhìnéng, cũng đang thúc đẩy con đường Scaling lấy tính đa dạng làm cốt lõi.
Về giải pháp phần cứng, Qiānxún cũng chọn giải pháp đeo, nhưng đi xa hơn. Để mô hình học thao tác tinh vi cấp độ con người, họ sử dụng thiết kế cấu trúc ba ngón — máy nguyên khối thông minh được trang bị 26 bậc tự do, mỗi khớp tích hợp cảm biến lực, trang bị bàn tay khéo léo ba ngón. Nhưng thách thức kỹ thuật cũng tăng lên đáng kể. Cấu trúc ba ngón trong thu thập dữ liệu đeo đối mặt với yêu cầu bậc tự do cao hơn, điều khiển lực tinh vi hơn và ánh xạ hành động phức tạp hơn.
Hiện tại, thiết bị đeo của Qiānxún đã lặp đến thế hệ thứ năm, khả năng sử dụng dữ liệu tăng từ 30% lên 95%, đồng thời chi phí được nén xuống khoảng một phần mười so với điều khiển từ xa.
Cần lưu ý, khác với Generallist AI hoàn toàn dựa vào dữ liệu đeo, Qiānxún xây dựng một động cơ dữ liệu hợp nhất đa nguồn.
Ở giai đoạn pre-training, ngoài lượng lớn dữ liệu đeo, Qiānxún Zhìnéng còn tích cực hợp nhất video Internet để pre-training, nhằm thu thập kiến thức chung và năng lực cơ bản. Sau đó, giới thiệu dữ liệu điều khiển từ xa của máy thật, để thực hiện SFT (supervised fine-tuning - vi chỉnh có giám sát) tinh tế, nâng cao hiệu suất của mô hình trong nhiệm vụ thực tế. Cuối cùng, thông qua học tăng cường (reinforcement learning) để tối ưu hóa hơn nữa: để mô hình liên tục roll-out (triển khai) trong môi trường thực tế, không ngừng tạo dữ liệu mới, bồi bổ cho mô hình.
Cho đến nay, Qiānxún đã thu thập được hơn 200.000 giờ dữ liệu tương tác thực tế, nguồn gốc trải rộng qua nhiều kênh như video Internet, điều khiển từ xa, thu thập thiết bị đeo, và con số này vẫn đang tăng trưởng nhanh chóng, dự kiến năm 2026 sẽ vượt 1 triệu giờ. Tính đến tháng 4 năm 2026, đội ngũ thu thập dữ liệu của Qiānxún Zhìnéng cũng sẽ đạt quy mô nghìn người.
Đáng chú ý là, sự hiểu biết của Qiānxún về dữ liệu, cũng trải qua một sự chuyển biến bản chất.
Họ không còn quá chú trọng vào bộ dữ liệu kịch bản hóa tinh xảo chủ đạo của ngành, mà chuyển hướng sang một范式 (paradigm) thu thập đa dạng hóa cởi mở hơn: không còn quy định nghiêm ngặt đường đi hành động, mà xoay quanh mục tiêu nhiệm vụ, để quá trình thực hiện diễn ra tự nhiên: cho phép thất bại, cho phép làm đổ, cho phép gián đoạn, rồi tiếp tục hoàn thành.
Điều này mang lại thay đổi căn bản, mô hình học được không còn là việc này làm thế nào, mà là khi gặp tình huống tương tự, nên xử lý ra sao. Ở cùng quy mô dữ liệu, phân phối dữ liệu này nâng cao đáng kể hiệu suất chuyển đổi của mô hình, đồng thời giảm sự phụ thuộc vào năng lực tính toán.
"Đẻ trứng dọc đường", dữ liệu场景 (scenario) thực tế, bồi bổ mô hình
Trong động cơ dữ liệu của Qiānxún, thứ thực sự quyết định bánh xe bay có thể quay được, không chỉ là nguồn dữ liệu, mà là khả năng roll-out liên tục trong môi trường thực tế.
Hàn Phong Thao từng tổng kết, đi đến场景 (scenario) thực tế, là để lấy nhiên liệu (dữ liệu) cho sự tiến hóa của mô hình. Thương mại hóa, là để quá trình thu thập này trở nên bền vững, có thể mở rộng quy mô.
Đằng sau đó, thực chất cũng tương ứng với một sự phân hóa con đường Trung-Mỹ rõ ràng. Ở Mỹ, một số công ty có thể đầu tư lâu dài xung quanh bản thân mô hình cơ bản, dùng thời gian đổi lấy giới hạn năng lực; nhưng ở Trung Quốc, không có demo, không có tín hiệu triển khai, thì rất khó tiếp tục nhận được đầu tư. Hầu hết các công ty có thể sống sót, thậm chí sống tốt, đa phần sẽ chọn một con đường折中 (thỏa hiệp) hơn.
Đi đến AI tổng quát, lại là một con đường dài và nhiều tuyết, không thể đợi mô hình成熟 (trưởng thành) rồi mới tìm ứng dụng. Chỉ có để robot vào môi trường sản xuất thực tế trước, tham gia vận hành nghiệp vụ thực tế, mới có thể sử dụng lượng dữ liệu khổng lồ do vận hành nghiệp vụ thực tế tạo ra, bồi bổ mô hình, tiếp tục tiến hóa.
Là công ty embodied AI đầu tiên trong nước đưa con đường thu thập dữ liệu đa dạng hóa từ lý thuyết đến kỹ thuật hóa, mở rộng quy mô, và hoàn thành xác minh kép trong场景 (scenario) thương mại thực tế, robot Qiānxún kiên trì "đẻ trứng dọc đường". Họ bắt đầu từ场景 (scenario) có thể kiểm soát, ưu tiên vào hai lĩnh vực công nghiệp và dịch vụ có cấu trúc tương đối ổn định, ranh giới nhiệm vụ rõ ràng, lợi nhuận cao và sẵn sàng trả tiền, xác minh năng lực mô hình đồng thời hỗ trợ vận hành công ty.
Ví dụ, trong场景 (scenario) bán lẻ, sự hợp tác giữa Qiānxún và JD.com (cũng là nhà đầu tư) đang sâu hơn. "Xiǎo Mò" đã vào JD MALL, nhận nhiệm vụ barista (pha cà phê). Trong khi hoàn thành nhiệm vụ dịch vụ, robot cũng sẽ đồng thời thu thập dữ liệu nhận thức đa phương thức, quỹ đạo chuyển động khớp và thông tin phản hồi lực tinh vi.
Những "dữ liệu chuyên gia" từ môi trường bán lẻ thực tế này, sẽ trực tiếp được sử dụng để huấn luyện và vi chỉnh mô hình embodied, hình thành vòng lặp tích cực "thu thập dữ liệu — lặp lại mô hình — nâng cao năng lực".
Robot Qiānxún Zhìnéng đã chính thức nhận nhiệm vụ tại JD MALL, đảm nhận barista.
Hai bên còn có kế hoạch mở rộng embodied AI hơn nữa đến nhiều lĩnh vực bán lẻ chi tiết, bao gồm hướng dẫn mua sắm kỹ thuật số gia dụng, tự động hóa kiểm tra hướng dẫn tham quan và vệ sinh. Đồng thời, nhà thuốc JD cũng được coi là điểm đột phá cốt lõi, robot sẽ tham gia vào các nhiệm vụ độ chính xác cao như phân loại tự động, pha chế thuốc chính xác, khám phá phương án nhà thuốc thông minh không người lái.
Trước khi vào JD Mall, Qiānxún đã hoàn thành một vòng xác minh trong môi trường công nghiệp. "Xiǎo Mò" đã lên dây chuyền sản xuất pin năng lượng của CATL (Contemporary Amperex Technology Co. Limited - Ningde时代), đảm nhận kiểm tra chức năng cuối cùng trước khi xuống xe. Tính đến nay, nó đã hoàn thành hơn 1000 thao tác cắm pin, tỷ lệ thành công ổn định trên 99%, nhịp độ công việc cũng tiệm cận trình độ công nhân lành nghề.
"Xiǎo Mò" đã lên dây chuyền sản xuất pin năng lượng
Embodied AI, trong ngắn hạn sẽ không đến lúc triển khai là phân thắng bại. Nhưng một xu hướng rõ ràng hơn đã xuất hiện — cạnh tranh, không còn chỉ là ai có nhiều dữ liệu hơn, mà chuyển hướng sang ai có thể thu thập dữ liệu场景 (scenario) thực tế hiệu quả hơn, và ai có thể xây dựng vòng lặp dữ liệu-mô hình vận hành tần suất cao hơn.
Sau khi hoàn thành bước nhảy định giá giai đoạn, Qiānxún Zhìnéng một mặt sẽ đặt cược vào khả năng tổng quát hóa của mô hình, một mặt tiếp tục phóng đại lợi thế quy mô dữ liệu, dùng phản hồi tần suất cao của thế giới thực, tăng tốc lặp lại mô hình.
Nhìn lại GPT-2 năm 2019, có lẽ không đáng nói, nhưng khi quy mô không ngừng mở rộng, lợi ích do năng lực tổng quát hóa mang lại nhanh chóng khuếch đại. Bây giờ, điểm uốn tương tự, đang tái diễn trong lĩnh vực robot.
Bài viết từ WeChat public account "Jīqì zhī xīn" (ID:almosthuman2014), tác giả: Sia











