Giới đầu tư được biết, công ty mô hình thế giới FaceMind mới đây đã hoàn thành vòng gọi vốn Pre-A trị giá hàng chục triệu nhân dân tệ, nhà đầu tư là Xinglian Capital, cổ đông cũ 360 tiếp tục đầu tư thêm với số tiền vượt mức.
Được biết, vòng gọi vốn mới của FaceMind đang được thúc đẩy, các cố vấn tài chính như Shendu Capital sẽ đảm nhiệm vai trò FA, hiện đã có một số tổ chức đầu tư bày tỏ ý định đầu tư.
Đây là một công ty AI trẻ. Người cầm lái Lục Hoằng Viễn, sinh năm 1995, thành lập FaceMind khi còn đi học. Hai năm qua, công ty bắt đầu từ việc phát triển mô hình đa phương thức phía thiết bị đầu cuối, dần dần chuyển hướng sang mô hình thế giới ở tầng cơ sở hơn.
Khi AI thâm nhập vào màn hình, phần mềm và robot, việc hiểu thế giới đang trở thành chủ đề tiếp theo.
Dẫn dắt bởi tiến sĩ 9X
Một đội ngũ mô hình thế giới xuất hiện
Câu chuyện của FaceMind, bắt nguồn từ Lục Hoằng Viễn.
Nhà sáng lập sinh năm 1995, Lục Hoằng Viễn học cử nhân và thạc sĩ tại Đại học Imperial College London, nhận bằng tiến sĩ từ Phòng thí nghiệm Xử lý Ngôn ngữ Tự nhiên của Đại học Trung văn Hồng Kông, theo học Giáo sư Lâm Vĩ, nghiên cứu lâu dài về xử lý ngôn ngữ tự nhiên và cơ chế nền tảng của mô hình lớn. Trong thời gian làm tiến sĩ, anh đã công bố 14 bài báo đứng tên tác giả chính/tác giả liên lạc tại các hội nghị đỉnh cao, nhiều bài báo trở thành những bài được trích dẫn nhiều trong lĩnh vực.
Năm 2023, FaceMind được thành lập, ban đầu nhắm mục tiêu vào nghiên cứu và ứng dụng mô hình đa phương thức phía thiết bị đầu cuối.
Điều thực sự khiến giới ngoại giới chú ý đến họ, là cuộc thảo luận trước đây về việc "Mã Gia Kỳ khiến mô hình lớn gặp sự cố". Lúc đó, có một mô hình lớn có thể nói chính xác tiểu sử liên quan đến Mã Gia Kỳ, nhưng lại không thể ổn định xuất ra ba chữ "Mã Gia Kỳ". Một cái tên người bình thường, đã vô tình phơi bày vấn đề nền tảng khi mô hình lớn xử lý ngôn ngữ: trước khi văn bản đi vào mô hình, cần được cắt thành token; khi mô hình gặp phải từ tần suất thấp, tên người hiếm gặp, từ ngữ ngôn ngữ ít người dùng, khả năng hiểu và tạo ra có thể trở nên không ổn định.
Nhóm của Lục Hoằng Viễn đã chú ý đến vấn đề này sớm hơn. Năm 2025, họ công bố bài báo liên quan đến SLoW, thảo luận về cách từ tần suất thấp ảnh hưởng đến hiệu suất dịch của mô hình lớn; đến năm 2026, kết quả nghiên cứu bài báo Adam's Law của họ tiếp tục đẩy vấn đề lên cấp độ câu - cùng một ý nghĩa, diễn đạt càng có tần suất cao, càng phổ biến, thường càng dễ được mô hình xử lý và học hỏi hơn.
Điều bất ngờ hơn là, công nghệ liên quan đến bài báo này đã được Anthropic áp dụng, và còn được một nhà đầu tư của Anthropic like và repost trên X. Nhận định của một nhà nghiên cứu trẻ 9X Trung Quốc về quy luật nền tảng của mô hình lớn, từ đó được nhiều người thấy hơn.
Đi theo hướng này, FaceMind bắt đầu chuyển trọng tâm sang mô hình thế giới.
Nói đơn giản, mô hình ngôn ngữ lớn giỏi dự đoán đoạn văn bản tiếp theo, còn mô hình thế giới thì phải dự đoán điều gì sẽ xảy ra tiếp theo trong một môi trường. Áp vào màn hình, là GUI Agent (trợ lý thông minh giao diện người dùng đồ họa) hiểu trang web, tài liệu, nút bấm và ý định người dùng; áp vào lĩnh vực robot, là hiểu không gian, hành động và kết quả nhiệm vụ.
Hệ thống mô hình thế giới tự nghiên cứu của FaceMind, chính xoay quanh hướng đi này. Công ty cố gắng thông qua kiến trúc mô hình lặp tuần hoàn, hiệu quả tham số, nâng cao tính ổn định của mô hình trong dự đoán chuỗi thời gian dài, hiểu màn hình và nhiệm vụ hiện thân.
DieDieShe, là sân chơi kiểm chứng sớm cho khả năng này. Nhìn bề ngoài đây là một sản phẩm AI danmu (bình luận chạy), có thể dựa trên nội dung trang web, tài liệu, video hoặc trò chơi mà người dùng đang xem, tạo ra danmu tương tác theo thời gian thực. Nhìn sâu hơn, để GUI Agent hoàn thành nhiệm vụ, phải hiểu màn hình, hiểu cấu trúc trang, phán đoán vị trí nút bấm, dự đoán kết quả sau khi click. Mỗi lần chuyển trang, phản hồi nhập liệu và hoàn thành nhiệm vụ, đều đang cấu thành một loại dữ liệu mô hình thế giới mật độ cao.
Đây cũng là cơ hội mà FaceMind muốn nắm bắt: mô hình thế giới đang trở thành cửa ngõ nền tảng AI mới.
Xinglian Capital, 360 xuất tay
Chiến trường nóng nhất của hiện thân
Vòng gọi vốn mới nhất lộ diện.
Mới đây, FaceMind thông báo hoàn thành vòng gọi vốn PreA trị giá hàng chục triệu nhân dân tệ, vòng gọi vốn này không chỉ thu hút nhà đầu tư mới Xinglian Capital, mà còn nhận được khoản đầu tư bổ sung vượt mức từ cổ đông cũ 360.
Trưởng bộ phận đầu tư trước khi niêm yết của Tập đoàn 360, Hướng Kỳ Kỳ cho biết "Tiến sĩ Lục là một trong những nhà nghiên cứu AI trẻ tuổi xuất sắc nhất mà tôi từng gặp."
Theo ông, điều Lục Hoằng Viễn quan tâm không phải là tối ưu hóa cục bộ, mà là nguyên lý nền tảng và đổi mới kiến trúc mô hình. Khi ngành còn đang thảo luận về khái niệm mô hình thế giới, FaceMind đã huấn luyện mô hình thế giới từ con số không, và đạt được kết quả ở cấp độ SOTA ngành trên nhiều loại benchmarking. Sau đó, Adam's Law nhận được sự quan tâm và kiểm chứng từ nhà sản xuất mô hình hàng đầu nước ngoài Anthropic, kiến trúc vòng lặp Loop mới nhất mà đội ngũ đề xuất thì tiếp tục khám phá vấn đề huấn luyện chuỗi thời gian dài của mô hình thế giới.
"Tốc độ lặp đáng kinh ngạc. Trước mỗi lần trao đổi, tôi đều xem bài báo và báo cáo kỹ thuật mới nhất mà họ công bố trước." Hướng Kỳ Kỳ cảm thán, thực sự cảm nhận được thế nào là "một lần đầu tư, học tập suốt đời".
Đối tác của Xinglian Capital, Lý Văn Quyết cho biết, đặc điểm nổi bật nhất của đội ngũ FaceMind, là kết hợp cả năng lực nghiên cứu vững chắc và năng lực triển khai kỹ thuật phức tạp. Các thành viên cốt lõi của đội ngũ lâu dài đào sâu vào công nghệ nền tảng trí tuệ nhân tạo, vừa có thể hình thành phán đoán độc lập về hướng đi tiên phong, cũng có thể nhanh chóng đưa kết quả nghiên cứu vào kiểm chứng trong bối cảnh thực tế.
"Chúng tôi đánh giá cao một đội ngũ có mật độ nhân tài cao, phán đoán kỹ thuật có tầm nhìn xa, năng lực thực thi mạnh mẽ." Theo bà, Lục Hoằng Viễn trên người kết hợp cả khát vọng khám phá của nhà nghiên cứu trẻ và năng lực hành động của doanh nhân, có thể dẫn dắt đội ngũ tiếp tục thách thức các vấn đề khó, và chuyển hóa phán đoán kỹ thuật thành hướng phát triển rõ ràng. Đặc điểm nhà sáng lập và sức mạnh đoàn kết đội ngũ như vậy, là lý do quan trọng khiến Xinglian Capital quyết định đầu tư.
Một năm qua, mô hình thế giới trở thành từ khóa mới của ngành AI. Dưới sự náo nhiệt, sự phân kỳ cũng đang xuất hiện: cạnh tranh giai đoạn tiếp theo, rốt cuộc tiếp tục dựa vào dữ liệu và tham số lớn hơn, hay thông qua kiến trúc mới nâng cao hiệu quả sử dụng dữ liệu hạn chế của mô hình?
FaceMind đã chọn phương án sau.
Theo giới thiệu, đặc điểm cốt lõi của mô hình tự nghiên cứu của công ty là lặp tuần hoàn và hiệu quả tham số. Nói đơn giản, nó cố gắng để mô hình ở cùng quy mô tham số, có được khả năng dự đoán chuỗi thời gian dài và suy luận môi trường mạnh hơn. Công ty tiết lộ, hiệu suất mô hình cỡ 1B của họ đã sánh ngang với các mô hình mạnh cùng loại quốc tế, và đạt được cải thiện hiệu quả tham số.
Hiện tại, FaceMind đã bắt đầu đưa khả năng mô hình này vào kiểm chứng trong nhiều bối cảnh. Tài liệu cho thấy, khả năng mô hình thế giới của họ đã hoàn thành kiểm chứng trong môi trường hiện thân mô phỏng, môi trường GUI Agent và môi trường cánh tay robot thực. Hướng đến hạ nguồn, công ty có kế hoạch cung cấp cho các đối tác như nhà sản xuất robot bản thể, nền tảng nội dung, nhà sản xuất chip và đám mây, một bộ năng lực toàn diện từ kiểm chứng bối cảnh, huấn luyện mô hình, triển khai kiến trúc đến dịch vụ suy luận, tối ưu hóa liên tục.
Theo quan điểm của Lục Hoằng Viễn, cơ hội của mô hình thế giới sẽ mở ra cùng với GUI Agent và trí tuệ hiện thân. Khi đó, mô hình cạnh tranh ở chỗ có thể hiểu nhiệm vụ, dự đoán thay đổi, và ổn định hoàn thành hành động hay không. Sau khi hoàn thành gọi vốn, FaceMind sẽ tiếp tục đầu tư vào nghiên cứu và phát triển mô hình thế giới và kiểm chứng đa bối cảnh.
Một công ty trẻ, đang len lỏi vào bàn chơi cơ sở hạ tầng AI thế hệ tiếp theo.
Bài viết này đến từ tài khoản WeChat công cộng "Giới đầu tư AI", tác giả: Vương Lộ





