Anh ấy vừa gọi được 2,7 tỷ USD, Lý Phi Phi cũng rót tiền đầu tư

marsbitXuất bản vào 2026-06-20Cập nhật gần nhất vào 2026-06-20

Tóm tắt

"Generalist AI", công ty khởi nghiệp trí tuệ thể hiện (embodied AI) do Pete Florence - cựu nhà khoa học nghiên cứu cốt cán của Google DeepMind và là một trong những người đặt nền móng cho kiến trúc mô hình VLA (Vision-Language-Action) - sáng lập, vừa huy động thành công 4 tỷ USD (tương đương 27 tỷ RMB) ở vòng gọi vốn mới, định giá 20 tỷ USD. Vòng đầu tư có sự tham gia của các tổ chức và cá nhân uy tín như NVentures (từ NVIDIA), NFDG, Bezos Expeditions, đồng sáng lập Xiaomi Lin Bin, người sáng lập Zoom Eric Yuan, và nhà khoa học nổi tiếng Fei-Fei Li. Mặc dù được coi là người tiên phong trong lĩnh vực "mô hình thế giới" (world model), Florence lại công khai phản đối việc dán nhãn này cho công ty mình. Triết lý của ông, chịu ảnh hưởng từ người thầy Russ Tedrake tại MIT, là ưu tiên "mục tiêu" cụ thể hơn các "nhãn" công nghệ chung chung. Mục tiêu tối thượng của Generalist AI là tạo ra những robot đa năng có thể thực hiện với độ tin cậy cực cao nhiều nhiệm vụ chưa từng thấy mà không cần dữ liệu huấn luyện riêng cho từng tác vụ. Để hiện thực hóa điều này, Generalist AI đã lần lượt ra mắt các mô hình GEN-0 và GEN-1. GEN-1, được công bố vào tháng 4/2026, được huấn luyện trên hơn 50 nghìn giờ dữ liệu tương tác vật lý thu thập qua một thiết bị đeo tay đặc biệt. Theo công ty, mô hình này đạt tỷ lệ thành công 99% trong một số nhiệm vụ thao tác lặp lại và tinh vi (như gấp hộp, đóng gói), với tốc độ nhanh gấp ba lần GEN-0 và chỉ cần khoảng một giờ để thích ứng với tác vụ mới. Thành tựu nà...

Trong thị trường đầu tư mạo hiểm hiện nay, "Mô hình Thế giới" (World Model) chắc chắn là từ khóa nổi bật nhất. Hầu như ngày nào chúng ta cũng thấy một công ty "Mô hình Thế giới" mới hoàn thành vòng gọi vốn, định giá tăng mạnh, danh sách cổ đông đẳng cấp. Và trong các thông cáo báo chí về tin tức gọi vốn này, mọi người còn thường xuyên nhấn mạnh một thực tế: Một siêu trí tuệ nhân tạo đủ tiêu chuẩn không nên chỉ dựa vào việc 'nuôi' dữ liệu để có được khả năng, mà phải hiểu về thế giới vật lý một cách chủ động như con người.

Nhưng Pete Florence sau khi khởi nghiệp lại viết một bức thư ngỏ dài, ngay từ đầu đã viết: "Đừng dán nhãn Mô hình Thế giới cho công ty của tôi."

Điều này thật sự trái khoáy. Bởi vì Pete Florence không chỉ đơn giản là một "nhà khởi nghiệp". Trước khi khởi nghiệp, Pete Florence đã làm việc trong nhóm Google DeepMind, từ một nhà nghiên cứu thông thường thăng tiến lên thành Nhà khoa học Nghiên cứu Cấp cao. Mô hình điều khiển robot Gemini Robotics mà DeepMind ra mắt vào năm 2025, Pete Florence chính là một trong những nhà phát triển cốt lõi nhất. Tuy nhiên, thành tựu có ảnh hưởng nhất của anh trong thời gian này là vào năm 2023, cùng với các đồng nghiệp, đã giới thiệu với thế giới một kiến trúc mô hình robot hoàn toàn mới: "Vision-Language-Action Models" (Mô hình Thị giác-Ngôn ngữ-Hành động).

(Pete Florence, Nguồn: Mạng xã hội)

Đúng vậy, nếu nói rằng hiện nay "Mô hình Thế giới" hay "VLA" là hướng đi tiên phong nhất, có được sự đồng thuận cao nhất, thì Pete Florence chính là người tiên phong xứng đáng trên con đường này. Một người như vậy lại dẫn đầu việc vứt bỏ nhãn "Mô hình Thế giới", quả thực là một cú sốc.

Và bây giờ, cú sốc còn tăng gấp bội. Gần đây, công ty trí tuệ thể hiện (embodied AI) Generalist AI do Pete Florence sáng lập đã hoàn thành một vòng gọi vốn mới, với tổng quy mô 4 tỷ USD (khoảng 27 tỷ nhân dân tệ), định giá 20 tỷ USD (khoảng 135,5 tỷ nhân dân tệ). Các nhà đầu tư vòng này bao gồm NVentures thuộc sở hữu của NVIDIA, các nhà đầu tư thiên thần nổi tiếng Nat Friedman và Daniel Gross cùng quản lý quỹ NFDG, văn phòng gia đình Bezos Expeditions của Jeff Bezos, đồng sáng lập Xiaomi Lâm Bân, nhà sáng lập Zoom Viên Trưng, và nhà khoa học tiêu biểu nhất trong lĩnh vực Mô hình Thế giới - Lý Phi Phi.

"Mục tiêu" quan trọng hơn "Nhãn mác"

Tại sao với tư cách là một trong những người đặt nền móng chính cho Mô hình Thế giới, Pete Florence lại phản đối việc bị dán nhãn "Mô hình Thế giới" đến vậy? Tại sao Lý Phi Phi, với tư cách là học giả tiêu biểu nhất trong lĩnh vực Mô hình Thế giới, lại dùng tiền thật để ủng hộ một người dị giáo công khai "ly kinh bạn đạo" như vậy? Câu chuyện có lẽ phải bắt đầu từ năm 2019.

Vào thời điểm đó, Pete Florence đang theo học Tiến sĩ Khoa học Máy tính tại Học viện Công nghệ Massachusetts (MIT), nghiên cứu chính về lĩnh vực điều khiển robot, thị giác máy tính và xử lý ngôn ngữ tự nhiên - xét về xuất thân này, Pete Florence có thể coi là "chính thống", hướng nghiên cứu chính thống, nền tảng học thuật cũng chính thống, không phải là một "giang hồ nhi nữ" cần dựa vào "đặc lập đặc hành" để tranh giành tài nguyên. Nhưng vấn đề là, MIT lại phân cho anh một người cố vấn tên là Russ Tedrake.

Russ Tedrake là ai? Trước hết, ông ấy chắc chắn là một học giả lớn. Vào năm 2019, ông đồng thời đảm nhận vị trí Giáo sư ngành Kỹ thuật Điện và Khoa học Máy tính tại MIT, Giám đốc Trung tâm Robot thuộc Phòng thí nghiệm Khoa học Máy tính và Trí tuệ Nhân tạo. Mỗi năm đến cuộc thi DARPA Robotics Challenge nổi tiếng, ông còn phụ trách dẫn dắt đội tuyển MIT tham gia. Bên ngoài trường học, ông còn kiêm nhiệm Phó Chủ tịch Trung tâm Nghiên cứu Robot của Viện Nghiên cứu Toyota. Có thể nói, Russ Tedrake là một trong những học giả hàng đầu trong lĩnh vực robot, có đủ nguồn lực để giúp Pete Florence trẻ tuổi hiện thực hóa giấc mơ học thuật của mình.

Tuy nhiên, trong nhận thức bản thân của Russ Tedrake, thứ khiến ông say mê không phải là mã lập trình, mà là "vật lý". Trong một bài giới thiệu về bản thân, Russ Tedrake hồi tưởng rằng, lý do ông bước vào con đường học thuật khoa học máy tính, tất cả bắt nguồn từ khi nghiên cứu "robot đứng thẳng hai chân", ông đã nhìn thấy "các đặc tính động lực học phong phú", khiến ông nảy sinh hứng thú sâu sắc với "điều khiển động lực học chất lưu phức tạp". Do đó, so với các nhà nghiên cứu khác khi mới vào nghề, thường đầu tiên sẽ nghiên cứu cách để robot bắt táo, gấp chăn, thì ông đầu tiên nghiên cứu đề tài là cách điều khiển "máy bay sau khi mất tốc độ hoặc máy bay vỗ cánh", cách "xuyên qua chướng ngại vật dày đặc với tốc độ cao".

Bối cảnh như vậy, đã định sẵn Russ Tedrake rất coi trọng việc "hiểu thế giới vật lý". Trang web chính thức của MIT giới thiệu đặc điểm học thuật của Russ Tedrake như sau: "Trọng tâm nghiên cứu của giáo sư này là tìm kiếm các giải pháp điều khiển tinh tế cho các hệ thống động lực thú vị (thiếu lái, ngẫu nhiên và/hoặc khó mô hình hóa), và có thể xây dựng các hệ thống này để kiểm chứng thực nghiệm. Ông đặc biệt quan tâm đến mối liên hệ giữa cơ học (đặc biệt là cơ học không trơn) với lý thuyết học máy/tối ưu hóa, từ đó đạt được thiết kế điều khiển mạnh mẽ cho các hệ thống cơ khí phức tạp."

Pete Florence chịu ảnh hưởng, đương nhiên cũng trở thành "phái vật lý" trong khoa học máy tính. Ví dụ, thành tựu học thuật tiêu biểu nhất trong thời gian làm tiến sĩ, là một bài báo có tiêu đề "Self-supervised Correspondence in Visual Motor Policy Learning" (Tương quan tự giám sát trong học chính sách vận động thị giác). Bài báo này đề xuất rằng, họ đã tìm ra một phương pháp thông qua học bắt chước, có thể để robot chỉ với 50 lần trình diễn là hoàn thành các nhiệm vụ thao tác đầy thách thức, còn có thể khái quát hóa cho các đối tượng thuộc các loại khác nhau, thích ứng với cấu hình của vật thể biến dạng. Bài báo này cũng nhờ đó giành được Giải thưởng Bài báo Xuất sắc Nhất năm 2020 của IEEE (Hiệp hội Kỹ sư Điện và Điện tử Quốc tế) trong lĩnh vực Robot và Tự động hóa.

Tất nhiên, thuộc về "phái" nào không quan trọng, quan trọng là Pete Florence dưới sự ảnh hưởng của môi trường như vậy, đã có được cách tư duy khác biệt. Nhiều nhà nghiên cứu quen với việc dựa trên công nghệ hiện có, sau đó thông qua thực nghiệm để suy ra khả năng của công nghệ, cuối cùng mới xác định kịch bản ứng dụng của công nghệ. Trong khi Pete Florence tin rằng trình tự đúng nên là "đầu tiên thiết lập mục tiêu cụ thể", sau đó mới thiết kế con đường công nghệ.

Sau khi gia nhập nhóm Google DeepMind, Pete Florence chính là đi theo hướng này để triển khai công việc của mình, tác phẩm tiêu biểu đầu tiên là kiến trúc mô hình robot thế hệ đầu tiên Transporter Network do Google ra mắt năm 2021. Trong bài báo công bố mô hình, Pete Florence nói rằng sắp xếp đồ vật vốn dĩ phải là một kỹ năng rất cơ bản, nhưng đối với robot, hoàn thành động tác này có nghĩa là "suy luận nhận thức cấp cao và cấp thấp", cần phải xem xét xem sách nên đặt ở đâu, và xếp chồng theo thứ tự nào, đồng thời còn phải đảm bảo các mép sách thẳng hàng với nhau, tạo thành chồng sách gọn gàng.

Transporter Network chính là kiến trúc mô hình được ra mắt nhằm mục đích "làm cho các động tác đơn giản trở nên dễ dàng", có thể để robot hoàn thành các thao tác khác nhau một cách phổ quát dựa trên thị giác, tốc độ huấn luyện nhanh, sự phụ thuộc vào môi trường huấn luyện cũng thấp hơn.

Việc cùng nhóm DeepMind ra mắt kiến trúc VLA vào năm 2023, cũng chính là "xuôi dòng nước đẩy thuyền" dựa trên tư duy này. Trong bài báo mở ra thời kỳ thịnh vượng của Mô hình Thế giới ngày nay, các tác giả cho biết họ hy vọng kiến trúc VLA có thể "nâng cao đáng kể khả năng khái quát hóa cho các đối tượng mới, có thể giải thích các chỉ dẫn chưa xuất hiện trong dữ liệu huấn luyện robot (ví dụ như đặt vật thể lên một con số hoặc biểu tượng cụ thể), và có thể thực hiện suy luận cơ bản dựa trên chỉ dẫn của người dùng (ví dụ như nhặt vật thể nhỏ nhất hoặc lớn nhất, hoặc nhặt vật thể gần nhất với vật thể khác)".

Quay lại câu hỏi ban đầu, với tư cách là một trong những người đặt nền móng chính cho Mô hình Thế giới, tại sao Pete Florence lại phản đối việc bị dán nhãn "Mô hình Thế giới" đến vậy? Câu trả lời cũng như vậy: Pete Florence cho rằng "mục tiêu" quan trọng hơn "nhãn mác".

Theo quan điểm của anh, nhiệt tình hiện nay về Mô hình Thế giới, thực chất là kiểu "dẫn dắt bởi lý niệm", ví dụ như khá nhiều nhiệt tình có thể quy về sự phấn khích của thị trường vốn khi phát hiện ra sự không đồng thuận trong một hướng đi nóng. Và nếu thực sự muốn thúc đẩy robot bước vào công việc và cuộc sống của chúng ta, tạo ra năng suất lao động, thì việc xây dựng "Mô hình Thế giới" rõ ràng không phải là một mục tiêu. Mục tiêu thực sự thực chất nên là robot có thể hoàn thành các loại nhiệm vụ chưa từng thấy với tỷ lệ thành công và tốc độ cực cao, và hoàn toàn không cần bất kỳ dữ liệu cụ thể cho nhiệm vụ nào.

Và đây cũng chính là lý do Pete Florence quyết định rời Google DeepMind để khởi nghiệp độc lập. Tại hội nghị GTC của NVIDIA năm 2025, Pete Florence lần đầu tiên xuất hiện trước mắt mọi người với tư cách là Đồng sáng lập kiêm Giám đốc điều hành của Generalist AI. Anh nói: "Chúng tôi quyết tâm tạo ra những robot có thể làm bất cứ việc gì... Hãy thử tưởng tượng, nếu chi phí biên của lao động chân tay giảm xuống bằng 0, thì đó sẽ là một cảnh tượng như thế nào."

Tỷ lệ thành công 99%

Ngoài việc "ly kinh bạn đạo" về mặt lý niệm công nghệ, con đường khởi nghiệp của Pete Florence cũng tỏ ra không chính thống.

Về lý thuyết, một nhà khởi nghiệp có lý lịch như vậy, trong hoàn cảnh hiện nay chắc chắn sẽ nhận được sự săn đón nồng nhiệt của các VC. Yann LeCun, Ilya Sutskever, Mira Murati đều là ví dụ, công ty vừa đăng ký thành lập (thậm chí chưa đăng ký) đã hoàn thành vòng hạt giống hơn 10 tỷ USD. Nhưng Generalist AI của Pete Florence trong giai đoạn khởi đầu chỉ nhận đầu tư từ một số ít tổ chức như NVIDIA, văn phòng gia đình Bezos, NFDG. Nếu không phải bộ phận đầu tư mạo hiểm NVentures của NVIDIA tổ chức một buổi "tọa đàm các công ty trong danh mục đầu tư" tại hội nghị GTC năm 2025, mọi người đều không biết người này đã nghỉ việc khởi nghiệp.

Tại sao lại như vậy? Câu trả lời khả dĩ nhất, chính là sự lựa chọn chủ động của Pete Florence. Như đã đề cập ở trên, Pete Florence sau khi tốt nghiệp đã vào nhóm Google DeepMind, từ năm 2019 làm đến năm 2025, giữa chừng không có lý lịch làm việc nào khác. Tức là, Generalist AI là lần khởi nghiệp đầu tiên trong đời anh, hoàn toàn cần thiết phải thận trọng hơn nữa.

Trên thực tế, tại hội nghị GTC của NVIDIA năm 2025, lần đầu tiên xuất hiện công khai với tư cách nhà khởi nghiệp, Pete Florence đã thể hiện rất trực quan sự "thận trọng" của mình. Ngoài việc nói với mọi người rằng mình đang chế tạo "robot", anh không tiết lộ bất kỳ hướng đi kinh doanh cụ thể nào, trực tiếp nói rằng "chúng tôi hiện vẫn đang trong trạng thái bí mật".

Mãi đến tháng 11 năm 2025, mọi người mới lần đầu nhìn thấy hoạt động kinh doanh cụ thể của Generalist AI. Tháng 11 năm 2025, Generalist AI ra mắt mô hình trí tuệ thể hiện thế hệ đầu tiên của họ là GEN-0. Trong phần giới thiệu chính thức, Generalist AI cho biết GEN-0 kết hợp ưu thế của mô hình thị giác và mô hình ngôn ngữ, đồng thời hoàn thành bước đột phá vượt bậc - Gen-0 có thể nắm bắt khả năng phản xạ và kiến thức vật lý ở cấp độ con người.

Nói một cách đơn giản, nó có thể tiếp tục nâng cao khả năng khi quy mô mô hình và dữ liệu huấn luyện tăng lên, vượt qua điểm tắc nghẽn của các mô hình nhỏ trước đây; nó có thể vừa suy nghĩ vừa hành động như con người, phản ứng nhanh chóng và tự nhiên trong môi trường vật lý thực tế; nó tương thích tự nhiên với các loại robot khác nhau, không cần cải tạo thêm; quan trọng hơn, nó dựa trên lượng lớn dữ liệu thao tác thực tế, không còn bị hạn chế bởi sự thiếu hụt dữ liệu, và thông qua việc điều chỉnh linh hoạt cấu thành dữ liệu huấn luyện. Nhiều phương tiện truyền thông công nghệ chỉ ra rằng, GEN-0 chứng minh rằng "quy luật mở rộng" toán học thúc đẩy các mô hình ngôn ngữ lớn như ChatGPT cũng áp dụng được cho vận động vật lý.

Tuy nhiên, GEN-0 không phải là hoàn hảo. Ví dụ, GEN-0 cũng không giải quyết được vấn đề tập dữ liệu làm phiền lĩnh vực trí tuệ thể hiện. Do đó, đến tháng 4 năm 2026, Generalist AI nhanh chóng lặp phiên bản lên GEN-1 hoàn toàn mới.

(“Bàn tay cơ khí”, Nguồn: Mạng xã hội Generalist AI)

Để giải quyết vấn đề tập dữ liệu, Generalist AI đã phát triển một thiết bị đeo được, dùng để thu thập các chuyển động nhỏ và thông tin thị giác khi con người thực hiện các nhiệm vụ thủ công. Generalist AI cho biết trong quá trình phát triển GEN-1, họ đã thu thập hơn 500.000 giờ "dữ liệu tương tác vật lý cấp PB" thông qua đôi bàn tay cơ khí này, để huấn luyện mô hình vật lý của họ. Sau khi được huấn luyện đầy đủ, Generalist AI cho biết GEN-1 đạt tỷ lệ thành công cao tới 99% trong các nhiệm vụ cơ khí lặp đi lặp lại nhưng tinh tế như gấp hộp carton, đóng gói điện thoại và bảo trì robot hút bụi, tốc độ khoảng gấp ba lần so với mẫu GEN-0 thế hệ trước, và chỉ mất khoảng một giờ đồng hồ để đạt được mục tiêu này.

Từ đó, Generalist AI tự hào tuyên bố, mô hình vật lý của GEN-1 đã tiệm cận điểm uốn tương tự như GPT-3, hiệu suất của một số nhiệm vụ bắt đầu "đạt đến mức độ cần thiết để triển khai trong môi trường thương mại thực tế", và "chúng ta có thể kỳ vọng mỗi thế hệ mô hình mới sẽ mang đến một loạt nhiệm vụ mới ngày càng phức tạp, những nhiệm vụ này đều có thể được nắm vững".

Trong blog chính thức, Pete Florence chỉ ra rằng, quá trình phát triển GEN-1 là sự diễn giải tốt nhất cho lý niệm công nghệ cá nhân của anh: Đầu tiên, anh đặt ra một mục tiêu hợp lý, đó là robot có thể hoàn thành các loại nhiệm vụ chưa từng thấy với tỷ lệ thành công và tốc độ cực cao, và hoàn toàn không cần dữ liệu cụ thể cho nhiệm vụ nào. Sau đó, dựa trên mục tiêu này, anh đặt ra một con đường giải quyết, cho phép sử dụng một lượng nhỏ dữ liệu robot cho nhiệm vụ cụ thể (gọi là X), và đạt được mức độ thực thi cao cho nhiệm vụ đó, sau đó liên tục giảm X, đồng thời nâng cao hiệu suất.

Nói đến đây, câu hỏi chúng ta đặt ra trước đó cũng đã được trả lời. Sản phẩm do Generalist AI phát triển rốt cuộc có gọi là "Mô hình Thế giới" hay không đã không quan trọng nữa, chỉ cần bạn nhìn thấy ngành trí tuệ thể hiện, lạc quan về việc robot có thể quy mô lớn bước vào sản xuất thực tế, thì Generalist AI thực sự là lựa chọn đáng để đặt cược. Và vòng gọi vốn này của Generalist AI thực sự đã được thỏa thuận nhanh chóng trong vòng hai tháng sau khi GEN-1 ra mắt.

Theo báo cáo, các cổ đông cũ như NVIDIA, Bezos Expeditions, NDFG đều chọn đầu tư lại, và là đầu tư tăng gấp bội. Ngoài ra, các nhà đầu tư mới bao gồm đồng sáng lập Xiaomi Lâm Bân, nhà sáng lập Zoom Viên Trưng, nhà khoa học người Hoa Lý Phi Phi, cũng bao gồm các nhà đầu tư tổ chức như Radical Ventures, 8VC, Union Square Ventures, Hanabi Capital, Norwest.

Nói cách khác, Pete Florence của tháng 6 năm 2026 không cần phải chứng minh bản thân nữa. Ít nhất là những lời khoác lác anh từng nói những năm đó - ví dụ như Pete Florence mới khởi nghiệp năm 2025 từng nói trong một podcast: "Robot đa năng không phải là cái gì cũng nếm thử một chút, mà phải chuyên nghiệp đến mức đủ hữu ích trong các nhiệm vụ thực tế" - đang đi trên con đường "lần lượt hiện thực hóa".

Bài viết này đến từ tài khoản công chúng WeChat "Touzhongwang", tác giả: Bồ Phàm

Câu hỏi Liên quan

QTại sao Peter Florence phản đối việc dán nhãn 'Mô hình thế giới' (World Model) cho công ty của mình?

APeter Florence tin rằng 'mục tiêu' quan trọng hơn 'nhãn mác'. Ông cho rằng sự nhiệt tình hiện tại với World Model chủ yếu là do động lực từ ý tưởng và thị trường vốn. Mục tiêu thực sự của ông là tạo ra robot có thể hoàn thành mọi nhiệm vụ chưa từng thấy với tỷ lệ thành công và tốc độ cực cao, mà không cần dữ liệu cụ thể cho từng nhiệm vụ. Việc tập trung vào nhãn 'World Model' có thể làm lu mờ mục tiêu cốt lõi này.

QNhững nhà đầu tư chính nào tham gia vào vòng gọi vốn 4 tỷ USD (khoảng 27 tỷ RMB) của Generalist AI?

AVòng gọi vốn này có sự tham gia của nhiều nhà đầu tư nổi tiếng, bao gồm: NVentures (công ty con của NVIDIA), quỹ NFDG (được quản lý bởi Nat Friedman và Daniel Gross), Bezos Expeditions (văn phòng gia đình của Jeff Bezos), đồng sáng lập Xiaomi Lin Bin, người sáng lập Zoom Eric Yuan, và nhà khoa học nổi tiếng Lý Phi Phi (Fei-Fei Li). Các nhà đầu tư cũ như NVIDIA, Bezos Expeditions và NFDG cũng tái đầu tư với số tiền lớn hơn.

QMô hình GEN-1 của Generalist AI đạt được những tiến bộ đáng kể nào so với GEN-0?

AGEN-1 đã giải quyết vấn đề về bộ dữ liệu bằng cách sử dụng một thiết bị đeo tay để thu thập hơn 50 triệu giờ dữ liệu tương tác vật lý. Kết quả là, GEN-1 đạt tỷ lệ thành công 99% trong các nhiệm vụ lặp lại nhưng tinh vi (gập hộp carton, đóng gói điện thoại), với tốc độ nhanh gấp ba lần GEN-0 và chỉ mất khoảng một giờ để đào tạo cho một nhiệm vụ mới. Điều này cho thấy khả năng ứng dụng thương mại của nó.

QẢnh hưởng từ người cố vấn Russ Tedrake đã định hình tư duy kỹ thuật của Peter Florence như thế nào?

ARuss Tedrake, một chuyên gia hàng đầu về robot với niềm đam mê 'vật lý', đã truyền cho Peter Florence cách tiếp cận 'hiểu thế giới vật lý'. Điều này khiến Florence phát triển một phương pháp luận khác biệt: thay vì bắt đầu từ công nghệ rồi tìm ứng dụng, ông tin vào việc 'đặt mục tiêu cụ thể trước', sau đó mới thiết kế con đường kỹ thuật để đạt được nó. Triết lý 'mục tiêu trên nhãn mác' của ông bắt nguồn từ đây.

QMục tiêu cuối cùng mà Peter Florence và Generalist AI hướng tới là gì?

AMục tiêu tối thượng của họ là tạo ra những robot đa năng (generalist robot) có thể thực hiện bất kỳ công việc thể chất nào, từ đó giảm chi phí biên của lao động chân tay xuống gần bằng 0. Họ hình dung về một tương lai nơi robot có thể triển khai rộng rãi trong sản xuất và đời sống, thực hiện các nhiệm vụ phức tạp, chưa từng thấy một cách đáng tin cậy và hiệu quả mà không cần lập trình hoặc đào tạo riêng cho từng tác vụ.

Nội dung Liên quan

Báo cáo Ethereum Q1 2026: Phí giảm, người dùng và khối lượng giao dịch lập kỷ lục mới

Báo cáo Q1/2026 của Ethereum cho thấy một xu hướng đối lập: lượng người dùng, số giao dịch và thông lượng mạng lưới đều đạt mức cao kỷ lục, trong khi phí giao dịch, tổng giá trị bị khóa (TVL), khối lượng giao dịch và vốn hóa pha loãng hoàn toàn (FDV) của ETH lại giảm. Hiện tượng này được giải thích là "Nghịch lý Jevons": việc giảm chi phí sử dụng mạng lưới sau đợt nâng cấp Fusaka đã giải phóng nhu cầu, thúc đẩy tăng trưởng quy mô. Báo cáo nhấn mạnh sự chuyển dịch trong định vị cốt lõi của Ethereum từ một blockchain DeFi sang một tầng thanh toán tài chính toàn cầu. Ethereum tiếp tục thống trị thị trường tài sản được mã hóa, chiếm phần lớn thị phần trong các lĩnh vực stablecoin (61,8%), quỹ được mã hóa (73%), hàng hóa được mã hóa (84%) và cổ phiếu được mã hóa. Sự tham gia của các tổ chức lớn như BlackRock, JPMorgan và Fidelity đang đẩy nhanh quá trình "thể chế lên chuỗi". Mặc dù phí giao dịch tầng cơ sở giảm mạnh (-47,9%), đây được xem là một sự đánh đổi có chủ đích để đổi lấy tăng trưởng mạng lưới dài hạn. Chiến lược này nhằm củng cố vị thế là nền tảng định sẵn cho việc thanh toán và quyết toán các tài sản tài chính ngày càng được mã hóa, từ đó tạo ra giá trị cơ bản cho ETH thông qua nhu cầu sử dụng mạng lưới.

marsbit1 giờ trước

Báo cáo Ethereum Q1 2026: Phí giảm, người dùng và khối lượng giao dịch lập kỷ lục mới

marsbit1 giờ trước

Mất hai huyền thoại trong ba ngày: Con đập nhân tài AI của Google đang vỡ?

Chỉ trong ba ngày, Google đã chứng kiến hai huyền thoại AI rời đi: Noam Shazeer (đồng tác giả Transformer, lãnh đạo Gemini) gia nhập OpenAI, và John Jumper (người đoạt giải Nobel Hóa học 2024, lãnh đạo AlphaFold) chuyển sang Anthropic. Đây không phải là trường hợp cá biệt mà là một xu hướng rõ ràng, bổ sung cho việc cựu thành viên sáng lập OpenAI Andrej Karpathy gia nhập Anthropic trước đó. Các tài năng AI hàng đầu đang tập trung ngày càng nhiều vào OpenAI và Anthropic, khiến Google trở thành nguồn cung cấp chính trong cuộc tái cấu trúc nhân tài này. Sự dịch chuyển này bắt nguồn từ sự khác biệt cốt lõi về sứ mệnh. Google, với doanh thu chính phụ thuộc vào quảng cáo, thường đặt các dự án AI trong khuôn khổ phục vụ mục tiêu sản phẩm và lợi nhuận. Ngược lại, OpenAI (với sứ mệnh AGI) và Anthropic (tập trung vào AI an toàn) cho phép các nhà nghiên cứu tập trung hoàn toàn vào việc đẩy xa giới hạn năng lực mô hình. Ngoài ra, cơ hội thu lợi nhuận lớn từ cổ phiếu trước thềm IPO của hai công ty này là động lực hấp dẫn mà Google - một gã khổng lồ trưởng thành - khó có thể sánh được. Việc sáp nhập Google Brain và DeepMind vào năm 2023 cũng tạo ra những lực ly tâm mới, làm xói mòn văn hóa nghiên cứu dài hạn dưới áp lực phải phù hợp với lộ trình sản phẩm. Sự ra đi của các nhân vật then chốt như Jumper và Shazeer phản ánh điều này. Cuộc khủng hoảng nhân tài này mang tính cấu trúc. Google có thể sở hữu cơ sở hạ tầng máy tính khổng lồ và kho dữ liệu đồ sộ, nhưng việc thiếu những bộ óc xuất sắc nhất để khai thác chúng khiến lợi thế đó trở nên vô nghĩa. Trong khi OpenAI và Anthropic củng cố vị thế với đội ngũ tinh nhuệ ngày càng mạnh, Google đang mất dần hào quang là trung tâm hấp dẫn nhân tài AI toàn cầu. Trong cuộc đua mà mật độ tài năng quyết định năng lực mô hình và thị phần, đây là một thách thức tồn vong thầm lặng nhưng nghiêm trọng của Google.

marsbit3 giờ trước

Mất hai huyền thoại trong ba ngày: Con đập nhân tài AI của Google đang vỡ?

marsbit3 giờ trước

Phía sau bảng điểm AI, ẩn giấu một 'người ra đề' gốc Hoa

Mỗi khi một mô hình AI tiên tiến ra mắt, giới công nghệ lại dõi theo những “bảng điểm” quen thuộc như MMLU-Pro, MMMU hay MMMU-Pro. Đây là các tiêu chuẩn đánh giá quan trọng giúp so sánh năng lực của các mô hình lớn như GPT, Claude hay Gemini. Tuy nhiên, ít người biết rằng đằng sau những bộ đề thi này là một nhà nghiên cứu người Hoa: Chen Wenhu (Trần Văn Hổ), trợ lý giáo sư tại Đại học Waterloo, Canada. Ông cùng phòng thí nghiệm TIGERLab (còn gọi là Hổ Đầu Bang) đã tạo ra MMLU-Pro vào năm 2024 để giải quyết vấn đề “mất chuẩn” của bộ đánh giá MMLU cũ, khi nhiều mô hình tiên tiến đạt điểm gần tuyệt đối, khó phân biệt được sự khác biệt thực sự. MMLU-Pro với hơn 12.000 câu hỏi, mở rộng lựa chọn và tăng cường các câu đòi hỏi suy luận, đã giúp kéo giãn khoảng cách điểm số và đánh giá ổn định hơn. Trước đó, nhóm của Chen Wenhu cũng phát triển MMMU - bộ đánh giá đa phương thức (multimodal) yêu cầu mô hình kết hợp hiểu biết hình ảnh, biểu đồ với kiến thức chuyên môn để trả lời câu hỏi. Ngay cả các mô hình mạnh nhất thời điểm đó như GPT-4V cũng chỉ đạt độ chính xác khoảng 56%. Phiên bản MMMU-Pro sau này được thiết kế để đảm bảo mô hình không thể “bỏ qua” thông tin hình ảnh mà chỉ dựa vào văn bản để đoán đáp án. Nghiên cứu của Chen Wenhu tập trung vào việc hiểu thông tin phức tạp, hỏi đáp tri thức và suy luận. Ông từng làm việc tại Google Research và DeepMind, tham gia vào dự án Gemini, trước khi gia nhập Đại học Waterloo và thành lập TIGERLab. Phòng thí nghiệm không chỉ tạo ra các bộ đánh giá mà còn nghiên cứu phát triển mô hình, chẳng hạn trong lĩnh vực xử lý video. Hiện tại, Chen Wenhu làm việc tại Phòng thí nghiệm Siêu trí tuệ (Super Intelligent Lab) của Meta, tiếp tục tập trung vào dữ liệu huấn luyện và đánh giá đa phương thức. Công việc của ông và nhiều nhà nghiên cứu người Hoa khác đang đóng góp quan trọng vào sự phát triển chung của ngành AI, dù có thể không nằm dưới ánh đèn sân khấu.

marsbit3 giờ trước

Phía sau bảng điểm AI, ẩn giấu một 'người ra đề' gốc Hoa

marsbit3 giờ trước

Thư gửi các nhà sáng lập từ Alliance: Viết vào thời điểm Cursor được bán với giá 600 tỷ USD

Ngồi trước máy tính, bạn nảy ra ý tưởng khởi nghiệp. Bạn thấy Cursor được bán với giá 600 tỷ USD cho Elon Musk. Bạn tự hỏi: Tại sao mình không thể làm được điều tương tự? Hầu hết các nhà sáng lập đều bắt đầu từ đây, nhưng cũng chính tại đây, họ thường bị mắc kẹt. Họ nhìn thấy AI, tiền điện tử, hàng nghìn công ty khởi nghiệp đã được tài trợ và kết luận: Cơ hội đã cạn kiệt. Họ từ bỏ. Đây là lý do nhiều ý tưởng thất bại - không phải do năng lực, mà do họ nghĩ trò chơi đã kết thúc. Hãy nhìn Cursor. Năm 2022, trước cả ChatGPT, họ bắt đầu với niềm tin rằng AI sẽ thay đổi công việc tri thức. Họ tập trung vào ba điều: lĩnh vực họ đam mê (AI), trở thành khách hàng của chính sản phẩm, và tập trung không lay chuyển vào người dùng nặng. Đây không phải là câu chuyện duy nhất. Stripe, Figma, Shopify đều đi theo mô hình tương tự: bắt đầu với một niềm tin phi đồng thuận về tương lai, kiên trì xây dựng nhiều năm trước khi tương lai đó trở nên hiển nhiên với tất cả. Câu hỏi quan trọng: Bạn đang ở giai đoạn nào của chu kỳ công nghệ? Nếu tham gia sớm như Coinbase hay Cursor, cơ hội nằm ở việc làm cho công nghệ mới trở nên khả dụng cho người dùng nặng. Nếu tham gia ở giai đoạn sau, cơ hội thường là tìm ra "mặt âm" - điểm mù mà thế hệ đầu tiên bỏ sót, giống như Stripe so với PayPal hay Shopify so với Amazon. Vậy bạn làm gì khi chưa có sự hiểu biết sâu sắc? Hãy đắm mình vào thị trường. Dùng mọi sản phẩm trong lĩnh vực. Trở thành người dùng nặng. Nói chuyện với khách hàng. Khi làm điều này đủ lâu, bạn sẽ ngừng tìm kiếm ý tưởng và bắt đầu nhận thấy chúng ở khắp mọi nơi. Khi có ý tưởng, hãy tự hỏi: Đây có phải là cải tiến gấp mười lần hoặc một "cơn đau nhức nhối" cần giải quyết ngay lập tức? Nếu không, đừng phí công. Mọi người chỉ chuyển đổi khi thứ gì đó tốt hơn rất nhiều hoặc nỗi đau đủ lớn. Khi xây dựng MVP, hãy tập trung vào câu hỏi cốt lõi: Tại sao ai đó từ bỏ công cụ hiện tại để dùng sản phẩm của bạn? Các công ty khởi nghiệp vĩ đại hiếm khi bắt người dùng học hành vi mới. Họ tìm cách cải thiện đáng kể quy trình quen thuộc. Chuyển đổi càng ít ma sát, giá trị tạo ra càng cao, thì tốc độ áp dụng càng nhanh. Đừng đánh giá thấp kênh phân phối. Kênh phân phối thường là hào rào cạnh tranh. Trước khi đạt được Sự Phù Hợp Sản Phẩm-Thị Trường (PMF), bạn cần Sự Phù Hợp Kênh Phân Phối-Thị Trường. Các nhà sáng lập giỏi không chỉ xây sản phẩm, họ xây dựng cỗ máy phân phối. Cuối cùng là sự kiên cường, khả năng thích ứng và không bao giờ bỏ cuộc. Không ai có thể dạy bạn điều này. Nó chỉ đến từ trải nghiệm. Cursor, Airbnb, Nvidia, Rain - tất cả đều trải qua những giai đoạn khó khăn tưởng chừng như vô vọng. Bài học không phải là họ thông minh hơn, mà là họ kiên trì đủ lâu để sự hiểu biết của họ sinh lãi kép. Vậy, hãy tìm kiếm sự chuyển đổi chu kỳ công nghệ. Nuôi dưỡng những hiểu biết độc đáo. Ám ảnh với thị trường của bạn. Nói chuyện với khách hàng. Tìm ra những cơn đau nhức nhối. Tạo điểm tiếp cận đơn giản nhất có thể. Chinh phục kênh phân phối của riêng bạn. Và quan trọng nhất, đừng bao giờ bỏ cuộc khi mọi thứ trở nên khó khăn. Không có bí mật nào cả. Hầu hết mọi người không thể làm những điều này một cách nhất quán và lâu dài. Một số ít những người làm được, cuối cùng sẽ xây dựng nên những công ty vĩ đại mà thế hệ nhà sáng lập tiếp theo sẽ nghiên cứu. Thế giới là của bạn. Hãy ra ngoài và sáng tạo.

marsbit3 giờ trước

Thư gửi các nhà sáng lập từ Alliance: Viết vào thời điểm Cursor được bán với giá 600 tỷ USD

marsbit3 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片