Anh ấy vừa gọi được 2,7 tỷ USD, Lý Phi Phi cũng rót tiền đầu tư

marsbitXuất bản vào 2026-06-20Cập nhật gần nhất vào 2026-06-20

Tóm tắt

"Generalist AI", công ty khởi nghiệp trí tuệ thể hiện (embodied AI) do Pete Florence - cựu nhà khoa học nghiên cứu cốt cán của Google DeepMind và là một trong những người đặt nền móng cho kiến trúc mô hình VLA (Vision-Language-Action) - sáng lập, vừa huy động thành công 4 tỷ USD (tương đương 27 tỷ RMB) ở vòng gọi vốn mới, định giá 20 tỷ USD. Vòng đầu tư có sự tham gia của các tổ chức và cá nhân uy tín như NVentures (từ NVIDIA), NFDG, Bezos Expeditions, đồng sáng lập Xiaomi Lin Bin, người sáng lập Zoom Eric Yuan, và nhà khoa học nổi tiếng Fei-Fei Li. Mặc dù được coi là người tiên phong trong lĩnh vực "mô hình thế giới" (world model), Florence lại công khai phản đối việc dán nhãn này cho công ty mình. Triết lý của ông, chịu ảnh hưởng từ người thầy Russ Tedrake tại MIT, là ưu tiên "mục tiêu" cụ thể hơn các "nhãn" công nghệ chung chung. Mục tiêu tối thượng của Generalist AI là tạo ra những robot đa năng có thể thực hiện với độ tin cậy cực cao nhiều nhiệm vụ chưa từng thấy mà không cần dữ liệu huấn luyện riêng cho từng tác vụ. Để hiện thực hóa điều này, Generalist AI đã lần lượt ra mắt các mô hình GEN-0 và GEN-1. GEN-1, được công bố vào tháng 4/2026, được huấn luyện trên hơn 50 nghìn giờ dữ liệu tương tác vật lý thu thập qua một thiết bị đeo tay đặc biệt. Theo công ty, mô hình này đạt tỷ lệ thành công 99% trong một số nhiệm vụ thao tác lặp lại và tinh vi (như gấp hộp, đóng gói), với tốc độ nhanh gấp ba lần GEN-0 và chỉ cần khoảng một giờ để thích ứng với tác vụ mới. Thành tựu nà...

Trong thị trường đầu tư mạo hiểm hiện nay, "Mô hình Thế giới" (World Model) chắc chắn là từ khóa nổi bật nhất. Hầu như ngày nào chúng ta cũng thấy một công ty "Mô hình Thế giới" mới hoàn thành vòng gọi vốn, định giá tăng mạnh, danh sách cổ đông đẳng cấp. Và trong các thông cáo báo chí về tin tức gọi vốn này, mọi người còn thường xuyên nhấn mạnh một thực tế: Một siêu trí tuệ nhân tạo đủ tiêu chuẩn không nên chỉ dựa vào việc 'nuôi' dữ liệu để có được khả năng, mà phải hiểu về thế giới vật lý một cách chủ động như con người.

Nhưng Pete Florence sau khi khởi nghiệp lại viết một bức thư ngỏ dài, ngay từ đầu đã viết: "Đừng dán nhãn Mô hình Thế giới cho công ty của tôi."

Điều này thật sự trái khoáy. Bởi vì Pete Florence không chỉ đơn giản là một "nhà khởi nghiệp". Trước khi khởi nghiệp, Pete Florence đã làm việc trong nhóm Google DeepMind, từ một nhà nghiên cứu thông thường thăng tiến lên thành Nhà khoa học Nghiên cứu Cấp cao. Mô hình điều khiển robot Gemini Robotics mà DeepMind ra mắt vào năm 2025, Pete Florence chính là một trong những nhà phát triển cốt lõi nhất. Tuy nhiên, thành tựu có ảnh hưởng nhất của anh trong thời gian này là vào năm 2023, cùng với các đồng nghiệp, đã giới thiệu với thế giới một kiến trúc mô hình robot hoàn toàn mới: "Vision-Language-Action Models" (Mô hình Thị giác-Ngôn ngữ-Hành động).

(Pete Florence, Nguồn: Mạng xã hội)

Đúng vậy, nếu nói rằng hiện nay "Mô hình Thế giới" hay "VLA" là hướng đi tiên phong nhất, có được sự đồng thuận cao nhất, thì Pete Florence chính là người tiên phong xứng đáng trên con đường này. Một người như vậy lại dẫn đầu việc vứt bỏ nhãn "Mô hình Thế giới", quả thực là một cú sốc.

Và bây giờ, cú sốc còn tăng gấp bội. Gần đây, công ty trí tuệ thể hiện (embodied AI) Generalist AI do Pete Florence sáng lập đã hoàn thành một vòng gọi vốn mới, với tổng quy mô 4 tỷ USD (khoảng 27 tỷ nhân dân tệ), định giá 20 tỷ USD (khoảng 135,5 tỷ nhân dân tệ). Các nhà đầu tư vòng này bao gồm NVentures thuộc sở hữu của NVIDIA, các nhà đầu tư thiên thần nổi tiếng Nat Friedman và Daniel Gross cùng quản lý quỹ NFDG, văn phòng gia đình Bezos Expeditions của Jeff Bezos, đồng sáng lập Xiaomi Lâm Bân, nhà sáng lập Zoom Viên Trưng, và nhà khoa học tiêu biểu nhất trong lĩnh vực Mô hình Thế giới - Lý Phi Phi.

"Mục tiêu" quan trọng hơn "Nhãn mác"

Tại sao với tư cách là một trong những người đặt nền móng chính cho Mô hình Thế giới, Pete Florence lại phản đối việc bị dán nhãn "Mô hình Thế giới" đến vậy? Tại sao Lý Phi Phi, với tư cách là học giả tiêu biểu nhất trong lĩnh vực Mô hình Thế giới, lại dùng tiền thật để ủng hộ một người dị giáo công khai "ly kinh bạn đạo" như vậy? Câu chuyện có lẽ phải bắt đầu từ năm 2019.

Vào thời điểm đó, Pete Florence đang theo học Tiến sĩ Khoa học Máy tính tại Học viện Công nghệ Massachusetts (MIT), nghiên cứu chính về lĩnh vực điều khiển robot, thị giác máy tính và xử lý ngôn ngữ tự nhiên - xét về xuất thân này, Pete Florence có thể coi là "chính thống", hướng nghiên cứu chính thống, nền tảng học thuật cũng chính thống, không phải là một "giang hồ nhi nữ" cần dựa vào "đặc lập đặc hành" để tranh giành tài nguyên. Nhưng vấn đề là, MIT lại phân cho anh một người cố vấn tên là Russ Tedrake.

Russ Tedrake là ai? Trước hết, ông ấy chắc chắn là một học giả lớn. Vào năm 2019, ông đồng thời đảm nhận vị trí Giáo sư ngành Kỹ thuật Điện và Khoa học Máy tính tại MIT, Giám đốc Trung tâm Robot thuộc Phòng thí nghiệm Khoa học Máy tính và Trí tuệ Nhân tạo. Mỗi năm đến cuộc thi DARPA Robotics Challenge nổi tiếng, ông còn phụ trách dẫn dắt đội tuyển MIT tham gia. Bên ngoài trường học, ông còn kiêm nhiệm Phó Chủ tịch Trung tâm Nghiên cứu Robot của Viện Nghiên cứu Toyota. Có thể nói, Russ Tedrake là một trong những học giả hàng đầu trong lĩnh vực robot, có đủ nguồn lực để giúp Pete Florence trẻ tuổi hiện thực hóa giấc mơ học thuật của mình.

Tuy nhiên, trong nhận thức bản thân của Russ Tedrake, thứ khiến ông say mê không phải là mã lập trình, mà là "vật lý". Trong một bài giới thiệu về bản thân, Russ Tedrake hồi tưởng rằng, lý do ông bước vào con đường học thuật khoa học máy tính, tất cả bắt nguồn từ khi nghiên cứu "robot đứng thẳng hai chân", ông đã nhìn thấy "các đặc tính động lực học phong phú", khiến ông nảy sinh hứng thú sâu sắc với "điều khiển động lực học chất lưu phức tạp". Do đó, so với các nhà nghiên cứu khác khi mới vào nghề, thường đầu tiên sẽ nghiên cứu cách để robot bắt táo, gấp chăn, thì ông đầu tiên nghiên cứu đề tài là cách điều khiển "máy bay sau khi mất tốc độ hoặc máy bay vỗ cánh", cách "xuyên qua chướng ngại vật dày đặc với tốc độ cao".

Bối cảnh như vậy, đã định sẵn Russ Tedrake rất coi trọng việc "hiểu thế giới vật lý". Trang web chính thức của MIT giới thiệu đặc điểm học thuật của Russ Tedrake như sau: "Trọng tâm nghiên cứu của giáo sư này là tìm kiếm các giải pháp điều khiển tinh tế cho các hệ thống động lực thú vị (thiếu lái, ngẫu nhiên và/hoặc khó mô hình hóa), và có thể xây dựng các hệ thống này để kiểm chứng thực nghiệm. Ông đặc biệt quan tâm đến mối liên hệ giữa cơ học (đặc biệt là cơ học không trơn) với lý thuyết học máy/tối ưu hóa, từ đó đạt được thiết kế điều khiển mạnh mẽ cho các hệ thống cơ khí phức tạp."

Pete Florence chịu ảnh hưởng, đương nhiên cũng trở thành "phái vật lý" trong khoa học máy tính. Ví dụ, thành tựu học thuật tiêu biểu nhất trong thời gian làm tiến sĩ, là một bài báo có tiêu đề "Self-supervised Correspondence in Visual Motor Policy Learning" (Tương quan tự giám sát trong học chính sách vận động thị giác). Bài báo này đề xuất rằng, họ đã tìm ra một phương pháp thông qua học bắt chước, có thể để robot chỉ với 50 lần trình diễn là hoàn thành các nhiệm vụ thao tác đầy thách thức, còn có thể khái quát hóa cho các đối tượng thuộc các loại khác nhau, thích ứng với cấu hình của vật thể biến dạng. Bài báo này cũng nhờ đó giành được Giải thưởng Bài báo Xuất sắc Nhất năm 2020 của IEEE (Hiệp hội Kỹ sư Điện và Điện tử Quốc tế) trong lĩnh vực Robot và Tự động hóa.

Tất nhiên, thuộc về "phái" nào không quan trọng, quan trọng là Pete Florence dưới sự ảnh hưởng của môi trường như vậy, đã có được cách tư duy khác biệt. Nhiều nhà nghiên cứu quen với việc dựa trên công nghệ hiện có, sau đó thông qua thực nghiệm để suy ra khả năng của công nghệ, cuối cùng mới xác định kịch bản ứng dụng của công nghệ. Trong khi Pete Florence tin rằng trình tự đúng nên là "đầu tiên thiết lập mục tiêu cụ thể", sau đó mới thiết kế con đường công nghệ.

Sau khi gia nhập nhóm Google DeepMind, Pete Florence chính là đi theo hướng này để triển khai công việc của mình, tác phẩm tiêu biểu đầu tiên là kiến trúc mô hình robot thế hệ đầu tiên Transporter Network do Google ra mắt năm 2021. Trong bài báo công bố mô hình, Pete Florence nói rằng sắp xếp đồ vật vốn dĩ phải là một kỹ năng rất cơ bản, nhưng đối với robot, hoàn thành động tác này có nghĩa là "suy luận nhận thức cấp cao và cấp thấp", cần phải xem xét xem sách nên đặt ở đâu, và xếp chồng theo thứ tự nào, đồng thời còn phải đảm bảo các mép sách thẳng hàng với nhau, tạo thành chồng sách gọn gàng.

Transporter Network chính là kiến trúc mô hình được ra mắt nhằm mục đích "làm cho các động tác đơn giản trở nên dễ dàng", có thể để robot hoàn thành các thao tác khác nhau một cách phổ quát dựa trên thị giác, tốc độ huấn luyện nhanh, sự phụ thuộc vào môi trường huấn luyện cũng thấp hơn.

Việc cùng nhóm DeepMind ra mắt kiến trúc VLA vào năm 2023, cũng chính là "xuôi dòng nước đẩy thuyền" dựa trên tư duy này. Trong bài báo mở ra thời kỳ thịnh vượng của Mô hình Thế giới ngày nay, các tác giả cho biết họ hy vọng kiến trúc VLA có thể "nâng cao đáng kể khả năng khái quát hóa cho các đối tượng mới, có thể giải thích các chỉ dẫn chưa xuất hiện trong dữ liệu huấn luyện robot (ví dụ như đặt vật thể lên một con số hoặc biểu tượng cụ thể), và có thể thực hiện suy luận cơ bản dựa trên chỉ dẫn của người dùng (ví dụ như nhặt vật thể nhỏ nhất hoặc lớn nhất, hoặc nhặt vật thể gần nhất với vật thể khác)".

Quay lại câu hỏi ban đầu, với tư cách là một trong những người đặt nền móng chính cho Mô hình Thế giới, tại sao Pete Florence lại phản đối việc bị dán nhãn "Mô hình Thế giới" đến vậy? Câu trả lời cũng như vậy: Pete Florence cho rằng "mục tiêu" quan trọng hơn "nhãn mác".

Theo quan điểm của anh, nhiệt tình hiện nay về Mô hình Thế giới, thực chất là kiểu "dẫn dắt bởi lý niệm", ví dụ như khá nhiều nhiệt tình có thể quy về sự phấn khích của thị trường vốn khi phát hiện ra sự không đồng thuận trong một hướng đi nóng. Và nếu thực sự muốn thúc đẩy robot bước vào công việc và cuộc sống của chúng ta, tạo ra năng suất lao động, thì việc xây dựng "Mô hình Thế giới" rõ ràng không phải là một mục tiêu. Mục tiêu thực sự thực chất nên là robot có thể hoàn thành các loại nhiệm vụ chưa từng thấy với tỷ lệ thành công và tốc độ cực cao, và hoàn toàn không cần bất kỳ dữ liệu cụ thể cho nhiệm vụ nào.

Và đây cũng chính là lý do Pete Florence quyết định rời Google DeepMind để khởi nghiệp độc lập. Tại hội nghị GTC của NVIDIA năm 2025, Pete Florence lần đầu tiên xuất hiện trước mắt mọi người với tư cách là Đồng sáng lập kiêm Giám đốc điều hành của Generalist AI. Anh nói: "Chúng tôi quyết tâm tạo ra những robot có thể làm bất cứ việc gì... Hãy thử tưởng tượng, nếu chi phí biên của lao động chân tay giảm xuống bằng 0, thì đó sẽ là một cảnh tượng như thế nào."

Tỷ lệ thành công 99%

Ngoài việc "ly kinh bạn đạo" về mặt lý niệm công nghệ, con đường khởi nghiệp của Pete Florence cũng tỏ ra không chính thống.

Về lý thuyết, một nhà khởi nghiệp có lý lịch như vậy, trong hoàn cảnh hiện nay chắc chắn sẽ nhận được sự săn đón nồng nhiệt của các VC. Yann LeCun, Ilya Sutskever, Mira Murati đều là ví dụ, công ty vừa đăng ký thành lập (thậm chí chưa đăng ký) đã hoàn thành vòng hạt giống hơn 10 tỷ USD. Nhưng Generalist AI của Pete Florence trong giai đoạn khởi đầu chỉ nhận đầu tư từ một số ít tổ chức như NVIDIA, văn phòng gia đình Bezos, NFDG. Nếu không phải bộ phận đầu tư mạo hiểm NVentures của NVIDIA tổ chức một buổi "tọa đàm các công ty trong danh mục đầu tư" tại hội nghị GTC năm 2025, mọi người đều không biết người này đã nghỉ việc khởi nghiệp.

Tại sao lại như vậy? Câu trả lời khả dĩ nhất, chính là sự lựa chọn chủ động của Pete Florence. Như đã đề cập ở trên, Pete Florence sau khi tốt nghiệp đã vào nhóm Google DeepMind, từ năm 2019 làm đến năm 2025, giữa chừng không có lý lịch làm việc nào khác. Tức là, Generalist AI là lần khởi nghiệp đầu tiên trong đời anh, hoàn toàn cần thiết phải thận trọng hơn nữa.

Trên thực tế, tại hội nghị GTC của NVIDIA năm 2025, lần đầu tiên xuất hiện công khai với tư cách nhà khởi nghiệp, Pete Florence đã thể hiện rất trực quan sự "thận trọng" của mình. Ngoài việc nói với mọi người rằng mình đang chế tạo "robot", anh không tiết lộ bất kỳ hướng đi kinh doanh cụ thể nào, trực tiếp nói rằng "chúng tôi hiện vẫn đang trong trạng thái bí mật".

Mãi đến tháng 11 năm 2025, mọi người mới lần đầu nhìn thấy hoạt động kinh doanh cụ thể của Generalist AI. Tháng 11 năm 2025, Generalist AI ra mắt mô hình trí tuệ thể hiện thế hệ đầu tiên của họ là GEN-0. Trong phần giới thiệu chính thức, Generalist AI cho biết GEN-0 kết hợp ưu thế của mô hình thị giác và mô hình ngôn ngữ, đồng thời hoàn thành bước đột phá vượt bậc - Gen-0 có thể nắm bắt khả năng phản xạ và kiến thức vật lý ở cấp độ con người.

Nói một cách đơn giản, nó có thể tiếp tục nâng cao khả năng khi quy mô mô hình và dữ liệu huấn luyện tăng lên, vượt qua điểm tắc nghẽn của các mô hình nhỏ trước đây; nó có thể vừa suy nghĩ vừa hành động như con người, phản ứng nhanh chóng và tự nhiên trong môi trường vật lý thực tế; nó tương thích tự nhiên với các loại robot khác nhau, không cần cải tạo thêm; quan trọng hơn, nó dựa trên lượng lớn dữ liệu thao tác thực tế, không còn bị hạn chế bởi sự thiếu hụt dữ liệu, và thông qua việc điều chỉnh linh hoạt cấu thành dữ liệu huấn luyện. Nhiều phương tiện truyền thông công nghệ chỉ ra rằng, GEN-0 chứng minh rằng "quy luật mở rộng" toán học thúc đẩy các mô hình ngôn ngữ lớn như ChatGPT cũng áp dụng được cho vận động vật lý.

Tuy nhiên, GEN-0 không phải là hoàn hảo. Ví dụ, GEN-0 cũng không giải quyết được vấn đề tập dữ liệu làm phiền lĩnh vực trí tuệ thể hiện. Do đó, đến tháng 4 năm 2026, Generalist AI nhanh chóng lặp phiên bản lên GEN-1 hoàn toàn mới.

(“Bàn tay cơ khí”, Nguồn: Mạng xã hội Generalist AI)

Để giải quyết vấn đề tập dữ liệu, Generalist AI đã phát triển một thiết bị đeo được, dùng để thu thập các chuyển động nhỏ và thông tin thị giác khi con người thực hiện các nhiệm vụ thủ công. Generalist AI cho biết trong quá trình phát triển GEN-1, họ đã thu thập hơn 500.000 giờ "dữ liệu tương tác vật lý cấp PB" thông qua đôi bàn tay cơ khí này, để huấn luyện mô hình vật lý của họ. Sau khi được huấn luyện đầy đủ, Generalist AI cho biết GEN-1 đạt tỷ lệ thành công cao tới 99% trong các nhiệm vụ cơ khí lặp đi lặp lại nhưng tinh tế như gấp hộp carton, đóng gói điện thoại và bảo trì robot hút bụi, tốc độ khoảng gấp ba lần so với mẫu GEN-0 thế hệ trước, và chỉ mất khoảng một giờ đồng hồ để đạt được mục tiêu này.

Từ đó, Generalist AI tự hào tuyên bố, mô hình vật lý của GEN-1 đã tiệm cận điểm uốn tương tự như GPT-3, hiệu suất của một số nhiệm vụ bắt đầu "đạt đến mức độ cần thiết để triển khai trong môi trường thương mại thực tế", và "chúng ta có thể kỳ vọng mỗi thế hệ mô hình mới sẽ mang đến một loạt nhiệm vụ mới ngày càng phức tạp, những nhiệm vụ này đều có thể được nắm vững".

Trong blog chính thức, Pete Florence chỉ ra rằng, quá trình phát triển GEN-1 là sự diễn giải tốt nhất cho lý niệm công nghệ cá nhân của anh: Đầu tiên, anh đặt ra một mục tiêu hợp lý, đó là robot có thể hoàn thành các loại nhiệm vụ chưa từng thấy với tỷ lệ thành công và tốc độ cực cao, và hoàn toàn không cần dữ liệu cụ thể cho nhiệm vụ nào. Sau đó, dựa trên mục tiêu này, anh đặt ra một con đường giải quyết, cho phép sử dụng một lượng nhỏ dữ liệu robot cho nhiệm vụ cụ thể (gọi là X), và đạt được mức độ thực thi cao cho nhiệm vụ đó, sau đó liên tục giảm X, đồng thời nâng cao hiệu suất.

Nói đến đây, câu hỏi chúng ta đặt ra trước đó cũng đã được trả lời. Sản phẩm do Generalist AI phát triển rốt cuộc có gọi là "Mô hình Thế giới" hay không đã không quan trọng nữa, chỉ cần bạn nhìn thấy ngành trí tuệ thể hiện, lạc quan về việc robot có thể quy mô lớn bước vào sản xuất thực tế, thì Generalist AI thực sự là lựa chọn đáng để đặt cược. Và vòng gọi vốn này của Generalist AI thực sự đã được thỏa thuận nhanh chóng trong vòng hai tháng sau khi GEN-1 ra mắt.

Theo báo cáo, các cổ đông cũ như NVIDIA, Bezos Expeditions, NDFG đều chọn đầu tư lại, và là đầu tư tăng gấp bội. Ngoài ra, các nhà đầu tư mới bao gồm đồng sáng lập Xiaomi Lâm Bân, nhà sáng lập Zoom Viên Trưng, nhà khoa học người Hoa Lý Phi Phi, cũng bao gồm các nhà đầu tư tổ chức như Radical Ventures, 8VC, Union Square Ventures, Hanabi Capital, Norwest.

Nói cách khác, Pete Florence của tháng 6 năm 2026 không cần phải chứng minh bản thân nữa. Ít nhất là những lời khoác lác anh từng nói những năm đó - ví dụ như Pete Florence mới khởi nghiệp năm 2025 từng nói trong một podcast: "Robot đa năng không phải là cái gì cũng nếm thử một chút, mà phải chuyên nghiệp đến mức đủ hữu ích trong các nhiệm vụ thực tế" - đang đi trên con đường "lần lượt hiện thực hóa".

Bài viết này đến từ tài khoản công chúng WeChat "Touzhongwang", tác giả: Bồ Phàm

Câu hỏi Liên quan

QTại sao Peter Florence phản đối việc dán nhãn 'Mô hình thế giới' (World Model) cho công ty của mình?

APeter Florence tin rằng 'mục tiêu' quan trọng hơn 'nhãn mác'. Ông cho rằng sự nhiệt tình hiện tại với World Model chủ yếu là do động lực từ ý tưởng và thị trường vốn. Mục tiêu thực sự của ông là tạo ra robot có thể hoàn thành mọi nhiệm vụ chưa từng thấy với tỷ lệ thành công và tốc độ cực cao, mà không cần dữ liệu cụ thể cho từng nhiệm vụ. Việc tập trung vào nhãn 'World Model' có thể làm lu mờ mục tiêu cốt lõi này.

QNhững nhà đầu tư chính nào tham gia vào vòng gọi vốn 4 tỷ USD (khoảng 27 tỷ RMB) của Generalist AI?

AVòng gọi vốn này có sự tham gia của nhiều nhà đầu tư nổi tiếng, bao gồm: NVentures (công ty con của NVIDIA), quỹ NFDG (được quản lý bởi Nat Friedman và Daniel Gross), Bezos Expeditions (văn phòng gia đình của Jeff Bezos), đồng sáng lập Xiaomi Lin Bin, người sáng lập Zoom Eric Yuan, và nhà khoa học nổi tiếng Lý Phi Phi (Fei-Fei Li). Các nhà đầu tư cũ như NVIDIA, Bezos Expeditions và NFDG cũng tái đầu tư với số tiền lớn hơn.

QMô hình GEN-1 của Generalist AI đạt được những tiến bộ đáng kể nào so với GEN-0?

AGEN-1 đã giải quyết vấn đề về bộ dữ liệu bằng cách sử dụng một thiết bị đeo tay để thu thập hơn 50 triệu giờ dữ liệu tương tác vật lý. Kết quả là, GEN-1 đạt tỷ lệ thành công 99% trong các nhiệm vụ lặp lại nhưng tinh vi (gập hộp carton, đóng gói điện thoại), với tốc độ nhanh gấp ba lần GEN-0 và chỉ mất khoảng một giờ để đào tạo cho một nhiệm vụ mới. Điều này cho thấy khả năng ứng dụng thương mại của nó.

QẢnh hưởng từ người cố vấn Russ Tedrake đã định hình tư duy kỹ thuật của Peter Florence như thế nào?

ARuss Tedrake, một chuyên gia hàng đầu về robot với niềm đam mê 'vật lý', đã truyền cho Peter Florence cách tiếp cận 'hiểu thế giới vật lý'. Điều này khiến Florence phát triển một phương pháp luận khác biệt: thay vì bắt đầu từ công nghệ rồi tìm ứng dụng, ông tin vào việc 'đặt mục tiêu cụ thể trước', sau đó mới thiết kế con đường kỹ thuật để đạt được nó. Triết lý 'mục tiêu trên nhãn mác' của ông bắt nguồn từ đây.

QMục tiêu cuối cùng mà Peter Florence và Generalist AI hướng tới là gì?

AMục tiêu tối thượng của họ là tạo ra những robot đa năng (generalist robot) có thể thực hiện bất kỳ công việc thể chất nào, từ đó giảm chi phí biên của lao động chân tay xuống gần bằng 0. Họ hình dung về một tương lai nơi robot có thể triển khai rộng rãi trong sản xuất và đời sống, thực hiện các nhiệm vụ phức tạp, chưa từng thấy một cách đáng tin cậy và hiệu quả mà không cần lập trình hoặc đào tạo riêng cho từng tác vụ.

Nội dung Liên quan

1996 hay 1999? Bài kiểm tra đầu tiên của Walsh là 'Cách nhìn về AI'

Tác giả: Đồng Tĩnh Vị Chủ tịch Fed mới, Walsh, đang đối mặt với thử thách đầu tiên và quan trọng nhất: **cách đánh giá sự bùng nổ AI hiện tại**. Quan điểm này sẽ quyết định hướng đi chính sách tiền tệ và định vị vai trò lịch sử của ông. Giới kinh tế đang tranh luận giữa hai cách hiểu trái ngược về làn sóng AI: 1. Lợi ích năng suất sắp hiện thực hóa, cung sẽ đuổi kịp cầu, cho phép Fed giữ nguyên lãi suất. 2. Cú sốc cầu đã đến trong khi lợi ích năng suất vẫn còn ở phía trước; nếu Fed chờ đợi dữ liệu xác nhận, họ sẽ bỏ lỡ thời điểm can thiệp tốt nhất và buộc phải tăng lãi suất mạnh hơn sau này. Bản thân Walsh có vẻ nghiêng về tư duy của Cựu Chủ tịch Alan Greenspan năm 1996: ông nhiều lần nhấn mạnh rằng "tăng trưởng mạnh mẽ được thúc đẩy bởi năng suất không phải là điều chúng ta sợ hãi, mà là điều chúng ta đón nhận". Ông lo ngại Fed sẽ phạm sai lầm khi thắt chặt chính sách quá sớm trong một thời kỳ thịnh vượng về năng suất, từ đó bóp nghẹt động lực tăng trưởng vốn có thể kiềm chế lạm phát. Tuy nhiên, bối cảnh hiện tại của Walsh khác xa năm 1996: áp lực thuế quan, thâm hụt ngân sách mở rộng và lợi ích toàn cầu hóa suy giảm khiến áp lực lạm phát tiềm tàng lớn hơn nhiều. Một thách thức quan trọng khác đến từ Chủ tịch Fed Chicago, Austan Goolsbee. Ông lập luận rằng một sự bùng nổ năng suất "được mong đợi từ trước" như AI hiện nay có thể gây ra hiệu ứng ngược: mọi người chi tiêu dựa trên kỳ vọng về của cải trong tương lai ngay từ bây giờ, dẫn đến nền kinh tế quá nóng và buộc Fed phải tăng lãi suất mạnh. Ông chỉ ra các dấu hiệu như việc xây dựng trung tâm dữ liệu AI đang đẩy giá đất, điện và chip lên cao. Ngược lại, Thống đốc Fed Christopher Waller phản bác rằng cơ chế "chi tiêu trước" này chỉ hoạt động nếu các hộ gia đình có thể vay mượn dễ dàng, điều không phải lúc nào cũng đúng. Điều này ủng hộ lập trường "chờ đợi" của Walsh. Walsh còn đối mặt với một nghịch lý sâu sắc: ông muốn xóa bỏ thông lệ "hướng dẫn dự báo" (forward guidance) - vốn được thiết lập từ năm 1999 - để Fed không phải lộ bài trước. Nhưng nếu nền kinh tế diễn biến theo kịch bản xấu hơn, ông sẽ phải lựa chọn: hoặc sử dụng lại công cụ mình muốn bãi bỏ để báo hiệu tăng lãi suất, hoặc im lặng và chấp nhận rủi ro thị trường biến động mạnh. Câu trả lời cuối cùng cho tất cả những vấn đề trên phụ thuộc vào một câu hỏi then chốt: **Hiện tại là năm 1996 hay năm 1999?**

marsbit1 giờ trước

1996 hay 1999? Bài kiểm tra đầu tiên của Walsh là 'Cách nhìn về AI'

marsbit1 giờ trước

Báo cáo Ethereum Q1 2026: Phí giảm, người dùng và khối lượng giao dịch lập kỷ lục mới

Báo cáo Q1/2026 của Ethereum cho thấy một xu hướng đối lập: lượng người dùng, số giao dịch và thông lượng mạng lưới đều đạt mức cao kỷ lục, trong khi phí giao dịch, tổng giá trị bị khóa (TVL), khối lượng giao dịch và vốn hóa pha loãng hoàn toàn (FDV) của ETH lại giảm. Hiện tượng này được giải thích là "Nghịch lý Jevons": việc giảm chi phí sử dụng mạng lưới sau đợt nâng cấp Fusaka đã giải phóng nhu cầu, thúc đẩy tăng trưởng quy mô. Báo cáo nhấn mạnh sự chuyển dịch trong định vị cốt lõi của Ethereum từ một blockchain DeFi sang một tầng thanh toán tài chính toàn cầu. Ethereum tiếp tục thống trị thị trường tài sản được mã hóa, chiếm phần lớn thị phần trong các lĩnh vực stablecoin (61,8%), quỹ được mã hóa (73%), hàng hóa được mã hóa (84%) và cổ phiếu được mã hóa. Sự tham gia của các tổ chức lớn như BlackRock, JPMorgan và Fidelity đang đẩy nhanh quá trình "thể chế lên chuỗi". Mặc dù phí giao dịch tầng cơ sở giảm mạnh (-47,9%), đây được xem là một sự đánh đổi có chủ đích để đổi lấy tăng trưởng mạng lưới dài hạn. Chiến lược này nhằm củng cố vị thế là nền tảng định sẵn cho việc thanh toán và quyết toán các tài sản tài chính ngày càng được mã hóa, từ đó tạo ra giá trị cơ bản cho ETH thông qua nhu cầu sử dụng mạng lưới.

marsbit3 giờ trước

Báo cáo Ethereum Q1 2026: Phí giảm, người dùng và khối lượng giao dịch lập kỷ lục mới

marsbit3 giờ trước

CEO Intel Anrrit Patel lần đầu phỏng vấn podcast: Mục tiêu của chúng tôi là '10 lần trong 5-10 năm', đặt cược vào đóng gói tiên tiến, bản nền bằng kính và kim cương nhân tạo

Giám đốc điều hành Intel, Lip-Bu Tan, đặt mục tiêu tạo ra lợi nhuận gấp 10 lần trong 5-10 năm. Chiến lược tập trung vào ba lĩnh vực then chốt: đóng gói tiên tiến (như công nghệ EMIB), vật liệu bán dẫn mới (GaN, SiC, InP, kim cương nhân tạo) và công nghệ nền tảng thế hệ tiếp theo (như nền thủy tinh). Ông nhấn mạnh nhu cầu CPU mạnh mẽ từ AI thông minh và suy luận, đồng thời cam kết xây dựng lại doanh nghiệp sản xuất của Intel với trọng tâm là tỷ lệ phần trăm hoàn hảo, độ tin cậy và thời gian chu kỳ để giành lấy niềm tin của khách hàng. Tan cũng tiết lộ hợp tác Terafab với Elon Musk để giải quyết tình trạng thiếu hụt cơ sở hạ tầng bán dẫn. Ông xem giai đoạn hiện tại là "bò" và dự đoán tiềm năng thực sự của Intel, vượt ra ngoài PC để đến với điện toán biên và AI vật lý, sẽ được công nhận đầy đủ sau năm 2030.

marsbit3 giờ trước

CEO Intel Anrrit Patel lần đầu phỏng vấn podcast: Mục tiêu của chúng tôi là '10 lần trong 5-10 năm', đặt cược vào đóng gói tiên tiến, bản nền bằng kính và kim cương nhân tạo

marsbit3 giờ trước

Mất hai huyền thoại trong ba ngày: Con đập nhân tài AI của Google đang vỡ?

Chỉ trong ba ngày, Google đã chứng kiến hai huyền thoại AI rời đi: Noam Shazeer (đồng tác giả Transformer, lãnh đạo Gemini) gia nhập OpenAI, và John Jumper (người đoạt giải Nobel Hóa học 2024, lãnh đạo AlphaFold) chuyển sang Anthropic. Đây không phải là trường hợp cá biệt mà là một xu hướng rõ ràng, bổ sung cho việc cựu thành viên sáng lập OpenAI Andrej Karpathy gia nhập Anthropic trước đó. Các tài năng AI hàng đầu đang tập trung ngày càng nhiều vào OpenAI và Anthropic, khiến Google trở thành nguồn cung cấp chính trong cuộc tái cấu trúc nhân tài này. Sự dịch chuyển này bắt nguồn từ sự khác biệt cốt lõi về sứ mệnh. Google, với doanh thu chính phụ thuộc vào quảng cáo, thường đặt các dự án AI trong khuôn khổ phục vụ mục tiêu sản phẩm và lợi nhuận. Ngược lại, OpenAI (với sứ mệnh AGI) và Anthropic (tập trung vào AI an toàn) cho phép các nhà nghiên cứu tập trung hoàn toàn vào việc đẩy xa giới hạn năng lực mô hình. Ngoài ra, cơ hội thu lợi nhuận lớn từ cổ phiếu trước thềm IPO của hai công ty này là động lực hấp dẫn mà Google - một gã khổng lồ trưởng thành - khó có thể sánh được. Việc sáp nhập Google Brain và DeepMind vào năm 2023 cũng tạo ra những lực ly tâm mới, làm xói mòn văn hóa nghiên cứu dài hạn dưới áp lực phải phù hợp với lộ trình sản phẩm. Sự ra đi của các nhân vật then chốt như Jumper và Shazeer phản ánh điều này. Cuộc khủng hoảng nhân tài này mang tính cấu trúc. Google có thể sở hữu cơ sở hạ tầng máy tính khổng lồ và kho dữ liệu đồ sộ, nhưng việc thiếu những bộ óc xuất sắc nhất để khai thác chúng khiến lợi thế đó trở nên vô nghĩa. Trong khi OpenAI và Anthropic củng cố vị thế với đội ngũ tinh nhuệ ngày càng mạnh, Google đang mất dần hào quang là trung tâm hấp dẫn nhân tài AI toàn cầu. Trong cuộc đua mà mật độ tài năng quyết định năng lực mô hình và thị phần, đây là một thách thức tồn vong thầm lặng nhưng nghiêm trọng của Google.

marsbit5 giờ trước

Mất hai huyền thoại trong ba ngày: Con đập nhân tài AI của Google đang vỡ?

marsbit5 giờ trước

Phía sau bảng điểm AI, ẩn giấu một 'người ra đề' gốc Hoa

Mỗi khi một mô hình AI tiên tiến ra mắt, giới công nghệ lại dõi theo những “bảng điểm” quen thuộc như MMLU-Pro, MMMU hay MMMU-Pro. Đây là các tiêu chuẩn đánh giá quan trọng giúp so sánh năng lực của các mô hình lớn như GPT, Claude hay Gemini. Tuy nhiên, ít người biết rằng đằng sau những bộ đề thi này là một nhà nghiên cứu người Hoa: Chen Wenhu (Trần Văn Hổ), trợ lý giáo sư tại Đại học Waterloo, Canada. Ông cùng phòng thí nghiệm TIGERLab (còn gọi là Hổ Đầu Bang) đã tạo ra MMLU-Pro vào năm 2024 để giải quyết vấn đề “mất chuẩn” của bộ đánh giá MMLU cũ, khi nhiều mô hình tiên tiến đạt điểm gần tuyệt đối, khó phân biệt được sự khác biệt thực sự. MMLU-Pro với hơn 12.000 câu hỏi, mở rộng lựa chọn và tăng cường các câu đòi hỏi suy luận, đã giúp kéo giãn khoảng cách điểm số và đánh giá ổn định hơn. Trước đó, nhóm của Chen Wenhu cũng phát triển MMMU - bộ đánh giá đa phương thức (multimodal) yêu cầu mô hình kết hợp hiểu biết hình ảnh, biểu đồ với kiến thức chuyên môn để trả lời câu hỏi. Ngay cả các mô hình mạnh nhất thời điểm đó như GPT-4V cũng chỉ đạt độ chính xác khoảng 56%. Phiên bản MMMU-Pro sau này được thiết kế để đảm bảo mô hình không thể “bỏ qua” thông tin hình ảnh mà chỉ dựa vào văn bản để đoán đáp án. Nghiên cứu của Chen Wenhu tập trung vào việc hiểu thông tin phức tạp, hỏi đáp tri thức và suy luận. Ông từng làm việc tại Google Research và DeepMind, tham gia vào dự án Gemini, trước khi gia nhập Đại học Waterloo và thành lập TIGERLab. Phòng thí nghiệm không chỉ tạo ra các bộ đánh giá mà còn nghiên cứu phát triển mô hình, chẳng hạn trong lĩnh vực xử lý video. Hiện tại, Chen Wenhu làm việc tại Phòng thí nghiệm Siêu trí tuệ (Super Intelligent Lab) của Meta, tiếp tục tập trung vào dữ liệu huấn luyện và đánh giá đa phương thức. Công việc của ông và nhiều nhà nghiên cứu người Hoa khác đang đóng góp quan trọng vào sự phát triển chung của ngành AI, dù có thể không nằm dưới ánh đèn sân khấu.

marsbit5 giờ trước

Phía sau bảng điểm AI, ẩn giấu một 'người ra đề' gốc Hoa

marsbit5 giờ trước

Giao dịch

Giao ngay

Hợp đồng Tương lai

Anh ấy vừa gọi được 2,7 tỷ USD, Lý Phi Phi cũng rót tiền đầu tư

Tóm tắt

"Mục tiêu" quan trọng hơn "Nhãn mác"

Tỷ lệ thành công 99%

Câu hỏi Liên quan

Nội dung Liên quan

1996 hay 1999? Bài kiểm tra đầu tiên của Walsh là 'Cách nhìn về AI'

Báo cáo Ethereum Q1 2026: Phí giảm, người dùng và khối lượng giao dịch lập kỷ lục mới

CEO Intel Anrrit Patel lần đầu phỏng vấn podcast: Mục tiêu của chúng tôi là '10 lần trong 5-10 năm', đặt cược vào đóng gói tiên tiến, bản nền bằng kính và kim cương nhân tạo

Mất hai huyền thoại trong ba ngày: Con đập nhân tài AI của Google đang vỡ?

Phía sau bảng điểm AI, ẩn giấu một 'người ra đề' gốc Hoa

Giao dịch

Danh mục Phổ biến

Thẻ Nổi bật