他刚融了27亿,李飞飞也投钱了

marsbit发布于2026-06-20更新于2026-06-20

文章摘要

皮特·弗洛伦斯是机器人VLA(视觉-语言-动作)模型的先行者,但他在创业后却公开拒绝“世界模型”的标签。他认为,产业应聚焦于“目标”而非“标签”,真正的目标是让机器人以极高成功率自主完成各类新任务。其创立的具身智能公司Generalist AI近期完成4亿美元融资,估值达20亿美元,投资方包括英伟达、贝索斯家办、NFDG、李飞飞等。 皮特在麻省理工的导师拉斯·泰德雷克影响了他从物理世界本质出发的研究思路。在谷歌DeepMind期间,他开发了Transporter Network和VLA架构,均强调面向具体目标设计技术路径。他于2025年创立Generalist AI,旨在打造能做任何事的机器人。 公司先后发布了GEN-0和GEN-1模型。GEN-1通过可穿戴设备收集了超50万小时物理交互数据进行训练,在折叠纸箱、打包等精细任务上成功率高达99%,速度是上一代的三倍。这表明驱动大语言模型的“扩展规律”在物理运动领域同样适用。公司的产品能力与清晰的商业化路径,吸引了知名投资方加注。

在当下的创投市场里,“世界模型”毫无疑问是热词中的热词。我们几乎每天都能看到有新的“世界模型”公司完成融资,估值增长迅猛,股东列表豪华。并且在这些融资新闻的通稿里,人们还会反复地强调一个事实:一个合格的超级智能体不应该只靠数据投喂来获得能力,而是要像人类那样去主动理解物理世界。

但皮特·弗洛伦斯(Pete Florence)却在创业之后写了一篇长长的公开信,一开头就写到:“不要将我的公司,贴上世界模型的标签。”

这真是倒反天罡。因为皮特·弗洛伦斯可不仅仅是一个“创业者”这么简单。在创业之前,皮特·弗洛伦斯一直在谷歌DeepMind团队工作,一路从普通研究员升级到了高级研究科学家。2025年DeepMind发布的机器人控制模型Gemini Robotics,皮特·弗洛伦斯就是最核心的开发者之一。不过在此期间他最有影响力的就成,就是在2023年与他的同事们一起,向全世界介绍了一个全新的机器人模型架构“Vision-Language-Action Models”

(皮特·弗洛伦斯,来源:社交媒体)

是的没错,如果说当下“世界模型”或者“VLA”是最前沿、最具共识的方向,那么皮特·弗洛伦斯就是这条路上当之无愧的先行者。这样的人带头扔掉“世界模型”的标签,实在是太冲击了。

而现在,冲击感加倍了。近日,皮特·弗洛伦斯创办的具身智能公司Generalist AI完成了一轮新融资,总规模为4亿美元(约合人民币27亿元),估值为20亿美元(约合人民币135.5亿元)。本轮投资方包括英伟达旗下的NVentures、知名天使投资人纳特·弗里德曼(Nat Friedman)和丹尼尔·格罗斯(Daniel Gross)共同管理的NFDG、贝索斯的家族办公司Bezos Expeditions,还有小米联合创始人林斌、Zoom创始人袁征,以及世界模型领域内最具代表性的科学家李飞飞。

“目标”比“标签”更重要

为什么作为世界模型的主要奠基者之一,皮特·弗洛伦斯如此抗拒贴上“世界模型”的标签?为什么李飞飞作为世界模型领域最有代表性的学者,却用真金白银支持了这样一位公开“离经叛道”的异端?故事或许要从2019年讲起。

那个时候的皮特·弗洛伦斯正在麻省理工大学攻读计算机科学博士,主要研究方向是机器人操控、计算机视觉和自然语言处理等领域——从这层出身来看,皮特·弗洛伦斯堪称“根正苗红”,研究方向正统、学术背景也很正统,并不是一个需要依靠“特立独行”来争取资源的“江湖儿女”。但问题在于,麻省理工却给他分配了一位叫做拉斯·泰德雷克(Russ Tedrake)的导师。

拉斯·泰德雷克是谁?首先,他肯定是学术大拿。在2019年,他分别担任麻省理工大学电气工程与计算机科学教授、计算机科学与人工智能实验室机器人中心主任。每年到了著名的DARPA机器人挑战赛,他还要负责带领麻省理工校队参赛。在校外,他还兼任丰田研究院机器人研究中心的副总裁。可以说,拉斯·泰德雷克是机器人领域内最顶尖的学者之一,有充足的资源帮助年轻的皮特·弗洛伦斯兑现自己的学术梦想。

然而在拉斯·泰德雷克的自我认知里,让他着迷的并不是编程代码,而是“物理”。在一篇自我介绍里,拉斯·泰德雷克回忆说,自己之所以踏上了计算机科学的学术道路,一切源于自己在研究“双腿直立机器人”的时候,看到了“丰富动力学特性”,让他对“复杂流体动力学控制”产生了浓厚的兴趣。因此相比于其他研究者在入行的时候,会首先去研究如何让机器人抓苹果、叠被子,他首先研究的课题是如何控制“失速后的飞行器或扑翼飞行器”,如何“高速穿越密集障碍物”。

这样的背景,注定了拉斯·泰德雷克非常重视“理解物理世界”这件事。麻省理工官网上如是介绍拉斯·泰德雷克的学术特点:“该教授的研究重点在于为有趣的(欠驱动、随机和/或难以建模的)动力系统寻找优雅的控制解决方案,并能够构建这些系统进行实验验证。他尤其关注力学(特别是非光滑力学)与机器学习/优化理论之间的联系,从而为复杂机械系统实现鲁棒控制设计。”

皮特·弗洛伦斯耳濡目染,自然也成为了计算机科学中的“物理派”。比如博士期间最有代表性的学术成果,就是一篇题为《视觉运动策略学习中的自监督对应》。这篇论文提出,他们找到了一种方法通过模仿学习,可以让机器人用仅仅50次演示就能完成具有挑战性的操作任务,还能能够对不同类别的物体进行泛化,适应可变形物体的构型。这篇论文也因此获得了2020年度IEEE(国际电气与电子工程师协会)机器人与自动化领域最佳论文奖。

当然属于什么“派”不重要,重要的是皮特·弗洛伦斯在这种环境的影响下,拥有了迥然的思考方式。大量研究者习惯现有技术,再通过实验来得出技术的可能性,最后再确定技术的落地场景。而皮特·弗洛伦斯相信正确的顺序应该是“先设置具体的目标”,再设计技术路径。

加入谷歌DeepMind团队后,皮特·弗洛伦斯正是沿着这一方向开展了自己的工作,其第一个代表作就是2021年谷歌推出的初代机器人模型架构Transporter Network。在模型发布的论文中,皮特·弗洛伦斯说整理物品本应该是一项非常基础的技能,但对于机器人来说完成这个动作意味着“高层次和低层次的感知推理”,需要先后考虑考虑书应该放在哪里,以及按照什么顺序堆放,同时还要确保书的边缘彼此对齐,形成整齐的书堆。

Transporter Network正是旨在“让简单的动作变得简单”而推出的模型架构,可以让机器人通用地基于视觉去完成各种操作,训练速度快,对训练环境依赖性也更低。

2023年与DeepMind团队共同发布VLA架构,也正是基于这一思路的“顺水推舟”。在那篇开启了如今世界模型盛世的论文中,作者们表示他们希望VLA架构能够“显著提升对新物体的泛化能力、能够解读机器人训练数据中未出现的指令(例如将物体放置在特定数字或图标上),以及能够根据用户指令进行基本的推理(例如拾取最小或最大的物体,或拾取距离其他物体最近的物体)”。

再回到开头的问题,作为世界模型的主要奠基者之一,皮特·弗洛伦斯如此抗拒贴上“世界模型”的标签?答案也是这样:皮特·弗洛伦斯认为“目标”比“标签”更重要。

在他看来目前关于世界模型的热情,实际上是“理念驱动型”的,比如相当一部分热情,可以归结为资本市场在大热方向上发现非共识的兴奋。并且如果想要真正地推动机器人进入我们的工作生活,创造生产力,那么构建“世界模型”显然不是一个目标。真正的目标实际上应该是机器人能够以极高的成功率和速度完成从未见过的各类任务,且完全无需任何特定任务的数据。

而这也正是皮特·弗洛伦斯决定离开谷歌DeepMind,独立创业的原因。2025年英伟达GTC大会上,皮特·弗洛伦斯首次作为Generalist AI的联合创始人兼首席执行官出现在人们的视野当中。他说:“我们决心制造出能够做任何事的机器人......试想一下,如果体力劳动的边际成本降至零,那会是怎样一番景象。”

99%的成功率

除了技术理念上的“离经叛道”,皮特·弗洛伦斯的创业之路也显得很非主流。

理论上,拥有如此履历的创业者,在当下必然会受到VC们的热捧。杨立昆、伊利亚·苏茨克维、米拉·穆拉蒂都是例子,都是公司刚一注册成立(甚至没注册)就完成了超过10亿美元的种子轮。但皮特·弗洛伦斯的Generalist AI在起步阶段只接受了英伟达、贝索斯家办、NFDG等少数几家机构的投资。如果不是英伟达的风投部门NVentures在2025年的GTC大会上组织了一场“被投企业圆桌”,大家都不知道这人已经离职创业了。

为什么会这样?最可能的答案,就是皮特·弗洛伦斯的主动选择。正如上文所提到的那样,皮特·弗洛伦斯一毕业就进入了谷歌DeepMind团队,从2019年一直干到了2025年,中间再也没有其他的工作履历。也就是说,Generalist AI是他人生中的第一段创业经历,是完全有必要慎之又慎的。

事实上,在第一次以创业者公开亮相的2025年英伟达GTC大会上,皮特·弗洛伦斯就非常直观地表现出了自己的“谨慎”。除了告诉大家自己在造“机器人”之外没有透露任何具体的业务方向,直接表示“我们目前仍处于隐秘状态”。

直到2025年11月,人们才第一次看到Generalist AI的具体业务。2025年11月,Generalist AI发布了他们的初代具身智能模型GEN-0。在官方介绍中,Generalist AI表示GEN-0融合了视觉模型与语言模型的优势,并同步完成了超越——Gen-0能够捕捉人类级别的反射能力和物理常识。

简单来说,它能够随着模型规模和训练数据的增大而持续提升能力,突破了以往小型模型的瓶颈;它可以像人类一样边思考边行动,在真实物理环境中做出快速而自然的反应;它天然适配不同类型的机器人,无需额外改造;更重要的是,它依托海量的真实操作数据,不再受数据匮乏的制约,并且通过灵活调整训练数据的构成。大量科技媒体指出,GEN-0证明了驱动ChatGPT等大型语言模型的数学“扩展规律”也适用于物理运动。

不过GEN-0并不是完美的。例如GEN-0也并没有解决困扰具身智能领域的数据集问题。因此到了2026年4月,Generalist AI迅速迭代到了全新的版本GEN-1。

(“机械手”,来源:Generalist AI社媒)

为了解决数据集问题,Generalist AI开发了一款可穿戴设备,用于捕捉人类执行手工任务时的微小动作和视觉信息。Generalist AI表示在开发GEN-1的过程中,他们通过这对机械手收集了超过50万小时的“PB级物理交互数据”,用于训练其物理模型。在得到充分训练后,GeneralistAI表示GEN-1在折叠纸箱、打包手机和维护扫地机器人等重复性但精细的机械任务上,成功率高达99%,速度约为上一代GEN-0型号的三倍,并且只需花费大约一个小时的时间就可以达成这一目标。

由此,Generalist AI骄傲的宣布,GEN-1的物理模型已经接近类似GPT-3的拐点,一些任务的性能开始“达到在商业实用环境中部署所需的水平”,并且“我们可以预期每一代新模型都会带来一系列日益复杂的新任务,这些任务都可以被掌握”。

在官方博客中,皮特·弗洛伦斯则指出,GEN-1的开发过程是他个人技术理念的最好诠释:首先,他设置了一个理性的目标,即机器人能够以极高的成功率和速度完成从未见过的各类任务,且完全无需任何特定任务的数据。接着基于这个目标设定了一个解决路径,允许针对特定任务使用少量机器人数据(称之为X),并实现该任务的高水平执行,然后不断减小X,同时提升性能。

聊到这里,前面我们提出的那个问题也得到了回答。Generalist AI所开发的产品到底叫不叫“世界模型”已经不重要了,只要你看到具身智能行业,看好机器人能够大规模地进入实际生产当中,那么Generalist AI确实是值得下注的选择。而Generalist AI这一轮融资也确实是在GEN-1发布之后的两个月内迅速敲定的。

根据报道,老股东英伟达、贝索斯家办Bezos Expeditions、NDFG全部选择了复投,并且是加倍复投。除此而外,新晋投资者包括小米联合创始人林斌、Zoom创始人袁征,华人科学家李飞飞,也包括Radical Ventures、8VC、Union Square Ventures、Hanabi Capital、Norwest这些机构投资人。

换句话说,2026年6月的皮特·弗洛伦斯已经不需要再证明自己了。最起码那些年他吹过的牛逼——比如2025年刚刚创业的皮特·弗洛伦斯曾经在一档播客中说:“通用机器人不是样样都浅尝辄止,而是要在真实任务上专业到足够有用”——已经走在“一一兑现”的路上了。

本文来自微信公众号“投中网”,作者:蒲凡

相关问答

Q皮特·弗洛伦斯为何公开拒绝“世界模型”的标签?

A皮特·弗洛伦斯认为‘目标’比‘标签’更重要。他批评当前世界模型的热情多是‘理念驱动型’的资本市场炒作。在他看来,真正的目标应是让机器人能以极高成功率和速度完成各类新任务,而构建‘世界模型’本身不是目的。

Q皮特·弗洛伦斯的学术背景和早期职业生涯如何影响了他的技术理念?

A皮特·弗洛伦斯在麻省理工学院师从重视‘物理世界理解’的机器人专家拉斯·泰德雷克,这使他形成了‘先设置具体目标,再设计技术路径’的思考方式。在谷歌DeepMind期间,他延续此理念,主导开发了Transporter Network和VLA架构。

Q皮特·弗洛伦斯创立的公司Generalist AI在近期完成了何种规模的融资?主要投资者有哪些?

AGeneralist AI近期完成了4亿美元(约合27亿元人民币)的新融资,估值达20亿美元(约合135.5亿元人民币)。主要投资者包括英伟达旗下NVentures、贝索斯家办Bezos Expeditions、NFDG、小米联合创始人林斌、Zoom创始人袁征以及科学家李飞飞等。

QGeneralist AI发布的GEN-1模型在技术上有何主要突破?

AGEN-1模型通过其研发的机械手收集了超50万小时的物理交互数据进行训练。它在折叠纸箱、打包手机等精细任务上成功率高达99%,速度约为上代GEN-0的三倍,且能快速适应新任务,性能已接近‘商业实用环境中部署所需的水平’。

Q根据文章,李飞飞作为世界模型领域的代表性科学家,为何会投资皮特·弗洛伦斯这家‘拒绝世界模型标签’的公司?

A文章指出,Generalist AI是否叫‘世界模型’已不重要。其技术路径(先设定明确的机器人实用目标)和成果(如GEN-1模型的高成功率与泛化能力)证明,它是实现具身智能和机器人商业化落地的有力竞争者,因此吸引了看好该领域的李飞飞等投资者。

你可能也喜欢

不可能三角根本就是伪问题

加密行业构建了强大的密码学系统,但默认状态下却无法保护用户资金的隐私,所有交易和持仓都公开可查,这成为大规模资金入场的主要障碍。文章认为,区块链本质上是一台无人拥有的慢速、昂贵计算机,其核心价值在于提供无需许可的准入和去中心化信任。资金(尤其是稳定币)是天然适合上链的资产,因为账本记录即资产本身。 然而,行业长期关注的“不可能三角”(去中心化、可扩展性、安全性)并非真正瓶颈。实际阻碍在于两大设计缺陷:合法性与隐私。合法性方面,无许可特性导致监管灰色地带,但随着美国《GENIUS法案》等监管框架落地,合规环境正在改善。 更关键的缺陷是“透明度税”。链上所有交易公开,导致用户面临MEV(矿工可提取价值)被抢跑、夹击等风险,这实质上是一种持续的成本。对于家族办公室、大型机构等严肃资本而言,公开资产负债表是无法接受的。隐私并非与合规对立,现代密码学(如零知识证明)允许在不泄露具体数据的情况下证明合规性(如偿付能力、KYC),实现“可证明的合规隐私”。 作者指出,为链上交易添加隐私保护是一次纯粹升级,它将把加密系统从“公开的谷歌表格”转变为能保守秘密的共享机器,从而吸引数万亿规模的机构资金,真正释放区块链的潜力。

链捕手2分钟前

不可能三角根本就是伪问题

链捕手2分钟前

光芯片,集体扩产

近日,全球光芯片产业链密集出现扩产、投资与供应链绑定动作,以满足AI数据中心对光互连能力激增的需求。 美国方面,Coherent获政府资助扩建德州6英寸磷化铟(InP)产线,产能将提升至4倍,NVIDIA已对其战略投资并锁定未来产能。Lumentum在北卡罗来纳州新建激光器工厂,Nokia则在宾夕法尼亚扩建光子芯片先进测试与封装产能。日本材料商JX Advanced Metals计划大幅投资,将InP衬底产能提升7-10倍。欧洲方面,IQE与Tower Semiconductor达成InP外延片供应协议,推动硅光平台与III-V材料集成;ST计划在法国大幅提升300mm硅光产能;Sivers Semiconductors与格芯合作开发集成激光器的硅光方案。 国内光芯片产业链同样迅猛发展。东山精密旗下索尔思光电宣布投资12亿美元在常州扩建光芯片及光模块产能。三安光电已具备6英寸InP光芯片量产能力,云南锗业亦启动磷化铟单晶片扩产项目。产业链正从模块组装向材料、芯片、封测等全环节延伸。 行业分析指出,无论未来采用可插拔、CPO(共封装光学)还是其他架构,AI算力增长对带宽的需求将持续推高光芯片用量。目前CPO面临技术挑战,可能放缓落地,但光源路线呈现多元化(如硅光+连续波激光器、VCSEL、MicroLED等),将在不同应用场景分层并存。这场全球扩产竞赛实质是各国对AI数据中心光互连时代的关键布局,光子产业链已进入白热化竞争阶段。

marsbit2小时前

光芯片,集体扩产

marsbit2小时前

交易

现货
合约
活动图片