# 空间智能的所有文章

在 HTX 新聞中心流覽與「空间智能」相關的最新資訊與深度分析。潘蓋市場趨勢、專案動態、技術進展及監管政策,提供權威的加密行業洞察。

李飞飞最新长文:当视频生成、机器人和 NVIDIA 都自称世界模型,我们需要一个分类法

李飞飞发表文章,针对当前AI领域中“世界模型”一词被广泛滥用的现象提出一个清晰的功能分类法。她指出,尽管视频生成、机器人和NVIDIA等不同领域都自称构建“世界模型”,但它们实际指的是强化学习闭环(POMDP)中三种不同的功能模块。 **分类法如下:** 1. **渲染器**:输出**观测**(如像素),追求视觉保真度,例如Sora、Genie等视频生成模型。其局限在于“好看不等于物理正确”。 2. **模拟器**:输出**状态**,即在几何、物理和动力学层面忠实的世界表征,服务于建筑设计、机器人训练等需要精确模拟的场景。李飞飞认为这是连接渲染和规划的关键枢纽,被严重低估。 3. **规划器**:输出**动作**,根据观测和目标决定智能体(如机器人)应执行的动作,是感知-行动回路的闭环。 **现状与趋势:** * **渲染器**商业化最成熟,但有物理准确性天花板。 * **规划器**最令人兴奋但最不成熟,实验室演示与实际部署存在巨大鸿沟。 * **模拟器**是核心桥梁,掌握了模拟就同时为渲染和规划提供了基础。 当前最重要的趋势是这三类功能的边界正在消融,因为它们共享对世界底层运作(几何、物理、动力学)的同一套理解。例如,World Labs的Marble模型能同时输出用于视觉的高斯泼溅和用于物理模拟的碰撞网格。 逻辑终点是构建一个**统一的世界基础模型**,能根据下游需求在渲染、模拟和规划模式间自由切换。尽管面临数据不均衡、优化目标冲突等挑战,但三者的融合将重新定义机器智能与物理世界的关系,推动空间智能的发展。

链捕手9 小時前

李飞飞最新长文:当视频生成、机器人和 NVIDIA 都自称世界模型,我们需要一个分类法

链捕手9 小時前

李飞飞的世界模型宣言

AI专家李飞飞近期发表技术博客,引用维特根斯坦“世界即所发生的一切”的观点,指出当前生成式AI虽能熟练处理语言,却缺乏对物理世界本质的理解。她强调,真正的“世界模型”应让机器超越文本统计,掌握物理空间与时间规律,这是实现具身智能的关键。 针对“世界模型”概念日益模糊的现状,李飞飞提出了一个基于“部分可观测马尔可夫决策过程”的清晰框架,并拆解出其三大核心组件:渲染器、模拟器和规划器。 * **渲染器**:负责生成视觉上合理、美观的像素画面(如Sora等视频生成模型),但可能缺乏物理真实性。 * **模拟器**:追求对物理规律的严格遵循,是连接渲染与规划的枢纽,也是当前最薄弱但至关重要的环节,英伟达的Omniverse是该领域的代表。 * **规划器**:负责决策与行动输出,是机器从“观察者”变为“实践者”的关键。 李飞飞认为,模拟器是实现AI工业化的核心,但其发展面临高质量3D物理数据稀缺、生成内容存在物理错误(如“穿模”)等巨大挑战。她同时预测,渲染、模拟与规划三者的界限正变得模糊,未来将趋向于一个统一的、可交互的基础模型,能无缝切换于视觉表现与物理仿真之间。 最终,李飞飞指出,构建世界模型的竞争本质是定义物理世界数字标准的竞争,这是AI从“谈论世界”走向“理解并与世界交互”的必经之路,是迈向通用人工智能(AGI)的重要一步,但前路依然漫长。

marsbit06/09 00:36

李飞飞的世界模型宣言

marsbit06/09 00:36

从一张午餐桌到无限宇宙,李飞飞押注AI的下一个维度

斯坦福大学教授、World Labs创始人李飞飞在近期的多次访谈中系统阐述了她对AI发展方向的判断:空间智能(Spatial Intelligence)是下一个前沿,而当前主流的大语言模型存在根本局限。 李飞飞指出,人类语言仅有约50万年历史,而视觉与空间感知能力则可追溯至5.4亿年前,是智能演化的基础。语言本质上是对世界的一种“有信息损失”的编码,无法完整捕捉物理世界的三维结构、运动和交互。她举例说明,当前AI模型甚至难以完成“数清视频中椅子数量”这类幼儿级空间任务,更无法像牛顿那样从观测数据中推导物理定律。 她创立的World Labs正致力于此方向,其首代模型Marble能够从文本、图像等输入生成可导航、可交互且具有几何一致性的3D环境,这与生成视频有本质区别。Marble模型规模远小于GPT-5,部分原因是高质量3D数据稀缺,且该领域尚处早期。该技术已应用于游戏开发、电影虚拟制作(将周期缩短40倍)、机器人训练、室内设计乃至为强迫症、恐高症患者定制个性化治疗环境。 李飞飞展望,空间智能技术将能创造“无限的宇宙”,应用于社交、旅行、创意等多领域,使人类未来可能生活在“多元宇宙”中。她同时也提醒,对AI的讨论应避免乌托邦或末日论的两极化,技术成功的终极标尺应是让人类文明更美好,并始终维护每个人的尊严与自主性。 她认为,从“谈论世界”到“理解世界”再到“在世界中行动”,是AI必须完成的进化。这条道路虽充满挑战,但意义深远,正如她所言:“感知先于语言,空间先于符号。”

marsbit05/27 00:14

从一张午餐桌到无限宇宙,李飞飞押注AI的下一个维度

marsbit05/27 00:14

活动图片