# 空间智能的所有文章

在 HTX 新聞中心流覽與「空间智能」相關的最新資訊與深度分析。潘蓋市場趨勢、專案動態、技術進展及監管政策，提供權威的加密行業洞察。

李飞飞最新长文：当视频生成、机器人和 NVIDIA 都自称世界模型，我们需要一个分类法

李飞飞发表文章，针对当前AI领域中“世界模型”一词被广泛滥用的现象提出一个清晰的功能分类法。她指出，尽管视频生成、机器人和NVIDIA等不同领域都自称构建“世界模型”，但它们实际指的是强化学习闭环（POMDP）中三种不同的功能模块。 **分类法如下：** 1. **渲染器**：输出**观测**（如像素），追求视觉保真度，例如Sora、Genie等视频生成模型。其局限在于“好看不等于物理正确”。 2. **模拟器**：输出**状态**，即在几何、物理和动力学层面忠实的世界表征，服务于建筑设计、机器人训练等需要精确模拟的场景。李飞飞认为这是连接渲染和规划的关键枢纽，被严重低估。 3. **规划器**：输出**动作**，根据观测和目标决定智能体（如机器人）应执行的动作，是感知-行动回路的闭环。 **现状与趋势：** * **渲染器**商业化最成熟，但有物理准确性天花板。 * **规划器**最令人兴奋但最不成熟，实验室演示与实际部署存在巨大鸿沟。 * **模拟器**是核心桥梁，掌握了模拟就同时为渲染和规划提供了基础。当前最重要的趋势是这三类功能的边界正在消融，因为它们共享对世界底层运作（几何、物理、动力学）的同一套理解。例如，World Labs的Marble模型能同时输出用于视觉的高斯泼溅和用于物理模拟的碰撞网格。逻辑终点是构建一个**统一的世界基础模型**，能根据下游需求在渲染、模拟和规划模式间自由切换。尽管面临数据不均衡、优化目标冲突等挑战，但三者的融合将重新定义机器智能与物理世界的关系，推动空间智能的发展。

链捕手9 小時前

李飞飞最新长文：当视频生成、机器人和 NVIDIA 都自称世界模型，我们需要一个分类法

链捕手9 小時前

李飞飞的世界模型宣言

AI专家李飞飞近期发表技术博客，引用维特根斯坦“世界即所发生的一切”的观点，指出当前生成式AI虽能熟练处理语言，却缺乏对物理世界本质的理解。她强调，真正的“世界模型”应让机器超越文本统计，掌握物理空间与时间规律，这是实现具身智能的关键。针对“世界模型”概念日益模糊的现状，李飞飞提出了一个基于“部分可观测马尔可夫决策过程”的清晰框架，并拆解出其三大核心组件：渲染器、模拟器和规划器。 * **渲染器**：负责生成视觉上合理、美观的像素画面（如Sora等视频生成模型），但可能缺乏物理真实性。 * **模拟器**：追求对物理规律的严格遵循，是连接渲染与规划的枢纽，也是当前最薄弱但至关重要的环节，英伟达的Omniverse是该领域的代表。 * **规划器**：负责决策与行动输出，是机器从“观察者”变为“实践者”的关键。李飞飞认为，模拟器是实现AI工业化的核心，但其发展面临高质量3D物理数据稀缺、生成内容存在物理错误（如“穿模”）等巨大挑战。她同时预测，渲染、模拟与规划三者的界限正变得模糊，未来将趋向于一个统一的、可交互的基础模型，能无缝切换于视觉表现与物理仿真之间。最终，李飞飞指出，构建世界模型的竞争本质是定义物理世界数字标准的竞争，这是AI从“谈论世界”走向“理解并与世界交互”的必经之路，是迈向通用人工智能（AGI）的重要一步，但前路依然漫长。

marsbit06/09 00:36

marsbit06/09 00:36

从一张午餐桌到无限宇宙，李飞飞押注AI的下一个维度

斯坦福大学教授、World Labs创始人李飞飞在近期的多次访谈中系统阐述了她对AI发展方向的判断：空间智能（Spatial Intelligence）是下一个前沿，而当前主流的大语言模型存在根本局限。李飞飞指出，人类语言仅有约50万年历史，而视觉与空间感知能力则可追溯至5.4亿年前，是智能演化的基础。语言本质上是对世界的一种“有信息损失”的编码，无法完整捕捉物理世界的三维结构、运动和交互。她举例说明，当前AI模型甚至难以完成“数清视频中椅子数量”这类幼儿级空间任务，更无法像牛顿那样从观测数据中推导物理定律。她创立的World Labs正致力于此方向，其首代模型Marble能够从文本、图像等输入生成可导航、可交互且具有几何一致性的3D环境，这与生成视频有本质区别。Marble模型规模远小于GPT-5，部分原因是高质量3D数据稀缺，且该领域尚处早期。该技术已应用于游戏开发、电影虚拟制作（将周期缩短40倍）、机器人训练、室内设计乃至为强迫症、恐高症患者定制个性化治疗环境。李飞飞展望，空间智能技术将能创造“无限的宇宙”，应用于社交、旅行、创意等多领域，使人类未来可能生活在“多元宇宙”中。她同时也提醒，对AI的讨论应避免乌托邦或末日论的两极化，技术成功的终极标尺应是让人类文明更美好，并始终维护每个人的尊严与自主性。她认为，从“谈论世界”到“理解世界”再到“在世界中行动”，是AI必须完成的进化。这条道路虽充满挑战，但意义深远，正如她所言：“感知先于语言，空间先于符号。”

marsbit05/27 00:14

marsbit05/27 00:14

# 空间智能的所有文章

李飞飞最新长文：当视频生成、机器人和 NVIDIA 都自称世界模型，我们需要一个分类法

李飞飞的世界模型宣言

从一张午餐桌到无限宇宙，李飞飞押注AI的下一个维度

熱門分類

熱門標籤

技术发展

项目动态