# 人工智能分类法的所有文章

在 HTX 新闻中心浏览与「人工智能分类法」相关的最新资讯与深度分析。潘盖市场趋势、项目动态、技术进展及监管政策，提供权威的加密行业洞察。

李飞飞最新长文：当视频生成、机器人和 NVIDIA 都自称世界模型，我们需要一个分类法

李飞飞发表文章，针对当前AI领域中“世界模型”一词被广泛滥用的现象提出一个清晰的功能分类法。她指出，尽管视频生成、机器人和NVIDIA等不同领域都自称构建“世界模型”，但它们实际指的是强化学习闭环（POMDP）中三种不同的功能模块。 **分类法如下：** 1. **渲染器**：输出**观测**（如像素），追求视觉保真度，例如Sora、Genie等视频生成模型。其局限在于“好看不等于物理正确”。 2. **模拟器**：输出**状态**，即在几何、物理和动力学层面忠实的世界表征，服务于建筑设计、机器人训练等需要精确模拟的场景。李飞飞认为这是连接渲染和规划的关键枢纽，被严重低估。 3. **规划器**：输出**动作**，根据观测和目标决定智能体（如机器人）应执行的动作，是感知-行动回路的闭环。 **现状与趋势：** * **渲染器**商业化最成熟，但有物理准确性天花板。 * **规划器**最令人兴奋但最不成熟，实验室演示与实际部署存在巨大鸿沟。 * **模拟器**是核心桥梁，掌握了模拟就同时为渲染和规划提供了基础。当前最重要的趋势是这三类功能的边界正在消融，因为它们共享对世界底层运作（几何、物理、动力学）的同一套理解。例如，World Labs的Marble模型能同时输出用于视觉的高斯泼溅和用于物理模拟的碰撞网格。逻辑终点是构建一个**统一的世界基础模型**，能根据下游需求在渲染、模拟和规划模式间自由切换。尽管面临数据不均衡、优化目标冲突等挑战，但三者的融合将重新定义机器智能与物理世界的关系，推动空间智能的发展。

链捕手07/05 09:12

李飞飞最新长文：当视频生成、机器人和 NVIDIA 都自称世界模型，我们需要一个分类法

链捕手07/05 09:12

李飞飞团队厘清“世界模型”概念，Sora只能算渲染器

斯坦福大学教授李飞飞团队联合发布概念分析文章《世界模型的功能分类法》，指出“世界模型”是AI领域最重要且被严重滥用的术语之一。文章将当前各类被称为“世界模型”的系统，依据其在部分可观马尔可夫决策过程中的功能，归约为三类：渲染器、模拟器和规划器。渲染器（如OpenAI的Sora、各类文生视频模型）的核心是生成面向人类视觉的高保真像素画面，但缺乏物理精确性，无法用于需要真实物理计算的任务。模拟器（如NVIDIA Omniverse）的核心是生成精确的物理状态数据，用于数字孪生、工程分析等，但受限于高质量3D物理数据的稀缺。规划器（如各类机器人控制模型）则根据观测和目标输出具体动作指令。文章指出，概念混乱源于各类系统只承载了“理解世界”完整认知循环中的一个环节，却被营销和叙事包装为完整模型。例如，Sora仅能沿视频数据固有序列“被动续写”，无法基于外部动作进行状态转移预测，因此本质上是渲染器，而非真正的世界模拟器。澄清概念有助于技术选型、投资判断和建立可比基准，避免因能力误解导致决策失误。未来的方向是三类功能的融合，但当前认清各自边界更为重要。

marsbit06/04 03:16

marsbit06/04 03:16

# 人工智能分类法的所有文章

李飞飞最新长文：当视频生成、机器人和 NVIDIA 都自称世界模型，我们需要一个分类法

李飞飞团队厘清“世界模型”概念，Sora只能算渲染器

热门分类

热门标签

交易策略

监管政策