# 愿景的所有文章

在 HTX 新聞中心流覽與「愿景」相關的最新資訊與深度分析。潘蓋市場趨勢、專案動態、技術進展及監管政策，提供權威的加密行業洞察。

AI2发布全开源网络代理 MolmoWeb:仅凭“视觉”即可掌控网页

艾伦人工智能研究所（AI2）近日发布全开源网络代理 MolmoWeb。与传统依赖网页底层代码（DOM）的方式不同，MolmoWeb 仅通过读取屏幕截图进行决策，实现了纯视觉驱动的网络导航，标志着技术上的重大突破。 MolmoWeb 的工作原理是捕获浏览器窗口截图，通过视觉分析决定下一步操作（如点击、滚动、翻页），并循环执行。这种方式使其比传统代理更稳定，因为视觉布局通常比代码更统一，且决策过程对人类而言更透明、可解释。尽管模型规模较小（4B 和 8B 参数），但性能表现突出：在 WebVoyager 测试中，8B 版本得分达 78.2%，接近 OpenAI 的专有模型 o3（79.3%）。通过多次运行筛选最佳结果，成功率可进一步提升至 94.7%，在 UI 元素定位测试中甚至超越了 Anthropic 的 Claude3.7。 AI2 同时开源了大规模数据集 MolmoWebMix，包含 3.6 万次真实浏览任务和超过 220 万个截图-问答对，部分合成数据经 GPT-4o 验证，显示在引导智能体方面优于人类轨迹。 MolmoWeb 已在 Hugging Face 和 GitHub 上通过 Apache 2.0 协议完全开放。尽管在复杂指令、登录验证和法律合规等方面仍存在挑战，但 AI2 强调开源与社区协作对对抗大型科技公司数据垄断的重要性。

marsbit03/26 01:39

marsbit03/26 01:39

以太坊能否撑到实现Buterin的AI愿景？

以太坊联合创始人Vitalik Buterin近期提出，希望将以太坊打造为去中心化人工智能的基础设施，但这一愿景正面临现实挑战。Buterin认为，当前追求通用人工智能（AGI）的目标过于空泛，应转向以保护人类权益为核心的发展方向，避免权力集中于少数机构或机器手中。他提出以太坊可扮演两大角色：一是作为安全交互基础设施，支持用户通过本地模型私密使用AI并完成匿名支付，同时验证AI系统行为以降低信任风险；二是成为共享经济层，使AI程序能在无中心权威介入的情况下实现相互支付、保证金存储及信誉建立。长期来看，AI与零知识证明（ZK）等技术结合，或能激活2014年提出的诸多创新构想。然而，尽管这一长期叙事格局宏大，以太坊当下正承受着实际压力，其能否支撑到实现Buterin的AI愿景仍需观察。

ambcrypto02/10 07:32

ambcrypto02/10 07:32

# 愿景的所有文章

AI2发布全开源网络代理 MolmoWeb:仅凭“视觉”即可掌控网页

以太坊能否撑到实现Buterin的AI愿景？

熱門分類

熱門標籤

市场分析

项目动态