你的“小龙虾”正在裸奔?CertiK实测:带漏洞的OpenClaw Skill如何骗过审核,无授权接管电脑

marsbit发布于2026-03-17更新于2026-03-17

文章摘要

开源自托管AI智能体平台OpenClaw(俗称“小龙虾”)及其应用市场Clawhub近期迅速走红,但CertiK安全研究显示其第三方Skill插件存在严重安全漏洞。行业普遍依赖“上架前扫描审核”作为安全防线,但该机制存在多重缺陷:静态检测易被代码改写绕过,AI审核无法识别隐藏于正常逻辑中的漏洞,且未完成扫描的Skill也可直接安装,用户无预警即可触发风险。 CertiK团队实测证实,一款表面合规的网页搜索Skill成功绕过所有检测,并在安装后通过远程指令触发漏洞,实现了在宿主设备上的任意命令执行(如弹出计算器)。问题根源在于OpenClaw将沙盒隔离设为可选而非强制配置,多数用户为保功能关闭沙盒,导致智能体处于“裸奔”状态。 CertiK建议开发者强制启用默认沙盒隔离与精细化权限管控,禁止第三方代码继承高权限;用户需避免在敏感环境部署OpenClaw,暂以虚拟机或闲置设备运行。审核扫描无法替代运行时隔离机制,唯有确立强制安全边界方能保障生态安全。

近期,开源自托管 AI 智能体平台 OpenClaw(圈内俗称“小龙虾”)凭借灵活的可扩展性、自主可控的部署特性迅速走红,成为个人 AI 智能体赛道的现象级产品。其生态核心 Clawhub 作为应用市场,汇聚了海量第三方 Skill 功能插件,能让智能体一键解锁从网页搜索、内容创作,到加密钱包操作、链上交互、系统自动化等高阶能力,生态规模与用户量迎来爆发式增长。

但对于这类运行在高权限环境中的第三方 Skill,平台真正的安全边界到底在哪里?

近日,全球最大的 Web3 安全公司 CertiK,发布了针对 Skill 安全的最新研究。文中指出,当前市场对 AI 智能体生态的安全边界存在认知错位:行业普遍将“Skill 扫描”当作核心安全边界,而这套机制在黑客攻击面前几乎形同虚设。

如果把 OpenClaw 比作一台智能设备的操作系统,Skill 就是安装在系统里的各类 APP。与普通消费级 APP 不同,OpenClaw 中的一些 Skill 运行在高权限环境中,可直接访问本地文件、调用系统工具、连接外部服务、执行宿主环境命令,甚至操作用户的加密数字资产,一旦出现安全问题,将直接导致敏感信息泄露、设备被远程接管、数字资产被盗等严重后果。

目前整个行业针对第三方 Skill 的通用安全解决方案,是“上架前扫描审核”。OpenClaw 的 Clawhub 也搭建了一套三层审核防护体系:融合 VirusTotal 代码扫描、静态代码检测引擎、AI 逻辑一致性检测,通过风险分级给用户推送安全弹窗提示,试图以此守住生态安全。但 CertiK 的研究与概念验证攻击测试证实,这套检测体系在真实的攻防对抗中存在短板,无法承担起安全防护的核心重任。

研究首先拆解了现有检测机制的天然局限性:

静态检测规则极易被绕过。这套引擎核心靠匹配代码特征识别风险,比如将“读取环境敏感信息 + 外发网络请求”的组合判定为高危行为,但攻击者只需对代码做轻微的语法改写,在完全保留恶意逻辑的前提下,就能轻松绕过特征匹配,如同给危险内容换了一套同义表述,就让安检仪彻底失效。

AI 审核存在先天检测盲区。Clawhub 的 AI 审核核心定位是“逻辑一致性检测器”,只能揪出“声明功能与实际行为不符”的明显恶意代码,却对隐藏在正常业务逻辑里的可利用漏洞束手无策,就像很难从一份看似合规的合同里,发现藏在条款深处的致命陷阱。

更致命的是,审核流程存在底层设计缺陷:即便 VirusTotal 的扫描结果还处于“待处理”状态,未完成全流程“体检”的 Skill 也能直接上架公开,用户可在无警告的情况下完成安装,给攻击者留下了可乘之机。

为了验证风险的真实危害性,CertiK 研究团队完成了完整的测试。团队开发了一款名为“test-web-searcher”的 Skill,表面上是完全合规的网页搜索工具,代码逻辑完全符合常规开发规范,实则在正常功能流程中植入了远程代码执行漏洞。

该 Skill 绕过了静态引擎与 AI 审核的检测,在 VirusTotal 扫描仍为待处理状态时,就实现了无任何安全警告的正常安装;最终通过 Telegram 远程发了一句指令,就成功触发漏洞,在宿主设备上实现了任意命令执行(演示中直接控制系统弹出了计算器)。

CertiK 在研究中明确指出,这些问题并非 OpenClaw 独有的产品 bug,而是整个 AI 智能体行业的普遍认知误区:行业普遍把“审核扫描”当成了核心安全防线,却忽略了真正的安全根基,是运行时的强制隔离与精细化权限管控。这就像苹果 iOS 生态的安全核心,从来不是 App Store 的严格审核,而是系统强制的沙盒机制、精细化的权限管控,让每个 APP 只能在专属的“隔离舱”里运行,无法随意获取系统权限。而 OpenClaw 现有的沙盒机制是可选而非强制的,且高度依赖用户手动配置,绝大多数用户为了保证 Skill 的功能可用性,都会选择关闭沙盒,最终让智能体处于“裸奔”状态,一旦安装了带漏洞或恶意代码的 Skill,就会直接导致灾难性后果。

针对此次发现的问题,CertiK 也给出了安全指引:

● 对 OpenClaw 等 AI 智能体开发者而言,须将沙盒隔离设为第三方 Skill 的默认强制配置,精细化 Skill 的权限管控模型,绝不允许第三方代码默认继承宿主机的高权限。

● 对普通用户而言,Skill 市场里带有“安全”标签的 Skill,仅仅代表它未被检测出风险,不等于绝对安全。在官方将底层的强隔离机制设为默认配置之前,建议把 OpenClaw 部署在不重要的闲置设备或虚拟机中,千万不要让它靠近敏感文件、密码凭证和高价值加密资产。

当前 AI 智能体赛道正处于爆发前夜,生态扩张的速度绝不能跑赢安全建设的脚步。审核扫描只能拦住初级的恶意攻击,却永远成不了高权限智能体的安全边界。唯有从“追求完美检测”转向“默认风险存在的损害遏制”,从运行时底层强制确立隔离边界,才能真正兜住 AI 智能体的安全底线,让这场技术变革行稳致远。

相关问答

QOpenClaw平台中的Skill如果存在漏洞,可能带来哪些具体风险?

AOpenClaw中的Skill运行在高权限环境中,一旦存在漏洞,可能导致敏感信息泄露、设备被远程接管、数字资产被盗等严重后果,甚至黑客可通过远程指令执行任意命令,完全控制用户设备。

QCertiK的研究发现OpenClaw的Clawhub审核体系存在哪些主要缺陷?

AClawhub的三层审核体系存在静态检测规则易被绕过、AI审核无法识别隐藏漏洞、以及审核流程设计缺陷(如VirusTotal扫描未完成时Skill即可上架),导致恶意代码能轻易避开检测。

QCertiK如何通过测试验证OpenClaw的安全风险?

ACertiK团队开发了一个表面合规的网页搜索Skill,在其中植入远程代码执行漏洞。该Skill绕过了所有审核检测,在VirusTotal扫描未完成时上架,并通过Telegram远程指令成功触发漏洞,在宿主设备上执行了任意命令(如弹出计算器)。

Q文章指出AI智能体行业的普遍安全认知误区是什么?

A行业错误地将‘审核扫描’视为核心安全防线,而忽略了真正的安全根基应是运行时的强制隔离与精细化权限管控,类似iOS的沙盒机制,而非依赖审核。

QCertiK对OpenClaw开发者和普通用户分别给出了哪些安全建议?

A对开发者:应将沙盒隔离设为Skill的默认强制配置,实施精细化权限管控,禁止第三方代码默认继承高权限。对用户:需警惕‘安全’标签不代表绝对安全,建议将OpenClaw部署在非敏感设备或虚拟机中,远离敏感数据和加密资产。

你可能也喜欢

Anthropic警告的递归AI,田渊栋新公司刚刚走出了「第一步」

近日,Anthropic发布文章披露,其代码库超过80%由AI撰写,并警告AI“递归自我改进”(即AI自主设计、训练后续版本)可能带来风险,呼吁行业建立暂停机制。与此同时,由田渊栋等人联合创立的新公司Recursive Superintelligence结束了隐身状态,发布了其首项公开技术成果——“迈向自动化AI研究的第一步”。 该系统旨在将传统AI研究中“提出想法-编写代码-运行实验-分析结果”的人工闭环自动化。它能够针对给定目标自动生成实验思路、实现代码、运行验证并从中学习,从而自主推进研究进程,并内置了防止“奖励作弊”的机制。 Recursive在三个差异显著的基准测试中取得了领先结果: 1. **小模型训练优化**:在固定计算预算下,将模型验证损失进一步降低,相当于以更少时间达到同等效果。 2. **训练速度竞速**:在社区持续优化两年的基准上,将训练时间从79.7秒缩短至77.5秒,核心改进包括在注意力层使用FP8计算、为优化器添加退火噪声等。 3. **GPU内核优化**:在英伟达的底层计算内核基准测试中,将整体得分提升至0.754,缩小了与硬件理论极限的差距,而这些优化策略并非来自团队的专业知识,而是由系统自主发现。 Recursive团队阵容强大,已获得巨额融资,其目标是构建能够递归提升自身研发能力的AI系统。这与Anthropic的警告形成了微妙对比:一方正在实践AI加速AI研发的路径,另一方则呼吁为可能到来的“递归自我改进”时刻做好风险管控准备。当前成果虽仅是迈向自动化研究的初步尝试,但标志着一个能够自我增强的AI研发新范式已开始运转。

marsbit22分钟前

Anthropic警告的递归AI,田渊栋新公司刚刚走出了「第一步」

marsbit22分钟前

黄金抄底指南:盯住利率,别只看战争

**黄金抄底指南:盯住利率,别只看战争** 金价在今年1月底触及历史新高后,开启了持续下跌,并于6月进入技术性熊市。许多投资者困惑:为何战争冲突下黄金不涨反跌? 文章指出,核心原因在于黄金的定价逻辑已从地缘冲突引发的“避险”情绪,切换为对利率的定价。战争推高油价和通胀预期,迫使央行维持紧缩货币政策。黄金作为不生息资产,利率(持有机会成本)越高,其吸引力就越低。5月份一度出现的和平传闻导致金价大跌,恰恰证明了“加息预期”而非“战争与否”才是当前市场的主线。 此外,本轮下跌伴随全市场去杠杆。当投资者需要补充保证金时,会优先抛售流动性好的资产,导致黄金、白银、比特币乃至纳斯达克指数在短期内呈现高度同步下跌,这与资产基本面无关。 对于抄底时机,文章建议关注三个关键信号:1. **加息预期见顶**(如市场对最后一次加息的定价完成);2. **霍尔木兹海峡复航**(缓解通胀压力的上游开关);3. **黄金ETF资金流转为净流入**(表明强制抛售压力减弱)。历史经验(如2008年、2022年)表明,金价见底通常与政策拐点(货币转向)同步,而非与战事结束同步。 文章最后给出个人策略思路(非投资建议):在4000、3700、3500美元附近分三笔试探性布局,总仓位不超过三成,并等待上述信号中至少两个出现后,再考虑追加仓位。核心结论是:在当前的宏观环境下,关注利率动向比单纯关注战争局势,对于黄金投资更为重要。

marsbit28分钟前

黄金抄底指南:盯住利率,别只看战争

marsbit28分钟前

近期链上回顾:美股冲击下毫无主线的炒

近期链上行情回顾显示,在以太坊主网沉寂后,市场注意力重回Solana,但缺乏明确主线,整体呈现“社区回归与注意力争夺”的拉锯态势。 一方面,注意力争夺成为主流玩法。市场依赖名人喊单、热点事件和快速交易,例如$JOTCHUA靠网络梗和KOL讨论热度暴涨,而同概念代币$WORLDCUP与$PITCH则因缺乏关注表现悬殊。平台pump.fun推出的悬赏任务功能进一步放大了这种趋势,出现了如纹身换赏金等极端案例,虽制造了短期热点,但也引发负面争议,被视作一种博眼球的流量游戏。 另一方面,部分项目展现出社区回归的迹象。这些项目不依赖单一名人喊单,而是通过持续建设、交付产品和凝聚社区共识获得长期发展。例如$neet、$troll、$buttcoin等老牌社区币,凭借鲜明的文化主题和活跃社区保持了相对稳定的生命力。新兴链游项目$KINS(Kintara)是典型代表,它通过扎实的游戏内容更新、经济机制设计和社区活动(如游戏内集成热门币、举办玩家赛事),逐步赢得了玩家信任,吸引了包括知名KOL在内的用户自发参与,建立起良性的网络效应。 文章最后反思,市场在追逐热点的同时,更应思考何为可持续的信任构建,期待更多依靠社区共识和真实价值支撑的项目能引导市场走向更健康的方向。

marsbit28分钟前

近期链上回顾:美股冲击下毫无主线的炒

marsbit28分钟前

交易

现货
合约
活动图片