CertiK Kiểm tra thực tế: OpenClaw Skill chứa lỗ hổng đã lừa qua kiểm duyệt và chiếm quyền điều khiển máy tính trái phép như thế nào

marsbitXuất bản vào 2026-03-22Cập nhật gần nhất vào 2026-03-22

Tóm tắt

Gần đây, nền tảng AI tự lưu trữ mã nguồn mở OpenClaw (còn gọi là “Tôm hùm đất”) đã trở nên phổ biến nhờ khả năng mở rộng linh hoạt. Tuy nhiên, nghiên cứu mới từ CertiK - công ty bảo mật Web3 lớn nhất thế giới, cảnh báo về lỗ hổng bảo mật nghiêm trọng trong cơ chế kiểm duyệt Skill (tính năng bổ sung) của nền tảng. Các Skill trên OpenClaw thường chạy trong môi trường có quyền cao, có thể truy cập tệp tin, công cụ hệ thống, thực thi lệnh và thậm chí quản lý tài sản kỹ thuật số. CertiK phát hiện cơ chế phòng thủ ba lớp hiện tại của Clawhub (cửa hàng ứng dụng), bao gồm quét mã bằng VirusTotal, kiểm tra mã tĩnh và AI, dễ dàng bị bỏ qua. Nhóm nghiên cứu đã tạo một Skill độc hại có tên “test-web-searcher” ẩn chứa lỗ hổng thực thi mã từ xa. Skill này vượt qua mọi lớp kiểm duyệt, được cài đặt mà không có cảnh báo, và cho phép kẻ tấn công điều khiển thiết bị từ xa thông qua Telegram. CertiK nhấn mạnh vấn đề nằm ở quan niệm sai lầm của toàn ngành: việc kiểm duyệt không thể là ranh giới bảo mật chính. Thay vào đó, cơ chế cách ly (sandbox) bắt buộc và kiểm soát quyền chi tiết mới là nền tảng bảo mật thực sự. OpenClaw hiện để sandbox là tùy chọn, không bắt buộc, khiến nhiều thiết bị dễ bị tấn công. Khuyến nghị: Nhà phát triển cần bắt buộc sandbox và kiểm soát quyền cho Skill. Người dùng nên cài OpenClaw trên thiết bị không quan trọng hoặc máy ảo, tránh xa dữ liệu nhạy cảm và tài sản có giá trị.

Gần đây, nền tảng tác nhân AI tự lưu trữ mã nguồn mở OpenClaw (thường được gọi trong giới là "Tôm hùm đất") đã nhanh chóng trở nên nổi tiếng nhờ khả năng mở rộng linh hoạt và đặc tính triển khai tự chủ, trở thành một sản phẩm hiện tượng trong lĩnh vực tác nhân AI cá nhân. Clawhub, trung tâm của hệ sinh thái này, hoạt động như một chợ ứng dụng, tập hợp vô số plugin chức năng Skill của bên thứ ba, cho phép tác nhân AI mở khóa ngay lập tức các khả năng cao cấp từ tìm kiếm web, sáng tạo nội dung, đến thao tác ví mã hóa, tương tác trên chuỗi, tự động hóa hệ thống, v.v., quy mô hệ sinh thái và lượng người dùng đang tăng trưởng bùng nổ.

Nhưng đối với các Skill của bên thứ ba chạy trong môi trường quyền cao như vậy, ranh giới bảo mật thực sự của nền tảng nằm ở đâu?

Gần đây, CertiK, công ty bảo mật Web3 lớn nhất toàn cầu, đã công bố nghiên cứu mới nhất về bảo mật Skill. Bài viết chỉ ra rằng thị trường hiện đang có sự hiểu lầm về nhận thức đối với ranh giới an ninh của hệ sinh thái tác nhân AI: ngành công nghiệp phổ biến coi "quét Skill" là ranh giới bảo mật cốt lõi, nhưng cơ chế này gần như vô dụng trước các cuộc tấn công của hacker.

Nếu so sán OpenClaw với một hệ điều hành thiết bị thông minh, thì Skill chính là các APP khác nhau được cài đặt trong hệ thống. Khác với APP tiêu dùng thông thường, một số Skill trong OpenClaw chạy trong môi trường quyền cao, có thể trực tiếp truy cập tệp cục bộ, gọi công cụ hệ thống, kết nối dịch vụ bên ngoài, thực thi lệnh môi trường máy chủ, thậm chí thao tác tài sản kỹ thuật số mã hóa của người dùng. Một khi xảy ra sự cố bảo mật, hậu quả nghiêm trọng như rò rỉ thông tin nhạy cảm, thiết bị bị chiếm quyền điều khiển từ xa, tài sản kỹ thuật số bị đánh cắp sẽ xảy ra trực tiếp.

Hiện tại, giải pháp bảo mật phổ biến của toàn ngành cho Skill của bên thứ ba là "quét và kiểm duyệt trước khi lên kệ". Clawhub của OpenClaw cũng đã xây dựng một hệ thống phòng hộ kiểm duyệt ba tầng: kết hợp quét mã VirusTotal, công cụ phát hiện mã tĩnh, phát hiện tính nhất quán logic bằng AI, đẩy thông báo cảnh báo an toàn đến người dùng thông qua phân loại rủi ro, cố gắng bảo vệ an ninh hệ sinh thái bằng cách này. Nhưng nghiên cứu và kiểm tra tấn công xác minh khái niệm (PoC) của CertiK xác nhận rằng hệ thống phát hiện này có điểm yếu trong đối kháng tấn công-phòng thủ thực tế và không thể đảm nhận trọng trách cốt lõi của phòng hộ bảo mật.

Nghiên cứu đầu tiên phân tích các hạn chế tự nhiên của cơ chế phát hiện hiện có:

Quy tắc phát hiện tĩnh rất dễ bị bỏ qua. Cốt lõi của công cụ này là khớp đặc trưng mã để nhận diện rủi ro, ví dụ kết hợp "đọc thông tin nhạy cảm môi trường + gửi yêu cầu mạng" được đánh giá là hành vi nguy hiểm cao, nhưng kẻ tấn công chỉ cần viết lại cú pháp mã một chút, trong khi vẫn giữ nguyên hoàn toàn logic độc hại, có thể dễ dàng vượt qua sự khớp đặc trưng, giống như thay một cách diễn đạt đồng nghĩa cho nội dung nguy hiểm, khiến máy kiểm tra an ninh hoàn toàn mất tác dụng.

Kiểm duyệt AI có điểm mù phát hiện bẩm sinh. Kiểm duyệt AI cốt lõi của Clawhub định vị là "bộ phát hiện tính nhất quán logic", chỉ có thể vạch trần mã độc rõ ràng "chức năng khai báo không phù hợp với hành vi thực tế", nhưng lại bó tay trước các lỗ hổng khai thác được ẩn giấu trong logic nghiệp vụ bình thường, giống như rất khó phát hiện ra cái bẫy chết người ẩn sâu trong các điều khoản từ một bản hợp đồng có vẻ tuân thủ.

Nguy hiểm hơn nữa, quy trình kiểm duyệt có thiết kế lỗi cơ bản: ngay cả khi kết quả quét của VirusTotal vẫn ở trạng thái "đang chờ xử lý", chưa hoàn thành "kiểm tra sức khỏe" toàn bộ quy trình, Skill vẫn có thể lên kệ công khai trực tiếp, người dùng có thể cài đặt hoàn tất trong tình trạng không có cảnh báo, tạo cơ hội cho kẻ tấn công.

Để xác minh tác hại rủi ro thực tế, nhóm nghiên cứu CertiK đã hoàn thành bài kiểm tra đầy đủ. Nhóm đã phát triển một Skill có tên "test-web-searcher", bề ngoài là một công cụ tìm kiếm web hoàn toàn tuân thủ, logic mã hoàn toàn phù hợp với quy chuẩn phát triển thông thường, nhưng thực tế đã cấy lỗ hổng thực thi mã từ xa vào quy trình chức năng bình thường.

Skill này đã vượt qua sự phát hiện của công cụ tĩnh và kiểm duyệt AI, trong khi quét VirusTotal vẫn ở trạng thái chờ xử lý, đã thực hiện cài đặt bình thường không có bất kỳ cảnh báo an toàn nào; cuối cùng thông qua Telegram gửi từ xa một lệnh, đã kích hoạt thành công lỗ hổng, thực hiện thành công lệnh bất kỳ trên thiết bị máy chủ (trong bản demo đã điều khiển hệ thống mở trực tiếp máy tính).

CertiK trong nghiên cứu đã chỉ rõ, những vấn đề này không phải là lỗi sản phẩm riêng của OpenClaw, mà là điểm hiểu lầm phổ biến của toàn ngành công nghiệp tác nhân AI: ngành công nghiệp phổ biến coi "quét kiểm duyệt" là tuyến phòng thủ an ninh cốt lõi, nhưng lại bỏ qua nền tảng an ninh thực sự, chính là cách ly bắt buộc trong thời gian chạy và quản lý quyền hạn tinh vi. Điều này giống như cốt lõi bảo mật của hệ sinh thái iOS Apple, không bao giờ là kiểm duyệt nghiêm ngặt của App Store, mà là cơ chế hộp cát bắt buộc của hệ thống, quản lý quyền hạn tinh vi, cho phép mỗi APP chỉ chạy trong "khoang cách ly" chuyên dụng, không thể tùy ý lấy quyền hệ thống. Còn cơ chế hộp cát hiện có của OpenClaw là tùy chọn chứ không bắt buộc, và phụ thuộc nhiều vào cấu hình thủ công của người dùng, đa số người dùng để đảm bảo tính khả dụng chức năng của Skill sẽ chọn tắt hộp cát, cuối cùng khiến tác nhân AI ở trạng thái "chạy không", một khi cài đặt Skill có lỗ hổng hoặc mã độc, sẽ trực tiếp dẫn đến hậu quả thảm khốc.

Đối với các vấn đề phát hiện lần này, CertiK cũng đưa ra hướng dẫn an ninh:

● Đối với các nhà phát triển tác nhân AI như OpenClaw, phải đặt cách ly hộp cát thành cấu hình bắt buộc mặc định cho Skill của bên thứ ba, tinh vi hóa mô hình quản lý quyền hạn của Skill, tuyệt đối không cho phép mã của bên thứ ba mặc định kế thừa quyền cao của máy chủ.

● Đối với người dùng thông thường, Skill trên chợ có nhãn "an toàn", chỉ đại diện cho nó chưa được phát hiện rủi ro, không bằng an toàn tuyệt đối. Trước khi bên chính thức đặt cơ chế cách ly mạnh mẽ cơ bản thành cấu hình mặc định, khuyến nghị triển khai OpenClaw trên thiết bị không quan trọng, không dùng đến hoặc máy ảo, tuyệt đối không để nó đến gần tệp nhạy cảm, chứng chỉ mật khẩu và tài sản mã hóa giá trị cao.

Hiện tại lĩnh vực tác nhân AI đang ở đêm trước của bùng nổ, tốc độ mở rộng hệ sinh thái tuyệt đối không thể chạy nhanh hơn bước chân xây dựng an ninh. Quét kiểm duyệt chỉ có thể chặn các cuộc tấn công độc hại sơ cấp, nhưng mãi mãi không thể trở thành ranh giới an ninh của tác nhân AI quyền cao. Chỉ có thể chuyển từ "theo đuổi phát hiện hoàn hảo" sang "mặc định sự tồn tại của rủi ro để ngăn chặn thiệt hại", từ thiết lập ranh giới cách ly bắt buộc từ tầng dưới thời gian chạy, mới thực sự đảm bảo được đường底线 an ninh của tác nhân AI, để cuộc cách mạng công nghệ này tiến triển vững chắc và lâu dài.

Bài nghiên cứu gốc:https://x.com/hhj4ck/status/2033527312042315816?s=20

https://mp.weixin.qq.com/s/Wxrzt7bAo86h3bOKkx6 UoA

Nội dung Liên quan

Matt Van: Tất cả các kỹ thuật Agent Engineering mà tôi biết

Bài viết của Matt Van Horn chia sẻ phương pháp làm việc với AI Agent (Agentic Engineering). Thay vì tự viết code, ông dùng AI như một đội thực thi: bắt đầu bằng lệnh `/ce-plan` để tạo kế hoạch `plan.md`, sau đó dùng `/ce-work` để thực hiện. Ông nhập liệu bằng giọng nói, mở nhiều phiên Claude và Codex song song, giao nhiệm vụ lập kế hoạch cho Claude và viết code cho Codex. Các công cụ chính bao gồm: **Compound Engineering** (tạo và chạy kế hoạch), **last30days** (nghiên cứu chủ đề), **Printing Press** (tạo CLI cho các tác vụ thực tế), và **Agent Cookie** (quản lý xác thực). Ông cũng kết nối AI với kho ghi chú cá nhân (như Bear) để tăng cường ngữ cảnh, sử dụng **cmux** để chạy nhiều tác vụ đồng thời, và cấu hình để bỏ qua các hộp thoại xác nhận nhằm tăng tốc độ. Phương pháp này chuyển trọng tâm của con người từ việc "tự tay thực hiện" sang "đưa ra định hướng, ràng buộc và phán đoán". Matt cảnh báo về nguy cơ "nghiện" xây dựng với AI và khuyên nên cân bằng, tập trung vào những thứ người khác thực sự cần. Bài viết được chính ông soạn thảo bằng cách ra lệnh bằng giọng nói cho Claude Code trong cmux.

marsbit19 phút trước

Matt Van: Tất cả các kỹ thuật Agent Engineering mà tôi biết

marsbit19 phút trước

Đừng chỉ chăm chú vào GPU, Intel tung ra đòn chí mạng, liệu có thể chấm dứt độc quyền điện toán của NVIDIA?

Trong hai năm qua, GPU gần như là trung tâm duy nhất của phần cứng AI, đẩy giá cổ phiếu NVIDIA lên cao. Tuy nhiên, tại COMPUTEX 2026, Intel đưa ra nhận định khác: giai đoạn tiếp theo của AI không thể chỉ nhìn vào GPU, mà trọng tâm là **Agentic AI (Trí tuệ thể tác nhân)**. Agentic AI thay đổi hoàn toàn cách vận hành: thay vì hỏi-đáp từng lượt, nó hoạt động trong luồng công việc thực tế, liên tục "suy nghĩ, lập kế hoạch, hành động, phản ánh". Điều này biến suy luận AI thành một hệ thống ra quyết định tự chủ, làm thay đổi căn bản cách bố trí sức mạnh tính toán trong trung tâm dữ liệu. Tỷ lệ CPU/GPU có thể chuyển từ 1:8 (trong đào tạo mô hình) xuống 1:1 hoặc thậm chí cần nhiều CPU hơn để điều phối công việc phức tạp, vì mức tiêu thụ Token của một tác nhân có thể tăng gấp 1000 lần so với suy luận thông thường. Để đáp ứng nhu cầu này, Intel ra mắt bộ xử lý Xeon 6+ (sản xuất trên tiến trình 18A), với tối đa 288 lõi hiệu suất cao và bộ nhớ đệm 576MB, nhắm đến điện toán đám mây gốc và tải Agentic AI, cung cấp hiệu suất ổn định và tiết kiệm năng lượng hơn. Bên cạnh đó, Intel cùng các đối tác công bố kiến trúc suy luận tách rời hoàn toàn mới, nơi CPU Xeon 6 phụ trách điều phối, SambaNova SN40L RDU xử lý giải mã và GPU NVIDIA Blackwell đảm nhiệm làm đầy trước, nhằm tối đa hóa hiệu quả bằng cách chạy từng giai đoạn trên phần cứng phù hợp nhất. Ở phía thiết bị đầu cuối, Intel trình diễn máy chủ lai kết hợp bộ xử lý Core Ultra thế hệ thứ 3 (cho AI cục bộ) với máy chủ đám mây Xeon 6+, cho phép phân bổ động tải công việc giữa thiết bị và đám mây, giảm chi phí và bảo vệ quyền riêng tư dữ liệu. Ngoài chip đa dụng, Intel cũng nhấn mạnh vào thị trường chip tùy chỉnh, hợp tác với các khách hành như Google (IPU) và Ericsson, đóng gói giải pháp toàn diện gồm chip, hệ thống, phần mềm và hợp tác ngành. Tóm lại, Intel định vị lại mình trong kỷ nguyên Agentic AI: CPU trở nên quan trọng cho điều phối, hệ thống suy luận cần kiến trúc dị thể, thiết bị biên và AI cục bộ cần chip tiết kiệm năng lượng, và khách hàng doanh nghiệp cần chip tùy chỉnh. Mặc dù NVIDIA và AMD vẫn là đối thủ cạnh tranh mạnh, Intel hướng tới việc trở nên "có mặt ở khắp mọi nơi" hơn bằng cách nắm bắt cơ hội tái phân công trong cơ sở hạ tầng AI.

marsbit23 phút trước

Đừng chỉ chăm chú vào GPU, Intel tung ra đòn chí mạng, liệu có thể chấm dứt độc quyền điện toán của NVIDIA?

marsbit23 phút trước

Cardano Hay Solana? Lựa Chọn Hàng Đầu Của Chuyên Gia Sau Khi ADA, SOL Giảm 10%

Thị trường tiền điện tử sụt giảm khi Bitcoin (BTC) tạm thời xuống dưới 67.000 USD, kéo theo Solana (SOL) và Cardano (ADA) mất giá khoảng 10%. Chuyên gia Anders Bylund so sánh hai nền tảng. Solana được thiết kế cho tốc độ cao và phí giao dịch rẻ, nhưng có lịch sử gặp sự cố ngừng hoạt động. Mặc dù mạng lưới đã ổn định hơn kể từ đầu năm 2024, bài viết cho rằng độ tin cậy lâu dài vẫn là một câu hỏi. Ngược lại, Cardano theo đuổi triết lý chú trọng nghiên cứu học thuật và xác minh chính thức, nhằm tạo ra một blockchain ổn định hơn, dù có thể phát triển tính năng mới chậm hơn. Về hoạt động thực tế, Solana thể hiện rõ hơn với khối lượng giao dịch trên các sàn phi tập trung (DEX) cao gấp hơn 400 lần so với Cardano. Kết luận, chuyên gia cho rằng Solana là lựa chọn mạnh hơn hiện tại, do lợi thế về mức độ sử dụng trong thực tế. Tuy nhiên, cả hai đều là khoản đầu tư rủi ro. Nếu Bitcoin giảm 30%, các altcoin như SOL và ADA có thể giảm từ 50-70%. Thời điểm bài viết, ADA giao dịch quanh 0,21 USD và SOL ở 76 USD, cả hai đều giảm hơn 5% trong 24h. ADA hiện thấp hơn 92% so với mức đỉnh mọi thời đại, trong khi SOL thấp hơn 73%.

bitcoinist1 giờ trước

Cardano Hay Solana? Lựa Chọn Hàng Đầu Của Chuyên Gia Sau Khi ADA, SOL Giảm 10%

bitcoinist1 giờ trước

Morningstar định giá SpaceX chỉ 7800 tỷ USD, chưa bằng một nửa mục tiêu IPO, "IPO lớn nhất lịch sử" định giá quá cao?

SpaceX đang chuẩn bị cho đợt IPO có thể là lớn nhất lịch sử với mục tiêu định giá 1.750 tỷ USD. Tuy nhiên, Morningstar đưa ra định giá hợp lý chỉ 780 tỷ USD, tương đương 45% mục tiêu, và nhận định công ty bị định giá quá cao. Theo phân tích, Morningstar định giá riêng lõi kinh doanh phóng tên lửa và Starlink khoảng 611 tỷ USD. Phần định giá 170 tỷ USD còn lại dành cho hoạt động AI (bao gồm xAI và nền tảng X), được tính trọng số xác suất với kịch bản bi quan chiếm ưu thế. Starlink là mảng duy nhất có lãi với doanh thu 2025 đạt 11,3 tỷ USD. Dù đánh giá cao, Morningstar thừa nhận giá cổ phiếu SpaceX có thể tăng ngắn hạn sau IPO nhờ lượng cổ phiếu lưu hành thấp (chỉ ~3%), nhu cầu cao với cổ phiếu hạ tầng AI và cơ chế đưa nhanh vào chỉ số Nasdaq 100 sau 15 phiên giao dịch. Tuy nhiên, áp lực bán từ cơ cấu giải ngân cổ phiếu nội bộ theo tầng và rủi ro tái cấp vốn cho khoản vay cầu nối 200 tỷ USD đáo hạn sau 15 tháng là những điểm cần lưu ý. Rủi ro quản trị cũng được nêu do cấu trúc cổ phần cho phép Elon Musk nắm ~85% quyền biểu quyết. Lộ trình dự kiến: SpaceX bắt đầu roadshow vào tuần ngày 8/6, định giá ngày 11/6 và niêm yết trên Nasdaq (mã SPCX) vào ngày 12/6.

marsbit1 giờ trước

Morningstar định giá SpaceX chỉ 7800 tỷ USD, chưa bằng một nửa mục tiêu IPO, "IPO lớn nhất lịch sử" định giá quá cao?

marsbit1 giờ trước

a16z: Tại sao thị trường dự đoán sẽ trở thành cơ sở hạ tầng của 'xác suất tương lai'

Thị trường dự đoán đang phát triển từ công cụ giao dịch nhỏ thành cơ sở hạ tầng cung cấp tín hiệu xác suất cho các sự kiện tương lai. Về bản chất, chúng là thị trường thuần túy, tận dụng khả năng tổng hợp thông tin phân tán thông qua cơ chế giá, biến các sự kiện như bầu cử hay biến động địa chính trị thành tài sản có thể giao dịch với mức giá phản ánh xác suất xảy ra. Ưu điểm chính của thị trường dự đoán so với thăm dò truyền thống là cơ chế khuyến khích bằng tiền thật, buộc người tham gia phải cân nhắc kỹ lưỡng dựa trên thông tin họ có, từ đó tạo ra tín hiệu xác suất động, cập nhật theo thời gian thực. Chúng cũng linh hoạt, có thể áp dụng cho các vấn đề chuyên biệt như đánh giá hiệu suất AI mà thị trường truyền thống không phản ánh được. Tuy nhiên, hiệu quả của thị trường dự đoán không tự động đạt được. Nó phụ thuộc vào việc người có thông tin có tham gia hay không, thiết kế hợp đồng, cơ chế xác định kết quả và nguy cơ bị thao túng bởi nội gián hoặc các nhóm muốn định hướng nhận thức công chúng. Do đó, bước phát triển tiếp theo là xây dựng cơ sở hạ tầng thị trường đáng tin cậy: quy tắc minh bạch, thiết kế hợp đồng rõ ràng, cơ chế thanh toán có thể kiểm toán và các biện pháp ngăn chặn thao túng. Giá trị cốt lõi của chúng không nằm ở việc "đặt cược vào tương lai", mà ở việc cung cấp một tín hiệu xác suất công cộng mới trong môi trường đầy bất định.

marsbit2 giờ trước

a16z: Tại sao thị trường dự đoán sẽ trở thành cơ sở hạ tầng của 'xác suất tương lai'

marsbit2 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片