Năm Ứng Dụng AI Chỉ Biết "Có", Bỏ Qua Rủi Ro? Nhật Ký Hành Trình Phát Triển Phần Mềm Hoàn Toàn Mã Nguồn Mở

marsbit发布于2026-06-16更新于2026-06-16

文章摘要

Năm 2026, mã nguồn được tạo ra ngày càng nhanh nhưng lại được triển khai với ít sự kiểm tra hơn. Các rủi ro từ AI tạo code thường ẩn trong những đoạn mã trông có vẻ chính xác, có thể dẫn đến rò rỉ dữi liệu hoặc tổn thất tài sản. Sự cố cấu hình oracle cbETH của Moonwell là một ví dụ điển hình, khi một lỗi ngữ nghĩa giá trị vượt qua tất cả các bước kiểm tra và gây thiệt hại 1.78 triệu USD. Dự án mã nguồn mở **Narwhal AI Code Risks** từ Phòng thí nghiệm Narwhal, Đại học Bắc Kinh, tập hợp các rủi ro thành một "nhật ký hành trình" công khai, giúp nhà phát triển nhận diện sớm nguy cơ. Dự án phân loại thông tin thành ba lớp: `cases/` (sự kiện thực tế), `inferred/` (tín hiệu cảnh báo sớm) và `scenarios/` (kịch bản rủi ro điển hình), đồng thời chia rủi ro thành 7 loại chính: chuỗi cung ứng, lỗ hổng cấp mã, cấu hình đám mây & hạ tầng, rủi ro Agent, rủi ro lĩnh vực chuyên sâu, rủi ro sở hữu trí tuệ & tuân thủ, và yếu tố con người. Mục đích của dự án là biến các bài học từ sự cố thành tri thức có thể tái sử dụng, giúp cộng đồng tránh lặp lại sai lầm tương tự trong kỷ nguyên ứng dụng AI.

Rủi ro khi AI viết mã ẩn chứa trong những dòng code trông có vẻ đúng, có thể dẫn đến rò rỉ dữ liệu hoặc tổn thất tài sản. Dự án mã nguồn mở Narwhal AI Code Risks đã tổng hợp các trường hợp thực tế, tín hiệu cảnh báo sớm và các con đường rủi ro điển hình, giúp nhà phát triển nhận diện nguy cơ từ sớm, tránh lặp lại sai lầm.

Năm 2026, mã nguồn đang được tạo ra ngày càng nhanh, nhưng lại được triển khai với sự kiểm tra ngày càng ít.

Ngày càng nhiều khi nhu cầu của người dùng được đưa vào hộp thoại, AI đọc xong ngữ cảnh, bổ sung hàm, kéo các dependency, sửa cấu hình, rồi tiện tay tạo ra cả bài kiểm thử.

Khi kịp nhận ra, một đoạn mã đã nằm trong kho lưu trữ, chờ được hợp nhất.

Người dùng thậm chí đã hình thành thói quen mới: cứ để AI viết ra và chạy trước đã, có vấn đề thì xem lại chỗ nào cần sửa.

Nhưng trong thế giới phần mềm, thứ nguy hiểm nhất thường là những dòng mã trông có vẻ bình thường: cú pháp đúng, giao diện hợp lệ, kiểm thử vượt qua, chú thích hoàn hảo.

Thế nhưng nó vẫn có thể kéo về những gói thư viện không tồn tại, mở ra các quyền quá rộng, phơi bày cơ sở dữ liệu... thậm chí để một Agent có khả năng gọi trực tiếp các công cụ hệ thống, dưới tác động của prompt injection, mang dữ liệu nhạy cảm ra khỏi hệ thống nội bộ.

Thực sự nguy hiểm, không phải là khi đèn báo lỗi sáng đỏ. Mà là khi tất cả các đồng hồ đo rủi ro đều hiển thị bình thường.

Rủi ro từ việc AI viết mã, trước đây nằm rải rác khắp nơi: một bài blog bảo mật ẩn chứa một trường hợp, một Issue ghi lại một manh mối. Đến khi đội ngũ tiếp theo gặp phải vấn đề tương tự, họ lại phải bắt đầu lắp ghép nguồn gốc rủi ro từ đầu, lại tốn thêm thời gian và công sức để thực hiện các phép đo quy mô lớn trên mã nguồn.

Trong khi đó, Narwhal AI Code Risks vừa được Narwhal-Lab của Đại học Bắc Kinh công bố mã nguồn mở đã sắp xếp các mảnh thông tin này, phân loại theo ba kiểu: sự kiện thực tế, tín hiệu cảnh báo sớm và các con đường rủi ro điển hình, để các nhà nghiên cứu tham khảo.

Liên kết bài báo: https://github.com/Narwhal-Lab/Narwhal-aicode-risks

Khi 28 kiểm tra đều vượt qua, hệ thống vẫn chệch hướng

Manh mối đầu tiên là một Pull Request đã được hợp nhất, trong phần ký tên PR ghi rõ Claude Opus 4.6 và Copilot, cùng bốn nhà phát triển con người. 28 kiểm tra đều vượt qua: Không ai phát hiện ra vấn đề.

Sau đó, robot thanh lý chỉ mất vài phút để lấy đi tài sản thế chấp trị giá 1.778.044,83 USD.

Trong tệp cấu hình, giá của cbETH được đặt thành tỷ lệ quy đổi với ETH, khoảng 1,12 USD, thay vì giá thực tế gần 2.200 USD.

Một lỗi ngữ nghĩa giá trị đã vượt qua toàn bộ quy trình phát triển, kiểm tra và hợp nhất, cuối cùng biến thành tổn thất thực tế trong hệ thống tài chính. Đó chính là điểm gây chú ý nhất trong sự cố cấu hình oracle cbETH của Moonwell.

Vấn đề nằm ở chỗ trong mã nguồn không có lỗi cú pháp, và nhà phát triển con người cũng không ngay lập tức ngăn chặn quy trình bất thường. Ngược lại, nó trông rất hoàn chỉnh, rất suôn sẻ, đó chỉ là một lần giao hàng kỹ thuật bình thường.

Nhưng chính cái vẻ "bình thường" ngầm chảy này mới khiến nó trở thành ví dụ điển hình cho sự cố an ninh.

Rủi ro của AI Coding nằm ở chỗ nó không phải lúc nào cũng xuất hiện dưới dạng báo lỗi.

Nhiều khi, nó khoác lên mình vẻ ngoài của câu trả lời đúng, lặng lẽ đi vào quy trình kỹ thuật. Mã chạy được, kiểm tra vượt qua, PR có thể hợp nhất, nhưng ngữ nghĩa nghiệp vụ đã lệch khỏi thế giới thực.

Trong các dự án rủi ro thấp, sự lệch ngữ nghĩa này có thể chỉ là một lần làm lại công việc; nhưng trong các kịch bản nhạy cảm như tài chính, hệ thống dữ liệu doanh nghiệp, nó sẽ trực tiếp dẫn đến rò rỉ dữ liệu, phơi bày quyền hạn và tổn thất tài sản.

Khi AI tham gia viết mã, sửa cấu hình, làm review, thậm chí cùng ký tên vào PR, liệu chúng ta có đủ tự tin để biết mỗi lần chệch hướng xảy ra như thế nào không?

Tín hiệu xanh thông hành, không chiếu sáng mọi ngóc ngách

Giai đoạn đầu, AI giúp bạn viết mã chủ yếu dừng lại ở việc bổ sung cục bộ. Nếu viết sai cú pháp, trình biên dịch sẽ báo lỗi, unit test sẽ thất bại, quy trình CI sẽ chặn nó lại.

Ngày nay, AI Coding đã đi xa hơn trong khi sự giám sát lại chậm chạp chưa theo kịp.

Nó có thể đọc tệp, sửa cấu hình, cài đặt dependency, tạo script hạ tầng, cũng có thể thông qua Agent tự lập kế hoạch giữa nhiều nhiệm vụ.

AI không còn chỉ ngồi bên cạnh và đưa công cụ, nó bắt đầu bước vào chuỗi dài hơn của quy trình kỹ thuật phần mềm.

Ranh giới vốn rõ ràng trong kỹ thuật phần mềm, giờ bị AI Agent kết nối lại thành một con đường dài hơn, khó truy nguồn hơn.

Bản ghi rải rác, cần một nhật ký hành trình công cộng

Sự cố an ninh hiếm khi có kết luận đầy đủ ngay từ đầu. Một số sự kiện có đầy đủ bằng chứng, có thể đưa vào danh mục làm trường hợp thực tế; một số vẫn chỉ dừng lại ở ảnh chụp cộng đồng, thảo luận của nhà nghiên cứu hoặc công bố sơ bộ, chỉ phù hợp để tiếp tục theo dõi; một số khác không gắn với một sự kiện thực tế duy nhất, nhưng đã hình thành mô hình rõ ràng, phù hợp để dùng làm diễn tập trước.

Narwhal AI Code Risks phân chia tài liệu thành ba lớp: `cases/`, `inferred/` và `scenarios/`.

cases/ ghi lại các sự kiện thực tế đã có nguồn công khai và chuỗi bằng chứng hỗ trợ; inferred/ lưu trữ các tín hiệu cảnh báo sớm chưa hoàn toàn được xác minh, nhưng đáng để theo dõi liên tục; scenarios/ tổng hợp các kịch bản điển hình rủi ro đủ rõ ràng, tạm thời chưa gắn với một sự kiện duy nhất.

Nếu không có bản ghi công cộng như vậy, rủi ro từ AI Coding rất dễ trở thành ký ức ngắn hạn trên internet.

Hôm nay mọi người nhớ một tên gói nào đó, ngày mai thảo luận về một lần phơi bày dữ liệu, vài tháng sau lại bị che lấp bởi làn sóng công cụ mới. Đến khi vấn đề tương tự xuất hiện trở lại, đội ngũ vẫn như ruồi không đầu đâm vào vùng hàng hải rủi ro chưa biết.

Điều Narwhal AI Code Risks đang làm, chính là cố định lại những mảnh rủi ro rời rạc này, để người đến sau có thể lật đến cùng một trang.

Theo bảy loại chỉ mục, nhìn thấy con đường rủi ro đã đi qua

Vấn đề do AI viết mã mang lại, không chỉ nằm trong mã nguồn. Nó nằm trong dependency, trong quyền hạn, trong việc gọi công cụ của Agent, và hơn hết là trong cách con người tin tưởng vào đầu ra của AI.

Hiện tại, Narwhal AI Code Risks phân loại rủi ro thành 7 loại: chuỗi cung ứng, lỗ hổng cấp mã, cấu hình đám mây và hạ tầng, rủi ro Agent, rủi ro lĩnh vực chuyên sâu, rủi ro sở hữu trí tuệ và tuân thủ, cùng các yếu tố con người.

Trong rủi ro chuỗi cung ứng, AI có thể đề xuất các dependency không tồn tại. Trong lỗ hổng cấp mã, AI có thể viết lại các vấn đề như duyệt đường dẫn, thiếu kiểm tra đầu vào, xác thực quyền vào mã nghiệp vụ. Trong cấu hình đám mây và hạ tầng, AI có thể để cho mã chạy được mà đưa ra các quyền quá rộng, thùng lưu trữ công khai hoặc cổng bị phơi bày. Rủi ro Agent thì phức tạp hơn, không chỉ tạo văn bản, mà còn bắt đầu thực hiện hành động. Vật phẩm do AI tạo ra đang chôn giấu mối nguy hiểm cho hệ thống thực.

Động cơ AI đang nổ máy, và nhật ký hành trình vừa mới mở ra

Khi AI từng bước bước vào thế giới thực, việc phòng ngừa rủi ro liên quan không nên chỉ dừng lại ở tổng kết sau sự cố hoặc thảo luận rời rạc.

Điều thực sự quan trọng của Narwhal AI Code Risks, là biến các trường hợp rủi ro thành tri thức có thể tái sử dụng.

Nhà phát triển có thể dùng nó để nhận diện vấn đề tương tự; nhà nghiên cứu an ninh có thể lấy nó làm thư viện mẫu; nhà sản xuất công cụ có thể trích xuất quy tắc phát hiện và tiêu chuẩn đánh giá từ đó; cộng đồng mã nguồn mở cũng có thể tiếp tục bổ sung các trường hợp mới, bằng chứng mới và loại rủi ro mới.

Động cơ của AI đang gầm rú, mỗi lần chệch hướng cũng nên để lại tọa độ. Rủi ro không bao giờ biến mất vì bị lờ đi, nhưng kinh nghiệm có thể được ghi lại và truyền đi. Giá trị thực sự không phải là phát hiện một lỗ hổng, mà là để người đến sau không phải bước vào cùng một cái bẫy nữa.

Điều Narwhal AI Code Risks đang làm, chính là để lại cho thế giới phần mềm của năm ứng dụng AI một nhật ký hành trình mã nguồn mở.

Tài liệu tham khảo:

https://github.com/Narwhal-Lab/Narwhal-aicode-risks

Bài viết từ tài khoản công chúng WeChat "New Zhi Yuan", tác giả: LRST

你可能也喜欢

XRP Ledger 发布 3.2.0 版本升级并启用 XRPLd 新品牌名

XRP Ledger发布了3.2.0版本，这是对其底层区块链基础设施的一次重要升级。本次更新的核心是将运行网络的软件名称从“rippled”更名为“xrpld”，以更好地反映整个项目生态。与此前侧重于前端功能的版本不同，3.2.0版本优先进行了后端升级和效率提升，旨在增强网络性能并为未来的扩展做准备。关键改进包括内存优化措施，预计可节省高达40%的服务器内存使用。此次升级引入了名为“fixCleanup3_2_0”的修改，为单资产金库、借贷协议、权限系统、去中心化交易所、多用途代币和权限域等多个模块带来了安全性增强。开发团队还新增了不变性检查，以确保已删除账户不会在账本上留下不一致的数据，从而加强整个网络的完整性和可靠性。对于开发者而言，新版本增加了一项重要功能：应用程序无需连接服务器即可检索XRP Ledger协议和服务器定义信息，这将极大便利钱包、区块链浏览器和API等的开发工作。在可扩展性和稳定性方面，更新包括可配置的区块大小、通过nuDB实现的高效数据库存储，以及将gRPC服务器的TLS/双向TLS支持改为可选，以提升企业用户的性能和连接性。此外，默认对等端口从51235更改为2459，并修复了涉及自动做市商、支付、代币托管、多用途代币、订单簿和RPC等多个方面的问题。出于性能考虑，3.2.0版本暂时禁用了交易不变性检查，但开发团队表示这不会构成安全威胁。

TheNewsCrypto16分钟前

TheNewsCrypto16分钟前

AGI不是终点，DeepMind新论文：迈向ASI，真正的AI进步才刚开始

DeepMind团队最新研究报告提出，通用人工智能（AGI）很可能不是AI发展的终点。AI将继续超越人类水平，走向超级人工智能（ASI）。报告区分了AGI（达到人类中位认知水平）、ASI（在所有重要领域整体超越人类专家集体）和UAI（理论智能上界）三个概念，并探讨了从AGI迈向ASI的四条潜在路径：持续扩展计算、模型与数据规模；算法持续演化乃至范式转变；系统通过递归自我改进形成正反馈；以及通过多智能体协作形成超越单体的集体智能。报告同时指出了发展过程中可能面临的六大关键瓶颈：高质量人类数据可能面临枯竭的“数据墙”；能源、芯片等经济和自然资源压力；现有神经网络范式在持续学习、稳定推理等方面的根本性局限；研究难度随领域成熟而增加；AI可能难以自主提炼新概念原语的“抽象壁垒”；以及监管、治理与社会反弹带来的影响。报告最后强调，一旦AI能力超越人类，现有以人类水平为参照的评估体系将失效，需要建立面向后AGI时代的新评估机制。ASI的发展仍受物理规律、资源等现实约束，其具体路径与速度存在高度不确定性，未来需持续开展跨学科研究以应对这一前景。

marsbit1小时前

marsbit1小时前

Kraken推出OpenAI和Anthropic的Pre-IPO永续合约，提供高达5倍杠杆

加密货币交易所Kraken推出了针对OpenAI和Anthropic的“IPO前永续合约”（pre-IPO perps），允许符合条件的交易者在这两家备受关注的私人人工智能公司公开上市前，进行高达5倍杠杆的多空交易。此举标志着加密货币衍生品平台正超越数字资产范畴，尝试对接私人公司股权等链下资产，为散户投资者提供原本难以触及的热门投资主题（如AI）的敞口。然而，这类产品与普通的加密货币永续合约存在显著差异。其定价基于不透明、非连续的私人市场估值（受融资轮次、二级交易、IPO预期等因素影响），而非流动的现货市场价格，因此风险管理更为复杂。高杠杆进一步放大了与估值波动、流动性及上市时间表相关的独特风险。总之，Kraken的推出显示了加密交易基础设施向更广泛投机标的的扩张，为投资者提供了新的表达观点的工具，但产品本身风险较高，投资者需充分了解其复杂性和风险后再谨慎参与。

bitcoinist1小时前

Kraken推出OpenAI和Anthropic的Pre-IPO永续合约，提供高达5倍杠杆

bitcoinist1小时前

给 OpenAI 盘前定价：Hyperliquid 上一门半年生死的新生意

本文探讨了在Hyperliquid平台上兴起的未上市公司（如SpaceX、OpenAI）“盘前定价”合约交易现象。匿名团队Trade.xyz通过聚焦即将上市的SpaceX（有明确的纳斯达克最终定价作为锚点），成功打造了该平台最大的盘前市场。相反，由知名风投Paradigm支持的Ventuals，虽手握OpenAI和Anthropic等稀缺标的，却因其定价机制（一半依赖非公开的老股交易价，一半依赖自身合约价格的均线）导致价格失真、缺乏流动性，最终在运营九个月后关停。其关停时给出的OpenAI（约1341美元）和Anthropic（约1619美元）的“最终报价”，虽被部分内部人士参考，但其公允性存疑。文章指出，为未上市公司提供实时交易价格的需求真实存在，并正吸引Coinbase等大型机构入场，但该生意的核心挑战——如何在没有公开市场的情况下形成公允、可持续的定价机制——仍未解决。Ventuals的案例揭示了，缺乏坚实价值锚点的定价游戏难以长久。

marsbit1小时前

marsbit1小时前

“七巨头”不够用了？SpaceX 上市散户狂买，华尔街端出“AI 科技十巨头”

SpaceX于上周五上市首日吸引散户净买入1.17亿美元，占当天全美散户股票买盘的56%，其IPO募资约750亿美元，估值约1.75万亿美元。研究机构Vanda据此提出“FAB 10”（前沿AI与科技十巨头）新概念，主张在原有的“七巨头”基础上，加入SpaceX、OpenAI和Anthropic，认为这些公司代表未来十年科技与AI方向。OpenAI与Anthropic尚未上市，预计估值或达万亿美元级别。与此同时，美国银行曾提出偏向半导体硬件的“AI Big 10”组合。Vanda指出，SpaceX的火爆可能从其他热门板块（如芯片股）抽走资金。尽管科技板块估值已显泡沫迹象，但市场对新巨头的追捧仍在改写投资框架。

marsbit1小时前

marsbit1小时前

交易

现货

合约

Năm Ứng Dụng AI Chỉ Biết "Có", Bỏ Qua Rủi Ro? Nhật Ký Hành Trình Phát Triển Phần Mềm Hoàn Toàn Mã Nguồn Mở

文章摘要

Khi 28 kiểm tra đều vượt qua, hệ thống vẫn chệch hướng

Tín hiệu xanh thông hành, không chiếu sáng mọi ngóc ngách

Bản ghi rải rác, cần một nhật ký hành trình công cộng

Theo bảy loại chỉ mục, nhìn thấy con đường rủi ro đã đi qua

Động cơ AI đang nổ máy, và nhật ký hành trình vừa mới mở ra

Tài liệu tham khảo:

相关问答

你可能也喜欢

XRP Ledger 发布 3.2.0 版本升级并启用 XRPLd 新品牌名

AGI不是终点，DeepMind新论文：迈向ASI，真正的AI进步才刚开始

Kraken推出OpenAI和Anthropic的Pre-IPO永续合约，提供高达5倍杠杆

给 OpenAI 盘前定价：Hyperliquid 上一门半年生死的新生意

“七巨头”不够用了？SpaceX 上市散户狂买，华尔街端出“AI 科技十巨头”

交易

热门文章

如何购买S

Sonic：Andre Cronje主导升级，逆势上涨的Layer1新星

成长学院：学习“ Sonic“ ，瓜分价值 1000 USDT

相关讨论

热门问答

热门分类

热门标签