Bài gốc | Odaily Planet Daily (@OdailyChina)
Tác giả | Azuma (@azuma_eth)
Ngày 8 tháng 4, Anthropic, công ty phát triển AI đứng sau Claude, đã chính thức công bố sẽ ra mắt một kế hoạch mới có tên "Cánh Thủy Tinh" (Project Glasswing). Kế hoạch này sẽ được triển khai phối hợp cùng nhiều tập đoàn hàng đầu như Amazon, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, Linux Foundation, Microsoft, NVIDIA và Palo Alto Networks.
Anthropic cho biết, đây là một biện pháp khẩn cấp nhằm bảo vệ phần mềm quan trọng nhất toàn cầu, các bên sẽ cùng nhau sử dụng phiên bản xem trước Mythos để phát hiện và sửa chữa các lỗ hổng tiềm ẩn trong các hệ thống mà thế giới hiện đang phụ thuộc vào.
Mythos được nhắc đến, chính là mô hình AI thế hệ tiếp theo mà Anthropic đang phát triển. Đây là mô hình đầu tiên trong lịch sử nhân loại đạt quy mô tham số tổng vượt mười nghìn tỷ (so với các mô hình phổ biến hiện nay có số tham số trong khoảng vài trăm tỷ đến một nghìn tỷ), với chi phí huấn luyện lên tới 100 tỷ USD đáng kinh ngạc. So với mô hình mạnh nhất hiện tại của Claude là Opus 4.6, Mythos đạt điểm số cao hơn đáng kể trong các bài kiểm tra về mã hóa phần mềm, lập luận học thuật và an ninh mạng.
Tin đồn về Mythos đã lan truyền trên thị trường từ tuần trước, mối lo ngại phổ biến lúc đó là — liệu Mythos với khả năng chuyên biệt về an ninh mạng có ảnh hưởng đến cục diện phòng thủ an ninh hiện tại? Nếu bị kẻ xấu lợi dụng, nó có thể gây ra các sự cố an ninh quy mô lớn hơn? Odaily lúc đó cũng đã đưa tin về sự việc và từng thảo luận với chuyên gia an ninh ngành, nhà sáng lập SlowMist, Cosine, về tác động tiềm ẩn đối với an ninh phòng thủ trong ngành công nghiệp tiền mã hóa (xem chi tiết 《Odaily Phỏng vấn Cosine: Mô hình mới hạt nhân của Anthropic bị rò rỉ, ảnh hưởng thế nào đến an ninh phòng thủ mã hóa?》), nhưng lúc đó phía Anthropic chưa công khai thừa nhận sự tồn tại của Mythos, nên thông tin liên quan vẫn còn hạn chế.
Vào ngày 8 tháng 4, cùng với việc công bố kế hoạch "Cánh Thủy Tinh", Anthropic cũng tiết lộ thêm nhiều chi tiết liên quan đến Mythos. Dựa trên các trường hợp thử nghiệm thực tế mà Anthropic công bố, Anthropic không hề phóng đại khả năng của Mythos, đến mức công ty này thậm chí không dám trực tiếp công bố rộng rãi mô hình này, để phòng tránh việc bị các nhóm hacker lợi dụng cho mục đích xấu, mà thay vào đó lên kế hoạch cho các tập đoàn lớn dùng thử thông qua kế hoạch "Cánh Thủy Tinh" để sớm kiểm tra và vá các lỗ hổng tiềm ẩn.
Mythos khoe cơ bắp: Chỉ vài tuần, đào được hàng nghìn "lỗ hổng zero-day"
Khi nói về sức mạnh của Mythos, Anthropic thẳng thắn tuyên bố, sự ra đời của mô hình này đồng nghĩa với một thực tế nghiêm trọng đã đến — khả năng mã hóa của mô hình AI đã đạt đến trình độ cực cao, trong việc phát hiện và khai thác lỗ hổng phần mềm, chúng gần như có thể vượt qua tất cả mọi người ngoại trừ những con người thành thạo nhất.
Theo tiết lộ từ phía Anthropic, chỉ trong vòng vài tuần ngắn ngủi, Anthropic đã sử dụng Mythos để xác định được hàng nghìn lỗ hổng zero-day (tức những lỗi mà ngay cả nhà phát triển phần mềm cũng chưa từng phát hiện ra), trong đó nhiều lỗi thuộc loại nguy hiểm cao, vấn đề bao phủ tất cả các hệ điều hành chính và trình duyệt chủ lưu, đồng thời ảnh hưởng đến một loạt phần mềm quan trọng khác.
Anthropic đưa ra một vài trường hợp điển hình:
- Mythos phát hiện một lỗ hổng tồn tại 27 năm trong OpenBSD, hệ thống vốn nổi tiếng với độ "cực kỳ an toàn", được sử dụng rộng rãi trong các cơ sở hạ tầng quan trọng như tường lửa, và lỗ hổng này cho phép kẻ tấn công từ xa trực tiếp làm sụp đổ hệ thống;
- Trong thư viện xử lý video FFmpeg được sử dụng rộng rãi, Mythos tìm thấy một lỗ hổng tồn tại 16 năm, đoạn mã chứa lỗi này đã từng được kích hoạt bởi kiểm tra tự động hơn 5 triệu lần, nhưng始终(chưa bao giờ) được phát hiện;
- Mythos còn có thể tự động kết nối nhiều lỗ hổng trong nhân Linux, leo thang từ quyền người dùng thông thường để giành quyền kiểm soát hoàn toàn máy chủ.
Đáng lo ngại hơn, Anthropic cho biết phần lớn các lỗ hổng này là do Mythos "tự động phát hiện và xây dựng đường dẫn khai thác" với rất ít sự can thiệp của con người, điều này có lẽ意味着(AI) đã bắt đầu có được khả năng tự động hóa tấn công-phòng thủ tương tự như các nhóm hacker đỉnh cao.
Trên các điểm chuẩn đánh giá, Mythos so với Opus 4.6 cũng thể hiện sự tiến hóa vượt bậc. Ví dụ, trong bài kiểm tra tái hiện lỗ hổng an ninh mạng, Mythos đạt 83.1%, trong khi Opus 4.6 chỉ đạt 66.6%; trong nhiều bài kiểm tra mã hóa và suy luận, điểm số của Mythos cũng dẫn đầu vượt trội.
Có lẽ chính vì khả năng của Mythos quá mạnh mẽ, Anthropic đã không chọn cách mở trực tiếp mô hình, mà trước tiên đưa ra kế hoạch "Cánh Thủy Tinh", để toàn bộ Internet sớm được "gia cố".
Thông qua kế hoạch này, Anthropic sẽ mở sớm phiên bản xem trước Mythos Preview cho các bên tham gia kế hoạch, để phát hiện và sửa chữa lỗ hổng hoặc điểm yếu trong hệ thống cơ sở của họ — tập trung vào các nhiệm vụ như phát hiện lỗ hổng cục bộ, kiểm tra hộp đen chương trình nhị phân, củng cố an ninh đầu cuối và kiểm tra thâm nhập hệ thống.
Anthropic còn cam kết, sẽ cung cấp cho các bên tham gia kế hoạch tổng hạn mức sử dụng mô hình trị giá 100 triệu USD, để hỗ trợ việc sử dụng trong toàn bộ giai đoạn xem trước nghiên cứu. Sau đó, phiên bản Mythos Preview sẽ được mở cho các bên tham gia với giá lần lượt là 25 USD / 125 USD cho mỗi triệu tokens đầu vào / đầu ra (người tham gia cũng có thể truy cập mô hình này thông qua Claude API, Amazon Bedrock, Google Cloud Vertex AI và Microsoft Foundry). Ngoài hạn mức sử dụng mô hình, Anthropic còn thông qua Linux Foundation quyên tặng 2.5 triệu USD cho Alpha-Omega và OpenSSF, và quyên tặng 1.5 triệu USD cho Apache Software Foundation, để giúp những người bảo trì phần mềm mã nguồn mở ứng phó với môi trường an ninh không ngừng thay đổi.
Anthropic có kế hoạch mở rộng dần phạm vi tham gia của "Cánh Thủy Tinh" và tiếp tục thúc đẩy trong nhiều tháng, đồng thời chia sẻ kinh nghiệm nhiều nhất có thể, để các tổ chức khác có thể áp dụng kinh nghiệm liên quan vào việc xây dựng an ninh của chính họ. Trong vòng 90 ngày, Anthropic sẽ công bố báo cáo kết quả giai đoạn, bao gồm các lỗ hổng đã được sửa chữa và các biện pháp cải thiện an ninh có thể tiết lộ.
Công nghệ chỉ không ngừng nâng cấp, nhưng cũng không cần quá lo lắng
AI đang thay đổi thế giới quen thuộc của chúng ta một cách không thể đảo ngược, bao gồm cả lĩnh vực an ninh mạng được đề cập trong bài viết này. Khi ngưỡng phát hiện và khai thác lỗ hổng giảm mạnh, mọi người không khỏi lo ngại, liệu AI có trở thành lưỡi dao trong tay kẻ có ý đồ xấu, đe dọa sự cân bằng an ninh mạng hiện có? (PS: Đối với người dùng tiền mã hóa cần đặt tiền thật trong hệ thống ví hoặc giao thức trên chuỗi, mối lo ngại này sẽ đặc biệt mạnh mẽ.)
Đối với vấn đề này, Anthropic cho rằng "chúng ta vẫn có lý do để lạc quan", lý do mô hình AI nguy hiểm chính là vì chúng có khả năng gây hại trong tay những kẻ bất hợp pháp, nhưng đồng thời, AI cũng có giá trị không thể đánh giá hết được trong việc phát hiện và sửa chữa lỗi phần mềm quan trọng cũng như phát triển phần mềm mới an toàn hơn.
Có thể dự đoán, trong vài năm tới khả năng của AI vẫn sẽ tiến hóa nhanh chóng, nhưng khi phương thức tấn công mới xuất hiện, cơ chế phòng thủ mới cũng sẽ đồng thời xuất hiện. Nâng cấp công nghệ là không thể tránh khỏi, nhưng điều này không có nghĩa rủi ro必然(tất yếu) mất kiểm soát — chỉ cần hệ thống phòng thủ tiến hóa đồng bộ, thậm chí có thể借助(dựa vào) AI để xây dựng hào thành an ninh cường độ cao hơn.









