Anthropic tạo ra mô hình AI mạnh nhất lịu sử, nhưng không dám công bố...

Odaily星球日报Xuất bản vào 2026-04-08Cập nhật gần nhất vào 2026-04-08

Tóm tắt

Công ty AI Anthropic vừa công bố kế hoạch "Cánh Thủy Tinh" (Project Glasswing), hợp tác với các tập đoàn hàng đầu như Amazon, Apple, Google, Microsoft, NVIDIA… nhằm bảo vệ phần mềm toàn cầu. Động lực chính là Mythos - mô hình AI thế hệ mới với quy mô 10 nghìn tỷ tham số, chi phí huấn luyện lên tới 10 tỷ USD. Mythos được cho là mô hình mạnh nhất từ trước đến nay, vượt trội so với Claude Opus 4.6 trong mã hóa, lập luận học thuật và an ninh mạng. Chỉ trong vài tuần, nó đã tự động phát hiện hàng nghìn lỗ hổng "zero-day" nghiêm trọng trong các hệ thống then chốt như OpenBSD, FFmpeg và Linux kernel, bao gồm những lỗi tồn tại hơn 20 năm. Do khả năng khai thác lỗ hổng quá mạnh, Anthropic không công bố rộng rãi mà cho các đối tác trong chương trình dùng thử Mythos Preview để sửa lỗi trước. Họ cam kết tài trợ 100 triệu USD chi phí sử dụng và quyên góp 4 triệu USD cho các tổ chức mã nguồn mở. Anthropic lạc quan cho rằng, dù AI có thể bị lợi dụng, nó cũng mang lại giá trị to lớn trong việc phát hiện và sửa lỗi, giúp xây dựng hệ thống phòng thủ mạnh hơn. Báo cáo chi tiết về kết quả sẽ được công bố sau 90 ngày.

Bài gốc | Odaily Planet Daily (@OdailyChina)

Tác giả | Azuma (@azuma_eth)

Ngày 8 tháng 4, Anthropic, công ty phát triển AI đứng sau Claude, đã chính thức công bố sẽ ra mắt một kế hoạch mới có tên "Cánh Thủy Tinh" (Project Glasswing). Kế hoạch này sẽ được triển khai phối hợp cùng nhiều tập đoàn hàng đầu như Amazon, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, Linux Foundation, Microsoft, NVIDIA và Palo Alto Networks.

Anthropic cho biết, đây là một biện pháp khẩn cấp nhằm bảo vệ phần mềm quan trọng nhất toàn cầu, các bên sẽ cùng nhau sử dụng phiên bản xem trước Mythos để phát hiện và sửa chữa các lỗ hổng tiềm ẩn trong các hệ thống mà thế giới hiện đang phụ thuộc vào.

Mythos được nhắc đến, chính là mô hình AI thế hệ tiếp theo mà Anthropic đang phát triển. Đây là mô hình đầu tiên trong lịch sử nhân loại đạt quy mô tham số tổng vượt mười nghìn tỷ (so với các mô hình phổ biến hiện nay có số tham số trong khoảng vài trăm tỷ đến một nghìn tỷ), với chi phí huấn luyện lên tới 100 tỷ USD đáng kinh ngạc. So với mô hình mạnh nhất hiện tại của Claude là Opus 4.6, Mythos đạt điểm số cao hơn đáng kể trong các bài kiểm tra về mã hóa phần mềm, lập luận học thuật và an ninh mạng.

Tin đồn về Mythos đã lan truyền trên thị trường từ tuần trước, mối lo ngại phổ biến lúc đó là — liệu Mythos với khả năng chuyên biệt về an ninh mạng có ảnh hưởng đến cục diện phòng thủ an ninh hiện tại? Nếu bị kẻ xấu lợi dụng, nó có thể gây ra các sự cố an ninh quy mô lớn hơn? Odaily lúc đó cũng đã đưa tin về sự việc và từng thảo luận với chuyên gia an ninh ngành, nhà sáng lập SlowMist, Cosine, về tác động tiềm ẩn đối với an ninh phòng thủ trong ngành công nghiệp tiền mã hóa (xem chi tiết 《Odaily Phỏng vấn Cosine: Mô hình mới hạt nhân của Anthropic bị rò rỉ, ảnh hưởng thế nào đến an ninh phòng thủ mã hóa?》), nhưng lúc đó phía Anthropic chưa công khai thừa nhận sự tồn tại của Mythos, nên thông tin liên quan vẫn còn hạn chế.

Vào ngày 8 tháng 4, cùng với việc công bố kế hoạch "Cánh Thủy Tinh", Anthropic cũng tiết lộ thêm nhiều chi tiết liên quan đến Mythos. Dựa trên các trường hợp thử nghiệm thực tế mà Anthropic công bố, Anthropic không hề phóng đại khả năng của Mythos, đến mức công ty này thậm chí không dám trực tiếp công bố rộng rãi mô hình này, để phòng tránh việc bị các nhóm hacker lợi dụng cho mục đích xấu, mà thay vào đó lên kế hoạch cho các tập đoàn lớn dùng thử thông qua kế hoạch "Cánh Thủy Tinh" để sớm kiểm tra và vá các lỗ hổng tiềm ẩn.

Mythos khoe cơ bắp: Chỉ vài tuần, đào được hàng nghìn "lỗ hổng zero-day"

Khi nói về sức mạnh của Mythos, Anthropic thẳng thắn tuyên bố, sự ra đời của mô hình này đồng nghĩa với một thực tế nghiêm trọng đã đến — khả năng mã hóa của mô hình AI đã đạt đến trình độ cực cao, trong việc phát hiện và khai thác lỗ hổng phần mềm, chúng gần như có thể vượt qua tất cả mọi người ngoại trừ những con người thành thạo nhất.

Theo tiết lộ từ phía Anthropic, chỉ trong vòng vài tuần ngắn ngủi, Anthropic đã sử dụng Mythos để xác định được hàng nghìn lỗ hổng zero-day (tức những lỗi mà ngay cả nhà phát triển phần mềm cũng chưa từng phát hiện ra), trong đó nhiều lỗi thuộc loại nguy hiểm cao, vấn đề bao phủ tất cả các hệ điều hành chính và trình duyệt chủ lưu, đồng thời ảnh hưởng đến một loạt phần mềm quan trọng khác.

Anthropic đưa ra một vài trường hợp điển hình:

  • Mythos phát hiện một lỗ hổng tồn tại 27 năm trong OpenBSD, hệ thống vốn nổi tiếng với độ "cực kỳ an toàn", được sử dụng rộng rãi trong các cơ sở hạ tầng quan trọng như tường lửa, và lỗ hổng này cho phép kẻ tấn công từ xa trực tiếp làm sụp đổ hệ thống;
  • Trong thư viện xử lý video FFmpeg được sử dụng rộng rãi, Mythos tìm thấy một lỗ hổng tồn tại 16 năm, đoạn mã chứa lỗi này đã từng được kích hoạt bởi kiểm tra tự động hơn 5 triệu lần, nhưng始终(chưa bao giờ) được phát hiện;
  • Mythos còn có thể tự động kết nối nhiều lỗ hổng trong nhân Linux, leo thang từ quyền người dùng thông thường để giành quyền kiểm soát hoàn toàn máy chủ.

Đáng lo ngại hơn, Anthropic cho biết phần lớn các lỗ hổng này là do Mythos "tự động phát hiện và xây dựng đường dẫn khai thác" với rất ít sự can thiệp của con người, điều này có lẽ意味着(AI) đã bắt đầu có được khả năng tự động hóa tấn công-phòng thủ tương tự như các nhóm hacker đỉnh cao.

Trên các điểm chuẩn đánh giá, Mythos so với Opus 4.6 cũng thể hiện sự tiến hóa vượt bậc. Ví dụ, trong bài kiểm tra tái hiện lỗ hổng an ninh mạng, Mythos đạt 83.1%, trong khi Opus 4.6 chỉ đạt 66.6%; trong nhiều bài kiểm tra mã hóa và suy luận, điểm số của Mythos cũng dẫn đầu vượt trội.

Có lẽ chính vì khả năng của Mythos quá mạnh mẽ, Anthropic đã không chọn cách mở trực tiếp mô hình, mà trước tiên đưa ra kế hoạch "Cánh Thủy Tinh", để toàn bộ Internet sớm được "gia cố".

Thông qua kế hoạch này, Anthropic sẽ mở sớm phiên bản xem trước Mythos Preview cho các bên tham gia kế hoạch, để phát hiện và sửa chữa lỗ hổng hoặc điểm yếu trong hệ thống cơ sở của họ — tập trung vào các nhiệm vụ như phát hiện lỗ hổng cục bộ, kiểm tra hộp đen chương trình nhị phân, củng cố an ninh đầu cuối và kiểm tra thâm nhập hệ thống.

Anthropic còn cam kết, sẽ cung cấp cho các bên tham gia kế hoạch tổng hạn mức sử dụng mô hình trị giá 100 triệu USD, để hỗ trợ việc sử dụng trong toàn bộ giai đoạn xem trước nghiên cứu. Sau đó, phiên bản Mythos Preview sẽ được mở cho các bên tham gia với giá lần lượt là 25 USD / 125 USD cho mỗi triệu tokens đầu vào / đầu ra (người tham gia cũng có thể truy cập mô hình này thông qua Claude API, Amazon Bedrock, Google Cloud Vertex AI và Microsoft Foundry). Ngoài hạn mức sử dụng mô hình, Anthropic còn thông qua Linux Foundation quyên tặng 2.5 triệu USD cho Alpha-Omega và OpenSSF, và quyên tặng 1.5 triệu USD cho Apache Software Foundation, để giúp những người bảo trì phần mềm mã nguồn mở ứng phó với môi trường an ninh không ngừng thay đổi.

Anthropic có kế hoạch mở rộng dần phạm vi tham gia của "Cánh Thủy Tinh" và tiếp tục thúc đẩy trong nhiều tháng, đồng thời chia sẻ kinh nghiệm nhiều nhất có thể, để các tổ chức khác có thể áp dụng kinh nghiệm liên quan vào việc xây dựng an ninh của chính họ. Trong vòng 90 ngày, Anthropic sẽ công bố báo cáo kết quả giai đoạn, bao gồm các lỗ hổng đã được sửa chữa và các biện pháp cải thiện an ninh có thể tiết lộ.

Công nghệ chỉ không ngừng nâng cấp, nhưng cũng không cần quá lo lắng

AI đang thay đổi thế giới quen thuộc của chúng ta một cách không thể đảo ngược, bao gồm cả lĩnh vực an ninh mạng được đề cập trong bài viết này. Khi ngưỡng phát hiện và khai thác lỗ hổng giảm mạnh, mọi người không khỏi lo ngại, liệu AI có trở thành lưỡi dao trong tay kẻ có ý đồ xấu, đe dọa sự cân bằng an ninh mạng hiện có? (PS: Đối với người dùng tiền mã hóa cần đặt tiền thật trong hệ thống ví hoặc giao thức trên chuỗi, mối lo ngại này sẽ đặc biệt mạnh mẽ.)

Đối với vấn đề này, Anthropic cho rằng "chúng ta vẫn có lý do để lạc quan", lý do mô hình AI nguy hiểm chính là vì chúng có khả năng gây hại trong tay những kẻ bất hợp pháp, nhưng đồng thời, AI cũng có giá trị không thể đánh giá hết được trong việc phát hiện và sửa chữa lỗi phần mềm quan trọng cũng như phát triển phần mềm mới an toàn hơn.

Có thể dự đoán, trong vài năm tới khả năng của AI vẫn sẽ tiến hóa nhanh chóng, nhưng khi phương thức tấn công mới xuất hiện, cơ chế phòng thủ mới cũng sẽ đồng thời xuất hiện. Nâng cấp công nghệ là không thể tránh khỏi, nhưng điều này không có nghĩa rủi ro必然(tất yếu) mất kiểm soát — chỉ cần hệ thống phòng thủ tiến hóa đồng bộ, thậm chí có thể借助(dựa vào) AI để xây dựng hào thành an ninh cường độ cao hơn.

Câu hỏi Liên quan

QAnthropic đã công bố kế hoạch gì vào ngày 8 tháng 4?

AAnthropic đã công bố kế hoạch 'Cánh Thủy Tinh' (Project Glasswing), một sáng kiến hợp tác với các công ty hàng đầu như Amazon, Apple, Google, Microsoft, NVIDIA và nhiều công ty khác để bảo vệ phần mềm quan trọng toàn cầu bằng cách sử dụng phiên bản Mythos Preview để phát hiện và sửa chữa các lỗ hổng tiềm ẩn.

QMô hình AI Mythos của Anthropic có những điểm đột phá nào?

AMythos là mô hình AI đầu tiên trên thế giới đạt quy mô tham số hơn 10 nghìn tỷ, với chi phí đào tạo lên tới 10 tỷ USD. Nó vượt trội so với Claude Opus 4.6 trong các bài kiểm tra mã hóa phần mềm, lập luận học thuật và an ninh mạng.

QTại sao Anthropic không công bố rộng rãi mô hình Mythos?

AAnthropic không công bố rộng rãi Mythos vì lo ngại khả năng mô hình có thể bị các nhóm tin tặc lợi dụng để khai thác lỗ hổng phần mềm. Thay vào đó, họ triển khai kế hoạch 'Cánh Thủy Tinh' để các công ty lớn kiểm tra và vá lỗi trước.

QMythos đã đạt được những kết quả ấn tượng nào trong thử nghiệm?

ATrong vài tuần, Mythos đã phát hiện hàng nghìn lỗ hổng zero-day, bao gồm các lỗ hổng nghiêm trọng trong hệ điều hành, trình duyệt và phần mềm then chốt. Nó cũng tìm thấy lỗi tồn tại 27 năm trong OpenBSD và 16 năm trong FFmpeg.

QLàm thế nào Anthropic hỗ trợ các tổ chức tham gia kế hoạch 'Cánh Thủy Tinh'?

AAnthropic cung cấp 100 triệu USD credit sử dụng mô hình Mythos Preview cho các đối tác, đồng thời quyên góp 4 triệu USD cho các tổ chức như Linux Foundation và Apache Software Foundation để hỗ trợ bảo mật phần mềm nguồn mở.

Nội dung Liên quan

Ghi chép 8 năm khởi nghiệp của đối tác định hướng AI tại a16z

Tác giả, một doanh nhân tiên phong trong lĩnh vực AI generative, đã chia sẻ hành trình 8 năm xây dựng Rosebud AI và những suyết định quan trọng trước khi chuyển sang vai trò mới với tư cách đối tác tại a16z, tập trung đầu tư vào cơ sở hạ tầng AI. Bắt đầu từ năm 2018 khi AI generative còn được gọi là "truyền thông tổng hợp", ông tin tưởng vào tiềm năng biến việc sáng tạo trở nên dễ dàng như chơi game. Các sản phẩm ban đầu như TokkingHeads đã thu hút hàng triệu người dùng bằng cách thiết kế trải nghiệm đơn giản, che đi những hạn chế của mô hình AI thời kỳ đầu. Sự ra mắt của GPT-4 vào năm 2023 là bước ngoặt, khi khả năng tạo mã đủ mạnh để phát triển công cụ trò chơi cho người sáng tạo không chuyên. Ông nhấn mạnh rằng giai đoạn chứng minh khả năng của AI generative đã kết thúc, và cuộc cạnh tranh tiếp theo sẽ xoay quanh việc tổ chức, sản phẩm hóa và thương mại hóa các khả năng này. Trong vai trò mới tại a16z, ông sẽ tập trung vào đầu tư vào frontier model stack, cơ sở hạ tầng và các công cụ phát triển xung quanh mô hình AI. Ông cũng bày tỏ sự lạc quan về những đột phá mà AI mang lại trong lĩnh vực toán học và khoa học.

marsbit13 giờ trước

Ghi chép 8 năm khởi nghiệp của đối tác định hướng AI tại a16z

marsbit13 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片