Anthropic tạo ra mô hình AI mạnh nhất lịu sử, nhưng không dám công bố...

Odaily星球日报Xuất bản vào 2026-04-08Cập nhật gần nhất vào 2026-04-08

Tóm tắt

Công ty AI Anthropic vừa công bố kế hoạch "Cánh Thủy Tinh" (Project Glasswing), hợp tác với các tập đoàn hàng đầu như Amazon, Apple, Google, Microsoft, NVIDIA… nhằm bảo vệ phần mềm toàn cầu. Động lực chính là Mythos - mô hình AI thế hệ mới với quy mô 10 nghìn tỷ tham số, chi phí huấn luyện lên tới 10 tỷ USD. Mythos được cho là mô hình mạnh nhất từ trước đến nay, vượt trội so với Claude Opus 4.6 trong mã hóa, lập luận học thuật và an ninh mạng. Chỉ trong vài tuần, nó đã tự động phát hiện hàng nghìn lỗ hổng "zero-day" nghiêm trọng trong các hệ thống then chốt như OpenBSD, FFmpeg và Linux kernel, bao gồm những lỗi tồn tại hơn 20 năm. Do khả năng khai thác lỗ hổng quá mạnh, Anthropic không công bố rộng rãi mà cho các đối tác trong chương trình dùng thử Mythos Preview để sửa lỗi trước. Họ cam kết tài trợ 100 triệu USD chi phí sử dụng và quyên góp 4 triệu USD cho các tổ chức mã nguồn mở. Anthropic lạc quan cho rằng, dù AI có thể bị lợi dụng, nó cũng mang lại giá trị to lớn trong việc phát hiện và sửa lỗi, giúp xây dựng hệ thống phòng thủ mạnh hơn. Báo cáo chi tiết về kết quả sẽ được công bố sau 90 ngày.

Bài gốc | Odaily Planet Daily (@OdailyChina)

Tác giả | Azuma (@azuma_eth)

Ngày 8 tháng 4, Anthropic, công ty phát triển AI đứng sau Claude, đã chính thức công bố sẽ ra mắt một kế hoạch mới có tên "Cánh Thủy Tinh" (Project Glasswing). Kế hoạch này sẽ được triển khai phối hợp cùng nhiều tập đoàn hàng đầu như Amazon, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, Linux Foundation, Microsoft, NVIDIA và Palo Alto Networks.

Anthropic cho biết, đây là một biện pháp khẩn cấp nhằm bảo vệ phần mềm quan trọng nhất toàn cầu, các bên sẽ cùng nhau sử dụng phiên bản xem trước Mythos để phát hiện và sửa chữa các lỗ hổng tiềm ẩn trong các hệ thống mà thế giới hiện đang phụ thuộc vào.

Mythos được nhắc đến, chính là mô hình AI thế hệ tiếp theo mà Anthropic đang phát triển. Đây là mô hình đầu tiên trong lịch sử nhân loại đạt quy mô tham số tổng vượt mười nghìn tỷ (so với các mô hình phổ biến hiện nay có số tham số trong khoảng vài trăm tỷ đến một nghìn tỷ), với chi phí huấn luyện lên tới 100 tỷ USD đáng kinh ngạc. So với mô hình mạnh nhất hiện tại của Claude là Opus 4.6, Mythos đạt điểm số cao hơn đáng kể trong các bài kiểm tra về mã hóa phần mềm, lập luận học thuật và an ninh mạng.

Tin đồn về Mythos đã lan truyền trên thị trường từ tuần trước, mối lo ngại phổ biến lúc đó là — liệu Mythos với khả năng chuyên biệt về an ninh mạng có ảnh hưởng đến cục diện phòng thủ an ninh hiện tại? Nếu bị kẻ xấu lợi dụng, nó có thể gây ra các sự cố an ninh quy mô lớn hơn? Odaily lúc đó cũng đã đưa tin về sự việc và từng thảo luận với chuyên gia an ninh ngành, nhà sáng lập SlowMist, Cosine, về tác động tiềm ẩn đối với an ninh phòng thủ trong ngành công nghiệp tiền mã hóa (xem chi tiết 《Odaily Phỏng vấn Cosine: Mô hình mới hạt nhân của Anthropic bị rò rỉ, ảnh hưởng thế nào đến an ninh phòng thủ mã hóa?》), nhưng lúc đó phía Anthropic chưa công khai thừa nhận sự tồn tại của Mythos, nên thông tin liên quan vẫn còn hạn chế.

Vào ngày 8 tháng 4, cùng với việc công bố kế hoạch "Cánh Thủy Tinh", Anthropic cũng tiết lộ thêm nhiều chi tiết liên quan đến Mythos. Dựa trên các trường hợp thử nghiệm thực tế mà Anthropic công bố, Anthropic không hề phóng đại khả năng của Mythos, đến mức công ty này thậm chí không dám trực tiếp công bố rộng rãi mô hình này, để phòng tránh việc bị các nhóm hacker lợi dụng cho mục đích xấu, mà thay vào đó lên kế hoạch cho các tập đoàn lớn dùng thử thông qua kế hoạch "Cánh Thủy Tinh" để sớm kiểm tra và vá các lỗ hổng tiềm ẩn.

Mythos khoe cơ bắp: Chỉ vài tuần, đào được hàng nghìn "lỗ hổng zero-day"

Khi nói về sức mạnh của Mythos, Anthropic thẳng thắn tuyên bố, sự ra đời của mô hình này đồng nghĩa với một thực tế nghiêm trọng đã đến — khả năng mã hóa của mô hình AI đã đạt đến trình độ cực cao, trong việc phát hiện và khai thác lỗ hổng phần mềm, chúng gần như có thể vượt qua tất cả mọi người ngoại trừ những con người thành thạo nhất.

Theo tiết lộ từ phía Anthropic, chỉ trong vòng vài tuần ngắn ngủi, Anthropic đã sử dụng Mythos để xác định được hàng nghìn lỗ hổng zero-day (tức những lỗi mà ngay cả nhà phát triển phần mềm cũng chưa từng phát hiện ra), trong đó nhiều lỗi thuộc loại nguy hiểm cao, vấn đề bao phủ tất cả các hệ điều hành chính và trình duyệt chủ lưu, đồng thời ảnh hưởng đến một loạt phần mềm quan trọng khác.

Anthropic đưa ra một vài trường hợp điển hình:

  • Mythos phát hiện một lỗ hổng tồn tại 27 năm trong OpenBSD, hệ thống vốn nổi tiếng với độ "cực kỳ an toàn", được sử dụng rộng rãi trong các cơ sở hạ tầng quan trọng như tường lửa, và lỗ hổng này cho phép kẻ tấn công từ xa trực tiếp làm sụp đổ hệ thống;
  • Trong thư viện xử lý video FFmpeg được sử dụng rộng rãi, Mythos tìm thấy một lỗ hổng tồn tại 16 năm, đoạn mã chứa lỗi này đã từng được kích hoạt bởi kiểm tra tự động hơn 5 triệu lần, nhưng始终(chưa bao giờ) được phát hiện;
  • Mythos còn có thể tự động kết nối nhiều lỗ hổng trong nhân Linux, leo thang từ quyền người dùng thông thường để giành quyền kiểm soát hoàn toàn máy chủ.

Đáng lo ngại hơn, Anthropic cho biết phần lớn các lỗ hổng này là do Mythos "tự động phát hiện và xây dựng đường dẫn khai thác" với rất ít sự can thiệp của con người, điều này có lẽ意味着(AI) đã bắt đầu có được khả năng tự động hóa tấn công-phòng thủ tương tự như các nhóm hacker đỉnh cao.

Trên các điểm chuẩn đánh giá, Mythos so với Opus 4.6 cũng thể hiện sự tiến hóa vượt bậc. Ví dụ, trong bài kiểm tra tái hiện lỗ hổng an ninh mạng, Mythos đạt 83.1%, trong khi Opus 4.6 chỉ đạt 66.6%; trong nhiều bài kiểm tra mã hóa và suy luận, điểm số của Mythos cũng dẫn đầu vượt trội.

Có lẽ chính vì khả năng của Mythos quá mạnh mẽ, Anthropic đã không chọn cách mở trực tiếp mô hình, mà trước tiên đưa ra kế hoạch "Cánh Thủy Tinh", để toàn bộ Internet sớm được "gia cố".

Thông qua kế hoạch này, Anthropic sẽ mở sớm phiên bản xem trước Mythos Preview cho các bên tham gia kế hoạch, để phát hiện và sửa chữa lỗ hổng hoặc điểm yếu trong hệ thống cơ sở của họ — tập trung vào các nhiệm vụ như phát hiện lỗ hổng cục bộ, kiểm tra hộp đen chương trình nhị phân, củng cố an ninh đầu cuối và kiểm tra thâm nhập hệ thống.

Anthropic còn cam kết, sẽ cung cấp cho các bên tham gia kế hoạch tổng hạn mức sử dụng mô hình trị giá 100 triệu USD, để hỗ trợ việc sử dụng trong toàn bộ giai đoạn xem trước nghiên cứu. Sau đó, phiên bản Mythos Preview sẽ được mở cho các bên tham gia với giá lần lượt là 25 USD / 125 USD cho mỗi triệu tokens đầu vào / đầu ra (người tham gia cũng có thể truy cập mô hình này thông qua Claude API, Amazon Bedrock, Google Cloud Vertex AI và Microsoft Foundry). Ngoài hạn mức sử dụng mô hình, Anthropic còn thông qua Linux Foundation quyên tặng 2.5 triệu USD cho Alpha-Omega và OpenSSF, và quyên tặng 1.5 triệu USD cho Apache Software Foundation, để giúp những người bảo trì phần mềm mã nguồn mở ứng phó với môi trường an ninh không ngừng thay đổi.

Anthropic có kế hoạch mở rộng dần phạm vi tham gia của "Cánh Thủy Tinh" và tiếp tục thúc đẩy trong nhiều tháng, đồng thời chia sẻ kinh nghiệm nhiều nhất có thể, để các tổ chức khác có thể áp dụng kinh nghiệm liên quan vào việc xây dựng an ninh của chính họ. Trong vòng 90 ngày, Anthropic sẽ công bố báo cáo kết quả giai đoạn, bao gồm các lỗ hổng đã được sửa chữa và các biện pháp cải thiện an ninh có thể tiết lộ.

Công nghệ chỉ không ngừng nâng cấp, nhưng cũng không cần quá lo lắng

AI đang thay đổi thế giới quen thuộc của chúng ta một cách không thể đảo ngược, bao gồm cả lĩnh vực an ninh mạng được đề cập trong bài viết này. Khi ngưỡng phát hiện và khai thác lỗ hổng giảm mạnh, mọi người không khỏi lo ngại, liệu AI có trở thành lưỡi dao trong tay kẻ có ý đồ xấu, đe dọa sự cân bằng an ninh mạng hiện có? (PS: Đối với người dùng tiền mã hóa cần đặt tiền thật trong hệ thống ví hoặc giao thức trên chuỗi, mối lo ngại này sẽ đặc biệt mạnh mẽ.)

Đối với vấn đề này, Anthropic cho rằng "chúng ta vẫn có lý do để lạc quan", lý do mô hình AI nguy hiểm chính là vì chúng có khả năng gây hại trong tay những kẻ bất hợp pháp, nhưng đồng thời, AI cũng có giá trị không thể đánh giá hết được trong việc phát hiện và sửa chữa lỗi phần mềm quan trọng cũng như phát triển phần mềm mới an toàn hơn.

Có thể dự đoán, trong vài năm tới khả năng của AI vẫn sẽ tiến hóa nhanh chóng, nhưng khi phương thức tấn công mới xuất hiện, cơ chế phòng thủ mới cũng sẽ đồng thời xuất hiện. Nâng cấp công nghệ là không thể tránh khỏi, nhưng điều này không có nghĩa rủi ro必然(tất yếu) mất kiểm soát — chỉ cần hệ thống phòng thủ tiến hóa đồng bộ, thậm chí có thể借助(dựa vào) AI để xây dựng hào thành an ninh cường độ cao hơn.

Câu hỏi Liên quan

QAnthropic đã công bố kế hoạch gì vào ngày 8 tháng 4?

AAnthropic đã công bố kế hoạch 'Cánh Thủy Tinh' (Project Glasswing), một sáng kiến hợp tác với các công ty hàng đầu như Amazon, Apple, Google, Microsoft, NVIDIA và nhiều công ty khác để bảo vệ phần mềm quan trọng toàn cầu bằng cách sử dụng phiên bản Mythos Preview để phát hiện và sửa chữa các lỗ hổng tiềm ẩn.

QMô hình AI Mythos của Anthropic có những điểm đột phá nào?

AMythos là mô hình AI đầu tiên trên thế giới đạt quy mô tham số hơn 10 nghìn tỷ, với chi phí đào tạo lên tới 10 tỷ USD. Nó vượt trội so với Claude Opus 4.6 trong các bài kiểm tra mã hóa phần mềm, lập luận học thuật và an ninh mạng.

QTại sao Anthropic không công bố rộng rãi mô hình Mythos?

AAnthropic không công bố rộng rãi Mythos vì lo ngại khả năng mô hình có thể bị các nhóm tin tặc lợi dụng để khai thác lỗ hổng phần mềm. Thay vào đó, họ triển khai kế hoạch 'Cánh Thủy Tinh' để các công ty lớn kiểm tra và vá lỗi trước.

QMythos đã đạt được những kết quả ấn tượng nào trong thử nghiệm?

ATrong vài tuần, Mythos đã phát hiện hàng nghìn lỗ hổng zero-day, bao gồm các lỗ hổng nghiêm trọng trong hệ điều hành, trình duyệt và phần mềm then chốt. Nó cũng tìm thấy lỗi tồn tại 27 năm trong OpenBSD và 16 năm trong FFmpeg.

QLàm thế nào Anthropic hỗ trợ các tổ chức tham gia kế hoạch 'Cánh Thủy Tinh'?

AAnthropic cung cấp 100 triệu USD credit sử dụng mô hình Mythos Preview cho các đối tác, đồng thời quyên góp 4 triệu USD cho các tổ chức như Linux Foundation và Apache Software Foundation để hỗ trợ bảo mật phần mềm nguồn mở.

Nội dung Liên quan

Bạn đặt cược tin tức, đầu tàu đọc quy tắc: Chênh lệch nhận thức thực sự khi thua lỗ trên Polymarket

Tại sao nhiều người thua lỗ trên Polymarket? Vì họ chỉ tập trung vào sự kiện thực tế mà bỏ qua yếu tố then chốt: **luật chơi**. Bài viết lấy ví dụ từ thị trường dự đoán lãnh đạo Venezuela năm 2026, nơi người chơi đặt cược vào Delcy (người đang nắm quyền) nhưng kết quả lại nghiêng về Maduro (người được công nhận chính thức dù đang trong tù), chỉ vì điều khoản thị trường quy định "người nắm giữ chức vụ chính thức" (officially holds) dựa trên sự công nhận của LHQ và văn bản hành chính, không phải thực tế nắm quyền. Polymarket xây dựng một quy trình giải quyết tranh chấp phức tạp gồm 5 bước: 1. **Đề xuất kết quả** (Propose) - Đặt cọc 750 USDC 2. **Khiếu nại** (Dispute) - Tranh chấp trong 2 giờ 3. **Thảo luận** - Trên Discord trong 48 giờ 4. **Bỏ phiếu** - Bởi holder UMA (ẩn danh & công khai) 5. **Kết quả cuối cùng** - Không kháng cáo Tuy nhiên, hệ thống này có điểm khác biệt lớn so với tòa án truyền thống: **người bỏ phiếu (thẩm phán) có thể đồng thời là người nắm giữ vị thế trên thị trường (người chơi)**, dẫn đến xung đột lợi ích. Điều này khiến cho các cuộc thảo luận dễ bị ảnh hưởng bởi hiệu ứng đám đông và thay đổi lập trường, đồng thời kết quả bỏ phiếu không được giải thích rõ ràng, không tạo ra tiền lệ để tham khảo cho sau này. Bài học rút ra: Polymarket không chỉ là nơi dự đoán sự kiện, mà là nơi diễn dịch **ngôn ngữ pháp lý** của các điều khoản thị trường. "Xe đầu" (người chơi chuyên nghiệp) thắng nhờ khả năng đọc kỹ và hiểu sâu luật chơi, từ đó tận dụng được khoảng chênh lệch giữa thực tế và quy tắc để kiếm lợi nhuận.

marsbit8 phút trước

Bạn đặt cược tin tức, đầu tàu đọc quy tắc: Chênh lệch nhận thức thực sự khi thua lỗ trên Polymarket

marsbit8 phút trước

Hiện trường thứ hai của ngôi sao hàng đầu vĩ mô Phó Bằng

Nhà kinh tế trưởng nổi tiếng Phó Bằng chính thức gia nhập Tập đoàn Tân Hỏa (Bitfire Group), đánh dấu bước chuyển mình sang lĩnh vực tài sản số sau gần một năm vắng bóng. Sự kiện này ngay lập tức đẩy giá cổ phiếu Tân Hỏa tăng hơn 11%. Phó Bằng, cựu Chuyên gia kinh tế trưởng của Đông Bắc Chứng quyền, sẽ đảm nhiệm vị trí tương tự tại Tân Hỏa, tập trung tích hợp tài sản số (C) vào khung phân bổ tài sản toàn cầu, kết hợp với chuyên môn FICC (thu nhập cố định, ngoại hối và hàng hóa) của ông. Bài viết điểm lại hành trình sự nghiệp của Phó Bằng, từ kinh nghiệm tại Lehman Brothers và các tổ chức tài chính truyền thống, đến phong cách phân tích phổ biến kiến thức vĩ mô phức tạp cho công chúng qua mạng xã hội, giúp ông có hơn 4 triệu người theo dõi. Năm 2024, một bài phát biểu trực tiếp về kinh tế Trung Quốc đã dẫn đến việc tài khoản của ông bị đình chỉ và ông rời Đông Bắc Chứng quyền, một phần vì lý do sức khỏe. Động thái này được xem là chiến lược cùng có lợi. Tân Hỏa, một công ty quản lý tài sản số có trụ sở tại Hồng Kông, đang tìm cách xây dựng niềm tin với các khách hàng tổ chức và gia đình giàu có. Danh tiếng và chuyên môn của Phó Bằng trong tài chính truyền thống được kỳ vọng sẽ cung cấp một "bộ não chiến lược" uy tín, giúp công ty thu hút dòng tiền truyền thống vào thị trường tài sản số đầy biến động.

marsbit1 giờ trước

Hiện trường thứ hai của ngôi sao hàng đầu vĩ mô Phó Bằng

marsbit1 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片