Mọi người chắc còn nhớ vào tháng Tư, Anthropic đã công bố mô hình tên là Mythos.
Nhìn tên đã biết nó lợi hại thế nào, "Huyền thoại".
Khi đó, nghe nói nó đã tìm ra hơn một vạn lỗ hổng nguy hiểm cao cho 50 doanh nghiệp khách hàng, chấn động toàn ngành.
Tin này đã từng khiến cổ phiếu an ninh mạng đồng loạt sụt giảm, mọi người hẳn vẫn còn ấn tượng.
Vì quá mạnh mẽ, lo ngại bị lạm dụng, "quá nguy hiểm không thể công khai", nên không mở cho công chúng.
Cho đến tối qua, Anthropic đã thêm bộ phân loại an toàn vào mô hình Mythos, chính thức ra mắt Fable 5.
Còn Mythos 5 chưa bị rút bớt tính năng, hiện chỉ mở cho khoảng 200 tổ chức được kiểm duyệt nghiêm ngặt như Nhà Trắng, những người phòng thủ an ninh mạng và dự án Bướm Cánh Trong.
Sự thận trọng như vậy, khó không khiến người ta liên tưởng đến bộ phim hoạt hình AI đang hot gần đây "Động Cơ Thiên Thần".
Thứ bị nhốt trong lồng, liệu có phải là vị "Thiên thần" đó không?
Ngay cả khi bây giờ chưa phải, thì cũng không còn xa nữa.
01
Theo dữ liệu kiểm tra do Anthropic công bố chính thức, cùng báo cáo thực nghiệm phản hồi từ các đối tác doanh nghiệp đầu tiên, sức mạnh của Fable 5 có thể dùng bốn từ để mô tả: kinh ngạc đến sững sờ.
Trước tiên nhìn vào điểm số.
Bảng đánh giá lập trình tự động SWE-Bench Pro, Claude Fable 5 tỷ lệ vượt qua 80.3%, "mẹ" của nó Opus 4.8 là 69.2%; GPT-5.5 là 58.6%; Gemini 3.1 Pro chỉ có 54.2%.
Đánh giá mã nguồn tiên tiến, Fable 5 đạt 29.3%, Opus 4.8 là 13.4%; GPT-5.5 chỉ 5.7%.
......
Khoảng cách trong đó, giống như trong thời kỳ vũ khí lạnh bỗng nhiên có người rút súng máy ra.
Còn lại, kỹ thuật phần mềm, giả thuyết nghiên cứu khoa học độc lập, thiết kế phân tử thuốc, chưng cất mô hình và nén tối đa, hiểu ngữ cảnh dài v.v..., trong hầu hết các bài kiểm tra, Fable 5 đều đứng nhất.
Cụ thể mọi người có thể tự tìm video xem.
Tiếp theo nhìn vào thực chiến.
Gã khổng lồ thanh toán Stripe dùng Fable 5 làm một bài kiểm tra sớm. Họ có một kho mã nguồn lịch sử di sản lên tới 50 triệu dòng cần di chuyển toàn bộ. Theo đánh giá, quy mô tái cấu trúc như vậy, dù giao cho đội ngũ chuyên nghiệp, cũng ít nhất cần hai tháng.
Kết quả, sau khi đưa nhiệm vụ cho Fable 5, nó tự mình lập kế hoạch, tự kiểm tra tiến độ, gặp lỗi tự sửa chữa. Chỉ trong một ngày, công việc di chuyển 50 triệu dòng mã đã hoàn thành.
Biểu hiện như vậy, không phải hai từ "mạnh mẽ" là có thể mô tả hết.
Từ góc độ hẹp mà nói, Fable 5 thực ra đã đạt được AGI ở cấp độ kinh tế số.
Nguyên nhân là, nó thể hiện khả năng "ủy thác tầm xa" thực sự.
Dù là GPT-5.5 hay Gemin 3.5, chưa nói đến các mô hình lớn kém hơn khác, về bản chất đều đang ở trạng thái "trả lời".
Bạn đá một cú, nó đi một bước.
Gặp ngõ cụt, nó chỉ có thể ném ra ngoại lệ, làm nũng nói "xin lỗi tôi chỉ là một mô hình ngôn ngữ".
Nói là công cụ, nhưng thực ra người dùng vẫn cần suy nghĩ sâu sắc, dẫn dắt AI từng bước đưa ra kết quả mình muốn, không hề dễ dàng.
Fable 5 với logic định hướng mục tiêu được nội hóa thì khác.
Như bài kiểm tra của Strip, khi người dùng đưa cho nó một nhiệm vụ dài hạn khó khăn, chia làm ba bước:
Thiết lập cây nhiệm vụ con;
Điều phối các công cụ khác nhau (tìm kiếm web, kéo cơ sở dữ liệu, môi trường sandbox Python);
Tự phản ánh, phát hiện không chạy được, lập tức đổi đường khác.
Người ngoài việc đề xuất nhiệm vụ và nhận kết quả, không còn cần phải chỉ tay năm ngón bên cạnh.
Là một công cụ sản xuất, điều này đã rất hoàn hảo.
Nhưng nó và AGI thực sự, vẫn là hai chuyện khác nhau.
Sự mạnh mẽ của Fable 5, được xây dựng dựa trên việc kho mã nguồn, tài liệu khoa học mà nó ở trong vẫn có một logic toán học cơ bản và định nghĩa cấu trúc.
Lý do nó không lạc lối trong nhiệm vụ chu kỳ dài, là vì đã khắc phục được vấn đề "suy giảm chú ý văn bản dài" này, khi xử lý nhiệm vụ phức tạp dài hàng triệu token, vẫn có thể luôn duy trì sự liên kết với mục tiêu cốt lõi.
Nhưng một khi ném nó vào một xã hội hiện thực vật lý hoàn toàn hỗn loạn, thiếu quy tắc số, và ngay cả con người cũng chưa hiểu rõ, nó vẫn sẽ tạo ra đứt gãy logic do "thiếu nền móng".
Nếu dùng "tiêu chuẩn năm cấp trí tuệ nhân tạo" do OpenAI đề xuất (Cấp 1: Chatbot; Cấp 2: Người lập luận; Cấp 3: Tác nhân thông minh; Cấp 4: Nhà đổi mới; Cấp 5: Tổ chức) để đo lường.
Opus 4.8 là từ cấp 2 tiến tới cấp 3, Fable 5 thực sự đứng vững ở cấp 3 và đang khám phá cấp 4.
Mà từ Opus 4.7 lên 4.8 mất 43 ngày, từ 4.8 lên Fable 5 chỉ mất 11 ngày.
Đứng vững cấp 4 cần bao lâu? Theo nhịp độ cập nhật ngày càng nhanh của Anthropic hiện nay, rất có thể trong năm nay sẽ đạt được.
Ngay cả cấp 5 cuối cùng, dự đoán lạc quan cũng chỉ cần 18-24 tháng, thực sự chỉ còn một bước chân nữa.
Tốc độ này quá nhanh, đây cũng là lý do lớn nhất tại sao phải thêm hạn chế an toàn cho nó.
02
Trong báo cáo "System Card" và đánh giá RSP được Anthropic phát hành cùng mô hình, Mythos 5 xuất hiện tín hiệu cực kỳ nguy hiểm ở hai khả năng.
Một, mô hình cơ sở Fable/Mythos trong đánh giá hóa học và sinh học, đã đạt đến cấp CB-1.
Nghĩa là, mô hình này có khả năng từ đầu đến cuối "tổng hợp và hướng dẫn chế tạo vũ khí sinh/hóa học không mới", thậm chí đưa ra đề xuất sửa đổi trình tự gene để tối ưu hiệu suất lây lan của một loại virus nguy hiểm cao.
Nếu một tên khủng bố có nền tảng sinh học đại học cơ bản, có được Mythos 5 đã được giải phong ấn, hoàn toàn có thể thông qua nhắc nhở mô hình liên tục, lấy được hướng dẫn hoàn chỉnh về cách tránh giám sát nguyên liệu, cách thiết lập phòng thí nghiệm P3 đơn giản dưới tầng hầm, cách tổng hợp mầm bệnh gây chết người cao.
Hai, tấn công mạng và khai thác lỗ hổng.
Trong bài kiểm tra cực kỳ sớm, Mythos 5 đã thể hiện khả năng tự tìm kiếm, và tấn công phá vỡ lỗ hổng cốt lõi của cơ sở hạ tầng trọng yếu (như nhà máy điện, hệ thống thanh toán tài chính, hệ thống mạng bệnh viện), chỉ vài giây có thể tạo ra kịch bản tấn công lỗ hổng zero-day nhắm mục tiêu.
Tháng 4 năm nay khi Mythos vừa được nghiên cứu ra, đã có tin tiết lộ nói nó đã tìm ra hơn một vạn lỗ hổng cấp độ nguy hiểm cao cho 50 đối tác ban đầu.
......
Đối với hai tình huống này, ném thẳng Mythos 5 cho đại chúng, nguy hiểm thực sự quá cao.
Phải nhốt con thú dữ này vào lồng.
Sau hai tháng, cái lồng Anthropic tạo ra có hai lớp.
Thứ nhất, cơ chế định tuyến giáng cấp im lặng.
Anthropic đã triển khai ở front-end của Fable 5 một bộ phân loại AI độc lập hoàn toàn, phản ứng cực kỳ nhạy bén với độ chính xác cao.
Khi người dùng nhập một đoạn nhắc phức tạp, có thể liên quan đến tấn công-phòng thủ mạng, sinh hóa học, hoặc cố gắng lấy trọng số mô hình một cách ẩn, bộ phân loại sẽ lập tức kéo còi báo động, và ở backend im lặng chuyển hướng phiên hội thoại sang phiên bản cũ Opus 4.8 để trả lời.
Thứ hai, lưu giữ dữ liệu.
Anthropic và Amazon tối qua cùng tuyên bố: Bất kể ở nền tảng bên thứ nhất hay bên thứ ba, tất cả lưu lượng gọi mô hình Mythos, bắt buộc phải thực thi lưu giữ dữ liệu 30 ngày.
Tại sao?
Vì hacker hoặc khủng bố thực sự, đa số IQ đều rất cao, họ sẽ không hỏi trực tiếp "làm thế nào chế tạo bom" trong một cuộc đối thoại, mà chia vấn đề thành 100 câu hỏi cơ bản trông vô hại.
Giám sát dữ liệu toàn lượng 30 ngày, chính là để thông qua nhận dạng mẫu, bắt những hành vi lạm dụng ác ý "cắt lát xúc xích" mà đối thoại đơn lần không nhìn ra được.
Như Dario Amodei đã từng cảnh báo ở nơi công cộng: "Xác suất AI dẫn đến rủi ro thảm họa cho nhân loại, có tới 25%."
Để tuân thủ "Chính sách thu phóng có trách nhiệm" (RSP) và "Khung tuân thủ tiên phong" (FCF) được thiết lập nội bộ công ty, Anthropic phải tự tay đeo xích cho con thú khổng lồ này.
Và thế là, có Fable 5.
03
Nói tiếp về giá cả.
Giá niêm yết chính thức do Anthropic công bố là: 10 đô la cho mỗi triệu token đầu vào, 50 đô la cho mỗi triệu token đầu ra.
Quá đắt.
Tác nhân Agent cấp doanh nghiệp hiện nay, để theo đuổi tỷ lệ chính xác cao, thường áp dụng logic chuỗi "suy nghĩ suy nghĩ suy nghĩ nhiều vòng", một vòng thông qua có thể đã ăn hết 20 triệu token đầu vào, sau đó nhả ra 5 triệu mã sửa đổi.
Tính ra, một nhiệm vụ đơn lần đã là 450 đô la.
Hơn nữa, Anthropic đã ra thông báo: Cửa sổ trải nghiệm mô hình Mythos có trong đăng ký cá nhân hiện tại (Claude Pro), sẽ đóng cửa hoàn toàn vào ngày 22 tháng 6 năm 2026.
Sau này, người dùng cá nhân nếu thực sự dùng nó để làm việc, vài chục đô la thật sự sẽ biến mất trong chớp mắt.
Tuy nói, cùng với cập nhật công nghệ, giá của nó cuối cùng chắc chắn sẽ giảm xuống, nhưng đến lúc đó nó sớm đã không còn mạnh nhất.
Hiện trạng đã rất rõ ràng: Mô hình lớn tiên tiến nhất biến thành hàng xa xỉ, người bình thường căn bản không dùng nổi.
Đương nhiên, đối với Anthropic tập trung thị trường B2B, điều này không có gì sai.
Vấn đề là, không lâu trước đó, Google còn tuyên bố ồn ào sẽ đánh chiến tranh giá.
Khi đối thủ cạnh tranh phổ biến giảm giá cướp thị trường, tại sao Anthropic dám tăng giá ngược dòng?
Vì giá Token là ảo, tỷ suất hoàn vốn mới là căn bản.
Khách hàng doanh nghiệp căn bản không quan tâm một kWh điện, một Token bao nhiêu tiền, chỉ cần AI có thể hoàn thành hoàn hảo không Bug toàn bộ quy trình công trình, phần giá đắt hơn này họ tranh nhau trả.
Quan trọng hơn, chiến tranh an ninh mạng hiện nay, đã hoàn toàn trở thành đối kháng giữa AI và AI.
Do mô hình cấp độ Fable/Mythos có thể ngay lập tức tìm ra lỗ hổng hệ thống, doanh nghiệp và cơ quan nhà nước để phòng bị bị tấn công, lựa chọn duy nhất chỉ có thể là mua với giá cao dịch vụ phòng thủ nội mạng riêng tư Mythos 5 từ Anthropic.
Nói đơn giản là thu phí bảo kê: Tôi tạo ra thanh kiếm kinh khủng nhất (Mythos 5), tôi sợ làm người khác bị thương nên đeo vỏ kiếm bán cho đại chúng (Fable 5), nhưng đồng thời tôi bán thanh kiếm không bị hạn chế cho bộ phận phòng thủ, để họ dùng để ngăn chặn thanh kiếm người khác đang nghiên cứu.
Phòng thủ mối đe dọa từ AI, sẽ trở thành chi tiêu cứng cần thiết của mọi doanh nghiệp lớn.
Điều này sẽ trực tiếp dẫn đến ngân sách cao cấp thị trường B2B sẽ càng tập trung vào Anthropic, còn những mô hình rẻ tiền chỉ dùng để viết văn bản công vụ, gửi email, chỉ có thể đánh nhau giữa các thị trường C2C lợi nhuận cực thấp.
Có thể dự đoán, tiếp theo, phân khúc an ninh mạng toàn cầu sẽ đón một vòng định giá lại giá trị do AI thúc đẩy.
Đồng thời, "doanh nghiệp một người" cũng sẽ sớm trở thành hiện tượng ngày càng phổ biến.
04
Mang chức năng phân bổ ngân sách nhiệm vụ, hỗ trợ công cụ ghi nhớ và quản lý ngữ cảnh, có thể như người ghi nhớ, lật đổ, làm lại, có thể đảm nhận độc lập toàn bộ vòng đời từ tài liệu yêu cầu đến giao mã nguồn......
Sự xuất hiện của Fable 5 và Mythos 5, không phải là một lần cập nhật công nghệ mô hình lớn, mà là lễ trưởng thành của ngành công nghiệp AI phân công lao động hoàn toàn trưởng thành.
Thị trường AI sơ bộ từ biệt thời đại đồng quê "toàn bộ dùng thử miễn phí".
Sức mạnh tính toán đỉnh cao nhất và trí tuệ sâu sắc nhất, sẽ được ưu tiên như một loại vật tư chiến lược sản xuất, vận chuyển định hướng đến chiến trường ứng dụng cơ sở hạ tầng, nghiên cứu khoa học và B2B có thể tạo ra giá trị thương mại nhất.
Đây là cuồng hoan của vụ nổ sản xuất, cũng là mùa đông của thị trường lao động.
Bài viết này đến từ tài khoản công chúng WeChat "Gelung", tác giả: Van Lien Son










