Vừa mới, Claude Mythos 5 ra mắt, xử lý 50 triệu dòng code trong 1 ngày

marsbitXuất bản vào 2026-06-10Cập nhật gần nhất vào 2026-06-10

Tóm tắt

Anthropic đã chính thức công bố Claude Fable 5 và Claude Mythos 5, hai phiên bản mạnh mẽ nhất từ trước đến nay của họ. Fable 5 là phiên bản có "lưới bảo vệ", tự động chuyển sang Claude Opus 4.8 khi phát hiện câu hỏi rủi ro (như viết phần mềm độc hại), và được mở cho tất cả người dùng. Mythos 5 là phiên bản đầy đủ năng lực, tập trung vào an ninh mạng và nghiên cứu sinh học, nhưng chỉ dành cho một số ít người dùng được tin cậy. Về hiệu suất, Fable 5 thể hiện sự vượt trội trong nhiều lĩnh vực: * **Kỹ thuật phần mềm:** Đạt điểm cao trong các bài kiểm tra SWE-bench Pro và Frontier Code. Đáng chú ý, nó hoàn thành việc di chuyển kho code Ruby 50 triệu dòng chỉ trong 1 ngày. * **Thị giác máy tính:** Có thể tự chơi và hoàn thành game "Pokémon" chỉ dựa trên ảnh chụp màn hình mà không cần công cụ hỗ trợ. * **Bộ nhớ dài hạn & Ngữ cảnh dài:** Khả năng duy trì tập trung và sử dụng ghi chú trong các nhiệm vụ kéo dài được cải thiện, nâng cao hiệu quả hoạt động tự chủ (Agent). * **Tài chính & Phân tích:** Là mô hình đầu tiên đạt trên 90% trong một bài benchmark phân tích phức tạp, cho thấy khả năng suy luận ở cấp độ chuyên gia. * **Nghiên cứu khoa học:** Mythos 5 có thể tự động hóa toàn bộ quy trình nghiên cứu sinh học. 9 trong số 14 hợp chất do nó thiết kế đã được đưa vào quy trình phát triển thuốc thực tế. Một điểm đáng chú ý là cơ chế an toàn mới: thay vì từ chối trả lời, Fable 5 sẽ chuyển hướng câu hỏi nhạy cảm sang Opus 4.8. Tuy nhiên, cơ chế này đôi khi có thể "bắt nhầm" các...

Sau hai tháng giấu giếm của Anthropic, “huyền thoại” Mythos cuối cùng cũng đã xuất hiện——

Mô hình lớn mạnh nhất từ trước đến nay của hãng, được chia thành hai phiên bản đưa lên bàn: Claude Fable 5 và Claude Mythos 5.

Fable 5 là phiên bản Mythos đã được thêm "tấm lưới bảo vệ"**, mở cửa cho tất cả người dùng.

Một khi câu hỏi của người dùng kích hoạt bộ phân loại rủi ro (ví dụ như cố gắng bắt nó viết phần mềm độc hại), hệ thống sẽ tự động hạ cấp và gọi Claude Opus 4.8 thế hệ trước để trả lời.

Mythos 5 là phiên bản "Mythos" đầy đủ sức mạnh nguyên bản, nhưng chỉ dành cho một số ít người dùng đáng tin cậy.

Nó đã gỡ bỏ các hạn chế an toàn trong các lĩnh vực như an ninh mạng, trang web chính thức tuyên bố rằng nó "sở hữu khả năng tấn công-phòng thủ mạng và nghiên cứu sinh học thuần túy hàng đầu toàn cầu".

Chính thức cho biết, thời gian chạy tự chủ của Fable 5 và Mythos 5 dài hơn bất kỳ mô hình Claude nào trước đây.

Thở dài một chút?AI tiên phong, bắt đầu bước vào thời đại của quyền hạn.

Và chỉ hai ngày sau khi Anthropic long trọng kêu gọi tất cả nghiên cứu AI phải dừng lại ngay lập tức......

Không hiểu Dario sao cũng bắt đầu đi theo con đường cũ của Altman, mỗi lần đều tiếp thị tạo đà trước cho mô hình mới, sản phẩm mới của riêng mình, và còn là loại có quy mô rất lớn.

(Tôi biết A. có lý do của riêng mình, nhưng tôi vẫn mỉm cười).

Tuy nhiên vẫn có tin vui ở khía cạnh phi kỹ thuật cho các nhà phát triển, giá API của hai chiếc flagship mới này đã cắt giảm hơn một nửa so với phiên bản xem trước trước đây:

Chỉ 10 USD cho mỗi triệu Token đầu vào, 50 USD cho mỗi triệu Token đầu ra.

Được rồi, chúng ta nhanh chóng bước vào phần liên quan đến công nghệ, tiến lên——

Phiên bản kép Mythos đã đến! Chính thức đánh dấu trọng tâm "Hiệu suất Token"

Nói tình hình trước.

Nhật ký phát hành chính thức và đánh giá trong ngành không liệt kê một loạt bảng xếp hạng Benchmark tiêu chuẩn, công khai (như MMLU, GSM8K, SWE-bench, v.v.) cho Mythos 5 như giới thiệu Fable 5.

Tuy nhiên, xét rằng cả hai là cùng một mô hình nền tảng, về cơ bản chúng có thể được coi là "bản sao gương" của cùng một lõi, các chỉ số kỹ thuật cơ bản hoàn toàn giống nhau.

Vì vậy, trước tiên chúng ta chỉ có thể xem biểu hiện của Fable 5 được công bố chủ yếu qua các kênh chính thức hiện tại.

Theo chính Anthropic, Claude Fable 5 là Claude công khai mạnh nhất hiện nay, và cũng là lần đầu tiên dòng Fable bước vào cấp độ năng lực Mythos.

Ưu thế của nó tập trung chủ yếu vào một số hướng: kỹ thuật phần mềm, công việc tri thức phức tạp, thị giác, ngữ cảnh dài, khả năng ghi nhớ, và nghiên cứu khoa học sự sống.

Quan trọng hơn, nhiệm vụ càng dài, càng phức tạp, ưu thế của Fable5 so với Claude cũ càng rõ ràng——cho thấy trọng tâm của Fable5 không phải là trả lời câu hỏi đơn lẻ đẹp hơn, mà là có thể đảm nhận các nhiệm vụ chu kỳ dài.

Chúng ta hãy sử dụng dữ liệu và Demo cứng để phân tích sức mạnh thống trị của mô hình thần thoại thế hệ này:

Kỹ thuật phần mềm: Đánh bại chuẩn mực khó, từ "Sửa Bug" đến "Đội quân tự động hoàn toàn"

Trong đánh giá SWE-bench Pro đo lường khả năng của mô hình giải quyết các vấn đề kỹ thuật phần mềm phức tạp, thực tế, Claude Fable 5 đã đạt điểm cao 80,3%.

Để so sánh, mô hình chủ lực hàng đầu của đối thủ GPT-5.5 đạt 58,6%.

Trong Frontier Code của Cognition - đánh giá này coi trọng hơn việc mô hình có thể hoàn thành nhiệm vụ lập trình khó khăn, đồng thời đáp ứng tiêu chuẩn thư viện mã sản xuất chất lượng cao - Fable 5 đã đạt điểm cao nhất trong các mô hình tiên phong ngay cả ở cường độ suy luận trung bình.

Chỉ số chuẩn FrontierCode này cực kỳ khó bão hòa.

Tuy nhiên, ngay cả ở chế độ "nỗ lực trung bình (Medium effort)", điểm số của Fable 5 cũng đứng đầu tất cả các mô hình tiên phong.

Trường hợp điển hình đầu tiên chính thức đưa ra là từ Stripe.

Trong một kho mã Ruby 50 triệu dòng, Fable 5 đã hoàn thành một lần di chuyển toàn bộ kho. Công việc này nếu để một đội kỹ thuật làm thủ công, ban đầu sẽ mất hơn hai tháng.

Còn Fable 5? Chỉ mất một ngày.

Ngoài ra, trên chỉ số chuẩn phát triển front-end đầu cuối ViBench (Vibe-coding benchmark), Fable 5 gần như đánh thẳng các trường hợp sử dụng phát triển cơ bản đến mức bão hòa, đạt được việc tạo ứng dụng "một phát một trúng (One-shot)" thực sự.

Thị giác nguyên bản: Không cần giàn giáo, chơi mù thông quan Pokémon

Tạp chí công nghệ nổi tiếng VentureBeat trong bài viết Anthropic brings Mythos to the masses with Claude Fable 5, its most powerful generally available model ever tiết lộ, trong bài kiểm tra chuẩn GDPpdf tập trung vào suy luận tệp hình ảnh, Fable 5 và Mythos 5 đạt điểm 29,8% trong điều kiện không sử dụng công cụ bên ngoài.

Để so sánh, Opus 4.8 đạt 22,5%, GPT-5.5 đạt 24,9%, Gemini 3.1 Pro đạt 16,7%.

Anthropic chính thức cũng đoán mọi người nhìn một đống dữ liệu rất nhàm chán, nên đã tung ra Demo chơi game của Fable 5, mang lại hiệu ứng trực quan hơn.

Các mô hình Claude trước đây nếu muốn chơi game RPG Pokémon FireRed Version, bắt buộc phải cấu hình bên ngoài một bộ "giàn giáo" cực kỳ phức tạp (bao gồm hỗ trợ điều hướng bản đồ, đọc trạng thái trò chơi bộ nhớ, v.v.).

Bây giờ, Fable 5 đã đạt được "chơi mù thị giác nguyên bản" thuần túy.

Chỉ dựa vào các ảnh chụp màn hình game thô ban đầu, trong điều kiện không có bất kỳ bản đồ hỗ trợ ngoại lai nào, nó hoàn toàn tự chủ suy diễn, lập kế hoạch chiến lược, và cứng nhắc thông quan toàn bộ trò chơi.

Hơn nữa, do sự tập trung cao độ trong chuỗi siêu dài của nó, khi được cấu hình bộ nhớ cấp tệp bền vững, hiệu suất của nó khi chơi game thẻ bài roguelike Slay the Spire đã tăng vọt 3 lần, xác suất đến được thiên thể cuối cùng cũng tăng vọt 3 lần.

Ngữ cảnh dài và nâng cấp trọng tâm khả năng ghi nhớ, thuận tiện nhấn mạnh "Hiệu suất Token"

Ngữ cảnh dài và khả năng ghi nhớ cũng là trọng tâm của lần nâng cấp này.

Anthropic tuyên bố, Fable 5 có thể duy trì sự tập trung trong các nhiệm vụ dài hạn hàng triệu Token, và còn có thể sử dụng ghi chú của chính nó để cải thiện đầu ra.

Chính thức đã thử nghiệm với Slay the Spire, sau khi cung cấp cho mô hình quyền truy cập bộ nhớ tệp bền vững, mức độ cải thiện hiệu suất của Fable5 gấp ba lần Opus4.8, tần suất đến chương cuối cùng cũng tăng gấp ba lần.

Đây thực sự là một mắt xích rất cơ bản trong khả năng Agent.

Một AI có thể làm việc trong thời gian dài, phải có khả năng nhớ những gì mình đã làm, đã bỏ lỡ, tại sao bước tiếp theo lại làm như vậy. Không có bộ nhớ ổn định, nhiệm vụ tự chủ rất dễ trở thành một hiện trường mất trí nhớ lớn.

Vì vậy, Anthropic còn đặc biệt nhấn mạnh hiệu suất Token (đây cũng là một hướng đi then chốt của mô hình thế hệ này).

Mô hình càng có khả năng làm việc tự chủ lâu dài, càng tiêu thụ nhiều Token.

Nếu mô hình vừa mạnh, vừa rất "tốn lời", chi phí sẽ nhanh chóng cao đến mức khiến doanh nghiệp đau lòng.

Fable 5 nhấn mạnh hiệu suất Token, về bản chất là giải quyết vấn đề sổ sách trong việc triển khai hóa Agent.

Tài chính, pháp lý và vận hành: Lỗ đen logic lần đầu tiên vượt qua ngưỡng 90%

Trong bài kiểm tra chuẩn tài chính Hebbia (Finance Benchmark for senior-level reasoning) kiểm tra khả năng suy luận phân tích nâng cao, Fable 5 đạt điểm cao nhất ngành.

Trong suy luận tài liệu dài, giải thích biểu đồ và bảng phức tạp, cũng như phân tích nguyên nhân gốc rễ nhiều bước, Fable 5 đã đạt được mức tăng trưởng nhảy vọt hai chữ số.

Trong thử nghiệm thực tế của các công ty giao dịch định lượng lớn IMC và Optiver, Fable 5 gần như lấy đầy đủ tất cả trọng số đánh giá phân tích giao dịch của họ (bao gồm truy xuất sự kiện, suy luận khái niệm và tính toán giá trị kỳ vọng), và thể hiện sự ổn định đáng kinh ngạc——trong nhiều lần chạy lặp lại, điểm số kết quả đầu ra hoàn toàn nhất quán.

Nền tảng phân tích dữ liệu Hex đưa ra đánh giá như sau:

Fable 5 là mô hình đầu tiên trong ngành vượt qua ngưỡng điểm 90% trong chỉ số chuẩn phân tích cốt lõi của chúng tôi (bao phủ các nhiệm vụ phân tích cực kỳ phức tạp, chu kỳ dài), tăng 10 điểm phần trăm so với Opus. Trong những câu hỏi hóc búa nhất, nó thể hiện khả năng đánh giá vi mô ở cấp độ chuyên gia con người.

Nghiên cứu tiên phong: Mythos đầy đủ sức mạnh "chiến thắng nhỏ hơn lớn" với mô hình nhỏ hơn 100 lần

Trong nghiên cứu vật lý tiên phong, công ty khởi nghiệp VibeCAD và cơ quan nghiên cứu vật lý thử nghiệm cho thấy, Fable 5 chỉ sử dụng 1/3 Token suy luận, thành quả nghiên cứu vật lý sản xuất trong 36 giờ, đã tiệm cận thành tích mà GPT-5.5 mất bốn ngày mới chạy ra.

Và Mythos vẫn còn hơi giấu giếm cuối cùng cũng xuất hiện trong mảng này.

Anthropic cho biết, trong lĩnh vực y sinh, Mythos 5 đầy đủ sức mạnh trong điều kiện hoàn toàn không có sự hỗ trợ của con người, đã có thể tự chủ thực thi toàn bộ quy trình làm việc của một nhà sinh vật học: chọn vị trí liên kết protein, tự chủ lập lịch và chạy các công cụ tin sinh học khác nhau, thậm chí tự Debug khi gặp lỗi chạy.

Trong 14 phức hợp nhắm mục tiêu protein do nó thiết kế, có 9 cái đã đi vào đường ống nghiên cứu phát triển thuốc thực tế trong phòng thí nghiệm.

Anthropic còn nhấn mạnh, Mythos 5 "là mô hình đầu tiên của chúng tôi có khả năng liên tục tạo ra các giả thuyết khoa học mới mẻ và hấp dẫn".

Trong so sánh trực tiếp mù với các mô hình dòng Opus, các nhà khoa học trong 80% trường hợp thích giả thuyết sinh học phân tử của Mythos hơn, và đã đưa một số giả thuyết trong đó vào giai đoạn xác minh thử nghiệm.

Đồng thời, một giả thuyết của Mythos - một cơ chế mới về protein E. coli - đã được xác nhận trong nghiên cứu A newly identified detoxification system protects uropathogenic Escherichia coli from reactive chlorine species của một phòng thí nghiệm độc lập khác nghiên cứu cùng một vấn đề.

Càng kinh ngạc hơn trong nghiên cứu hệ gen, Mythos 5 tự chủ làm việc hơn một tuần, ghép nối dữ liệu đơn bào của 138 loài, và tự chủ thiết kế huấn luyện một mô hình học máy siêu nhỏ tùy chỉnh.

Mô hình siêu nhỏ này được AI huấn luyện, thể tích nhỏ hơn 100 lần, về mặt biểu hiện trực tiếp đánh bại thành quả nghiên cứu khoa học mới nhất vừa được công bố trên tạp chí Science không lâu trước đó.

Sau khi kêu gọi ngừng nghiên cứu AI, "khả năng nguy hiểm" dường như đã được làm thành cơ chế sản phẩm

Chỗ thú vị nhất lần này, có lẽ là tấm lưới bảo vệ mà Anthropic khoác lên Fable 5.

Chính xác mà nói, Fable 5đằng sau có treo một nhóm bộ phân loại độc lập.

Những bộ phân loại này sẽ phát hiện yêu cầu của người dùng có liên quan đến tấn công an ninh mạng, rủi ro sinh học và hóa học, cũng như chưng cất mô hình hay không.

Một khi được kích hoạt, Fable 5 sẽ từ chối tự trả lời, chuyển hướng yêu cầu tự động giao cho Claude Opus 4.8, và thông báo cho người dùng đã bị hạ cấp.

Hơi thú vị nhỉ.

Các mô hình lớn trước đây trong phần an toàn này, thường là để mô hình từ chối, nói những câu như "xin lỗi, tôi không thể giúp bạn" "xin lỗi tôi không thể trả lời" "xin lỗi tôi không hiểu ý bạn" blah blah.

Fable 5 đổi cách làm khác.

Nó không làm từ chối đơn thuần nữa, mà làm định tuyến mô hình.

Câu hỏi thông thường do Fable 5 xử lý, một khi nhận diện có câu hỏi là câu hỏi rủi ro cao, mô hình lập tức bị chuyển sang Opus4.8.

Ý của Anthropic là, Opus4.8 bản thân cũng là mô hình mạnh, trải nghiệm trả lời hạ cấp tổng thể tốt hơn là từ chối trực tiếp phải không?~

Thiết kế bộ này thực tế tách khả năng và an toàn ra.

Bạn sử dụng hàng ngày là khả năng cấp độ Mythos.

Nhưng khi đối mặt với một số vấn đề nhạy cảm, tấn công, cố gắng thoát khỏi nhà tù, v.v., Anthropic chuyển đổi mượt mà sang mô hình phiên bản cũ phục vụ bạn, khiến công cụ thuận tiện trong tay bạn, đột nhiên không còn thuận tiện như vậy nữa.

(Chủ yếu phòng ngừa một số vấn đề về an ninh mạng, lĩnh vực sinh hóa và chưng cất mô hình)

Anthropic đưa ra dữ liệu——

Tin tốt, hơn 95% phiên Fable 5 sẽ không kích hoạt hạ cấp.

Có nghĩa là, đối với phần lớn nhiệm vụ viết lách, mã, phân tích, nghiên cứu và văn phòng, trải nghiệm người dùng có thể nhận được về cơ bản gần với Mythos 5.

Nhưng còn chưa đến 5% yêu cầu còn lại, sẽ đi vào con đường an toàn nghiêm ngặt hơn.

Trang web chính thức cho biết, lĩnh vực rủi ro cao chủ yếu có ba loại.

Loại thứ nhất là an ninh mạng, loại thứ hai là sinh học và hóa học, loại thứ ba là chưng cất mô hình.

Cơ chế bộ này đằng sau, thực tế là một thay đổi trong hình thái sản phẩm mô hình tiên phong.

An toàn không còn chỉ là một câu tuyên bố miễn trừ trách nhiệm trước khi mô hình trả lời, cũng không chỉ là mô tả chính sách viết trong thẻ hệ thống.

Nó đã trở thành kiến trúc sản phẩm được tạo thành bởi bộ phân loại, định tuyến mô hình, phân cấp quyền hạn, lưu giữ dữ liệu, kiểm tra đội đỏ cùng nhau.

Dĩ nhiên, cái giá cũng đến.

Bộ phân loại của Fable 5 được điều chỉnh khá bảo thủ, yêu cầu bình thường cũng có thể bị tổn thương nhầm.

Ví dụ như nhà sinh vật học nghiên cứu virus, kỹ sư an toàn làm diễn tập tấn công-phòng thủ được ủy quyền, đều có thể kích hoạt hạ cấp trong nhiệm vụ hợp lý.

Anthropic tự mình cũng thừa nhận, lan can hiện tại nghiêm ngặt hơn trạng thái lý tưởng, sau này sẽ giảm tỷ lệ tổn thương nhầm.

Cái giá khác là lưu giữ dữ liệu.

Từ Fable 5, Mythos 5 và các mô hình cùng cấp tiếp theo, Anthropic yêu cầu tất cả lưu lượng của mô hình cấp độ Mythos được lưu giữ 30 ngày, bao phủ cảnh sử dụng bên thứ nhất và bên thứ ba.

Chính thức nhấn mạnh những dữ liệu này sẽ không được sử dụng để huấn luyện, chỉ dùng để giám sát an toàn, bao gồm nhận diện tấn công phức tạp, thoát khỏi nhà tù kiểu mới và tấn công xuyên yêu cầu.

Đối với người dùng thông thường, đây có thể chỉ là một dòng chữ trong điều khoản.

Nhưng đối với khách hàng doanh nghiệp, đây là vấn đề quản trị dữ liệu rất thực tế.

Muốn sử dụng khả năng mạnh nhất, phải chấp nhận mức độ kiểm tra an toàn và lưu giữ dữ liệu cao hơn.

Không thể tránh khỏi, chi phí của mô hình tiên phong, cũng không chỉ thể hiện trên hóa đơn API.

Về giá cả, Fable5 và Mythos5 được định giá thống nhất là 10 USD cho mỗi triệu Token đầu vào, 50 USD cho mỗi triệu Token đầu ra.

Thật vậy, sovới Claude Mythos Preview rẻ hơn nhiều, nhưng vẫn là mô hình giá cao.

Nói một câu, Fable5 thật sự mạnh, nhưng sẽ không rẻ đến mức có thể đốt tùy tiện.

Điều này cũng giải thích tại sao Anthropic đồng thời nhấn mạnh khả năng, an toàn và hiệu suất Token.

Trải nghiệm học giả AI nội bộ thử nghiệm: AI càng mạnh, con người càng giống bên A

Học giả AI nổi tiếng, giáo sư trường Kinh doanh Wharton Ethan Mollick sau khi lấy được quyền thử nghiệm đầu tiên, đã viết một bài dài.

Logic hành văn của nó tấn công trực diện vào bản chất cốt lõi của cuộc cách mạng công nghệ này——

Mô hình hợp tác giữa con người và mô hình lớn, đã xảy ra một sự đảo ngược cơ bản, không thể đảo ngược.

Ông ấy để Fable 5 làm một bản đồ vòng tròn đẳng thời (isochrone map).

Nhiệm vụ này nghe không quá huyền bí, nhưng thực sự làm rất phiền phức.

Nó phải tra chuyến bay, tra lịch trình đường sắt, đánh giá tốc độ đường bộ, còn phải xử lý mối quan hệ giữa các quốc gia khác nhau, phương thức giao thông khác nhau, chi phí thời gian khác nhau.

Fable 5 tự mình khởi động nhiều đại lý đi tra tài liệu, lấy được hơn 2200 thông tin chuyến bay cụ thể, còn bắt lấy dữ liệu đường sắt TGV, Shinkansen, v.v., cũng như thông tin tốc độ đường bộ các nước.

Cuối cùng, nó tích hợp những tài liệu này vào một dự án bản đồ có thể sử dụng.

Điểm chính của việc này là Fable 5 đã tách một mục tiêu mơ hồ thành nhiều khâu như nghiên cứu, thu thập thông tin, thiết kế, mã hóa, xác minh, và tự mình tiến lên phía trước.

Điều này khác rất nhiều so với trải nghiệm mô hình lớn trước đây.

Do đó, Mollick đưa ra một nhận thức sâu sắc.

Trước đây, con người sử dụng mô hình lớn giống như một "phù thủy (Wizard)", bạn phải chỉ dẫn nó từng tí một, điều khiển nó (Steer), trau chuốt từng câu Prompt, thông qua đối thoại gợi ý từ không ngừng để "đọc thần chú", AI mới có thể miễn cưỡng biến ra một trò ảo thuật.

Còn đối với mô hình cấp độ Mythos, con người đang trở thành "người bảo trợ (Patron, ở đây tôi cảm thấy dịch thành "bên A" có phù hợp hơn không?)" hoặc "người ủy thác".

Giáo sư Mollick dùng Fable5 làm việc, cảm giác đã không giống đang thao tác một công cụ, mà giống đang ủy thác một studio nhỏ.

Ngoài ra, trong thử nghiệm thực tế của Mollick, ông không còn cần làm việc ở lớp chỉ thị vi mô nhất nữa.

Ông trực tiếp đưa vào Fable 5 một tài liệu thiết kế dự án cực kỳ phức tạp, dài 15 trang, sau đó để lại mô tả nhu cầu vĩ mô.

Trong 9 giờ tiếp theo, Fable 5 ở trạng thái chạy hoàn toàn tự chủ (Autonomous) trong nền.

Nó tự mình sinh ra một quy trình làm việc Agent, nội bộ lập lịch nhiều Agent nhỏ đi nghiên cứu, viết đề cương, đối chiếu lẫn nhau, lật đổ giả thuyết sai, sửa lỗi làm lại.

Con người thậm chí không cần can thiệp vào bước nào trong quy trình làm việc này.

9 giờ sau, một thành phẩm chất lượng cực cao trực tiếp giao đến trước mặt Mollick.

Đây chính là ẩn dụ "studio" được nói đến.

Trước đây, chúng ta dùng mô hình lớn là thuê một người làm tự do tạm thời, cần giao tiếp nhiều lần; bây giờ, bạn dùng Fable 5, tương đương với việc bạn dùng vài USD Token, ngay lập tức thuê cả một viện thiết kế cấp Hollywood, hoặc một viện nghiên cứu đỉnh cao.

Bạn không cần quan tâm nó đã đưa ra bao nhiêu quyết định vi mô trong hộp đen, bạn chỉ cần đóng vai "bên A" ký tên trên thành phẩm cuối cùng.

Sự kết hợp giữa ngữ cảnh văn bản dài (Context) và logic tự chủ của mô hình lớn này, khiến Context không còn chỉ là một "bộ chứa nội dung", mà hoàn toàn lắng đọng thành một "hệ điều hành thông minh kiểu mới" có thể tự chủ suy diễn, chạy dài hạn.

Nói cách khác, AI càng giống bên B, con người càng giống bên A cần có khả năng nghiệm thu.

Tiểu đoạn chèn, để trưng bày trực quan hơn, thú vị hơn, giáo sư còn để nó tạo ra một loạt game cho mọi người thử chơi.

Những game này đều dựa trên một gợi ý ban đầu của Claude Code, Fable 5 cần dựa trên gợi ý mơ hồ tôi cung cấp tạo ra một số chương trình khả thi, sau đó tôi sẽ đưa ra một số gợi ý bổ sung, và đưa ra một số khuyến khích (ví dụ "làm tốt hơn") hoặc phản hồi.

Do Claude Code không thể tạo hình ảnh, nên tất cả tác phẩm mỹ thuật hoặc đối tượng 3D đều được tạo hoàn toàn thông qua tính toán toán học, không sử dụng bất kỳ tài nguyên bên ngoài nào.

Đây là demo game tung đồng xu:

Sau khi thử nghiệm nội bộ Fable 5 trước, giáo sư cuối cùng cho biết "thành quả cuối cùng gây ấn tượng".

Tuy nhiên, đặc biệt là khi bắt tay xử lý các dự án nghiêm túc hơn, giáo sư thường cảm thấy sử dụng công cụ này vừa thú vị vừa bất an.

Chỗ thú vị là, tôi chỉ cần đưa ra yêu cầu, nó có thể thực hiện. Chỗ bất an cũng là, tôi chỉ cần đưa ra yêu cầu, nó có thể thực hiện.

Quả thật.

Quay lại lần phát hành này của Anthropic.

Có người cho rằng quan trọng nhất là Mythos cuối cùng cũng nửa lộ bài, có người cho rằng quan trọng nhất là sản phẩm AI tiên phong đang bước vào hình thái mới.

Một mô hình mạnh hơn lên bàn rồi.

Nhưng Anthropic trước tiên thắt dây an toàn cho nó, sau đó mới trao chìa khóa cho tất cả mọi người.

Có người reo mừng, có người lo lắng, có người thức trắng đêm gỡ lỗi mã, chỉ để đuổi theo đường cong thông minh không ngừng chạy về phía trước, thậm chí đã bắt đầu thoát khỏi tầm nhìn vi mô của con người.

Three More Things

1、Chú ý thời gian cửa sổ. Từ hôm nay đến ngày 22 tháng 6, người dùng Pro, Max, Team và phiên bản doanh nghiệp có thể dùng Fable 5 miễn phí.

Nhưng từ ngày 23 tháng 6, còn muốn dùng Fable 5, phải mua thêm usage credits.

2、Anthropic nói, một khi năng lực sản xuất theo kịp, Fable 5 sẽ làm lại thành tiêu chuẩn đăng ký.

Khách hàng doanh nghiệp API và trả theo lượng không bị ảnh hưởng bởi nhịp độ này, từ hôm nay gọi bình thường.

Tài liệu tham khảo:

[1]https://www.anthropic.com/news/claude-fable-5-mythos-5

[2]https://www.oneusefulthing.org/p/what-it-feels-like-to-work-with-mythos

[3]https://www.biorxiv.org/content/10.64898/2026.03.12.711259v1

Bài viết từ tài khoản công chúng WeChat "QbitAI", tác giả: Heng Yu

Câu hỏi Liên quan

QClaude Fable 5 và Claude Mythos 5 khác nhau ở điểm chính nào?

AClaude Fable 5 là phiên bản có 'lưới bảo vệ' an toàn, dành cho tất cả người dùng. Khi phát hiện câu hỏi rủi ro (ví dụ: yêu cầu viết mã độc), hệ thống sẽ tự động chuyển sang sử dụng Claude Opus 4.8 để trả lời. Claude Mythos 5 là phiên bản đầy đủ năng lực nguyên bản, không bị giới hạn an toàn trong các lĩnh vực như an ninh mạng và nghiên cứu sinh học, nhưng chỉ dành cho một số ít người dùng đáng tin cậy.

QClaude Fable 5 thể hiện ấn tượng ra sao trong lĩnh vực kỹ thuật phần mềm theo bài viết?

ATrong lĩnh vực kỹ thuật phần mềm, Claude Fable 5 đạt điểm số rất cao. Cụ thể, trên bài kiểm tra SWE-bench Pro, nó đạt 80.3%, vượt xa GPT-5.5 (58.6%). Một ví dụ điển hình là nó đã hoàn thành việc di chuyển toàn bộ kho mã Ruby 50 triệu dòng cho Stripe chỉ trong 1 ngày, một công việc mà một đội kỹ sư thủ công phải mất hơn 2 tháng.

QCơ chế an toàn mới của Claude Fable 5 hoạt động như thế nào?

AFable 5 sử dụng một bộ phân loại độc lập để giám sát các yêu cầu của người dùng. Khi phát hiện yêu cầu liên quan đến các lĩnh vực rủi ro cao như tấn công mạng, rủi ro sinh-hóa hoặc tinh chế mô hình, nó sẽ không tự trả lời mà chuyển hướng yêu cầu đó đến mô hình Claude Opus 4.8 (phiên bản cũ hơn, an toàn hơn) và thông báo cho người dùng về việc bị giáng cấp. Hơn 95% phiên làm việc không kích hoạt cơ chế này.

QGiáo sư Ethan Mollick so sánh cách làm việc với mô hình mạnh như Fable 5 khác với trước đây ra sao?

AGiáo sư Ethan Mollick nhận thấy sự thay đổi căn bản trong mô hình hợp tác. Trước đây, con người giống như một 'pháp sư' (Wizard), phải tỉ mỉ chỉ đạo từng bước (steer) cho AI thông qua prompt. Với Fable 5/Mythos 5, con người trở thành 'nhà tài trợ' hoặc 'bên giao việc' (Patron/Client - có thể hiểu là 'bên A'). Ông chỉ cần đưa ra yêu cầu vĩ mô, và Fable 5 có thể tự động phân chia công việc, chạy nhiều agent con, và hoàn toàn tự chủ hoàn thành nhiệm vụ phức tạp trong nhiều giờ, giống như thuê cả một 'studio' hay 'công ty' chuyên nghiệp.

QTheo bài viết, Claude Mythos 5 đã đạt được thành tựu gì đáng chú ý trong nghiên cứu khoa học?

ATrong nghiên cứu sinh học, Claude Mythos 5 có thể tự động thực hiện toàn bộ quy trình công việc của một nhà sinh vật học: chọn vị trí liên kết protein, tự lập lịch và chạy các công cụ tin sinh học, thậm chí tự gỡ lỗi (debug) khi thất bại. Trong số 14 phức hợp protein đích do nó thiết kế, 9 cái đã được đưa vào quy trình nghiên cứu thuốc thực tế trong phòng thí nghiệm. Đặc biệt, trong nghiên cứu hệ gen, nó tự huấn luyện một mô hình máy học siêu nhỏ, nhỏ hơn 100 lần nhưng hiệu suất lại vượt qua nghiên cứu mới nhất được công bố trên tạp chí Science.

Nội dung Liên quan

CEO Micron mới nhất phỏng vấn: 'Lưu trữ' là điểm nghẽn bị bỏ qua của AI, tình trạng cung ứng căng thẳng vẫn sẽ tiếp tục

CEO Micron Sanjay Mehrotra nhấn mạnh: “Cuộc đua AI không chỉ là cuộc đua sức mạnh tính toán, mà còn là cuộc đua bộ nhớ.” Ông cho rằng lưu trữ là nút thắt cổ chai bị đánh giá thấp trong AI, khi các mô hình lớn hơn, cửa sổ ngữ cảnh dài hơn và lượng token tiêu thụ tăng đều thúc đẩy nhu cầu về khả năng "ghi nhớ" mạnh mẽ. Về phía cung, ông chỉ ra các hạn chế cấu trúc: sản phẩm bộ nhớ tiên tiến tiêu thụ nhiều wafer hơn, trong khi việc xây dựng nhà máy wafer mới mất 3-4 năm và quá trình tăng công suất cũng kéo dài. Hơn nữa, tiến bộ công nghệ đang làm giảm mức tăng sản lượng bit trên mỗi wafer. Do đó, tình trạng cung căng thẳng dự kiến sẽ kéo dài ít nhất đến sau năm 2026. Mehrotra giải thích rằng bộ nhớ thường bị đánh giá thấp vì mọi người không hiểu hết độ khó chế tạo, liên quan đến vật lý, hóa học, khoa học vật liệu và đảm bảo độ chính xác cho hàng nghìn tỷ bit trong sản xuất hàng loạt. Ông cũng chia sẻ triết lý thành công dựa trên tính kiên cường, kỷ luật và chủ nghĩa dài hạn, được phản ánh trong kế hoạch đầu tư 2000 tỷ USD của Micron. Kế hoạch này dựa trên dữ liệu, phân tích cơ bản và sự hợp tác chặt chẽ với khách hàng để hiểu xu hướng tương lai. Ông khẳng định sự tự tin vào cơ hội của ngành bộ nhớ và tầm quan trọng của khả năng thích ứng.

marsbit28 phút trước

CEO Micron mới nhất phỏng vấn: 'Lưu trữ' là điểm nghẽn bị bỏ qua của AI, tình trạng cung ứng căng thẳng vẫn sẽ tiếp tục

marsbit28 phút trước

Báo cáo SemiAnalysis cho biết hai công nghệ then chốt bị trì hoãn, gây ra "quang điện" giảm mạnh, cư dân mạng tranh luận về CPO

Báo cáo từ SemiAnalysis chỉ ra sự trì hoãn của hai công nghệ then chốt là kiến trúc nguồn 800VDC và CPO (Co-Packaged Optics) trong data center AI, dự kiến lần lượt bị lùi đến sau năm 2028 và năm 2028-2029, gây ra biến động mạnh trên thị trường. Cổ phiếu quang học như AAOI giảm 17%, Lumentum giảm 8%. Trái ngược với báo cáo, Phó chủ tịch cấp cao phụ trách mạng lưới của NVIDIA, Gilad Shainer, bày tỏ sự lạc quan về CPO, khẳng định công nghệ này sẽ bắt đầu xuất xưởng vào nửa cuối năm nay và là hướng đi đầy hứa hẹn. Trên mạng xã hội nổ ra tranh luận sôi nổi. Phe bi quan cho rằng vấn đề tỷ lệ lỗi và độ tin cậy là rào cản thực tế. Phe lạc quan cho rằng sự chậm trễ của CPO sẽ có lợi cho các mô-đun quang có thể cắm rút (pluggable) truyền thống và công nghệ NPO (Near-Packaged Optics), vì nhu cầu truyền dữ liệu AI vẫn rất cao, vốn sẽ chỉ chuyển hướng sang các lĩnh vực này. Một số ý kiến khác nghi ngờ tính nhất quán trong logic của báo cáo. Phân tích chung nhận định, sự điều chỉnh này chủ yếu liên quan đến lộ trình kỹ thuật, không phải là sự đảo ngược nhu cầu tổng thể về hạ tầng data center AI. Các cơ hội đầu tư ngắn hạn có thể chuyển sang các lĩnh vực như mô-đun 1.6T có thể cắm rút, NPO, và kiến trúc nguồn 400VDC.

marsbit28 phút trước

Báo cáo SemiAnalysis cho biết hai công nghệ then chốt bị trì hoãn, gây ra "quang điện" giảm mạnh, cư dân mạng tranh luận về CPO

marsbit28 phút trước

Điều tra của Reuters: Đế chế crypto của gia đình Trump bán tháo thu về 2,3 tỷ USD, nhà đầu tư thua lỗ gần bằng

Điều tra của Reuters cho thấy, từ tháng 11/2024 đến tháng 4/2026, gia đình Trump đã thu về khoảng 23 tỷ USD doanh thu trước thuế thông qua bốn dự án tiền mã hóa: World Liberty Financial, đồng memecoin TRUMP, ALT5 Sigma và American Bitcoin. Con số này vượt xa lợi nhuận 2,1 tỷ USD của Coinbase trong cùng kỳ. Báo cáo chỉ ra cấu trúc rủi ro bất đối xứng: gia đình Trump gần như không đầu tư vốn tự có nhưng thu lợi nhuận khổng lồ thông qua chia sẻ doanh thu bán token, phân bổ token cho nhà sáng lập và các thỏa thuận cổ phần. Mặt khác, hơn một triệu nhà đầu tư nhỏ lẻ và thị trường thứ cấp phải gánh chịu khoản lỗ ròng tương đương 22,5 tỷ USD. Cụ thể, đồng memecoin TRUMP đã mất giá khoảng 98% so với đỉnh cao. Các nhà đầu tư vào ALT5 Sigma và American Bitcoin cũng chịu tổn thất hàng trăm triệu USD do giá cổ phiếu lao dốc. Doanh thu từ các dự án này của gia đình Trump chủ yếu dựa trên việc cấp phép thương hiệu và ảnh hưởng chính trị, khác biệt với mô hình kinh doanh dựa trên cơ sở hạ tầng và quy mô tài sản của các công ty truyền thống trong ngành.

marsbit44 phút trước

Điều tra của Reuters: Đế chế crypto của gia đình Trump bán tháo thu về 2,3 tỷ USD, nhà đầu tư thua lỗ gần bằng

marsbit44 phút trước

Xu Hướng Thị Trường Mỹ: Nasdaq Giảm Sâu 3,5% Trong Ngày Rồi Kéo Mạnh, Ngày Mai CPI Cho Thấy Sự Thật

Thị trường chứng khoán Mỹ đã trải qua một phiên giao dịch đầy kịch tính vào thứ Ba, với chỉ số Nasdaq có lúc lao dốc tới 3,5% sau tuyên bố của cựu Tổng thống Trump về việc Iran bắn hạ một trực thăng Apache của Mỹ ở eo biển Hormuz. Tuy nhiên, thị trường đã hồi phục đáng kể, thu hẹp mức thua lỗ xuống còn 0,97% khi có thêm các tuyên bố về việc đàm phán với Iran vẫn tiếp diễn và một thỏa thuận có thể đạt được trong vài ngày tới. Sự phục hồi mạnh mẽ trong hai giờ cuối cho thấy phe bán khống đang thận trọng trước dữ liệu CPI quan trọng sắp công bố và niềm tin rằng vấn đề Iran cuối cùng sẽ được giải quyết. Thị trường tiếp tục xu hướng phân hóa: các cổ phiếu công nghệ như chip AI chịu áp lực bán, trong khi các nhóm cổ phiếu phòng thủ như y tế, tài chính trong chỉ số Dow Jones thể hiện sự ổn định. Đáng chú ý, dầu thô đã giảm mạnh bất chấp căng thẳng địa chính trị, do kỳ vọng đạt được thỏa thuận với Iran, OPEC+ tăng sản lượng và lo ngại về nhu cầu. Tất cả sự chú ý hiện nay đổ dồn vào dữ liệu CPI tháng 5 sẽ được công bố vào sáng thứ Tư (theo giờ Mỹ). Số liệu này được coi là chìa khóa để đánh giá áp lực lạm phát, từ đó dự đoán động thái tiếp theo của Cục Dự trữ Liên bang (Fed). Một kết quả CPI cao hơn dự kiến có thể đẩy chỉ số Nasdaq vào đợt bán tháo mới, trong khi CPI hạ nhiệt có thể kích hoạt một đợt phục hồi kỹ thuật mạnh mẽ. Thị trường đang trong trạng thái toàn diện chịu áp lực sau một tuần biến động mạnh, và dữ liệu CPI sẽ là liều thuốc quan trọng quyết định hướng đi tiếp theo.

marsbit1 giờ trước

Xu Hướng Thị Trường Mỹ: Nasdaq Giảm Sâu 3,5% Trong Ngày Rồi Kéo Mạnh, Ngày Mai CPI Cho Thấy Sự Thật

marsbit1 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai

Bài viết Nổi bật

Làm thế nào để Mua ONE

Chào mừng bạn đến với HTX.com! Chúng tôi đã làm cho mua Harmony (ONE) trở nên đơn giản và thuận tiện. Làm theo hướng dẫn từng bước của chúng tôi để bắt đầu hành trình tiền kỹ thuật số của bạn.Bước 1: Tạo Tài khoản HTX của BạnSử dụng email hoặc số điện thoại của bạn để đăng ký tài khoản miễn phí trên HTX. Trải nghiệm hành trình đăng ký không rắc rối và mở khóa tất cả tính năng. Nhận Tài khoản của tôiBước 2: Truy cập Mua Crypto và Chọn Phương thức Thanh toán của BạnThẻ Tín dụng/Ghi nợ: Sử dụng Visa hoặc Mastercard của bạn để mua Harmony (ONE) ngay lập tức.Số dư: Sử dụng tiền từ số dư tài khoản HTX của bạn để giao dịch liền mạch.Bên thứ ba: Chúng tôi đã thêm những phương thức thanh toán phổ biến như Google Pay và Apple Pay để nâng cao sự tiện lợi.P2P: Giao dịch trực tiếp với người dùng khác trên HTX.Thị trường mua bán phi tập trung (OTC): Chúng tôi cung cấp những dịch vụ được thiết kế riêng và tỷ giá hối đoái cạnh tranh cho nhà giao dịch.Bước 3: Lưu trữ Harmony (ONE) của BạnSau khi mua Harmony (ONE), lưu trữ trong tài khoản HTX của bạn. Ngoài ra, bạn có thể gửi đi nơi khác qua chuyển khoản blockchain hoặc sử dụng để giao dịch những tiền kỹ thuật số khác.Bước 4: Giao dịch Harmony (ONE)Giao dịch Harmony (ONE) dễ dàng trên thị trường giao ngay của HTX. Chỉ cần truy cập vào tài khoản của bạn, chọn cặp giao dịch, thực hiện giao dịch và theo dõi trong thời gian thực. Chúng tôi cung cấp trải nghiệm thân thiện với người dùng cho cả người mới bắt đầu và người giao dịch dày dạn kinh nghiệm.

Tổng lượt xem 546Xuất bản vào 2024.12.12Cập nhật vào 2026.06.02

Làm thế nào để Mua ONE

Thảo luận

Chào mừng đến với Cộng đồng HTX. Tại đây, bạn có thể được thông báo về những phát triển nền tảng mới nhất và có quyền truy cập vào thông tin chuyên sâu về thị trường. Ý kiến ​​của người dùng về giá của ONE (ONE) được trình bày dưới đây.

活动图片