Vừa mới, Claude Mythos 5 ra mắt, xử lý 50 triệu dòng code trong 1 ngày

marsbitXuất bản vào 2026-06-10Cập nhật gần nhất vào 2026-06-10

Tóm tắt

Anthropic đã chính thức công bố Claude Fable 5 và Claude Mythos 5, hai phiên bản mạnh mẽ nhất từ trước đến nay của họ. Fable 5 là phiên bản có "lưới bảo vệ", tự động chuyển sang Claude Opus 4.8 khi phát hiện câu hỏi rủi ro (như viết phần mềm độc hại), và được mở cho tất cả người dùng. Mythos 5 là phiên bản đầy đủ năng lực, tập trung vào an ninh mạng và nghiên cứu sinh học, nhưng chỉ dành cho một số ít người dùng được tin cậy. Về hiệu suất, Fable 5 thể hiện sự vượt trội trong nhiều lĩnh vực: * **Kỹ thuật phần mềm:** Đạt điểm cao trong các bài kiểm tra SWE-bench Pro và Frontier Code. Đáng chú ý, nó hoàn thành việc di chuyển kho code Ruby 50 triệu dòng chỉ trong 1 ngày. * **Thị giác máy tính:** Có thể tự chơi và hoàn thành game "Pokémon" chỉ dựa trên ảnh chụp màn hình mà không cần công cụ hỗ trợ. * **Bộ nhớ dài hạn & Ngữ cảnh dài:** Khả năng duy trì tập trung và sử dụng ghi chú trong các nhiệm vụ kéo dài được cải thiện, nâng cao hiệu quả hoạt động tự chủ (Agent). * **Tài chính & Phân tích:** Là mô hình đầu tiên đạt trên 90% trong một bài benchmark phân tích phức tạp, cho thấy khả năng suy luận ở cấp độ chuyên gia. * **Nghiên cứu khoa học:** Mythos 5 có thể tự động hóa toàn bộ quy trình nghiên cứu sinh học. 9 trong số 14 hợp chất do nó thiết kế đã được đưa vào quy trình phát triển thuốc thực tế. Một điểm đáng chú ý là cơ chế an toàn mới: thay vì từ chối trả lời, Fable 5 sẽ chuyển hướng câu hỏi nhạy cảm sang Opus 4.8. Tuy nhiên, cơ chế này đôi khi có thể "bắt nhầm" các...

Sau hai tháng giấu giếm của Anthropic, “huyền thoại” Mythos cuối cùng cũng đã xuất hiện——

Mô hình lớn mạnh nhất từ trước đến nay của hãng, được chia thành hai phiên bản đưa lên bàn: Claude Fable 5 và Claude Mythos 5.

Fable 5 là phiên bản Mythos đã được thêm "tấm lưới bảo vệ"**, mở cửa cho tất cả người dùng.

Một khi câu hỏi của người dùng kích hoạt bộ phân loại rủi ro (ví dụ như cố gắng bắt nó viết phần mềm độc hại), hệ thống sẽ tự động hạ cấp và gọi Claude Opus 4.8 thế hệ trước để trả lời.

Mythos 5 là phiên bản "Mythos" đầy đủ sức mạnh nguyên bản, nhưng chỉ dành cho một số ít người dùng đáng tin cậy.

Nó đã gỡ bỏ các hạn chế an toàn trong các lĩnh vực như an ninh mạng, trang web chính thức tuyên bố rằng nó "sở hữu khả năng tấn công-phòng thủ mạng và nghiên cứu sinh học thuần túy hàng đầu toàn cầu".

Chính thức cho biết, thời gian chạy tự chủ của Fable 5 và Mythos 5 dài hơn bất kỳ mô hình Claude nào trước đây.

Thở dài một chút?AI tiên phong, bắt đầu bước vào thời đại của quyền hạn.

Và chỉ hai ngày sau khi Anthropic long trọng kêu gọi tất cả nghiên cứu AI phải dừng lại ngay lập tức......

Không hiểu Dario sao cũng bắt đầu đi theo con đường cũ của Altman, mỗi lần đều tiếp thị tạo đà trước cho mô hình mới, sản phẩm mới của riêng mình, và còn là loại có quy mô rất lớn.

(Tôi biết A. có lý do của riêng mình, nhưng tôi vẫn mỉm cười).

Tuy nhiên vẫn có tin vui ở khía cạnh phi kỹ thuật cho các nhà phát triển, giá API của hai chiếc flagship mới này đã cắt giảm hơn một nửa so với phiên bản xem trước trước đây:

Chỉ 10 USD cho mỗi triệu Token đầu vào, 50 USD cho mỗi triệu Token đầu ra.

Được rồi, chúng ta nhanh chóng bước vào phần liên quan đến công nghệ, tiến lên——

Phiên bản kép Mythos đã đến! Chính thức đánh dấu trọng tâm "Hiệu suất Token"

Nói tình hình trước.

Nhật ký phát hành chính thức và đánh giá trong ngành không liệt kê một loạt bảng xếp hạng Benchmark tiêu chuẩn, công khai (như MMLU, GSM8K, SWE-bench, v.v.) cho Mythos 5 như giới thiệu Fable 5.

Tuy nhiên, xét rằng cả hai là cùng một mô hình nền tảng, về cơ bản chúng có thể được coi là "bản sao gương" của cùng một lõi, các chỉ số kỹ thuật cơ bản hoàn toàn giống nhau.

Vì vậy, trước tiên chúng ta chỉ có thể xem biểu hiện của Fable 5 được công bố chủ yếu qua các kênh chính thức hiện tại.

Theo chính Anthropic, Claude Fable 5 là Claude công khai mạnh nhất hiện nay, và cũng là lần đầu tiên dòng Fable bước vào cấp độ năng lực Mythos.

Ưu thế của nó tập trung chủ yếu vào một số hướng: kỹ thuật phần mềm, công việc tri thức phức tạp, thị giác, ngữ cảnh dài, khả năng ghi nhớ, và nghiên cứu khoa học sự sống.

Quan trọng hơn, nhiệm vụ càng dài, càng phức tạp, ưu thế của Fable5 so với Claude cũ càng rõ ràng——cho thấy trọng tâm của Fable5 không phải là trả lời câu hỏi đơn lẻ đẹp hơn, mà là có thể đảm nhận các nhiệm vụ chu kỳ dài.

Chúng ta hãy sử dụng dữ liệu và Demo cứng để phân tích sức mạnh thống trị của mô hình thần thoại thế hệ này:

Kỹ thuật phần mềm: Đánh bại chuẩn mực khó, từ "Sửa Bug" đến "Đội quân tự động hoàn toàn"

Trong đánh giá SWE-bench Pro đo lường khả năng của mô hình giải quyết các vấn đề kỹ thuật phần mềm phức tạp, thực tế, Claude Fable 5 đã đạt điểm cao 80,3%.

Để so sánh, mô hình chủ lực hàng đầu của đối thủ GPT-5.5 đạt 58,6%.

Trong Frontier Code của Cognition - đánh giá này coi trọng hơn việc mô hình có thể hoàn thành nhiệm vụ lập trình khó khăn, đồng thời đáp ứng tiêu chuẩn thư viện mã sản xuất chất lượng cao - Fable 5 đã đạt điểm cao nhất trong các mô hình tiên phong ngay cả ở cường độ suy luận trung bình.

Chỉ số chuẩn FrontierCode này cực kỳ khó bão hòa.

Tuy nhiên, ngay cả ở chế độ "nỗ lực trung bình (Medium effort)", điểm số của Fable 5 cũng đứng đầu tất cả các mô hình tiên phong.

Trường hợp điển hình đầu tiên chính thức đưa ra là từ Stripe.

Trong một kho mã Ruby 50 triệu dòng, Fable 5 đã hoàn thành một lần di chuyển toàn bộ kho. Công việc này nếu để một đội kỹ thuật làm thủ công, ban đầu sẽ mất hơn hai tháng.

Còn Fable 5? Chỉ mất một ngày.

Ngoài ra, trên chỉ số chuẩn phát triển front-end đầu cuối ViBench (Vibe-coding benchmark), Fable 5 gần như đánh thẳng các trường hợp sử dụng phát triển cơ bản đến mức bão hòa, đạt được việc tạo ứng dụng "một phát một trúng (One-shot)" thực sự.

Thị giác nguyên bản: Không cần giàn giáo, chơi mù thông quan Pokémon

Tạp chí công nghệ nổi tiếng VentureBeat trong bài viết Anthropic brings Mythos to the masses with Claude Fable 5, its most powerful generally available model ever tiết lộ, trong bài kiểm tra chuẩn GDPpdf tập trung vào suy luận tệp hình ảnh, Fable 5 và Mythos 5 đạt điểm 29,8% trong điều kiện không sử dụng công cụ bên ngoài.

Để so sánh, Opus 4.8 đạt 22,5%, GPT-5.5 đạt 24,9%, Gemini 3.1 Pro đạt 16,7%.

Anthropic chính thức cũng đoán mọi người nhìn một đống dữ liệu rất nhàm chán, nên đã tung ra Demo chơi game của Fable 5, mang lại hiệu ứng trực quan hơn.

Các mô hình Claude trước đây nếu muốn chơi game RPG Pokémon FireRed Version, bắt buộc phải cấu hình bên ngoài một bộ "giàn giáo" cực kỳ phức tạp (bao gồm hỗ trợ điều hướng bản đồ, đọc trạng thái trò chơi bộ nhớ, v.v.).

Bây giờ, Fable 5 đã đạt được "chơi mù thị giác nguyên bản" thuần túy.

Chỉ dựa vào các ảnh chụp màn hình game thô ban đầu, trong điều kiện không có bất kỳ bản đồ hỗ trợ ngoại lai nào, nó hoàn toàn tự chủ suy diễn, lập kế hoạch chiến lược, và cứng nhắc thông quan toàn bộ trò chơi.

Hơn nữa, do sự tập trung cao độ trong chuỗi siêu dài của nó, khi được cấu hình bộ nhớ cấp tệp bền vững, hiệu suất của nó khi chơi game thẻ bài roguelike Slay the Spire đã tăng vọt 3 lần, xác suất đến được thiên thể cuối cùng cũng tăng vọt 3 lần.

Ngữ cảnh dài và nâng cấp trọng tâm khả năng ghi nhớ, thuận tiện nhấn mạnh "Hiệu suất Token"

Ngữ cảnh dài và khả năng ghi nhớ cũng là trọng tâm của lần nâng cấp này.

Anthropic tuyên bố, Fable 5 có thể duy trì sự tập trung trong các nhiệm vụ dài hạn hàng triệu Token, và còn có thể sử dụng ghi chú của chính nó để cải thiện đầu ra.

Chính thức đã thử nghiệm với Slay the Spire, sau khi cung cấp cho mô hình quyền truy cập bộ nhớ tệp bền vững, mức độ cải thiện hiệu suất của Fable5 gấp ba lần Opus4.8, tần suất đến chương cuối cùng cũng tăng gấp ba lần.

Đây thực sự là một mắt xích rất cơ bản trong khả năng Agent.

Một AI có thể làm việc trong thời gian dài, phải có khả năng nhớ những gì mình đã làm, đã bỏ lỡ, tại sao bước tiếp theo lại làm như vậy. Không có bộ nhớ ổn định, nhiệm vụ tự chủ rất dễ trở thành một hiện trường mất trí nhớ lớn.

Vì vậy, Anthropic còn đặc biệt nhấn mạnh hiệu suất Token (đây cũng là một hướng đi then chốt của mô hình thế hệ này).

Mô hình càng có khả năng làm việc tự chủ lâu dài, càng tiêu thụ nhiều Token.

Nếu mô hình vừa mạnh, vừa rất "tốn lời", chi phí sẽ nhanh chóng cao đến mức khiến doanh nghiệp đau lòng.

Fable 5 nhấn mạnh hiệu suất Token, về bản chất là giải quyết vấn đề sổ sách trong việc triển khai hóa Agent.

Tài chính, pháp lý và vận hành: Lỗ đen logic lần đầu tiên vượt qua ngưỡng 90%

Trong bài kiểm tra chuẩn tài chính Hebbia (Finance Benchmark for senior-level reasoning) kiểm tra khả năng suy luận phân tích nâng cao, Fable 5 đạt điểm cao nhất ngành.

Trong suy luận tài liệu dài, giải thích biểu đồ và bảng phức tạp, cũng như phân tích nguyên nhân gốc rễ nhiều bước, Fable 5 đã đạt được mức tăng trưởng nhảy vọt hai chữ số.

Trong thử nghiệm thực tế của các công ty giao dịch định lượng lớn IMC và Optiver, Fable 5 gần như lấy đầy đủ tất cả trọng số đánh giá phân tích giao dịch của họ (bao gồm truy xuất sự kiện, suy luận khái niệm và tính toán giá trị kỳ vọng), và thể hiện sự ổn định đáng kinh ngạc——trong nhiều lần chạy lặp lại, điểm số kết quả đầu ra hoàn toàn nhất quán.

Nền tảng phân tích dữ liệu Hex đưa ra đánh giá như sau:

Fable 5 là mô hình đầu tiên trong ngành vượt qua ngưỡng điểm 90% trong chỉ số chuẩn phân tích cốt lõi của chúng tôi (bao phủ các nhiệm vụ phân tích cực kỳ phức tạp, chu kỳ dài), tăng 10 điểm phần trăm so với Opus. Trong những câu hỏi hóc búa nhất, nó thể hiện khả năng đánh giá vi mô ở cấp độ chuyên gia con người.

Nghiên cứu tiên phong: Mythos đầy đủ sức mạnh "chiến thắng nhỏ hơn lớn" với mô hình nhỏ hơn 100 lần

Trong nghiên cứu vật lý tiên phong, công ty khởi nghiệp VibeCAD và cơ quan nghiên cứu vật lý thử nghiệm cho thấy, Fable 5 chỉ sử dụng 1/3 Token suy luận, thành quả nghiên cứu vật lý sản xuất trong 36 giờ, đã tiệm cận thành tích mà GPT-5.5 mất bốn ngày mới chạy ra.

Và Mythos vẫn còn hơi giấu giếm cuối cùng cũng xuất hiện trong mảng này.

Anthropic cho biết, trong lĩnh vực y sinh, Mythos 5 đầy đủ sức mạnh trong điều kiện hoàn toàn không có sự hỗ trợ của con người, đã có thể tự chủ thực thi toàn bộ quy trình làm việc của một nhà sinh vật học: chọn vị trí liên kết protein, tự chủ lập lịch và chạy các công cụ tin sinh học khác nhau, thậm chí tự Debug khi gặp lỗi chạy.

Trong 14 phức hợp nhắm mục tiêu protein do nó thiết kế, có 9 cái đã đi vào đường ống nghiên cứu phát triển thuốc thực tế trong phòng thí nghiệm.

Anthropic còn nhấn mạnh, Mythos 5 "là mô hình đầu tiên của chúng tôi có khả năng liên tục tạo ra các giả thuyết khoa học mới mẻ và hấp dẫn".

Trong so sánh trực tiếp mù với các mô hình dòng Opus, các nhà khoa học trong 80% trường hợp thích giả thuyết sinh học phân tử của Mythos hơn, và đã đưa một số giả thuyết trong đó vào giai đoạn xác minh thử nghiệm.

Đồng thời, một giả thuyết của Mythos - một cơ chế mới về protein E. coli - đã được xác nhận trong nghiên cứu A newly identified detoxification system protects uropathogenic Escherichia coli from reactive chlorine species của một phòng thí nghiệm độc lập khác nghiên cứu cùng một vấn đề.

Càng kinh ngạc hơn trong nghiên cứu hệ gen, Mythos 5 tự chủ làm việc hơn một tuần, ghép nối dữ liệu đơn bào của 138 loài, và tự chủ thiết kế huấn luyện một mô hình học máy siêu nhỏ tùy chỉnh.

Mô hình siêu nhỏ này được AI huấn luyện, thể tích nhỏ hơn 100 lần, về mặt biểu hiện trực tiếp đánh bại thành quả nghiên cứu khoa học mới nhất vừa được công bố trên tạp chí Science không lâu trước đó.

Sau khi kêu gọi ngừng nghiên cứu AI, "khả năng nguy hiểm" dường như đã được làm thành cơ chế sản phẩm

Chỗ thú vị nhất lần này, có lẽ là tấm lưới bảo vệ mà Anthropic khoác lên Fable 5.

Chính xác mà nói, Fable 5đằng sau có treo một nhóm bộ phân loại độc lập.

Những bộ phân loại này sẽ phát hiện yêu cầu của người dùng có liên quan đến tấn công an ninh mạng, rủi ro sinh học và hóa học, cũng như chưng cất mô hình hay không.

Một khi được kích hoạt, Fable 5 sẽ từ chối tự trả lời, chuyển hướng yêu cầu tự động giao cho Claude Opus 4.8, và thông báo cho người dùng đã bị hạ cấp.

Hơi thú vị nhỉ.

Các mô hình lớn trước đây trong phần an toàn này, thường là để mô hình từ chối, nói những câu như "xin lỗi, tôi không thể giúp bạn" "xin lỗi tôi không thể trả lời" "xin lỗi tôi không hiểu ý bạn" blah blah.

Fable 5 đổi cách làm khác.

Nó không làm từ chối đơn thuần nữa, mà làm định tuyến mô hình.

Câu hỏi thông thường do Fable 5 xử lý, một khi nhận diện có câu hỏi là câu hỏi rủi ro cao, mô hình lập tức bị chuyển sang Opus4.8.

Ý của Anthropic là, Opus4.8 bản thân cũng là mô hình mạnh, trải nghiệm trả lời hạ cấp tổng thể tốt hơn là từ chối trực tiếp phải không?~

Thiết kế bộ này thực tế tách khả năng và an toàn ra.

Bạn sử dụng hàng ngày là khả năng cấp độ Mythos.

Nhưng khi đối mặt với một số vấn đề nhạy cảm, tấn công, cố gắng thoát khỏi nhà tù, v.v., Anthropic chuyển đổi mượt mà sang mô hình phiên bản cũ phục vụ bạn, khiến công cụ thuận tiện trong tay bạn, đột nhiên không còn thuận tiện như vậy nữa.

(Chủ yếu phòng ngừa một số vấn đề về an ninh mạng, lĩnh vực sinh hóa và chưng cất mô hình)

Anthropic đưa ra dữ liệu——

Tin tốt, hơn 95% phiên Fable 5 sẽ không kích hoạt hạ cấp.

Có nghĩa là, đối với phần lớn nhiệm vụ viết lách, mã, phân tích, nghiên cứu và văn phòng, trải nghiệm người dùng có thể nhận được về cơ bản gần với Mythos 5.

Nhưng còn chưa đến 5% yêu cầu còn lại, sẽ đi vào con đường an toàn nghiêm ngặt hơn.

Trang web chính thức cho biết, lĩnh vực rủi ro cao chủ yếu có ba loại.

Loại thứ nhất là an ninh mạng, loại thứ hai là sinh học và hóa học, loại thứ ba là chưng cất mô hình.

Cơ chế bộ này đằng sau, thực tế là một thay đổi trong hình thái sản phẩm mô hình tiên phong.

An toàn không còn chỉ là một câu tuyên bố miễn trừ trách nhiệm trước khi mô hình trả lời, cũng không chỉ là mô tả chính sách viết trong thẻ hệ thống.

Nó đã trở thành kiến trúc sản phẩm được tạo thành bởi bộ phân loại, định tuyến mô hình, phân cấp quyền hạn, lưu giữ dữ liệu, kiểm tra đội đỏ cùng nhau.

Dĩ nhiên, cái giá cũng đến.

Bộ phân loại của Fable 5 được điều chỉnh khá bảo thủ, yêu cầu bình thường cũng có thể bị tổn thương nhầm.

Ví dụ như nhà sinh vật học nghiên cứu virus, kỹ sư an toàn làm diễn tập tấn công-phòng thủ được ủy quyền, đều có thể kích hoạt hạ cấp trong nhiệm vụ hợp lý.

Anthropic tự mình cũng thừa nhận, lan can hiện tại nghiêm ngặt hơn trạng thái lý tưởng, sau này sẽ giảm tỷ lệ tổn thương nhầm.

Cái giá khác là lưu giữ dữ liệu.

Từ Fable 5, Mythos 5 và các mô hình cùng cấp tiếp theo, Anthropic yêu cầu tất cả lưu lượng của mô hình cấp độ Mythos được lưu giữ 30 ngày, bao phủ cảnh sử dụng bên thứ nhất và bên thứ ba.

Chính thức nhấn mạnh những dữ liệu này sẽ không được sử dụng để huấn luyện, chỉ dùng để giám sát an toàn, bao gồm nhận diện tấn công phức tạp, thoát khỏi nhà tù kiểu mới và tấn công xuyên yêu cầu.

Đối với người dùng thông thường, đây có thể chỉ là một dòng chữ trong điều khoản.

Nhưng đối với khách hàng doanh nghiệp, đây là vấn đề quản trị dữ liệu rất thực tế.

Muốn sử dụng khả năng mạnh nhất, phải chấp nhận mức độ kiểm tra an toàn và lưu giữ dữ liệu cao hơn.

Không thể tránh khỏi, chi phí của mô hình tiên phong, cũng không chỉ thể hiện trên hóa đơn API.

Về giá cả, Fable5 và Mythos5 được định giá thống nhất là 10 USD cho mỗi triệu Token đầu vào, 50 USD cho mỗi triệu Token đầu ra.

Thật vậy, sovới Claude Mythos Preview rẻ hơn nhiều, nhưng vẫn là mô hình giá cao.

Nói một câu, Fable5 thật sự mạnh, nhưng sẽ không rẻ đến mức có thể đốt tùy tiện.

Điều này cũng giải thích tại sao Anthropic đồng thời nhấn mạnh khả năng, an toàn và hiệu suất Token.

Trải nghiệm học giả AI nội bộ thử nghiệm: AI càng mạnh, con người càng giống bên A

Học giả AI nổi tiếng, giáo sư trường Kinh doanh Wharton Ethan Mollick sau khi lấy được quyền thử nghiệm đầu tiên, đã viết một bài dài.

Logic hành văn của nó tấn công trực diện vào bản chất cốt lõi của cuộc cách mạng công nghệ này——

Mô hình hợp tác giữa con người và mô hình lớn, đã xảy ra một sự đảo ngược cơ bản, không thể đảo ngược.

Ông ấy để Fable 5 làm một bản đồ vòng tròn đẳng thời (isochrone map).

Nhiệm vụ này nghe không quá huyền bí, nhưng thực sự làm rất phiền phức.

Nó phải tra chuyến bay, tra lịch trình đường sắt, đánh giá tốc độ đường bộ, còn phải xử lý mối quan hệ giữa các quốc gia khác nhau, phương thức giao thông khác nhau, chi phí thời gian khác nhau.

Fable 5 tự mình khởi động nhiều đại lý đi tra tài liệu, lấy được hơn 2200 thông tin chuyến bay cụ thể, còn bắt lấy dữ liệu đường sắt TGV, Shinkansen, v.v., cũng như thông tin tốc độ đường bộ các nước.

Cuối cùng, nó tích hợp những tài liệu này vào một dự án bản đồ có thể sử dụng.

Điểm chính của việc này là Fable 5 đã tách một mục tiêu mơ hồ thành nhiều khâu như nghiên cứu, thu thập thông tin, thiết kế, mã hóa, xác minh, và tự mình tiến lên phía trước.

Điều này khác rất nhiều so với trải nghiệm mô hình lớn trước đây.

Do đó, Mollick đưa ra một nhận thức sâu sắc.

Trước đây, con người sử dụng mô hình lớn giống như một "phù thủy (Wizard)", bạn phải chỉ dẫn nó từng tí một, điều khiển nó (Steer), trau chuốt từng câu Prompt, thông qua đối thoại gợi ý từ không ngừng để "đọc thần chú", AI mới có thể miễn cưỡng biến ra một trò ảo thuật.

Còn đối với mô hình cấp độ Mythos, con người đang trở thành "người bảo trợ (Patron, ở đây tôi cảm thấy dịch thành "bên A" có phù hợp hơn không?)" hoặc "người ủy thác".

Giáo sư Mollick dùng Fable5 làm việc, cảm giác đã không giống đang thao tác một công cụ, mà giống đang ủy thác một studio nhỏ.

Ngoài ra, trong thử nghiệm thực tế của Mollick, ông không còn cần làm việc ở lớp chỉ thị vi mô nhất nữa.

Ông trực tiếp đưa vào Fable 5 một tài liệu thiết kế dự án cực kỳ phức tạp, dài 15 trang, sau đó để lại mô tả nhu cầu vĩ mô.

Trong 9 giờ tiếp theo, Fable 5 ở trạng thái chạy hoàn toàn tự chủ (Autonomous) trong nền.

Nó tự mình sinh ra một quy trình làm việc Agent, nội bộ lập lịch nhiều Agent nhỏ đi nghiên cứu, viết đề cương, đối chiếu lẫn nhau, lật đổ giả thuyết sai, sửa lỗi làm lại.

Con người thậm chí không cần can thiệp vào bước nào trong quy trình làm việc này.

9 giờ sau, một thành phẩm chất lượng cực cao trực tiếp giao đến trước mặt Mollick.

Đây chính là ẩn dụ "studio" được nói đến.

Trước đây, chúng ta dùng mô hình lớn là thuê một người làm tự do tạm thời, cần giao tiếp nhiều lần; bây giờ, bạn dùng Fable 5, tương đương với việc bạn dùng vài USD Token, ngay lập tức thuê cả một viện thiết kế cấp Hollywood, hoặc một viện nghiên cứu đỉnh cao.

Bạn không cần quan tâm nó đã đưa ra bao nhiêu quyết định vi mô trong hộp đen, bạn chỉ cần đóng vai "bên A" ký tên trên thành phẩm cuối cùng.

Sự kết hợp giữa ngữ cảnh văn bản dài (Context) và logic tự chủ của mô hình lớn này, khiến Context không còn chỉ là một "bộ chứa nội dung", mà hoàn toàn lắng đọng thành một "hệ điều hành thông minh kiểu mới" có thể tự chủ suy diễn, chạy dài hạn.

Nói cách khác, AI càng giống bên B, con người càng giống bên A cần có khả năng nghiệm thu.

Tiểu đoạn chèn, để trưng bày trực quan hơn, thú vị hơn, giáo sư còn để nó tạo ra một loạt game cho mọi người thử chơi.

Những game này đều dựa trên một gợi ý ban đầu của Claude Code, Fable 5 cần dựa trên gợi ý mơ hồ tôi cung cấp tạo ra một số chương trình khả thi, sau đó tôi sẽ đưa ra một số gợi ý bổ sung, và đưa ra một số khuyến khích (ví dụ "làm tốt hơn") hoặc phản hồi.

Do Claude Code không thể tạo hình ảnh, nên tất cả tác phẩm mỹ thuật hoặc đối tượng 3D đều được tạo hoàn toàn thông qua tính toán toán học, không sử dụng bất kỳ tài nguyên bên ngoài nào.

Đây là demo game tung đồng xu:

Sau khi thử nghiệm nội bộ Fable 5 trước, giáo sư cuối cùng cho biết "thành quả cuối cùng gây ấn tượng".

Tuy nhiên, đặc biệt là khi bắt tay xử lý các dự án nghiêm túc hơn, giáo sư thường cảm thấy sử dụng công cụ này vừa thú vị vừa bất an.

Chỗ thú vị là, tôi chỉ cần đưa ra yêu cầu, nó có thể thực hiện. Chỗ bất an cũng là, tôi chỉ cần đưa ra yêu cầu, nó có thể thực hiện.

Quả thật.

Quay lại lần phát hành này của Anthropic.

Có người cho rằng quan trọng nhất là Mythos cuối cùng cũng nửa lộ bài, có người cho rằng quan trọng nhất là sản phẩm AI tiên phong đang bước vào hình thái mới.

Một mô hình mạnh hơn lên bàn rồi.

Nhưng Anthropic trước tiên thắt dây an toàn cho nó, sau đó mới trao chìa khóa cho tất cả mọi người.

Có người reo mừng, có người lo lắng, có người thức trắng đêm gỡ lỗi mã, chỉ để đuổi theo đường cong thông minh không ngừng chạy về phía trước, thậm chí đã bắt đầu thoát khỏi tầm nhìn vi mô của con người.

Three More Things

1、Chú ý thời gian cửa sổ. Từ hôm nay đến ngày 22 tháng 6, người dùng Pro, Max, Team và phiên bản doanh nghiệp có thể dùng Fable 5 miễn phí.

Nhưng từ ngày 23 tháng 6, còn muốn dùng Fable 5, phải mua thêm usage credits.

2、Anthropic nói, một khi năng lực sản xuất theo kịp, Fable 5 sẽ làm lại thành tiêu chuẩn đăng ký.

Khách hàng doanh nghiệp API và trả theo lượng không bị ảnh hưởng bởi nhịp độ này, từ hôm nay gọi bình thường.

Tài liệu tham khảo:

[1]https://www.anthropic.com/news/claude-fable-5-mythos-5

[2]https://www.oneusefulthing.org/p/what-it-feels-like-to-work-with-mythos

[3]https://www.biorxiv.org/content/10.64898/2026.03.12.711259v1

Bài viết từ tài khoản công chúng WeChat "QbitAI", tác giả: Heng Yu

Tiền kỹ thuật số thịnh hành

CitreaCTR

wrapped stUSDTWSTUSDT

Velodrome FinanceVELODROME

BrevisBREV

PancakeSwapCAKE

JUSTJST

Câu hỏi Liên quan

QClaude Fable 5 và Claude Mythos 5 khác nhau ở điểm chính nào?

AClaude Fable 5 là phiên bản có 'lưới bảo vệ' an toàn, dành cho tất cả người dùng. Khi phát hiện câu hỏi rủi ro (ví dụ: yêu cầu viết mã độc), hệ thống sẽ tự động chuyển sang sử dụng Claude Opus 4.8 để trả lời. Claude Mythos 5 là phiên bản đầy đủ năng lực nguyên bản, không bị giới hạn an toàn trong các lĩnh vực như an ninh mạng và nghiên cứu sinh học, nhưng chỉ dành cho một số ít người dùng đáng tin cậy.

QClaude Fable 5 thể hiện ấn tượng ra sao trong lĩnh vực kỹ thuật phần mềm theo bài viết?

ATrong lĩnh vực kỹ thuật phần mềm, Claude Fable 5 đạt điểm số rất cao. Cụ thể, trên bài kiểm tra SWE-bench Pro, nó đạt 80.3%, vượt xa GPT-5.5 (58.6%). Một ví dụ điển hình là nó đã hoàn thành việc di chuyển toàn bộ kho mã Ruby 50 triệu dòng cho Stripe chỉ trong 1 ngày, một công việc mà một đội kỹ sư thủ công phải mất hơn 2 tháng.

QCơ chế an toàn mới của Claude Fable 5 hoạt động như thế nào?

AFable 5 sử dụng một bộ phân loại độc lập để giám sát các yêu cầu của người dùng. Khi phát hiện yêu cầu liên quan đến các lĩnh vực rủi ro cao như tấn công mạng, rủi ro sinh-hóa hoặc tinh chế mô hình, nó sẽ không tự trả lời mà chuyển hướng yêu cầu đó đến mô hình Claude Opus 4.8 (phiên bản cũ hơn, an toàn hơn) và thông báo cho người dùng về việc bị giáng cấp. Hơn 95% phiên làm việc không kích hoạt cơ chế này.

QGiáo sư Ethan Mollick so sánh cách làm việc với mô hình mạnh như Fable 5 khác với trước đây ra sao?

AGiáo sư Ethan Mollick nhận thấy sự thay đổi căn bản trong mô hình hợp tác. Trước đây, con người giống như một 'pháp sư' (Wizard), phải tỉ mỉ chỉ đạo từng bước (steer) cho AI thông qua prompt. Với Fable 5/Mythos 5, con người trở thành 'nhà tài trợ' hoặc 'bên giao việc' (Patron/Client - có thể hiểu là 'bên A'). Ông chỉ cần đưa ra yêu cầu vĩ mô, và Fable 5 có thể tự động phân chia công việc, chạy nhiều agent con, và hoàn toàn tự chủ hoàn thành nhiệm vụ phức tạp trong nhiều giờ, giống như thuê cả một 'studio' hay 'công ty' chuyên nghiệp.

QTheo bài viết, Claude Mythos 5 đã đạt được thành tựu gì đáng chú ý trong nghiên cứu khoa học?

ATrong nghiên cứu sinh học, Claude Mythos 5 có thể tự động thực hiện toàn bộ quy trình công việc của một nhà sinh vật học: chọn vị trí liên kết protein, tự lập lịch và chạy các công cụ tin sinh học, thậm chí tự gỡ lỗi (debug) khi thất bại. Trong số 14 phức hợp protein đích do nó thiết kế, 9 cái đã được đưa vào quy trình nghiên cứu thuốc thực tế trong phòng thí nghiệm. Đặc biệt, trong nghiên cứu hệ gen, nó tự huấn luyện một mô hình máy học siêu nhỏ, nhỏ hơn 100 lần nhưng hiệu suất lại vượt qua nghiên cứu mới nhất được công bố trên tạp chí Science.

Nội dung Liên quan

Đối thoại với Ray Dalio: Chúng ta đang ở trong bong bóng AI, 1% danh mục đầu tư của tôi là Bitcoin

Ray Dalio, người sáng lập Bridgewater Associates, trong một cuộc phỏng vấn đã chỉ ra rằng thế giới hiện tại đang trong một "AI bubble" (bong bóng AI) cổ điển, với giá tài sản tăng vọt và đầu cơ quá mức. Ông cảnh báo bong bóng có thể vỡ do lãi suất tăng, nguồn cung cổ phiếu dư thừa hoặc khi nhà đầu tư cần tiền mặt trả nợ, dẫn đến suy thoái kinh tế. Đồng thời, Dalio mô tả một "chu kỳ lớn" kéo dài khoảng 80 năm, bao gồm ba động lực chồng chéo: khoảng cách giàu nghèo và xung đột nội bộ, thâm hụt ngân sách chính phủ khổng lồ và thay đổi địa chính trị. Ông nhấn mạnh rằng Mỹ và Anh đang đối mặt với những thách thức trong giai đoạn suy yếu này. Để bảo vệ của cải, Dalio khuyến nghị đa dạng hóa danh mục đầu tư với cổ phiếu, vàng, trái phiếu, bất động sản thay vì chỉ giữ tiền mặt. Ông tiết lộ khoảng 1% danh mục của mình là Bitcoin, nhưng vẫn ưa chuộng vàng vật chất hơn do tính ổn định và vai trò tiền tệ dự trữ. Về tác động của AI, Dalio cho rằng nó không chỉ thay thế lao động chân tay mà còn cả tư duy, làm trầm trọng thêm bất bình đẳng thu nhập. Con người cần phát huy trí tuệ cảm xúc và trực giác - những thứ AI chưa có - và học cách hợp tác với AI. Cuối cùng, ông phân tích những rủi ro của thuế tài sản và xu hướng thế giới có thể trở nên "khu vực hóa" hơn, với các khối như châu Mỹ và châu Á - Thái Bình Dương, trong bối cảnh sự thống trị toàn cầu của Mỹ đang suy yếu.

marsbit52 phút trước

Đối thoại với Ray Dalio: Chúng ta đang ở trong bong bóng AI, 1% danh mục đầu tư của tôi là Bitcoin

marsbit52 phút trước

Hơn 7.2 nghìn tỷ won trong một ngày, ngoại hải nước ngoài mua ròng kỷ lục vào thứ Sáu! Phố Wall: Cơn gió ngược về mặt vốn của thị trường chứng khoán Hàn Quốc đã tan biến

Dòng vốn nước ngoài đổ mạnh vào thị trường chứng khoán Hàn Quốc (KOSPI) với mức mua ròng kỷ lục 7,2 nghìn tỷ won chỉ trong ngày 31/7, đánh dấu sự đảo chiều rõ rệt sau nhiều tháng bán ròng mạnh. Theo báo cáo từ Citigroup, áp lực bán từ dòng vốn nước ngoài đã giảm đáng kể, với mức bán ròng tháng 7 thu hẹp còn 9,8 nghìn tỷ won so với mức 48,4 và 44,5 nghìn tỷ won trong tháng 6 và tháng 5. Đồng thời, các quỹ hưu trí và quỹ đầu tư trong nước cũng chuyển sang vị thế mua ròng 1,0 nghìn tỷ won trong tháng 7. Một yếu tố hỗ trợ khác là quy định mới từ Ủy ban Dịch vụ Tài chính Hàn Quốc (FSC), có hiệu lực từ 31/7, siết chặt điều kiện đầu tư vào các ETF có đòn bẩy đối với nhà đầu tư cá nhân. Quy định này đã ngay lập tức làm giảm khoảng 50% khối lượng giao dịch của các ETF này, góp phần kỳ vọng giảm bớt biến động cho thị trường. Citigroup duy trì mục tiêu chỉ số KOSPI ở mức 10.000 điểm, dựa trên các yếu tố thuận lợi như ngành chip bán dẫn ổn định, định giá thị trường thấp, nền tảng kinh tế vững mạnh và các chính sách hỗ trợ. Họ nhận định áp lực dòng vốn ngược chiều đang giảm dần, tạo điều kiện cho các yếu tố cơ bản và chính sách tích cực phát huy tác dụng.

marsbit52 phút trước

Hơn 7.2 nghìn tỷ won trong một ngày, ngoại hải nước ngoài mua ròng kỷ lục vào thứ Sáu! Phố Wall: Cơn gió ngược về mặt vốn của thị trường chứng khoán Hàn Quốc đã tan biến

marsbit52 phút trước

Tin khẩn cấp! OpenAI thế hệ tiếp theo phá giải 10 bài toán cấp Fields Medal

OpenAI vừa công bố mô hình AI thế hệ tiếp theo tên Astra, tuyên bố đã đột phá 10 vấn đề toán học ở đẳng cấp giải Fields. Trong số này, nổi bật là việc tạo ra nhóm "không sofic" đầu tiên, phủ định giả thuyết tồn tại từ năm 1999; đột phá giới hạn 46 năm trong bài toán xếp cầu ở không gian nhiều chiều; và tìm ra phản ví dụ cho giả thuyết "tính cứng" của nhà toán học Alain Connes. Các kết quả được công bố trong một bài báo dài 249 trang, đã được xác minh bằng công cụ Lean 4. Chi phí để tạo ra các chứng minh này được cho là chưa đến 2.000 USD. Cộng đồng toán học quốc tế đã phản ứng mạnh mẽ, nhiều chuyên gia nhận định đây là thành tựu AI hỗ trợ toán học quan trọng nhất từ trước đến nay, đánh dấu một bước ngoặt trong hành trình phát triển AGI.

marsbit2 giờ trước

Tin khẩn cấp! OpenAI thế hệ tiếp theo phá giải 10 bài toán cấp Fields Medal

marsbit2 giờ trước

Làm thế nào để khiến bản thân trở nên không thể bị thay thế bởi trí tuệ nhân tạo

**Tóm tắt: Làm thế nào để trở nên không thể bị thay thế bởi AI** Bài viết phản đối việc than vãn về AI và thay vào đó đề xuất một giải pháp căn cơ: trở thành một "siêu cá nhân" không thể bị thuê mướn. Mối đe dọa thực sự không phải là AI, mà là tình trạng "nô lệ lương thưởng" – phụ thuộc hoàn toàn vào người khác để sinh tồn, làm công việc nhàm chán mà không có mục đích. Để thoát khỏi vòng luẩn quẩn này và phát triển mạnh trong kỷ nguyên AI, bạn cần trau dồi 5 yếu tố then chốt: 1. **Tính tự chủ:** Khả năng hành động mà không cần chờ chỉ thị. 2. **Khiếu thẩm mỹ:** Khả năng nhận biết điều gì thực sự có giá trị. 3. **Khả năng thuyết phục:** Thu hút sự chú ý và sự công nhận. 4. **Sự kiên trì:** Không sợ thất bại, xem đó là bài học. 5. **Khả năng lặp:** Điều chỉnh dựa trên phản hồi để tiến tới mục tiêu. Giải pháp là đầu tư vào sự nghiệp của chính mình. Trong khi AI giỏi tạo ra "tài sản" (nội dung, code), nó không thể thay thế được khả năng phân biệt thứ gì đáng để tạo ra, làm cho mọi người quan tâm và kiên trì theo đuổi. Trong hai kỹ năng đòn bẩy mạnh mẽ là **Code (Lập trình)** và **Media (Nội dung)**, bài viết nhấn mạnh **Nội dung** quan trọng hơn. Giá trị của nội dung là chủ quan và đòi hỏi sự am hiểu, trải nghiệm mà AI khó có được, tạo không gian cho các cá nhân sáng tạo thực sự. **Cách bắt đầu (Bài tập 15 phút):** 1. **Khai thác nguyên liệu thô của bạn:** Xác định chủ đề bạn am hiểu sâu, vấn đề bạn tự giải quyết được, hay sở thích đặc biệt từ nhỏ. 2. **Xác định "trục phản biện" của bạn:** Tìm ra quan điểm độc đáo của bạn – những điều bạn tin là đúng nhưng số đông lại sai trong lĩnh vực của mình. 3. **Xuất bản ý tưởng đầu tiên:** Kết hợp câu trả lời từ bước 1 và 2, tạo ra một nội dung (bài đăng, video) và đăng nó lên. Hành động này mang lại phản hồi thực tế, bắt đầu quá trình học hỏi, lặp lại và phát triển kỹ năng thuyết phục. Bằng cách xây dựng một sự nghiệp xoay quanh con người thật, trải nghiệm thật và góc nhìn độc đáo của mình thông qua nội dung, bạn có thể tạo ra giá trị mà AI không thể sao chép, từ đó trở nên không thể thay thế.

marsbit3 giờ trước

Làm thế nào để khiến bản thân trở nên không thể bị thay thế bởi trí tuệ nhân tạo

marsbit3 giờ trước

Nhờ việc tung xúc xắc, chìa khóa Bitcoin được lưu trữ offline, nhưng không phải ai cũng muốn làm điều này

Cảm biến từ cuộc tranh cãi gần đây xung quanh lỗ hổng trong ví phần cứng Coldcard, bài viết thảo luận về phương pháp tạo seed (cụm từ khôi phục) cho ví Bitcoin bằng cách xúc xắc vật lý. Mỗi lần xúc xắc công bằng cung cấp khoảng 2,6 bit entropy (thước đo tính ngẫu nhiên). Để đạt mức entropy an toàn cho một seed 12 từ (128 bit), cần khoảng 50 lần xúc xắc; Coldcard khuyến nghị 99 lần để đạt mức bảo mật cao hơn. Lợi thế chính của phương pháp này là tách biệt hoàn toàn với bất kỳ lỗi phần cứng hoặc phần mềm nào trong trình tạo số ngẫu nhiên của thiết bị, từ đó bảo vệ seed chính của ví. Tuy nhiên, bài viết cảnh báo rằng trong sự cố Coldcard, các chức năng phụ khác của thiết bị (như tạo ví giấy, khóa đa chữ ký, mật mã phiên USB) vẫn có thể bị ảnh hưởng nếu chúng dựa vào trình tạo số lỗi, ngay cả khi seed chính được tạo an toàn bằng xúc xắc. Nhược điểm lớn của việc dùng xúc xắc là quá trình thủ công, dễ xảy ra sai sót, tốn thời gian và không thực tế cho đa số người dùng mới. Người dùng có thể ghi chép sai, sử dụng xúc xắc gian lận, hoặc để lộ chuỗi kết quả. Do đó, mặc dù có nền tảng toán học vững chắc, phương pháp này đòi hỏi sự tỉ mỉ cao và không phải là giải pháp khả thi cho việc áp dụng Bitcoin rộng rãi. Bài viết kết luận rằng mục tiêu dài hạn vẫn là phát triển phần cứng/phần mềm tạo số ngẫu nhiên mạnh mẽ và đáng tin cậy, trong khi vẫn giữ phương pháp thủ công như một tùy chọn cho người dùng có kinh nghiệm. Cuối cùng, bài viết đưa ra khuyến nghị cho chủ sở hữu Coldcard: cập nhật firmware, kiểm tra các chức năng phụ đã sử dụng và xem xét các biện pháp bảo mật bổ sung như ví đa chữ ký kết hợp nhiều nhà sản xuất để giảm thiểu rủi ro từ một điểm yếu đơn lẻ.

cryptonews.ru6 giờ trước

Nhờ việc tung xúc xắc, chìa khóa Bitcoin được lưu trữ offline, nhưng không phải ai cũng muốn làm điều này

cryptonews.ru6 giờ trước

Giao dịch

Giao ngay

Bài viết Nổi bật

Làm thế nào để Mua ONE

Chào mừng bạn đến với HTX.com! Chúng tôi đã làm cho mua Harmony (ONE) trở nên đơn giản và thuận tiện. Làm theo hướng dẫn từng bước của chúng tôi để bắt đầu hành trình tiền kỹ thuật số của bạn.Bước 1: Tạo Tài khoản HTX của BạnSử dụng email hoặc số điện thoại của bạn để đăng ký tài khoản miễn phí trên HTX. Trải nghiệm hành trình đăng ký không rắc rối và mở khóa tất cả tính năng. Nhận Tài khoản của tôiBước 2: Truy cập Mua Crypto và Chọn Phương thức Thanh toán của BạnThẻ Tín dụng/Ghi nợ: Sử dụng Visa hoặc Mastercard của bạn để mua Harmony (ONE) ngay lập tức.Số dư: Sử dụng tiền từ số dư tài khoản HTX của bạn để giao dịch liền mạch.Bên thứ ba: Chúng tôi đã thêm những phương thức thanh toán phổ biến như Google Pay và Apple Pay để nâng cao sự tiện lợi.P2P: Giao dịch trực tiếp với người dùng khác trên HTX.Thị trường mua bán phi tập trung (OTC): Chúng tôi cung cấp những dịch vụ được thiết kế riêng và tỷ giá hối đoái cạnh tranh cho nhà giao dịch.Bước 3: Lưu trữ Harmony (ONE) của BạnSau khi mua Harmony (ONE), lưu trữ trong tài khoản HTX của bạn. Ngoài ra, bạn có thể gửi đi nơi khác qua chuyển khoản blockchain hoặc sử dụng để giao dịch những tiền kỹ thuật số khác.Bước 4: Giao dịch Harmony (ONE)Giao dịch Harmony (ONE) dễ dàng trên thị trường giao ngay của HTX. Chỉ cần truy cập vào tài khoản của bạn, chọn cặp giao dịch, thực hiện giao dịch và theo dõi trong thời gian thực. Chúng tôi cung cấp trải nghiệm thân thiện với người dùng cho cả người mới bắt đầu và người giao dịch dày dạn kinh nghiệm.

Tổng lượt xem 655Xuất bản vào 2024.12.12Cập nhật vào 2026.06.02

Thảo luận

Chào mừng đến với Cộng đồng HTX. Tại đây, bạn có thể được thông báo về những phát triển nền tảng mới nhất và có quyền truy cập vào thông tin chuyên sâu về thị trường. Ý kiến của người dùng về giá của ONE (ONE) được trình bày dưới đây.

Vừa mới, Claude Mythos 5 ra mắt, xử lý 50 triệu dòng code trong 1 ngày

Tóm tắt

Phiên bản kép Mythos đã đến! Chính thức đánh dấu trọng tâm "Hiệu suất Token"

Kỹ thuật phần mềm: Đánh bại chuẩn mực khó, từ "Sửa Bug" đến "Đội quân tự động hoàn toàn"

Thị giác nguyên bản: Không cần giàn giáo, chơi mù thông quan Pokémon

Ngữ cảnh dài và nâng cấp trọng tâm khả năng ghi nhớ, thuận tiện nhấn mạnh "Hiệu suất Token"

Tài chính, pháp lý và vận hành: Lỗ đen logic lần đầu tiên vượt qua ngưỡng 90%

Nghiên cứu tiên phong: Mythos đầy đủ sức mạnh "chiến thắng nhỏ hơn lớn" với mô hình nhỏ hơn 100 lần

Sau khi kêu gọi ngừng nghiên cứu AI, "khả năng nguy hiểm" dường như đã được làm thành cơ chế sản phẩm

Trải nghiệm học giả AI nội bộ thử nghiệm: AI càng mạnh, con người càng giống bên A

Three More Things

Tiền kỹ thuật số thịnh hành

Câu hỏi Liên quan

Nội dung Liên quan

Đối thoại với Ray Dalio: Chúng ta đang ở trong bong bóng AI, 1% danh mục đầu tư của tôi là Bitcoin

Hơn 7.2 nghìn tỷ won trong một ngày, ngoại hải nước ngoài mua ròng kỷ lục vào thứ Sáu! Phố Wall: Cơn gió ngược về mặt vốn của thị trường chứng khoán Hàn Quốc đã tan biến

Tin khẩn cấp! OpenAI thế hệ tiếp theo phá giải 10 bài toán cấp Fields Medal

Làm thế nào để khiến bản thân trở nên không thể bị thay thế bởi trí tuệ nhân tạo

Nhờ việc tung xúc xắc, chìa khóa Bitcoin được lưu trữ offline, nhưng không phải ai cũng muốn làm điều này

Giao dịch

Bài viết Nổi bật

Làm thế nào để Mua ONE

Thảo luận

Danh mục Phổ biến

Thẻ Nổi bật