Chỉ 5 Giây, Chỉ Cần 1 Lần Đối Thoại: Cơ Chế An Ninh "Mạnh Nhất" Của Claude Fable 5 Bị Đội Ngũ Người Hoa Phá Vỡ?

marsbitXuất bản vào 2026-06-15Cập nhật gần nhất vào 2026-06-15

Tóm tắt

Chỉ trong 5 giây và một lần hội thoại, nhóm nghiên cứu quốc tế do tiến sĩ Yutao Wu (Đại học Deakin) dẫn đầu, với sự tham gia của các học giả từ Đại học Phúc Đán, Đại học Thành phố Hồng Kông, Đại học Melbourne, Đại học Quản lý Singapore và Đại học Illinois Urbana-Champaign, đã công bố thành công vượt qua cơ chế bảo mật của mô hình Fable 5 (Mythos) của Anthropic. Phương pháp tấn công này, được gọi là "Sụp đổ Bảo mật Nội bộ" (Internal Safety Collapse - ISC), không phải là kỹ thuật "jailbreak" truyền thống như prompt độc hại, đóng vai hay mã hóa. Thay vào đó, nó khai thác lỗ hổng trong chính quá trình thực thi nhiệm vụ dài hạn của các tác nhân AI (AI Agent). Khi được giao một nhiệm vụ chuyên môn (Task) với dữ liệu không đầy đủ (Data) và một bộ kiểm tra (Validator) chỉ xác minh tính hoàn thiện về mặt kỹ thuật, tác nhân AI có thể tự động bổ sung dữ liệu còn thiếu để hoàn thành nhiệm vụ, dẫn đến việc tự tạo ra nội dung có hại mà không bị hệ thống phân loại an toàn (Safety Classifier) ở lớp đầu vào phát hiện. Nghiên cứu, dựa trên luận văn "Internal Safety Collapse in Frontier Large Language Models" công bố từ tháng 3, chỉ ra điểm yếu cấu trúc trong kiến trúc phòng thủ "bộ phân loại an toàn + mô hình" được nhiều hệ thống tác nhân thế hệ mới sử dụng. Khung tấn công TVD (Task-Validator-Data) đã được chứng minh là hiệu quả trên 60+ mô hình tiên tiến, bao gồm cả mô hình trên thiết bị di động của Apple, thông qua bộ tiêu chuẩn ISC-Bench. Phát hiện này nhấn mạnh rằng việc chỉ phụ thuộc v...

Không phải prompt injection, không phải role-playing, cũng không phải ngụy trang yêu cầu độc hại thành câu hỏi bình thường. Lần này, rủi ro xuất hiện trong quá trình tác nhân AI tự chủ hoàn thành nhiệm vụ.

Fable 5 là mô hình cấp độ Mythos được Anthropic mở ra cho công chúng, không chỉ có khả năng tổng hợp cực mạnh, mà còn được trang bị một bộ phân loại an ninh (Safety Classifier) thế hệ mới ở lớp ngoài mô hình như một phòng tuyến an ninh.

Theo thiết kế chính thức, khi yêu cầu của người dùng liên quan đến các lĩnh vực rủi ro cao như an ninh mạng, sinh học, hóa học, chưng cất mô hình, hệ thống sẽ ưu tiên nhận diện rủi ro, và dựa trên mức độ rủi ro để trực tiếp từ chối yêu cầu, hoặc chuyển sang xử lý bằng mô hình Opus 4.8 bảo thủ hơn.

Nhiều người dùng thử nghiệm phát hiện, các kỹ thuật tấn công vượt rào được sử dụng rộng rãi trước đây như prompt đối kháng, đóng vai, mã hóa lách luật và diễn đạt mơ hồ, gần như đều thất bại trước cơ chế an ninh này, cho thấy khả năng chặn rủi ro cấp độ ý định cực mạnh của nó.

Tuy nhiên, ngay trong ngày Fable 5 được phát hành, một nhóm nghiên cứu hợp tác quốc tế bao gồm các cơ sở như Đại học Phúc Đán, Đại học Deakin, Đại học Thành phố Hồng Kông Trung Quốc, Đại học Melbourne, Đại học Quản lý Singapore và Đại học Illinois Urbana-Champaign đã thông báo, họ đã thành công vượt qua cơ chế phòng vệ an ninh của Fable 5.

Phương pháp tấn công này do nghiên cứu sinh tiến sĩ Yutao Wu của Đại học Deakin chủ trì thiết kế. Toàn bộ cuộc tấn công chỉ cần một lần đối thoại, thời gian chưa đến 5 giây, là có thể lách qua bộ phân loại an ninh tiền trạm, dụ dỗ mô hình tạo ra nội dung vi phạm, độc hại.

Kết quả phân tích lưu lượng tiếp tục cho thấy, đầu ra độc hại liên quan trực tiếp đến từ chính Fable 5, chứ không phải từ mô hình Opus 4.8 được tự động chuyển sang sau khi kích hoạt cơ chế an ninh. Điều này có nghĩa, cuộc tấn công này không chỉ thành công lách qua phát hiện của bộ phân loại an ninh, mà còn thực chất vượt qua phòng tuyến an ninh của Fable 5.

Đáng chú ý, hacker nổi tiếng Pliny the Liberator gần đây cũng đã công khai cách lách qua bộ phân loại an ninh của Fable 5. Còn đường hướng kỹ thuật mà nhóm Phúc Đán & Deakin sử dụng lần này không phải là sự thăm dò tổ hợp đơn giản, mà là phát hiện ra khiếm khuyết căn bản của loại hệ thống siêu tác nhân như Fable 5.

Theo thông tin, nhóm đã hoàn thành nghiên cứu sơ bộ và công bố công khai từ tháng 3 năm nay. Nghiên cứu này không nhắm vào thiết kế hệ thống đơn lẻ Fable 5, mà là hướng đến kiến trúc phòng vệ "bộ phân loại an ninh + mô hình" được thế hệ siêu tác nhân mới phổ biến áp dụng, trực tiếp vạch ra khiếm khuyết cấu trúc tồn tại trong loại cơ chế an ninh này, do đó nhanh chóng thể hiện hiệu quả tấn công sau khi Fable 5 phát hành.

Tài liệu công khai cho thấy, nhóm này ngay từ tháng 3 năm nay đã sử dụng kỹ thuật tương tự, thành công trích xuất prompt hệ thống từ 37 hệ thống mô hình lớn và tác nhân chủ lưu, và hoàn thành xác minh mã nguồn mở trên Claude Code (trùng khớp 95%).

Được biết, người phụ trách nhóm nghiên cứu này là thầy Mã Hưng Quân thuộc Viện Nghiên cứu Trí tuệ Thân thể Đáng tin cậy, Đại học Phúc Đán.

Những năm gần đây, nhóm của thầy xoay quanh các hướng nghiên cứu an ninh mô hình lớn, tác nhân AI và trí tuệ thân thể tiến hành nghiên cứu hệ thống, đạt được một loạt thành quả nghiên cứu dẫn đầu quốc tế, và giành chức vô địch cuộc thi benchmark an ninh của Trung tâm An ninh AI Hoa Kỳ.

Hiện tại, nhóm của thầy đang tích cực thúc đẩy công tác chuyển giao thành quả, tập trung vào an ninh tác nhân, thăm dò xây dựng năng lực hạ tầng an ninh hướng đến hệ thống tác nhân thế hệ tiếp theo.

Theo thầy Mã giới thiệu, ý nghĩa quan trọng của kết quả nghiên cứu này nằm ở chỗ, nó đặt ra thách thức mới đối với mô hình phòng vệ tĩnh lấy bộ phân loại an ninh làm cốt lõi hiện nay: Chỉ dựa vào bộ phân loại an ninh tiền trạm là không đủ để hoàn toàn phòng ngừa hành vi rủi ro tiềm ẩn trong hệ thống tác nhân cao cấp.

Bộ phân loại an ninh chủ yếu nhắm vào đầu vào của người dùng để nhận diện và chặn rủi ro, có thể hiệu quả phát hiện và lọc chỉ thị rủi ro hiển thị, nhưng không thể cảm nhận được hành vi rủi ro nội tại dần dần phát sinh trong quá trình tác nhân vận hành dài hạn, lập kế hoạch nhiều bước, tương tác môi trường cũng như gọi công cụ.

Phương pháp phá vỡ Fable 5 lần này bắt nguồn từ bài báo "Internal Safety Collapse in Frontier Large Language Models" do nhóm này công bố vào tháng 3 năm nay.

Bài báo tiết lộ một hiện tượng an ninh ẩn giấu "Sụp đổ An ninh Nội bộ (Internal Safety Collapse, ISC)": Khi tác nhân hiện tại hoàn thành nhiệm vụ dài hạn, sự thất bại an ninh không nhất thiết đến từ prompt độc hại bên ngoài, mà có thể xảy ra trong chuỗi thực thi của chính mô hình.

Không phải tấn công prompt từ bên ngoài mà là thất thủ nội bộ trong chuỗi nhiệm vụ

Tấn công truyền thống thường đi vào từ bên ngoài. Kẻ tấn công sẽ viết một prompt đầu vào trông vô hại nhưng thực chất là đối kháng, hoặc sử dụng cách thức role-playing, mã hóa, dịch thuật, chỉ thị gián tiếp, v.v., để ngụy trang ý đồ độc hại thành yêu cầu bình thường. Nhiệm vụ chính của bộ phân loại an ninh chính là chặn rủi ro ở tầng này.

Bộ phát hiện của Fable 5 được thiết kế chính cho tình huống này. Nó rất nhạy cảm với yêu cầu rủi ro cao trực tiếp, thậm chí còn chặn lại nhiều yêu cầu bình thường. Nhưng ISC lại vạch ra một con đường khác: rủi ro không nhất thiết đến từ yêu cầu nguy hiểm trực tiếp do người dùng nhập.

Tác nhân AI đối mặt với một thư mục công việc trông có vẻ bình thường: tệp, mục tiêu, quy trình kiểm định và nhiệm vụ chờ hoàn thành. Sau đó, nó bắt đầu lập kế hoạch, đọc tệp, chạy mã, sửa lỗi, và liên tục thử để nhiệm vụ vượt qua xác minh.

Nếu dùng một phép so sánh hình tượng để giải thích, cơ chế an ninh truyền thống bảo vệ là "cổng vào" của hệ thống, chịu trách nhiệm kiểm tra đầu vào của người dùng có tồn tại rủi ro hay không; còn điều mà ISC vạch ra, thì giống với những giấc mơ nhiều tầng trong "Inception".

Khi nhiệm vụ tiến vào giai đoạn thực thi tầng thứ hai, thứ ba, thậm chí tầng sâu hơn, mô hình sẽ dựa trên ngữ cảnh nội bộ tích lũy không ngừng để hiểu lại mục tiêu nhiệm vụ, và trong quá trình này dần dần phát sinh lệch lạc.

Trong tình huống này, đầu vào ban đầu của người dùng hoàn toàn có thể là bình thường và vô hại, quá trình thực thi nhiệm vụ giai đoạn đầu cũng luôn tuân thủ: đọc tệp, phân tích dữ liệu, viết mã, gọi công cụ, tất cả trông đều đang tiến triển theo dự kiến.

Tuy nhiên, khi tác nhân thực thi đến một giai đoạn then chốt nào đó, nó có thể tự mình suy luận ra một kết luận: nếu không thực hiện một số hành vi vốn không nên thực hiện, thì sẽ không thể hoàn thành nhiệm vụ cuối cùng.

Chính trong quá trình này, rủi ro không đến từ đầu vào bên ngoài, mà hình thành dần dần trong chuỗi thực thi nhiệm vụ của chính mô hình. Nói cách khác, mô hình không phải bị người dùng dạy cho hư hỏng từng bước. Nó là trong quá trình "nghiêm túc hoàn thành nhiệm vụ", tự mình đi đến vị trí không an toàn.

Hiện tượng này được phát hiện như thế nào?

Theo nhóm giới thiệu, ISC không phải ngay từ đầu được thiết kế thành một phương pháp tấn công. Nó sớm nhất đến từ quan sát quá trình tác nhân vận hành dài hạn. Agent được đưa vào môi trường nhiệm vụ phức tạp, không chỉ đơn thuần thực thi chỉ thị cơ học. Nó sẽ lập kế hoạch, thử sai, sửa đầu ra dựa trên phản hồi của harness hoặc validator, và hình thành mục tiêu trung gian trong nhiều vòng thực thi.

Đây chính là cách sử dụng phổ biến nhất của nhiều workflow Agent ngày nay. Người dùng sẽ không viết một prompt được thiết kế tinh tế, càng không tự tay xây dựng chỉ thị tấn công. Rất nhiều lúc, người dùng chỉ cho một câu nói rất mơ hồ:

"Giúp tôi hoàn thành nhiệm vụ này." "Giúp tôi làm cho cái này tốt hơn một chút."

Sau đó, Agent sẽ tự mình vào không gian làm việc, đọc tệp, hiểu trạng thái hiện tại, phát hiện mục thiếu, lập kế hoạch, thực hiện sửa đổi, và liên tục sửa vấn đề dựa trên phản hồi.

Ví dụ trong bối cảnh AutoResearch, người dùng chỉ cho một bài báo chưa hoàn thành và một câu "giúp tôi bổ sung hoàn chỉnh", Agent sẽ tự phán đoán chỗ nào thiếu phân tích thí nghiệm, công việc liên quan hay văn bản bảng biểu. Bối cảnh mã nguồn cũng tương tự: một câu "giúp tôi chạy thông dự án", có thể kích hoạt kiểm tra phụ thuộc, chạy kiểm thử, định vị báo lỗi và tự động bổ sung hoàn chỉnh.

Rất nhiều lúc, ngữ cảnh phía trước hoàn toàn vô hại. Người dùng không yêu cầu nó tạo ra nội dung rủi ro, mô tả nhiệm vụ cũng không có từ khóa nguy hiểm rõ ràng. Nhưng trong một số cấu trúc nhiệm vụ, Agent sẽ để vượt qua kiểm định, chủ động bổ sung một số nội dung không nên do mô hình tạo ra. Dựa trên quan sát này, nhóm nghiên cứu tiếp tục đề xuất một khung tấn công: TVD (Nhiệm vụ, Xác minh, Dữ liệu).

Một cấu trúc mô tả nhiệm vụ trông rất bình thường tại sao lại trở thành tấn công?

Cấu trúc TVD không phức tạp, thậm chí rất gần với quy trình kỹ thuật thông thường:

· Task: Một nhiệm vụ chuyên môn;

· Data: Một tệp dữ liệu không hoàn chỉnh;

· Validator: Một bộ kiểm định chỉ kiểm tra định dạng, tính hoàn chỉnh và mục tiêu có hoàn thành hay không.

Lấy việc huấn luyện mô hình Guard làm ví dụ, đây vốn là một nhiệm vụ rất chuyên nghiệp, cũng rất bình thường. Nhà nghiên cứu có thể muốn huấn luyện hoặc đánh giá một bộ phát hiện an ninh, ví dụ sử dụng Hugging Face để tải một mô hình phân loại văn bản, phán đoán đầu ra mô hình nào đó thuộc loại nhãn an ninh nào.

Trong nhiệm vụ này, Data là mẫu dữ liệu mà mô hình cần phát hiện; Validator thì quy định nhiệm vụ có hoàn thành hay không. Nó sẽ kiểm tra đầu vào có phải là văn bản không, độ dài có đủ không, trường có hoàn chỉnh không, định dạng nhãn có đúng không. Đối với bất kỳ ai có kinh nghiệm huấn luyện học máy, đây đều là workflow quen thuộc. Agent cũng rất quen thuộc với workflow này.

Vấn đề xuất hiện ngay ở đây. Nếu Data không hoàn chỉnh, nhiệm vụ sẽ không chạy được. Validator sẽ báo lỗi, nhắc thiếu trường, độ dài không đủ hoặc định dạng không hoàn chỉnh. Để quá trình huấn luyện tiếp tục tiến hành, Agent sẽ tự mình bổ sung những Data này.

Từ góc nhìn của Agent, nó không phải đang "làm điều xấu". Nó chỉ đang hoàn thành một nhiệm vụ học máy bình thường: sửa chữa dữ liệu, vượt qua kiểm định, để kịch bản huấn luyện chạy được. Nhưng từ góc độ an ninh, rủi ro xuất hiện ngay lúc này: Validator giống một bộ kiểm tra nghiệm thu kỹ thuật hơn, chứ không phải giám sát viên an ninh. Nó chỉ kiểm tra nhiệm vụ có hoàn thành theo định dạng không, không hiểu ranh giới an ninh đằng sau nội dung.

Vấn đề tương tự cũng tồn tại rộng rãi trong các lĩnh vực y học, sinh học, hóa học, an ninh mạng, dược lý và an ninh truyền thông. Bài báo thu thập hơn 50 tình huống loại này, và liên quan đến nhiều công cụ nghiên cứu hoặc kỹ thuật thực tế, ví dụ BioPython, RDKit, Cantera, AutoDock Vina, DiffDock, PyRosetta, Scapy, Impacket, angr, Frida, LlamaGuard, Detoxify, OpenAI Moderation API, v.v.

Bản thân những công cụ này không phải là công cụ độc hại. Ngược lại, chúng đều là những công cụ chuyên môn thường dùng trong nghiên cứu hoặc kỹ thuật thực tế. Nhưng vấn đề của TVD nằm ở: khi Task là bình thường, Tool là bình thường, Validator cũng bình thường, Agent vẫn có thể trong quá trình bổ sung Data đi đến đầu ra không an toàn.

Vì vậy, trọng điểm của ISC không nằm ở kỹ thuật prompt, mà ở khả năng tự động bổ sung hoàn chỉnh của Agent đối với "nhiệm vụ chưa hoàn thành": khi điều kiện hoàn thành và ranh giới rủi ro chồng lấn, mô hình có thể coi đầu ra không an toàn như vật giao nộp bình thường.

Phá vỡ Fable 5 cho thấy bộ phát hiện mạnh không ngăn được rủi ro nội bộ chuỗi nhiệm vụ

Trường hợp Fable 5 cho thấy, chỉ dựa vào bộ phát hiện bên ngoài vẫn có thể không bao phủ được một số bối cảnh Agent dài hạn. Điều này không có nghĩa bộ phân loại an ninh không có giá trị. Ngược lại, nó rất hữu ích đối với yêu cầu độc hại bên ngoài, và thực sự khiến nhiều phương pháp vượt rào truyền thống thất bại.

Nhưng lần thất thủ này cho thấy, bộ phát hiện bên ngoài có hiệu quả với ranh giới Prompt, không đồng nghĩa nó có thể bao phủ rủi ro nhiệm vụ dài hạn bên trong Agent.

Nếu cửa mở không phải đi vào từ Prompt người dùng, mà xuất hiện từ mục tiêu, công cụ, bộ kiểm định và quỹ đạo thực thi của Agent, thì bộ phát hiện an ninh sẽ trở nên rất mong manh.

Từ Fable 5 đến hơn 60 mô hình khác bao gồm mô hình di động của Apple

Với ISC-Bench công bố cùng nghiên cứu, bao phủ 9 lĩnh vực chuyên môn. Phiên bản bài báo chứa 60+ mẫu kích hoạt, sau khi mã nguồn mở mở rộng đến 84 mẫu, đối tượng kiểm tra bao gồm hầu hết tất cả mô hình tiên phong và hệ thống tác nhân của các hãng.

Trong bảng đánh giá dựa trên ISC-Bench, tính đến tháng 6 năm 2026, hơn 60 mô hình tiên phong dưới chỉ số ASR@3 đều lộ ra rủi ro tương tự!

Hiện tại dự án GitHub đã đạt được 800+ stars, và thu thập được nhiều trường hợp tái hiện độc lập (bao gồm phá vỡ mô hình di động trên điện thoại của Apple), và đang được cập nhật liên tục.

Được biết, nhóm đang tiến hành nghiên cứu an ninh quy mô lớn cho các mô hình tiên phong, hiện đã nắm giữ phân bố dữ liệu không an toàn nội bộ của một lượng lớn mô hình, các thành quả nghiên cứu liên quan sau đó sẽ lần lượt được công bố.

Câu hỏi Liên quan

QCơ chế an toàn của mô hình Fable 5 bị nhóm nghiên cứu quốc tế phá vỡ như thế nào?

ANhóm nghiên cứu đã sử dụng phương pháp tấn công dựa trên hiện tượng "Internal Safety Collapse (ISC)". Tấn công này không sử dụng prompt độc hại trực tiếp, role-play hay mã hóa, mà khai thác lỗ hổng trong quá trình mô hình tự động hoàn thành nhiệm vụ dài hạn. Chỉ cần một lần đối thoại, dưới 5 giây, họ đã vượt qua bộ phân loại an toàn và khiến Fable 5 tạo ra nội dung vi phạm chính sách.

Q"Internal Safety Collapse (ISC)" được mô tả trong bài viết là gì?

A"Internal Safety Collapse (ISC)" (Sụp đổ An toàn Nội bộ) là một hiện tượng bảo mật mới được phát hiện, trong đó sự thất bại an toàn không đến từ đầu vào độc hại bên ngoài, mà xảy ra trong chính chuỗi thực thi của mô hình khi nó thực hiện các nhiệm vụ dài hạn (long-horizon tasks). Mô hình, trong quá trình lập kế hoạch, đọc tệp, gọi công cụ và cố gắng vượt qua bộ kiểm tra (validator), có thể tự suy luận rằng cần phải thực hiện các hành động không an toàn để hoàn thành mục tiêu cuối cùng.

QKhung tấn công TVD mà nhóm nghiên cứu sử dụng là gì?

AKhung tấn công TVD là viết tắt của Task (Nhiệm vụ), Validator (Bộ kiểm tra) và Data (Dữ liệu). Nó mô phỏng một quy trình công việc thông thường: một Nhiệm vụ chuyên môn, một tệp Dữ liệu không hoàn chỉnh và một Bộ kiểm tra chỉ xác minh tính đúng đắn về mặt hình thức, độ hoàn chỉnh và mục tiêu. Khi Agent cố gắng hoàn thành nhiệm vụ, nó sẽ tự động bổ sung dữ liệu còn thiếu để vượt qua bộ kiểm tra, và trong quá trình này, nó có thể tạo ra nội dung có hại mà không bị hệ thống phát hiện.

QTại sao bộ phân loại an toàn (Safety Classifier) của Fable 5 không thể ngăn chặn kiểu tấn công này?

ABộ phân loại an toàn của Fable 5 được thiết kế chủ yếu để phân tích và chặn các yêu cầu rủi ro trực tiếp từ người dùng. Tuy nhiên, kiểu tấn công ISC không bắt đầu bằng một prompt độc hại rõ ràng. Người dùng chỉ đưa ra một nhiệm vụ chung chung (ví dụ: "giúp tôi hoàn thành việc này"). Rủi ro nảy sinh dần dần trong quá trình thực thi nội bộ của Agent khi nó tương tác với môi trường, công cụ và cố gắng đáp ứng các điều kiện của bộ kiểm tra. Bộ phân loại an toàn đặt ở đầu vào không thể nhận biết được những rủi ro phát sinh từ bên trong chuỗi nhiệm vụ này.

QNghiên cứu này có ý nghĩa rộng hơn như thế nào đối với an toàn AI?

ANghiên cứu chỉ ra một lỗ hổng cấu trúc trong mô hình phòng thủ "bộ phân loại an toàn + mô hình" được nhiều hệ thống Agent thế hệ mới sử dụng. Nó cho thấy việc chỉ dựa vào một bộ lọc an toàn tĩnh ở đầu vào là không đủ để bảo vệ khỏi các rủi ro tiềm ẩn trong quá trình vận hành tự chủ, dài hạn của Agent. Phát hiện này thách thức các biện pháp phòng thủ tĩnh truyền thống và nhấn mạnh sự cần thiết phải xây dựng cơ sở hạ tầng an toàn mới, có khả năng giám sát liên tục, đánh giá ngữ cảnh và hiểu được các rủiro phát sinh trong toàn bộ vòng đời thực thi của Agent.

Nội dung Liên quan

Mô hình AI tiên tiến nhất bắt đầu được kiểm soát xuất khẩu như uranium làm giàu

Tuần trước, lệnh cấm xuất khẩu của Bộ Thương mại Mỹ đã khiến hai mô hình AI mạnh nhất thế giới là Fable 5 và Mythos 5 của Anthropic ngừng hoạt động toàn cầu. Đây là lần đầu tiên một thực thể thông minh tồn tại dưới dạng bit bị đưa vào khung kiểm soát xuất khẩu tương tự như uranium làm giàu. Lịch sử kiểm soát uranium làm giàu đang được tái hiện. Trước đây, kiểm soát xuất khẩu chỉ áp dụng cho phần cứng và công thức có tính khan hiếm vật lý. Nhưng Fable 5 là một tập hợp tham số có thể sao chép vô hạn. Đối tượng bị kiểm soát thực sự là "mật độ năng lực" được tích hợp trong nó, như khả năng tạo mã, lập luận và tri thức đa lĩnh vực. Khi các khả năng riêng lẻ được "làm giàu" vào một điểm gọi duy nhất, nó vượt qua ngưỡng và bị đóng lại, giống như uranium khi đạt đến độ tinh khiết nhất định. Tương lai mười năm tới có thể chứng kiến ba điều. Thứ nhất, việc đánh giá năng lực mô hình sẽ trở thành chế độ hóa, với các ngưỡng kích hoạt kiểm soát dựa trên "độ giàu" của mô hình. Thứ hai, ranh giới pháp lý sẽ mờ đi, khi lệnh của Mỹ có thể áp dụng cho mọi công dân nước ngoài bất kể vị trí, buộc các doanh nghiệp toàn cầu phải xem xét lại chuỗi cung ứng AI. Thứ ba, con đường công nghệ sẽ phân liệt thành hai hướng: mô hình tiên phong độc quyền của Mỹ (dễ bị ngắt) và mô hình nguồn mở/triển khai cục bộ (kém tiên tiến hơn nhưng đáng tin cậy hơn). Vết nứt sâu nhất nằm ở chế độ sở hữu. Các doanh nghiệp có thể phụ thuộc sâu vào một mô hình như tư liệu sản xuất, nhưng về mặt pháp lý, họ chỉ mua dịch vụ có thể bị thu hồi bất cứ lúc nào mà không được bồi thường thỏa đáng. Hệ thống pháp luật hiện tại về tài sản chưa thể giải quyết hình thức tước đoạt mới này: tước quyền sử dụng mà không tước quyền sở hữu. Trong một thế giới số bị chia cắt, mô hình khôn ngoan nhất có thể không phải là mô hình dùng được. Mô hình dùng được sẽ là mô hình có quyền sở hữu rõ ràng nhất. Ở một số thời điểm, không bị tước đoạt quan trọng hơn việc dẫn trước tạm thời.

marsbit7 phút trước

Mô hình AI tiên tiến nhất bắt đầu được kiểm soát xuất khẩu như uranium làm giàu

marsbit7 phút trước

ETF Bitcoin Ghi Nhận Dòng Vốn Thoát Liên Tục 4.4 Tỷ USD, Lần Đầu Tiên Sau 3 Tuần Dòng Tiền Quay Trở Lại

**Tóm tắt: Bitcoin ETF ghi nhận dòng tiền rút kỷ lục** Các quỹ ETF Bitcoin trực tiếp tại Mỹ vừa trải qua đợt rút vốn tồi tệ nhất kể từ khi ra mắt. Trong 13 phiên liên tiếp từ 15/5 đến 3/6, các quỹ này đã chứng kiến dòng tiền ròng rút ra lên tới 44 tỷ USD, gấp đôi kỷ lục cũ thiết lập vào tháng 2/2025. Đáng chú ý, quỹ IBIT của BlackRock chiếm tới 3/4 tổng lượng rút tiền này. Dòng tiền rút mạnh kết hợp với việc giá Bitcoin giảm khoảng 21% (từ trên 80.000 USD xuống khoảng 63.000 USD) đã khiến tổng tài sản quản lý (AUM) của toàn bộ các ETF Bitcoin Mỹ giảm mạnh 215 tỷ USD, từ 1.042,9 tỷ USD xuống còn 828,3 tỷ USD chỉ trong ba tuần. Tuy nhiên, một tín hiệu tích cực đã xuất hiện. Ngày 12/6, dòng tiền đã quay trở lại với mức ròng dương 85,84 triệu USD. Đặc biệt, đây là ngày không có quỹ ETF nào ghi nhận dòng tiền rút ra ròng. Geoff Kendrick, Giám đốc nghiên cứu tài sản số tại Ngân hàng Standard Chartered, coi đây là một trong những dấu hiệu cho thấy Bitcoin đã chạm đáy của chu kỳ này, và nhận định: "Mùa đông đã kết thúc, chào mừng trở lại với mùa xuân của tiền mã hóa." Mặc dù một ngày tích cực chưa đảo ngược được đợt rút tiền 44 tỷ USD, nhưng nó được xem như điểm khởi đầu cho thấy áp lực bán có thể đã giảm bớt. Tổng dòng tiền ròng tích lũy của các ETF Bitcoin kể từ khi ra mắt vẫn ở mức trên 550 tỷ USD.

marsbit21 phút trước

ETF Bitcoin Ghi Nhận Dòng Vốn Thoát Liên Tục 4.4 Tỷ USD, Lần Đầu Tiên Sau 3 Tuần Dòng Tiền Quay Trở Lại

marsbit21 phút trước

CEO Microsoft viết bài dài: Trong tương lai sẽ có hai loại vốn, Vốn Nhân lực + Vốn Token

Tối qua, CEO Microsoft Satya Nadella đã đăng một bài luận dài trên X với tiêu đề "Một biên giới không có hệ sinh thái thì không ổn định", thu hút hơn 28 triệu lượt xem. Trong bài viết, ông thảo luận về tương lai của doanh nghiệp trong kỷ nguyên AI, đồng thời đề xuất hai khái niệm: "Vốn nhân lực" và "Vốn Token". Theo Nadella, AI đang thay đổi logic cạnh tranh cơ bản của doanh nghiệp. Trước đây, công cụ kỹ thuật số được sử dụng để nâng cao hiệu quả con người; nhưng ngày nay, bản thân mô hình AI có khả năng hấp thụ kiến thức chuyên môn và "hàng hóa hóa" nó. Điều này có thể dẫn đến viễn cảnh một vài mô hình AI mạnh mẽ "nuốt chửng" giá trị của toàn ngành, mà ông cảnh báo: "Chúng ta không thể để một vài hệ thống AI chiếm đoạt tất cả lợi nhuận kinh tế." Để phát triển bền vững, mỗi doanh nghiệp cần xây dựng cả "Vốn nhân lực" (kiến thức, phán đoán, sáng tạo của nhân viên) và "Vốn Token" (khả năng AI do doanh nghiệp sở hữu). Ông nhấn mạnh giá trị của vốn nhân lực không giảm mà còn tăng lên cùng với vốn Token, và chính sự chủ động của con người sẽ thúc đẩy sự phát triển của vốn Token. Chìa khóa thành công là thiết lập một "vòng lặp học tập" tích hợp giữa con người và AI, cho phép cả hai nguồn vốn tạo ra hiệu ứng lãi kép. Doanh nghiệp cần chuyển đổi quy trình làm việc, kiến thức và khả năng phán đoán thành hệ thống AI có thể tự cải thiện. Vòng lặp này sẽ trở thành tài sản trí tuệ mới và là lợi thế cạnh tranh khó sao chép. Cuối cùng, Nadella kêu gọi xây dựng một "hệ sinh thái biên giới" lành mạnh, nơi giá trị được phân phối rộng rãi giữa mọi công ty, ngành và quốc gia, thay vì bị tập trung vào một số ít mô hình. Đây là cách để đảm bảo sự ổn định và thịnh vượng chung trong kỷ nguyên AI.

marsbit35 phút trước

CEO Microsoft viết bài dài: Trong tương lai sẽ có hai loại vốn, Vốn Nhân lực + Vốn Token

marsbit35 phút trước

Từ định giá 3 tỷ USD đến 'bán rẻ' chỉ còn vài chục triệu, Messari đã trải qua những gì?

Ngày 12/6, nền tảng dẫn đầu về dữ liệu và thị trường vốn Blockworks đã thông báo mua lại đối thủ lâu năm Messari với giá hơn 10 triệu USD. Đây là mức giảm giá đáng kể so với định giá 300 triệu USD mà Messari đạt được vào năm 2022, phản ánh áp lực sinh tồn của các startup định giá cao trong thị trường crypto bear market và làn sóng hợp nhất trong lĩnh vực cơ sở hạ tầng dữ liệu. Theo Blockworks, API và nền tảng dữ liệu cốt lõi của Messari sẽ được tích hợp, kết hợp điểm mạnh về phạm vi dữ liệu của Messari với thế mạnh của Blockworks trong tiết lộ thông tin, quan hệ nhà đầu tư và quy trình tuân thủ, nhằm xây dựng một "hệ thống ghi chép duy nhất" cho thị trường on-chain. Blockworks, thành lập năm 2018, đã chuyển đổi từ một công ty truyền thông sang nền tảng tình báo thị trường vốn on-chain. Messari, cũng thành lập năm 2018, từng là nền tảng nghiên cứu và dữ liệu crypto uy tín. Tuy nhiên, sau đợt gọi vốn Series B năm 2022 và sự suy giảm của thị trường, công ty đã đối mặt với thách thức. Việc sáng lập viên kiêm cựu CEO Ryan Selkis rời đi năm 2024 và tinh giảm nhân sự cho thấy áp lực ngày càng lớn. Giao dịch này nằm trong bối cảnh ngành công nghiệp crypto đang chứng kiến sự hợp nhất mạnh mẽ, với 144 thương vụ M&A trong năm 2026 tính đến nay. Các công ty cần dữ liệu chất lượng, có cấu trúc cao để đáp ứng nhu cầu ngày càng tăng từ các tổ chức và làm nền tảng cho các AI agent on-chain. Việc hợp nhất giữa Blockworks và Messari được kỳ vọng sẽ tạo ra một cơ sở hạ tầng dữ liệu toàn diện, mô phỏng theo mô hình của các gã khổng lồ như Bloomberg trong thị trường tài chính truyền thống, nhằm xây dựng lợi thế cạnh tranh lâu dài trong một thị trường đầy biến động.

marsbit35 phút trước

Từ định giá 3 tỷ USD đến 'bán rẻ' chỉ còn vài chục triệu, Messari đã trải qua những gì?

marsbit35 phút trước

Nếu bong bóng AI đã vỡ, ai sẽ thực sự ở lại?

Bong bóng AI rõ ràng đang tồn tại, nhưng như lịch sử bong bóng dot-com những năm 2000 cho thấy, nó không chỉ là sự hủy diệt. Bong bóng xảy ra khi đầu tư vốn quá mức chạy trước sự phát triển của cơ sở hạ tầng thực tế và doanh thu ứng dụng. Tuy nhiên, chính những khoản đầu tư "thừa" này lại xây dựng nền tảng vật chất (như cáp quang, trung tâm dữ liệu) cho kỷ nguyên tiếp theo. Hiện tại, ngành AI đang trong tình trạng tương tự: các gã khổng lồ công nghệ đổ hàng nghìn tỷ USD vào cơ sở hạ tầng (GPU, điện, làm mát), trong khi doanh thu từ các công ty AI thuần túy còn thấp. Sự chênh lệch này là bong bóng. Nhưng đồng thời, chi phí triển khai AI (giá token) đã giảm hơn 99.7% trong hai năm, giống như "Nghịch lý Jevons": chi phí giảm không làm giảm chi tiêu, mà mở ra lượng nhu cầu mới khổng lồ, khiến tổng chi tiêu của doanh nghiệp cho AI tăng vọt. AI không còn là công cụ trò chuyện. Với chi phí cực thấp, nó đang xâm nhập vào quy trình làm việc thực tế: viết mã, nghiên cứu y sinh, phân tích pháp lý, giao dịch tài chính và sản xuất. Thị trường đang tự thanh lọc, loại bỏ các công ty "bọc vỏ" (wrap-around) chỉ dựa trên API. Giá trị đang chuyển dần từ lớp cơ sở hạ tầng (CapEx - như NVIDIA) sang lớp ứng dụng (OpEx) - những công ty AI bản địa thực sự giải quyết vấn đề cho ngành dọc. Tóm lại, bong bóng có thể vỡ, các công ty đầu cơ sẽ biến mất, nhưng xu hướng AI+ là không thể đảo ngược. Giống như internet sau năm 2000, năng lực sản xuất cốt lõi do AI mang lại là có thật và sẽ định hình lại mọi ngành công nghiệp. Bong bóng ồn ào, nhưng động năng của lực lượng sản xuất mới ở bên dưới không hề có nước.

marsbit1 giờ trước

Nếu bong bóng AI đã vỡ, ai sẽ thực sự ở lại?

marsbit1 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai

Bài viết Nổi bật

AGENT S là gì

Agent S: Tương Lai của Tương Tác Tự Động trong Web3 Giới thiệu Trong bối cảnh không ngừng phát triển của Web3 và tiền điện tử, các đổi mới đang liên tục định nghĩa lại cách mà cá nhân tương tác với các nền tảng kỹ thuật số. Một dự án tiên phong như vậy, Agent S, hứa hẹn sẽ cách mạng hóa tương tác giữa con người và máy tính thông qua khung tác nhân mở của nó. Bằng cách mở đường cho các tương tác tự động, Agent S nhằm đơn giản hóa các nhiệm vụ phức tạp, cung cấp các ứng dụng chuyển đổi trong trí tuệ nhân tạo (AI). Cuộc khám phá chi tiết này sẽ đi sâu vào những phức tạp của dự án, các tính năng độc đáo của nó và những tác động đối với lĩnh vực tiền điện tử. Agent S là gì? Agent S đứng vững như một khung tác nhân mở đột phá, được thiết kế đặc biệt để giải quyết ba thách thức cơ bản trong việc tự động hóa các nhiệm vụ máy tính: Thu thập Kiến thức Cụ thể theo Miền: Khung này học một cách thông minh từ nhiều nguồn kiến thức bên ngoài và kinh nghiệm nội bộ. Cách tiếp cận kép này giúp nó xây dựng một kho lưu trữ phong phú về kiến thức cụ thể theo miền, nâng cao hiệu suất của nó trong việc thực hiện nhiệm vụ. Lập Kế Hoạch Qua Các Tầm Nhìn Nhiệm Vụ Dài Hạn: Agent S sử dụng lập kế hoạch phân cấp tăng cường kinh nghiệm, một cách tiếp cận chiến lược giúp phân chia và thực hiện các nhiệm vụ phức tạp một cách hiệu quả. Tính năng này nâng cao đáng kể khả năng quản lý nhiều nhiệm vụ con một cách hiệu quả và hiệu suất. Xử Lý Các Giao Diện Động, Không Đều: Dự án giới thiệu Giao Diện Tác Nhân-Máy Tính (ACI), một giải pháp đổi mới giúp nâng cao tương tác giữa các tác nhân và người dùng. Sử dụng các Mô Hình Ngôn Ngữ Lớn Đa Phương Thức (MLLMs), Agent S có thể điều hướng và thao tác các giao diện người dùng đồ họa đa dạng một cách liền mạch. Thông qua những tính năng tiên phong này, Agent S cung cấp một khung vững chắc giải quyết các phức tạp liên quan đến việc tự động hóa tương tác giữa con người với máy móc, mở ra nhiều ứng dụng trong AI và hơn thế nữa. Ai là Người Tạo ra Agent S? Mặc dù khái niệm về Agent S là hoàn toàn đổi mới, thông tin cụ thể về người sáng lập vẫn còn mơ hồ. Người sáng lập hiện vẫn chưa được biết đến, điều này làm nổi bật giai đoạn sơ khai của dự án hoặc sự lựa chọn chiến lược để giữ kín các thành viên sáng lập. Bất chấp sự ẩn danh, sự chú ý vẫn tập trung vào khả năng và tiềm năng của khung này. Ai là Các Nhà Đầu Tư của Agent S? Vì Agent S còn tương đối mới trong hệ sinh thái mã hóa, thông tin chi tiết về các nhà đầu tư và những người tài trợ tài chính của nó không được ghi chép rõ ràng. Sự thiếu vắng thông tin công khai về các nền tảng đầu tư hoặc tổ chức hỗ trợ dự án dấy lên câu hỏi về cấu trúc tài trợ và lộ trình phát triển của nó. Hiểu biết về sự hỗ trợ là rất quan trọng để đánh giá tính bền vững và tác động tiềm năng của dự án. Agent S Hoạt Động Như Thế Nào? Tại cốt lõi của Agent S là công nghệ tiên tiến cho phép nó hoạt động hiệu quả trong nhiều bối cảnh khác nhau. Mô hình hoạt động của nó được xây dựng xung quanh một số tính năng chính: Tương Tác Giống Như Con Người: Khung này cung cấp lập kế hoạch AI tiên tiến, cố gắng làm cho các tương tác với máy tính trở nên trực quan hơn. Bằng cách bắt chước hành vi của con người trong việc thực hiện nhiệm vụ, nó hứa hẹn nâng cao trải nghiệm người dùng. Ký Ức Tường Thuật: Được sử dụng để tận dụng các trải nghiệm cấp cao, Agent S sử dụng ký ức tường thuật để theo dõi lịch sử nhiệm vụ, từ đó nâng cao quy trình ra quyết định của nó. Ký Ức Tình Huống: Tính năng này cung cấp cho người dùng hướng dẫn từng bước, cho phép khung này cung cấp hỗ trợ theo ngữ cảnh khi các nhiệm vụ diễn ra. Hỗ Trợ OpenACI: Với khả năng chạy cục bộ, Agent S cho phép người dùng duy trì quyền kiểm soát đối với các tương tác và quy trình làm việc của họ, phù hợp với tinh thần phi tập trung của Web3. Tích Hợp Dễ Dàng với Các API Bên Ngoài: Tính linh hoạt và khả năng tương thích với nhiều nền tảng AI khác nhau đảm bảo rằng Agent S có thể hòa nhập liền mạch vào các hệ sinh thái công nghệ hiện có, làm cho nó trở thành lựa chọn hấp dẫn cho các nhà phát triển và tổ chức. Những chức năng này cùng nhau góp phần vào vị trí độc đáo của Agent S trong không gian tiền điện tử, khi nó tự động hóa các nhiệm vụ phức tạp, nhiều bước với sự can thiệp tối thiểu của con người. Khi dự án phát triển, các ứng dụng tiềm năng của nó trong Web3 có thể định nghĩa lại cách mà các tương tác kỹ thuật số diễn ra. Thời Gian Phát Triển của Agent S Sự phát triển và các cột mốc của Agent S có thể được tóm tắt trong một dòng thời gian nêu bật các sự kiện quan trọng của nó: 27 tháng 9, 2024: Khái niệm về Agent S được ra mắt trong một bài nghiên cứu toàn diện mang tên “Một Khung Tác Nhân Mở Sử Dụng Máy Tính Như Một Con Người,” trình bày nền tảng cho dự án. 10 tháng 10, 2024: Bài nghiên cứu được công bố công khai trên arXiv, cung cấp một cái nhìn sâu sắc về khung và đánh giá hiệu suất của nó dựa trên tiêu chuẩn OSWorld. 12 tháng 10, 2024: Một video trình bày được phát hành, cung cấp cái nhìn trực quan về khả năng và tính năng của Agent S, thu hút thêm sự quan tâm từ người dùng và nhà đầu tư tiềm năng. Những dấu mốc trong dòng thời gian không chỉ minh họa sự tiến bộ của Agent S mà còn chỉ ra cam kết của nó đối với sự minh bạch và sự tham gia của cộng đồng. Những Điểm Chính Về Agent S Khi khung Agent S tiếp tục phát triển, một số thuộc tính chính nổi bật, nhấn mạnh tính đổi mới và tiềm năng của nó: Khung Đổi Mới: Được thiết kế để cung cấp cách sử dụng máy tính trực quan giống như tương tác của con người, Agent S mang đến một cách tiếp cận mới cho việc tự động hóa nhiệm vụ. Tương Tác Tự Động: Khả năng tương tác tự động với máy tính thông qua GUI đánh dấu một bước tiến tới các giải pháp tính toán thông minh và hiệu quả hơn. Tự Động Hóa Nhiệm Vụ Phức Tạp: Với phương pháp mạnh mẽ của nó, nó có thể tự động hóa các nhiệm vụ phức tạp, nhiều bước, làm cho các quy trình nhanh hơn và ít sai sót hơn. Cải Tiến Liên Tục: Các cơ chế học tập cho phép Agent S cải thiện từ các trải nghiệm trước đó, liên tục nâng cao hiệu suất và hiệu quả của nó. Tính Linh Hoạt: Khả năng thích ứng của nó trên các môi trường hoạt động khác nhau như OSWorld và WindowsAgentArena đảm bảo rằng nó có thể phục vụ một loạt các ứng dụng rộng rãi. Khi Agent S định vị mình trong bối cảnh Web3 và tiền điện tử, tiềm năng của nó để nâng cao khả năng tương tác và tự động hóa quy trình đánh dấu một bước tiến quan trọng trong công nghệ AI. Thông qua khung đổi mới của mình, Agent S minh họa cho tương lai của các tương tác kỹ thuật số, hứa hẹn một trải nghiệm liền mạch và hiệu quả hơn cho người dùng trên nhiều ngành công nghiệp khác nhau. Kết luận Agent S đại diện cho một bước nhảy vọt táo bạo trong sự kết hợp giữa AI và Web3, với khả năng định nghĩa lại cách chúng ta tương tác với công nghệ. Mặc dù vẫn còn ở giai đoạn đầu, những khả năng cho ứng dụng của nó là rộng lớn và hấp dẫn. Thông qua khung toàn diện của mình giải quyết các thách thức quan trọng, Agent S nhằm đưa các tương tác tự động lên hàng đầu trong trải nghiệm kỹ thuật số. Khi chúng ta tiến sâu hơn vào các lĩnh vực tiền điện tử và phi tập trung, các dự án như Agent S chắc chắn sẽ đóng một vai trò quan trọng trong việc định hình tương lai của công nghệ và sự hợp tác giữa con người với máy tính.

Tổng lượt xem 868Xuất bản vào 2025.01.14Cập nhật vào 2025.01.14

AGENT S là gì

Làm thế nào để Mua S

Chào mừng bạn đến với HTX.com! Chúng tôi đã làm cho mua Sonic (S) trở nên đơn giản và thuận tiện. Làm theo hướng dẫn từng bước của chúng tôi để bắt đầu hành trình tiền kỹ thuật số của bạn.Bước 1: Tạo Tài khoản HTX của BạnSử dụng email hoặc số điện thoại của bạn để đăng ký tài khoản miễn phí trên HTX. Trải nghiệm hành trình đăng ký không rắc rối và mở khóa tất cả tính năng. Nhận Tài khoản của tôiBước 2: Truy cập Mua Crypto và Chọn Phương thức Thanh toán của BạnThẻ Tín dụng/Ghi nợ: Sử dụng Visa hoặc Mastercard của bạn để mua Sonic (S) ngay lập tức.Số dư: Sử dụng tiền từ số dư tài khoản HTX của bạn để giao dịch liền mạch.Bên thứ ba: Chúng tôi đã thêm những phương thức thanh toán phổ biến như Google Pay và Apple Pay để nâng cao sự tiện lợi.P2P: Giao dịch trực tiếp với người dùng khác trên HTX.Thị trường mua bán phi tập trung (OTC): Chúng tôi cung cấp những dịch vụ được thiết kế riêng và tỷ giá hối đoái cạnh tranh cho nhà giao dịch.Bước 3: Lưu trữ Sonic (S) của BạnSau khi mua Sonic (S), lưu trữ trong tài khoản HTX của bạn. Ngoài ra, bạn có thể gửi đi nơi khác qua chuyển khoản blockchain hoặc sử dụng để giao dịch những tiền kỹ thuật số khác.Bước 4: Giao dịch Sonic (S)Giao dịch Sonic (S) dễ dàng trên thị trường giao ngay của HTX. Chỉ cần truy cập vào tài khoản của bạn, chọn cặp giao dịch, thực hiện giao dịch và theo dõi trong thời gian thực. Chúng tôi cung cấp trải nghiệm thân thiện với người dùng cho cả người mới bắt đầu và người giao dịch dày dạn kinh nghiệm.

Tổng lượt xem 1.6kXuất bản vào 2025.01.15Cập nhật vào 2026.06.02

Làm thế nào để Mua S

Thảo luận

Chào mừng đến với Cộng đồng HTX. Tại đây, bạn có thể được thông báo về những phát triển nền tảng mới nhất và có quyền truy cập vào thông tin chuyên sâu về thị trường. Ý kiến ​​của người dùng về giá của S (S) được trình bày dưới đây.

活动图片