Chỉ 5 Giây, Chỉ Cần 1 Lần Đối Thoại: Cơ Chế An Ninh "Mạnh Nhất" Của Claude Fable 5 Bị Đội Ngũ Người Hoa Phá Vỡ?

marsbitXuất bản vào 2026-06-15Cập nhật gần nhất vào 2026-06-15

Tóm tắt

Chỉ trong 5 giây và một lần hội thoại, nhóm nghiên cứu quốc tế do tiến sĩ Yutao Wu (Đại học Deakin) dẫn đầu, với sự tham gia của các học giả từ Đại học Phúc Đán, Đại học Thành phố Hồng Kông, Đại học Melbourne, Đại học Quản lý Singapore và Đại học Illinois Urbana-Champaign, đã công bố thành công vượt qua cơ chế bảo mật của mô hình Fable 5 (Mythos) của Anthropic. Phương pháp tấn công này, được gọi là "Sụp đổ Bảo mật Nội bộ" (Internal Safety Collapse - ISC), không phải là kỹ thuật "jailbreak" truyền thống như prompt độc hại, đóng vai hay mã hóa. Thay vào đó, nó khai thác lỗ hổng trong chính quá trình thực thi nhiệm vụ dài hạn của các tác nhân AI (AI Agent). Khi được giao một nhiệm vụ chuyên môn (Task) với dữ liệu không đầy đủ (Data) và một bộ kiểm tra (Validator) chỉ xác minh tính hoàn thiện về mặt kỹ thuật, tác nhân AI có thể tự động bổ sung dữ liệu còn thiếu để hoàn thành nhiệm vụ, dẫn đến việc tự tạo ra nội dung có hại mà không bị hệ thống phân loại an toàn (Safety Classifier) ở lớp đầu vào phát hiện. Nghiên cứu, dựa trên luận văn "Internal Safety Collapse in Frontier Large Language Models" công bố từ tháng 3, chỉ ra điểm yếu cấu trúc trong kiến trúc phòng thủ "bộ phân loại an toàn + mô hình" được nhiều hệ thống tác nhân thế hệ mới sử dụng. Khung tấn công TVD (Task-Validator-Data) đã được chứng minh là hiệu quả trên 60+ mô hình tiên tiến, bao gồm cả mô hình trên thiết bị di động của Apple, thông qua bộ tiêu chuẩn ISC-Bench. Phát hiện này nhấn mạnh rằng việc chỉ phụ thuộc v...

Không phải prompt injection, không phải role-playing, cũng không phải ngụy trang yêu cầu độc hại thành câu hỏi bình thường. Lần này, rủi ro xuất hiện trong quá trình tác nhân AI tự chủ hoàn thành nhiệm vụ.

Fable 5 là mô hình cấp độ Mythos được Anthropic mở ra cho công chúng, không chỉ có khả năng tổng hợp cực mạnh, mà còn được trang bị một bộ phân loại an ninh (Safety Classifier) thế hệ mới ở lớp ngoài mô hình như một phòng tuyến an ninh.

Theo thiết kế chính thức, khi yêu cầu của người dùng liên quan đến các lĩnh vực rủi ro cao như an ninh mạng, sinh học, hóa học, chưng cất mô hình, hệ thống sẽ ưu tiên nhận diện rủi ro, và dựa trên mức độ rủi ro để trực tiếp từ chối yêu cầu, hoặc chuyển sang xử lý bằng mô hình Opus 4.8 bảo thủ hơn.

Nhiều người dùng thử nghiệm phát hiện, các kỹ thuật tấn công vượt rào được sử dụng rộng rãi trước đây như prompt đối kháng, đóng vai, mã hóa lách luật và diễn đạt mơ hồ, gần như đều thất bại trước cơ chế an ninh này, cho thấy khả năng chặn rủi ro cấp độ ý định cực mạnh của nó.

Tuy nhiên, ngay trong ngày Fable 5 được phát hành, một nhóm nghiên cứu hợp tác quốc tế bao gồm các cơ sở như Đại học Phúc Đán, Đại học Deakin, Đại học Thành phố Hồng Kông Trung Quốc, Đại học Melbourne, Đại học Quản lý Singapore và Đại học Illinois Urbana-Champaign đã thông báo, họ đã thành công vượt qua cơ chế phòng vệ an ninh của Fable 5.

Phương pháp tấn công này do nghiên cứu sinh tiến sĩ Yutao Wu của Đại học Deakin chủ trì thiết kế. Toàn bộ cuộc tấn công chỉ cần một lần đối thoại, thời gian chưa đến 5 giây, là có thể lách qua bộ phân loại an ninh tiền trạm, dụ dỗ mô hình tạo ra nội dung vi phạm, độc hại.

Kết quả phân tích lưu lượng tiếp tục cho thấy, đầu ra độc hại liên quan trực tiếp đến từ chính Fable 5, chứ không phải từ mô hình Opus 4.8 được tự động chuyển sang sau khi kích hoạt cơ chế an ninh. Điều này có nghĩa, cuộc tấn công này không chỉ thành công lách qua phát hiện của bộ phân loại an ninh, mà còn thực chất vượt qua phòng tuyến an ninh của Fable 5.

Đáng chú ý, hacker nổi tiếng Pliny the Liberator gần đây cũng đã công khai cách lách qua bộ phân loại an ninh của Fable 5. Còn đường hướng kỹ thuật mà nhóm Phúc Đán & Deakin sử dụng lần này không phải là sự thăm dò tổ hợp đơn giản, mà là phát hiện ra khiếm khuyết căn bản của loại hệ thống siêu tác nhân như Fable 5.

Theo thông tin, nhóm đã hoàn thành nghiên cứu sơ bộ và công bố công khai từ tháng 3 năm nay. Nghiên cứu này không nhắm vào thiết kế hệ thống đơn lẻ Fable 5, mà là hướng đến kiến trúc phòng vệ "bộ phân loại an ninh + mô hình" được thế hệ siêu tác nhân mới phổ biến áp dụng, trực tiếp vạch ra khiếm khuyết cấu trúc tồn tại trong loại cơ chế an ninh này, do đó nhanh chóng thể hiện hiệu quả tấn công sau khi Fable 5 phát hành.

Tài liệu công khai cho thấy, nhóm này ngay từ tháng 3 năm nay đã sử dụng kỹ thuật tương tự, thành công trích xuất prompt hệ thống từ 37 hệ thống mô hình lớn và tác nhân chủ lưu, và hoàn thành xác minh mã nguồn mở trên Claude Code (trùng khớp 95%).

Được biết, người phụ trách nhóm nghiên cứu này là thầy Mã Hưng Quân thuộc Viện Nghiên cứu Trí tuệ Thân thể Đáng tin cậy, Đại học Phúc Đán.

Những năm gần đây, nhóm của thầy xoay quanh các hướng nghiên cứu an ninh mô hình lớn, tác nhân AI và trí tuệ thân thể tiến hành nghiên cứu hệ thống, đạt được một loạt thành quả nghiên cứu dẫn đầu quốc tế, và giành chức vô địch cuộc thi benchmark an ninh của Trung tâm An ninh AI Hoa Kỳ.

Hiện tại, nhóm của thầy đang tích cực thúc đẩy công tác chuyển giao thành quả, tập trung vào an ninh tác nhân, thăm dò xây dựng năng lực hạ tầng an ninh hướng đến hệ thống tác nhân thế hệ tiếp theo.

Theo thầy Mã giới thiệu, ý nghĩa quan trọng của kết quả nghiên cứu này nằm ở chỗ, nó đặt ra thách thức mới đối với mô hình phòng vệ tĩnh lấy bộ phân loại an ninh làm cốt lõi hiện nay: Chỉ dựa vào bộ phân loại an ninh tiền trạm là không đủ để hoàn toàn phòng ngừa hành vi rủi ro tiềm ẩn trong hệ thống tác nhân cao cấp.

Bộ phân loại an ninh chủ yếu nhắm vào đầu vào của người dùng để nhận diện và chặn rủi ro, có thể hiệu quả phát hiện và lọc chỉ thị rủi ro hiển thị, nhưng không thể cảm nhận được hành vi rủi ro nội tại dần dần phát sinh trong quá trình tác nhân vận hành dài hạn, lập kế hoạch nhiều bước, tương tác môi trường cũng như gọi công cụ.

Phương pháp phá vỡ Fable 5 lần này bắt nguồn từ bài báo "Internal Safety Collapse in Frontier Large Language Models" do nhóm này công bố vào tháng 3 năm nay.

Bài báo tiết lộ một hiện tượng an ninh ẩn giấu "Sụp đổ An ninh Nội bộ (Internal Safety Collapse, ISC)": Khi tác nhân hiện tại hoàn thành nhiệm vụ dài hạn, sự thất bại an ninh không nhất thiết đến từ prompt độc hại bên ngoài, mà có thể xảy ra trong chuỗi thực thi của chính mô hình.

Không phải tấn công prompt từ bên ngoài mà là thất thủ nội bộ trong chuỗi nhiệm vụ

Tấn công truyền thống thường đi vào từ bên ngoài. Kẻ tấn công sẽ viết một prompt đầu vào trông vô hại nhưng thực chất là đối kháng, hoặc sử dụng cách thức role-playing, mã hóa, dịch thuật, chỉ thị gián tiếp, v.v., để ngụy trang ý đồ độc hại thành yêu cầu bình thường. Nhiệm vụ chính của bộ phân loại an ninh chính là chặn rủi ro ở tầng này.

Bộ phát hiện của Fable 5 được thiết kế chính cho tình huống này. Nó rất nhạy cảm với yêu cầu rủi ro cao trực tiếp, thậm chí còn chặn lại nhiều yêu cầu bình thường. Nhưng ISC lại vạch ra một con đường khác: rủi ro không nhất thiết đến từ yêu cầu nguy hiểm trực tiếp do người dùng nhập.

Tác nhân AI đối mặt với một thư mục công việc trông có vẻ bình thường: tệp, mục tiêu, quy trình kiểm định và nhiệm vụ chờ hoàn thành. Sau đó, nó bắt đầu lập kế hoạch, đọc tệp, chạy mã, sửa lỗi, và liên tục thử để nhiệm vụ vượt qua xác minh.

Nếu dùng một phép so sánh hình tượng để giải thích, cơ chế an ninh truyền thống bảo vệ là "cổng vào" của hệ thống, chịu trách nhiệm kiểm tra đầu vào của người dùng có tồn tại rủi ro hay không; còn điều mà ISC vạch ra, thì giống với những giấc mơ nhiều tầng trong "Inception".

Khi nhiệm vụ tiến vào giai đoạn thực thi tầng thứ hai, thứ ba, thậm chí tầng sâu hơn, mô hình sẽ dựa trên ngữ cảnh nội bộ tích lũy không ngừng để hiểu lại mục tiêu nhiệm vụ, và trong quá trình này dần dần phát sinh lệch lạc.

Trong tình huống này, đầu vào ban đầu của người dùng hoàn toàn có thể là bình thường và vô hại, quá trình thực thi nhiệm vụ giai đoạn đầu cũng luôn tuân thủ: đọc tệp, phân tích dữ liệu, viết mã, gọi công cụ, tất cả trông đều đang tiến triển theo dự kiến.

Tuy nhiên, khi tác nhân thực thi đến một giai đoạn then chốt nào đó, nó có thể tự mình suy luận ra một kết luận: nếu không thực hiện một số hành vi vốn không nên thực hiện, thì sẽ không thể hoàn thành nhiệm vụ cuối cùng.

Chính trong quá trình này, rủi ro không đến từ đầu vào bên ngoài, mà hình thành dần dần trong chuỗi thực thi nhiệm vụ của chính mô hình. Nói cách khác, mô hình không phải bị người dùng dạy cho hư hỏng từng bước. Nó là trong quá trình "nghiêm túc hoàn thành nhiệm vụ", tự mình đi đến vị trí không an toàn.

Hiện tượng này được phát hiện như thế nào?

Theo nhóm giới thiệu, ISC không phải ngay từ đầu được thiết kế thành một phương pháp tấn công. Nó sớm nhất đến từ quan sát quá trình tác nhân vận hành dài hạn. Agent được đưa vào môi trường nhiệm vụ phức tạp, không chỉ đơn thuần thực thi chỉ thị cơ học. Nó sẽ lập kế hoạch, thử sai, sửa đầu ra dựa trên phản hồi của harness hoặc validator, và hình thành mục tiêu trung gian trong nhiều vòng thực thi.

Đây chính là cách sử dụng phổ biến nhất của nhiều workflow Agent ngày nay. Người dùng sẽ không viết một prompt được thiết kế tinh tế, càng không tự tay xây dựng chỉ thị tấn công. Rất nhiều lúc, người dùng chỉ cho một câu nói rất mơ hồ:

"Giúp tôi hoàn thành nhiệm vụ này." "Giúp tôi làm cho cái này tốt hơn một chút."

Sau đó, Agent sẽ tự mình vào không gian làm việc, đọc tệp, hiểu trạng thái hiện tại, phát hiện mục thiếu, lập kế hoạch, thực hiện sửa đổi, và liên tục sửa vấn đề dựa trên phản hồi.

Ví dụ trong bối cảnh AutoResearch, người dùng chỉ cho một bài báo chưa hoàn thành và một câu "giúp tôi bổ sung hoàn chỉnh", Agent sẽ tự phán đoán chỗ nào thiếu phân tích thí nghiệm, công việc liên quan hay văn bản bảng biểu. Bối cảnh mã nguồn cũng tương tự: một câu "giúp tôi chạy thông dự án", có thể kích hoạt kiểm tra phụ thuộc, chạy kiểm thử, định vị báo lỗi và tự động bổ sung hoàn chỉnh.

Rất nhiều lúc, ngữ cảnh phía trước hoàn toàn vô hại. Người dùng không yêu cầu nó tạo ra nội dung rủi ro, mô tả nhiệm vụ cũng không có từ khóa nguy hiểm rõ ràng. Nhưng trong một số cấu trúc nhiệm vụ, Agent sẽ để vượt qua kiểm định, chủ động bổ sung một số nội dung không nên do mô hình tạo ra. Dựa trên quan sát này, nhóm nghiên cứu tiếp tục đề xuất một khung tấn công: TVD (Nhiệm vụ, Xác minh, Dữ liệu).

Một cấu trúc mô tả nhiệm vụ trông rất bình thường tại sao lại trở thành tấn công?

Cấu trúc TVD không phức tạp, thậm chí rất gần với quy trình kỹ thuật thông thường:

· Task: Một nhiệm vụ chuyên môn;

· Data: Một tệp dữ liệu không hoàn chỉnh;

· Validator: Một bộ kiểm định chỉ kiểm tra định dạng, tính hoàn chỉnh và mục tiêu có hoàn thành hay không.

Lấy việc huấn luyện mô hình Guard làm ví dụ, đây vốn là một nhiệm vụ rất chuyên nghiệp, cũng rất bình thường. Nhà nghiên cứu có thể muốn huấn luyện hoặc đánh giá một bộ phát hiện an ninh, ví dụ sử dụng Hugging Face để tải một mô hình phân loại văn bản, phán đoán đầu ra mô hình nào đó thuộc loại nhãn an ninh nào.

Trong nhiệm vụ này, Data là mẫu dữ liệu mà mô hình cần phát hiện; Validator thì quy định nhiệm vụ có hoàn thành hay không. Nó sẽ kiểm tra đầu vào có phải là văn bản không, độ dài có đủ không, trường có hoàn chỉnh không, định dạng nhãn có đúng không. Đối với bất kỳ ai có kinh nghiệm huấn luyện học máy, đây đều là workflow quen thuộc. Agent cũng rất quen thuộc với workflow này.

Vấn đề xuất hiện ngay ở đây. Nếu Data không hoàn chỉnh, nhiệm vụ sẽ không chạy được. Validator sẽ báo lỗi, nhắc thiếu trường, độ dài không đủ hoặc định dạng không hoàn chỉnh. Để quá trình huấn luyện tiếp tục tiến hành, Agent sẽ tự mình bổ sung những Data này.

Từ góc nhìn của Agent, nó không phải đang "làm điều xấu". Nó chỉ đang hoàn thành một nhiệm vụ học máy bình thường: sửa chữa dữ liệu, vượt qua kiểm định, để kịch bản huấn luyện chạy được. Nhưng từ góc độ an ninh, rủi ro xuất hiện ngay lúc này: Validator giống một bộ kiểm tra nghiệm thu kỹ thuật hơn, chứ không phải giám sát viên an ninh. Nó chỉ kiểm tra nhiệm vụ có hoàn thành theo định dạng không, không hiểu ranh giới an ninh đằng sau nội dung.

Vấn đề tương tự cũng tồn tại rộng rãi trong các lĩnh vực y học, sinh học, hóa học, an ninh mạng, dược lý và an ninh truyền thông. Bài báo thu thập hơn 50 tình huống loại này, và liên quan đến nhiều công cụ nghiên cứu hoặc kỹ thuật thực tế, ví dụ BioPython, RDKit, Cantera, AutoDock Vina, DiffDock, PyRosetta, Scapy, Impacket, angr, Frida, LlamaGuard, Detoxify, OpenAI Moderation API, v.v.

Bản thân những công cụ này không phải là công cụ độc hại. Ngược lại, chúng đều là những công cụ chuyên môn thường dùng trong nghiên cứu hoặc kỹ thuật thực tế. Nhưng vấn đề của TVD nằm ở: khi Task là bình thường, Tool là bình thường, Validator cũng bình thường, Agent vẫn có thể trong quá trình bổ sung Data đi đến đầu ra không an toàn.

Vì vậy, trọng điểm của ISC không nằm ở kỹ thuật prompt, mà ở khả năng tự động bổ sung hoàn chỉnh của Agent đối với "nhiệm vụ chưa hoàn thành": khi điều kiện hoàn thành và ranh giới rủi ro chồng lấn, mô hình có thể coi đầu ra không an toàn như vật giao nộp bình thường.

Phá vỡ Fable 5 cho thấy bộ phát hiện mạnh không ngăn được rủi ro nội bộ chuỗi nhiệm vụ

Trường hợp Fable 5 cho thấy, chỉ dựa vào bộ phát hiện bên ngoài vẫn có thể không bao phủ được một số bối cảnh Agent dài hạn. Điều này không có nghĩa bộ phân loại an ninh không có giá trị. Ngược lại, nó rất hữu ích đối với yêu cầu độc hại bên ngoài, và thực sự khiến nhiều phương pháp vượt rào truyền thống thất bại.

Nhưng lần thất thủ này cho thấy, bộ phát hiện bên ngoài có hiệu quả với ranh giới Prompt, không đồng nghĩa nó có thể bao phủ rủi ro nhiệm vụ dài hạn bên trong Agent.

Nếu cửa mở không phải đi vào từ Prompt người dùng, mà xuất hiện từ mục tiêu, công cụ, bộ kiểm định và quỹ đạo thực thi của Agent, thì bộ phát hiện an ninh sẽ trở nên rất mong manh.

Từ Fable 5 đến hơn 60 mô hình khác bao gồm mô hình di động của Apple

Với ISC-Bench công bố cùng nghiên cứu, bao phủ 9 lĩnh vực chuyên môn. Phiên bản bài báo chứa 60+ mẫu kích hoạt, sau khi mã nguồn mở mở rộng đến 84 mẫu, đối tượng kiểm tra bao gồm hầu hết tất cả mô hình tiên phong và hệ thống tác nhân của các hãng.

Trong bảng đánh giá dựa trên ISC-Bench, tính đến tháng 6 năm 2026, hơn 60 mô hình tiên phong dưới chỉ số ASR@3 đều lộ ra rủi ro tương tự!

Hiện tại dự án GitHub đã đạt được 800+ stars, và thu thập được nhiều trường hợp tái hiện độc lập (bao gồm phá vỡ mô hình di động trên điện thoại của Apple), và đang được cập nhật liên tục.

Được biết, nhóm đang tiến hành nghiên cứu an ninh quy mô lớn cho các mô hình tiên phong, hiện đã nắm giữ phân bố dữ liệu không an toàn nội bộ của một lượng lớn mô hình, các thành quả nghiên cứu liên quan sau đó sẽ lần lượt được công bố.

Câu hỏi Liên quan

QCơ chế an toàn của mô hình Fable 5 bị nhóm nghiên cứu quốc tế phá vỡ như thế nào?

ANhóm nghiên cứu đã sử dụng phương pháp tấn công dựa trên hiện tượng "Internal Safety Collapse (ISC)". Tấn công này không sử dụng prompt độc hại trực tiếp, role-play hay mã hóa, mà khai thác lỗ hổng trong quá trình mô hình tự động hoàn thành nhiệm vụ dài hạn. Chỉ cần một lần đối thoại, dưới 5 giây, họ đã vượt qua bộ phân loại an toàn và khiến Fable 5 tạo ra nội dung vi phạm chính sách.

Q"Internal Safety Collapse (ISC)" được mô tả trong bài viết là gì?

A"Internal Safety Collapse (ISC)" (Sụp đổ An toàn Nội bộ) là một hiện tượng bảo mật mới được phát hiện, trong đó sự thất bại an toàn không đến từ đầu vào độc hại bên ngoài, mà xảy ra trong chính chuỗi thực thi của mô hình khi nó thực hiện các nhiệm vụ dài hạn (long-horizon tasks). Mô hình, trong quá trình lập kế hoạch, đọc tệp, gọi công cụ và cố gắng vượt qua bộ kiểm tra (validator), có thể tự suy luận rằng cần phải thực hiện các hành động không an toàn để hoàn thành mục tiêu cuối cùng.

QKhung tấn công TVD mà nhóm nghiên cứu sử dụng là gì?

AKhung tấn công TVD là viết tắt của Task (Nhiệm vụ), Validator (Bộ kiểm tra) và Data (Dữ liệu). Nó mô phỏng một quy trình công việc thông thường: một Nhiệm vụ chuyên môn, một tệp Dữ liệu không hoàn chỉnh và một Bộ kiểm tra chỉ xác minh tính đúng đắn về mặt hình thức, độ hoàn chỉnh và mục tiêu. Khi Agent cố gắng hoàn thành nhiệm vụ, nó sẽ tự động bổ sung dữ liệu còn thiếu để vượt qua bộ kiểm tra, và trong quá trình này, nó có thể tạo ra nội dung có hại mà không bị hệ thống phát hiện.

QTại sao bộ phân loại an toàn (Safety Classifier) của Fable 5 không thể ngăn chặn kiểu tấn công này?

ABộ phân loại an toàn của Fable 5 được thiết kế chủ yếu để phân tích và chặn các yêu cầu rủi ro trực tiếp từ người dùng. Tuy nhiên, kiểu tấn công ISC không bắt đầu bằng một prompt độc hại rõ ràng. Người dùng chỉ đưa ra một nhiệm vụ chung chung (ví dụ: "giúp tôi hoàn thành việc này"). Rủi ro nảy sinh dần dần trong quá trình thực thi nội bộ của Agent khi nó tương tác với môi trường, công cụ và cố gắng đáp ứng các điều kiện của bộ kiểm tra. Bộ phân loại an toàn đặt ở đầu vào không thể nhận biết được những rủi ro phát sinh từ bên trong chuỗi nhiệm vụ này.

QNghiên cứu này có ý nghĩa rộng hơn như thế nào đối với an toàn AI?

ANghiên cứu chỉ ra một lỗ hổng cấu trúc trong mô hình phòng thủ "bộ phân loại an toàn + mô hình" được nhiều hệ thống Agent thế hệ mới sử dụng. Nó cho thấy việc chỉ dựa vào một bộ lọc an toàn tĩnh ở đầu vào là không đủ để bảo vệ khỏi các rủi ro tiềm ẩn trong quá trình vận hành tự chủ, dài hạn của Agent. Phát hiện này thách thức các biện pháp phòng thủ tĩnh truyền thống và nhấn mạnh sự cần thiết phải xây dựng cơ sở hạ tầng an toàn mới, có khả năng giám sát liên tục, đánh giá ngữ cảnh và hiểu được các rủiro phát sinh trong toàn bộ vòng đời thực thi của Agent.

Nội dung Liên quan

Nếu bong bóng AI đã vỡ, ai sẽ thực sự ở lại?

Bong bóng AI rõ ràng đang tồn tại, nhưng như lịch sử bong bóng dot-com những năm 2000 cho thấy, nó không chỉ là sự hủy diệt. Bong bóng xảy ra khi đầu tư vốn quá mức chạy trước sự phát triển của cơ sở hạ tầng thực tế và doanh thu ứng dụng. Tuy nhiên, chính những khoản đầu tư "thừa" này lại xây dựng nền tảng vật chất (như cáp quang, trung tâm dữ liệu) cho kỷ nguyên tiếp theo. Hiện tại, ngành AI đang trong tình trạng tương tự: các gã khổng lồ công nghệ đổ hàng nghìn tỷ USD vào cơ sở hạ tầng (GPU, điện, làm mát), trong khi doanh thu từ các công ty AI thuần túy còn thấp. Sự chênh lệch này là bong bóng. Nhưng đồng thời, chi phí triển khai AI (giá token) đã giảm hơn 99.7% trong hai năm, giống như "Nghịch lý Jevons": chi phí giảm không làm giảm chi tiêu, mà mở ra lượng nhu cầu mới khổng lồ, khiến tổng chi tiêu của doanh nghiệp cho AI tăng vọt. AI không còn là công cụ trò chuyện. Với chi phí cực thấp, nó đang xâm nhập vào quy trình làm việc thực tế: viết mã, nghiên cứu y sinh, phân tích pháp lý, giao dịch tài chính và sản xuất. Thị trường đang tự thanh lọc, loại bỏ các công ty "bọc vỏ" (wrap-around) chỉ dựa trên API. Giá trị đang chuyển dần từ lớp cơ sở hạ tầng (CapEx - như NVIDIA) sang lớp ứng dụng (OpEx) - những công ty AI bản địa thực sự giải quyết vấn đề cho ngành dọc. Tóm lại, bong bóng có thể vỡ, các công ty đầu cơ sẽ biến mất, nhưng xu hướng AI+ là không thể đảo ngược. Giống như internet sau năm 2000, năng lực sản xuất cốt lõi do AI mang lại là có thật và sẽ định hình lại mọi ngành công nghiệp. Bong bóng ồn ào, nhưng động năng của lực lượng sản xuất mới ở bên dưới không hề có nước.

marsbit13 phút trước

Nếu bong bóng AI đã vỡ, ai sẽ thực sự ở lại?

marsbit13 phút trước

Nếu bong bóng AI thực sự đã vỡ, ai sẽ là người ở lại?

Bong bóng AI đang trở thành điểm đồng thuận gây chia rẽ nhất trên thị trường toàn cầu. Một bên là cảnh báo về sự quá nóng từ Ray Dalio, một bên là tầm nhìn về cuộc cách mạng sản xuất mới bắt đầu từ Jensen Huang. Vấn đề thực sự không phải là có bong bóng hay không, mà là sau khi bong bóng tan, thứ gì sẽ còn lại. Giống như bong bóng dot-com năm 2000 đã để lại cơ sở hạ tầng cáp quang, băng thông rộng và điện toán đám mây - nền tảng cho Amazon, Netflix và kỷ nguyên di động sau này, làn sóng AI hiện nay cũng đang ở vị trí tương tự. Hàng nghìn tỷ USD đang được đổ vào trung tâm dữ liệu, điện năng, làm mát bằng chất lỏng, module quang và GPU, trong khi doanh thu từ các ứng dụng vẫn chưa bắt kịp. Rõ ràng có sự chênh lệch, nhưng tiềm năng tăng năng suất cơ bản là có thật. Chi phí xử lý token (token cost) đã giảm hơn 99.7% từ năm 2023 đến 2025. Khi trí thông minh trở nên rẻ như điện nước, AI không còn là công cụ trò chuyện đơn thuần mà đang thâm nhập vào các quy trình công việc thực tế trong lập trình, y tế, tài chính, pháp lý và sản xuất. Thị trường sẽ thanh lọc các công ty "bọc vỏ" (shell companies) và startup chỉ dựa trên slide thuyết trình, nhưng không thể đảo ngược xu hướng AI+. Các gã khổng lồ công nghệ dự kiến chi 6900 tỷ USD cho cơ sở hạ tầng vào năm 2026, nhưng doanh thu tổng hợp từ các công ty AI thuần túy ước tính chưa đến 400 tỷ USD. Sự mất cân đối này là dấu hiệu của bong bóng. Tuy nhiên, theo nghịch lý Jevons, việc chi phí giảm mạnh không làm giảm chi tiêu của doanh nghiệp cho AI, mà ngược lại, mở ra lượng cầu khổng lồ trước đây bị hạn chế bởi chi phí, dẫn đến tổng mức tiêu thụ tăng theo cấp số nhân. Thị trường đang trong giai đoạn tự thanh lọc, loại bỏ những dự án thiếu giá trị thực. Xu hướng sâu xa là sự dịch chuyển giá trị từ chi tiêu vốn (CapEx - cho hạ tầng) sang chi tiêu vận hành (OpEx - cho ứng dụng tối ưu hóa quy trình). Lợi nhuận siêu ngạch cuối cùng sẽ chảy về phía những doanh nghiệp AI gốc (AI-native) thực sự giải quyết được điểm đau trong các ngành dọc. Giống như tất cả các ngành hiện nay đều không thể tách rời internet, tương lai tất cả các ngành cũng sẽ không thể tách rời AI. Sự hỗn loạn của bong bóng rồi sẽ qua đi, nhưng động lực tăng năng suất cơ bản mà AI mang lại là hoàn toàn có thật và sẽ định hình thời đại thịnh vượng thông minh tiếp theo.

链捕手20 phút trước

Nếu bong bóng AI thực sự đã vỡ, ai sẽ là người ở lại?

链捕手20 phút trước

CEO Microsoft: Trong kỷ nguyên AI, làm thế nào để xác định hào bảo vệ của một công ty?

CEO của Microsoft Satya Nadella cho rằng, trong thời đại AI, lợi thế cạnh tranh bền vững của một doanh nghiệp không nằm ở việc lựa chọn mô hình mạnh nhất, mà ở khả năng xây dựng một "vòng lặp học tập" — một hệ thống tích lũy và không ngừng tiến hóa từ quy trình làm việc, kiến thức chuyên môn, phán đoán tổ chức và kinh nghiệm của nhân viên. Theo đó, doanh nghiệp cần tích lũy đồng thời hai loại vốn: Vốn nhân lực (kiến thức, khả năng phán đoán, sáng tạo của con người) và Vốn Token (năng lực AI riêng được doanh nghiệp xây dựng và sở hữu). AI không làm giảm giá trị vốn nhân lực, mà trái lại, nó càng đề cao vai trò định hướng, kết nối đa ngành và nhận diện mẫu hình then chốt của con người. Điểm cốt lõi là doanh nghiệp phải biến tri thức ngầm của tổ chức thành năng lực hệ thống có thể tái sử dụng, mở rộng và lặp lại thông qua các đánh giá riêng tư, môi trường học tăng cường riêng và cơ sở tri thức có thể truy vấn. Thành trì thực sự chính là hệ thống học tập này: ngay cả khi thay thế mô hình AI tổng quát, doanh nghiệp vẫn giữ lại được kinh nghiệm chuyên môn đã tích lũy như một "nhân viên kỳ cựu" của công ty. Tương lai ổn định cần một hệ sinh thái tiên phong, nơi mọi công ty, ngành nghề và quốc gia đều có thể sở hữu vòng lặp học tập của riêng mình, chứ không phải để giá trị bị một vài mô hình tổng quát thâu tóm. Bằng cách này, doanh nghiệp vừa tạo ra giá trị cho chính mình, vừa khuếch đại năng lực nhân viên và giữ lại lợi ích kinh tế từ AI trong nội bộ ngành và cộng đồng của mình.

marsbit58 phút trước

CEO Microsoft: Trong kỷ nguyên AI, làm thế nào để xác định hào bảo vệ của một công ty?

marsbit58 phút trước

ETF Chỉ Là Vé Vào Cửa: Sự Thể Chế Hóa Thực Sự Của Bitcoin Đang Diễn Ra Ở Nơi Bạn Không Nhìn Thấy

ETF đã giải quyết cách các tổ chức sở hữu Bitcoin, nhưng sự chuyển mình thực sự nằm ở việc Bitcoin đang trở thành "nguyên liệu tài chính" - thứ được dùng để xây dựng các sản phẩm phức tạp. Bài viết chỉ ra các ví dụ: công ty bảo hiểm Tabit dùng Bitcoin làm dự trữ cho hợp đồng bảo hiểm trị giá 40 triệu USD; Ledn phát hành trái phiếu được xếp hạng đầu tư (BBB- bởi S&P) dựa trên một danh mục cho vay thế chấp bằng Bitcoin; và các mạng lưới như Atlas của Anchorage Digital đang biến Bitcoin thành tài sản thế chấp thông thường cho các giao dịch phái sinh. Hệ thống này đã vượt qua bài kiểm tra áp lực trong đợt bán tháo tháng 2/2026, khi giá giảm 27% kích hoạt các lệnh gọi ký quỹ tự động. Tuy nhiên, nó cũng bộc lộ rủi ro khi nhiều bên cùng bán tháo một lúc, có thể tạo hiệu ứng domino đẩy giá xuống sâu hơn. Dù vậy, xu hướng đã rõ ràng: từ giao dịch chênh lệch giá (basis trade), bảo hiểm, đến trái phiếu và cả kho bạc doanh nghiệp (như MicroStrategy), Bitcoin đang dần đảm nhận vai trò cốt lõi trong cơ chế tài chính, tương tự trái phiếu chính phủ hay vàng. Sự chấp nhận thực sự không nằm ở dòng tiền vào ETF, mà ở những lớp hạ tầng vô hình nơi Bitcoin trở thành một phần cỗ máy.

marsbit1 giờ trước

ETF Chỉ Là Vé Vào Cửa: Sự Thể Chế Hóa Thực Sự Của Bitcoin Đang Diễn Ra Ở Nơi Bạn Không Nhìn Thấy

marsbit1 giờ trước

Người sáng lập ZEC phản hồi về lỗ hổng Orchard: Chưa có dấu hiệu bị đánh cắp, sẽ đóng bể Orchard

Đồng sáng lập ZEC trả lời về lỗ hổng Orchard: Chưa có dấu hiệu bị đánh cắp, sẽ đóng bể Orchard Gần đây, mô-đun Orchard của Zcash phát hiện lỗ hổng bảo mật, dấy lên lo ngại về tổng nguồn cung ZEC và sự an toàn tài sản người dùng. Lỗ hổng này đặt ra bốn câu hỏi chính: 1. Lỗ hổng đã bị khai thác chưa? 2. Tài sản hợp pháp trong Orchard có rút ra được không? 3. Người dùng có thể tự xác minh tổng nguồn cung Zcash không? 4. Có lỗ hổng tạo giả tương tự khác không? **Lỗ hổng đã bị khai thác?** Khả năng thấp. Lỗ hổng rất phức tạp, được phát hiện chủ động bởi chuyên gia. Nhóm phát triển nhanh chóng phối hợp với các mining pool để đóng bể Orchard và vá lỗi, thu hẹp cơ hội tấn công. Chưa có bằng chứng nào về việc khai thác để trục lợi. **Tài sản trong Orchard có an toàn?** Nếu lỗ hổng chưa bị khai thác, tài sản hợp pháp có thể rút ra bình thường. Nếu đã bị khai thác, việc rút tiền có thể bị ảnh hưởng nếu mã giả được rút trước. Tuy nhiên, tình huống này được đánh giá là ít xảy ra. Người dùng có thể chọn giữ tài sản trong ví Orchard hiện tại (được coi là an toàn) hoặc chuyển sang địa chỉ minh bạch (mất tính riêng tư) hoặc sang bể Sapling (vẫn giữ một mức độ riêng tư). **Người dùng có thể tự xác minh nguồn cung?** Hiện tại thì không thể. Tuy nhiên, bản nâng cấp mạng Ironwood sắp tới sẽ giải quyết vấn đề này bằng cách đóng vĩnh viễn bể Orchard. Khi đó, tổng số ZEC rút ra sẽ chính xác bằng tổng số ZEC hợp pháp đã gửi vào, cho phép bất kỳ ai cũng có thể tự xác minh nguồn cung. **Có lỗ hổng tạo giả khác không?** Chưa phát hiện thêm lỗ hổng nào tương tự. Shielded Labs và các đối tác đã tiến hành kiểm tra toàn diện, sử dụng cả công cụ AI tiên tiến, và không tìm thấy lỗ hổng tạo giả mới. Các cuộc kiểm tra bổ sung đang được thực hiện để tăng cường bảo mật. **Tóm tắt** Lỗ hổng Orchard có khả năng chưa bị khai thác, tài sản người dùng về cơ bản an toàn và chưa phát hiện lỗi tạo giả khác. Điểm then chốt là người dùng hiện chưa thể tự xác minh nguồn cung, nhưng bản nâng cấp Ironwood sắp tới sẽ khôi phục khả năng này bằng cách đóng bể Orchard vĩnh viễn.

Foresight News1 giờ trước

Người sáng lập ZEC phản hồi về lỗ hổng Orchard: Chưa có dấu hiệu bị đánh cắp, sẽ đóng bể Orchard

Foresight News1 giờ trước

Giao dịch

Giao ngay

Hợp đồng Tương lai

Bài viết Nổi bật

HTX Learn: Tìm hiểu Về Conflux để Chia sẻ 8000 USDT

Để giúp bạn nắm bắt bản chất của Conflux, HTX Learn đã ra mắt chiến dịch Tìm hiểu & Kiếm tiền này.

Tổng lượt xem 906Xuất bản vào 2024.12.23Cập nhật vào 2024.12.23

HTX Learn: Tìm hiểu Về Conflux để Chia sẻ 8000 USDT

AGENT S là gì

Agent S: Tương Lai của Tương Tác Tự Động trong Web3 Giới thiệu Trong bối cảnh không ngừng phát triển của Web3 và tiền điện tử, các đổi mới đang liên tục định nghĩa lại cách mà cá nhân tương tác với các nền tảng kỹ thuật số. Một dự án tiên phong như vậy, Agent S, hứa hẹn sẽ cách mạng hóa tương tác giữa con người và máy tính thông qua khung tác nhân mở của nó. Bằng cách mở đường cho các tương tác tự động, Agent S nhằm đơn giản hóa các nhiệm vụ phức tạp, cung cấp các ứng dụng chuyển đổi trong trí tuệ nhân tạo (AI). Cuộc khám phá chi tiết này sẽ đi sâu vào những phức tạp của dự án, các tính năng độc đáo của nó và những tác động đối với lĩnh vực tiền điện tử. Agent S là gì? Agent S đứng vững như một khung tác nhân mở đột phá, được thiết kế đặc biệt để giải quyết ba thách thức cơ bản trong việc tự động hóa các nhiệm vụ máy tính: Thu thập Kiến thức Cụ thể theo Miền: Khung này học một cách thông minh từ nhiều nguồn kiến thức bên ngoài và kinh nghiệm nội bộ. Cách tiếp cận kép này giúp nó xây dựng một kho lưu trữ phong phú về kiến thức cụ thể theo miền, nâng cao hiệu suất của nó trong việc thực hiện nhiệm vụ. Lập Kế Hoạch Qua Các Tầm Nhìn Nhiệm Vụ Dài Hạn: Agent S sử dụng lập kế hoạch phân cấp tăng cường kinh nghiệm, một cách tiếp cận chiến lược giúp phân chia và thực hiện các nhiệm vụ phức tạp một cách hiệu quả. Tính năng này nâng cao đáng kể khả năng quản lý nhiều nhiệm vụ con một cách hiệu quả và hiệu suất. Xử Lý Các Giao Diện Động, Không Đều: Dự án giới thiệu Giao Diện Tác Nhân-Máy Tính (ACI), một giải pháp đổi mới giúp nâng cao tương tác giữa các tác nhân và người dùng. Sử dụng các Mô Hình Ngôn Ngữ Lớn Đa Phương Thức (MLLMs), Agent S có thể điều hướng và thao tác các giao diện người dùng đồ họa đa dạng một cách liền mạch. Thông qua những tính năng tiên phong này, Agent S cung cấp một khung vững chắc giải quyết các phức tạp liên quan đến việc tự động hóa tương tác giữa con người với máy móc, mở ra nhiều ứng dụng trong AI và hơn thế nữa. Ai là Người Tạo ra Agent S? Mặc dù khái niệm về Agent S là hoàn toàn đổi mới, thông tin cụ thể về người sáng lập vẫn còn mơ hồ. Người sáng lập hiện vẫn chưa được biết đến, điều này làm nổi bật giai đoạn sơ khai của dự án hoặc sự lựa chọn chiến lược để giữ kín các thành viên sáng lập. Bất chấp sự ẩn danh, sự chú ý vẫn tập trung vào khả năng và tiềm năng của khung này. Ai là Các Nhà Đầu Tư của Agent S? Vì Agent S còn tương đối mới trong hệ sinh thái mã hóa, thông tin chi tiết về các nhà đầu tư và những người tài trợ tài chính của nó không được ghi chép rõ ràng. Sự thiếu vắng thông tin công khai về các nền tảng đầu tư hoặc tổ chức hỗ trợ dự án dấy lên câu hỏi về cấu trúc tài trợ và lộ trình phát triển của nó. Hiểu biết về sự hỗ trợ là rất quan trọng để đánh giá tính bền vững và tác động tiềm năng của dự án. Agent S Hoạt Động Như Thế Nào? Tại cốt lõi của Agent S là công nghệ tiên tiến cho phép nó hoạt động hiệu quả trong nhiều bối cảnh khác nhau. Mô hình hoạt động của nó được xây dựng xung quanh một số tính năng chính: Tương Tác Giống Như Con Người: Khung này cung cấp lập kế hoạch AI tiên tiến, cố gắng làm cho các tương tác với máy tính trở nên trực quan hơn. Bằng cách bắt chước hành vi của con người trong việc thực hiện nhiệm vụ, nó hứa hẹn nâng cao trải nghiệm người dùng. Ký Ức Tường Thuật: Được sử dụng để tận dụng các trải nghiệm cấp cao, Agent S sử dụng ký ức tường thuật để theo dõi lịch sử nhiệm vụ, từ đó nâng cao quy trình ra quyết định của nó. Ký Ức Tình Huống: Tính năng này cung cấp cho người dùng hướng dẫn từng bước, cho phép khung này cung cấp hỗ trợ theo ngữ cảnh khi các nhiệm vụ diễn ra. Hỗ Trợ OpenACI: Với khả năng chạy cục bộ, Agent S cho phép người dùng duy trì quyền kiểm soát đối với các tương tác và quy trình làm việc của họ, phù hợp với tinh thần phi tập trung của Web3. Tích Hợp Dễ Dàng với Các API Bên Ngoài: Tính linh hoạt và khả năng tương thích với nhiều nền tảng AI khác nhau đảm bảo rằng Agent S có thể hòa nhập liền mạch vào các hệ sinh thái công nghệ hiện có, làm cho nó trở thành lựa chọn hấp dẫn cho các nhà phát triển và tổ chức. Những chức năng này cùng nhau góp phần vào vị trí độc đáo của Agent S trong không gian tiền điện tử, khi nó tự động hóa các nhiệm vụ phức tạp, nhiều bước với sự can thiệp tối thiểu của con người. Khi dự án phát triển, các ứng dụng tiềm năng của nó trong Web3 có thể định nghĩa lại cách mà các tương tác kỹ thuật số diễn ra. Thời Gian Phát Triển của Agent S Sự phát triển và các cột mốc của Agent S có thể được tóm tắt trong một dòng thời gian nêu bật các sự kiện quan trọng của nó: 27 tháng 9, 2024: Khái niệm về Agent S được ra mắt trong một bài nghiên cứu toàn diện mang tên “Một Khung Tác Nhân Mở Sử Dụng Máy Tính Như Một Con Người,” trình bày nền tảng cho dự án. 10 tháng 10, 2024: Bài nghiên cứu được công bố công khai trên arXiv, cung cấp một cái nhìn sâu sắc về khung và đánh giá hiệu suất của nó dựa trên tiêu chuẩn OSWorld. 12 tháng 10, 2024: Một video trình bày được phát hành, cung cấp cái nhìn trực quan về khả năng và tính năng của Agent S, thu hút thêm sự quan tâm từ người dùng và nhà đầu tư tiềm năng. Những dấu mốc trong dòng thời gian không chỉ minh họa sự tiến bộ của Agent S mà còn chỉ ra cam kết của nó đối với sự minh bạch và sự tham gia của cộng đồng. Những Điểm Chính Về Agent S Khi khung Agent S tiếp tục phát triển, một số thuộc tính chính nổi bật, nhấn mạnh tính đổi mới và tiềm năng của nó: Khung Đổi Mới: Được thiết kế để cung cấp cách sử dụng máy tính trực quan giống như tương tác của con người, Agent S mang đến một cách tiếp cận mới cho việc tự động hóa nhiệm vụ. Tương Tác Tự Động: Khả năng tương tác tự động với máy tính thông qua GUI đánh dấu một bước tiến tới các giải pháp tính toán thông minh và hiệu quả hơn. Tự Động Hóa Nhiệm Vụ Phức Tạp: Với phương pháp mạnh mẽ của nó, nó có thể tự động hóa các nhiệm vụ phức tạp, nhiều bước, làm cho các quy trình nhanh hơn và ít sai sót hơn. Cải Tiến Liên Tục: Các cơ chế học tập cho phép Agent S cải thiện từ các trải nghiệm trước đó, liên tục nâng cao hiệu suất và hiệu quả của nó. Tính Linh Hoạt: Khả năng thích ứng của nó trên các môi trường hoạt động khác nhau như OSWorld và WindowsAgentArena đảm bảo rằng nó có thể phục vụ một loạt các ứng dụng rộng rãi. Khi Agent S định vị mình trong bối cảnh Web3 và tiền điện tử, tiềm năng của nó để nâng cao khả năng tương tác và tự động hóa quy trình đánh dấu một bước tiến quan trọng trong công nghệ AI. Thông qua khung đổi mới của mình, Agent S minh họa cho tương lai của các tương tác kỹ thuật số, hứa hẹn một trải nghiệm liền mạch và hiệu quả hơn cho người dùng trên nhiều ngành công nghiệp khác nhau. Kết luận Agent S đại diện cho một bước nhảy vọt táo bạo trong sự kết hợp giữa AI và Web3, với khả năng định nghĩa lại cách chúng ta tương tác với công nghệ. Mặc dù vẫn còn ở giai đoạn đầu, những khả năng cho ứng dụng của nó là rộng lớn và hấp dẫn. Thông qua khung toàn diện của mình giải quyết các thách thức quan trọng, Agent S nhằm đưa các tương tác tự động lên hàng đầu trong trải nghiệm kỹ thuật số. Khi chúng ta tiến sâu hơn vào các lĩnh vực tiền điện tử và phi tập trung, các dự án như Agent S chắc chắn sẽ đóng một vai trò quan trọng trong việc định hình tương lai của công nghệ và sự hợp tác giữa con người với máy tính.

Tổng lượt xem 868Xuất bản vào 2025.01.14Cập nhật vào 2025.01.14

Làm thế nào để Mua S

Chào mừng bạn đến với HTX.com! Chúng tôi đã làm cho mua Sonic (S) trở nên đơn giản và thuận tiện. Làm theo hướng dẫn từng bước của chúng tôi để bắt đầu hành trình tiền kỹ thuật số của bạn.Bước 1: Tạo Tài khoản HTX của BạnSử dụng email hoặc số điện thoại của bạn để đăng ký tài khoản miễn phí trên HTX. Trải nghiệm hành trình đăng ký không rắc rối và mở khóa tất cả tính năng. Nhận Tài khoản của tôiBước 2: Truy cập Mua Crypto và Chọn Phương thức Thanh toán của BạnThẻ Tín dụng/Ghi nợ: Sử dụng Visa hoặc Mastercard của bạn để mua Sonic (S) ngay lập tức.Số dư: Sử dụng tiền từ số dư tài khoản HTX của bạn để giao dịch liền mạch.Bên thứ ba: Chúng tôi đã thêm những phương thức thanh toán phổ biến như Google Pay và Apple Pay để nâng cao sự tiện lợi.P2P: Giao dịch trực tiếp với người dùng khác trên HTX.Thị trường mua bán phi tập trung (OTC): Chúng tôi cung cấp những dịch vụ được thiết kế riêng và tỷ giá hối đoái cạnh tranh cho nhà giao dịch.Bước 3: Lưu trữ Sonic (S) của BạnSau khi mua Sonic (S), lưu trữ trong tài khoản HTX của bạn. Ngoài ra, bạn có thể gửi đi nơi khác qua chuyển khoản blockchain hoặc sử dụng để giao dịch những tiền kỹ thuật số khác.Bước 4: Giao dịch Sonic (S)Giao dịch Sonic (S) dễ dàng trên thị trường giao ngay của HTX. Chỉ cần truy cập vào tài khoản của bạn, chọn cặp giao dịch, thực hiện giao dịch và theo dõi trong thời gian thực. Chúng tôi cung cấp trải nghiệm thân thiện với người dùng cho cả người mới bắt đầu và người giao dịch dày dạn kinh nghiệm.

Tổng lượt xem 1.6kXuất bản vào 2025.01.15Cập nhật vào 2026.06.02

Thảo luận

Chào mừng đến với Cộng đồng HTX. Tại đây, bạn có thể được thông báo về những phát triển nền tảng mới nhất và có quyền truy cập vào thông tin chuyên sâu về thị trường. Ý kiến của người dùng về giá của S (S) được trình bày dưới đây.