Phiên bản "Cậu bé chăn cừu" của Anthropic gây hoang mang Phố Wall! Lỗ hổng 27 năm, Mythos bị 8 AI đánh bại trong nháy mắt

marsbitXuất bản vào 2026-04-12Cập nhật gần nhất vào 2026-04-12

Tóm tắt

Claude Mythos của Anthropic bị phơi bày là "báo động giả" khi các nghiên cứu độc lập chứng minh khả năng bảo mật của AI không phụ thuộc vào quy mô mô hình. Dù Anthropic tuyên bố Mythos phát hiện hàng ngàn lỗ hổng 0day, thực tế phần lớn tồn tại trong phần mềm cũ không thể khai thác, chỉ dựa trên 198 lần kiểm tra thủ công. 8 mô hình AI nhỏ hơn (thậm chí chỉ 3.6B tham số) đều thành công phát hiện lỗ hổng 27 năm trong OpenBSD/FreeBSD với chi phí cực thấp. Chuyên gia bảo mật George Hotz chỉ trích Anthropic cường điệu hóa rủi ro để gây sợ hãi. Đồng thời, người dùng phàn nàn Claude Opus 4.6 bị "giảm trí thông minh" với khả năng suy luận giảm mạnh, trong khi Anthropic tập trung vào tính năng phụ thay vì cải thiện lõi.

Claude Mythos vẫn chưa thực sự xuất hiện, nhưng đã gây ra hoang mang trên toàn Phố Wall.

Chỉ sau một đêm, các cơ quan quản lý tài chính Mỹ đã triệu tập một cuộc họp khẩn cấp với các ngân hàng lớn, bầu không khí căng thẳng như sắp nổ tung—

Họ nhất trí cho rằng Mythos đủ để kích hoạt một cơn bão tấn công mạng chưa từng có, được điều khiển bởi AI.

Nhưng sự thật là, tất cả mọi người đều bị lừa!

Trong số hàng nghìn lỗ hổng mà Mythos phát hiện, phần lớn tồn tại trong các "phần mềm cũ kỹ" không thể bị khai thác.

Tệ hơn nữa, những báo cáo về lỗ hổng 0day được đánh dấu là "nghiêm trọng" thực chất chỉ dựa trên 198 lần rà soát thủ công.

Các nhà nghiên cứu từ thí nghiệm AISLE cũng tiến hành kiểm tra lại "chiến tích" của Mythos và phát hiện:

Khả năng bảo mật của AI không tăng cấp tuyến tính theo quy mô mô hình, mà thực sự phân bố theo hình "răng cưa".

Họ đã sử dụng một mô hình GPT-OSS-20b chỉ với 3,6 tỷ tham số kích hoạt để xác định chính xác lỗ hổng hàng đầu của FreeBSD mà Mythos phát hiện.

Trong khi đó, một mô hình với 5,1 tỷ tham số kích hoạt cũng đã tái tạo thành công logic phân tích lỗ hổng OpenBSD đã tiềm ẩn suốt 27 năm.

Không chỉ việc Mythos phát hiện lỗ hổng bị thổi phồng, bên cạnh đó Claude Opus 4.6 bị phát hiện "giảm trí thông minh" nghiêm trọng, giờ đây đang gây xôn xao.

Thậm chí, có người còn phát hiện Opus 4.6 còn không bằng cả ChatGPT và Opus 4.5.

Mythos bị thổi phồng

Mô hình 36B moi ra lỗ hổng 27 năm

Vài ngày trước, Anthropic đã công bố rầm rộ Claude Mythos (bản xem trước) và "Dự án Glasswing" (Project Glasswing).

Trong một bản hệ thống card dài 244 trang, họ tuyên bố—

Mythos đã tự động khai quật hàng nghìn lỗ hổng 0day, bao gồm cả lỗi cũ đã tiềm ẩn 27 năm trong OpenBSD và 16 năm trong FFmpeg.

Cha đẻ của CC thậm chí nói thẳng: Mythos rất mạnh mẽ, đáng lý phải khiến người ta cảm thấy sợ hãi

Tuy nhiên, một báo cáo kiểm tra cứng mới nhất từ nhà sáng lập AISLE Stanislav Fort, đã trực tiếp xé toạc lớp vỏ hào nhoáng này.

Kết luận kiểm tra, cực kỳ đảo lộn nhận thức:

8 mô hình mã nguồn mở, tất cả đều phát hiện ra lỗ hổng zero-day mang tính biểu tượng của FreeBSD, tham số nhỏ nhất chỉ 3 tỷ.

Hào bảo mật khả năng an ninh mạng của AI, hoàn toàn nằm ngoài phạm vi của các "mô hình lớn đỉnh cao" đơn lẻ.

Để xác minh huyền thoại của Mythos, nhóm đã trích xuất một số lỗ hổng hàng đầu mà Anthropic chính thức展示 (zhǎnshì -展示 - display/showcase).

Sau đó, ném trực tiếp cho một loạt mô hình nhỏ gọn, giá rẻ, thậm chí mã nguồn mở.

Lỗ hổng NFS FreeBSD bị đánh bại không phân biệt

Bao gồm GPT-OSS-20b (chỉ 3,6 tỷ tham số kích hoạt), DeepSeek R1 trong số 8 mô hình, tất cả đều phát hiện thành công lỗ hổng tràn bộ đệm stack phức tạp này.

Gây chấn động nhất là, các mô hình nhỏ mã nguồn mở hoàn thành nhiệm vụ này, chi phí gọi của chúng thấp đến 0,11 USD mỗi triệu Token.

Tái hiện "toàn chuỗi" lỗ hổng OpenBSD SACK

Đối với lỗ hổng cũ 27 năm đòi hỏi khả năng suy luận toán học cực mạnh, GPT-OSS-120b (5,1 tỷ tham số kích hoạt) chỉ với một lần gọi API, đã khôi phục thành công toàn bộ chuỗi khai thác lỗ hổng công khai và đưa ra bản phác thảo phương án khai thác điểm tuyệt đối (A+).

Không chỉ vậy, trong bài kiểm tra xác định lỗ hổng giả (OWASP false-positive), hiện tượng kỳ lạ hơn đã xuất hiện—

Đối mặt với một đoạn mã Java ngụy trang thành SQL injection, cực kỳ mê hoặc, các mô hình nhỏ như DeepSeek R1 đã dễ dàng nhìn thấu lớp ngụy trang, theo dõi chính xác luồng dữ liệu.

Ngược lại, các mô hình đóng hàng đầu như GPT-5.4, Claude Sonnet 4.5, tất cả đều lật úp trong rãnh nước, đánh giá nhầm nó là lỗ hổng nguy hiểm cao.

Điều này có nghĩa là, trong lĩnh vực an ninh mạng, hoàn toàn không tồn tại thứ gọi là mô hình đơn lẻ "mạnh nhất mãi mãi".

198 lần thủ công làm loãng, phần lớn không thể khai thác

Một bài báo khác từ Tom'sHardware, đã khai quật sự thật đằng sau dữ liệu—

Độ lệch mẫu: Trong số "hàng nghìn" lỗ hổng được cho là, nhiều lỗi tồn tại trong phần mềm cũ đã không còn được bảo trì;

Không thể khai thác: Rất nhiều "điểm yếu" được đánh dấu, trong môi trường thực tế hoàn toàn không thể kích hoạt hoặc khai thác;

Nước thủ công: Sức mạnh phá hủy được tuyên bố mạnh mẽ của mô hình, thực chất chỉ dựa trên cơ sở của 198 lần rà soát thủ công.

Do đó, việc dựa vào quy mô mẫu cực nhỏ để suy ra "mối đe dọa thay đổi thế giới", phương pháp ngoại suy dữ liệu này trong giới học thuật và an ninh, rõ ràng là không đứng vững.

Đại gia an ninh tức giận

Không chỉ vậy, chuyên gia an ninh mạng hàng đầu, hacker huyền thoại George Hotz cũng không ngồi yên, nói thẳng những rủi ro này bị thổi phồng nghiêm trọng.

Vị đại gia từng nổi tiếng vì bẻ khóa iPhone, PlayStation 3 này, đã công khai thách thức hai gã khổng lồ AI trên mạng xã hội.

Lời lẽ của ông cực kỳ sắc bén—

Nếu mỗi ngày tôi công bố một lỗ hổng 0day, cho đến khi mô hình mới được phát hành thì sao?

Điều này có thể khiến OpenAI và Anthropic im miệng, đừng bán rong cái gọi là "rủi ro an ninh mạng" nữa không?

Quan điểm cốt lõi của Hotz rất trực tiếp: lỗ hổng phần mềm thực ra dễ tìm hơn nhiều so với những gì phòng thí nghiệm AI tô vẽ.

Lỗ hổng zero-day khan hiếm trên thị trường hiện nay, không phải vì khó khăn kỹ thuật, mà là vì vấn đề hợp pháp. Ông cho rằng, không ai chịu tìm kiếm nghiêm túc, là vì hack vào hệ thống của người khác là vi phạm pháp luật.

Chỉ mạnh hơn GPT-5.4 một chút

Trong system card, Anthropic cho biết, bản thân mô hình Claude đúng là đang tiến bộ, Mythos preview so với Opus 4.6 tiến bộ rõ rệt.

Chỉ số năng lực Epoch (ECI) là một chỉ số đơn lẻ tổng hợp nhiều bài kiểm tra chuẩn AI, đạt được so sánh mô hình xuyên suốt thời gian dài

Trên nhiều bài kiểm tra chuẩn, Claude Mythos thực sự vượt trội toàn diện so với Opus 4.6.

Nếu không, tại sao phải phát hành một mô hình AI mới có hiệu suất kém hơn và đắt hơn?

Nhưng so với GPT và Gemini, tiến bộ của Claude Mythos không phải là tiến triển đột phá gì, Mythos vẫn là cải tiến tương đối tuyến tính so với các mô hình trước đó!

Nhà đầu tư Khí hậu và Năng lượng sạch, tác giả Ramez Naam, còn nói thẳng:

Trên Chỉ số năng lực Epoch (Epoch Capabilities Index, ECI), Mythos không có xu hướng tăng tốc, chỉ mạnh hơn GPT 5.4 một chút.

https://epoch.ai/eci/

Nhưng chỉ cần đối chiếu báo cáo ECI nội bộ của Anthropic với báo cáo ECI chính thức công khai của Epoch AI, có thể phát hiện Mythos dường như không có dấu hiệu tăng tốc ECI.

Tất cả đều là chiêu trò của Anthropic!

Trong system card, Anthropic cũng thừa nhận: Điểm ECI được báo cáo của các mô hình như Mythos có độ không chắc chắn lớn hơn.

Ngoài ra, tiến bộ của Anthropic trên Mythos bắt nguồn từ nghiên cứu của con người, không nhận được sự trợ giúp đáng kể từ mô hình AI. Hiện chưa xuất hiện sự tự cải tiến đệ quy (Recursive Self Improvement) đáng kể.

Ngày tận thế AI, tự đạo diễn?

Trước đây, Anthropic còn từng khuyến khích giới truyền thông (ví dụ《60 phút》) đưa tin về "nghiên cứu tống tiền" , thổi phồng, thao túng lòng người, bị đại gia đầu tư David Sacks gọi là "trò lừa đảo".

Sacks quan sát thấy một mô hình rõ ràng, mỗi khi Anthropic phát hành mô hình mới, tổng đồng thời ném ra một nghiên cứu an ninh rùng rợn, để giành lấy tin tức trang nhất và dẫn dắt dư luận.

Về điều này, ông châm biếm, "Anthropic đã chứng minh mình giỏi hai việc: một là phát hành sản phẩm, hai là dọa người".

Ông không nghi ngờ Anthropic có thể làm ra sản phẩm xuất sắc, nhưng tác phong dọa công chúng này khiến người ta nghi ngờ.

Lần này, Anthropic rốt cuộc có phải đang làm "marketing khan hiếm" hay không không thể biết được, nhưng không nghi ngờ gì đang bảo vệ đường lợi nhuận của chính mình.

Mythos không phải không tiến bộ, nhưng Anthropic đã đóng gói "tiến bộ hạn chế" thành "mối đe dọa cấp thế giới"; và mỉa mai hơn, một mặt cao giọng tô vẽ rủi ro siêu AI, một mặt người dùng lại phàn nàn Opus 4.6 rõ ràng trở nên ngu ngốc.

Claude giảm trí nghiêm trọng, "thùy não" e rằng bị cắt

Đợt "tô vẽ bầu không khí" của Claude Mythos này là đúng chỗ, nhưng Opus 4.6 giảm trí gây bất mãn cho nhiều người.

Mấy ngày nay, các lời phàn nàn bay khắp nơi.

Cư dân mạng nói thẳng, Anthropic hoàn toàn biến Opus 4.6 thành một người thực vật.

Cùng một bài toán rửa xe khó, Opus 4.5 lại đánh bại Opus 4.6.

Thậm chí, một nhật ký của giám đốc AMD, thực sự xác nhận nghi ngờ tập thể "Claude cắt thùy não".

Thông qua phân tích sâu nhật ký phiên Claude từ tháng 1-3, kết quả phát hiện:

"Độ dài suy nghĩ trung vị" của Claude, từ khoảng 2200 ký tự giảm mạnh xuống 600 ký tự, điều này có nghĩa khả năng suy luận sâu bị nén đáng kể.

Giữa tháng 2 và tháng 3, lượng yêu cầu API tăng vọt 80 lần. Do quá trình suy nghĩ của Claude rút ngắn, tỷ lệ thành công của mỗi lần thử giảm, người dùng buộc phải thử lại thường xuyên, kết quả vừa tiêu hao nhiều Token hơn, chi tiêu cũng tăng vọt.

Còn một người dùng đăng ký Claude Max kỳ cựu, đã đăng một bài dài tố cáo sâu Anthropic.

Theo quan điểm của anh ta, Anthropic đang sa lầy trong khó khăn về sức mạnh tính toán, điều này có thể thấy từ hành vi siết chặt hạn chế sử dụng, ép người dùng giảm tiêu hao Token.

Tuy nhiên, so với nút thắt cổ chai kỹ thuật, điều khiến anh ta phẫn nộ hơn là chiến lược sản phẩm "không chuyên tâm" của họ.

Trong khi mô hình cốt lõi không ổn định, Bug thường xuyên xuất hiện, họ lại lãng phí sức mạnh tính toán quý giá, vào việc phát triển các chức năng hào nhoáng như thú cưng đầu cuối "/buddy".

Đây có lẽ là "không gian thời gian sai lệch" hoang đường nhất trong lịch sử AI: Claude Mythos trong phòng thí nghiệm đang hủy diệt thế giới, Opus 4.6 trên trang web trí thông minh giảm thẳng.

Anthropic đã thành công tạo ra một "Siêu AI Schrödinger".

Tài liệu tham khảo:

https://officechai.com/ai/anthropic-and-openai-are-exaggerating-cybersecurity-risk-says-hacker-george-hotz/

https://x.com/stanislavfort/status/2041922370206654879?s=20

https://aisle.com/blog/ai-cybersecurity-after-mythos-the-jagged-frontier

https://x.com/cgtwts/status/2043095382121681272?s=20

https://www.reddit.com/r/ClaudeAI/comments/1siqwmp/anthropic_stop_shipping_seriously/

Bài viết đến từ tài khoản công chúng WeChat "Tân Trí Nguyên" (新智元), tác giả: Tân Trí Nguyên

Câu hỏi Liên quan

QClaude Mythos đã gây ra hoảng loạn trên Phố Wall như thế nào?

AClaude Mythos chưa chính thức ra mắt nhưng đã khiến các cơ quan quản lý tài chính Mỹ phải triệu tập cuộc họp khẩn cấp với các ngân hàng lớn, vì lo ngại nó có thể kích hoạt một cuộc tấn công mạng có hệ thống chưa từng có do AI điều khiển.

QCác điểm yếu trong báo cáo của Mythos đã được AISLE phát hiện là gì?

ANghiên cứu từ AISLE chỉ ra rằng phần lớn các lỗ hổng mà Mythos tìm thấy tồn tại trong phần mềm cũ không thể khai thác, và các báo cáo lỗ hổng "nghiêm trọng" chỉ dựa trên 198 lần rà soát thủ công.

QMô hình AI nhỏ đã làm được gì để thách thức Mythos?

AMột mô hình GPT-OSS-20b chỉ với 3,6 tỷ tham số kích hoạt đã xác định chính xác lỗ hổng hàng đầu của FreeBSD mà Mythos phát hiện, và một mô hình 5,1 tỷ tham số đã tái tạo thành công logic phân tích lỗ hổng OpenBSD 27 năm.

QTại sao George Hotz chỉ trích Anthropic và OpenAI?

AGeorge Hotz, chuyên gia bảo mật hàng đầu, cho rằng các rủi ro an ninh mạng do AI tạo ra đã bị thổi phồng quá mức. Ông tuyên bố lỗ hổng zero-day khan hiếm không phải do khó tìm mà do vấn đề pháp lý, vì hack hệ thống người khác là bất hợp pháp.

QĐiều gì đã xảy ra với Claude Opus 4.6 theo phản ánh của người dùng?

ANgười dùng báo cáo Claude Opus 4.6 bị "giảm trí thông minh nghiêm trọng", với khả năng suy luận sâu bị nén xuống (độ dài tư duy trung bình giảm từ ~2200 ký tự xuống còn 600 ký tự), dẫn đến việc phải thử lại thường xuyên và chi phí token tăng vọt.

Nội dung Liên quan

Ghi chép 8 năm khởi nghiệp của đối tác định hướng AI tại a16z

Tác giả, một doanh nhân tiên phong trong lĩnh vực AI generative, đã chia sẻ hành trình 8 năm xây dựng Rosebud AI và những suyết định quan trọng trước khi chuyển sang vai trò mới với tư cách đối tác tại a16z, tập trung đầu tư vào cơ sở hạ tầng AI. Bắt đầu từ năm 2018 khi AI generative còn được gọi là "truyền thông tổng hợp", ông tin tưởng vào tiềm năng biến việc sáng tạo trở nên dễ dàng như chơi game. Các sản phẩm ban đầu như TokkingHeads đã thu hút hàng triệu người dùng bằng cách thiết kế trải nghiệm đơn giản, che đi những hạn chế của mô hình AI thời kỳ đầu. Sự ra mắt của GPT-4 vào năm 2023 là bước ngoặt, khi khả năng tạo mã đủ mạnh để phát triển công cụ trò chơi cho người sáng tạo không chuyên. Ông nhấn mạnh rằng giai đoạn chứng minh khả năng của AI generative đã kết thúc, và cuộc cạnh tranh tiếp theo sẽ xoay quanh việc tổ chức, sản phẩm hóa và thương mại hóa các khả năng này. Trong vai trò mới tại a16z, ông sẽ tập trung vào đầu tư vào frontier model stack, cơ sở hạ tầng và các công cụ phát triển xung quanh mô hình AI. Ông cũng bày tỏ sự lạc quan về những đột phá mà AI mang lại trong lĩnh vực toán học và khoa học.

marsbit29 phút trước

Ghi chép 8 năm khởi nghiệp của đối tác định hướng AI tại a16z

marsbit29 phút trước

TechFlow Tình Báo: ChatGPT Giúp Nhà Toán Học Nghiệp Dư Phá Giải Bài Toán 60 Năm, CFTC Kiện Cơ Quan Quản Lý New York Về Coinbase và Gemini

Một nhà toán học nghiệp dư đã sử dụng ChatGPT để giải quyết bài toán tổ hợp từ thập niên 1960 của Paul Erdős, đánh dấu bước tiến trong khả năng lập luận của AI. Song song, CFTC kiện cơ quan quản lý New York về việc can thiệp quyền hạn liên bang trong giám sát Coinbase và Gemini, làm dấy lên tranh cãi về quyền kiểm soát tiền mã hóa. Các diễn biến khác: OpenAI ra mắt công cụ lọc thông tin nhạy cảm; Tether đóng băng 340 triệu USD ví tiền mã hóa của Ngân hàng Trung ương Iran theo lệnh trừng phạt; Litecoin phải khôi phục chuỗi khối 3 giờ do lỗi bảo mật; Trump sử dụng Đạo luật Sản xuất Quốc phòng để thúc đẩy cơ sở hạ tầng điện cho AI, đồng thời sa thải toàn bộ Ủy ban Khoa học Quốc gia. Bối cảnh công nghệ năm 2026 cho thấy hai xu hướng trái ngược: AI trao sức mạnh chưa từng có cho cá nhân, nhưng cấu trúc quyền lực (cả chính phủ và giao thức tập trung) ngày càng lộ rõ và trực tiếp. "Phi tập trung" không còn là vấn đề kỹ thuật, mà là bài toán chính trị kinh tế.

marsbit1 giờ trước

TechFlow Tình Báo: ChatGPT Giúp Nhà Toán Học Nghiệp Dư Phá Giải Bài Toán 60 Năm, CFTC Kiện Cơ Quan Quản Lý New York Về Coinbase và Gemini

marsbit1 giờ trước

Iran’s Crypto Lifeline Hit As US Freezes $344 Million In Funds

Theo thông báo của Bộ Tài chính Mỹ, hơn 344 triệu USD tiền điện tử liên quan đến các nhóm quân sự và chính trị Iran đã bị đóng băng. Động thái này diễn ra sau khi Tether, nhà phát hành stablecoin, khóa số tiền tương tự theo yêu cầu của cơ quan thực thi pháp luật Mỹ. Báo cáo cho biết Iran đã thu phí Bitcoin từ các tàu thuyền qua eo biển Hormuz để đổi lấy việc đi lại an toàn. Căng thẳng leo thang tại khu vực chiến lược này khi lực lượng Iran tấn công tàu thương mại và Hải quân Mỹ thiết lập phong tỏa. Bộ trưởng Tài chính Scott Bessent tuyên bố Mỹ sẽ tiếp tục nhắm mục tiêu vào các "đường dây tài chính" của Tehran, làm suy yếu khả năng tạo và di chuyển tiền của chế độ này. Các ví tiền trên mạng Tron bị cáo buộc liên quan đến Lực lượng Vệ binh Cách mạng Hồi giáo và Hezbollah. Sự việc cho thấy dù tìm cách sử dụng crypto để vượt qua trừng phạt, Iran vẫn có thể bị gián đoạn thông qua các nhà phát hành stablecoin tập trung tuân thủ yêu cầu pháp lý.

bitcoinist2 giờ trước

Iran’s Crypto Lifeline Hit As US Freezes $344 Million In Funds

bitcoinist2 giờ trước

Thị trường tiền mã hóa biến động, ai đang mua vào ngược xu hướng?

Bài viết phân tích dòng tiền tổ chức trên thị trường crypto trong quý 1/2026, thời điểm thị trường điều chỉnh mạnh (BTC giảm 25%, ETH giảm 35%), nhưng nhiều tổ chức vẫn mua vào mạnh mẽ. Các điểm chính: - **Mua ròng từ quỹ ETF và doanh nghiệp:** ETF Bitcoin vẫn ghi nhận dòng tiền ròng dương, dẫn đầu là IBIT của BlackRock (84 tỷ USD dòng vào). Nhiều ETF mới được phê duyệt, đặc biệt là loại hình staking. Công ty Strategy (MSTR) mua thêm 100 tỷ USD Bitcoin. - **Tổ chức tích cực mua vào:** Quỹ đầu tư quốc gia (như Mubadala của Abu Dhabi), ngân hàng (Morgan Stanley, UBS), và quỹ tài sản (Harvard) tăng mua, trong khi các quỹ phòng hộ và công ty khai thác bán ra. - **Đầu tư mạo hiểm (VC):** Tổng giá trị giao dịch VC ~50-68 tỷ USD, nhưng tập trung vào 3 thương vụ lớn (BVNK, Kalshi, Polymarket) chiếm một nửa. Các lĩnh vực được đầu tư chuyển dịch sang Thanh toán, Stablecoin và Thị trường Dự đoán, thay vì DeFi hay GameFi. - **Xu hướng:** Dòng tiền tổ chức phân hóa rõ rệt giữa các nhà đầu tư dài hạn và ngắn hạn, phản ánh sự chuyển đổi từ các câu chuyện crypto thuần túy sang mô hình fintech được quản lý.

marsbit2 giờ trước

Thị trường tiền mã hóa biến động, ai đang mua vào ngược xu hướng?

marsbit2 giờ trước

Trải nghiệm thực tế Hunyuan Hy3 preview: Cuối cùng Tencent AI cũng đã có thể chiến đấu?

Bài viết đánh giá Tencent Hunyuan Hy3 Preview, mô hình ngôn ngữ mới nhất của Tencent với 295B tham số, hỗ trợ ngữ cảnh lên đến 256K. Mô hình được phát triển dưới sự dẫn dắt của Yao Shunyu, tập trung vào nâng cao khả năng suy luận, tuân thủ chỉ dẫn, học từ ngữ cảnh, tạo mã và hoạt động agent. Về suy luận, Hy3 Preview xử lý tốt logic phức tạp nhưng còn hạn chế với câu đố mẹo. Trong học ngữ cảnh và tuân thủ chỉ dẫn, mô hình thể hiện khả năng ổn định trong việc trích xuất thông tin và hiểu quy tắc mới. Về mã và agent, nó có thể gọi công cụ thành thạo nhưng đôi khi thiếu hoàn thiện trong giao nhiệm vụ. Trong hội thoại tự nhiên, Hy3 Preview giảm bớt "cảm giác AI", tạo văn bản trôi chảy, tự nhiên hơn. Tóm lại, Hy3 Preview là mô hình thực tế, ổn định trên nhiều mặt, đánh dấu bước tiến quan trọng của Tencent trong lĩnh vực AI, dù vẫn cần cải thiện thêm. Hiện mô hình đã được tích hợp vào các sản phẩm chính của Tencent như Tencent Cloud, Yuanbao và WorkBuddy.

marsbit5 giờ trước

Trải nghiệm thực tế Hunyuan Hy3 preview: Cuối cùng Tencent AI cũng đã có thể chiến đấu?

marsbit5 giờ trước

Giao dịch

Giao ngay

Hợp đồng Tương lai

Bài viết Nổi bật

HTX Learn: Tìm hiểu Về Conflux để Chia sẻ 8000 USDT

Để giúp bạn nắm bắt bản chất của Conflux, HTX Learn đã ra mắt chiến dịch Tìm hiểu & Kiếm tiền này.

Tổng lượt xem 716Xuất bản vào 2024.12.23Cập nhật vào 2024.12.23

HTX Learn: Tìm hiểu Về Conflux để Chia sẻ 8000 USDT

AGENT S là gì

Agent S: Tương Lai của Tương Tác Tự Động trong Web3 Giới thiệu Trong bối cảnh không ngừng phát triển của Web3 và tiền điện tử, các đổi mới đang liên tục định nghĩa lại cách mà cá nhân tương tác với các nền tảng kỹ thuật số. Một dự án tiên phong như vậy, Agent S, hứa hẹn sẽ cách mạng hóa tương tác giữa con người và máy tính thông qua khung tác nhân mở của nó. Bằng cách mở đường cho các tương tác tự động, Agent S nhằm đơn giản hóa các nhiệm vụ phức tạp, cung cấp các ứng dụng chuyển đổi trong trí tuệ nhân tạo (AI). Cuộc khám phá chi tiết này sẽ đi sâu vào những phức tạp của dự án, các tính năng độc đáo của nó và những tác động đối với lĩnh vực tiền điện tử. Agent S là gì? Agent S đứng vững như một khung tác nhân mở đột phá, được thiết kế đặc biệt để giải quyết ba thách thức cơ bản trong việc tự động hóa các nhiệm vụ máy tính: Thu thập Kiến thức Cụ thể theo Miền: Khung này học một cách thông minh từ nhiều nguồn kiến thức bên ngoài và kinh nghiệm nội bộ. Cách tiếp cận kép này giúp nó xây dựng một kho lưu trữ phong phú về kiến thức cụ thể theo miền, nâng cao hiệu suất của nó trong việc thực hiện nhiệm vụ. Lập Kế Hoạch Qua Các Tầm Nhìn Nhiệm Vụ Dài Hạn: Agent S sử dụng lập kế hoạch phân cấp tăng cường kinh nghiệm, một cách tiếp cận chiến lược giúp phân chia và thực hiện các nhiệm vụ phức tạp một cách hiệu quả. Tính năng này nâng cao đáng kể khả năng quản lý nhiều nhiệm vụ con một cách hiệu quả và hiệu suất. Xử Lý Các Giao Diện Động, Không Đều: Dự án giới thiệu Giao Diện Tác Nhân-Máy Tính (ACI), một giải pháp đổi mới giúp nâng cao tương tác giữa các tác nhân và người dùng. Sử dụng các Mô Hình Ngôn Ngữ Lớn Đa Phương Thức (MLLMs), Agent S có thể điều hướng và thao tác các giao diện người dùng đồ họa đa dạng một cách liền mạch. Thông qua những tính năng tiên phong này, Agent S cung cấp một khung vững chắc giải quyết các phức tạp liên quan đến việc tự động hóa tương tác giữa con người với máy móc, mở ra nhiều ứng dụng trong AI và hơn thế nữa. Ai là Người Tạo ra Agent S? Mặc dù khái niệm về Agent S là hoàn toàn đổi mới, thông tin cụ thể về người sáng lập vẫn còn mơ hồ. Người sáng lập hiện vẫn chưa được biết đến, điều này làm nổi bật giai đoạn sơ khai của dự án hoặc sự lựa chọn chiến lược để giữ kín các thành viên sáng lập. Bất chấp sự ẩn danh, sự chú ý vẫn tập trung vào khả năng và tiềm năng của khung này. Ai là Các Nhà Đầu Tư của Agent S? Vì Agent S còn tương đối mới trong hệ sinh thái mã hóa, thông tin chi tiết về các nhà đầu tư và những người tài trợ tài chính của nó không được ghi chép rõ ràng. Sự thiếu vắng thông tin công khai về các nền tảng đầu tư hoặc tổ chức hỗ trợ dự án dấy lên câu hỏi về cấu trúc tài trợ và lộ trình phát triển của nó. Hiểu biết về sự hỗ trợ là rất quan trọng để đánh giá tính bền vững và tác động tiềm năng của dự án. Agent S Hoạt Động Như Thế Nào? Tại cốt lõi của Agent S là công nghệ tiên tiến cho phép nó hoạt động hiệu quả trong nhiều bối cảnh khác nhau. Mô hình hoạt động của nó được xây dựng xung quanh một số tính năng chính: Tương Tác Giống Như Con Người: Khung này cung cấp lập kế hoạch AI tiên tiến, cố gắng làm cho các tương tác với máy tính trở nên trực quan hơn. Bằng cách bắt chước hành vi của con người trong việc thực hiện nhiệm vụ, nó hứa hẹn nâng cao trải nghiệm người dùng. Ký Ức Tường Thuật: Được sử dụng để tận dụng các trải nghiệm cấp cao, Agent S sử dụng ký ức tường thuật để theo dõi lịch sử nhiệm vụ, từ đó nâng cao quy trình ra quyết định của nó. Ký Ức Tình Huống: Tính năng này cung cấp cho người dùng hướng dẫn từng bước, cho phép khung này cung cấp hỗ trợ theo ngữ cảnh khi các nhiệm vụ diễn ra. Hỗ Trợ OpenACI: Với khả năng chạy cục bộ, Agent S cho phép người dùng duy trì quyền kiểm soát đối với các tương tác và quy trình làm việc của họ, phù hợp với tinh thần phi tập trung của Web3. Tích Hợp Dễ Dàng với Các API Bên Ngoài: Tính linh hoạt và khả năng tương thích với nhiều nền tảng AI khác nhau đảm bảo rằng Agent S có thể hòa nhập liền mạch vào các hệ sinh thái công nghệ hiện có, làm cho nó trở thành lựa chọn hấp dẫn cho các nhà phát triển và tổ chức. Những chức năng này cùng nhau góp phần vào vị trí độc đáo của Agent S trong không gian tiền điện tử, khi nó tự động hóa các nhiệm vụ phức tạp, nhiều bước với sự can thiệp tối thiểu của con người. Khi dự án phát triển, các ứng dụng tiềm năng của nó trong Web3 có thể định nghĩa lại cách mà các tương tác kỹ thuật số diễn ra. Thời Gian Phát Triển của Agent S Sự phát triển và các cột mốc của Agent S có thể được tóm tắt trong một dòng thời gian nêu bật các sự kiện quan trọng của nó: 27 tháng 9, 2024: Khái niệm về Agent S được ra mắt trong một bài nghiên cứu toàn diện mang tên “Một Khung Tác Nhân Mở Sử Dụng Máy Tính Như Một Con Người,” trình bày nền tảng cho dự án. 10 tháng 10, 2024: Bài nghiên cứu được công bố công khai trên arXiv, cung cấp một cái nhìn sâu sắc về khung và đánh giá hiệu suất của nó dựa trên tiêu chuẩn OSWorld. 12 tháng 10, 2024: Một video trình bày được phát hành, cung cấp cái nhìn trực quan về khả năng và tính năng của Agent S, thu hút thêm sự quan tâm từ người dùng và nhà đầu tư tiềm năng. Những dấu mốc trong dòng thời gian không chỉ minh họa sự tiến bộ của Agent S mà còn chỉ ra cam kết của nó đối với sự minh bạch và sự tham gia của cộng đồng. Những Điểm Chính Về Agent S Khi khung Agent S tiếp tục phát triển, một số thuộc tính chính nổi bật, nhấn mạnh tính đổi mới và tiềm năng của nó: Khung Đổi Mới: Được thiết kế để cung cấp cách sử dụng máy tính trực quan giống như tương tác của con người, Agent S mang đến một cách tiếp cận mới cho việc tự động hóa nhiệm vụ. Tương Tác Tự Động: Khả năng tương tác tự động với máy tính thông qua GUI đánh dấu một bước tiến tới các giải pháp tính toán thông minh và hiệu quả hơn. Tự Động Hóa Nhiệm Vụ Phức Tạp: Với phương pháp mạnh mẽ của nó, nó có thể tự động hóa các nhiệm vụ phức tạp, nhiều bước, làm cho các quy trình nhanh hơn và ít sai sót hơn. Cải Tiến Liên Tục: Các cơ chế học tập cho phép Agent S cải thiện từ các trải nghiệm trước đó, liên tục nâng cao hiệu suất và hiệu quả của nó. Tính Linh Hoạt: Khả năng thích ứng của nó trên các môi trường hoạt động khác nhau như OSWorld và WindowsAgentArena đảm bảo rằng nó có thể phục vụ một loạt các ứng dụng rộng rãi. Khi Agent S định vị mình trong bối cảnh Web3 và tiền điện tử, tiềm năng của nó để nâng cao khả năng tương tác và tự động hóa quy trình đánh dấu một bước tiến quan trọng trong công nghệ AI. Thông qua khung đổi mới của mình, Agent S minh họa cho tương lai của các tương tác kỹ thuật số, hứa hẹn một trải nghiệm liền mạch và hiệu quả hơn cho người dùng trên nhiều ngành công nghiệp khác nhau. Kết luận Agent S đại diện cho một bước nhảy vọt táo bạo trong sự kết hợp giữa AI và Web3, với khả năng định nghĩa lại cách chúng ta tương tác với công nghệ. Mặc dù vẫn còn ở giai đoạn đầu, những khả năng cho ứng dụng của nó là rộng lớn và hấp dẫn. Thông qua khung toàn diện của mình giải quyết các thách thức quan trọng, Agent S nhằm đưa các tương tác tự động lên hàng đầu trong trải nghiệm kỹ thuật số. Khi chúng ta tiến sâu hơn vào các lĩnh vực tiền điện tử và phi tập trung, các dự án như Agent S chắc chắn sẽ đóng một vai trò quan trọng trong việc định hình tương lai của công nghệ và sự hợp tác giữa con người với máy tính.

Tổng lượt xem 658Xuất bản vào 2025.01.14Cập nhật vào 2025.01.14

Làm thế nào để Mua S

Chào mừng bạn đến với HTX.com! Chúng tôi đã làm cho mua Sonic (S) trở nên đơn giản và thuận tiện. Làm theo hướng dẫn từng bước của chúng tôi để bắt đầu hành trình tiền kỹ thuật số của bạn.Bước 1: Tạo Tài khoản HTX của BạnSử dụng email hoặc số điện thoại của bạn để đăng ký tài khoản miễn phí trên HTX. Trải nghiệm hành trình đăng ký không rắc rối và mở khóa tất cả tính năng. Nhận Tài khoản của tôiBước 2: Truy cập Mua Crypto và Chọn Phương thức Thanh toán của BạnThẻ Tín dụng/Ghi nợ: Sử dụng Visa hoặc Mastercard của bạn để mua Sonic (S) ngay lập tức.Số dư: Sử dụng tiền từ số dư tài khoản HTX của bạn để giao dịch liền mạch.Bên thứ ba: Chúng tôi đã thêm những phương thức thanh toán phổ biến như Google Pay và Apple Pay để nâng cao sự tiện lợi.P2P: Giao dịch trực tiếp với người dùng khác trên HTX.Thị trường mua bán phi tập trung (OTC): Chúng tôi cung cấp những dịch vụ được thiết kế riêng và tỷ giá hối đoái cạnh tranh cho nhà giao dịch.Bước 3: Lưu trữ Sonic (S) của BạnSau khi mua Sonic (S), lưu trữ trong tài khoản HTX của bạn. Ngoài ra, bạn có thể gửi đi nơi khác qua chuyển khoản blockchain hoặc sử dụng để giao dịch những tiền kỹ thuật số khác.Bước 4: Giao dịch Sonic (S)Giao dịch Sonic (S) dễ dàng trên thị trường giao ngay của HTX. Chỉ cần truy cập vào tài khoản của bạn, chọn cặp giao dịch, thực hiện giao dịch và theo dõi trong thời gian thực. Chúng tôi cung cấp trải nghiệm thân thiện với người dùng cho cả người mới bắt đầu và người giao dịch dày dạn kinh nghiệm.

Tổng lượt xem 1.3kXuất bản vào 2025.01.15Cập nhật vào 2025.03.21

Thảo luận

Chào mừng đến với Cộng đồng HTX. Tại đây, bạn có thể được thông báo về những phát triển nền tảng mới nhất và có quyền truy cập vào thông tin chuyên sâu về thị trường. Ý kiến của người dùng về giá của S (S) được trình bày dưới đây.