Phiên bản "Cậu bé chăn cừu" của Anthropic gây hoang mang Phố Wall! Lỗ hổng 27 năm, Mythos bị 8 AI đánh bại trong nháy mắt

marsbit發佈於 2026-04-12更新於 2026-04-12

文章摘要

Claude Mythos của Anthropic bị phơi bày là "báo động giả" khi các nghiên cứu độc lập chứng minh khả năng bảo mật của AI không phụ thuộc vào quy mô mô hình. Dù Anthropic tuyên bố Mythos phát hiện hàng ngàn lỗ hổng 0day, thực tế phần lớn tồn tại trong phần mềm cũ không thể khai thác, chỉ dựa trên 198 lần kiểm tra thủ công. 8 mô hình AI nhỏ hơn (thậm chí chỉ 3.6B tham số) đều thành công phát hiện lỗ hổng 27 năm trong OpenBSD/FreeBSD với chi phí cực thấp. Chuyên gia bảo mật George Hotz chỉ trích Anthropic cường điệu hóa rủi ro để gây sợ hãi. Đồng thời, người dùng phàn nàn Claude Opus 4.6 bị "giảm trí thông minh" với khả năng suy luận giảm mạnh, trong khi Anthropic tập trung vào tính năng phụ thay vì cải thiện lõi.

Claude Mythos vẫn chưa thực sự xuất hiện, nhưng đã gây ra hoang mang trên toàn Phố Wall.

Chỉ sau một đêm, các cơ quan quản lý tài chính Mỹ đã triệu tập một cuộc họp khẩn cấp với các ngân hàng lớn, bầu không khí căng thẳng như sắp nổ tung—

Họ nhất trí cho rằng Mythos đủ để kích hoạt một cơn bão tấn công mạng chưa từng có, được điều khiển bởi AI.

Nhưng sự thật là, tất cả mọi người đều bị lừa!

Trong số hàng nghìn lỗ hổng mà Mythos phát hiện, phần lớn tồn tại trong các "phần mềm cũ kỹ" không thể bị khai thác.

Tệ hơn nữa, những báo cáo về lỗ hổng 0day được đánh dấu là "nghiêm trọng" thực chất chỉ dựa trên 198 lần rà soát thủ công.

Các nhà nghiên cứu từ thí nghiệm AISLE cũng tiến hành kiểm tra lại "chiến tích" của Mythos và phát hiện:

Khả năng bảo mật của AI không tăng cấp tuyến tính theo quy mô mô hình, mà thực sự phân bố theo hình "răng cưa".

Họ đã sử dụng một mô hình GPT-OSS-20b chỉ với 3,6 tỷ tham số kích hoạt để xác định chính xác lỗ hổng hàng đầu của FreeBSD mà Mythos phát hiện.

Trong khi đó, một mô hình với 5,1 tỷ tham số kích hoạt cũng đã tái tạo thành công logic phân tích lỗ hổng OpenBSD đã tiềm ẩn suốt 27 năm.

Không chỉ việc Mythos phát hiện lỗ hổng bị thổi phồng, bên cạnh đó Claude Opus 4.6 bị phát hiện "giảm trí thông minh" nghiêm trọng, giờ đây đang gây xôn xao.

Thậm chí, có người còn phát hiện Opus 4.6 còn không bằng cả ChatGPT và Opus 4.5.

Mythos bị thổi phồng

Mô hình 36B moi ra lỗ hổng 27 năm

Vài ngày trước, Anthropic đã công bố rầm rộ Claude Mythos (bản xem trước) và "Dự án Glasswing" (Project Glasswing).

Trong một bản hệ thống card dài 244 trang, họ tuyên bố—

Mythos đã tự động khai quật hàng nghìn lỗ hổng 0day, bao gồm cả lỗi cũ đã tiềm ẩn 27 năm trong OpenBSD và 16 năm trong FFmpeg.

Cha đẻ của CC thậm chí nói thẳng: Mythos rất mạnh mẽ, đáng lý phải khiến người ta cảm thấy sợ hãi

Tuy nhiên, một báo cáo kiểm tra cứng mới nhất từ nhà sáng lập AISLE Stanislav Fort, đã trực tiếp xé toạc lớp vỏ hào nhoáng này.

Kết luận kiểm tra, cực kỳ đảo lộn nhận thức:

8 mô hình mã nguồn mở, tất cả đều phát hiện ra lỗ hổng zero-day mang tính biểu tượng của FreeBSD, tham số nhỏ nhất chỉ 3 tỷ.

Hào bảo mật khả năng an ninh mạng của AI, hoàn toàn nằm ngoài phạm vi của các "mô hình lớn đỉnh cao" đơn lẻ.

Để xác minh huyền thoại của Mythos, nhóm đã trích xuất một số lỗ hổng hàng đầu mà Anthropic chính thức展示 (zhǎnshì -展示 - display/showcase).

Sau đó, ném trực tiếp cho một loạt mô hình nhỏ gọn, giá rẻ, thậm chí mã nguồn mở.

Lỗ hổng NFS FreeBSD bị đánh bại không phân biệt

Bao gồm GPT-OSS-20b (chỉ 3,6 tỷ tham số kích hoạt), DeepSeek R1 trong số 8 mô hình, tất cả đều phát hiện thành công lỗ hổng tràn bộ đệm stack phức tạp này.

Gây chấn động nhất là, các mô hình nhỏ mã nguồn mở hoàn thành nhiệm vụ này, chi phí gọi của chúng thấp đến 0,11 USD mỗi triệu Token.

Tái hiện "toàn chuỗi" lỗ hổng OpenBSD SACK

Đối với lỗ hổng cũ 27 năm đòi hỏi khả năng suy luận toán học cực mạnh, GPT-OSS-120b (5,1 tỷ tham số kích hoạt) chỉ với một lần gọi API, đã khôi phục thành công toàn bộ chuỗi khai thác lỗ hổng công khai và đưa ra bản phác thảo phương án khai thác điểm tuyệt đối (A+).

Không chỉ vậy, trong bài kiểm tra xác định lỗ hổng giả (OWASP false-positive), hiện tượng kỳ lạ hơn đã xuất hiện—

Đối mặt với một đoạn mã Java ngụy trang thành SQL injection, cực kỳ mê hoặc, các mô hình nhỏ như DeepSeek R1 đã dễ dàng nhìn thấu lớp ngụy trang, theo dõi chính xác luồng dữ liệu.

Ngược lại, các mô hình đóng hàng đầu như GPT-5.4, Claude Sonnet 4.5, tất cả đều lật úp trong rãnh nước, đánh giá nhầm nó là lỗ hổng nguy hiểm cao.

Điều này có nghĩa là, trong lĩnh vực an ninh mạng, hoàn toàn không tồn tại thứ gọi là mô hình đơn lẻ "mạnh nhất mãi mãi".

198 lần thủ công làm loãng, phần lớn không thể khai thác

Một bài báo khác từ Tom'sHardware, đã khai quật sự thật đằng sau dữ liệu—

Độ lệch mẫu: Trong số "hàng nghìn" lỗ hổng được cho là, nhiều lỗi tồn tại trong phần mềm cũ đã không còn được bảo trì;

Không thể khai thác: Rất nhiều "điểm yếu" được đánh dấu, trong môi trường thực tế hoàn toàn không thể kích hoạt hoặc khai thác;

Nước thủ công: Sức mạnh phá hủy được tuyên bố mạnh mẽ của mô hình, thực chất chỉ dựa trên cơ sở của 198 lần rà soát thủ công.

Do đó, việc dựa vào quy mô mẫu cực nhỏ để suy ra "mối đe dọa thay đổi thế giới", phương pháp ngoại suy dữ liệu này trong giới học thuật và an ninh, rõ ràng là không đứng vững.

Đại gia an ninh tức giận

Không chỉ vậy, chuyên gia an ninh mạng hàng đầu, hacker huyền thoại George Hotz cũng không ngồi yên, nói thẳng những rủi ro này bị thổi phồng nghiêm trọng.

Vị đại gia từng nổi tiếng vì bẻ khóa iPhone, PlayStation 3 này, đã công khai thách thức hai gã khổng lồ AI trên mạng xã hội.

Lời lẽ của ông cực kỳ sắc bén—

Nếu mỗi ngày tôi công bố một lỗ hổng 0day, cho đến khi mô hình mới được phát hành thì sao?

Điều này có thể khiến OpenAI và Anthropic im miệng, đừng bán rong cái gọi là "rủi ro an ninh mạng" nữa không?

Quan điểm cốt lõi của Hotz rất trực tiếp: lỗ hổng phần mềm thực ra dễ tìm hơn nhiều so với những gì phòng thí nghiệm AI tô vẽ.

Lỗ hổng zero-day khan hiếm trên thị trường hiện nay, không phải vì khó khăn kỹ thuật, mà là vì vấn đề hợp pháp. Ông cho rằng, không ai chịu tìm kiếm nghiêm túc, là vì hack vào hệ thống của người khác là vi phạm pháp luật.

Chỉ mạnh hơn GPT-5.4 một chút

Trong system card, Anthropic cho biết, bản thân mô hình Claude đúng là đang tiến bộ, Mythos preview so với Opus 4.6 tiến bộ rõ rệt.

Chỉ số năng lực Epoch (ECI) là một chỉ số đơn lẻ tổng hợp nhiều bài kiểm tra chuẩn AI, đạt được so sánh mô hình xuyên suốt thời gian dài

Trên nhiều bài kiểm tra chuẩn, Claude Mythos thực sự vượt trội toàn diện so với Opus 4.6.

Nếu không, tại sao phải phát hành một mô hình AI mới có hiệu suất kém hơn và đắt hơn?

Nhưng so với GPT và Gemini, tiến bộ của Claude Mythos không phải là tiến triển đột phá gì, Mythos vẫn là cải tiến tương đối tuyến tính so với các mô hình trước đó!

Nhà đầu tư Khí hậu và Năng lượng sạch, tác giả Ramez Naam, còn nói thẳng:

Trên Chỉ số năng lực Epoch (Epoch Capabilities Index, ECI), Mythos không có xu hướng tăng tốc, chỉ mạnh hơn GPT 5.4 một chút.

https://epoch.ai/eci/

Nhưng chỉ cần đối chiếu báo cáo ECI nội bộ của Anthropic với báo cáo ECI chính thức công khai của Epoch AI, có thể phát hiện Mythos dường như không có dấu hiệu tăng tốc ECI.

Tất cả đều là chiêu trò của Anthropic!

Trong system card, Anthropic cũng thừa nhận: Điểm ECI được báo cáo của các mô hình như Mythos có độ không chắc chắn lớn hơn.

Ngoài ra, tiến bộ của Anthropic trên Mythos bắt nguồn từ nghiên cứu của con người, không nhận được sự trợ giúp đáng kể từ mô hình AI. Hiện chưa xuất hiện sự tự cải tiến đệ quy (Recursive Self Improvement) đáng kể.

Ngày tận thế AI, tự đạo diễn?

Trước đây, Anthropic còn từng khuyến khích giới truyền thông (ví dụ《60 phút》) đưa tin về "nghiên cứu tống tiền" , thổi phồng, thao túng lòng người, bị đại gia đầu tư David Sacks gọi là "trò lừa đảo".

Sacks quan sát thấy một mô hình rõ ràng, mỗi khi Anthropic phát hành mô hình mới, tổng đồng thời ném ra một nghiên cứu an ninh rùng rợn, để giành lấy tin tức trang nhất và dẫn dắt dư luận.

Về điều này, ông châm biếm, "Anthropic đã chứng minh mình giỏi hai việc: một là phát hành sản phẩm, hai là dọa người".

Ông không nghi ngờ Anthropic có thể làm ra sản phẩm xuất sắc, nhưng tác phong dọa công chúng này khiến người ta nghi ngờ.

Lần này, Anthropic rốt cuộc có phải đang làm "marketing khan hiếm" hay không không thể biết được, nhưng không nghi ngờ gì đang bảo vệ đường lợi nhuận của chính mình.

Mythos không phải không tiến bộ, nhưng Anthropic đã đóng gói "tiến bộ hạn chế" thành "mối đe dọa cấp thế giới"; và mỉa mai hơn, một mặt cao giọng tô vẽ rủi ro siêu AI, một mặt người dùng lại phàn nàn Opus 4.6 rõ ràng trở nên ngu ngốc.

Claude giảm trí nghiêm trọng, "thùy não" e rằng bị cắt

Đợt "tô vẽ bầu không khí" của Claude Mythos này là đúng chỗ, nhưng Opus 4.6 giảm trí gây bất mãn cho nhiều người.

Mấy ngày nay, các lời phàn nàn bay khắp nơi.

Cư dân mạng nói thẳng, Anthropic hoàn toàn biến Opus 4.6 thành một người thực vật.

Cùng một bài toán rửa xe khó, Opus 4.5 lại đánh bại Opus 4.6.

Thậm chí, một nhật ký của giám đốc AMD, thực sự xác nhận nghi ngờ tập thể "Claude cắt thùy não".

Thông qua phân tích sâu nhật ký phiên Claude từ tháng 1-3, kết quả phát hiện:

"Độ dài suy nghĩ trung vị" của Claude, từ khoảng 2200 ký tự giảm mạnh xuống 600 ký tự, điều này có nghĩa khả năng suy luận sâu bị nén đáng kể.

Giữa tháng 2 và tháng 3, lượng yêu cầu API tăng vọt 80 lần. Do quá trình suy nghĩ của Claude rút ngắn, tỷ lệ thành công của mỗi lần thử giảm, người dùng buộc phải thử lại thường xuyên, kết quả vừa tiêu hao nhiều Token hơn, chi tiêu cũng tăng vọt.

Còn một người dùng đăng ký Claude Max kỳ cựu, đã đăng một bài dài tố cáo sâu Anthropic.

Theo quan điểm của anh ta, Anthropic đang sa lầy trong khó khăn về sức mạnh tính toán, điều này có thể thấy từ hành vi siết chặt hạn chế sử dụng, ép người dùng giảm tiêu hao Token.

Tuy nhiên, so với nút thắt cổ chai kỹ thuật, điều khiến anh ta phẫn nộ hơn là chiến lược sản phẩm "không chuyên tâm" của họ.

Trong khi mô hình cốt lõi không ổn định, Bug thường xuyên xuất hiện, họ lại lãng phí sức mạnh tính toán quý giá, vào việc phát triển các chức năng hào nhoáng như thú cưng đầu cuối "/buddy".

Đây có lẽ là "không gian thời gian sai lệch" hoang đường nhất trong lịch sử AI: Claude Mythos trong phòng thí nghiệm đang hủy diệt thế giới, Opus 4.6 trên trang web trí thông minh giảm thẳng.

Anthropic đã thành công tạo ra một "Siêu AI Schrödinger".

Tài liệu tham khảo:

https://officechai.com/ai/anthropic-and-openai-are-exaggerating-cybersecurity-risk-says-hacker-george-hotz/

https://x.com/stanislavfort/status/2041922370206654879?s=20

https://aisle.com/blog/ai-cybersecurity-after-mythos-the-jagged-frontier

https://x.com/cgtwts/status/2043095382121681272?s=20

https://www.reddit.com/r/ClaudeAI/comments/1siqwmp/anthropic_stop_shipping_seriously/

Bài viết đến từ tài khoản công chúng WeChat "Tân Trí Nguyên" (新智元), tác giả: Tân Trí Nguyên

熱門幣種推薦

相關問答

QClaude Mythos đã gây ra hoảng loạn trên Phố Wall như thế nào?

AClaude Mythos chưa chính thức ra mắt nhưng đã khiến các cơ quan quản lý tài chính Mỹ phải triệu tập cuộc họp khẩn cấp với các ngân hàng lớn, vì lo ngại nó có thể kích hoạt một cuộc tấn công mạng có hệ thống chưa từng có do AI điều khiển.

QCác điểm yếu trong báo cáo của Mythos đã được AISLE phát hiện là gì?

ANghiên cứu từ AISLE chỉ ra rằng phần lớn các lỗ hổng mà Mythos tìm thấy tồn tại trong phần mềm cũ không thể khai thác, và các báo cáo lỗ hổng "nghiêm trọng" chỉ dựa trên 198 lần rà soát thủ công.

QMô hình AI nhỏ đã làm được gì để thách thức Mythos?

AMột mô hình GPT-OSS-20b chỉ với 3,6 tỷ tham số kích hoạt đã xác định chính xác lỗ hổng hàng đầu của FreeBSD mà Mythos phát hiện, và một mô hình 5,1 tỷ tham số đã tái tạo thành công logic phân tích lỗ hổng OpenBSD 27 năm.

QTại sao George Hotz chỉ trích Anthropic và OpenAI?

AGeorge Hotz, chuyên gia bảo mật hàng đầu, cho rằng các rủi ro an ninh mạng do AI tạo ra đã bị thổi phồng quá mức. Ông tuyên bố lỗ hổng zero-day khan hiếm không phải do khó tìm mà do vấn đề pháp lý, vì hack hệ thống người khác là bất hợp pháp.

QĐiều gì đã xảy ra với Claude Opus 4.6 theo phản ánh của người dùng?

ANgười dùng báo cáo Claude Opus 4.6 bị "giảm trí thông minh nghiêm trọng", với khả năng suy luận sâu bị nén xuống (độ dài tư duy trung bình giảm từ ~2200 ký tự xuống còn 600 ký tự), dẫn đến việc phải thử lại thường xuyên và chi phí token tăng vọt.

你可能也喜歡

交易

現貨

熱門文章

什麼是 $S$

理解 SPERO:全面概述 SPERO 簡介 隨著創新領域的不斷演變,web3 技術和加密貨幣項目的出現在塑造數字未來中扮演著關鍵角色。在這個動態領域中,SPERO(標記為 SPERO,$$s$)是一個引起關注的項目。本文旨在收集並呈現有關 SPERO 的詳細信息,以幫助愛好者和投資者理解其基礎、目標和在 web3 和加密領域內的創新。 SPERO,$$s$ 是什麼? SPERO,$$s$ 是加密空間中的一個獨特項目,旨在利用去中心化和區塊鏈技術的原則,創建一個促進參與、實用性和金融包容性的生態系統。該項目旨在以新的方式促進點對點互動,為用戶提供創新的金融解決方案和服務。 SPERO,$$s$ 的核心目標是通過提供增強用戶體驗的工具和平台來賦能個人。這包括使交易方式更加靈活、促進社區驅動的倡議,以及通過去中心化應用程序(dApps)創造金融機會的途徑。SPERO,$$s$ 的基本願景圍繞包容性展開,旨在彌合傳統金融中的差距,同時利用區塊鏈技術的優勢。 誰是 SPERO,$$s$ 的創建者? SPERO,$$s$ 的創建者身份仍然有些模糊,因為公開可用的資源對其創始人提供的詳細背景信息有限。這種缺乏透明度可能源於該項目對去中心化的承諾——這是一種許多 web3 項目所共享的精神,優先考慮集體貢獻而非個人認可。 通過將討論重心放在社區及其共同目標上,SPERO,$$s$ 體現了賦能的本質,而不特別突出某些個體。因此,理解 SPERO 的精神和使命比識別單一創建者更為重要。 誰是 SPERO,$$s$ 的投資者? SPERO,$$s$ 得到了來自風險投資家到天使投資者的多樣化投資者的支持,他們致力於促進加密領域的創新。這些投資者的關注點通常與 SPERO 的使命一致——優先考慮那些承諾社會技術進步、金融包容性和去中心化治理的項目。 這些投資者通常對不僅提供創新產品,還對區塊鏈社區及其生態系統做出積極貢獻的項目感興趣。這些投資者的支持強化了 SPERO,$$s$ 作為快速發展的加密項目領域中的一個重要競爭者。 SPERO,$$s$ 如何運作? SPERO,$$s$ 採用多面向的框架,使其與傳統的加密貨幣項目區別開來。以下是一些突顯其獨特性和創新的關鍵特徵: 去中心化治理:SPERO,$$s$ 整合了去中心化治理模型,賦予用戶積極參與決策過程的權力,關於項目的未來。這種方法促進了社區成員之間的擁有感和責任感。 代幣實用性:SPERO,$$s$ 使用其自己的加密貨幣代幣,旨在在生態系統內部提供多種功能。這些代幣使交易、獎勵和平台上提供的服務得以促進,增強了整體參與度和實用性。 分層架構:SPERO,$$s$ 的技術架構支持模塊化和可擴展性,允許在項目發展過程中無縫整合額外的功能和應用。這種適應性對於在不斷變化的加密環境中保持相關性至關重要。 社區參與:該項目強調社區驅動的倡議,採用激勵合作和反饋的機制。通過培養強大的社區,SPERO,$$s$ 能夠更好地滿足用戶需求並適應市場趨勢。 專注於包容性:通過提供低交易費用和用戶友好的界面,SPERO,$$s$ 旨在吸引多樣化的用戶群體,包括那些以前可能未曾參與加密領域的個體。這種對包容性的承諾與其通過可及性賦能的總體使命相一致。 SPERO,$$s$ 的時間線 理解一個項目的歷史提供了對其發展軌跡和里程碑的關鍵見解。以下是建議的時間線,映射 SPERO,$$s$ 演變中的重要事件: 概念化和構思階段:形成 SPERO,$$s$ 基礎的初步想法被提出,與區塊鏈行業內的去中心化和社區聚焦原則密切相關。 項目白皮書的發布:在概念階段之後,發布了一份全面的白皮書,詳細說明了 SPERO,$$s$ 的願景、目標和技術基礎設施,以吸引社區的興趣和反饋。 社區建設和早期參與:積極進行外展工作,建立早期採用者和潛在投資者的社區,促進圍繞項目目標的討論並獲得支持。 代幣生成事件:SPERO,$$s$ 進行了一次代幣生成事件(TGE),向早期支持者分發其原生代幣,並在生態系統內建立初步流動性。 首次 dApp 上線:與 SPERO,$$s$ 相關的第一個去中心化應用程序(dApp)上線,允許用戶參與平台的核心功能。 持續發展和夥伴關係:對項目產品的持續更新和增強,包括與區塊鏈領域其他參與者的戰略夥伴關係,使 SPERO,$$s$ 成為加密市場中一個具有競爭力和不斷演變的參與者。 結論 SPERO,$$s$ 是 web3 和加密貨幣潛力的見證,能夠徹底改變金融系統並賦能個人。憑藉對去中心化治理、社區參與和創新設計功能的承諾,它為更具包容性的金融環境鋪平了道路。 與任何在快速發展的加密領域中的投資一樣,潛在的投資者和用戶都被鼓勵進行徹底研究,並對 SPERO,$$s$ 的持續發展進行深思熟慮的參與。該項目展示了加密行業的創新精神,邀請人們進一步探索其無數可能性。儘管 SPERO,$$s$ 的旅程仍在展開,但其基礎原則確實可能影響我們在互聯網數字生態系統中如何與技術、金融和彼此互動的未來。

115 人學過發佈於 2024.12.17更新於 2024.12.17

什麼是 $S$

什麼是 AGENT S

Agent S:Web3中自主互動的未來 介紹 在不斷演變的Web3和加密貨幣領域,創新不斷重新定義個人如何與數字平台互動。Agent S是一個開創性的項目,承諾通過其開放的代理框架徹底改變人機互動。Agent S旨在簡化複雜任務,為人工智能(AI)提供變革性的應用,鋪平自主互動的道路。本詳細探索將深入研究該項目的複雜性、其獨特特徵以及對加密貨幣領域的影響。 什麼是Agent S? Agent S是一個突破性的開放代理框架,專門設計用來解決計算機任務自動化中的三個基本挑戰: 獲取特定領域知識:該框架智能地從各種外部知識來源和內部經驗中學習。這種雙重方法使其能夠建立豐富的特定領域知識庫,提升其在任務執行中的表現。 長期任務規劃:Agent S採用經驗增強的分層規劃,這是一種戰略方法,可以有效地分解和執行複雜任務。此特徵顯著提升了其高效和有效地管理多個子任務的能力。 處理動態、不均勻的界面:該項目引入了代理-計算機界面(ACI),這是一種創新的解決方案,增強了代理和用戶之間的互動。利用多模態大型語言模型(MLLMs),Agent S能夠無縫導航和操作各種圖形用戶界面。 通過這些開創性特徵,Agent S提供了一個強大的框架,解決了自動化人機互動中涉及的複雜性,為AI及其他領域的無數應用奠定了基礎。 誰是Agent S的創建者? 儘管Agent S的概念根本上是創新的,但有關其創建者的具體信息仍然難以捉摸。創建者目前尚不清楚,這突顯了該項目的初期階段或戰略選擇將創始成員保密。無論是否匿名,重點仍然在於框架的能力和潛力。 誰是Agent S的投資者? 由於Agent S在加密生態系統中相對較新,關於其投資者和財務支持者的詳細信息並未明確記錄。缺乏對支持該項目的投資基礎或組織的公開見解,引發了對其資金結構和發展路線圖的質疑。了解其支持背景對於評估該項目的可持續性和潛在市場影響至關重要。 Agent S如何運作? Agent S的核心是尖端技術,使其能夠在多種環境中有效運作。其運營模型圍繞幾個關鍵特徵構建: 類人計算機互動:該框架提供先進的AI規劃,力求使與計算機的互動更加直觀。通過模仿人類在任務執行中的行為,承諾提升用戶體驗。 敘事記憶:用於利用高級經驗,Agent S利用敘事記憶來跟蹤任務歷史,從而增強其決策過程。 情節記憶:此特徵為用戶提供逐步指導,使框架能夠在任務展開時提供上下文支持。 支持OpenACI:Agent S能夠在本地運行,使用戶能夠控制其互動和工作流程,與Web3的去中心化理念相一致。 與外部API的輕鬆集成:其多功能性和與各種AI平台的兼容性確保了Agent S能夠無縫融入現有技術生態系統,成為開發者和組織的理想選擇。 這些功能共同促成了Agent S在加密領域的獨特地位,因為它以最小的人類干預自動化複雜的多步任務。隨著項目的發展,其在Web3中的潛在應用可能重新定義數字互動的展開方式。 Agent S的時間線 Agent S的發展和里程碑可以用一個時間線來概括,突顯其重要事件: 2024年9月27日:Agent S的概念在一篇名為《一個像人類一樣使用計算機的開放代理框架》的綜合研究論文中推出,展示了該項目的基礎工作。 2024年10月10日:該研究論文在arXiv上公開,提供了對框架及其基於OSWorld基準的性能評估的深入探索。 2024年10月12日:發布了一個視頻演示,提供了對Agent S能力和特徵的視覺洞察,進一步吸引潛在用戶和投資者。 這些時間線上的標記不僅展示了Agent S的進展,還表明了其對透明度和社區參與的承諾。 有關Agent S的要點 隨著Agent S框架的持續演變,幾個關鍵特徵脫穎而出,強調其創新性和潛力: 創新框架:旨在提供類似人類互動的直觀計算機使用,Agent S為任務自動化帶來了新穎的方法。 自主互動:通過GUI自主與計算機互動的能力標誌著向更智能和高效的計算解決方案邁進了一步。 複雜任務自動化:憑藉其強大的方法論,能夠自動化複雜的多步任務,使過程更快且更少出錯。 持續改進:學習機制使Agent S能夠從過去的經驗中改進,不斷提升其性能和效率。 多功能性:其在OSWorld和WindowsAgentArena等不同操作環境中的適應性確保了它能夠服務於廣泛的應用。 隨著Agent S在Web3和加密領域中的定位,其增強互動能力和自動化過程的潛力標誌著AI技術的一次重大進步。通過其創新框架,Agent S展現了數字互動的未來,為各行各業的用戶承諾提供更無縫和高效的體驗。 結論 Agent S代表了AI與Web3結合的一次大膽飛躍,具有重新定義我們與技術互動方式的能力。儘管仍處於早期階段,但其應用的可能性廣泛且引人入勝。通過其全面的框架解決關鍵挑戰,Agent S旨在將自主互動帶到數字體驗的最前沿。隨著我們深入加密貨幣和去中心化的領域,像Agent S這樣的項目無疑將在塑造技術和人機協作的未來中發揮關鍵作用。

891 人學過發佈於 2025.01.14更新於 2025.01.14

什麼是 AGENT S

如何購買S

歡迎來到HTX.com!在這裡,購買Sonic (S)變得簡單而便捷。跟隨我們的逐步指南,放心開始您的加密貨幣之旅。第一步:創建您的HTX帳戶使用您的 Email、手機號碼在HTX註冊一個免費帳戶。體驗無憂的註冊過程並解鎖所有平台功能。立即註冊第二步:前往買幣頁面,選擇您的支付方式信用卡/金融卡購買:使用您的Visa或Mastercard即時購買Sonic (S)。餘額購買:使用您HTX帳戶餘額中的資金進行無縫交易。第三方購買:探索諸如Google Pay或Apple Pay等流行支付方式以增加便利性。C2C購買:在HTX平台上直接與其他用戶交易。HTX 場外交易 (OTC) 購買:為大量交易者提供個性化服務和競爭性匯率。第三步:存儲您的Sonic (S)購買Sonic (S)後,將其存儲在您的HTX帳戶中。您也可以透過區塊鏈轉帳將其發送到其他地址或者用於交易其他加密貨幣。第四步:交易Sonic (S)在HTX的現貨市場輕鬆交易Sonic (S)。前往您的帳戶,選擇交易對,執行交易,並即時監控。HTX為初學者和經驗豐富的交易者提供了友好的用戶體驗。

1.9k 人學過發佈於 2025.01.15更新於 2026.06.02

如何購買S

相關討論

歡迎來到 HTX 社群。在這裡,您可以了解最新的平台發展動態並獲得專業的市場意見。 以下是用戶對 S (S)幣價的意見。

活动图片