Claude Mythos Officially Announced: Performance Crushes Opus 4.6, 'Imprisoned' for Being Too Dangerous

marsbit發佈於 2026-04-08更新於 2026-04-08

文章摘要

Anthropic has officially announced Claude Mythos, a highly advanced AI model that reportedly surpasses Opus 4.6 across multiple benchmarks, including a 24% improvement in bug-fixing capability and a 17% boost in agent-based computer operations. However, due to its dangerous ability to identify and exploit security vulnerabilities at a level exceeding most human hackers, the model has been deemed a significant risk to public and economic security. Instead of releasing it publicly, Anthropic has initiated "Project Glasswing," a collaborative security effort involving major tech companies like Amazon, Apple, Google, Microsoft, and NVIDIA, along with open-source organizations. These partners will use the preview version of Mythos to strengthen defenses and identify vulnerabilities in critical systems before the model is widely available. Anthropic is also providing up to $100 million in usage credits and donating $4 million to support open-source security initiatives. The move underscores the urgent need to address AI safety at a global scale, as rapidly advancing capabilities could soon outpace existing security measures.

The beast is about to break free.

Just moments ago, Anthropic's legendary strongest model—

Claude Mythos—released its preview version.

The rumors were right; this is indeed an epoch-making model.

On various benchmarks, it completely crushes Opus 4.6.

Not just an improvement, it's a true "crushing"......

SWE-bench Pro: Bug-fixing capability surged by 24%

SWE-bench Verified: Tested again with the stricter version, still a 13% improvement.

Terminal-Bench 2.0: Computer operation/Agent capability, improved by 17%.

A model stronger than Opus 4.6? And it's still beating Opus down??

Friends, I simply cannot imagine what this thing will even be like.

Following Sonnet and Opus, OpenAI now meets its strictest father—

Mythos.

But this time, Anthropic doesn't want to talk about benchmarks.

Compared to excitement and boasting, the official announcement blog subtly reveals a hint of hard-to-conceal "concern."

Even, panic.

Because this mythical model has a fatal "flaw."

Mythos Preview has already discovered thousands of high-risk vulnerabilities; all major mainstream operating systems and browsers are affected.

That's right. As AI's programming capabilities rapidly improve, making it more and more like a competent engineer, its other, dual-faceted ability is also growing uncontrollably.

Now, Mythos's ability to attack security vulnerabilities far surpasses that of the vast majority of hackers.

AI's capabilities at the code level have become so strong that in finding and exploiting vulnerabilities, it can exceed the vast majority of human engineers, leaving only the top few able to compete.

The other side of the coin has finally been flipped before us.

Anthropic states that at the current pace of AI development, this capability will soon proliferate and could even fall into the hands of those with less than secure intentions.

If it gets out of control, it would be a catastrophic disaster for the economy and public safety.

To give everyone enough time to respond, upon first announcing this new model, Anthropic made a very unusual move for an AI company.

They are temporarily not releasing it to the public.

Yes, Mythos will be part of the Glasswing Project (Project Glasswing1), initially opened to various partners first.

Their task is to build the strongest possible safety guardrails before this beast is fully unleashed.

The Imprisoned Claude Mythos

This is a massive "containment" operation.

To tame the beast that is Mythos, Anthropic has called upon almost all the legacy internet giants.

Participants include: Amazon, Apple, Google, Linux Foundation, Microsoft, NVIDIA......

In this project, there are no bystanders. All partners will deploy Mythos Preview into their own defensive security work.

They will unlock Mythos's true capabilities early, letting it out of its cage.

This is a preemptive training session. Before being riddled by the official version of Mythos, they will use the Mythos preview's capabilities to the fullest to strengthen their defenses.

Security, this time, is for real.

Anthropic says it will share the experience gained from this process so the entire industry can benefit.

The project is also open to over 40 additional builders and maintainers of critical software infrastructure, allowing them to use this model to scan and fortify their own systems and open-source systems.

Even more夸张的是, Anthropic has also pledged up to $100 million in usage credits to support this work and directly donated $4 million to open-source security organizations.

Wait, hold on, you're actually serious about this??

Haven't seen something like this in a long time.

Labs have always talked about limiting their internal models' capabilities, but honestly, it always felt like PR posturing.

But this Glasswing Project is the first time I've genuinely felt a chill down my spine.

Such a powerful model, yet tightly held back, creating such a huge stir just to announce a safety plan.

The level of seriousness is completely different. Who would give away so much money just for publicity?

So the Pro and Max users' Token usage, leaking like a sieve, was all to support your security cause, huh (doge).

Fine.

After all, if Mythos's capabilities are truly as announced, the release of this model would undoubtedly completely change the cybersecurity landscape.

AI safety is really no longer some scientists' "unfounded worry." This beast has already let out its first roar from behind the cage bars.

The Glasswing Project is just the starting point.

Anthropic states that cybersecurity is something no single organization can solve alone; frontier AI companies, software vendors, security researchers, the open-source community, and governments worldwide must all participate.

Defending global network infrastructure could be a project lasting years, while AI capabilities may see significant leaps in the coming months.

If we don't want to be turned into sieves by AI, we must act now, immediately, right away.

The Beast is Unleashed

Token usage burning through rapidly, Pro users "downgraded" to free users, OpenClaw cut off from resources, Claude Code inexplicably open-sourced......

Everything, suddenly, makes sense.

Anthropic might truly be swamped and dizzy.

The security issues with Mythos have become so severe that the internal team has no mind for other projects, forced to bet all their available GPUs, all-in on security.

Because—

The beast, is about to break free.

Reference links:[1]https://x.com/alexalbert__/status/2041579938537775160?s=46&t=iTysI4vQLQqCNJjSmBODPw[2]https://www.anthropic.com/glasswing

This article is from the WeChat public account "QbitAI", author: Focus on Frontier Technology

你可能也喜歡

辨析AI对经济增长与生产率的影响

本文探讨了AI对经济增长与生产率的影响，主要分为乐观派、温和派和悲观派三种观点。乐观派认为AI能通过研发自动化推动经济爆发式增长，甚至达到“奇点”；温和派承认AI会提升生产率，但受成本节约有限、任务暴露度低、物理能源约束、监管伦理摩擦等多重瓶颈制约，红利可能低于预期；悲观派则担忧AI替代劳动力会导致劳动收入份额下降，压制总需求，拖累经济增长。短期内（1-2年），AI对经济的支撑主要来自投资拉动，而非生产率红利；长期来看，AI可能带来生产力革命。中期（3-5年）可能面临三条路径：若AI需求符合预期且瓶颈较少，可能实现“乐观”的技术繁荣，但若缺乏收入再分配，可能导致社会矛盾；“温和”路径下，AI发展面临可克服的瓶颈，经济增长温和但金融市场可能出现K型分化；“悲观”路径下，AI需求不及预期或遭遇硬瓶颈，技术红利有限，但社会冲击较小。作者认为“温和路径”概率最大，但每条路径均非坦途，需决策者通盘考虑，平衡技术发展与社会稳定，确保可持续增长。

marsbit3 分鐘前

marsbit3 分鐘前

美国国税局防诈骗警报：虚假信件以数据窃取骗局瞄准加密货币持有者

美国国税局刑事调查部门发布警告，针对加密货币持有者的新型钓鱼骗局正在蔓延。该骗局通过伪造官方纸质信件，诱骗收件人扫描内含的二维码，进入虚假的“数字资产合规门户”网站以窃取个人信息，甚至可能直接骗取加密货币转账。骗局之所以奏效，是因为国税局自2019年起确实会向疑似未如实申报数字资产活动的纳税人寄送合规教育信函，这使收到相关信件显得平常。诈骗分子正是利用了这种认知。国税局明确指出：官方信函从不包含二维码，也绝不会要求纳税人转移数字资产或通过此类门户网站进行注册。如果收到可疑信件，切勿扫描其中的二维码、拨打信上列出的电话或在通过链接/二维码进入的网站上输入任何个人信息。任何国税局通知的真伪都应通过访问官方IRS.gov网站或拨打该网站列出的电话进行核实。此类骗局损害了国税局在加强加密货币税务执法时期，其官方沟通的可信度。

TheNewsCrypto6 分鐘前

TheNewsCrypto6 分鐘前

新冷战是科技股战

本文认为，新冷战本质上是科技金融战，其核心是金融体系与科技产业的深度绑定和国家意志的体现。文章通过对比美苏冷战、美日摩擦和中美竞争，指出竞争形态已从实体贸易战演变为以金融市场（尤其是股市）为标尺的科技金融博弈。美苏冷战时期，美国通过美元体系渗透并最终拖垮了苏联的经互会体系。美日摩擦中，美国通过“广场协议”和金融手段（如美债）遏制了日本半导体产业。当前的中美博弈则更为复杂：中国拥有庞大的工业基础和美元资产，美国难以单纯通过贸易或传统金融手段取胜。于是，竞争焦点转向科技领域，并直接反映在双方核心科技企业的股市表现上。文章指出，美股（尤其是AI、半导体板块）和A股中的科技龙头（如长鑫科技、月之暗面）已成为“主权级资产”，其涨跌体现了国家力量的对垒。科技战的新形式在于，双方体系内的企业能在各自市场形成“自然垄断”，并通过股市估值相互施压。未来的垄断企业可能不再是全球性的消费巨头，而是在各自体系内获得垄断收益的科技公司。最终，这场“大争之世”的博弈，超越了简单的贸易份额争夺，演变为以金融定价权为终极武器的科技体系竞争。

marsbit12 分鐘前

marsbit12 分鐘前

RWA周刊：十家欧洲金融机构成立代币化资产合作社；Ondo 推出新执行网络 Ondo Network

本期RWA周刊统计周期为2026年7月24日至31日。数据显示，RWA链上总市值稳定在368亿美元，持有者数量单月净增超42万，创历史新高。但稳定币市场月度转账量连续深度下滑近30%，链上活跃度低迷，呈现“资金沉淀、活性萎缩”的僵持格局。监管方面，韩国推进稳定币立法并酝酿废除加密税，肯尼亚下调稳定币发行商资本门槛以吸引全球参与者，津巴布韦启动加密监管沙盒，多国框架趋于明朗。项目进展方面，国际清算银行牵头的Project Agorá成功完成六种货币、100万美元的真实跨境支付测试，平均结算时间约80秒，标志批发代币化走向实操。十家欧洲金融机构联合成立了专注于代币化资产的RL1区块链合作社，共建基础设施。同时，RWA应用场景向实物资产延伸：韩国浦项国际利用区块链对商业发票进行代币化以加速跨境支付；巴西农户通过将奶牛代币化成功融资近2万美元。其他重要动态包括：Ondo Finance推出新的执行网络Ondo Network；Tether的合规稳定币USA₮在Celo主网上线；Securitize获得美SEC投资顾问牌照；纽约梅隆银行计划将核心转账代理业务迁移至区块链。洞察文章指出，当前链上RWA资产规模虽大，但约90%处于休眠状态，面临DeFi利用率困局。竞赛焦点正从“资产发行”转向“应用与渠道分发”。此外，新型稳定币OUSD通过收益共享模式挑战USDC，但面临合规与治理等挑战。

marsbit13 分鐘前

RWA周刊：十家欧洲金融机构成立代币化资产合作社；Ondo 推出新执行网络 Ondo Network

marsbit13 分鐘前

韩国股市暴力去杠杆后大幅反弹，SK海力士上涨30%

7月31日，韩国股市大幅反弹，KOSPI指数上涨18.27%，SK海力士涨停。此前一个多月，韩国股市经历近40%的暴跌，杠杆ETF的强制再平衡机制被认为是放大波动、形成“死亡螺旋”的重要原因。本次反弹由多重利好触发：北美微软、亚马逊等云厂商财报显示AI需求强劲，提振科技板块信心；SK集团会长崔泰源罕见个人抄底SK海力士股票；韩国政府宣布注资20万亿韩元专项投资人工智能。针对此前市场动荡，韩国政府已收紧对杠杆ETF的监管，包括提高散户投资门槛、限制新产品上市等。分析指出，市场正经历从“流动性驱动”向“基本面驱动”的必要切换，外资抛售放缓、企业回购计划构成支撑。但亦有观点认为，反弹属超跌修复，后市走势仍需观察全球科技巨头资本开支及存储芯片周期。

marsbit33 分鐘前

marsbit33 分鐘前

交易

現貨

熱門文章

什麼是 $S$

理解 SPERO：全面概述 SPERO 簡介隨著創新領域的不斷演變，web3 技術和加密貨幣項目的出現在塑造數字未來中扮演著關鍵角色。在這個動態領域中，SPERO（標記為 SPERO,$$s$）是一個引起關注的項目。本文旨在收集並呈現有關 SPERO 的詳細信息，以幫助愛好者和投資者理解其基礎、目標和在 web3 和加密領域內的創新。 SPERO,$$s$ 是什麼？ SPERO,$$s$ 是加密空間中的一個獨特項目，旨在利用去中心化和區塊鏈技術的原則，創建一個促進參與、實用性和金融包容性的生態系統。該項目旨在以新的方式促進點對點互動，為用戶提供創新的金融解決方案和服務。 SPERO,$$s$ 的核心目標是通過提供增強用戶體驗的工具和平台來賦能個人。這包括使交易方式更加靈活、促進社區驅動的倡議，以及通過去中心化應用程序（dApps）創造金融機會的途徑。SPERO,$$s$ 的基本願景圍繞包容性展開，旨在彌合傳統金融中的差距，同時利用區塊鏈技術的優勢。誰是 SPERO,$$s$ 的創建者？ SPERO,$$s$ 的創建者身份仍然有些模糊，因為公開可用的資源對其創始人提供的詳細背景信息有限。這種缺乏透明度可能源於該項目對去中心化的承諾——這是一種許多 web3 項目所共享的精神，優先考慮集體貢獻而非個人認可。通過將討論重心放在社區及其共同目標上，SPERO,$$s$ 體現了賦能的本質，而不特別突出某些個體。因此，理解 SPERO 的精神和使命比識別單一創建者更為重要。誰是 SPERO,$$s$ 的投資者？ SPERO,$$s$ 得到了來自風險投資家到天使投資者的多樣化投資者的支持，他們致力於促進加密領域的創新。這些投資者的關注點通常與 SPERO 的使命一致——優先考慮那些承諾社會技術進步、金融包容性和去中心化治理的項目。這些投資者通常對不僅提供創新產品，還對區塊鏈社區及其生態系統做出積極貢獻的項目感興趣。這些投資者的支持強化了 SPERO,$$s$ 作為快速發展的加密項目領域中的一個重要競爭者。 SPERO,$$s$ 如何運作？ SPERO,$$s$ 採用多面向的框架，使其與傳統的加密貨幣項目區別開來。以下是一些突顯其獨特性和創新的關鍵特徵：去中心化治理：SPERO,$$s$ 整合了去中心化治理模型，賦予用戶積極參與決策過程的權力，關於項目的未來。這種方法促進了社區成員之間的擁有感和責任感。代幣實用性：SPERO,$$s$ 使用其自己的加密貨幣代幣，旨在在生態系統內部提供多種功能。這些代幣使交易、獎勵和平台上提供的服務得以促進，增強了整體參與度和實用性。分層架構：SPERO,$$s$ 的技術架構支持模塊化和可擴展性，允許在項目發展過程中無縫整合額外的功能和應用。這種適應性對於在不斷變化的加密環境中保持相關性至關重要。社區參與：該項目強調社區驅動的倡議，採用激勵合作和反饋的機制。通過培養強大的社區，SPERO,$$s$ 能夠更好地滿足用戶需求並適應市場趨勢。專注於包容性：通過提供低交易費用和用戶友好的界面，SPERO,$$s$ 旨在吸引多樣化的用戶群體，包括那些以前可能未曾參與加密領域的個體。這種對包容性的承諾與其通過可及性賦能的總體使命相一致。 SPERO,$$s$ 的時間線理解一個項目的歷史提供了對其發展軌跡和里程碑的關鍵見解。以下是建議的時間線，映射 SPERO,$$s$ 演變中的重要事件：概念化和構思階段：形成 SPERO,$$s$ 基礎的初步想法被提出，與區塊鏈行業內的去中心化和社區聚焦原則密切相關。項目白皮書的發布：在概念階段之後，發布了一份全面的白皮書，詳細說明了 SPERO,$$s$ 的願景、目標和技術基礎設施，以吸引社區的興趣和反饋。社區建設和早期參與：積極進行外展工作，建立早期採用者和潛在投資者的社區，促進圍繞項目目標的討論並獲得支持。代幣生成事件：SPERO,$$s$ 進行了一次代幣生成事件（TGE），向早期支持者分發其原生代幣，並在生態系統內建立初步流動性。首次 dApp 上線：與 SPERO,$$s$ 相關的第一個去中心化應用程序（dApp）上線，允許用戶參與平台的核心功能。持續發展和夥伴關係：對項目產品的持續更新和增強，包括與區塊鏈領域其他參與者的戰略夥伴關係，使 SPERO,$$s$ 成為加密市場中一個具有競爭力和不斷演變的參與者。結論 SPERO,$$s$ 是 web3 和加密貨幣潛力的見證，能夠徹底改變金融系統並賦能個人。憑藉對去中心化治理、社區參與和創新設計功能的承諾，它為更具包容性的金融環境鋪平了道路。與任何在快速發展的加密領域中的投資一樣，潛在的投資者和用戶都被鼓勵進行徹底研究，並對 SPERO,$$s$ 的持續發展進行深思熟慮的參與。該項目展示了加密行業的創新精神，邀請人們進一步探索其無數可能性。儘管 SPERO,$$s$ 的旅程仍在展開，但其基礎原則確實可能影響我們在互聯網數字生態系統中如何與技術、金融和彼此互動的未來。

356 人學過發佈於 2024.12.17更新於 2024.12.17

什麼是 AGENT S

Agent S：Web3中自主互動的未來介紹在不斷演變的Web3和加密貨幣領域，創新不斷重新定義個人如何與數字平台互動。Agent S是一個開創性的項目，承諾通過其開放的代理框架徹底改變人機互動。Agent S旨在簡化複雜任務，為人工智能（AI）提供變革性的應用，鋪平自主互動的道路。本詳細探索將深入研究該項目的複雜性、其獨特特徵以及對加密貨幣領域的影響。什麼是Agent S？ Agent S是一個突破性的開放代理框架，專門設計用來解決計算機任務自動化中的三個基本挑戰：獲取特定領域知識：該框架智能地從各種外部知識來源和內部經驗中學習。這種雙重方法使其能夠建立豐富的特定領域知識庫，提升其在任務執行中的表現。長期任務規劃：Agent S採用經驗增強的分層規劃，這是一種戰略方法，可以有效地分解和執行複雜任務。此特徵顯著提升了其高效和有效地管理多個子任務的能力。處理動態、不均勻的界面：該項目引入了代理-計算機界面（ACI），這是一種創新的解決方案，增強了代理和用戶之間的互動。利用多模態大型語言模型（MLLMs），Agent S能夠無縫導航和操作各種圖形用戶界面。通過這些開創性特徵，Agent S提供了一個強大的框架，解決了自動化人機互動中涉及的複雜性，為AI及其他領域的無數應用奠定了基礎。誰是Agent S的創建者？儘管Agent S的概念根本上是創新的，但有關其創建者的具體信息仍然難以捉摸。創建者目前尚不清楚，這突顯了該項目的初期階段或戰略選擇將創始成員保密。無論是否匿名，重點仍然在於框架的能力和潛力。誰是Agent S的投資者？由於Agent S在加密生態系統中相對較新，關於其投資者和財務支持者的詳細信息並未明確記錄。缺乏對支持該項目的投資基礎或組織的公開見解，引發了對其資金結構和發展路線圖的質疑。了解其支持背景對於評估該項目的可持續性和潛在市場影響至關重要。 Agent S如何運作？ Agent S的核心是尖端技術，使其能夠在多種環境中有效運作。其運營模型圍繞幾個關鍵特徵構建：類人計算機互動：該框架提供先進的AI規劃，力求使與計算機的互動更加直觀。通過模仿人類在任務執行中的行為，承諾提升用戶體驗。敘事記憶：用於利用高級經驗，Agent S利用敘事記憶來跟蹤任務歷史，從而增強其決策過程。情節記憶：此特徵為用戶提供逐步指導，使框架能夠在任務展開時提供上下文支持。支持OpenACI：Agent S能夠在本地運行，使用戶能夠控制其互動和工作流程，與Web3的去中心化理念相一致。與外部API的輕鬆集成：其多功能性和與各種AI平台的兼容性確保了Agent S能夠無縫融入現有技術生態系統，成為開發者和組織的理想選擇。這些功能共同促成了Agent S在加密領域的獨特地位，因為它以最小的人類干預自動化複雜的多步任務。隨著項目的發展，其在Web3中的潛在應用可能重新定義數字互動的展開方式。 Agent S的時間線 Agent S的發展和里程碑可以用一個時間線來概括，突顯其重要事件： 2024年9月27日：Agent S的概念在一篇名為《一個像人類一樣使用計算機的開放代理框架》的綜合研究論文中推出，展示了該項目的基礎工作。 2024年10月10日：該研究論文在arXiv上公開，提供了對框架及其基於OSWorld基準的性能評估的深入探索。 2024年10月12日：發布了一個視頻演示，提供了對Agent S能力和特徵的視覺洞察，進一步吸引潛在用戶和投資者。這些時間線上的標記不僅展示了Agent S的進展，還表明了其對透明度和社區參與的承諾。有關Agent S的要點隨著Agent S框架的持續演變，幾個關鍵特徵脫穎而出，強調其創新性和潛力：創新框架：旨在提供類似人類互動的直觀計算機使用，Agent S為任務自動化帶來了新穎的方法。自主互動：通過GUI自主與計算機互動的能力標誌著向更智能和高效的計算解決方案邁進了一步。複雜任務自動化：憑藉其強大的方法論，能夠自動化複雜的多步任務，使過程更快且更少出錯。持續改進：學習機制使Agent S能夠從過去的經驗中改進，不斷提升其性能和效率。多功能性：其在OSWorld和WindowsAgentArena等不同操作環境中的適應性確保了它能夠服務於廣泛的應用。隨著Agent S在Web3和加密領域中的定位，其增強互動能力和自動化過程的潛力標誌著AI技術的一次重大進步。通過其創新框架，Agent S展現了數字互動的未來，為各行各業的用戶承諾提供更無縫和高效的體驗。結論 Agent S代表了AI與Web3結合的一次大膽飛躍，具有重新定義我們與技術互動方式的能力。儘管仍處於早期階段，但其應用的可能性廣泛且引人入勝。通過其全面的框架解決關鍵挑戰，Agent S旨在將自主互動帶到數字體驗的最前沿。隨著我們深入加密貨幣和去中心化的領域，像Agent S這樣的項目無疑將在塑造技術和人機協作的未來中發揮關鍵作用。

1.1k 人學過發佈於 2025.01.14更新於 2025.01.14

如何購買S

歡迎來到HTX.com！在這裡，購買Sonic (S)變得簡單而便捷。跟隨我們的逐步指南，放心開始您的加密貨幣之旅。第一步：創建您的HTX帳戶使用您的 Email、手機號碼在HTX註冊一個免費帳戶。體驗無憂的註冊過程並解鎖所有平台功能。立即註冊第二步：前往買幣頁面，選擇您的支付方式信用卡/金融卡購買：使用您的Visa或Mastercard即時購買Sonic (S)。餘額購買：使用您HTX帳戶餘額中的資金進行無縫交易。第三方購買：探索諸如Google Pay或Apple Pay等流行支付方式以增加便利性。C2C購買：在HTX平台上直接與其他用戶交易。HTX 場外交易 (OTC) 購買：為大量交易者提供個性化服務和競爭性匯率。第三步：存儲您的Sonic (S)購買Sonic (S)後，將其存儲在您的HTX帳戶中。您也可以透過區塊鏈轉帳將其發送到其他地址或者用於交易其他加密貨幣。第四步：交易Sonic (S)在HTX的現貨市場輕鬆交易Sonic (S)。前往您的帳戶，選擇交易對，執行交易，並即時監控。HTX為初學者和經驗豐富的交易者提供了友好的用戶體驗。

2.5k 人學過發佈於 2025.01.15更新於 2026.06.02