# Claude的所有文章

在 HTX 新聞中心流覽與「Claude」相關的最新資訊與深度分析。潘蓋市場趨勢、專案動態、技術進展及監管政策,提供權威的加密行業洞察。

突发!Anthropic呼吁全员停止AI研究

人工智能公司Anthropic在其官方博客中发布重要观点,指出其AI模型Claude已展现出显著的“自进化”能力,即递归自我提升(RSI)的早期迹象。 核心数据显示,截至2026年5月,Anthropic代码库中超过80%的代码由Claude编写,而在其代码工具发布前,这一比例仅为个位数。工程师的代码交付量达到2024年的8倍。在编程质量上,Claude处理最复杂模糊任务的成功率在半年内从26%跃升至76%,其代码质量被认为年内有望超越人类。 Anthropic提出了“AI能独立完成的任务时长”这一新衡量维度:从2024年3月的4分钟,增至2025年的1.5小时,再到2026年的至少16小时,翻倍速度已加快至每4个月一次。若趋势持续,2027年可能达到数周。 在研究层面,Claude展现强大能力:将训练小模型的代码运行速度优化了52倍,远超人类水平;在一项AI安全研究中,其将效果差距缩小了97%,而人类研究员仅缩小23%。 Anthropic认为,人类在AI开发中的角色正不断收窄,最后优势可能仅剩研究品味与方向判断。公司描绘了三种未来:能力增长停滞;AI加速但人类主导;或AI实现完全递归自我提升,自主设计下一代AI,这可能带来巨大福祉,但也存在对齐失败、最终失控的风险。 为此,Anthropic呼吁,如果存在可验证的机制确保全球AI实验室能同步暂停竞争,其愿意减速甚至暂停研发。OpenAI近期也发表了类似观点,认为自进化迹象将加剧竞争与治理挑战。这表明AI发展的“奇点”可能正在加速逼近。

marsbit06/05 00:26

突发!Anthropic呼吁全员停止AI研究

marsbit06/05 00:26

AI版的 Siri,可能长这样

苹果即将在WWDC上发布全新AI版Siri,这将是其自2011年亮相以来最大规模的一次革新。新版Siri将彻底重塑界面,采用深色配色和聊天机器人式交互,并与灵动岛深度集成,使其从一个偶尔使用的语音命令行转变为一个可主动使用的工具入口。关键改进包括对话持久性(能记住上下文)以及引入“Extensions”框架,允许用户将Google Gemini和Anthropic Claude等第三方AI模型直接接入Siri,使其成为一个AI模型的分发平台。 此举被视为苹果面对过去三年在AI助手领域落后局面的重要回应。在ChatGPT、Gemini等竞品重新定义对话式AI后,Siri因能力不足而备受批评。苹果的新策略不再是独自研发最强模型,而是利用其系统生态优势,将iOS打造成一个聚合与整合最佳AI模型的平台,通过深度系统级集成(如调用联系人、日历、健康数据)来构建差异化体验,应对用户“为何不用原生App”的质疑。 然而,这一转变也带来挑战,尤其是隐私承诺问题。苹果长期强调设备端处理和数据隐私,但引入Google等外部基础设施处理部分查询,可能动摇其“只用自己基础设施”的承诺。苹果需要在发布会上妥善解释这一平衡。 苹果的AI布局看似后发,实则是等待赛道稳定后,以其擅长的系统整合能力进行赶超。这场豪赌的核心在于:AI的终局或许不在于谁拥有最强模型,而在于谁能将模型无缝、深度地融入用户体验。6月8日的WWDC,将是Siri证明自己的关键时刻。

marsbit05/29 07:14

AI版的 Siri,可能长这样

marsbit05/29 07:14

刚刚,Claude Opus 4.8 上线,张口就说自己是 DeepSeek、Qwen

刚刚,Anthropic发布了旗舰模型Claude Opus 4.8,并宣布完成650亿美元的H轮融资,投后估值达9650亿美元,逼近万亿美元关口。 Opus 4.8在编码、智能体任务、推理和知识工作等方面均有提升,价格保持不变。新模型在长任务和复杂协作中表现更可靠,诚实性提升,更愿意说明不确定性,代码缺陷漏报率约为前代的四分之一。有趣的是,有网友测试发现,Opus 4.8有时会错误地自称是DeepSeek或Qwen,疑似存在模型蒸馏行为。 同时上线的还有多项产品功能,包括可调节模型推理强度的“思考强度控制”,以及处于研究预览阶段的“动态工作流”。后者允许Claude Code处理大规模任务,通过动态编排脚本、并行运行数十到数百个子智能体,来完成如大型代码库迁移等复杂工程。Anthropic以Bun项目从Zig到Rust的迁移为例,展示了该功能在11天内生成约75万行代码的能力。 本轮巨额融资主要用于算力扩张。Anthropic与亚马逊、谷歌、博通、SpaceX等签署了基础设施协议,以获得下一代TPU和GPU容量,支撑其训练和推理需求。公司强调,Claude已成为首个同时登陆AWS、Google Cloud和Microsoft Azure三大云的前沿模型。 综上,Anthropic正从单纯的模型提供商,转向构建集智能模型、开发工具、云平台和算力资源于一体的企业AI工作系统。Opus 4.8是新的模型底座,动态工作流代表产品形态的进化,而巨额融资则为服务更大规模客户提供了基础设施保障。

marsbit05/28 23:56

刚刚,Claude Opus 4.8 上线,张口就说自己是 DeepSeek、Qwen

marsbit05/28 23:56

Mythos首个报告出炉:全球数十亿设备裸奔,30天挖出10000致命漏洞

Anthropic公司启动的“玻璃翼计划”首月战报公布,其下一代顶级大模型Claude Mythos Preview在30天内联合全球约50家网络及关键基础设施公司,发现了超过10,000个高危或严重软件漏洞。该模型不仅能精准发现漏洞,误报率低于人类专家,还能自动构建攻击链,甚至在一家合作银行成功拦截了一笔150万美元的电诈。 报告显示,Mythos对Cloudflare、Mozilla Firefox、OpenBSD等核心系统进行了扫描,发现了大量漏洞,包括在OpenBSD中隐藏27年的旧Bug。在对全球1000多个关键开源项目的扫描中,共发现23,019个漏洞,经第三方复核确认其中1,094个为高危或严重漏洞,准确率达90.6%。一个典型案例是在广泛使用的开源密码库wolfSSL中发现了一个可伪造数字证书的严重逻辑漏洞。 然而,漏洞发现速度远超人类修复能力,导致开源维护者不堪重负。为此,Anthropic推出了“防御者工具包”,包括能自动生成修复补丁的Claude Security、面向安全研究员的“网络验证计划”,以及一套开源的自动化漏洞挖掘流水线,旨在用AI修复AI发现的漏洞。 由于Mythos能力过于强大且可能被滥用,Anthropic暂未公开发布,强调需先建立更高级别的安全护栏。公司呼吁行业缩短补丁周期、推行强制升级并加强基础安全措施。尽管当前人类开发者面临修复压力,但长远来看,此类AI技术有望极大提升全球软件的安全基石。

marsbit05/25 00:09

Mythos首个报告出炉:全球数十亿设备裸奔,30天挖出10000致命漏洞

marsbit05/25 00:09

一周省下3亿Token,Anthropic工程师的Claude Code缓存指南

这篇文章分享了Anthropic工程师通过有效利用Claude Code的Prompt缓存机制,一周内节省超过3亿Token的经验。核心观点是,缓存的Token成本仅为普通输入的10%,因此提高缓存复用率能显著降低使用成本并延长会话额度。 缓存机制依赖“前缀匹配”,分为系统层、项目层和对话层三层。只要会话前缀与已缓存内容一致,Claude即可直接复用,无需重新处理。Claude Code订阅版的缓存有效时间(TTL)为1小时,而API默认为5分钟。 文章强调了几个关键的使用习惯以避免“打断”缓存: 1. 不要让会话空置超过1小时,否则缓存过期,重新开始成本更低。 2. 切换任务时,建议进行清晰的会话交接(如使用自定义的handoff技能总结进度后新建会话),而非使用可能破坏缓存的`/compact`命令。 3. 避免在会话中途切换模型(包括开启“Opus plan”模式),因为不同模型使用独立缓存,切换会导致缓存失效。 4. 大文档应放入Projects中管理,而非反复粘贴进对话,以获得更好的缓存优化。 此外,文章提到Anthropic内部会监控缓存命中率,因为这直接影响服务成本和用户体验。通过理解并遵循这些简单的原则,用户可以在不改变使用习惯的情况下,更高效地利用Claude Code,节省Token消耗。

marsbit05/24 00:36

一周省下3亿Token,Anthropic工程师的Claude Code缓存指南

marsbit05/24 00:36

Anthropic 重磅发布「创始人手册」:创业的 4 个阶段,用 AI 全部重构

Anthropic发布《创始人手册》,提出AI正在彻底重构创业逻辑,将创业分为四个阶段,并指导如何用AI工具在每个阶段发挥作用。 **核心观点**:AI原生创业不是简单地为传统公司添加AI工具,而是从第一天起就以AI驱动业务运作。创始人的角色转变为“指挥者”,专注于高阶判断与决策,将执行层工作交由AI Agent处理。Anthropic为此提供了三层生产力工具:Claude Chat(对话研究)、Claude Code(生成代码)、Claude Cowork(工作流自动化)。 **创业四阶段AI应用指南**: 1. **想法阶段**:核心是验证问题是否真实存在。避免被AI轻易生成的原机所误导。应利用AI作为“结构化魔鬼代言人”挑战假设,并进行市场与竞品调研。 2. **MVP阶段**:核心是收集产品被需要的早期信号。需警惕因开发加速导致的技术债务和功能蔓延。应利用AI建立项目“记忆”文档,辅助结构化编码,并自动化用户反馈收集。 3. **上线阶段**:核心是验证业务增长能力。需应对技术债务爆发和创始人成为瓶颈的挑战。应构建AI“操作系统”自动化常规运营(如内容生成、CRM更新),让创始人聚焦于关键决策。 4. **规模化阶段**:核心是实现业务可持续性。关键在于创始人克服心理障碍,将运营控制权委托给AI和团队。可利用AI进行差异化营销、优化运营效率并构建竞争壁垒。 **最终结论**:在AI时代,“能不能造”已不再是壁垒,“该不该造”才是关键。竞争优势回归到更本质的洞察力、判断力以及对问题与用户的深刻理解。

marsbit05/22 13:57

Anthropic 重磅发布「创始人手册」:创业的 4 个阶段,用 AI 全部重构

marsbit05/22 13:57

知情人士:DeepSeek正在组建Harness团队,对标Claude Code

知情人士透露,DeepSeek正在内部组建一个名为“Harness”的团队,旨在开发代码智能体产品,直接对标Anthropic旗下的Claude Code。DeepSeek资深研究员陈德里在社交媒体证实了这一动向,并表示团队目标即“做DeepSeek Code Harness”。 此次招聘开放了Harness产品经理和研发工程师两个关键岗位。招聘信息揭示了一个核心公式:模型(Model) + 约束与控制层(Harness) = 智能体(Agent)。这表明DeepSeek的战略重点正从单纯的模型能力竞争,转向构建连接模型与真实工作流的“中间层”。DeepSeek认为,模型之外的上下文管理、工具调用、任务规划、代码修改、终端执行等能力,才是智能体融入开发者工作流的关键。 文章分析,DeepSeek此举并非简单打造代码助手插件,而是要“补齐模型通向真实工作流的中间层”,为强大的代码模型“装上双手”。过去,虽然DeepSeek的代码模型能力突出,但尚未形成高频使用的产品化工作流。Claude Code的成功证明,AI编程的竞争已转向争夺开发者工作流入口。 此前,一个名为DeepSeek-TUI的开源终端智能体项目在社区走红,它展示了开发者对DeepSeek版Claude Code的强烈需求,但也凸显了官方产品的缺失。官方Harness团队的优势在于能与模型团队深度协作,实现“模型与Harness的共同进化”,并将真实任务反馈系统性地注入模型迭代,形成数据闭环。 此举标志着DeepSeek在模型能力之外,开始全力构建其智能体产品的关键组成部分,正式进入以工作流为核心的“智能体战争”新阶段。

链捕手05/22 02:14

知情人士:DeepSeek正在组建Harness团队,对标Claude Code

链捕手05/22 02:14

活动图片