# 代码的所有文章

在 HTX 新闻中心浏览与「代码」相关的最新资讯与深度分析。潘盖市场趋势、项目动态、技术进展及监管政策,提供权威的加密行业洞察。

突发!Anthropic呼吁全员停止AI研究

人工智能公司Anthropic在其官方博客中发布重要观点,指出其AI模型Claude已展现出显著的“自进化”能力,即递归自我提升(RSI)的早期迹象。 核心数据显示,截至2026年5月,Anthropic代码库中超过80%的代码由Claude编写,而在其代码工具发布前,这一比例仅为个位数。工程师的代码交付量达到2024年的8倍。在编程质量上,Claude处理最复杂模糊任务的成功率在半年内从26%跃升至76%,其代码质量被认为年内有望超越人类。 Anthropic提出了“AI能独立完成的任务时长”这一新衡量维度:从2024年3月的4分钟,增至2025年的1.5小时,再到2026年的至少16小时,翻倍速度已加快至每4个月一次。若趋势持续,2027年可能达到数周。 在研究层面,Claude展现强大能力:将训练小模型的代码运行速度优化了52倍,远超人类水平;在一项AI安全研究中,其将效果差距缩小了97%,而人类研究员仅缩小23%。 Anthropic认为,人类在AI开发中的角色正不断收窄,最后优势可能仅剩研究品味与方向判断。公司描绘了三种未来:能力增长停滞;AI加速但人类主导;或AI实现完全递归自我提升,自主设计下一代AI,这可能带来巨大福祉,但也存在对齐失败、最终失控的风险。 为此,Anthropic呼吁,如果存在可验证的机制确保全球AI实验室能同步暂停竞争,其愿意减速甚至暂停研发。OpenAI近期也发表了类似观点,认为自进化迹象将加剧竞争与治理挑战。这表明AI发展的“奇点”可能正在加速逼近。

marsbit06/05 00:26

突发!Anthropic呼吁全员停止AI研究

marsbit06/05 00:26

刚刚,Claude Opus 4.8 上线,张口就说自己是 DeepSeek、Qwen

刚刚,Anthropic发布了旗舰模型Claude Opus 4.8,并宣布完成650亿美元的H轮融资,投后估值达9650亿美元,逼近万亿美元关口。 Opus 4.8在编码、智能体任务、推理和知识工作等方面均有提升,价格保持不变。新模型在长任务和复杂协作中表现更可靠,诚实性提升,更愿意说明不确定性,代码缺陷漏报率约为前代的四分之一。有趣的是,有网友测试发现,Opus 4.8有时会错误地自称是DeepSeek或Qwen,疑似存在模型蒸馏行为。 同时上线的还有多项产品功能,包括可调节模型推理强度的“思考强度控制”,以及处于研究预览阶段的“动态工作流”。后者允许Claude Code处理大规模任务,通过动态编排脚本、并行运行数十到数百个子智能体,来完成如大型代码库迁移等复杂工程。Anthropic以Bun项目从Zig到Rust的迁移为例,展示了该功能在11天内生成约75万行代码的能力。 本轮巨额融资主要用于算力扩张。Anthropic与亚马逊、谷歌、博通、SpaceX等签署了基础设施协议,以获得下一代TPU和GPU容量,支撑其训练和推理需求。公司强调,Claude已成为首个同时登陆AWS、Google Cloud和Microsoft Azure三大云的前沿模型。 综上,Anthropic正从单纯的模型提供商,转向构建集智能模型、开发工具、云平台和算力资源于一体的企业AI工作系统。Opus 4.8是新的模型底座,动态工作流代表产品形态的进化,而巨额融资则为服务更大规模客户提供了基础设施保障。

marsbit05/28 23:56

刚刚,Claude Opus 4.8 上线,张口就说自己是 DeepSeek、Qwen

marsbit05/28 23:56

知情人士:DeepSeek正在组建Harness团队,对标Claude Code

知情人士透露,DeepSeek正在内部组建一个名为“Harness”的团队,旨在开发代码智能体产品,直接对标Anthropic旗下的Claude Code。DeepSeek资深研究员陈德里在社交媒体证实了这一动向,并表示团队目标即“做DeepSeek Code Harness”。 此次招聘开放了Harness产品经理和研发工程师两个关键岗位。招聘信息揭示了一个核心公式:模型(Model) + 约束与控制层(Harness) = 智能体(Agent)。这表明DeepSeek的战略重点正从单纯的模型能力竞争,转向构建连接模型与真实工作流的“中间层”。DeepSeek认为,模型之外的上下文管理、工具调用、任务规划、代码修改、终端执行等能力,才是智能体融入开发者工作流的关键。 文章分析,DeepSeek此举并非简单打造代码助手插件,而是要“补齐模型通向真实工作流的中间层”,为强大的代码模型“装上双手”。过去,虽然DeepSeek的代码模型能力突出,但尚未形成高频使用的产品化工作流。Claude Code的成功证明,AI编程的竞争已转向争夺开发者工作流入口。 此前,一个名为DeepSeek-TUI的开源终端智能体项目在社区走红,它展示了开发者对DeepSeek版Claude Code的强烈需求,但也凸显了官方产品的缺失。官方Harness团队的优势在于能与模型团队深度协作,实现“模型与Harness的共同进化”,并将真实任务反馈系统性地注入模型迭代,形成数据闭环。 此举标志着DeepSeek在模型能力之外,开始全力构建其智能体产品的关键组成部分,正式进入以工作流为核心的“智能体战争”新阶段。

链捕手05/22 02:14

知情人士:DeepSeek正在组建Harness团队,对标Claude Code

链捕手05/22 02:14

活动图片