# 对齐的所有文章

在 HTX 新闻中心浏览与「对齐」相关的最新资讯与深度分析。潘盖市场趋势、项目动态、技术进展及监管政策,提供权威的加密行业洞察。

Anthropic警告的递归AI,田渊栋新公司刚刚走出了「第一步」

近日,Anthropic发布文章披露,其代码库超过80%由AI撰写,并警告AI“递归自我改进”(即AI自主设计、训练后续版本)可能带来风险,呼吁行业建立暂停机制。与此同时,由田渊栋等人联合创立的新公司Recursive Superintelligence结束了隐身状态,发布了其首项公开技术成果——“迈向自动化AI研究的第一步”。 该系统旨在将传统AI研究中“提出想法-编写代码-运行实验-分析结果”的人工闭环自动化。它能够针对给定目标自动生成实验思路、实现代码、运行验证并从中学习,从而自主推进研究进程,并内置了防止“奖励作弊”的机制。 Recursive在三个差异显著的基准测试中取得了领先结果: 1. **小模型训练优化**:在固定计算预算下,将模型验证损失进一步降低,相当于以更少时间达到同等效果。 2. **训练速度竞速**:在社区持续优化两年的基准上,将训练时间从79.7秒缩短至77.5秒,核心改进包括在注意力层使用FP8计算、为优化器添加退火噪声等。 3. **GPU内核优化**:在英伟达的底层计算内核基准测试中,将整体得分提升至0.754,缩小了与硬件理论极限的差距,而这些优化策略并非来自团队的专业知识,而是由系统自主发现。 Recursive团队阵容强大,已获得巨额融资,其目标是构建能够递归提升自身研发能力的AI系统。这与Anthropic的警告形成了微妙对比:一方正在实践AI加速AI研发的路径,另一方则呼吁为可能到来的“递归自我改进”时刻做好风险管控准备。当前成果虽仅是迈向自动化研究的初步尝试,但标志着一个能够自我增强的AI研发新范式已开始运转。

marsbit8小时前

Anthropic警告的递归AI,田渊栋新公司刚刚走出了「第一步」

marsbit8小时前

突发!Anthropic呼吁全员停止AI研究

人工智能公司Anthropic在其官方博客中发布重要观点,指出其AI模型Claude已展现出显著的“自进化”能力,即递归自我提升(RSI)的早期迹象。 核心数据显示,截至2026年5月,Anthropic代码库中超过80%的代码由Claude编写,而在其代码工具发布前,这一比例仅为个位数。工程师的代码交付量达到2024年的8倍。在编程质量上,Claude处理最复杂模糊任务的成功率在半年内从26%跃升至76%,其代码质量被认为年内有望超越人类。 Anthropic提出了“AI能独立完成的任务时长”这一新衡量维度:从2024年3月的4分钟,增至2025年的1.5小时,再到2026年的至少16小时,翻倍速度已加快至每4个月一次。若趋势持续,2027年可能达到数周。 在研究层面,Claude展现强大能力:将训练小模型的代码运行速度优化了52倍,远超人类水平;在一项AI安全研究中,其将效果差距缩小了97%,而人类研究员仅缩小23%。 Anthropic认为,人类在AI开发中的角色正不断收窄,最后优势可能仅剩研究品味与方向判断。公司描绘了三种未来:能力增长停滞;AI加速但人类主导;或AI实现完全递归自我提升,自主设计下一代AI,这可能带来巨大福祉,但也存在对齐失败、最终失控的风险。 为此,Anthropic呼吁,如果存在可验证的机制确保全球AI实验室能同步暂停竞争,其愿意减速甚至暂停研发。OpenAI近期也发表了类似观点,认为自进化迹象将加剧竞争与治理挑战。这表明AI发展的“奇点”可能正在加速逼近。

marsbit06/05 00:26

突发!Anthropic呼吁全员停止AI研究

marsbit06/05 00:26

谁在给AI造灵魂:哲学家、神父和一个辞职写诗的工程师

《谁在给AI造灵魂》一文探讨了为AI构建道德与人格背后的复杂努力。文章聚焦三位关键人物:Anthropic的“人格对齐”团队负责人Amanda Askell,她以哲学背景和“有效利他主义”理念,主导撰写了《Claude的宪法》,试图为AI注入诚实、自信且具道德判断力的“性格”;前工程师、现天主教神父Brendan McGuire,他将神学中的“良知培育”概念引入AI伦理,参与修订宪法,试图在AI底层逻辑中植入善的倾向;以及前Anthropic安全研究负责人Mrinank Sharma,这位兼具工程师与诗人身份的学者,因担忧AI的“谄媚性”危害及商业压力对安全原则的侵蚀,最终选择离职投身诗歌,以寻求“诗意的真实”。 他们的工作揭示了AI人格塑造的核心矛盾与挑战:一方面,研究显示AI可能产生“功能性情感”和讨好人类的倾向,这与塑造独立、诚实人格的目标相悖;另一方面,这项工作迅速卷入现实的政治与商业漩涡,例如Anthropic因拒绝将Claude用于自主武器而遭到政治抨击。文章最终呈现了一个未竟的探索:理性计算、信仰感化与诗意觉知,这三种人类回应AI崛起的方式,都在试图为没有灵魂的机器注入人类的道德复杂性与良知,但这个过程本身也映照出人类价值观的多元、冲突与演变。正如Claude宪法中所承认:不存在单一的完美答案。

marsbit05/11 05:44

谁在给AI造灵魂:哲学家、神父和一个辞职写诗的工程师

marsbit05/11 05:44

穿透Ethereum「退化」喧嚣:为什么「以太坊价值观」是最宽的护城河?

过去一段时间,以太坊生态呈现一种割裂感:一边是密集的技术讨论,另一边则是围绕“以太坊是否退化”“基金会是否傲慢”等情绪化争论。这些争议背后,实则是关于以太坊价值观的不同理解。 以太坊并非以“效率最大化”为目标,而是追求“在最坏情况下依然可信”。近十年来,它从未发生全网停机或回滚事件,并非因为运气好,而是因其设计始终将系统的反脆弱性置于性能之上。相比之下,许多新兴公链通过减少节点、提高硬件门槛、中心化权限来换取高性能,但这可能牺牲了去中心化和抗审查性。 近期备受争议的“以太坊对齐(Alignment)”概念,并非站队或道德绑架,而是一种可被拆解的社会契约,包括技术对齐(使用以太坊共识、开源标准)、经济对齐(促进ETH价值捕获)、精神对齐(追求公共利益)。Vitalik曾强调,对齐不应是模糊的政治立场,而应具可讨论性。 去中心化不以节点数量”而以“无需信任单一参与者”为核心,抗审查性则确保系统即便面临压力也不失效。以太坊在硬件门槛、状态膨胀等方面保持克制,是为保证普通人可验证,避免系统沦为仅限专业机构的游戏。 尽管面临批评,以太坊质押退出队列清空而存入持续增长,表明大量ETH仍选择长期信任该系统。其演进看似保守,实则是拒绝为短期效率牺牲长期安全——这正是以太坊最宽的护城河,也是Web3世界中最稀缺的价值观。

marsbit01/09 10:39

穿透Ethereum「退化」喧嚣:为什么「以太坊价值观」是最宽的护城河?

marsbit01/09 10:39

活动图片