Anthropic公开信:虚伪的Sam Altman,PUA大师

marsbit發佈於 2026-03-05更新於 2026-03-05

文章摘要

Anthropic CEO Dario Amodei在内部备忘录中强烈批评OpenAI与五角大楼的合作,指责其安全机制多为“安全表演”,实际无法有效防止AI滥用。Amodei揭露OpenAI合作模式中模型本身无使用限制,仅依靠“安全层”进行应用拦截,但该机制在军事应用中八成无效,因模型无法判断上下文,易被越狱攻击绕过。他还指控OpenAI CEO Sam Altman通过公关手段掩盖真相,与政府配合营造虚假安全叙事,并质疑五角大楼在合作中区别对待两家公司,拒绝Anthropic提出的关键安全条款。Amodei指出,真实分歧源于政治因素,包括OpenAI对特朗普政府的捐款和支持,而Anthropic坚守自主武器和大规模监控红线。他警告员工警惕Altman的“煤气灯操控”,并呼吁行业认清安全表演的危害。

编者按:就在 OpenAI 宣布与五角大楼达成 AI 合作协议的数小时前,五角大楼刚刚以 Anthropic 坚持安全条款为由终止双方合作。随后,Anthropic CEO Dario Amodei 向员工发布了一封措辞异常激烈的内部备忘录,直指 OpenAI 所宣称的「安全机制」大多只是「安全表演」,并质疑其在自主武器与大规模监控问题上的立场。

在这封约 1600 字的邮件中,Amodei 不仅披露了双方与美国国防体系谈判的部分细节,也将矛头直接指向 OpenAI CEO Sam Altman,指责其通过公关叙事掩盖真实的合作结构。这场围绕 AI 军事应用、安全红线与政治关系的争议,正在把硅谷两大 AI 公司之间的分歧推向台前。

以下为原文:

我想把 OpenAI 当前释放的信息,以及这些信息中存在的虚伪之处,说得非常清楚。这正是他们真实的做法,我希望大家都能看清。

尽管我们对他们与战争部(DoW)签署的合同仍有许多未知之处(甚至他们自己可能也未必完全清楚,因为合同条款很可能相当模糊),但有几点是可以确定的:从 Sam Altman 和战争部的公开描述来看(当然还需要看到合同文本才能最终确认),他们的合作模式大致是这样的:模型本身没有任何法律层面的使用限制,即所谓「所有合法用途」;同时设置一层所谓的「安全层」。在我看来,这种「安全层」本质上就是模型的拒绝机制,用来阻止模型完成某些任务或参与某些应用。

所谓的「安全层」,也可能指合作伙伴(例如 Palantir,Anthropic 服务美国政府客户时的商业伙伴)在谈判中试图向我们推销的方案。他们提出了一种分类器或机器学习系统,声称能够允许某些应用通过,同时拦截另一些应用。此外,也有迹象表明 OpenAI 会安排员工(FDE,即前线部署工程师)对模型的使用进行监督,以防止出现不当应用。

我们的总体判断是:这些方案并非完全没有作用,但在军事应用的语境下,大约 20% 是真实防护,80% 是安全表演。

问题的根源在于:模型是否被用于大规模监控或完全自主武器系统,往往取决于更广泛的上下文信息。模型本身并不知道自己处在什么样的系统中,它不知道是否有人类处于「回路之中」(human-in-the-loop,即自主武器问题的关键);也不知道它正在分析的数据来源是什么。例如,是美国国内数据还是境外数据,是企业在获得用户同意后提供的数据,还是通过灰色渠道购买的数据等等。

从事安全工作的人员对此早已深有体会:模型拒绝机制并不可靠。越狱攻击十分常见,很多时候只需要向模型谎报数据的性质,就可以绕过这些限制。

这里还有一个关键区别,使问题比普通安全防护更复杂:判断模型是否正在执行网络攻击,从输入和输出往往可以看出端倪;但判断攻击的性质以及具体上下文,却是完全不同的事情,而这恰恰是这里所需要的判断能力。在很多情况下,这项任务极其困难,甚至根本不可能完成。

Palantir 向我们推销的「安全层」(我想他们也向 OpenAI 推销了类似方案)情况更糟。我们的判断是,这几乎完全是一种安全表演。

Palantir 的基本逻辑似乎是这样的:「你们公司里可能有一些不满的员工,你们需要给他们一些东西来安抚他们,或者让正在发生的事情对他们不可见。这正是我们提供的服务。」

至于让 Anthropic 或 OpenAI 的员工直接监督部署的问题,我们几个月前在扩展机密环境下的可接受使用政策(AUP)时也进行过内部讨论。结论非常明确:这种方式只在极少数情况下可行。我们会尽力尝试,但它绝不是可以依赖的核心保障机制,在机密环境中尤其难以实施。顺便说一句,我们确实已经在尽可能这样做,在这一点上我们与 OpenAI 并没有区别。

因此我要说的是:OpenAI 采取的这些措施基本无法解决问题。


他们之所以接受这些方案,而我们没有,本质原因在于:他们关注的是如何安抚员工,而我们真正关心的是防止滥用。

这些方案并非毫无价值,我们自己也在使用其中的一部分,但它们远远不足以达到应有的安全标准。同时,战争部在对待 OpenAI 和我们时显然并不一致。

事实上,我们曾尝试在合同中加入与 OpenAI 类似的一些安全条款(作为 AUP 的补充。在我们看来,AUP 才是更重要的部分),但战争部拒绝了。相关证据就在当时的邮件讨论链中。由于我现在事务繁多,可能会让同事之后去查找具体措辞。因此,「OpenAI 的条款曾提供给我们而被我们拒绝」这一说法并不属实;同样,「OpenAI 的条款能够有效阻止大规模国内监控或完全自主武器」这一说法也不属实。

此外,Sam 和 OpenAI 的表述还暗示,我们提出的红线,即完全自主武器与大规模国内监控,本身已经是违法行为,因此相关使用政策是多余的。这种说法与战争部的表态几乎完全一致,看起来像是事先协调好的。

但这并不符合事实。

正如我们昨天在声明中解释的那样,战争部确实拥有进行国内监控的权限。过去在没有 AI 的时代,这些权限的影响相对有限,但在 AI 时代,其意义已经完全不同。

举例来说:战争部可以合法地从供应商处大量购买美国公民的私人数据(这些供应商通常通过隐蔽的用户同意条款获得转售权),随后利用 AI 对这些数据进行大规模分析,用于建立公民画像、评估政治倾向、追踪现实空间中的行动轨迹,他们能够获得的数据甚至包括 GPS 信息等等。

还有一点值得注意:在谈判接近尾声时,战争部提出,如果我们删除合同中一条关于 「大规模采购数据分析」(analysis of bulk acquired data) 的具体表述,就愿意接受我们的全部其他条款。而这一条恰恰是合同中唯一精准对应我们最担心情景的条文。我们对此感到非常可疑。

在自主武器问题上,战争部声称「人类在回路中」是法律要求。但事实并非如此。这实际上只是拜登政府时期的一项五角大楼政策,要求在武器发射决策中必须有人类参与。而这项政策可以由现任国防部长 Pete Hegseth 单方面修改——这正是我们真正担心的地方。因此,从现实角度来看,这并不是一个真正的约束。

OpenAI 与战争部在这些问题上的大量公关说辞,要么是在撒谎,要么是在刻意制造混淆。这些事实揭示了一种行为模式,而这种模式我在 Sam Altman 身上已经见过很多次。我希望大家能够识别它。

今天早上,他先表示自己认同 Anthropic 的红线,这样做的目的是显得支持我们,从而分走一些功劳,同时在他们接手这份合同时避免受到批评。他还试图把自己塑造成一个希望「为整个行业制定统一合同标准」的角色——也就是和平缔造者与交易撮合人。

但在幕后,他正在与战争部签署合同,准备在我们被标记为供应链风险的那一刻取代我们。

同时,他必须确保这一过程看起来不像是「在 Anthropic 坚守红线时,OpenAI 却放弃了底线」。之所以能做到这一点,是因为:

第一,他可以签署所有我们拒绝的「安全表演」措施,而战争部及其合作伙伴也愿意配合,把这些措施包装得足够可信,以安抚他的员工。

第二,战争部愿意接受他提出的一些条款,而当初我们提出同样内容时却遭到了拒绝。

正是这两点,使得 OpenAI 可以达成协议,而我们无法做到。

战争部以及特朗普政府不喜欢我们的真正原因是:我们没有向特朗普进行政治捐款(而 OpenAI 以及 Greg Brockman 捐了很多);我们没有对特朗普进行独裁式的赞美(而 Sam 做了);我们支持 AI 监管,而这违背了他们的政策议程;我们在许多 AI 政策问题上选择说实话(例如 AI 对就业的替代问题);以及,我们确实坚守了红线,而不是与他们一起制造「安全表演」来安抚员工。

Sam 现在正在试图把这一切描述成:我们难以合作、我们态度强硬、我们缺乏灵活性等等。我希望大家认识到,这正是一种典型的 煤气灯操控(gaslighting)。

「某个人不好合作」这种模糊的说法,往往被用来掩盖真正难看的原因——也就是我刚刚提到的那些:政治捐款、政治忠诚,以及安全表演。

每个人都需要理解这一点,并在私下与 OpenAI 员工交流时反驳这种叙事。

换句话说,Sam 正在以「支持我们」的姿态削弱我们的立场。我希望大家对此保持清醒:他通过削弱公众对我们的支持,让政府更容易对我们进行惩罚。甚至,我怀疑他可能还在暗中推波助澜,虽然这一点我目前没有直接证据。

在公众和媒体层面,这种话术与操控似乎已经失效。大多数人都认为 OpenAI 与战争部的交易值得警惕,甚至令人不安,同时把我们视为坚持原则的一方(顺便说一句,我们现在已经是 App Store 下载榜第二名了)。

【注:随后 Claude 升至 App Store 第一。】

当然,这套叙事在一些推特上的蠢货那里起了作用,不过这并不重要。我真正担心的是:确保它不会在 OpenAI 的员工内部产生影响。

由于筛选效应,他们本来就是一群相对容易被说服的人。但反驳 Sam 正在向自己员工兜售的这些叙事,依然十分重要。

相關問答

QAnthropic CEO Dario Amodei 在内部备忘录中主要批评了OpenAI的哪些方面?

ADario Amodei 批评OpenAI的‘安全机制’大多是‘安全表演’,质疑其在自主武器和大规模监控问题上的立场,指责Sam Altman通过公关叙事掩盖真实合作结构,并认为OpenAI接受的安全方案本质是为了安抚员工而非真正防止滥用。

Q根据文章,OpenAI与五角大楼的合作模式大致是怎样的?

AOpenAI与五角大楼的合作模式是模型本身没有法律层面的使用限制(即‘所有合法用途’),但设置一层所谓的‘安全层’,这包括模型的拒绝机制、可能的分类器或机器学习系统来允许或拦截应用,以及安排员工对模型进行监督以防止不当应用。

QAnthropic为什么拒绝与五角大楼的合作?

AAnthropic拒绝合作是因为他们坚持在合同中明确禁止完全自主武器和大规模国内监控的红线条款,而五角大楼要求删除相关具体表述;同时,Anthropic认为OpenAI接受的‘安全表演’措施不足以达到真正的安全标准,且合作被拒还与政治因素如缺乏对特朗普的政治捐款和支持AI监管有关。

Q文章中提到‘安全表演’具体指什么?为什么Anthropic认为其无效?

A‘安全表演’指OpenAI和合作伙伴(如Palantir)提出的安全措施,如模型拒绝机制或分类器系统,这些在Anthropic看来主要是为了安抚员工而非有效防止滥用。Anthropic认为其无效是因为模型无法理解上下文(如数据来源或人类是否在回路中),越狱攻击常见,且判断攻击性质在军事应用中极其困难甚至不可能。

QSam Altman被指责使用了哪些策略来削弱Anthropic的立场?

ASam Altman被指责通过公关上声称认同Anthropic的红线来分走功劳和避免批评,同时签署‘安全表演’措施并与五角大楼合作取代Anthropic;他还试图将Anthropic描绘为‘难以合作’来掩盖真实原因(如政治捐款和忠诚问题),这是一种煤气灯操控策略,旨在削弱公众对Anthropic的支持并使政府更容易惩罚Anthropic。

你可能也喜歡

BTC“数字黄金”的叙事是不是失败了?

这篇文章从三个核心问题探讨了比特币的现状与未来,强调提供的是思考框架而非投资建议。 **如何看待比特币资产?** 作者认为比特币是一种全新的、更优秀的“黄金”资产。其优势在于总量恒定、转移便捷、交易可审计。尽管早期与灰色地带关联,但合规化是趋势。目前全球数字货币渗透率仅3%-4%,类比互联网和电商的早期阶段,意味着比特币仍处于发展初期,潜力巨大但波动性也极高。 **如何理解本轮下跌?** 比特币自2025年10月高点(近12.6万美元)持续下跌,2026年2月一度跌破6.1万美元,单日跌幅达15%,随后又快速反弹。这被解读为遵循四年减半周期的共识性获利了结。特别之处在于,美国比特币ETF的批准引入了机构资金,也促使早期低成本持有者(如矿工和信仰者)进行大规模“换手”,这是资产迈向主流化的必经过程。历史数据显示,比特币历次大跌的幅度在收窄(从93%到当前的约50%),表明资产正在成熟,波动率逐步下降,但高波动仍是其获取超额回报的固有特征。 **长期如何看待发展?** 长期价值可对标黄金。当前比特币市值仅为黄金市值的约7%,若“数字黄金”叙事实现一半,上行空间依然显著。但作者提醒,短期市场脆弱,换手可能未完,底部无法预测。真正的风险并非资产归零(概率较低),而在于错误的仓位管理(如All-in或加杠杆)以及对资产缺乏深刻理解。投资者必须计算并承受潜在的最大回撤(例如从已跌50%的位置再跌50%),才能存活至长期价值兑现。 文章最后以亚马逊在互联网泡沫后暴涨为例,指出关键不在于比特币未来是否上涨,而在于投资者能否通过理性的仓位管理和深度认知,扛过剧烈波动存活到那一天。文末提问引导读者反思:当前黄金涨、比特币跌的局面,究竟意味着“数字黄金”叙事失败,还是资产进化过程中的换手阵痛?这取决于每个人对比特币最底层的信仰。

marsbit3 小時前

BTC“数字黄金”的叙事是不是失败了?

marsbit3 小時前

BTC“数字黄金”的叙事是不是失败了?

标题:BTC“数字黄金”的叙事是不是失败了? 作者:@wuk_Bitcoin 本文从三个核心问题出发,探讨比特币的现状与未来。 **如何看待比特币?** 作者认为比特币是一种全新的、更优秀的“黄金”类资产。其优势在于:总量恒定(2100万枚);资产可转移性极强,在全球不确定性时代具备溢价;所有交易链上可审计,透明度高。反驳了比特币主要用于灰色地带的过时观点,指出其正走向合规。目前全球数字货币渗透率仅约3%-4%,类比互联网和电商早期,意味着该资产类别仍处早期,潜力与巨大波动并存。 **如何理解本轮下跌?** 比特币自2025年10月高点(近12.6万美元)持续下跌,2026年2月初曾单日暴跌15%,跌破6.1万美元。这被视为遵循其四年减半周期的规律性回调,是长期持有者在周期高点锁定利润的结果。本轮下跌的特殊性在于:美国比特币ETF的批准引入了大量机构新资金,但也促使成本极低的早期持有者(矿工、OG)进行历史性抛售,即从“早期信仰者”向“长期配置机构”的换手过程。历史数据显示,比特币历次大回撤的跌幅在逐步收窄(从93%到目前的约50%),表明资产在成熟,波动率在下降,但高波动仍是获取超额回报的代价。 **长期怎么看?** 若将比特币视为“数字黄金”,其当前总市值(约1.4万亿美元)仅为黄金总市值(约20万亿美元)的7%。即使该叙事仅部分实现,上行空间依然可观。但作者强调短期风险:换手可能未结束,市场脆弱,不排除进一步下跌。真正的风险不在于资产归零(概率极低),而在于错误的仓位管理(如All-in、加杠杆)和对资产缺乏深度理解,这可能导致投资者无法承受巨大波动而提前被迫出局。 **最后对比** 作者以亚马逊在互联网泡沫破裂后股价跌95%又最终上涨42倍为例,指出关键在于“活着等到那一天”。对于比特币,核心同样是能否通过理性仓位管理活到其价值兑现之时。文末提问:当黄金大涨而比特币大跌,这究竟是“数字黄金”叙事的失败,还是资产进化过程中的阵痛?答案取决于每个人对比特币最底层的信仰。

链捕手4 小時前

BTC“数字黄金”的叙事是不是失败了?

链捕手4 小時前

从代码到认知:机器人大脑进化的万字指南

本文概述了机器人大脑从传统代码控制到现代人工智能模型驱动的演进历程。文章首先回顾了前大型语言模型(LLM)时代,机器人依赖手工编码的模块化技术栈(感知、状态估计、规划、控制)和行为树,虽稳定但泛化能力差。随后,深度学习改进了感知,强化学习和模仿学习进入了控制层,但策略仍较为狭窄。 ChatGPT的出现带来了转折。LLM最初被用作自然语言编译器,将指令转化为机器人可执行的原子技能序列(如谷歌的SayCan)。但更重要的突破是视觉-语言-动作模型(VLA),例如谷歌的RT-2和开源的OpenVLA,它能将视觉、语言信息融合,直接输出动作指令,实现了推理与行动的耦合。 目前最先进的系统采用“双脑”架构(如Figure AI的Helix、NVIDIA GR00T):一个慢速、参数多的“系统2”负责高层次推理和规划;一个快速、小巧的“系统1”负责高频动作生成。其下还可能有一个“系统0”反射层处理平衡等底层控制。出于延迟和可靠性考虑,安全关键的控制回路通常在机器人本地(如NVIDIA Jetson模块)运行,而对话界面和集群学习等任务可交由云端。 开源模型(如OpenVLA、GR00T、π0)降低了行业门槛,让初创公司能在其基础上用自有数据微调。然而,当前VLA机器人仍存在任务中途恢复能力弱、样本效率低、缺乏物理常识和长期规划能力等局限。 这催生了下一代方向:世界模型。这类模型(如NVIDIA Cosmos、Meta V-JEPA)能根据当前状态和动作预测未来结果,让机器人在行动前进行模拟和评估,从而改善恢复能力、泛化能力和长期规划。架构上主要分为像素级视频扩散、联合嵌入预测架构(JEPA)和潜在动作世界模型等流派。 文章最后指出,数据采集(特别是远程操作数据)是核心竞争力,仿真训练至关重要,机器人成本正在迅速下降。当前物理AI的发展阶段大约相当于“GPT-2时代”,虽未完全自主,但正通过架构的持续演进(从代码到感知、规划、策略,最终到世界模型),朝着更通用、更强大的方向稳步前进。

marsbit4 小時前

从代码到认知:机器人大脑进化的万字指南

marsbit4 小時前

AI 泡沫正在破裂

近期市场剧烈波动,“AI泡沫论”甚嚣尘上。桥水达利欧认为AI市场存在“相对较高”的泡沫,而英伟达黄仁勋则强调AI算力需求才刚刚开始。两者观点看似矛盾,实则揭示了技术革命初期的典型特征:市场因高估短期影响而产生泡沫,却往往低估其长期颠覆性力量。 回顾2000年互联网泡沫,纳指暴跌78%,超5万亿美元财富蒸发,大量公司破产。然而,泡沫破裂后留下的廉价电信基础设施(如海底光缆),却成为日后流媒体、云计算乃至移动互联网崛起的基石。这符合“阿玛拉定律”:人们高估技术的短期影响,低估其长期影响。泡沫是创新必须缴纳的“智商税”,其破裂能淘汰投机者,沉淀下坚固的基础设施,滋养真正伟大的公司。 当前AI行业同样呈现巨大的“投入-产出”不对称:2026年,五大云服务商的AI基础设施资本开支预计达6900亿美元,而头部纯AI厂商的总收入预计不超过400亿美元。但深层逻辑正在演变:AI推理成本在两年内暴跌超过99.7%,接近零的边际成本解锁了海量长尾需求,驱动企业AI支出翻倍增长。这印证了“杰文斯悖论”——效率提升导致总消耗量指数级上升。如今,各行业关心的已非“是否用AI”,而是如何更有效地整合AI。 市场已进入“幻灭的低谷”前夕,缺乏护城河的套壳公司正批量死亡,这是市场的自我净化。与此同时,价值转移正在发生:1. 从资本开支(CapEx,如硬件)向运营开支(OpEx,如解决垂直行业痛点的应用)转移;2. 高估值正被高速增长的业绩逐步消化。AI已深入制造业(缩短研发周期)、金融(微秒级定价)、法律、医疗等专业领域,成为实质性的生产力工具。 历史总在重演“创造性毁灭”。当下近7000亿美元的基建投资短期内无法全部转化为利润,市场洗牌不可避免。但洗牌之后,廉价的算力与高度优化的算法将赋能千行百业。正如互联网泡沫后我们迎来了数字时代,AI泡沫的喧嚣过后,我们将不可逆转地迈向一个所有行业都由AI深度赋能的智能全盛时代。泡沫终会破裂,但底层先进生产力的势能,没有水分。

链捕手4 小時前

AI 泡沫正在破裂

链捕手4 小時前

交易

現貨
合約
活动图片