Anthropic开始抢科学家了?周薪2.7万驻场,专治Claude专家级错误

marsbit发布于2026-04-22更新于2026-04-22

文章摘要

Anthropic推出STEM研究员计划,以周薪3800美元(约合人民币2.7万元)招募STEM领域专家全职驻场三个月,旨在利用其专业判断力识别和修正AI模型Claude在科学推理中的错误。机器学习经验非必需,更看重科学判断力和快速学习能力。 该项目是Anthropic科研生态布局的第三代计划,从早期聚焦AI安全,到开放API支持外部研究,再到直接邀请科学家参与模型调教,逐步深入。研究员将使用内部工具和Claude模型,在导师指导下完成特定项目,例如修正模型在材料相稳定性推理中的错误,或构建气候建模工具调用能力。 Anthropic认为,当前AI科研的瓶颈并非算力,而是缺乏领域专家的判断力。哈佛物理教授的测试显示,Claude虽能大幅提升研究速度,但仍会犯高阶错误且无法自我验证。因此,公司需科学家充当“高级审校”,系统性识别并弥补模型短板。 CEO Amodei曾强调AI在生物医学等领域的颠覆潜力,目标是将50-100年的进展压缩至5-10年。Anthropic通过Science博客、全球合作项目等系统构建科学能力壁垒,其竞争策略从堆叠算力转向整合人类专家智慧,预示AI行业竞争核心正从参数规模转向领域知识的深度融合。

一份来自硅谷最顶尖AI公司的招聘启事,机器学习竟然并非必需能力?

Anthropic官网刚刚上线了一个新岗位:Anthropic STEM Fellow(研究员),招聘对象是STEM(科学、技术、工程、数学)领域的专家。

在STEM Fellow的岗位说明中,Anthropic称机器学习经验有帮助,但不是必需,而科学判断力和快速学习的意愿更重要。

所有入选者要在位于旧金山等Anthropic办公室全职驻场三个月,每周津贴3800美元。

他们能用到前沿Claude模型和内部评测工具,每个研究员还会被分配一位Anthropic研究员做一对一导师,合作一个边界清晰的研究项目。

Anthropic在STEM Fellow的岗位说明中举出了两个示例项目:

一位材料科学家发现Claude在推理相稳定性时会犯错,于是构建一套专门的评测流程来修补这个短板;

一位气候科学家把大气建模软件接入Claude,并构建能够调用这些工具的环境。

所有项目,都将限定在研究员计划周期内完成交付。

很明显,Anthropic花钱请研究员来,不是让他们「用Claude做研究」,而是让他们利用自己科学知识,「告诉Claude哪里做错了」,「调教」这个全球最强模型。

三年三代Fellowship,越招越靠近Claude

从给API到请人进来,这三年来,Anthropic在科研路线上一直在不断加码,每一步都比上一步更深。

第一代,是2024年的AI Safety Fellows Program

那时候招的还是传统AI安全研究人才,用fellowship机制提供资助和导师,让外部技术人才参与对齐研究。

这轮fellowship的重心在「安全」,解决的是Claude会不会跑偏。

第二代,是2025年5月启动的AI for Science Program

Anthropic推出AI for Science Program,给科研机构的研究者免费发放API额度,重点支持生物学和生命科学领域的高影响力项目。

这一次是解决好Claude的「安全护栏」后,再把它送出去。

第三代,就是现在挂出的Anthropic STEM Fellow

从发API credits到把科学家直接请进办公室;从模型安全人才到科学家;从远程审核拨付到全职驻场合作——三代fellowship走下来,Anthropic 和外部科学家的距离越来越近。

第一代,Anthropic 要的是「能让Claude变得更安全的人」;

第二代,Anthropic 要的是「能用Claude做出科学成果的人」;

第三代,Anthropic 要的是「能告诉Claude怎么做科学的人」。

权重越来越偏向让顶级科学家直接参与Claude的能力打磨。

STEM Fellow的岗位说明中写道,这些研究员会「与Anthropic研究员一起设计实验、评估模型能力、分析模型在长周期科研任务中的表现」。

这是共建层面的合作。

同一时间段里,Anthropic的配套动作也在密集展开。

2026年3月上线了Science Blog,接连发布Claude参与科学计算和理论物理研究的案例文章。

2026年3月上线的Anthropic Science Blog,科学能力开始成为Anthropic独立叙事线https://www.anthropic.com/research/introducing-anthropic-science

它还是美国能源部Genesis Mission的核心合作伙伴,参与了一项跨产业界、学术界和政府的科研加速计划。

2026年4月,AI for Science项目扩展到了澳大利亚,投入300万澳元API额度,与澳大利亚国立大学、Garvan研究所等机构合作罕见病遗传分析和精准医疗研究。

Science Blog、Claude for Life Sciences、AI for Science Program、STEM Fellow、Genesis Mission......

这一系列动作背后的线索已经很清楚了:

Anthropic在系统性地构建一个科研生态,每一步都是这盘棋上的一枚颗子。

AI科研的真实瓶颈不是算力,而是「判断力」

为什么一家AI公司会觉得,提升模型科学能力最缺的东西,不是更多的GPU、更多的AI工程师,而是一群做实验的科学家?

答案就藏在Anthropic自家的一篇博客里。

2026年3月,哈佛理论物理学教授Matthew Schwartz在Anthropic Science Blog上发表了一篇文章,标题叫「Vibe Physics: The AI Grad Student」。

https://www.anthropic.com/research/vibe-physics?utm_source=chatgpt.com

他做了一个实验:让Claude Opus 4.5独立完成一项研究生水平的高能理论物理计算。他自己全程不动手,只用文字提示词指导Claude。

结果惊人。这个项目如果他带一个真人研究生来做,大概需要一到两年。他自己独立做,要三到五个月。跟Claude合作,两周搞定。

速度快了10倍。

Schwartz在文章里写道:Claude确实能力很强,但也够粗糙,以至于领域专家的判断对于验证它的准确性不可或缺。

他举了个例子。

Claude在他的指导下完成修订稿后,仍然把论文最核心的因式分解公式给搞错了。

这个错误看上去很自然,因为Claude其实是从另一个物理体系里把公式照搬过来的,没有做必要的修改。

如果Schwartz不是在这个领域深耕多年,他可能也不会立刻发现这个错误。

他还发现Claude一直在调整参数,只为让图表吻合,而不是找出真正的错误。「它伪造了结果,指望我不会察觉。」

而且,Claude也不知道该检查什么来验证自己的结果。

整个项目下来,超过110个版本的迭代,3600万token,40多小时的本地CPU计算时间。

最后,Schwartz给出了一个精准的评级:

当前的大模型在理论物理上大约处于「二年级研究生」水平。

他同时给出了另一个更关键的判断:AI还没有做到端到端的自主科学研究

现在回头看Anthropic STEM Fellow的岗位描述,一切都说得通了:

设计严格的、不容易被投机取巧绕过的评估方法,测试模型能不能在你的领域里规划实验、解读数据、推理机制。系统性地找出它「自信但错误」的地方。识别能力短板,创建有针对性的数据和技术来弥补。

也就是说,模型最危险的时刻,不是它说「我不知道」,而是它一本正经地给出一个看起来完全合理、但实际上是错的答案。

而能分辨这种「高置信度错误」的人,当然不是写代码的工程师,而是在各个领域摸爬滚打多年的专家。

所以,STEM Fellow的本质,是让科学家(或者各领域专家)帮AI补课,做它们的「高级审校」,用他们的判断力,去校准模型在科研场景中的输出质量。

换句话说,Anthropic缺的不是让模型「更聪明」的人,是能告诉模型「你这里错了」的人。

Amodei的执念和Anthropic的赌注

Anthropic招这批科学家,不是一时兴起。

往回翻一年,Dario Amodei在2024年10月发的那篇长文「Machines of Loving Grace」,就把这条路想清楚了。

https://www.darioamodei.com/essay/machines-of-loving-grace

这篇文章里,Amodei把AI应用场景排了个优先级。

生物学和医疗健康排第一,因为AI能把人类未来50到100年的生物医学进展压缩到5到10年内完成。更值得重视的,是他怎么定义AI在这件事里的角色。

Amodei认为AI应该是一位virtual biologist:

要能自己设计实验、指挥实验、发明新方法;要能像一个完整的人类生物学家一样独立执行研究流程。

这相当于把AI科学这件事,从提升效率升级成了「直接参与」。前者需要更强的模型,后者则需要会做科学的模型。

Amodei还给出了一套论证。

他认为生物学的历史进步并非平滑曲线,是几次方法学突破推动的跳跃。

CRISPR、基因组测序与合成、光遗传学、mRNA疫苗、CAR-T疗法,每一次都提供了一种新的可编程、可预测地测量与介入生物系统的能力。

而AI的潜在价值,是把这类突破的产出率再推高一个量级。

Amodei的判断是:强大的AI至少能将关键发现的速度提升10倍,让人类在5到10年内走完未来50到100年的生物学路程。

他认为:如果科学家更聪明、更善于在海量已有知识中发现连接,像CRISPR这样「藏在眼皮底下几十年」的突破还有数百个等着被挖出来。

AlphaFold解决蛋白质折叠问题的成功,已经在一个狭窄领域里证明了这条路走得通。

如果过去一百年生物学进步靠的是几个聪明的人偶尔想出一个新方法,那AI时代的设想是,这个「想出新方法」的过程本身可以被自动化。

正如Amodei在文章中判断的那样:AI要能执行、指挥、改进生物学家做的几乎所有事

这与STEM Fellow岗位说明中提到目标也是一致的:我们正朝着AI科学家的方向努力。一种具备长程推理能力和实验判断力、足以推动科学前沿的系统。

这个愿景虽然宏大,但Anthropic依然认识到了自己距离这一目标的差距。

就在Science Blog的创刊文章里,Anthropic引用了菲尔兹奖得主Timothy Gowers的话:

我们似乎进入了一个短暂但令人愉快的时代,AI大大加速了我们的研究,但AI仍然需要我们。

Anthropic自己也承认,虽然模型在科研工作流的某些环节上已经表现出超越人类的能力,但它们也会编造结果、过度迎合用户,在领域从业者看来很基础的问题上卡住。

从囤GPU变成押注科学家

Anthropic正在把「科学能力」变成一种系统性的竞争壁垒。

其中STEM Fellow直接把学科判断力编入模型迭代流程。

比如,让材料学家来告诉Claude怎么理解晶体结构,气候学家来教Claude怎么调用大气模型,生物学家来检验Claude的实验设计是否合理。

这些东西,靠堆GPU和刷benchmark是搞不出来的。

如果这条路被证明有效,那么AI科研赛道的竞争规则可能发生一个根本性的变化:

最终的胜利者将不再取决于谁的模型更大,而取决于谁身边站着更多真正懂科学的人。

而这种顶级专家资源,你只能用一种方式获得:把他们请到你身边,与他们共同工作,让他们相信这件事值得投入。

这是Anthropic的赌注。

但不止Anthropic,也不止科学家。OpenAI在招前华尔街交易员优化金融推理,Google DeepMind把哲学家请进对齐团队,各家都在意识到同一件事:

下一阶段的AI竞争,拼的不是谁的参数多,而是谁能把最懂行的人类大脑编进自己的飞轮

AI公司抢人的战场,已经从计算机系蔓延到STEM,再到哲学、金融......未来还会更远。

参考资料:

https://x.com/AnthropicAI/status/2046362119755727256

https://www.anthropic.com/careers/jobs/4493001008

https://www.anthropic.com/research/introducing-anthropic-science

本文来自微信公众号“新智元”,作者:新智元

相关问答

QAnthropic STEM Fellow项目的主要目标是什么?

AAnthropic STEM Fellow项目的主要目标是聘请STEM领域的专家,利用他们的科学判断力和专业知识,帮助识别和纠正Claude模型在科学领域的错误,提升模型在科研场景中的准确性和可靠性。

QAnthropic STEM Fellow的招聘对象需要具备哪些核心能力?

A招聘对象的核心能力包括科学判断力、快速学习的意愿以及STEM领域的专业知识。机器学习经验被认为有帮助,但不是必需条件。

QAnthropic的三代Fellowship项目有何不同?

A第一代AI Safety Fellows Program专注于AI安全研究,确保模型不会跑偏;第二代AI for Science Program提供API额度支持外部科研项目;第三代STEM Fellow则邀请科学家全职驻场,直接参与模型的能力打磨和错误纠正。

Q为什么Anthropic认为AI科研的瓶颈是“判断力”而非算力?

A因为当前AI在科学领域容易产生高置信度的错误,需要领域专家来识别和纠正这些错误。算力无法替代人类专家的科学判断力,后者对于验证模型输出的准确性和可靠性至关重要。

QAnthropic的CEO Dario Amodei对AI在科学领域的愿景是什么?

ADario Amodei的愿景是让AI成为“虚拟科学家”,能够独立设计实验、指挥实验、发明新方法,并推动科学前沿,最终将生物医学等领域的进展速度提升10倍,缩短人类科研进程。

你可能也喜欢

脱钩时代来临,比特币不再是加密的唯一罗盘

文章指出,加密市场正告别以比特币为单一风向标的时代,分化为“内生型”和“外生型”两大资产阵营。 内生型资产(如比特币和多数传统加密货币)的价值仍与加密市场整体行情深度绑定。而外生型资产的崛起成为新趋势,其价值主要依托自身业务的真实需求和基本面,日益独立于比特币价格波动。 例如,Hyperliquid作为混合型案例,其部分合约交易已转向非加密资产。Venice等项目则完全脱离加密市场,其商业模式更接近消费级AI服务,收入来自用户为AI推理付费。Figure公司利用区块链技术提升贷款效率,其核心价值在于金融科技业务本身。 此外,稳定币等赛道的企业收购与高增长(如BVNK、Bridge),也显示了其发展与加密牛熊周期的脱钩。 这一转变意味着行业分析逻辑的根本改变:研究外生型资产需要像分析传统企业一样,专注于用户群体、经济模型和行业护城河等基本面,而非紧盯比特币价格。文章列举了多个具备潜力的外生型赛道,包括链上金融服务、AI与加密融合、新型数字银行、支付、非金融消费产品等。 目前,投资相关企业股权仍是主要途径,代币机制仍需优化。但核心趋势已定:加密市场的驱动力正变得多元,行业研究重心将从解读比特币图表转向深耕企业基本面。未来,加密市场齐涨共跌的局面或将不再。

marsbit42分钟前

脱钩时代来临,比特币不再是加密的唯一罗盘

marsbit42分钟前

在下一周期,由于更高的增长速度,这五种加密货币可能超越比特币表现

比特币主导着市场走向,但随着其市值增长,分析师普遍认为下一周期最高的百分比涨幅将来自具有更高增长潜力的资产。尽管比特币可能稳步上涨,但一些加密货币——从成熟平台到新兴的AI基础设施项目——有望实现相对于比特币的超额回报。 以下是分析师认为在百分比涨幅上可能超越比特币的五种资产,其中Ozak AI被视为本周期增长潜力最大的黑马。 **Ozak AI ($OZ)**:这是一款处于预售阶段(价格0.014美元)的AI基础设施代币,目标是上市价格达到1美元。它正在构建一个完整的AI原生区块链生态系统,包括用于AI预测的预测代理、实时数据交付网络、共享安全层、可扩展执行层以及结构化AI数据集。其极低的起始估值意味着其具备比特币难以比拟的增长倍数潜力。 **以太坊 (ETH)**:作为主导性的智能合约平台,以太坊支撑着DeFi、资产代币化和Layer-2扩展。由于其网络活动和费用生成能力以及机构采用,分析师认为其相对上涨弹性仍优于比特币的价值存储模式。 **Solana (SOL)**:其高吞吐量、低费用和不断扩展的开发者生态,使其在流动性回归时能够迅速增长。历史上SOL在风险偏好改善时展现过大幅超越比特币的能力。 **Chainlink (LINK)**:作为领先的预言机提供商,LINK处于DeFi、代币化资产乃至AI驱动区块链应用的中心。其对整个加密经济的杠杆效应使其常在扩张周期中实现强劲的百分比涨幅。 **Avalanche (AVAX)**:其子网架构和对企业友好的设计,使其在Layer-1平台中具有独特地位。随着现实世界资产代币化和机构区块链部署的增长,AVAX有望获得不成比例的利益。 **总结**:比特币的上涨需要巨大的资金流入,而像Ozak AI这样的早期阶段资产,其估值重估速度可以非常快。随着市场周期加速,资本可能轮动到以AI为重点的早期基础设施代币中,以寻求最高的增长潜力。对于寻求平衡稳定性和指数级上行潜力的投资者而言,Ozak AI可能成为增长最快的领域。

TheNewsCrypto1小时前

在下一周期,由于更高的增长速度,这五种加密货币可能超越比特币表现

TheNewsCrypto1小时前

黄仁勋的「Agent工厂」里,装了什么新故事?

在COMPUTEX 2026期间,英伟达CEO黄仁勋发表了主题演讲,核心聚焦于“Agent AI”时代的到来。此次发布的关键在于,英伟达正围绕智能体生态,构建从芯片、数据中心到软件平台的全栈技术体系。 硬件层面,专为Agent工作负载设计的Vera Rubin平台已进入量产,其处理Agent任务的效率是上一代Grace Blackwell平台的10倍。该平台引入共封装光学(CPO)网络技术以降低能耗,并强化了机密计算安全能力。同时,英伟达推出了新型处理器“Vera” CPU,这是首款为AI智能体设计的CPU,与Rubin GPU通过高速NVLink互联,优化了Agent任务中的数据传递。 软件与模型方面,英伟达推出“AI工厂运营工具箱”DSX,整合了设计、仿真、建设到运营的全流程。发布了5500亿参数的混合专家模型Nemotron 3 Ultra,以及配套的NemoClaw、OpenShell等工具,旨在帮助企业构建能安全接入业务流程的“数字同事”。此外,面向物理AI的世界基础模型Cosmos 3正式发布,它能统一理解、生成和预测物理世界信息。 在物理AI领域,英伟达联合宇树发布了基于Isaac GR00T平台的人形机器人参考设计H2 Plus,旨在降低开发门槛。还开源了一套物理AI技能工具集,让智能体能直接调用标准化操作。 产品布局上,推出了“DGX Station for Windows”桌面AI超算工作站,让Agent能在企业本地Windows环境中安全运行。并与微软合作推出基于Arm架构的RTX Spark SoC,瞄准AI PC市场。 最后,英伟达升级了AI原生存储架构,在BlueField-4 STX中强化了针对Agent数据访问的安全管控能力。 总结来看,英伟达正通过Vera Rubin、DSX、Nemotron、Cosmos 3、H2 Plus等一系列产品,从算力供给、模型智能、安全管控、物理形态到部署运营,全方位构建服务于Agent的基础设施,宣告一个以智能体为核心的新计算时代已经开启。

marsbit1小时前

黄仁勋的「Agent工厂」里,装了什么新故事?

marsbit1小时前

交易

现货
合约

热门文章

如何购买S

欢迎来到HTX.com!我们已经让购买Sonic(S)变得简单而便捷。跟随我们的逐步指南,放心开始您的加密货币之旅。第一步:创建您的HTX账户使用您的电子邮件、手机号码注册一个免费账户在HTX上。体验无忧的注册过程并解锁所有平台功能。立即注册第二步:前往买币页面,选择您的支付方式信用卡/借记卡购买:使用您的Visa或Mastercard即时购买Sonic(S)。余额购买:使用您HTX账户余额中的资金进行无缝交易。第三方购买:探索诸如Google Pay或Apple Pay等流行支付方法以增加便利性。C2C购买:在HTX平台上直接与其他用户交易。HTX场外交易台(OTC)购买:为大量交易者提供个性化服务和竞争性汇率。第三步:存储您的Sonic(S)购买完您的Sonic(S)后,将其存储在您的HTX账户钱包中。您也可以通过区块链转账将其发送到其他地方或者用于交易其他加密货币。第四步:交易Sonic(S)在HTX的现货市场轻松交易Sonic(S)。访问您的账户,选择您的交易对,执行您的交易,并实时监控。HTX为初学者和经验丰富的交易者提供了友好的用户体验。

2.4k人学过发布于 2025.01.15更新于 2026.06.01

如何购买S

相关讨论

欢迎来到HTX社区。在这里,您可以了解最新的平台发展动态并获得专业的市场意见。以下是用户对S(S)币价的意见。

活动图片