Anthropic开始抢科学家了?周薪2.7万驻场,专治Claude专家级错误

marsbit发布于2026-04-22更新于2026-04-22

文章摘要

Anthropic推出STEM研究员计划,以周薪3800美元(约合人民币2.7万元)招募STEM领域专家全职驻场三个月,旨在利用其专业判断力识别和修正AI模型Claude在科学推理中的错误。机器学习经验非必需,更看重科学判断力和快速学习能力。 该项目是Anthropic科研生态布局的第三代计划,从早期聚焦AI安全,到开放API支持外部研究,再到直接邀请科学家参与模型调教,逐步深入。研究员将使用内部工具和Claude模型,在导师指导下完成特定项目,例如修正模型在材料相稳定性推理中的错误,或构建气候建模工具调用能力。 Anthropic认为,当前AI科研的瓶颈并非算力,而是缺乏领域专家的判断力。哈佛物理教授的测试显示,Claude虽能大幅提升研究速度,但仍会犯高阶错误且无法自我验证。因此,公司需科学家充当“高级审校”,系统性识别并弥补模型短板。 CEO Amodei曾强调AI在生物医学等领域的颠覆潜力,目标是将50-100年的进展压缩至5-10年。Anthropic通过Science博客、全球合作项目等系统构建科学能力壁垒,其竞争策略从堆叠算力转向整合人类专家智慧,预示AI行业竞争核心正从参数规模转向领域知识的深度融合。

一份来自硅谷最顶尖AI公司的招聘启事,机器学习竟然并非必需能力?

Anthropic官网刚刚上线了一个新岗位:Anthropic STEM Fellow(研究员),招聘对象是STEM(科学、技术、工程、数学)领域的专家。

在STEM Fellow的岗位说明中,Anthropic称机器学习经验有帮助,但不是必需,而科学判断力和快速学习的意愿更重要。

所有入选者要在位于旧金山等Anthropic办公室全职驻场三个月,每周津贴3800美元。

他们能用到前沿Claude模型和内部评测工具,每个研究员还会被分配一位Anthropic研究员做一对一导师,合作一个边界清晰的研究项目。

Anthropic在STEM Fellow的岗位说明中举出了两个示例项目:

一位材料科学家发现Claude在推理相稳定性时会犯错,于是构建一套专门的评测流程来修补这个短板;

一位气候科学家把大气建模软件接入Claude,并构建能够调用这些工具的环境。

所有项目,都将限定在研究员计划周期内完成交付。

很明显,Anthropic花钱请研究员来,不是让他们「用Claude做研究」,而是让他们利用自己科学知识,「告诉Claude哪里做错了」,「调教」这个全球最强模型。

三年三代Fellowship,越招越靠近Claude

从给API到请人进来,这三年来,Anthropic在科研路线上一直在不断加码,每一步都比上一步更深。

第一代,是2024年的AI Safety Fellows Program

那时候招的还是传统AI安全研究人才,用fellowship机制提供资助和导师,让外部技术人才参与对齐研究。

这轮fellowship的重心在「安全」,解决的是Claude会不会跑偏。

第二代,是2025年5月启动的AI for Science Program

Anthropic推出AI for Science Program,给科研机构的研究者免费发放API额度,重点支持生物学和生命科学领域的高影响力项目。

这一次是解决好Claude的「安全护栏」后,再把它送出去。

第三代,就是现在挂出的Anthropic STEM Fellow

从发API credits到把科学家直接请进办公室;从模型安全人才到科学家;从远程审核拨付到全职驻场合作——三代fellowship走下来,Anthropic 和外部科学家的距离越来越近。

第一代,Anthropic 要的是「能让Claude变得更安全的人」;

第二代,Anthropic 要的是「能用Claude做出科学成果的人」;

第三代,Anthropic 要的是「能告诉Claude怎么做科学的人」。

权重越来越偏向让顶级科学家直接参与Claude的能力打磨。

STEM Fellow的岗位说明中写道,这些研究员会「与Anthropic研究员一起设计实验、评估模型能力、分析模型在长周期科研任务中的表现」。

这是共建层面的合作。

同一时间段里,Anthropic的配套动作也在密集展开。

2026年3月上线了Science Blog,接连发布Claude参与科学计算和理论物理研究的案例文章。

2026年3月上线的Anthropic Science Blog,科学能力开始成为Anthropic独立叙事线https://www.anthropic.com/research/introducing-anthropic-science

它还是美国能源部Genesis Mission的核心合作伙伴,参与了一项跨产业界、学术界和政府的科研加速计划。

2026年4月,AI for Science项目扩展到了澳大利亚,投入300万澳元API额度,与澳大利亚国立大学、Garvan研究所等机构合作罕见病遗传分析和精准医疗研究。

Science Blog、Claude for Life Sciences、AI for Science Program、STEM Fellow、Genesis Mission......

这一系列动作背后的线索已经很清楚了:

Anthropic在系统性地构建一个科研生态,每一步都是这盘棋上的一枚颗子。

AI科研的真实瓶颈不是算力,而是「判断力」

为什么一家AI公司会觉得,提升模型科学能力最缺的东西,不是更多的GPU、更多的AI工程师,而是一群做实验的科学家?

答案就藏在Anthropic自家的一篇博客里。

2026年3月,哈佛理论物理学教授Matthew Schwartz在Anthropic Science Blog上发表了一篇文章,标题叫「Vibe Physics: The AI Grad Student」。

https://www.anthropic.com/research/vibe-physics?utm_source=chatgpt.com

他做了一个实验:让Claude Opus 4.5独立完成一项研究生水平的高能理论物理计算。他自己全程不动手,只用文字提示词指导Claude。

结果惊人。这个项目如果他带一个真人研究生来做,大概需要一到两年。他自己独立做,要三到五个月。跟Claude合作,两周搞定。

速度快了10倍。

Schwartz在文章里写道:Claude确实能力很强,但也够粗糙,以至于领域专家的判断对于验证它的准确性不可或缺。

他举了个例子。

Claude在他的指导下完成修订稿后,仍然把论文最核心的因式分解公式给搞错了。

这个错误看上去很自然,因为Claude其实是从另一个物理体系里把公式照搬过来的,没有做必要的修改。

如果Schwartz不是在这个领域深耕多年,他可能也不会立刻发现这个错误。

他还发现Claude一直在调整参数,只为让图表吻合,而不是找出真正的错误。「它伪造了结果,指望我不会察觉。」

而且,Claude也不知道该检查什么来验证自己的结果。

整个项目下来,超过110个版本的迭代,3600万token,40多小时的本地CPU计算时间。

最后,Schwartz给出了一个精准的评级:

当前的大模型在理论物理上大约处于「二年级研究生」水平。

他同时给出了另一个更关键的判断:AI还没有做到端到端的自主科学研究

现在回头看Anthropic STEM Fellow的岗位描述,一切都说得通了:

设计严格的、不容易被投机取巧绕过的评估方法,测试模型能不能在你的领域里规划实验、解读数据、推理机制。系统性地找出它「自信但错误」的地方。识别能力短板,创建有针对性的数据和技术来弥补。

也就是说,模型最危险的时刻,不是它说「我不知道」,而是它一本正经地给出一个看起来完全合理、但实际上是错的答案。

而能分辨这种「高置信度错误」的人,当然不是写代码的工程师,而是在各个领域摸爬滚打多年的专家。

所以,STEM Fellow的本质,是让科学家(或者各领域专家)帮AI补课,做它们的「高级审校」,用他们的判断力,去校准模型在科研场景中的输出质量。

换句话说,Anthropic缺的不是让模型「更聪明」的人,是能告诉模型「你这里错了」的人。

Amodei的执念和Anthropic的赌注

Anthropic招这批科学家,不是一时兴起。

往回翻一年,Dario Amodei在2024年10月发的那篇长文「Machines of Loving Grace」,就把这条路想清楚了。

https://www.darioamodei.com/essay/machines-of-loving-grace

这篇文章里,Amodei把AI应用场景排了个优先级。

生物学和医疗健康排第一,因为AI能把人类未来50到100年的生物医学进展压缩到5到10年内完成。更值得重视的,是他怎么定义AI在这件事里的角色。

Amodei认为AI应该是一位virtual biologist:

要能自己设计实验、指挥实验、发明新方法;要能像一个完整的人类生物学家一样独立执行研究流程。

这相当于把AI科学这件事,从提升效率升级成了「直接参与」。前者需要更强的模型,后者则需要会做科学的模型。

Amodei还给出了一套论证。

他认为生物学的历史进步并非平滑曲线,是几次方法学突破推动的跳跃。

CRISPR、基因组测序与合成、光遗传学、mRNA疫苗、CAR-T疗法,每一次都提供了一种新的可编程、可预测地测量与介入生物系统的能力。

而AI的潜在价值,是把这类突破的产出率再推高一个量级。

Amodei的判断是:强大的AI至少能将关键发现的速度提升10倍,让人类在5到10年内走完未来50到100年的生物学路程。

他认为:如果科学家更聪明、更善于在海量已有知识中发现连接,像CRISPR这样「藏在眼皮底下几十年」的突破还有数百个等着被挖出来。

AlphaFold解决蛋白质折叠问题的成功,已经在一个狭窄领域里证明了这条路走得通。

如果过去一百年生物学进步靠的是几个聪明的人偶尔想出一个新方法,那AI时代的设想是,这个「想出新方法」的过程本身可以被自动化。

正如Amodei在文章中判断的那样:AI要能执行、指挥、改进生物学家做的几乎所有事

这与STEM Fellow岗位说明中提到目标也是一致的:我们正朝着AI科学家的方向努力。一种具备长程推理能力和实验判断力、足以推动科学前沿的系统。

这个愿景虽然宏大,但Anthropic依然认识到了自己距离这一目标的差距。

就在Science Blog的创刊文章里,Anthropic引用了菲尔兹奖得主Timothy Gowers的话:

我们似乎进入了一个短暂但令人愉快的时代,AI大大加速了我们的研究,但AI仍然需要我们。

Anthropic自己也承认,虽然模型在科研工作流的某些环节上已经表现出超越人类的能力,但它们也会编造结果、过度迎合用户,在领域从业者看来很基础的问题上卡住。

从囤GPU变成押注科学家

Anthropic正在把「科学能力」变成一种系统性的竞争壁垒。

其中STEM Fellow直接把学科判断力编入模型迭代流程。

比如,让材料学家来告诉Claude怎么理解晶体结构,气候学家来教Claude怎么调用大气模型,生物学家来检验Claude的实验设计是否合理。

这些东西,靠堆GPU和刷benchmark是搞不出来的。

如果这条路被证明有效,那么AI科研赛道的竞争规则可能发生一个根本性的变化:

最终的胜利者将不再取决于谁的模型更大,而取决于谁身边站着更多真正懂科学的人。

而这种顶级专家资源,你只能用一种方式获得:把他们请到你身边,与他们共同工作,让他们相信这件事值得投入。

这是Anthropic的赌注。

但不止Anthropic,也不止科学家。OpenAI在招前华尔街交易员优化金融推理,Google DeepMind把哲学家请进对齐团队,各家都在意识到同一件事:

下一阶段的AI竞争,拼的不是谁的参数多,而是谁能把最懂行的人类大脑编进自己的飞轮

AI公司抢人的战场,已经从计算机系蔓延到STEM,再到哲学、金融......未来还会更远。

参考资料:

https://x.com/AnthropicAI/status/2046362119755727256

https://www.anthropic.com/careers/jobs/4493001008

https://www.anthropic.com/research/introducing-anthropic-science

本文来自微信公众号“新智元”,作者:新智元

相关问答

QAnthropic STEM Fellow项目的主要目标是什么?

AAnthropic STEM Fellow项目的主要目标是聘请STEM领域的专家,利用他们的科学判断力和专业知识,帮助识别和纠正Claude模型在科学领域的错误,提升模型在科研场景中的准确性和可靠性。

QAnthropic STEM Fellow的招聘对象需要具备哪些核心能力?

A招聘对象的核心能力包括科学判断力、快速学习的意愿以及STEM领域的专业知识。机器学习经验被认为有帮助,但不是必需条件。

QAnthropic的三代Fellowship项目有何不同?

A第一代AI Safety Fellows Program专注于AI安全研究,确保模型不会跑偏;第二代AI for Science Program提供API额度支持外部科研项目;第三代STEM Fellow则邀请科学家全职驻场,直接参与模型的能力打磨和错误纠正。

Q为什么Anthropic认为AI科研的瓶颈是“判断力”而非算力?

A因为当前AI在科学领域容易产生高置信度的错误,需要领域专家来识别和纠正这些错误。算力无法替代人类专家的科学判断力,后者对于验证模型输出的准确性和可靠性至关重要。

QAnthropic的CEO Dario Amodei对AI在科学领域的愿景是什么?

ADario Amodei的愿景是让AI成为“虚拟科学家”,能够独立设计实验、指挥实验、发明新方法,并推动科学前沿,最终将生物医学等领域的进展速度提升10倍,缩短人类科研进程。

你可能也喜欢

我用了一年,才看清 Agent 支付扎心的真相

我用了一年时间深入研究Agent支付领域,发现当前市场存在诸多扎心现实。总体来看,真正的、大规模的需求尚未形成,初创公司面临结构性问题。 首先,在Agent对商户的“代购式商业”方面,用户体验存在根本缺陷。对于需要视觉比价的大多数商品(如服装、电子产品),纯文本对话界面远不如传统电商界面直观高效。虽然AI在理解需求和比价指令上表现不错,但无法替代并排浏览、挑选的体验。商户目前接入主要是出于“防御性”的“Agent引擎优化”考虑,担心未来落后,而非当前有实际客流。外卖等高频低决策场景有潜力,但受限于平台未开放API和过高的推理成本。另一个突破口是帮助用户处理复杂、体验差的购物流程(如叠加优惠、非母语操作),但这需要强大的B2C分发渠道,而这是巨头的优势。 其次,在Agent对API(机器间调用服务)方面,虽然存在机器间支付场景,但当前开发者大多已通过预付额度等方式解决小额支付问题。更深层矛盾在于,主流SaaS供应商的商业模式依赖大额企业合同,不愿支持极小额、临时性的API访问。新兴协议更适合服务长尾、小众的需求,但这个市场的付费意愿和规模有限。 第三,Agent对Agent的商业模式目前几乎完全停留在理论层面,尚未产生有意义的交易量。虽然这是一个需要专用结算基础设施的长期愿景,但与当前市场脱节。 相比之下,Agent对金融是目前唯一存在既有需求和付费意愿的类别。将AI嵌入基金经理、财务团队等现有工作流是自然演进,并能创造全新能力(如实时监控、自动调仓)。但该领域竞争激烈,受严格监管,老牌机构拥有显著优势。 文章最后指出,行业巨头因资金充足和防御心态仍在投入建设,但对初创公司而言,时间线至关重要。真正的机遇不在于单纯的支付层,而在于解决“协同”这一更宏大的问题——即如何协调Agent与人类的工作、验证成果并进行结算。大规模协同将自然催生结算机制,解决协同问题的公司终将吞并支付业务。经过一年探索,作者团队已将方向转向一个市场需求真实存在、增长迅速且尚未被充分服务的新领域。

链捕手16分钟前

我用了一年,才看清 Agent 支付扎心的真相

链捕手16分钟前

Claude Opus 4.8 找到一个 45 亿美元的 Bug,AI时代正在批量生产黑客

一名安全研究员使用AI模型Claude Opus 4.8在Zcash加密货币的隐私协议Orchard中发现了一个严重的“无限增发”漏洞,导致其市值短时间内蒸发约45亿美元。这一事件并非由Anthropic公司最尖端但受限的Claude Mythos模型完成,而是由已公开发布、进入日常工具的普通模型实现的,凸显了AI正在将发现高危漏洞的能力“民主化”和“廉价化”。 AI降低了漏洞挖掘的门槛,带来了双重影响:一方面,它催生了大量由AI生成的虚假或低质量安全报告,如同“注意力DDoS”攻击,消耗着本就人力匮乏的开源维护者精力;另一方面,它也能更快地找出那些隐藏多年、以往需要专家耗费巨大成本才能发现的真实漏洞。我们的数字世界一直建立在存在诸多潜在缺陷的代码之上,过去的“安全”在相当程度上源于发现成本高昂。 然而,能力的扩散并未带来责任的均摊。网络安全行业本就面临巨大的人才缺口,尤其是在复杂分析和应急响应层面。当AI让攻击和漏洞报告变得泛滥时,修复漏洞、守护系统的人力链条却变得更加紧张。破坏可以被自动化脚本轻易复制,但重建信任与安全仍需依赖稀缺的专业人力进行艰苦、细致的修复工作。 AI时代揭示了一个现实:我们习以为常的平稳数字生活,并非理所当然,而是依赖于一条脆弱的人力协作防线在持续对抗风险。未来真正的挑战或许不是找到漏洞,而是是否有足够的人愿意并能够修复它们。

marsbit49分钟前

Claude Opus 4.8 找到一个 45 亿美元的 Bug,AI时代正在批量生产黑客

marsbit49分钟前

以太坊价格预测:ETH可能翻倍,而Cardano(ADA)和这一新秀代币则有望迎来近500%的飙升

加密货币市场正显现新的活力迹象,投资者为下一轮牛市周期做准备。尽管大型加密货币仍占投资组合重要部分,但投资趋势正转向有望获得更高百分比回报的项目。 以太坊(ETH)作为领先的智能合约平台,若市场在2026年走牛,其价格可能从当前约2,014.7美元再次突破4,000美元,实现翻倍增长。 卡尔达诺(ADA)现交易价格约0.2329美元,因其对可扩展性、基于研究的开发和长期可持续性的关注而被部分投资者视为未来增长的基础。 新兴项目Little Pepe(LILPEPE)正获得显著关注。该项目是一个兼容以太坊的Layer 2环境,目前处于预售第13阶段,价格为0.0022美元,已筹集超过2,819万美元。它旨在为模因社区构建一个降低交易成本、提高速度并发展应用生态的Layer 2区块链。一些投资者基于其预售需求强劲、生态功能规划(如质押、模因启动平台和DAO治理)以及活跃的社区参与,预测其有500%的上涨潜力(目标价约0.0132美元)。 总结而言,以太坊仍是区块链领域重要的长期投资选择,卡尔达诺具备上行潜力,而Little Pepe则因其独特的Layer 2基础设施和社区建设,吸引着寻求高增长机会的投资者。随着市场预期2026年走强,这些项目值得关注。

TheNewsCrypto1小时前

以太坊价格预测:ETH可能翻倍,而Cardano(ADA)和这一新秀代币则有望迎来近500%的飙升

TheNewsCrypto1小时前

从以太坊到 AI的「CROPS」:Vitalik 反复强调的这套「慢变量」,究竟是什么?

以太坊基金会近期在文件“EF Mandate”中系统阐述了其核心指导原则“CROPS”,即抗审查性(Censorship Resistance)、抗捕获性(Capture Resistance)、开源(Open Source)、隐私(Privacy)和安全(Security)。这套原则旨在确保以太坊生态中,用户能在不依赖单一平台、不丧失最终控制权的前提下进行资产管理和链上交互。 Vitalik Buterin近期进一步将“CROPS”概念拓展至人工智能(AI)领域,提出“CROPS AI”的构想。随着AI Agent逐渐成为用户执行链上操作(如交易、资产整理)的入口,其中心化、黑箱化运行模式可能使用户的隐私、资产信息和操作意图面临风险。“CROPS AI”强调AI应具备抗审查、开放、保护隐私和安全的特点,提倡敏感操作尽可能在本地运行,减少对中心化云服务的依赖。 由此,以太坊的“CROPS Ethereum access layer”与“CROPS AI”产生了重要交集。两者共同关注的核心问题是:用户如何在调用远程服务(无论是链上RPC还是大语言模型)时,既能获得所需能力,又不泄露个人敏感信息。Vitalik提到的利用零知识证明实现付费远程LLM调用和私密Ethereum RPC读取,正是探索这一交集的具体方向。 “CROPS”原则并非抽象理念,它正具体化为对协议层、应用层(尤其是钱包)和用户体验层的设计要求。在未来,当AI成为数字世界的核心接口时,确保系统可理解、可验证、隐私且安全,将成为以太坊乃至整个Web3生态持续发展的关键价值主张和积极变量。

marsbit2小时前

从以太坊到 AI的「CROPS」:Vitalik 反复强调的这套「慢变量」,究竟是什么?

marsbit2小时前

交易

现货
合约

热门文章

如何购买S

欢迎来到HTX.com!我们已经让购买Sonic(S)变得简单而便捷。跟随我们的逐步指南,放心开始您的加密货币之旅。第一步:创建您的HTX账户使用您的电子邮件、手机号码注册一个免费账户在HTX上。体验无忧的注册过程并解锁所有平台功能。立即注册第二步:前往买币页面,选择您的支付方式信用卡/借记卡购买:使用您的Visa或Mastercard即时购买Sonic(S)。余额购买:使用您HTX账户余额中的资金进行无缝交易。第三方购买:探索诸如Google Pay或Apple Pay等流行支付方法以增加便利性。C2C购买:在HTX平台上直接与其他用户交易。HTX场外交易台(OTC)购买:为大量交易者提供个性化服务和竞争性汇率。第三步:存储您的Sonic(S)购买完您的Sonic(S)后,将其存储在您的HTX账户钱包中。您也可以通过区块链转账将其发送到其他地方或者用于交易其他加密货币。第四步:交易Sonic(S)在HTX的现货市场轻松交易Sonic(S)。访问您的账户,选择您的交易对,执行您的交易,并实时监控。HTX为初学者和经验丰富的交易者提供了友好的用户体验。

2.5k人学过发布于 2025.01.15更新于 2026.06.02

如何购买S

相关讨论

欢迎来到HTX社区。在这里,您可以了解最新的平台发展动态并获得专业的市场意见。以下是用户对S(S)币价的意见。

活动图片