Claude Science几周干完两年活，10倍科研提速真来了？

marsbit發佈於 2026-07-01更新於 2026-07-01

文章摘要

Anthropic近日推出Claude Science，这是一个面向科学家的AI工作台，旨在将科研流程整合为一条可审计的流水线，显著提升效率。据案例介绍，有神经科学家团队使用该工具将一篇长篇综述的写作时间从近两年压缩到几周。 Claude Science的关键在于整合碎片化的科研工具链。它能在同一环境中完成文献分析、计算、图表制作和论文撰写，支持本地或远程运行，并可自动调度算力资源，将分析任务扩展到数百个GPU。其突出特点是强调可复现性：生成的每张图都附带确切的生成代码、运行环境和完整对话历史，确保结果可追溯、可修改。该平台采用多智能体协作架构，包括一个协调智能体和专门核查引用与计算的审查智能体，形成类似“AI内部同行评审”的机制，但坚持“人在回路”原则，关键决策需经用户授权。目前，Claude Science首先聚焦生命科学领域，已预置基因组、单细胞、蛋白质组等分析环境，并能连接60多个科学数据库。在科研AI赛道，各厂商策略不同：Google依靠AlphaFold等独家模型，OpenAI侧重提升模型的科研判断力（如推出GeneBench-Pro基准测试），而Anthropic则专注于构建端到端、可审计的工作流。Claude Science的目标并非替代科学家，而是通过自动化繁琐流程，将科研真正融入实验室日常，同时解决科研中长期存在的可复现性难题。

两年的活,如今几周干完。

最近,Allen Institute的一位神经科学家Jérôme Lecoq和他的团队,把一篇长篇综述的写作时间,从将近2年压到了几周。

Jérôme Lecoq手头上积攒了约10篇综述,不少超过100页,每一条引用都被一个智能体逐句核对过。

帮他干活的,是Anthropic刚推出的新应用,Claude Science。

2026年6月30日,Anthropic发布Claude Science,定位为面向科学家的AI工作台。(图源:Anthropic官方博客)

据Anthropic介绍,这套活儿过去这位科学家和他的团队要干两年。

Anthropic给Claude Science的定位,并非一个更聪明的科研模型,而是一个面向科学家的AI工作台。

它真正的突破在于:第一次把科研这件事,拆成了一条能被逐步审计的流水线。

如今,Claude Science已在macOS和Linux上开启beta,对Pro、Max、Team、Enterprise用户开放。

真正改变的,是整条科研工具链

做过科研的人,都懂那种繁琐:

一个项目要在几十个数据库之间来回跳,每个库都有自己的schema和查询语言;

文件格式五花八门,每种都得现搭管线、现找查看器;

手边还摆着一排工具,PubMed查文献,Jupyter跑代码,R做统计,集群终端提交任务......

不停转场,真正用来思考科学问题的时间,经常被这些搬运、拼接、调试工作耗费殆尽。

而Claude Science干的事,正是将这些碎片场景打包「收纳」进同一个执行环境:

文献分析、多步计算、图表打磨、论文成稿,全部阶段在同一个环境里走完,你不必再为换一个工具而中断思路。

它能跑在你本地的macOS或Linux上,也能通过SSH连到远程机器,或者挂在高性能计算(HPC)的登录节点上。

就像你平时用Jupyter那样,数据在哪,它就去哪。

就连算力调度这块,它也包了。

折叠一个蛋白质,或者在海量数据上跑一条基因组管线,这种大活过去要研究者亲自伺候,搭计算任务、排队等集群、盯着成功还是失败、再把结果拉回来,一来一回半天就没了。

Claude Science把这套流程接管了:先起草计划,碰新资源前先问你一声,写任务、提交任务之前都让你能审查或撤销,把分析从1个GPU一路扩到数百个。

Claude Science把一次8组scVI超参扫描派到实验室A100集群运行,右侧Notebook与智能体共用同一个实时内核,变量和状态实时同步。(图源:Anthropic官方博客)

更重要的一点,敏感数据不离开原系统,只有每一步真正需要的上下文才会发给Claude。

每一张图,都自带可追溯代码

科研这行天生就跟图打交道,蛋白质三维结构、基因组浏览器轨道、化学结构式,这些本就是图。

Claude Science顺着这一点,在出图、出稿的同时,把生成它们的代码一并交出来,还能把它们原生渲染出来。

更关键的在可复现性(reproducibility)。

每当Claude Science生成一张图,它都会把生成这张图的确切代码、运行环境、纯语言说明和完整对话历史,一并打包「钉」在图上。

左侧一张跨138个物种的细胞图,右侧同屏挂着生成它的确切代码,圈注一句就能让智能体改图。每个结果都可复现、可追溯到代码。(图源:Anthropic官方博客)

一篇论文从投稿到见刊,常常隔着大半年;几个月后,等审稿人要你重跑某张图,你可以很轻松地把输入、过程、结果整条链当场复现出来。

想改图?直接说话就行——「把网格线去掉」「纵轴换成对数」,智能体直接去改自己写的代码。

你还能在任意节点把会话fork出去,同时试两条思路,原来那条线程一点不乱。

一句话,科研第一次被整合成一份可审计(auditable)的工作流,code、env、history都被放进一个闭环中。

一个智能体写,另一个专门挑错

Claude Science背后,并非一个智能体在单打独斗。

你面对的是一个会统筹的协调智能体,它手里握着60多个为基因组、单细胞、蛋白质组、结构生物学、化学信息学预配好的技能和连接器。

活一多,它自己就能派生出更多智能体来分工,也能随时调用你亲手创建的专家智能体。

最妙的是那个审查智能体(reviewer agent)。

它专门核查引用和计算,揪出错误的引用、追不到出处的数字、对不上代码的图,发现了就标出来、自己改掉。

在Allen Institute那个案例里,团队用的正是actor-critic配对,一个智能体负责写,另一个专门评它的准确性和引用真不真。

这套结构,已经有点「AI内部同行评审」的雏形了。

但有一条边界必须说清楚,全程是人在回路(human-in-the-loop)。

在需要动用新资源前,它会先征求授权,每个决策你都能复核、能撤销。它自动化的是流程,而并非自动替你做科学发现。

它还接了NVIDIA的BioNeMo Agent Toolkit,能原生连上Evo 2、Boltz-2、OpenFold3这些生命科学模型。

你实验室自己信得过的模型、数据、管线,也能存成可复用的技能挂进来,往后的会话自动继承。

Claude Science第一站是生命科学

Claude Science的第一个落点,选在了生命科学。

基因组、单细胞、蛋白质组、结构生物学、化学信息学,开箱即用。

它能读文献,能查询60+科学数据库,UniProt、PDB、Ensembl、ClinVar、ChEMBL、GEO这些规格不一的库,你不用再一个个去学着用。

Claude Science为基因组、单细胞、蛋白质组、化学信息学预配好环境,背靠60+科学数据库。(图源:Anthropic官方博客)

Manifold Bio做的是组织靶向药物。

他们用Claude Science来提名最新实验的靶点,对每个组织和靶点,逐一评估表面表达、运输和安全性,再按公司从自有数据里学到的标准给候选排序。

Manifold说,普通编程助手做不到这一点,Claude Science能端到端地干完,拿对数据,下对判断,还带着过往项目的上下文。

还有更硬核的例子。

UCSF脑瘤中心的一位流行病学副教授,用它做脑胶质瘤的分子流行病学研究,分析数千个微效种系(germline)变异如何叠加、塑造个体易感性。

据Anthropic介绍,这套种系分析,Claude Science用了过去约1/10的时间就跑完了,他的团队还独立复核过结果,确认既快又稳。

不过这些10倍提速的场景,目前只限定在综述写作、基因组分析、特定管线自动化上,并不等于「科研整体提速10倍」。

与此同时,科研可信度的门槛,也在被重新定义。

过去衡量一项研究靠不靠谱,要看同行评审,看能不能被别人复现。

而可复现,长期是科研最大的痛点之一,代码丢了,环境变了,几个月后连作者自己都跑不出当初那张图。

Claude Science每张图都有可追溯的代码,每个结果都连着它的环境和历史。可复现这道坎,它可能是第一个迈过去的。

同一条赛道,三种玩家

生物科研赛道,三巨头都在抢,只是玩法各自不同。

Google押独门模型,OpenAI押模型的科研智商,Anthropic则押的是工作流。

Google攥着AlphaFold、AlphaGenome这些别人没有的自家模型,直接下场。

OpenAI走的是另一条线。

今年4月它推出GPT-Rosalind,一个专为生物推理和药物发现打造的前沿模型。

如今更进一步,开始练模型的「科研判断力」。

它刚刚推出GeneBench-Pro,专测模型能不能像计算生物学家那样做判断:129道题,从基因组学、群体遗传一路铺到临床诊断,专测「数据撑不撑得起这个问题」「哪一步该推翻重来」的手感。

最强的GPT-5.6 Sol拿到28.7%,开Pro模式31.5%;几代前的GPT-5还不到5%。

OpenAI自己说,照这速度,年底就可能被刷爆。

可再强的模型,也只解开不到三分之一。而解不开的那部分,恰恰是人类科学家的位置。

GeneBench-Pro暴露的AI短板也很明显:

模型能起个头,却收不拢最后那一环,比如该不该剔掉一批异常数据、假设被推翻后怎么改路子,这类判断还得科学家自己拍板。

Claude Science也没有绕开这一点,方案交给人审、每个决定留给人撤,它自动化的是流程,判断权并非交给模型,人类始终在环。

对Lecoq这样的科学家,一篇综述能不能复现、几个月后还站不站得住,本就比榜单上多零点几个百分点要紧。

Claude Science赌的,正是让AI科研真正落进实验室的日常。

参考资料:

https://www.anthropic.com/news/claude-science-ai-workbench

https://openai.com/index/introducing-genebench-pro/

本文来自微信公众号“新智元”,作者:ASI启示录

你可能也喜歡

Circle CEO 回应 OUSD 的挑战：稳定币是赢家通吃的生意，我们不会放慢脚步

Circle CEO Jeremy Allaire针对投资者关于OUSD的提问阐述了观点。他认为稳定币市场具有明显的网络效应，趋向赢家通吃。USDC的成功基于三个层面的长期建设：首先，作为互联网协议层，通过广泛接入应用和服务形成强大的开发者与实用性网络效应；其次，建立深度的全球一二级市场流动性网络，USDC现已成为全球流动性前三的数字资产；第三，与全球监管政策深度融合，获得多地牌照与官方认可，并构建了全球化的运营体系。这些投入使USDC成为可信、易用的数字美元基础设施。针对OUSD等新竞争者的不同主张，Allaire逐一进行了分析：关于免费铸造赎回，他认为市场现实可能导致策略调整，Circle通过合同机制灵活处理；关于收入全分配，他认为这会削弱基础设施投入，限制平台发展；关于联盟治理，他基于历史经验指出大型联盟往往效率低下、行动迟缓。他同时强调，Circle与Coinbase的合作稳固，并将继续以开放态度与包括OUSD成员在内的众多伙伴合作，支持生态增长。最终数据显示，USDC在2026年第一季度处理了80%的美元稳定币链上交易，凸显了其网络优势。Circle将继续推进建设，不会放慢脚步。

链捕手4 分鐘前

Circle CEO 回应 OUSD 的挑战：稳定币是赢家通吃的生意，我们不会放慢脚步

链捕手4 分鐘前

Payodex 加密货币交易所评测：功能、安全性、存款与提款

Payodex是一家成立于2018年的中心化加密货币交易所，总部位于塞浦路斯尼科西亚，据称受塞浦路斯证券交易委员会（CySEC）监管。该平台面向新手和经验丰富的交易者，提供现货、期货（永续合约）和最高1:20杠杆的保证金交易，支持自动化交易工具和API接入。其优势包括简洁易用的界面、较低的交易费用以及较快的账户验证流程。平台将安全作为首要任务，采用双因素认证（2FA）、冷钱包存储用户资产、数据加密和多步提现验证等措施。目前，Payodex仅支持加密货币充值和提现，处理速度较快。不过，其小众代币选择有限，部分交易对流动性可能不及主流交易所，且用户反映客服响应有时较慢。此外，Payodex提供价格图表、市场通知、年化收益可达30%的被动收入产品以及推荐奖励计划。总体而言，Payodex作为一个功能全面的替代性交易平台，在提供基础与高级工具的同时保持了操作的简便性。

TheNewsCrypto7 分鐘前

TheNewsCrypto7 分鐘前

Q2 加密市场回顾：比特币涨了个「寂寞」，钱都跑去了 AI 和链上？

**2026年第二季度加密市场回顾** 比特币在第二季度表现疲软，回吐了4月份的全部涨幅，最终季度下跌约11%，交易价格徘徊在60,000美元附近，较2025年末的历史高点下跌超50%。市场走弱主要由三大因素驱动：美联储鹰派利率预期转变、资本从加密货币轮动至AI股票板块，以及关键地缘政治事件（如油价波动）的影响。与此同时，美股主要指数（如标普500和纳斯克达克100）同期则录得显著上涨。 **流动性收紧：三大需求渠道同时减弱** 1. **现货比特币ETF**：季度净流出达40.8亿美元，其中6月单月净流出38.4亿美元，资金流入趋势发生逆转。 2. **加密资产财库（如Strategy公司）**：增持速度显著放缓，市场情绪受其出售少量BTC及调整资本框架影响。 3. **稳定币**：总市值收缩约42亿美元（主要受USDC和USDe减少拖累），链上可用流动性减少。 **市场活动与杠杆变化** * 交易所现货总交易量环比下降28%，而衍生品交易占比上升。 * 市场经历了显著的去杠杆化，BTC和ETH的多头平仓总额达83.5亿美元，未平仓合约自高点大幅回落。 * 市场流动性恶化，订单簿深度减半，吸收抛售压力的能力减弱。 **未来值得关注的新趋势** 尽管市场疲软，一些结构性发展预示了新方向： * **资产类别扩展**：代币化股票（如Coinbase推出）、链上RWA（股票、指数、大宗商品）永续合约兴起。 * **链上价格发现**：例如SpaceX的巨额IPO在公开上市前已在加密市场进行定价。 * **机构基础设施成熟**：链上金库正成为机构资本的核心配置层，传统资管公司开始进入该领域。 **总结**：Q2加密市场在流动性全面收紧和资本外流的背景下表现低迷，市场进入去杠杆化后的更稳定但谨慎的状态。资金是否回流加密货币，还是继续追逐AI等传统市场热点，是Q3的关键观察点。同时，链上在资产种类和金融基础设施方面的创新仍在持续推进。

Foresight News22 分鐘前

Foresight News22 分鐘前

‘似乎看跌’ – Open USD加入稳定币竞赛，Circle股价暴跌17%

6月30日，Circle公司股票CRCL暴跌17.5%，收于62.63美元，创下自3月以来的最大单日跌幅。此次下跌主要原因是市场出现了一个新的强大竞争对手——由Visa、万事达卡、贝莱德、谷歌等140家公司联合推出的新稳定币“开放美元”（OUSD）。 OUSD瞄准企业资金管理和商户支付领域，并计划将储备收益分配给合作伙伴，且转账零费用。这与Circle的USDC和Tether的USDT的目标市场存在重叠。市场分析认为，OUSD的入局可能挑战Circle在稳定币市场的份额主导地位。尽管面临新竞争，Circle的市场份额在2025年《GENIUS法案》通过后曾从19%升至25%，目前维持在24%左右。分析师对Circle股票仍持乐观态度，平均目标价看至120美元，意味着较当前水平有约91%的上涨空间。

ambcrypto28 分鐘前

ambcrypto28 分鐘前

邢波再出手：上次「骂」完世界模型，这次轮到智能体了

邢波教授继去年批评世界模型后，近日与合作者发表新论文《智能体模型批评》，对当前被滥用的“智能体”概念提出系统性质疑与重构方案。论文尖锐指出，目前众多被称为“智能体”的系统（如编程助手、客服机器人）大多只具备“智能体外观”（agentic），而非真正的“能动性”（agentive）。前者能力依赖于外部预设的工具链和提示词，模型仅是嵌入流程的零件；后者的决策和目标则内生于系统自身。论文以“工卡员工”和“感应灯”为例，说明任务复杂度不同并非自主性的本质区别。基于此，论文从五个维度拆解主流智能体设计的不足，并提出了对应的“重建”思路： 1. **目标**：应从人类逐步喂指令，转变为一次性给予长期目标，由系统自主进行可调整的分层目标分解。 2. **身份**：自我认知不应固化于提示词，而应成为能根据经验持续演化的“活的自我评估”。 3. **决策方式**：驳斥仅靠延长思维链文字就能规划的观点，主张采用“模拟式推理”，即借助世界模型预测行动后果，再选择最优方案。 4. **节奏判断**：批评固定规划深度的做法，提出需引入独立的“元认知模块”（称为System III），让智能体自行判断何时该深思或速断。 5. **学习**：主张“持续自主学习”，让智能体自主决定何时在真实世界行动、何时退回模拟器训练、何时更新认知。为整合这些原则，团队提出了具体架构GIC（Goal-Identity-Configurator），包含信念编码器、目标分解器、身份演化器、配置器（System III）、模拟规划器（System II）和执行器（System I）六个组件，并以飞行员训练过程类比其成长路径。论文最后讨论了安全性，认为GIC架构通过将目标、身份、决策等模块显式化、可审查化，使安全问题变得可诊断、可修正，而非承诺绝对不出错。其核心论点是：真正的自主性不在于任务复杂度，而在于目标、身份与判断力是否内化于模型自身。当前大多数“智能体”可能仍停留在精准执行外部指令的阶段，而非真正理解与自主决策。

marsbit1 小時前

marsbit1 小時前

交易

現貨

Claude Science几周干完两年活，10倍科研提速真来了？

文章摘要

真正改变的,是整条科研工具链

每一张图,都自带可追溯代码

一个智能体写,另一个专门挑错

Claude Science第一站是生命科学

同一条赛道,三种玩家

相關問答

你可能也喜歡

Circle CEO 回应 OUSD 的挑战：稳定币是赢家通吃的生意，我们不会放慢脚步

Payodex 加密货币交易所评测：功能、安全性、存款与提款

Q2 加密市场回顾：比特币涨了个「寂寞」，钱都跑去了 AI 和链上？

‘似乎看跌’ – Open USD加入稳定币竞赛，Circle股价暴跌17%

邢波再出手：上次「骂」完世界模型，这次轮到智能体了

交易

熱門分類

熱門標籤