Anthropic 数据：AI Agent 近半调用集中在软件工程，这 16 个垂域仍是蓝海

marsbit发布于2026-02-24更新于2026-02-24

文章摘要

Anthropic最新研究显示，近50%的AI Agent工具调用集中在软件工程领域，而医疗、法律、教育等16个垂直领域的应用占比均不足5%，市场仍处于蓝海状态。尽管AI模型已能独立处理近5小时的任务，用户实际平均使用时长仅42分钟，存在显著的“信任赤字”，这为产品创新提供了机会。研究发现，用户随着使用经验积累，会从逐步审批转向主动监控，但干预频率反而上升。Anthropic强调，自主权是由模型、用户和产品共同构建的，强制审批每个操作会降低效率而非提升安全性。 Box创始人指出，垂直AI的成功需结合领域专业知识、专有数据和变更管理能力，未来十年可能涌现300家垂直AI独角兽，取代的不仅是软件，还包括操作人员。目前，高风险操作占比极低，安全性可控。

作者:Garry's List

编译:深潮 TechFlow

深潮导读:Anthropic 最新发布了迄今最全面的 AI Agent 真实使用研究,核心数据是:软件工程占据近 50% 的 Agent 工具调用量,而医疗、法律、教育等 16 个垂直领域加起来还不到剩余的一半,每个领域份额均低于 5%。

这不是市场饱和的信号,而是 300 个垂直 AI 独角兽的地图——更有价值的是文章引用的一个反直觉发现:模型已经能独立工作近 5 小时,但用户实际只让它工作 42 分钟,这个"信任赤字"本身就是下一个产品机会。

全文如下:

软件工程占所有 AI Agent 工具调用量的近 50%。医疗、法律、金融等 16 个垂直领域几乎未被触及,每个领域均低于 5%。这意味着有 300 个垂直 AI 独角兽等待被建造出来。

如果我今天要创业,我会盯着上面那张柱状图的红色区域,直到我看见自己的未来。

Box 创始人 Aaron Levie 表示:

这张图很好地提醒了我们,AI Agent 领域现在有多大的机会。

水平方向当然会有大量 Agent 机会,但同样有很多工作流需要深厚的领域专业知识,才能真正帮助用户自动化其所在垂直领域的独特流程。

模板是:构建接入专有数据的 Agent 软件,以有效衔接用户与 Agent 协作的方式处理工作流,同时具备深度领域专属的上下文工程能力,以及推动客户侧变更管理的能力。

目前许多领域仍存在巨大空白。

软件工程占据了所有 AI Agent 活动的半壁江山。另一半分散在 16 个垂直领域,没有一个超过 9%。医疗占 1%,法律占 0.9%,教育占 1.8%。这些不是饱和市场,而是几乎还不存在的市场。

Anthropic 刚刚发布了迄今最全面的 AI Agent 真实使用研究。核心发现是:软件工程占其 API 上 49.7%的 Agent 工具调用量。被埋在后面的核心结论是:其他一切都是蓝海。

部署滞后

有一个数据应该让创业者兴奋不已:模型的能力已经远超用户愿意信任它的边界。

METR 的能力评估显示,Claude 可以解决需要人类近五小时才能完成的任务。但在实际使用中,第 99.9 百分位的会话时长只有约 42 分钟。这个差距——AI 能做什么与我们允许它做什么之间的差距——是一个巨大的机会。

图:Claude Code 训练的最长时长在三个月内几乎翻了一番。这不仅提升了能力,也增强了信任。

来源:x.com

从 2025 年 10 月到 2026 年 1 月,第 99.9 百分位的单次会话时长几乎翻了一倍,从不足 25 分钟增长至超过 45 分钟。增长在各个模型版本间都很平稳。这不只是模型变得更强了,而是用户一次次地在使用中学习,逐渐延伸着对 Agent 的信任。

"从 8 月到 12 月,Claude Code 在内部用户最具挑战性任务上的成功率翻了一倍,与此同时,每次会话的人工干预次数从 5.4 次减少到 3.3 次。"

能力已经在那里,部署还没跟上。这不是问题,而是产品机会。

信任是如何演化的

新用户中有 20%会自动批准 Claude Code 的操作。到 750 次会话时,超过 40%的会话完全在自动批准模式下运行。但有一个反直觉的发现:有经验的用户反而会更多地进行干预,而不是更少。新用户会在 5%的轮次中进行干预,老用户则是 9%。

图:信任是一种会不断积累的技能。新用户会自动批准 20% 的会话。到 750 次会话时,这一比例会超过 40%。

图片:Anthropic

来源: x.com

这并不矛盾,而是监督策略的转变。初学者在操作发生前逐步审批,老用户则是先授权、在出问题时再介入——他们已经从预先审批转向了主动监控。

以下是一个在安全层面值得关注的发现:在复杂任务上,Claude Code 主动请求澄清的频率超过人类主动干预频率的两倍。Agent 会暂停确认,而不是一路冲到底。这是特性,不是缺陷。

"这项研究的核心启示是:Agent 在实践中行使的自主权,是由模型、用户和产品共同构建的。Claude 在不确定时会暂停提问,以此限制自身的独立性。用户在与模型协作的过程中建立信任,并相应地调整自己的监督策略。"

Levie 的垂直 AI 打法

Aaron Levie 指出了等待被解锁的巨大财富与价值:构建接入专有数据的 Agent 软件,让它真正解决真实的人和问题,把上下文塞满以最大化智能输出,以及——这是大多数创业者忽略的部分——推动客户侧的变更管理。

最后这一点正是垂直 AI 如此难以被复制的原因。任何人都能搭一个 API 封装,但很少有人能真正驾驭医疗账单、法律发现或建筑许可证审批中特有的工作流、监管约束和组织阻力。

SaaS 在过去几十年里每十年增长十倍。过去 20 年超过 40%的风险投资资金流向了 SaaS 公司。这个行业诞生了 170 多只 SaaS 独角兽。逻辑很简单:这些独角兽中的每一只,都有一个垂直 AI 版本在等待出现。而 AI 版本可能会大十倍,因为它取代的不只是软件,还有操作人员。

共同构建的本质

Anthropic 的核心发现值得任何参与 AI 政策制定的人认真关注。自主权不是模型的固有属性,而是由模型、用户和产品共同构建的。部署前的评估无法捕捉这一点,你必须在真实使用中去衡量。

Anthropic 官方表示:

软件工程约占我们 API 上 Agent 工具调用量的 50%,但我们也看到其他行业正在涌现。随着风险与自主权的边界持续扩展,部署后的监控变得至关重要。我们鼓励其他模型开发者扩展这项研究。

安全层面的数字令人放心:73%的工具调用有人类在回路中参与,只有 0.8%的操作是不可逆的。最高风险的部署场景——如 API 密钥泄露或自主加密交易——大多是安全评估,而非真实生产环境。

"规定具体交互模式的监管要求——例如要求人类批准每一个操作——只会制造摩擦,而不一定带来安全收益。"

强制要求"批准每一个操作"的政策,会杀死生产力收益,却不会增加安全性。更好的目标是确保人类能够监控和介入,而不是规定具体的审批工作流。

独角兽藏在哪里

地图已经画好。软件工程已经有人在做了。医疗、法律、金融、教育、客服、物流——16 个垂直领域,每个市场份额均为个位数——都在等待有人把领域专业知识真正嵌入 Agent。

此前诞生了 300 只 SaaS 独角兽,接下来 300 只垂直 AI 独角兽即将出现。那些选定垂直领域、把领域专业知识嵌入 Agent、并想明白如何驱动变更管理的创始人,将拥有下一个十年的企业软件市场。

模型已经能工作五小时,用户只让它工作 42 分钟。这就是信号:我们仍然处于极早期,还有大量东西可以建造,而且在无数个还没有见过哪怕一分钟智能发挥作用的地方。

你可能也喜欢

科创50大涨10.73%，A股为何上演“V型反转”？

连续回调多日后，A股市场于7月21日迎来强势上涨，上演“V型反转”。截至收盘，科创50指数大涨10.73%，创近一年最高单日涨幅；沪指、深证成指、创业板指也悉数飘红。两市成交额显著放大，超3100只个股上涨，半导体产业链全线爆发，成为反弹先锋，带动多只相关主题ETF大幅上涨。机构分析认为，此轮强力反弹源于三重因素共振：一是多路资金积极入市，“国家队”、险资增持以及上市公司回购等行为有效提振市场信心和流动性；二是政策面释放呵护信号，证监会明确全力维护市场平稳运行；三是海外市场企稳反弹，为A股提供了良好的外部环境。对于后市，机构观点认为，经历前期快速调整后，科技板块的估值压力和拥挤度已大幅消化，杠杆资金出清接近尾声，最恐慌的阶段大概率已经过去。政策信号缓解了市场恐慌情绪，但市场寻底仍需时间，后续波动可能依然存在。中期来看，AI算力需求扩张、半导体国产替代等产业趋势未变，科技成长板块仍具备中长期配置价值，投资者可关注超跌反弹机会及后续产业催化的落地。

marsbit39分钟前

marsbit39分钟前

美股“科技动量股”创史上最大单日涨幅，但暴跌结束了吗？

美股科技动量股在7月21日出现历史性强劲反弹。摩根士丹利TMT动量因子单日涨幅超12%，创有记录以来最大单日涨幅；高盛相关动量指数也录得近年来最强单日表现。半导体板块是主要推动力，费城半导体指数大涨4.6%，美光、英特尔等个股涨幅显著。此次反弹发生在此前动量股累计暴跌33%、触及严重超卖之后，很大程度上由空头被迫平仓回补的“逼仓”行情驱动。市场分析指出，跌得深是反弹猛的基础逻辑。然而，反弹的内部结构引发疑虑。成交量低于均值，市场广度偏弱，上涨主要依赖少数重仓股，并非全面复苏。BTIG策略师警告反弹已触及关键阻力区，建议逢高减仓，并指出极端波动和个股分化是市场全面回调的信号。另一方面，高盛和瑞银则认为动量抛售已近尾声，持仓得到出清，且缺乏新的基本面利空催化剂，是逐步增加相关敞口的机会。但他们也建议通过审慎方式分批建仓。市场接下来的焦点转向密集的财报季，尤其是科技巨头的资本开支指引。同时，债券市场隐忧浮现，美债收益率因油价等地缘因素走高，若长期收益率持续上升可能对股市构成冲击。总体而言，此次反弹虽然力度惊人，但成色受到质疑，其可持续性将取决于财报表现与宏观环境变化。

链捕手49分钟前

链捕手49分钟前

比特币闪现三大宏观底部信号——但BTC能否触及7万美元？

比特币市场叙事正从局部底部转向宏观底部。技术分析显示，BTC突破66,000美元后激发了看涨情绪，分析师认为周期低点可能已经出现。加密分析师阿里·马丁内斯指出，比特币再次闪现三个历史上与宏观周期底部同时出现的技术信号：月度RSI降至约43.65，钱德动量振荡器(CMO)跌至约-71，且价格接近50个月移动平均线。这一模式在2015年、2019年和2022年周期底部均出现过，随后都引发了大幅上涨。然而，看涨势头的持续最终取决于流动性，这仍是比特币面临的关键考验。技术层面显示，稳定币 dominance 已升至约13%，与以太坊超过10%的市值占比差距缩小。与此同时，过去一个月稳定币总市值下跌超过100亿美元，表明资金仍在流出加密市场而非流入。链上数据也支持这一趋势：尽管比特币价格保持在65,000美元以上，但支撑上涨所需的流动性似乎在减弱，稳定币已连续35天离开交易所，而比特币现货积累未见明显增加。综上，价格虽已突破，但流动性未能跟上。从局部底部向宏观底部的转变可能仍需更强确认。缺乏新流动性意味着涨势可能难以维持足够动能以决定性突破70,000美元区域。

ambcrypto51分钟前

ambcrypto51分钟前

合久必分，分久必合：当 L1 变成自身的 Rollup，以太坊的终局是什么？

以太坊正重新审视L1与L2的关系。随着主网自身扩容能力提升（如提高Gas Limit、推进无状态化和zkEVM验证），L2仅凭“更便宜的交易”难以维持长期价值，未来需转向提供L1难以满足的差异化功能，如特定应用优化、隐私或灵活的经济模型。以太坊将L2视为一个连续光谱：从高度继承主网安全的Rollup，到部分继承的执行环境，再到相对独立的链。同时，为解决L2碎片化带来的流动性割裂和用户体验问题，以太坊正着力提升互操作性，包括推进开放意图框架和以太坊互操作层，让跨链交互更接近单链体验；并通过账户抽象和缩短最终确定性时间，让不同执行环境能更快互信彼此状态。更前瞻的观点是，随着证明系统（如zkEVM）进入主网验证流程，L1自身也可能采用类似Rollup的“执行-验证”分离架构，从而模糊L1与L2的传统边界。未来的以太坊可能演变为一套统一的共识和安全基础之上，多个拥有不同功能、却共享状态和流动性的执行域组成的整体。总之，以太坊的终局并非L1与L2的替代，而是在扩容之后，重新将分散的资产、应用和用户体验安全、高效地连接起来，形成一个既分又合的统一网络。

链捕手1小时前

链捕手1小时前

Agent 赛马结束，超级工作台上位

过去一个月，腾讯、阿里、字节三家巨头不约而同地开始调整其AI战略：他们并未发布新的Agent（智能体），反而着手缩减和整合现有的众多Agent产品。腾讯将QClaw业务并入其战略级产品WorkBuddy；阿里计划将多款办公智能体整合进“千问办公”，由钉钉统一主导；字节则将其AI编程产品TRAE SOLO更名为TRAE Work，转向工作流协同。这标志着行业对Agent发展的共识正在形成：分散探索阶段结束，资源开始向统一入口集中。此前，各大厂曾效仿早期互联网，在各个部门和场景广泛布局Agent，导致产品功能重叠、资源分散、成本高昂。随着技术壁垒因开源工具而降低，竞争核心转向算力效率与市场聚焦。当下的调整类似于PC时代的浏览器和移动时代的超级App，预示着AI时代正进入以“超级工作台”统一入口的新阶段。这一转变背后是市场重心的深刻转移：AI的最大市场并非最初的程序员群体，而是更广阔的数十亿职场人的通用办公场景。超级工作台的目标是成为员工处理邮件、文档、数据、审批等日常工作的首要AI入口，从而掌握企业数据和系统API的调度权。这并非要取代现有的企业软件（如ERP、CRM），而是通过引入“Skills”（标准化能力接口）让软件能力无缝接入工作台。软件的前端交互界面重要性下降，其价值将转向按能力调用和结果付费。Agent本身也从独立产品，逐渐演变为一种底层能力，最终像电力和网络协议一样，无处不在却又隐于无形。行业正从Agent作为明星产品的第一阶段，快速迈向其作为统一工作入口的第二阶段，并终将进入其化为无形基础设施的第三阶段。

marsbit1小时前

marsbit1小时前

交易

现货

Anthropic 数据：AI Agent 近半调用集中在软件工程，这 16 个垂域仍是蓝海

文章摘要

全文如下:

部署滞后

信任是如何演化的

Levie 的垂直 AI 打法

共同构建的本质

独角兽藏在哪里

相关问答

你可能也喜欢

科创50大涨10.73%，A股为何上演“V型反转”？

美股“科技动量股”创史上最大单日涨幅，但暴跌结束了吗？

比特币闪现三大宏观底部信号——但BTC能否触及7万美元？

合久必分，分久必合：当 L1 变成自身的 Rollup，以太坊的终局是什么？

Agent 赛马结束，超级工作台上位

交易

热门分类

热门标签