你交给Claude的订阅费,光模块公司能拿到多少?

marsbit發佈於 2026-06-17更新於 2026-06-17

文章摘要

一张将Claude Pro约20美元月费拆解给模型公司、云算力、GPU折旧、电力及供应链的估算图,引发了投资者对AI应用估值逻辑的重新审视。 核心问题在于:用户为AI应用支付的订阅费,有多少能像传统SaaS(软件即服务)那样沉淀为高软件毛利?传统SaaS新增用户成本极低,毛利率可达70%-80%。而AI应用不同,用户每一次调用模型(推理)都会消耗GPU算力、电力和云资源,导致边际成本显著。固定月费背后是随使用量波动的成本链,重度用户的成本可能急剧上升。 因此,AI应用公司要获得高估值,不仅需证明用户付费意愿,更需证明在考虑使用量后,其毛利率能持续改善并接近传统软件公司。当前阶段,AI使用量的增长更直接地转化为对底层基础设施(如英伟达GPU、台积电芯片、HBM内存、电力及数据中心)的需求,这使得基础设施供应商的业绩和估值更早、更确定地得到验证。 支持AI应用高毛利前景的观点认为,当前推理成本高是早期现象。通过模型优化、缓存技术、使用小模型、自研芯片以及提高集群利用率,单位成本有望快速下降。行业已有案例显示,部分模型的单位成本大幅降低。 然而,挑战在于,AI应用正从简单问答转向更复杂、耗能更高的任务(如代码生成、长文档处理)。关键在于,推理成本下降的速度能否超越用户使用量和任务复杂度的增长速度。 总之,该分析图的价值在于提醒市场:在AI应用公司缺乏透明毛利率数据的情况下,不应简单将其收入等同于高毛利SaaS收入。投资者需要关注其成本结构、用户使用行为分层以及效率提升的实际证据。模型公司最终需要证明,即使在重度使用下,订阅收入也能转化为可观的利润。

TL;DR

一张把 Claude Pro 美国月付约 20 美元拆给模型公司、云算力、GPU 折旧、电力和供应链的估算图,正在让投资者重新讨论 AI 应用收入到底该怎么估值。

这张图不是 Anthropic、亚马逊云或英伟达的官方分账数据,也不能当成任何一家公司的真实账本。它的价值在于提出了一个更底层的问题:用户付给 AI 应用的订阅费,有多少能像传统 SaaS 一样沉淀成软件毛利?

传统 SaaS 的估值想象很清楚。软件写好后,多卖一个账号,新增成本通常不高,成熟纯软件公司毛利率常见在 70% 甚至 80% 以上。投资者愿意给高倍数,是因为收入规模扩大后,利润率有机会继续抬升。

AI 应用的麻烦在于,用户每一次提问、写代码、分析文件或调用 agent,背后都要消耗 GPU 时间、电力、内存带宽和云资源。表面是固定月费,底层却是一条随使用量变化的成本链。轻度用户可能是高毛利,重度用户在可用额度或相关工具套餐内连续跑任务,成本可能迅速上升。

所以,20 美元拆分图要挑战的不是某家公司到底拿走几美元,而是「AI 应用收入是否天然等于 SaaS 收入」。AI 公司要证明自己值高倍数,不能只证明用户愿意付费,还要证明使用量加权后的毛利率能持续改善。

订阅费背后有一条推理成本链

AI 订阅和普通软件订阅最大的不同,是「使用一次」的边际成本不再接近于零。

在传统 SaaS 里,一个团队多开一个账号,服务商也有服务器、客服和带宽成本,但这些成本通常不会随着每一次点击线性上升。真正昂贵的是前期研发、销售和获客。产品规模化后,新增收入中有相当部分可以留下来。

大模型产品不同。用户输入问题,模型生成答案,这个过程叫推理,也就是模型被用户调用时的实际计算。Token 是模型读写文本的基本计量单位。用户问得越多、上下文越长、生成内容越复杂,消耗的 token 和算力就越多。

这就形成了固定订阅和可变成本之间的矛盾。Claude Pro 美国月付口径约为 20 美元,价格会受地区、税费和 Anthropic 调整影响。用户看到的是固定价格,模型公司面对的却是差异很大的使用行为。有人只是写邮件和查资料,有人会处理长文档、跑代码任务或调用更复杂的自动化流程。

市场流传的拆分图试图把这件事具象化:20 美元里,一部分留给模型公司,一部分支付给云和算力提供方。算力成本中包含电力、运维、GPU 折旧。GPU 采购再向上流向英伟达、台积电、HBM(高带宽内存)供应商、光模块、ODM 和电力相关企业。

这里的「GPU 折旧」可以理解为,昂贵 GPU 不是一次性算完成本,而是按使用年限、使用强度或会计口径慢慢摊到 AI 服务里。真实分配会受到套餐限额、轻重度用户比例、云厂商内部结算价、预留算力折扣、GPU 利用率和折旧年限影响。平均成本也不等于边际成本。

投资者真正需要盯住的是方向:AI 应用公司不能只披露收入增长,还要回答收入增长背后的算力成本是否同步增长。如果使用量扩张快于模型效率提升,订阅收入越高,毛利压力可能越明显。只有效率改善足够快,模型公司才有机会重新接近软件公司的利润结构。

基础设施先拿到更确定的收入

现阶段,AI 使用量增长更直接流向基础设施,而不是全部沉淀在应用层。

不管用户是在 Claude、ChatGPT、Gemini,还是企业内部 agent 里使用模型,推理最终都要落到算力、电力、内存和网络上。应用层可能出现产品更替,底层资源消耗更刚性。只要 AI 使用量继续上升,云资本开支、GPU 采购、HBM 需求和数据中心用电就会被拉动。

这也是英伟达、台积电、SK 海力士等基础设施链条持续被市场重估的原因。英伟达近年整体毛利率处于高位,FY2026 年度 GAAP 和非 GAAP 毛利率约为 71.1% 和 71.3%,后续季度指引也保持高位。需要注意,个别季度会受特定费用扰动,公开财报也不总能直接拆出 AI 数据中心的真实毛利结构,但稀缺基础设施具备定价权这一点已经反映在业绩里。

HBM 是这条链上最典型的环节。它不是普通内存,而是 AI 加速器里支撑高吞吐计算的关键部件。模型规模、上下文长度和并发推理需求上升后,AI 芯片对高带宽内存的依赖更强。供应链估算显示,HBM 在新一代 AI 芯片成本中的占比提高,这也是 SK 海力士、三星、美光在 AI 周期中被重新定价的重要原因。

电力和数据中心也从背景成本变成投资主线。单次普通文本查询的能耗未必夸张,但复杂 agent、长上下文、代码生成和多轮任务会放大计算量。对云厂商和数据中心运营商来说,关键不是某一次查询耗电多少,而是海量推理请求持续发生时,集群利用率、电价、冷却、机房容量和电网接入能力都会变成成本与瓶颈。

基础设施端的优势在于业绩验证更快。云厂商的 AI 资本开支已经发生,英伟达收入和毛利体现在财报里,HBM 厂商订单和价格也会较快进入利润表。模型应用层交易的更多是未来预期:订阅转化、企业渗透率、API 收入和未来成本曲线下降后的利润释放。

效率改善仍是多头的核心依据

软件投资者和 AI 多头并非没有反驳。效率派的核心观点是,今天推理成本偏高只是早期阶段现象,模型优化、缓存、小模型、自研芯片和更高集群利用率,会持续压低单位成本。只要成本下降足够快,AI 应用仍可能回到高毛利软件逻辑。

这个反驳有现实基础。部分主流模型在同等或更高能力下,单位价格已经明显下降。OpenAI 曾披露,GPT-4o mini 相比早期 text-davinci-003 每 token 成本下降 99%。不同公司节奏并不完全一致,Anthropic 近期更多体现为同价升级和模型分层,但行业方向仍是用更低成本提供更强能力。

模型公司也有多种办法改善单位经济性。简单任务交给小模型,常见请求通过缓存复用,长上下文和复杂任务交给更强模型。云厂商则通过自研芯片和集群调度降低单位算力成本。谷歌有 TPU,微软推出用于推理的 Maia,亚马逊也在推进 Trainium 和 Inferentia。

如果只看技术进步,AI 应用利润率确有改善空间。更便宜的推理、更好的模型路由、更强的压缩能力,都能让同样 20 美元订阅承载更多使用量。轻度用户、高价企业套餐、API 分层定价和更严格的使用限额,也能改善整体单位经济性。

难点在于,成本下降不是唯一变量。AI 应用正在从简单聊天走向更重的工作负载。过去用户可能只是问答和改写文本,现在越来越多需求来自代码 agent、长文档处理、视频和多模态生成、企业自动化流程。这些场景价值更高,消耗也更高。模型越有用,用户越可能把更复杂、更长时间的任务交给它。

分歧由此变得更具体:推理成本下降速度,能否超过使用量和任务复杂度的增长。如果单位成本下降很快,但用户平均消耗增长更快,模型公司的加权毛利率仍会承压。反过来,如果模型路由、缓存、自研芯片和价格分层足够有效,AI 订阅就可能逐步摆脱今天的重成本特征。

订阅用户数并非毛利率

20 美元拆分图不应被理解为终局。它更像当前阶段的估值提醒:当市场还看不到足够透明的模型公司毛利率数据时,投资者需要给「AI 应用天然等于 SaaS」这个假设打折。

对 OpenAI、Anthropic 这类未上市模型公司来说,外部投资者很难看到完整账本。融资材料、合作方披露、云成本结构、企业套餐价格、API 收入占比和使用限制,都会成为判断线索。真正有价值的数据不是付费用户有多少,而是轻度用户和重度用户各占多少、企业客户是否愿意为高强度使用付更高价格、云结算成本是否下降,以及单位推理成本下降能否进入公司毛利率。

上市公司链条的验证会更快出现在财报里。英伟达整体毛利率和数据中心收入增速、台积电先进制程和封装需求、HBM 厂商价格与利润率、云厂商资本开支强度,都会继续反映 AI 使用量是否仍在向基础设施端传导。如果这些指标保持强劲,而模型应用层缺少毛利率改善证据,市场会继续给基础设施更确定的估值溢价。

最终,模型公司要拿回更高估值锚,需要证明的不只是用户愿意付 20 美元,而是这些订阅费在重度使用之后,仍能留下足够多的毛利。下一轮定价分歧,很可能不在 ARR 的 headline 数字,而在推理成本、套餐限制和企业付费价格能否同时跑通。

相關問答

Q为什么AI应用的订阅费估值与传统SaaS应用不同?

A因为AI应用存在推理成本链,用户每一次调用模型都需要消耗GPU时间、电力、内存和云资源,这使得其边际成本远高于传统SaaS,不能直接套用传统软件的高毛利估值逻辑。

Q用户订阅Claude Pro的20美元费用,会流向哪些环节?

A费用大致流向模型公司(如Anthropic)、云与算力提供方(如亚马逊云)、GPU折旧、电力和更上游的供应链(如英伟达、台积电、HBM供应商、光模块等)。

Q为什么说AI基础设施公司比模型应用公司更早获得确定的收入?

A因为无论用户在哪个AI应用中使用模型,底层算力、电力、内存和网络的消耗是刚性的,云资本开支、GPU采购、HBM需求等已体现在英伟达、台积电、HBM厂商的财报中,业绩验证更快、确定性更高。

Q效率改善如何可能使AI应用公司回归高毛利逻辑?

A通过模型优化、缓存、小模型路由、自研芯片(如TPU、Maia、Inferentia)以及提升集群利用率等方法持续降低单位推理成本,结合分层定价和套餐限制,有望改善AI应用的整体毛利率。

Q投资者评估AI模型公司时,除了付费用户数,更应关注什么关键数据?

A应关注公司公开的或可推断的毛利率数据,尤其是单位推理成本变化、不同使用强度用户的构成比例、企业客户的高价付费意愿、云结算成本下降趋势,以及成本下降能否真正转化为公司利润率的改善。

你可能也喜歡

SBF提出新代币偿还FTX受害者,但这可能实现吗?

摘要:据报道,正在服刑的FTX创始人萨姆·班克曼-弗里德(SBF)近期表达了通过发起一个新的代币项目来偿还FTX受害者的个人愿望。这一说法因极具话题性而引发关注,但其与法律现实存在巨大差距。 核心信息点: * 这只是SBF的个人希望,并非一个积极的、可行的计划。 * 背景是,美国上诉法院已于2026年6月12日维持了对SBF的25年刑期判决。 * 目前没有任何经过验证的、在法律上可行的代币项目存在。 文章分析指出,作为一名正在服长期刑期的重罪犯,SBF在运营公司、筹集资金、发行证券或管理代币项目方面面临显而易见的法律障碍。即使他个人相信新方案能偿还受害者,法院、监管机构、债权人或破产管理人也不太可能允许。 该言论之所以仍受关注,是因为FTX倒闭是加密货币历史上的标志性事件,任何关于偿还受害者或新计划的提及都会触动市场记忆。这同时也引出了一个更广泛的行业问题:失败的平台能否利用代币来弥补损失?在FTX的案例中,法律和声誉障碍远高于普通的重组故事。 因此,本文的立论点不应是SBF将推出代币,而应强调他个人幻想与法律现实之间的张力:即便司法系统已做出严厉判决,他仍 reportedly 设想一条基于代币的偿还路径。任何实际的偿还过程,仍将严格遵循法律程序、破产结构和债权人追偿机制,而非一个来自监狱牢房的想法。

bitcoinist3 小時前

SBF提出新代币偿还FTX受害者,但这可能实现吗?

bitcoinist3 小時前

贝莱德以BITA为代码推出备兑看涨比特币ETF

贝莱德推出了一款新的比特币ETF产品——iShares Bitcoin Premium Income ETF,交易代码为BITA。与单纯的现货比特币基金不同,该产品采用备兑看涨期权策略,旨在通过出售期权获得权利金收入,并向投资者提供每月派息,为寻求加密相关收益但不愿直接使用DeFi或离岸借贷产品的投资者提供了新选择。 这种策略意味着产品在比特币横盘或震荡市场中可能表现更佳,但在比特币价格快速上涨时,其收益可能会落后于单纯的现货持有。这并非产品缺陷,而是其设计核心:贝莱德将比特币波动性打包成一种收入策略,为更保守或注重收益的投资者提供了更接近传统期权ETF的产品形式。 BITA的推出表明比特币ETF市场正迅速超越单纯的现货产品,进入策略多样化阶段,如赚取溢价收入、对冲和结构化敞口等。这标志着比特币正逐渐被视作可整合进更广泛基金架构的市场要素,而不仅仅是孤立资产。 该产品主要吸引那些已接受比特币投资逻辑,但希望在经纪账户内获得更平滑、以收益为导向产品的投资者,以及寻求在不单纯依赖价格升值的情况下讨论比特币敞口的投资顾问。它并非现货比特币或IBIT的替代品,而是一种不同的工具。关键在于投资者是否理解其收益与上涨潜力之间的权衡。

bitcoinist5 小時前

贝莱德以BITA为代码推出备兑看涨比特币ETF

bitcoinist5 小時前

日本加息,为什么全世界都在紧张?

日本央行在2026年6月将政策利率提升至1%,这是自1995年来的首次。尽管1%的利率在主要经济体中并不高,但由于日本长期充当全球最低成本融资中心的特殊角色,此次加息引发了全球市场的广泛关注。 过去二十余年,日本近乎零的利率环境催生了大规模的日元套利交易。国际资本以极低成本借入日元,转而投资于全球高收益资产,如美国科技股和新兴市场债券,这为全球资产价格上涨提供了重要的流动性基础。日本加息意味着这一廉价资金源头开始收紧,可能引发全球资本的去杠杆化调整。 日本长期维持超低利率,源于其人口老龄化、长期通缩和高额政府债务等结构性约束。然而,疫情后全球通胀传导、国内工资持续增长(近年春斗涨薪均超5%)以及日元贬值压力,共同推动其货币政策转向。 市场担忧的核心并非当前1%的利率水平,而是日本持续三十年的超宽松货币政策框架发生根本性转变的趋势。这种变化将重塑全球套利交易的逻辑和风险资产的定价基础。不过,决定全球资本最终流向的关键,仍在于美日之间的利差变化。如果未来美联储进入降息周期而日本继续加息,两者货币政策差异的收窄可能对国际资本市场产生更深远的影响。 简言之,日本加息标志着全球最重要的低成本融资来源进入正常化进程,这可能引发建立在廉价日元资金之上的全球资本配置体系进行深度重估。

marsbit7 小時前

日本加息,为什么全世界都在紧张?

marsbit7 小時前

交易

現貨
合約
活动图片