OpenRouter:怎么靠“模型中转站”做到 10 亿美元公司?

marsbit发布于2026-06-25更新于2026-06-25

文章摘要

OpenRouter是一个AI模型调用中转站,它将OpenAI、Claude、Gemini等数百个模型聚合在同一个接口后面,让开发者用一套API、一个账号和统一账单就能灵活调用多种模型,并能在不同模型与供应商之间进行切换、设置备用方案。其核心价值并非简单的“模型超市”,而是为企业与开发者提供强大的模型调度与管理层,包括供应商路由、故障自动切换、成本控制、零数据留存策略及提示词缓存等功能,从而帮助用户在多变且复杂的模型市场中平衡效果、成本与稳定性。 随着AI应用从实验走向大规模生产,模型选择增多、成本控制需求提升以及智能体应用消耗更多tokens,OpenRouter的流量和处理量快速增长,目前已达到年化约1.5千万亿tokens的规模。其商业模式清晰,主要通过收取5.5%的平台使用费盈利,收入与流量直接挂钩。 然而,这门生意也面临风险:大企业可能自建系统,云厂商可能推出类似网关服务,模型供应商关系可能变得微妙,以及平台费率在竞争中有被压低的压力。OpenRouter需持续深化其在路由算法、模型覆盖、企业级功能和服务稳定性上的优势,以巩固其作为关键AI基础设施的地位。

作者:张艾拉

今天来聊聊中转站。

简单来说,模型中转站,就是把 OpenAI、Claude、Gemini、DeepSeek 等不同模型接到同一个入口后面,让开发者用一套接口、一个账号和统一账单调用多个模型,并在不同模型或供应商之间做选择、切换和备用。

当然,对于国内用户来说,用中转站更大的原因是想用海外模型,以及更便宜。

这个大家懂得都懂,国内的中转站我们就不多说,今天主要介绍 OpenRouter。

到 2026 年,OpenRouter 已经融到 1.13 亿美元 B 轮,估值已经接近 13 亿美元。

也就是说,它已经是一家独角兽公司。

我们就来分析下,一个“不造模型”的模型中转站,为什么能值这么多钱?

OpenRouter 到底是做什么?

OpenRouter 官方给自己的定位是:统一的大模型接口。

OpenRouter 现在支持 400 多个模型、70 多个模型供应商。

官网还披露,平台月处理量已经达到 100 万亿 tokens,全球用户超过 1000 万。

在 2026 年 5 月的 B 轮融资公告里也提到,过去 6 个月,OpenRouter 每周处理量从 5 万亿 tokens 增长到 25 万亿 tokens,并服务 800 多万开发者。

这些数字说明一件事:

OpenRouter 已经不是一个小众开发者工具,而是一个很大的 AI 调用入口。

开发者使用它的方式也很简单。

原来你要分别接 OpenAI、Anthropic、Google、DeepSeek、Mistral、xAI 等模型。

每接一家,都要看文档、申请 API key、绑定账单、处理接口差异、看限流规则、做异常处理。

用 OpenRouter 后,开发者可以通过同一个接口调用不同模型。

很多时候,原来使用 OpenAI 接口的代码,只需要改 base URL、换 API key,再指定模型名称,就可以通过 OpenRouter 调用别的模型。

这也是它早期增长很快的原因之一:迁移成本低。

为什么开发者不直接接模型公司?

看起来,开发者完全可以绕过 OpenRouter,直接去模型公司官网开通 API。

但在真实开发里,这件事没有那么简单。

如果一个 AI 产品只是 demo,只用一个模型就够了。但只要进入真实业务,就很难只依赖一个模型。

比如一个 AI 写作工具,可能有几类不同任务:

  • 生成标题,用便宜模型就够了;
  • 写长文章,需要更强的文本能力;
  • 分析资料,需要长上下文模型;
  • 做内容审核,需要低成本、高稳定的分类能力;
  • 企业客户要求数据不被留存,就必须选择符合数据政策的供应商;
  • 高峰期模型被限流,还要自动切到备用模型。

这时候,问题就不只是“接一个 API”。

团队要维护一套完整的模型调用系统:

哪个模型负责哪个任务,哪个模型更便宜,哪个供应商速度更快,哪个供应商失败率更低,出了问题怎么切换,账单怎么归因,企业客户的数据怎么隔离。

更麻烦的是,模型市场变化太快。

今天 Claude 适合写代码,明天 Gemini 的长上下文更有优势,后天 DeepSeek 或某个开源模型把价格打下来。

模型能力、价格、上下文长度、供应商政策,一直在变。

OpenRouter 的价值也就在这里。

它不是替开发者写 AI 应用,而是替开发者管理“用哪个模型、怎么调用、怎么兜底、怎么控成本”这件事。

不只是模型超市,而是模型调度层

如果只把 OpenRouter 理解成“模型超市”,就会低估了它。

模型超市解决的是“这里有很多模型,你可以挑”。

但 OpenRouter 真正重要的能力,是在模型和供应商之间做调度。

同一个模型,可能由不同供应商提供推理服务。

比如一个开源模型,可以由多家云服务商或推理服务商托管。不同供应商的价格、速度、稳定性并不一样。

OpenRouter 的文档里有一个能力叫 provider routing,也就是供应商路由。

开发者可以根据价格、延迟、吞吐、供应商顺序等条件,让请求自动走不同供应商。

它还支持 fallback,也就是某个模型或供应商失败后,系统自动切到备用选项。

对开发者来说,OpenRouter 相当于把“模型选择”和“故障处理”从业务代码里拆出来,交给一个专门的平台处理。

企业为什么会需要这层东西?

企业中上 AI,早期的问题通常是“能不能用”,但很快就会变成“怎么管”。

一个公司内部可能有很多团队都在用 AI。

市场团队用来写内容,客服团队用来回复用户,研发团队用来写代码,运营团队用来分析数据,法务团队用来处理合同。

如果每个团队都自己接模型,问题会越来越多:

  • 账单分不清;模型选择不统一;
  • 数据政策不透明;不同团队重复接入;
  • 出了问题没人知道是哪一路调用;
  • 模型供应商发生变化,系统很难统一调整。

OpenRouter 提供的工作区、预算控制、调用日志、供应商策略、零数据留存路由,都是在解决这些问题。

比如零数据留存。

对很多企业来说,不是所有请求都能随便发给任何模型供应商。客户信息、合同内容、医疗数据、金融数据,都可能有严格要求。

OpenRouter 文档里支持 Zero Data Retention,也就是零数据留存。

开发者可以设置只把请求发给不存储数据的供应商。这个策略可以按全局、模型组、安全规则或单次请求来执行。

再比如 prompt caching,也就是提示词缓存。

很多 AI 应用会反复使用很长的系统提示词、知识库内容或上下文。如果每次都重新计算,成本会很高。

OpenRouter 支持通过供应商粘性路由提高缓存命中率,尽量让后续请求走同一个供应商端点,从而降低重复上下文的成本。

这类功能听起来不性感,但非常实用,而且 AI 应用的规模越大,省下来的成本越明显。

OpenRouter 怎么赚钱?

OpenRouter 的商业模式很清楚:按使用量赚钱。

开发者先购买平台额度,然后按实际调用的模型和 tokens 付费。

OpenRouter 官方写得很清楚:

平台在购买额度时收取 5.5% 的费用,最低 0.8 美元;底层模型供应商的价格按原价转给用户,不在模型推理价格上额外加价。

这是一门很典型的“流量过路费”生意。

这个模式的好处是,收入和使用量绑定。

开发者调用越多,平台收入越高;AI 应用越多、tokens 消耗越大,OpenRouter 的生意就越大。

但它也有一个特点:单次抽成不高,所以必须靠规模。

这也是为什么 tokens 处理量对 OpenRouter 很重要。

它的核心指标不是注册用户数,而是每周、每月有多少 tokens 从它这里流过。

2025 年,OpenRouter 的年处理量从约 10 万亿 tokens 增长到 100 万亿 tokens 以上。

到了 2026 年,OpenRouter 已经达到约 1.5 千万亿 tokens 的年化处理量。

这就是这门生意的底层逻辑。

只要越来越多 AI 应用跑在多模型系统上,OpenRouter 就能从这些调用里持续抽取服务费。

为什么最近增长这么快?

OpenRouter 的增长,总结下来是吃到了三个变化。

第一个变化,是模型越来越多。

过去做 AI 应用,很多团队默认先用 OpenAI。现在不一样了。

Claude、Gemini、DeepSeek、Qwen、Mistral、Llama、Grok,还有大量开源和开放权重模型,都在不同场景里有优势。

这不是一个“谁完全替代谁”的市场。

有的模型写代码好,有的模型便宜,有的模型长文本强,有的模型速度快,有的模型适合角色扮演,有的模型适合企业文档,有的模型适合多模态。

模型越多,选择成本越高;选择成本越高,中间层就越有价值。

第二个变化,是 AI 应用开始关注成本。

很多产品早期用最强模型,因为先要把效果做出来。

但产品一旦有用户,模型成本会很快变成问题。

一个客服机器人、AI 搜索产品、代码助手、内容生成工具,如果所有请求都走最贵模型,毛利很容易被吃掉。

更成熟的做法是,把任务拆开:

  • 简单任务用便宜模型;
  • 复杂任务用强模型;
  • 高频任务优先低延迟模型;
  • 失败后切备用模型;
  • 涉及敏感数据时,只走符合数据政策的供应商。

这正是 OpenRouter 的使用场景。

它不一定帮你找到“最强模型”,但它可以帮你在效果、价格、速度和稳定性之间做平衡。

第三个变化,是 AI 应用从聊天框走向智能体。

智能体会调用工具、读取文件、搜索网页、执行任务,也会连续多轮调用模型。

相比普通聊天,智能体会消耗更多 tokens,也更依赖稳定性。

这对 OpenRouter 是利好。

因为调用次数越多、链路越长,开发者越需要路由、备用、日志、成本控制和供应商管理。

这也是为什么 OpenRouter 的融资公告里强调,AI 正在从实验走向关键生产应用和智能体场景。

它的增长,本质上来自 AI 调用量的上升。

这门生意也有风险

OpenRouter 的位置很好,但并不安全。

它夹在模型公司、云厂商和应用开发者中间。这种位置既有价值,也容易被挤压。

第一个风险,是大公司可能自建。

对小团队来说,OpenRouter 很省事。

但对大企业来说,模型路由、权限、日志、成本管理,也可以自己做,或者交给云厂商做。

尤其是金融、医疗、政企客户,可能更在意数据可控和私有化部署。

OpenRouter 要进入这些客户,不能只靠“模型多”。它必须把权限、审计、数据政策、供应商管理和企业支持做得足够深。

第二个风险,是云厂商也会做模型网关。

AWS、Google Cloud、Azure 这些云平台,本来就有企业客户、账单系统、权限系统和合规能力。

它们完全可以把多模型调用、路由、监控和成本管理做成云服务的一部分。

OpenRouter 的优势是开放和中立,模型覆盖更广,接入更快。

但云厂商的优势是客户关系和企业采购流程,这是一场长期竞争。

第三个风险,是模型供应商关系。

OpenRouter 给模型公司带来流量,但也让模型公司离最终开发者远了一层。

当平台越来越大,它会掌握更多用户关系和模型使用数据。

模型供应商既希望获得分发,也会担心议价权被削弱。

这类中间层平台,早期通常被供给方欢迎;规模变大后,关系会更微妙。

第四个风险,是平台费可能被压低。

OpenRouter 收 5.5% 平台费,现在看起来不高。

但如果类似服务越来越多,开发者会比较价格、稳定性、模型覆盖和企业功能。

如果某些竞品愿意更低费率,或者云厂商把这类能力打包进已有服务里,OpenRouter 就需要证明自己不只是一个“请求转发器”。

它必须持续提供更好的路由、更强的模型覆盖、更透明的价格、更稳定的服务和更完整的企业控制。

热门币种推荐

相关问答

QOpenRouter的核心业务是什么,它为开发者解决了什么问题?

AOpenRouter是一个统一的大模型接口平台,其核心业务是充当“模型中转站”或“模型调度层”。它整合了OpenAI、Claude、Gemini、DeepSeek等超过400个模型和70多个供应商,为开发者提供统一的API入口、账户和账单。它解决了开发者直接对接多个模型厂商的复杂性问题,如接口差异、文档学习、API密钥管理、账单处理、模型限流和故障切换等,帮助开发者降低多模型系统的开发和维护成本,并在效果、价格、速度和稳定性之间进行智能平衡与调度。

QOpenRouter为何能快速成为一家估值近13亿美元的独角兽公司?

AOpenRouter的快速增长和成为独角兽主要得益于抓住了三个关键市场变化:1. 模型生态爆发:市场上出现了大量在能力、价格、速度上各有千秋的模型,开发者选择和管理成本剧增,使得中间调度层变得不可或缺。2. AI应用进入成本控制阶段:当AI产品从实验走向规模化生产,企业开始精细化控制成本,需要根据任务类型动态选择性价比最高的模型和供应商,这正是OpenRouter的核心价值。3. AI应用形态演进:从简单聊天向复杂的智能体应用发展,产生了更多、更连续的模型调用需求,对模型的稳定性、路由、备用和成本管理要求更高。同时,其月处理量达到100万亿tokens、拥有千万级用户的庞大规模,也支撑了其高估值。

QOpenRouter与“模型超市”有何本质区别?它提供了哪些关键的企业级功能?

AOpenRouter超越了简单的“模型超市”(仅提供多种模型选择),其本质是“模型调度层”。它不仅聚合模型,更提供智能的模型与供应商路由、故障回退、成本优化和企业级管理功能。关键企业级功能包括:供应商路由:根据价格、延迟、吞吐等条件自动选择最佳供应商。故障切换:在模型或供应商失败时自动切换到备用选项。零数据留存路由:确保敏感数据仅被发送给符合严格数据政策的供应商,满足企业合规要求。提示词缓存:通过供应商粘性路由提高缓存命中率,降低重复长上下文的成本。工作区与预算控制:帮助企业分团队管理模型使用、统一账单并进行预算管控。调用日志与供应商策略:提供完整的审计追踪和策略配置能力。

QOpenRouter的商业模式是什么?其收入增长依赖的核心指标是什么?

AOpenRouter采用“流量过路费”模式。它向开发者收取平台使用费:用户在平台充值额度时,OpenRouter收取5.5%的费用(最低0.8美元)。对于模型推理本身,OpenRouter按供应商的原价向用户收费,不额外加价。这种模式的优点是收入与使用量直接绑定,用户调用越多,平台收入越高。其收入增长高度依赖的核心指标是平台处理的tokens总量。文章指出,到2026年,其年化处理量已达到约1.5千万亿tokens。这是一个规模驱动的生意,必须通过不断增长的AI调用流量来实现收入和估值提升。

QOpenRouter作为一家成功的“中转站”公司,面临哪些主要风险和挑战?

AOpenRouter面临的主要风险和挑战包括:1. 大客户自建风险:大型企业出于数据可控和定制化需求,可能选择自建模型调度和管理系统,或要求私有化部署。2. 云厂商的竞争:AWS、Google Cloud、Azure等云平台拥有现成的企业客户、账单和合规体系,可能将类似功能整合为云服务的一部分,对OpenRouter形成挤压。3. 与模型供应商关系的微妙性:作为分发渠道,OpenRouter让模型商与最终用户隔了一层。随着平台规模扩大,其掌握的议价权和用户数据可能引发模型供应商的担忧,合作关系可能变得复杂。4. 平台费率竞争压力:如果出现更多低成本竞品,或云厂商将此类服务免费打包,OpenRouter的5.5%平台费可能面临下调压力,需要持续强化其在路由优化、模型覆盖、稳定性和企业服务上的独特价值以维持竞争力。

你可能也喜欢

21shares 年中重磅报告:BTC 四年周期未破,稳定币与代币化成新增长引擎

21shares年中报告回顾了年初对2026年加密行业的十大预测,并评估其半年进展。总体认为行业从叙事驱动转向基本面驱动的方向正确,但进展不一。 核心结论包括: 1. **BTC四年周期未破**:价格走势仍遵循历史减半后模式,但市场结构更成熟,跌幅收窄,年末预期回升至10万美元附近。 2. **加密ETP规模下降**:受价格影响,全球资产管理规模(AUM)从1720亿降至约1400亿美元,但产品创新与机构采纳仍在推进。 3. **稳定币增长稳健**:总供应量约3200亿美元,持续创新高,显示需求不再依赖市场周期,但万亿美元目标达成需更长时间。 4. **DeFi增长受安全事件拖累**:总锁仓价值(TVL)维持在约1400亿美元,未达预期,主要因频繁安全事件打击信心,资金向有真实收入的协议集中。 5. **企业加密国库整合加速**:持仓BTC总量超128万枚,但总价值约1000亿美元。弱者正被淘汰,强者通过收购整合。 6. **预测市场超额完成**:半年交易量已达575亿美元,超全年千亿目标半数,下半年重大事件有望推动再创新高。 7. **AI代理经济仍处早期**:基础设施就绪,但大规模应用和交易量(千万美元级)尚未爆发,属于打基础阶段。 8. **以太坊L2集中化加剧**:前5大L2占据近90%日活用户,多数小规模扩展方案正被淘汰,整合持续。 9. **合规代币发行平台就绪**:基础设施完善,标杆案例出现,但融资规模受传统股市高回报分流影响,尚未成为主流渠道。 10. **代币化资产快速增长**:公链分发价值约310亿美元,但机构内部“表示”上链的资产价值更高。核心市场基础设施(如DTCC)开始行动,为未来增长铺路。

marsbit1小时前

21shares 年中重磅报告:BTC 四年周期未破,稳定币与代币化成新增长引擎

marsbit1小时前

交易

现货
合约

热门文章

加密市场宏观研报:原油飓风、AI巨浪与比特币的十字路口

全球金融市场正经历一场由地缘冲突引发的系统性重估:霍尔木兹海峡封锁导致原油一度暴涨30%,G7紧急释放储备后涨幅收窄,滞胀风险取代通胀成为核心担忧,美元成为“唯一避风港”并逼近100大关,亚太及美股遭遇“黑色星期一”全线重挫;AI领域则冰火两重天,国家发改委提出“十五五”末10万亿规模目标,OpenClaw项目火爆推动概念股狂飙;比特币在宏观风暴中跌破70000美元关键防线。

595人学过发布于 2026.03.12更新于 2026.03.12

加密市场宏观研报:原油飓风、AI巨浪与比特币的十字路口

相关讨论

欢迎来到HTX社区。在这里,您可以了解最新的平台发展动态并获得专业的市场意见。以下是用户对AI(AI)币价的意见。

活动图片