AI 推理市场全景解析,加密项目如何突围?

Foresight News发布于2026-06-25更新于2026-06-25

文章摘要

本文深入解析了AI推理市场,指出其核心价值正从模型训练转向推理环节。推理是模型响应请求并生成答案的过程,目前占据了大部分经济利益。市场可分为传统与加密两大阵营:传统提供商(如AWS、Google)主打可靠性、企业级服务;加密网络(如Chutes、Akash)则侧重开放访问、低成本、隐私和新型激励机制。 路由器(如OpenRouter)成为市场关键瓶颈,它聚合不同提供商的模型,根据价格、延迟等因素智能路由请求,类似能源市场的调度中心。传统市场还包括优化开源模型的服务商(如Together、Fireworks)和模型市场(如Replicate)。 加密AI推理项目呈现多样化:Chutes提供去中心化推理API;Akash是GPU拍卖市场;io.net侧重分布式GPU云;Targon专注保密计算;Darkbloom利用闲置Mac进行私密推理;Venice面向消费者提供私密AI体验;NuNet致力于分布式算力编排;OpenServ关注代理基础设施;Dolphin AI从无审查模型需求切入;c0mpute尝试跨机器分布式推理。 文章指出,加密项目的优势在于无许可供给、隐私、可验证性和代币化支付。成功的关键在于:真实的付费需求、每GPU收入、路由器集成、有效的验证机制、真实的隐私保障以及代币价值捕获。最终,市场的赢家将是能有效控制需求、路由、验证和结算的实体,而不仅仅是拥有算力的供给方。


撰文:0xSammy(Khala Research)

编译:AIdidiaoJP,Foresight News


当前 AI 推理市场已不再像单一的云服务市场,而更像一盘「风险」棋局。每家提供商都在争夺不同领地:超大规模云服务商掌控企业级大陆,路由器把持贸易通道,而去中心化网络则在开放前沿奋力厮杀。


上一轮 AI 周期的核心是模型训练,但如今越来越明显,推理环节蕴含着巨大的经济价值。很多人可能第一次听到「inference」(推理)这个词,那么它到底是什么?


训练创造 AI 模型,而推理则是当有人向模型提问或下达任务时,模型生成答案的过程。


AI 推理市场概览


训练环节之所以占据头条,是因为它支撑着那些令人惊叹的输出。但实际上,推理目前拿走了大部分经济利益——每一个提示、代理循环、图像生成、交易执行、工具调用和代码编辑,都必须在某个地方运行。


路由器是真正的瓶颈


在「风险」棋局中,最有价值的领地往往是那些狭窄的瓶颈,它们决定军队下一步如何移动。在推理市场中,路由器扮演着完全相同的角色。它们位于需求与供给之间,决定每个请求流向何处、哪家提供商能拿到报酬。


其中一个典型例子是 OpenRouter,其协议上周就处理了 4700 万亿个 token。


这种经济活动丝毫没有放缓迹象,尤其是随着数万亿代理即将上线。



那么,一个完整的推理市场需要什么?核心要素包括:


  • token 正成为记账单位
  • OpenRouter 正迅速成为核心的交易所层,上周通过其 LLM 市场使用的 token 量就达 4700 万亿。
  • 专业供给侧:Fireworks、Together、Replicate、Baseten、Groq 以及各大超大规模云服务商。
  • 加密 AI 网络:Chutes、Akash、io.net、Nosana、Targon、Venice、NuNet 等项目,正在构建底层的无许可版本。


不要把所有这些提供商当成在同一个市场竞争——它们根本不是。


传统提供商销售的是可靠性、开发者体验和企业级采购流程。


加密 AI 网络则主打更便宜的供给、开放访问、隐私性、可验证性以及全新的激励循环。


最近 Anthropic 禁止美国以外用户使用其 Mythos 模型(Fable 5)的事件,让很多人重新意识到过度依赖单一前沿专有模型的风险。


有趣的是,两个世界开始出现重叠:隐私、保密计算或代理原生支付(Venice 和 Targon 在这方面表现突出)。


如何看待 AI 算力市场


更好的视角是把市场分为传统与加密两大阵营:



传统侧卖的是可靠性、开发者体验和企业采购。


加密网络则主要竞争开放访问、更低成本供给、隐私、可验证性和新型激励机制,以全球无缝协调资本。


为什么推理才是真正的 AI 市场


模型层依然重要,但模型质量正在以超出预期的速度压缩。开源模型已达到前沿模型 90-95% 的质量,却只需其 10% 的成本(例如 Z.ai 的 GLM-5.2)。



开源模型持续迭代,中国实验室不断压低价格。前沿模型仍能维持溢价,但在其之下,代币定价竞争已非常激烈。



这正是路由层变得关键的原因:同一个开源模型可能由五家不同提供商以五种不同价格提供,开发者不想永远硬编码一个端点,他们需要路由器。



路由器可以根据价格、延迟、隐私、可靠性等多种因素进行选择。



它位于所有提供商之上,将混乱的格局变成一个干净统一的界面。


这正是 OpenRouter 做对的地方,也解释了为什么风险投资基金在最近的 B 轮融资中投入了 1.13 亿美元,来抓住这个路由机会。



OpenRouter 正快速成为市场界面:一把钥匙就能访问数百个跨多家提供商的模型。真正的价值不在于模型列表,而在于同一个请求能被路由到最适合该任务的提供商。


这开始像能源市场:用户不在乎哪家电厂发了电,他们只关心灯是否亮起、价格是否公道、系统是否稳定。



AI 用户也将越来越这样思考——他们不在乎哪个 GPU 集群服务了这个代币,只关心响应是否快速、便宜、私密且可靠。


传统推理提供商



传统侧正在分化成四类:


i) 超大规模云服务商(Hyperscalers):AWS、Google、Microsoft


它们掌控着「 fortified continents」(坚固大陆)。它们获胜并非因为永远最便宜,而是因为早已控制企业采购、合规、身份、 安全和账单体系。正面攻击这个阵地成本极高。


它们靠企业信任取胜。大公司购买的不仅是 token,更是合规、安全、采购便利以及出问题时有人负责。


ii) 路由市场:OpenRouter 及各类 AI 网关


路由器位于模型提供商之上,将每个请求发送到最佳选项。随着模型领导地位每周变化,硬编码单一模型显得越来越脆弱。AI 需要聚合器,就像加密领域一样。


iii) 优化开源模型服务:Together、Fireworks、Baseten、Groq


它们不只是廉价 API,而是专注速度、批处理、扩展、微调、自定义端点和生产支持的性能基础设施公司。


iv) 模型市场:Replicate 及类似 Hugging Face 的平台


推理远不止聊天。图像、视频、语音、嵌入、机器人模型、模拟和多模态代理都需要模型运行。市场让长尾模型需求变得易于获取。


加密 AI 推理提供商


去中心化网络是「游击领地」


加密推理网络并不试图在 AWS 的主战场上花费更多资金。它们开辟新战线:无审查模型、更便宜的 GPU 供给、私密推理、代理原生支付,以及不需要超大规模云服务商级别可靠性的工作负载。


加密侧常被简单归为「去中心化算力」,这个说法太模糊了,至少有五类不同方向:


  • 无服务器推理网络
  • 去中心化 GPU 市场
  • 保密计算网络
  • 私密 AI 应用与网关
  • 编排层


它们不应被同等分析。


i) Chutes:加密原生推理


@chutes_ai 最好理解为去中心化推理平台,而非单纯的 GPU 市场。


核心在于:开发者不想租用 GPU 或管理基础设施,他们想要一个能正常工作的端点。Chutes 通过熟悉的 API 服务开源模型,底层使用去中心化 GPU 供给。


关键问题是能否将头部使用量转化为付费、 recurring( recurring)需求。便宜代币有用,但前提是开发者信任其正常运行时间、延迟和可靠性。


其每万亿代币收入持续上升,显示出可持续盈利 / 可行性的潜力。



ii) Akash:GPU 拍卖层


@akashnet 是去中心化云市场。


用户定义所需算力,提供商竞价供应,工作负载通过租约运行。它更像算力市场,而非直接推理路由器。


其最适合价格敏感、能容忍基础设施波动且不需要深度集成 AWS/Azure/Google Cloud 的工作负载。费用与代币价格有一定相关性且呈上升趋势。


iii) io.net:去中心化 GPU 云


@ionet 更接近去中心化 GPU 云提供商。


核心卖点是以更低成本和更快配置速度访问分布式 GPU 供给,适合需要算力但不想签订长期云合同或接受超大规模定价的 AI 团队。


挑战在于执行:硬件验证、可靠性、调度、支持和一致性能。原始 GPU 访问有价值,但更高利润层仍是路由、管理推理和编排。


io.net 过去 30 天表现突出,年化收入达 1230 万美元。



iv) Targon:保密计算


@TargonCompute(由@manifoldlabs 打造)专注于 AI 工作负载的保密计算。


它解决的问题显而易见:许多用户不愿在未知第三方运营的基础设施上运行敏感提示、模型或数据。


Targon 通过可信执行环境、加密虚拟机、远程证明和保密 GPU 基础设施提供受保护执行。简单说,就是证明工作负载在安全环境中运行,并减少运营商能看到的内容。


这对金融、医疗和企业 AI 等领域的私密推理尤为相关。保密计算并非魔法,它将信任转移到硬件、固件和证明系统上。


去年该协议报告年收入 1040 万美元,并与 Intel 共同撰写了关于「不可信硬件上的去中心化算力」的研究论文。



v) Darkbloom:闲置 Mac 上的私密推理


Darkbloom(由@eigenlabs 打造)走的是不同路线。


它不把大模型分片到随机 GPU 上,而是把闲置的 Apple Silicon Mac 变成私密推理网络。Mac 本地运行模型,请求被加密并路由到经过验证的提供商。


卖点是隐私和成本,而非最大化前沿模型性能。


这很有用,因为「没有节点持有完整模型」并不自动意味着提示是私密的。Darkbloom 更明确地针对隐私问题,但仍需证明供给规模、性能和开发者信任。


目前网络已有 300 台机器,服务了 20 亿 token 和 100 万次请求。



vi) Venice:面向消费者的私密推理


@AskVenice 所处位置与 Akash 或 io.net 等网络不同。它更像是私密 AI 应用和推理网关,而非主要 GPU 市场。


其网关吞吐量已达每日 850 亿 token(@ErikVoorhees 数据)。



大多数用户想要一个尊重隐私、能访问强大模型且不大量收集数据的 AI 产品。


Venice 将基础设施理念包装成面向消费者的体验,围绕私密提示、开源模型、无审查访问、API 功能以及通过 VVV 和 DIEM 实现的代币化算力。


DIEM 组件特别有趣,它指向更广泛的代理经济理念:提供每日 1 美元算力访问。市场最近已为这一概念赋予了不错的价格标签。


如果代理需要持续访问推理,那么算力积分开始像代理原生资产,整个二级市场都可以围绕它构建。


一个能直接持有和花费算力权利的代理,比依赖人类定期刷信用卡的代理更实用。


这凸显了更深层的加密 AI 论点:代理最终需要访问资金、身份、记忆和算力,而加密系统为这些资源的编程化提供了框架。


Venice 并非在模型广度上直接与 OpenRouter 竞争,而是竞争隐私、访问和代币化算力。这是一个 legitimate(合理)利基,但关键问题是私密 AI 产品的需求是否会大到足以支撑代币模型超越当前叙事周期。我的判断是,随着 AI 普及,隐私叙事只会越来越强。


vii) NuNet:分布式算力编排


@nunet_global 常被归入去中心化算力项目,但更有用的框架是「编排」。


编排涉及将工作负载匹配到最合适的算力资源,并在不同机器、环境和位置间协调执行。



随着 AI 超越中心化云基础设施,这变得越来越重要。


未来 AI 系统很可能跨越云 GPU、边缘设备、本地服务器、机器人、手机、传感器和去中心化提供商网络运行。


仓库机器人可能等不及跨区域 API 响应;无人机不能假设时刻有完美连接;野外机器人需要在网络不可靠时本地执行推理。


因此,编排正成为一个独立且有意义的类别。


NuNet 的挑战在于能否将这个协调问题转化为具备足够供给、需求和开发者采用的 functioning( functioning)经济网络。


viii) OpenServ:代理编排,而非纯推理


@openservai 最好理解为代理基础设施和编排平台,而非去中心化推理网络。


这很重要,因为代理是未来最清晰的推理需求来源之一。普通聊天机器人可能只调用一次模型,而代理会反复调用模型:推理、使用工具、检查输出、调用另一个模型、采取行动,然后循环。


这创造了沉重的推理需求,已在加密圈内引起注意。


OpenServ 因此从需求侧而非供给侧与推理市场相关。如果该平台能成为开发者构建、部署和协调代理的有用场所,它自然会成为底层路由推理到不同提供商的层。


关键问题是 OpenServ 能否成为真正的代理执行层,还是只是另一个附带代币的代理市场。


与团队多次交流后,我认为其能力不止于后者,其推理框架有若干 notable(显著)基准表现,路线图上还有自有专有模型。


如果 OpenServ 能掌控代理化运营工作流,推理就成为平台的输入而非主要产品。


在代理化世界中,最有价值的层将是代理花费大量持续时间和资源的场所。


ix) Dolphin AI:产品驱动的去中心化推理


@dphnAI 有趣之处在于它从模型需求而非 GPU 市场起步。


Dolphin 模型家族已有无审查开源模型的口碑,这让网络有了更清晰的存在理由。


这很重要,因为许多去中心化推理项目都是供给先行:「我们有 GPU,现在谁来买?」


Dolphin 则相反:从人们已经想用的模型集合出发,然后围绕该需求构建去中心化推理网络。


其架构常被称为 peer-to-pool:GPU 所有者将容量贡献到特定模型池中,而不是每个买家直接租用特定节点。请求路由到池中,可用节点处理。


这对不可靠的消费者供给来说是更好的设计。如果有人贡献闲置游戏 GPU,他们可能不会永远保持在线,池化模型能比一对一租赁市场更自然地吸收这种波动。


更有趣的是验证。Dolphin 正在推动 live-weight proofs(实时权重证明)。简单说,就是检查服务过程中实际加载的模型权重是否与节点声称运行的模型一致。


这很重要,因为作弊是去中心化推理中最难的问题之一。节点可能声称运行昂贵模型,却偷偷服务更小、更便宜或量化版本的模型。如果网络无法检测,整个市场就会失去可信度。


x) c0mpute:面向代理的分布式推理


@c0mputeAI 值得关注,因为它试图解决去中心化推理中最难的问题之一:在开放互联网上跨分散 GPU 运行大模型。


其 Shard 引擎将模型拆分到多台机器上,而非要求一台巨型服务器容纳完整模型。这对可能太大或受限而无法通过常规托管路线的前沿规模开源模型尤其相关。


@virtuals_io 的链接是关键需求侧角度。Virtuals 正在构建代理经济,而代理是重度推理用户:它们规划、调用工具、交易、检查结果并循环。这创造了对廉价、开放且抗审查推需求。


caveat 是这仍处于早期阶段。c0mpute 需要证明真实负载下的性能、节点可靠性、验证和提示隐私。


但方向很重要:GPU 市场销售算力访问;c0mpute 正试图分发模型本身。


传统 vs 加密推理


两者将共存,各有明显且值得理解的独特优势。



需要关注什么


付费 token 量


市场应减少对原始 token 处理统计的关注,除非这些代币产生收入。免费层活动和补贴使用能制造亮眼数字,却无法证明真实的产品市场契合。


付费推理需求才是关键指标——它更可持续,能支撑长期可行性。


ii) 每 GPU 收入


去中心化算力网络只有在 GPU 在网络内赚取的价值高于外部时才可持续。如果排放是提供商参与的主要原因,一旦激励下降,供给就会消失。GPU 提供商会计算机会成本。


iii) 路由器集成:分发


分发往往比基础设施本身更重要。


OpenRouter 集成、编码代理、钱包、支付端点、开发者工具和消费者应用,都是潜在需求来源。


支付端点是软件可通过 API 直接支付服务的通道。


iv) 验证


GPU 欺骗、虚假容量和不可靠提供商仍是真实风险。


网络需要 robust( robust)的硬件验证、加密流量、声誉系统和对不良行为的 meaningful(有意义)惩罚。


v) 隐私保障


私密推理仍是加密 AI 最强机会之一,但保障必须真实。营销隐私容易;安全执行、本地优先架构、数据最小化和可审计基础设施则难得多。


vi) 代币价值捕获


最强的代币模型将需求直接与真实推理使用挂钩。这可能涉及回购、销毁、质押要求、算力权利或与收入挂钩的机制。


仅靠宽泛的 AI 叙事长期来看不太够。


核心结论


终局是需求控制


在「风险」棋局中,仅拥有零散领地是不够的。你需要连通的区域、增援路线和持久的补给线。


在推理市场中同样如此。赢家将掌控需求、路由、验证和结算;仅拥有 GPU 本身不够。


推理市场让 AI 开始 resemble( resemble)金融系统:


  • 每一个生成的代币都携带成本,
  • 每一个端点都带有利润,
  • 每一个代理循环都创造需求,
  • 每一个路由器都像做市商,
  • 每一个 GPU 网络都成为供给来源......


传统提供商目前主导开发者体验和企业信任层。


加密 AI 网络则在探索另一条前沿:无许可供给、私密推理、可验证算力、代币化访问以及代理原生(无 KYC 限制)支付。


短期内,赢家不太可能是最去中心化的网络,而更可能是让去中心化推理感觉普通且可靠的网络——通过快速端点、强文档、可靠正常运行时间、透明定价、验证供给和 genuine(真实)付费需求。


Chutes 仍是值得重点关注的项目之一,因为它最接近将 Bittensor 支持的算力转化为 functioning( functioning)推理市场,而非单纯的 GPU 叙事。Eigen Labs 的「Darkbloom」也是如此。


Akash 和 io.net 代表供给侧挑战者,Targon 代表保密计算论点,Venice 代表私密 AI 需求层,NuNet 代表更分布式算力未来的编排。


更广泛的论点:


「AI 模型可能越来越商品化,但推理市场不太可能遵循相同路径。」


最大价值将归属于那些路由工作、验证工作、结算工作并捕获需求的实体。


这正是下一个加密 AI 机会可能出现的地方......至少在物理 AI 在社会中胜任之前。

相关问答

Q什么是AI推理?它在AI经济中扮演什么角色?

AAI推理是指当用户向AI模型提问或下达任务时,模型生成答案(如文本、图像、代码等)的实时运行过程。与创造模型的训练环节不同,推理是AI模型投入实际应用并产生价值的核心环节。当前AI市场中,虽然训练环节备受关注,但推理才是创造大部分经济价值的部分,因为它支撑着每一次具体的用户交互和应用请求。

Q文章中提到的AI推理市场中的“路由器”(如OpenRouter)具体是什么,为什么它至关重要?

A“路由器”是指位于AI模型需求方(开发者或应用)与供给方(各种算力提供商)之间的路由与聚合层,如OpenRouter。它之所以至关重要,是因为它解决了当前市场上模型提供商众多、价格和性能差异巨大的问题。路由器根据价格、延迟、隐私、可靠性等因素,将用户的每一次推理请求智能地路由到最适合的提供商,从而为开发者提供了一个统一、高效且经济的接入界面。它扮演着市场瓶颈和协调者的角色,是获取真实市场需求和流量的关键节点。

Q与传统推理市场相比,加密AI推理项目(如Chutes、Akash等)有哪些独特的竞争策略和价值主张?

A加密AI推理项目并不主要在成本、可靠性和企业级服务上与传统云巨头(如AWS)直接竞争,而是开辟了新的差异化战场,其独特价值主张包括: 1. **开放访问与无审查**:提供不受地理或政策限制的模型访问。 2. **隐私与保密计算**:通过可信执行环境等技术,保护用户数据和推理过程的私密性。 3. **更便宜的分散式算力供给**:利用全球闲置或去中心化的GPU资源降低成本。 4. **新型激励机制与代币化**:通过代币经济协调全球资本和资源,并探索代理原生支付等新场景。 5. **可验证性**:利用加密技术证明工作负载在指定硬件上正确执行。

Q文章认为评估一个加密AI推理项目时,应关注哪些关键指标?

A评估加密AI推理项目应超越表面叙事,关注以下关键指标: 1. **付费Token量/收入**:真实的、可持续的付费推理需求是产品市场契合度的核心证明,比免费或补贴的使用量更重要。 2. **每GPU收入**:衡量网络为供给方(GPU提供者)创造的实际经济价值,这关系到网络的供给是否可持续。 3. **路由器集成与分发**:项目是否被集成到OpenRouter等主流路由层或支付端点中,这决定了其获取需求的能力。 4. **验证机制**:是否有强大机制来防止GPU欺诈、虚假算力,确保服务质量和可信度。 5. **隐私保障的实际效果**:隐私功能是否通过可靠的技术(如保密计算)实现,而非仅停留在营销层面。 6. **代币价值捕获**:代币模型如何与真实推理使用和收入挂钩,确保长期价值。

Q文章对AI推理市场的“终局”或未来竞争格局有何核心判断?

A文章的核心判断是:**最终控制市场价值的将不是单纯拥有GPU算力的一方,而是控制需求、路由、验证和结算的实体**。未来的赢家需要像下棋一样,连通各个领地并建立稳固的“补给线”。这意味着: 1. **模型可能商品化**,但**推理市场不会**。 2. **传统提供商**凭借企业信任、可靠性和完整生态,将继续主导企业级市场。 3. **加密AI网络**的突破口在于成功将去中心化、隐私、代币化等特性,转化为能让开发者感觉“普通且可靠”的服务(如快速的端点、高可用性、透明定价)。 4. 最大的机会属于那些能够有效聚合需求、智能路由请求、严格验证工作并实现价值结算的平台或协议。

你可能也喜欢

连CZ都夸Hyperliquid“很棒”,但它最大的护城河,可能也是最大风险

在Galaxy Brains节目中,币安创始人赵长鹏(CZ)称赞了链上永续合约交易平台Hyperliquid的产品“很棒”,但也明确指出其基于“免KYC+去中心化叙事”的模式是币安无法、也不愿复制的赛道。这揭示了Hyperliquid的核心竞争优势——无需身份验证的开放访问体验,但也将其最大的护城河与潜在的法律合规风险紧密绑定。 CZ的评论将讨论从产品层面提升至市场结构问题。Hyperliquid的优势在于为交易者提供更快、更原生、更少障碍的高杠杆市场访问,但这恰恰可能成为监管机构的审查焦点。英国金融行为监管局(FCA)已对Hyperliquid发布未经授权运营的警示,将其视为金融服务提供方而非单纯的基础设施。 与此同时,受监管的在岸市场(如CME、Cboe)正在推出类似永续合约体验的连续期货产品,不断缩小与链上平台之间的“产品差距”。然而,它们无法复制Hyperliquid的“访问差距”。这导致Hyperliquid的长期优势可能越来越集中于其免KYC等特征上,而这也正是监管压力最可能指向的地方。 文章指出,未来的监管动向、Hyperliquid自身访问规则的变化,以及在岸产品的演进,将共同决定这条“护城河”的稳固性。Hyperliquid的成功取决于交易者是否持续认为“访问便捷性”的价值高于“监管不确定性”带来的折价。其最大的优势,也可能成为其最大的风险来源。

marsbit51分钟前

连CZ都夸Hyperliquid“很棒”,但它最大的护城河,可能也是最大风险

marsbit51分钟前

交易

现货
合约
活动图片