Token套餐上线:AI时代的“流量战争”,轮到豆包们卷了

marsbit發佈於 2026-05-19更新於 2026-05-19

文章摘要

随着AI应用普及,大模型使用量激增,Token(大模型处理信息的最小单位)正成为新的计费标准。近期,国内电信、移动、联通等运营商陆续推出面向个人和企业的Token套餐服务,例如月费9.9元可获得1000万Token,支持话费支付,并聚合了豆包、千问、DeepSeek等主流模型供用户灵活调用。 此举意味着Token开始像手机流量一样被“套餐化”,降低了用户切换和使用不同模型的门槛。对用户而言,选择更灵活;但对大模型厂商来说,用户粘性可能减弱,竞争将更加激烈。厂商们需要从单纯比拼模型参数,转向优化“单位能耗的Token输出质量”,并面临更直接的价格竞争。未来,盈利重心可能从提供基础API,转向开发高价值的AI应用解决方案和行业智能体。 运营商的入场,标志着Token正从技术指标走向标准化消费品,可能推动AI能力像水电一样成为基础资源。一个“运营商掌控入口,模型厂商提供能力”的双边市场格局正在形成。

文 | 硅基象限

当用户不再纠结每月是否要升级流量套餐时,或许要开始纠结每月买多少Token服务了。

Token即将像流量、宽带、短信一样,被运营商包装成标准化服务进行售卖。

日前,国内三大运营商陆续推出Token套餐产品:面向个人用户推出按月订阅制Token 方案,面向开发者和企业客户提供分层算力套餐,并宣布已将数十至数百种大模型纳入平台,“按月购买、多模型调用、话费支付”。

中国电信已推出个人及企业版Token套餐,月费最低9.9元,1000万Token使用量;上海移动、上海电信等地方运营商则推出按额度点或通用Token计费模式,上海移动1元可获得40万Tokens。

随着运营商开始售卖Token服务,用户切换大模型的成本将大幅降低,那么对于大模型企业来说,“用户粘性”将被弱化,只有“更卷”才能保住市场。

未来,豆包、千问、DeepSeek等大模型厂商,不仅要卷“价格”,“单位能耗下Token质量”,甚至卷向“更高价值的AI应用解决方案能力”。

01 什么是 Token 服务?

要理解Token服务,先理解什么是Token。

计算机无法直接识别文字,只能识别0、1代码,所以我们输入的每个单词、文字、语音、标点,都会通过特定编码机制,转换成0、1代码。

在大模型语境中,也是先识别数字编码,而每个文字转换成的数字编码位数略有差异。

Token是大模型处理信息的最小计算单位。用户输入、上下文记忆、模型输出,都以Token计算。模型调用越复杂、上下文越长、Agent执行链条越深,Token消耗越高。

通常情况下:在英文中,一个Token大约相当于4个字母;在中文中,由于汉字信息密度更高,一个汉字、一个标点符号或一个词组,往往对应1到2个Token。

由于大模型的思考和输出是逐个Token进行的,因此,行业便将大模型的调用成本、使用额度,以“每百万Token(Per Million Tokens)”或“额度点”的形式向用户进行售卖与结算。

目前大模型公司对于Token进行阶梯收费,普通用户用豆包、千问这类大模型普通模式,免费;而如果是企业级的重度使用,可以通过购买不同阶梯的API包月、计量服务。

从去年开始,运营商开起了大模型“算力超市”。模型厂商是 “入驻商户”,运营商收 “平台费+算力费+渠道费”。用户买的不是 “运营商模型”,而是:在电信平台上,用电信算力,调用任意大模型,按Token计费。

2025年7月,中国移动发布模型服务平台MoMA(Mobile Model Access);4月,中国电信发布星辰TokenHub运营服务平台,5月,“联通星罗”Token服务平台发布,这些平台把百度、阿里、字节、DeepSeek 等多家主流大模型全部接入,统一API、统一鉴权、统一计费。

运营商平台内部对多种大模型适配,用户只需要换个模型名称(Model ID)就能平滑切换。

02 运营商为何卖Token ?

Token服务的爆发并非偶然。

首先,计费模式改变。在传统的云计算时代,用户习惯于为“服务器租赁时间”或“固定带宽”买单(即IaaS层的算力付费),买的是带宽速率和时间。但是随着大模型的发展,不同大模型提供的能力,不同任务所需消耗的成本差距非常大。比如更强的模型,单个 Token 更贵;更长上下文,Token 消耗更多;推理复杂度越高,实际成本越高。按Token计费,可以对齐“用户消耗的智能程度”与“厂商付出的算力成本”。

其次,降低技术门槛与“试错成本”。大模型的研发和部署动辄需要千万乃至数亿美元的投入。对于绝大多数中小企业和个人开发者而言,自建模型并不现实。Token服务将“通用人工智能(AGI)”能力切碎、打包,开发者不需要关心底层有几万张GPU在烧电,只需要按需调用API并支付Token费用。

最后,应用层爆发带来的迫切需求。步入2026年,AI Agent(智能体)、AI辅助编程、多模态内容生成等应用层场景爆发。这些应用在日常运行中,需要频繁地与底层大模型进行“吞吐”互动。一个自动化的AI写代码工具,可能在一夜之间就要消耗数百万个Token。这种高频、海量的交互,倒逼市场必须提供更加标准化、稳定且具备价格竞争力的Token套餐服务。

过去二十年,运营商商业模式经历了三次核心计量单位变化。

第一阶段是语音时代,运营商出售的是分钟数;第二阶段是移动互联网时代,出售的是流量GB;而进入AI时代,运营商开始尝试出售Token。

Token正在经历与流量相似的演化过程。最初,只是技术指标;随后成为计费单位;最终演变为标准化商品。

运营商入局,标志着Token已开始脱离技术范畴,进入消费体系。

未来几年,用户购买AI能力的方式可能发生根本变化:个人用户购买“AI月包”、 企业采购“Token资源池”、家庭宽带附带AI额度、 政企专线集成Agent服务。Token将像电、水、流量一样成为基础资源。

但这并不意味着,运营商会替代大模型厂商。

03 Token 怎么买合适?

Token服务究竟是从原生大模型厂直接售卖,还是从运营商平台购买?目前两种商业模式都有何利弊。

第一种是原生模型厂商模式,即按百万Token计费。OpenAI、Anthropic、DeepSeek、千问等厂商普遍采用这一体系。用户按输入Token、输出Token分别付费。诸如千问等可能采用月初预购买,月底结账的形式。

第二种是运营商月费订阅Token额度。例如上海电信推出最低9.9元对应1000万Token,超额再追加,并计划将Token权益融合进家庭的“美好家”数字空间中,支持话费账单一键支付。

这种“一价全包”或“话费融合”的模式,让中国用户能够像买流量包一样购买大模型算力。

海外市场以大模型原生企业的API阶梯计价为主,国内市场将Token服务推向了类似于手机话费的“套餐化”时代。

目前来看,两种收费模式各有优势,因为从Token套餐用户群体看,主要分三个类型。

第一是独立开发者与技术发烧友(Geeks)。他们利用各家厂商提供的API接口,搭建属于自己的个性化AI应用,如效率工具、自动翻译插件、个人专属知识库等;

第二类是中小企业、初创公司与 B 端独立软件开发商(ISV),这是Token服务最核心客群。无论是给公司员工购买用于编程的Token,还是开发针对特定行业的AI Agent,还是在现有的企业ERP、CRM系统中嵌入AI辅助功能,中小企业需要订阅云厂商或运营商的“团队版Token套餐”。

第三类是“重度依赖AI”的职场人与普通家庭,他们在居家场景需要高频使用AI进行文案创作、代码编写,或者需要AI辅导孩子功课。

针对中小企业、初创公司,从技术经济学角度,原生大模型的纯Token计费模式更科学。

而运营商的套餐模式,有两个优势,一方面,独立开发者不需要绑定在某一家大模型上,可以通过平台商进行多种大模型自主选择;另一方面,Token服务或将更快走向大众消费。因为大多数人知道100GB流量意味着什么,却无法感知1000万Token代表多少。

运营商采用月费订阅,本质上是在降低认知门槛。用户不需要理解Token,只需要从普通9.9元/1000万Token开始了解自己的需求。

随着运营商开始售卖Token服务,“豆包们”即将开始向三个层次内卷。

从“拼参数”到“拼能效比”对于大模型企业来说,将不能继续盲目追求大模型的大参数、大耗能,而是将精力投入到模型蒸馏(Distillation)、量化(Quantization)以及推断加速(Inference Optimization)等能用更小能耗、输出更高质量Token的能力。

价格竞争将进一步加剧。运营商聚合数百模型后,用户切换成本下降。如果A模型涨价,可通过平台替换B模型。模型能力差异不足时,价格将成为核心竞争因素。

大模型企业利润中心将转移。单纯卖API利润有限,未来盈利重点可能转向Agent、行业应用、企业解决方案。模型本身逐渐成为基础设施,而应用层成为价值中心。

或许,“双边市场”正在形成:运营商控制入口,模型厂商控制能力。

相關問答

Q运营商推出的Token套餐服务有什么特点?

A运营商推出的Token套餐服务主要特点包括:面向个人用户提供按月订阅制方案,例如最低月费9.9元对应1000万Token使用量;面向企业提供分层算力套餐;支持将数十至数百种大模型纳入统一平台,实现“按月购买、多模型调用、话费支付”;部分地方运营商(如上海移动)推出按额度点或通用Token计费模式。这种模式降低了用户切换大模型的成本,使Token服务更接近于流量套餐的消费体验。

Q在大模型语境中,Token是什么?如何计算?

AToken是大模型处理信息的最小计算单位。用户输入、上下文记忆和模型输出都以Token计算。在英文中,一个Token大约相当于4个字母;在中文中,由于汉字信息密度更高,一个汉字、一个标点符号或一个词组往往对应1到2个Token。行业通常以“每百万Token”或“额度点”的形式向用户售卖与结算大模型的调用成本和使用额度。模型调用越复杂、上下文越长、Agent执行链条越深,Token消耗就越高。

Q运营商为何要进入并售卖Token服务?

A运营商进入并售卖Token服务的原因主要有三点:首先,计费模式需要改变,传统的算力付费(如服务器租赁时间或固定带宽)无法准确对齐“用户消耗的智能程度”与“厂商付出的算力成本”,按Token计费更科学。其次,为了降低技术门槛与“试错成本”,让中小企业和个人开发者无需自建模型,只需按需调用API。最后,应用层(如AI Agent、AI辅助编程)的爆发带来了高频、海量的交互需求,倒逼市场提供更标准化、稳定且具备价格竞争力的Token套餐服务。这也是运营商商业模式从语音时代的“分钟数”、移动互联网时代的“流量GB”,向AI时代的“Token”演进的体现。

Q目前市场上购买Token服务有哪两种主要模式?各自适合什么用户?

A目前主要有两种购买Token服务的模式:第一种是原生模型厂商模式,如OpenAI、DeepSeek、千问等,按百万Token阶梯计费(通常输入、输出分别付费),适合对模型性能和成本控制有精确要求的中小企业、初创公司及技术团队。第二种是运营商月费订阅模式,如中国电信9.9元/1000万Token的套餐,采用“一价全包”或与话费融合的方式,降低了用户的认知和使用门槛,更适合独立开发者、技术发烧友以及希望像购买流量包一样便捷消费的普通个人和家庭用户。运营商平台还支持多模型切换,为用户提供了灵活性。

Q随着运营商开始售卖Token服务,对大模型厂商(如豆包、千问)会产生什么影响?

A随着运营商开始售卖Token服务,大模型厂商将面临更激烈的竞争,并可能向三个层次“内卷”:1. 从“拼参数”到“拼能效比”:厂商需更关注模型蒸馏、量化、推断加速等技术,以更小能耗输出更高质量的Token。2. 价格竞争加剧:运营商聚合多模型后,用户切换成本下降,模型能力相近时,价格将成为核心竞争因素。3. 利润中心转移:单纯售卖API的利润将变得有限,未来盈利重点可能转向开发更高价值的AI Agent、行业应用解决方案和企业服务,模型本身逐渐成为底层基础设施。

你可能也喜歡

Agents 资本市场:自主代理将如何获得融资?

未来十年内,自主AI代理将拥有专属的资本市场。这些代理是具备法律主体资格的软件实体,能签署合同、持有账户、通过提供常规商业服务(如营销、物流、法律研究等)赚取收入。其核心优势在于极低的运营成本,可能仅为人类同类公司的10%,从而形成巨大的经济效益。 这一趋势必将实现,理由有四:1) 压倒性的成本优势与利润空间;2) 已有成功案例(如Sierra、Harvey)证明市场需求真实存在;3) 美国多州法律框架(如怀俄明州无成员LLC)已支持算法管理实体;4) 全球巨额资本正在寻找高收益的新资产类别。 代理的融资将呈现多层次结构:初期依赖风险投资;随后出现基于其可审计现金流的程序化营运资金垫款和基于收入的融资;成熟后,机构资本将通过类似好莱坞的“片单融资”模式,投资于由大量小型代理公司组成的资产池,以分散风险。代币化主要作为二级市场结算层,增强流动性。 对代理的尽职调查将更侧重于其业务真实性、模型依赖性、客户粘性以及由智能合约定义的股权结构,而非创始团队访谈。 目前,代理发展的两大束缚正被解除:法律上已能成为独立实体;财务上,专属资本市场的形成将使其能直接对接资本,无需依赖人类投资者的个人决策。当评级、承销、指数等金融市场基础设施完备时,代理将从技术概念转化为真正可大规模融资的经济板块。这一刻,才是该类别真正成熟的标志。

链捕手45 分鐘前

Agents 资本市场:自主代理将如何获得融资?

链捕手45 分鐘前

交易

現貨
合約

熱門文章

如何購買ERA

歡迎來到HTX.com!在這裡,購買Caldera (ERA)變得簡單而便捷。跟隨我們的逐步指南,放心開始您的加密貨幣之旅。第一步:創建您的HTX帳戶使用您的 Email、手機號碼在HTX註冊一個免費帳戶。體驗無憂的註冊過程並解鎖所有平台功能。立即註冊第二步:前往買幣頁面,選擇您的支付方式信用卡/金融卡購買:使用您的Visa或Mastercard即時購買Caldera (ERA)。餘額購買:使用您HTX帳戶餘額中的資金進行無縫交易。第三方購買:探索諸如Google Pay或Apple Pay等流行支付方式以增加便利性。C2C購買:在HTX平台上直接與其他用戶交易。HTX 場外交易 (OTC) 購買:為大量交易者提供個性化服務和競爭性匯率。第三步:存儲您的Caldera (ERA)購買Caldera (ERA)後,將其存儲在您的HTX帳戶中。您也可以透過區塊鏈轉帳將其發送到其他地址或者用於交易其他加密貨幣。第四步:交易Caldera (ERA)在HTX的現貨市場輕鬆交易Caldera (ERA)。前往您的帳戶,選擇交易對,執行交易,並即時監控。HTX為初學者和經驗豐富的交易者提供了友好的用戶體驗。

639 人學過發佈於 2025.07.17更新於 2025.07.17

如何購買ERA

相關討論

歡迎來到 HTX 社群。在這裡,您可以了解最新的平台發展動態並獲得專業的市場意見。 以下是用戶對 ERA (ERA)幣價的意見。

活动图片