补贴→Token计费→降价,OpenAI打响价格战,Token经济学拐点将至?

marsbitPublié le 2026-06-11Dernière mise à jour le 2026-06-11

Résumé

生成式AI行业的商业化模式正经历深刻变革。OpenAI考虑大幅下调Token费用以争夺企业客户,可能引发与竞争对手Anthropic的价格战。这背后是AI行业商业化的快速演变:从早期的月费订阅,到补贴换增长,再到按Token用量计费。然而,Token计费模式暴露了企业AI支出的失控问题,许多企业发现成本高昂但产出效率低下,大量支出消耗在修复AI错误和返工上。 价格战将严重挤压本已亏损的OpenAI和Anthropic的利润空间。由于产品高度同质化,降价难以构建长期护城河,还可能通过云服务承诺影响微软、甲骨文等合作伙伴。分析师观点出现分歧:一方认为当前焦虑只是短期调整,随着AI应用渗透和智能体技术发展,总支出仍将增长;另一方则担忧不可持续,可能逆转支撑产业链的资本流动。 未来商业化可能走向分层收费,高价值任务使用前沿模型,日常任务转向廉价或本地模型。行业需要从追求Token消耗转向价值创造。值得注意的是,中国模型如DeepSeek凭借显著的价格优势,在美国企业市场增速迅猛,可能成为价格战中的重要变量。整个AI行业的估值和盈利逻辑面临重构。

当Token价格战真正打响,AI行业靠什么赚钱?整条AI商业化的估值逻辑,都到了需要被重写的时刻。拼“性价比”和“稀缺性”的时期可能到了。对于OpenAI而言“局势进一步恶化”,分析指“一旦OpenAI走下坡路,很可能会拖垮英伟达、甲骨文、Coreweave等。”

生成式AI的商业化叙事,正面临三年来最深刻的一次自我审视。从以补贴换用户、月包订阅隐藏成本,到按Token计费引爆企业账单危机,AI行业用三年时间完成了一次商业化的三级跳——而一场潜在的价格战,可能让整套变现逻辑再度归零。

据《华尔街日报》报道,OpenAI正在考虑大幅下调向用户收取的Token费用,以从竞争对手Anthropic手中争夺企业客户。据知情人士称,此举部分是为“抢占先手”,OpenAI预计Anthropic也将采取的类似降价行动。OpenAI首席执行官Sam Altman近期在一场活动上承认,AI使用成本已成为"一个巨大问题",并表示将"帮助人们用更少的支出获得更多价值"。

这一消息的时机格外敏感。OpenAI本周已秘密提交IPO申请,Anthropic同样处于上市倒计时阶段。与此同时,彭博Silicon Data LLM Token支出指数已连续7个交易日下跌,创今年1月以来最长连跌纪录,折射出市场对AI账单可持续性的深层焦虑。报道直言,价格战将直接侵蚀两家公司的利润率——而两家公司目前均已因AI系统所需的庞大算力亏损数十亿美元。

这场讨论的核心,不再只是一次降价决策,而是一个更根本的问题:当"Token消耗越多越好"的叙事走到尽头,AI行业下一个商业化故事将由谁来讲,又将如何讲。

01

初始三阶段:从月包补贴到Token账单

生成式AI的商业化,在短短三年内经历了清晰的三段演变。

第一阶段,月包和年包订阅奠定行业基调。2023年2月,OpenAI推出月费19.99美元的ChatGPT Plus,开创大模型C端付费先例;百度、阿里、腾讯随后跟进,固定月费订阅成为初级商业模式的标配。

第二阶段,补贴大战全面爆发。为拉高ARR(年度经常性收入)这一融资估值的核心锚点,各家厂商转向大规模补贴:谷歌为学生免费提供15个月Gemini Advanced,OpenAI推出首月1美元的Team版会员,字节跳动豆包以"比行业价低99.3%"的定价入场,百度宣布核心模型免费。补贴的本质是以亏损换增长——据报道,微软在GitHub Copilot订阅模式下平均每位用户每月亏损超过20美元,部分重度用户月亏损高达80美元。

第三阶段,是按量计费的强制切换。2026年6月1日,微软宣布GitHub Copilot所有计划正式转向基于Token用量计费,月费19美元直接转化为等额Token额度。这一改变,将被订阅制长期掩藏的真实成本摆上台面——据Reddit社区用户测算,一次智能体编程会话可消耗30至40美元,单月套餐在单次使用中即告耗尽。

02

账单失控:当Token比人更贵

Token按量计费的落地,将企业AI支出的真实面目完整呈现。

企业端的账单数字触目惊心。Uber首席运营官Andrew Macdonald在2026年5月公开表示,Token消耗的增长与产品实质改善之间,"这条线还不存在",并为此专门造了一个词:"tokenmaxxing"(Token极大化),形容员工为刷使用量而执行无价值任务。

更直接的数据是:Uber仅2026年前四个月就耗尽了全年Token预算;Salesforce预计全年付给Anthropic的费用将达约3亿美元。

Anthropic自己的开发者文档显示,使用Claude Code的开发者平均成本约为每个工作日13美元,90%的用户每日成本低于30美元——折算下来,一个10人开发团队仅Token费用一年就可能超过75600美元。

投入产出比同样令人警觉。企业数据平台Entelligence.AI汇总2444家企业的数据后发现,每投入1美元的AI Token费用,仅有18美分产生了触达用户的实际价值;44美分用于修复AI自身引入的Bug,27美分流向返工,11美分消耗于审查摩擦。

面对失控的账单,企业端已开始主动管控。亚马逊叫停了内部AI使用排行榜,要求员工"不要为了用AI而用AI";微软计划逐步停用部分关键产品部门员工的Claude Code订阅。高盛指出,部分企业用于AI Token的支出已占其员工总人力成本的10%,未来几个季度这一比例可能进一步攀升。这不是需求消失,而是AI支出的粗放时代走向终结。

03

第四幕:价格战打响,OpenAI考虑大幅降价

正是在这样的背景下,价格战的导火索被点燃。

据《华尔街日报》报道,Altman的降价考量直接由追赶Anthropic的压力所触发。Anthropic的收入近期大幅增长,旗下编程工具Claude Code在软件工程师群体中走红,这家成立五年的初创公司估值甚至首次超过OpenAI。

然而,这场价格战的代价将异常沉重。价格若大幅下调,将进一步压缩两家公司本就为负的利润空间,而竞争格局提供的空间极为有限。

投资者长期以来识别出的底层风险是,OpenAI与Anthropic的产品具有高度可替代性,客户可以轻易从一家转向另一家——这意味着降价即便短期留住客户,也无法真正构建护城河,只是延缓了份额流失。

这一困境还通过云计算巨头与AI实验室之间的财务循环向外传导。

据The Information汇编的企业披露文件,OpenAI和Anthropic合计占微软、甲骨文、谷歌和亚马逊约2万亿美元未来云服务承诺的逾半数。若降价引发收入预期下修,这条传导链条将双向承压。

美国神经科学和人工智能专家Gary Marcus说道:“这进一步暴露了OpenAI的脆弱,也表明了它面临的困境有多严重。一旦OpenAI走下坡路,很可能会拖垮英伟达、甲骨文、Coreweave等公司。局势正在迅速恶化。”

多空分歧在华尔街公开对峙。摩根大通TMT分析师Mark Schilsky认为,当前账单焦虑不过是"通往更高支出的最小减速带":若每百万Token均价下降,但美国公司AI付费渗透率持续上升,总体Token用量在数学上必然大幅增加;加之代理式AI(agentic AI)将单任务Token消耗推升至传统问答模式的数倍,长期总支出料将显著高于当前水平。

高盛半导体分析师Jim Covello则持更为悲观的立场,认为当前产业链繁荣几乎将所有价值导向半导体公司,这一现象"在历史上前所未有且不可持续",一旦企业直面按量计费的真实价格,支撑GPU采购和模型训练的资本流动将面临逆转。

04

第五幕:Token经济学的下一个故事?

价格战之后,AI行业商业化的下一章尚未写就,但轮廓正在浮现。

Citadel证券的报告提供了一个方向性框架:分层收费与按稀缺性定价。其核心逻辑是,推理密集型前沿AI不会消失,但会越来越集中在少数有能力承担算力成本的大型企业手中;对更广泛的企业而言,在物理约束缓解之前,更简单的模型可能是更具生产力的路径。这意味着AI使用将走向分层——高价值、复杂任务继续使用前沿模型,日常任务、批量任务则转向廉价模型或本地模型。

摩根大通则持相对乐观的判断:即便单位Token价格下降,智能体AI(agentic AI)的普及将使每个任务的Token消耗倍增——现有数据显示,业务agent化后每个任务的Token消耗可变为原来的3.5倍——总体支出规模仍有望继续扩大,当前的账单焦虑或许只是"通往更高支出的最小减速带"。

Nebius首席营收官Marc Boroditsky提出了"valuemaxxing"的概念,主张行业从追求Token消耗最大化,转向使每个Token真正产生价值。这一方向正逐渐成为行业共识——但真正的商业落地,仍需要AI实验室找到一套既能反映真实成本、又能被企业客户接受的定价体系,而这正是当前所有争论尚未解决的核心命题。

然而,在这场价格战中,最被忽视的变量或许是中国模型。

据美国企业支出管理平台Ramp的6月数据,DeepSeek已登顶美国企业软件订阅增速榜首。Ramp首席经济学家Ara Kharazian特别强调,这并非开源模型的本地部署,"企业在直接通过DeepSeek收发数据",是真实付费的直连使用——他坦言"没有料到美国公司会去用DeepSeek"。据第三方测算,DeepSeek V4-Pro的API均价约为GPT-5.5的十分之一,约为Claude Opus 4.7的十一分之一。

OpenAI与Anthropic两虎相争,最终受益的,可能是那个早已将"普惠定价"写入基因、且不需要向IPO投资者交代利润率的玩家。这或许不是这场价格战最受欢迎的结局,但正在成为越来越难以忽视的现实。

本文来自微信公众号“硬AI”,作者:徐超

Questions liées

Q根据文章,生成式AI的商业化经历了哪三个阶段?

A第一阶段是月包和年包订阅,以OpenAI的ChatGPT Plus为代表。第二阶段是补贴大战,各家厂商为抢占市场提供大规模补贴或免费服务。第三阶段是按量计费(Token计费),将使用成本透明化,典型代表是微软GitHub Copilot转向基于Token用量计费。

Q文章中提到企业使用AI时,Token费用投入产出比的情况如何?

A根据企业数据平台Entelligence.AI的数据,每投入1美元的AI Token费用,仅有18美分产生了触达用户的实际价值;44美分用于修复AI自身引入的Bug,27美分流向返工,11美分消耗于审查摩擦。

Q文章认为OpenAI考虑大幅降价的主要原因是什么?

AOpenAI考虑大幅降价,主要是为了从竞争对手Anthropic手中争夺企业客户。由于Anthropic的收入近期大幅增长,其编程工具Claude Code深受欢迎,甚至估值超过了OpenAI,因此OpenAI希望通过降价来“抢占先手”,预计Anthropic也将采取类似降价行动。

Q文章指出,如果OpenAI与Anthropic陷入价格战,可能会对产业链带来什么影响?

A价格战会直接侵蚀两家公司的利润率,而它们目前均已因庞大的算力需求亏损数十亿美元。更重要的是,这可能通过云计算巨头与AI实验室之间的财务循环向外传导。OpenAI和Anthropic合计占微软、甲骨文、谷歌和亚马逊大量未来云服务承诺,若其收入预期下降,这条传导链条将双向承压。美国专家Gary Marcus警告,这暴露了OpenAI的脆弱,一旦其走下坡路,可能会拖垮英伟达、甲骨文、Coreweave等上游供应商。

Q文章提出了哪些关于AI商业化未来的新叙事或解决方案?

A文章提到了几个方向:1. **分层收费与按稀缺性定价**(Citadel证券):前沿AI模型集中在少数大企业,日常任务转向廉价或本地模型。2. **智能体AI(agentic AI)增加总消耗**(摩根大通):即便单价下降,但每个任务消耗的Token数量可能倍增,总体支出仍可能扩大。3. **从“Token极大化”转向“价值极大化”(valuemaxxing)**:核心是使每个Token产生真正的价值,而非单纯追求消耗量。此外,文章还指出,拥有“普惠定价”基因的中国模型(如DeepSeek)可能成为不可忽视的变量。

Lectures associées

Début de Warsh : le président de la Fed le plus au fait du Crypto de l'histoire apportera-t-il des surprises ou des chocs au marché ?

**Résumé :** Kevin Warsh, nouveau président de la Réserve fédérale américaine, s'apprête à tenir sa première conférence de presse monétaire. Sa nomination est historique : il est le premier président de la Fed à détenir personnellement des actifs numériques (investissements indirects dans Solana, dYdX, etc.), montrant une compréhension unique du secteur. Son dilemme est majeur : il doit faire face à une résurgence de l'inflation, qui exige une politique monétaire stricte (position "de faucon"), tout en répondant aux pressions politiques pour des baisses de taux. Parallèlement, son attitude envers les crypto-actifs diffère fondamentalement de celle de son prédécesseur. Il ne les considère pas comme de simples actifs spéculatifs, mais plutôt comme un "bon policier" pour la politique économique et une composante de la compétitivité américaine. Son impact potentiel sur le marché crypto s'articule autour de trois axes : 1. Un changement de paradigme réglementaire, passant de la prévention à l'intégration et à l'innovation. 2. Une reprixation des actifs liée aux taux d'intérêt, où sa clarté de communication pourrait réduire la prime d'incertitude. 3. Une légitimation accrue pouvant attirer les capitaux institutionnels traditionnels. Deux scénarios principaux sont envisagés pour sa première intervention : * **Scénario "Surprise"** : Un ton modéré ("de colombe") sur les taux combiné à des signaux favorables à l'innovation numérique pourrait booster le marché. * **Scénario "Choc"** : Un message excessivement restrictif sur les taux pourrait entraîner une vente généralisée des actifs risqués, y compris les cryptos. Bien qu'il ait dû vendre ses actifs crypto pour des raisons d'éthique, la compréhension intrinsèque de Warsh pour la technologie blockchain pourrait, à long terme, poser les bases d'une intégration plus structurelle des actifs numériques dans le système financier.

marsbitIl y a 6 h

Début de Warsh : le président de la Fed le plus au fait du Crypto de l'histoire apportera-t-il des surprises ou des chocs au marché ?

marsbitIl y a 6 h

XRP Ledger Lance le Rebranding XRPld Avec la Mise à Niveau Version 3.2.0

La version 3.2.0 du XRP Ledger (XRPL) est désormais disponible, introduisant une refonte majeure incluant le changement de nom du logiciel principal de « rippled » à « xrpld ». Cette mise à niveau se concentre principalement sur les améliorations des performances, de la sécurité et de l'évolutivité de l'infrastructure sous-jacente, plutôt que sur de nouvelles fonctionnalités utilisateur. Les principales avancées incluent des optimisations de mémoire pouvant réduire jusqu'à 40% l'utilisation de la mémoire serveur. Sur le plan de la sécurité, la modification `fixCleanup3_2_0` renforce plusieurs modules, notamment les coffres-forts à actif unique, le protocole de prêt, les échanges décentralisés et les jetons multi-usages. De nouveaux contrôles d'invariance garantissent la cohérence du registre après la suppression de comptes. Pour les développeurs, la mise à jour permet désormais de récupérer des informations sur les définitions du protocole et du serveur XRPL sans nécessiter de connexion active, facilitant ainsi la création de portefeuilles, d'explorateurs de blockchain et d'APIs. En termes d'évolutivité et de stabilité, les améliorations comprennent des tailles de bloc configurables, un stockage de base de données optimisé via nuDB, et le support optionnel de TLS/mutual TLS pour le serveur gRPC. Le port de peering par défaut est également passé du 51235 au 2459. Divers correctifs ont été apportés aux fonctions liées aux Market Makers Automatisés, aux paiements, aux séquestres de jetons et aux carnets d'ordres. Une note importante : les invariants de transaction ont été temporairement désactivés dans la v3.2.0 en raison d'un impact sur les performances, mais cela ne présente pas de risque pour la sécurité.

TheNewsCryptoIl y a 6 h

XRP Ledger Lance le Rebranding XRPld Avec la Mise à Niveau Version 3.2.0

TheNewsCryptoIl y a 6 h

L'AGI n'est pas l'arrivée, nouveau document de DeepMind : Vers l'ASI, le véritable progrès de l'IA ne fait que commencer

Si l'intelligence artificielle générale (IAG) était atteinte demain, quelle serait la prochaine étape ? Une étude de Google DeepMind suggère que l'IAG n'est pas un point final, mais une étape vers une superintelligence artificielle (ISA) dépassant les collectifs d'experts humains. L'étude distingue trois concepts : l'IAG (niveau médian humain), l'ISA (supérieure aux meilleurs collectifs humains dans presque tous les domaines) et l'IA universelle (limite théorique). Elle propose quatre voies potentielles vers l'ISA : 1. **Extension des ressources** : augmentation de la puissance de calcul, des données et des modèles. 2. **Évolution algorithmique** : améliorations incrémentales ou nouveaux paradigmes (apprentissage continu, utilisation d'outils, modèles du monde). 3. **Auto-amélioration récursive** : des IA plus performantes conçoivent la génération suivante, créant une boucle de rétroaction positive. 4. **Coordination multi-agents** : des systèmes IAG collaborant atteignent une intelligence collective supérieure. L'étude identifie six principaux goulets d'étranglement : 1. **Le mur des données** : les données humaines de haute qualité pourraient s'épuiser. 2. **Pressions économiques et ressources naturelles** : coûts énergétiques et matériels. 3. **Limites des paradigmes neuronaux actuels** : problèmes d'apprentissage continu, de raisonnement robuste, d'hallucinations. 4. **Difficulté croissante de la recherche**. 5. **Barrières à l'abstraction** : difficulté à former de nouveaux concepts fondamentaux. 6. **Régulation, gouvernance et réaction sociale**. Un défi crucial est l'évaluation des capacités de l'IA au-delà du niveau humain, nécessitant de nouveaux benchmarks. L'étude conclut que la progression vers l'ISA reste incertaine, soumise à des contraintes physiques et de ressources, et appelle à un effort de recherche interdisciplinaire pour mieux anticiper cette évolution.

marsbitIl y a 7 h

L'AGI n'est pas l'arrivée, nouveau document de DeepMind : Vers l'ASI, le véritable progrès de l'IA ne fait que commencer

marsbitIl y a 7 h

Trading

Spot
Futures

Articles tendance

Comment acheter WAR

Bienvenue sur HTX.com ! Nous vous permettons d'acheter WAR (WAR) de manière simple et pratique. Suivez notre guide étape par étape pour commencer votre parcours crypto.Étape 1 : Création de votre compte HTXUtilisez votre adresse e-mail ou votre numéro de téléphone pour ouvrir un compte sur HTX gratuitement. L'inscription se fait en toute simplicité et débloque toutes les fonctionnalités.Créer mon compteÉtape 2 : Choix du mode de paiement (rubrique Acheter des cryptosCarte de crédit/débit : utilisez votre carte Visa ou Mastercard pour acheter instantanément WAR (WAR).Solde :utilisez les fonds du solde de votre compte HTX pour trader en toute simplicité.Prestataire tiers :pour accroître la commodité d'utilisation, nous avons ajouté des modes de paiement populaires tels que Google Pay et Apple Pay.P2P :tradez directement avec d'autres utilisateurs sur HTX.OTC (de gré à gré) : nous offrons des services personnalisés et des taux de change compétitifs aux traders.Étape 3 : stockage de vos WAR (WAR)Après avoir acheté vos WAR (WAR), stockez-les sur votre compte HTX. Vous pouvez également les envoyer ailleurs via un transfert sur la blockchain ou les utiliser pour trader d'autres cryptos.Étape 4 : tradez des WAR (WAR)Tradez facilement WAR (WAR) sur le marché Spot de HTX. Il vous suffit d'accéder à votre compte, de sélectionner la paire de trading, d'exécuter vos trades et de les suivre en temps réel. Nous offrons une expérience conviviale aux débutants comme aux traders chevronnés.

533 vues totalesPublié le 2024.12.11Mis à jour le 2026.06.02

Comment acheter WAR

Discussions

Bienvenue dans la Communauté HTX. Ici, vous pouvez vous tenir informé(e) des derniers développements de la plateforme et accéder à des analyses de marché professionnelles. Les opinions des utilisateurs sur le prix de WAR (WAR) sont présentées ci-dessous.

活动图片