原文标题:美国最大加密交易所,悄悄换上了中国 AI 模型,省了一半钱
原文作者:AI 上手笔记
一个让硅谷坐不住的数据
最近,美国最大加密货币交易所 Coinbase 的 CEO Brian Armstrong 说了一句话,在科技圈炸了锅:
「我们把 AI 模型切到了中国的 GLM 5.2 和 Kimi 2.7,AI 支出直接砍了一半。」
砍了一半?那用量是不是也降了?
恰恰相反。Coinbase 的 token 用量一直在涨。
省钱的同时用得更多,这才是真正让 OpenAI 和 Anthropic 坐不住的地方。
怎么做到的?三招省钱策略
Coinbase 不是简单地换了个便宜模型就完事。他们搭了一套完整的「省钱系统」:
第一招:不绑定一个模型,让系统自己选
Coinbase 搭了一个自动路由系统。每次请求进来,系统会根据任务类型、价格、缓存情况,自动挑选最合适的模型。
不是所有任务都需要最贵的模型。简单翻译用便宜的,复杂推理用好的——就像你不会开着跑车去楼下买菜。
第二招:把缓存命中率从 5% 拉到 60%
这是最狠的一招。通过优化缓存策略,Coinbase 把缓存命中率从 5% 提升到了 60%。
简单说,60% 的请求可以复用之前的计算结果,大幅降低了每次调用的实际成本。光这一项优化,就省掉了大笔费用。
第三招:Context Engineering(上下文工程)
Coinbase 要求开发者精简上下文,新任务开新会话,不要在一个对话里塞太多东西。
这不是偷懒,而是一门新学问——业界叫 Context Engineering。Anthropic 在一篇技术博客中明确指出:在管理 AI 代理时,上下文工程比提示工程更有效。
简单说:不是让 AI 更聪明,而是给 AI 更精准的信息。

▲ 越来越多企业开始在AI模型上精打细算
不只是 Coinbase,这是一股潮流
Coinbase 不是第一个吃螃蟹的。
Lindy,一家只有 25 人的 AI 创业公司,CEO Flo Crivello 直接把 Claude 全换成了 Deepseek。他告诉 CNBC:「AI 成本已经超过了人力成本,这不可持续。」换模型后,成本「断崖式下降」,省了数百万美元。
Snowflake 的 CEO Sridhar Ramaswamy 做了一个实测对比:在 103 个编码任务上,GLM-5.2 解决了 66%,Claude Opus 4.7 解决了 67%。差距?几乎没有。
但价格差距是实打实的:
价格对比(每百万 token)
- GLM-5.2:输入 $1.40 / 输出 $4.40
- Claude Opus 4.7:输入 $5 / 输出 $25
- GPT-5.5:输入 $5 / 输出 $30
输出价格差了 5-7 倍。
便宜没好货?先别急着下结论
看到这里,你可能会问:便宜这么多,质量能一样吗?
说实话,不完全一样,但差距比你想的小。
Snowflake 的测试显示,GLM-5.2 在某些任务上确实不够稳定——首次尝试成功率 47.6%,低于 Opus 的 53.7%。而且 GLM 有时候会「死磕」错误方向:在一个任务上,它花了 24 分钟调用了 411 次工具,还是失败了。Opus 用 49 次调用、9 分钟就搞定了。
但在多数任务上,两者的最终成功率几乎持平。关键在于:你愿不愿意为那几个百分点的稳定性多付 5 倍价格?
对很多企业来说,答案越来越明确:不愿意。

▲ 中西方AI模型价格差距正在重塑行业格局
这对我们普通人意味着什么?
你可能会说:我又不是 Coinbase,这些跟我有什么关系?
其实,这个趋势对你用 AI 的方式有三个直接启示:
1. 别只认一个模型
很多人用 AI 就认准一个——要么 ChatGPT,要么 Claude。但专业玩家已经不这么干了。不同任务用不同模型,才是性价比最高的玩法。
日常问答用便宜的,写代码、做分析用好的。就像你吃饭,不会每顿都去米其林。
2. 缓存和复用是省钱关键
如果你经常用 AI 做类似的事情(比如每周写周报、每天整理笔记),学会利用缓存和模板,能大幅降低消耗。
3. 精简上下文 = 更好的结果
很多人跟 AI 对话,恨不得把所有背景都塞进去。但事实证明,给 AI 更少但更精准的信息,效果反而更好。新任务,开新对话。别让 AI 在一堆历史记录里找答案。
更深层的变化:AI 定价模式正在被重塑
这波「模型迁移潮」背后,是整个 AI 行业定价逻辑的动摇。
OpenAI 和 Anthropic 的高估值,建立在「收入持续高速增长」的假设上。但如果越来越多的企业像 Coinbase、Lindy 一样转向更便宜的替代品,这个假设就站不住了。
据报道,OpenAI 和 Anthropic 之间已经开始打价格战。OpenAI 刚发布的 GPT-5.6 系列中,Terra 模型比 GPT-5.5 便宜一半,Luna 更是主打最低价。
对用户来说,这是好事。竞争越激烈,价格越低,选择越多。
当美国巨头开始用中国模型省钱,说明 AI 的竞争已经不再是实验室里的跑分比赛,而是真金白银的成本较量。能花更少的钱办同样的事,才是真本事。






