# 节省成本的所有文章

在 HTX 新聞中心流覽與「节省成本」相關的最新資訊與深度分析。潘蓋市場趨勢、專案動態、技術進展及監管政策,提供權威的加密行業洞察。

Deepseek 能否为中国节省 1 万亿美元?

《DeepSeek 能否为中国节省 1 万亿美元?》一文探讨了DeepSeek如何通过技术创新,可能大幅降低中国AI基础设施的建设成本。 核心在于,AI硬件的成本正从计算芯片向昂贵的内存(如HBM)倾斜。DeepSeek通过三方面技术突破,系统性降低了对这类稀缺硬件的依赖: 1. **压缩“记性”**:采用多头潜在注意力(MLA)等技术,将长上下文对话所需的缓存(KV Cache)压缩至原来的极小部分,极大节省显存。 2. **按需唤醒“身体”**:利用混合专家(MoE)模型架构,每次只激活部分参数,并结合智能的存储调度,将多数参数移出昂贵显存。 3. **复用计算结果**:将算过的上下文作为缓存复用,用低成本的内存读取替代高成本的重复计算。 这些技术协同,使DeepSeek V4等模型在长上下文场景下,用同等硬件可能产出数倍的有效Token,等效于大幅提升硬件效率、摊薄单位成本。 文章据此进行推演:到2030年,全球AI硬件投资预计达数万亿美元。若DeepSeek的技术路线能使中国未来AI基建的硬件需求等效减少75%,在日均Token消耗达到数千万亿级的规模时,节省的投资额可能接近1万亿美元(约7万亿元人民币),相当于少建数万座智算中心。 更重要的是,此举将产业价值从受制于人的尖端算力芯片,部分转移至中国已有所突破的存储芯片及系统工程领域,提升了供应链安全性。DeepSeek的意义不在于“消灭硬件”,而在于通过极致优化,降低行业对最昂贵、最稀缺硬件的边际依赖,让AI能力更普惠,重塑未来AI基建的账本。 (注:文中关于万亿节省的具体数字属于基于行业趋势的推演观点。)

marsbit前天 00:47

Deepseek 能否为中国节省 1 万亿美元?

marsbit前天 00:47

一周省下3亿Token,Anthropic工程师的Claude Code缓存指南

这篇文章分享了Anthropic工程师通过有效利用Claude Code的Prompt缓存机制,一周内节省超过3亿Token的经验。核心观点是,缓存的Token成本仅为普通输入的10%,因此提高缓存复用率能显著降低使用成本并延长会话额度。 缓存机制依赖“前缀匹配”,分为系统层、项目层和对话层三层。只要会话前缀与已缓存内容一致,Claude即可直接复用,无需重新处理。Claude Code订阅版的缓存有效时间(TTL)为1小时,而API默认为5分钟。 文章强调了几个关键的使用习惯以避免“打断”缓存: 1. 不要让会话空置超过1小时,否则缓存过期,重新开始成本更低。 2. 切换任务时,建议进行清晰的会话交接(如使用自定义的handoff技能总结进度后新建会话),而非使用可能破坏缓存的`/compact`命令。 3. 避免在会话中途切换模型(包括开启“Opus plan”模式),因为不同模型使用独立缓存,切换会导致缓存失效。 4. 大文档应放入Projects中管理,而非反复粘贴进对话,以获得更好的缓存优化。 此外,文章提到Anthropic内部会监控缓存命中率,因为这直接影响服务成本和用户体验。通过理解并遵循这些简单的原则,用户可以在不改变使用习惯的情况下,更高效地利用Claude Code,节省Token消耗。

marsbit05/24 00:36

一周省下3亿Token,Anthropic工程师的Claude Code缓存指南

marsbit05/24 00:36

活动图片