一年吃掉一块固态硬盘，Codex日志bug被骂“劣质软件”

marsbit发布于2026-07-02更新于2026-07-02

文章摘要

OpenAI的编程工具Codex被曝存在严重日志Bug，其默认的TRACE级别日志记录导致在用户本地SQLite数据库中疯狂执行“插入后立即删除”操作。该问题在21天内产生了37TB的写入量，推算一年可达640TB，足以快速耗尽一块消费级固态硬盘（SSD）的写入寿命。问题的核心在于，尽管最终数据库文件大小仅约1GB，但SSD的损耗取决于总写入数据量。Codex的日志系统无视用户通过RUST_LOG环境变量进行的配置，将大量无用的调试信息和遥测数据（占总写入量的96%）持续写入硬盘。类似“日志无限增长”的问题在Codex中至少被报告过9次。在问题被提交至GitHub并引发社区广泛讨论后，OpenAI合并了修复代码，据称可减少约85%的日志写入量，但仍未彻底解决。此事引发了开发者对AI编程工具资源管理不当的批评，将其称为“劣质软件”，并指出同类工具Claude Code也存在类似问题。评论认为，现代软件过度依赖硬件性能来掩盖其低效和缺陷，形成了一个“软件越写越烂，硬件越造越猛”的荒诞循环。

一年「吃掉」一块1TB的固态硬盘?

OpenAI的旗舰编程工具Codex,正在以一年640TB的写入量,烧穿你的固态硬盘。

前段时间,一位开发者在GitHub上提交了一个issue。这个如今标着「Closed」、编号#28224的GitHub issue,标题写着:

Codex的SQLite反馈日志一年能写640TB,迅速耗尽固态硬盘寿命。

据这位报告者实测,他的主固态硬盘连续开机21天被写掉37TB,照此推算一年约640TB,足够报废一块总写入量(TBW)为600TB的消费级硬盘。

为佐证,他贴出了两张表。

在证据1里,这个日志库始终只有1.2GB,表面像什么都没发生;可它的自增行ID已经冲到55亿,真正留存的行不过50万出头,两者差了整整一万倍。

关键在于,硬盘损耗只算一共写过多少、不管此刻还剩多少:这55亿行全都落过盘,删掉也退不回已经付出的写入。所以你查文件永远只看到那50万行,硬盘却早已扛下55亿行的写入量。

证据2暴露了这55亿行的分布:九成多是连开发者自己都不会回头看的调试噪声,光把每条WebSocket数据包整包抄下来这一项,就占了一半。

罪魁祸首,是一行Level::TRACE默认配置,它把你硬盘的写入寿命,当成了免费的草稿纸。

Hacker News上一条高赞评论,直接为这事定了性:

这是「劣质软件」(slopware)最臭名昭著的例子之一。

这位网友还无奈地甩出一句:

这真是个悲剧。这个世界,需要有人来和Anthropic竞争。

更尴尬的是,这个问题不是没人报。

从今年4月起就有零星反馈,前后拖了两个多月,非要等用户自己测算、写报告、把它顶上Hacker News头条,才算被正经对待。即便如此,这一轮也只砍掉了约85%的日志写入。

还有人想自己动手,却发现无从下手:这些工具的桌面端是闭源的。

评论区还有一句神评论:审查流程怎么没拦住这么明显的错误?哦对了......@codex 审查一下这个。

640TB,到底是怎么写出来的

640TB是什么概念。

主流消费级固态硬盘,标称写入寿命大概150到600 TBW,够普通用户用上十几二十年。

而Codex这个「记录自己干了点什么」的日志功能,一年就能写满。

事情要从这位用户清点硬盘说起。他的机器连续开机21天,主固态硬盘被写掉了37TB。

照这速度,一年约640TB。

更离谱的是写入方式。

Codex在本地维护着一个SQLite数据库logs_2.sqlite,专门记录反馈日志。这位用户抓了15秒——数据库被插入36211行,而保留的总行数,从头到尾都是681774,一个没多。

每插进一行,就有一行被删掉。行数始终不变,磁盘却被来回擦写几万次。

这套机制有个外号,叫insert-and-prune:插入,然后立刻删除。

更荒诞的是它记的东西:一堆文件系统的inotify事件。

ld.so.cache被记了128764次,locale.alias37982次,passwd23843次。

同一个文件,被同一个程序,反反复复记上十几万遍。

日志里的自增ID已经超过55亿,而真正留存的行只有约50万。

两者差了一万倍。

这不是bug,简直就像是一个AI编程工具在对着自己的硬盘反复念经。

文件才1GB,写入却是640TB

一边写一边删,留下的logs_2.sqlite能多大?大约1GB。

这就引出整件事最反常识的一点:固态硬盘的寿命看的是「写入量」,而非「文件大小」。一个1GB的文件被反复擦写640次,对硬盘就等于写了640TB。

SQLite用的是WAL机制,每次改动先写进-wal文件,攒够再checkpoint回主库。Codex每15秒做三万多次插入加删除,每一次都要经过WAL、索引更新、checkpoint,同一块存储区,被擦了又擦。

打个比方:一本1GB的笔记本,你每天擦掉重写1750遍,连写一年。笔记本还是那本,纸已经磨穿了。

这也是这个bug能潜伏这么久的原因:它不占空间,只烧寿命。

查可用磁盘看不出异常,文件大小一直很安静,只有去读硬盘自己的SMART健康计数,才能看到写入量在悄悄累积。

根因,一行被无视的RUST_LOG

为什么会记这么多日志?

答案在Codex源码的一行配置里:SQLite反馈日志的sink,初始化时用的是Targets::new().with_default(Level::TRACE)。

一句话,日志默认开到TRACE级别,最高、最啰嗦、什么都记的那一档。

Codex的日志框架是Rust生态的tracing,标准做法是读RUST_LOG环境变量。用户当然试过,把RUST_LOG调成info、warn,甚至直接关掉。

没用。

with_default(Level::TRACE)把全局默认硬钉死在TRACE,RUST_LOG在这条路径上根本不生效。你以为自己关掉了日志,它照写不误。

这种bug最坑人的地方在于,并非「你忘了配置」,而是「你配置了,它假装没听见」。

更刺眼的是一个比例。

把保留的日志按类别拆开,TRACE占了70.7%,约732.5 MB。再加上codex_otel那两路镜像遥测日志(log_only和trace_safe),又占了25.3%。

七成写入是TRACE噪声,加上镜像遥测,96%全是没人会看的废话。

只有4%,才是真正有意义的内容。

这不是第一个,至少是第九个

报告者翻了Codex仓库,发现这类「日志无界增长」的Issue,至少有9个。

#17320,流式响应期间WAL狂写,根因和这次一模一样,都是TRACE无视RUST_LOG。

#24275,桌面版logs_2.sqlite疯涨。

#22444,WAL无限增长还占着空间不释放。

#26374,一天写0.75GB,没轮转。

#27911,一个4KB的goals_1.sqlite,被写成11MB/s。

#20563,进程闲着也狂写盘。

#27020,Windows上磁盘活跃100%。

最早的源头能追到#12969,正是这个PR把SQLite反馈日志的sink按TRACE级别接了进来。

一个4KB的数据库被写成每秒11MB,单独拎出来都够写一篇。而它和640TB那个,是同一个产品、同一套遥测体系的症状。

这说明Codex的日志和遥测系统,从一开始就没有「资源预算」这个概念。

整个赛道都在卷token预算、卷上下文长度、卷模型能力。

但几乎没人问:一个常驻用户机器、7×24小时跑的Agent,它的磁盘、内存、CPU预算,谁来管?

修了,但修得很OpenAI

6月14日报上GitHub,6月23日,报告者更新了一条:三个PR已合并,据他自己的Codex反馈能减少约85%日志,于是宣布关闭。

先说这个85%——不是100%,而且还没全落地。

三个修复里,#29432、#29457已随0.142.0发布,砍掉逐条WebSocket日志和噪声目标;第三个#29599停掉另一类被桥接进来的冗余日志,要等0.143.0才上线。

即便三个全到位,剩下约15%、一年仍要写约96TB,不过是从「一年烧穿硬盘」降到「六年烧穿硬盘」。

也有人替它辩护:trace日志是按设计存下来调试的,不算bug,对OpenAI也确实方便追查边缘case。

但问题恰恰在这儿:拿付费用户的SSD寿命,给厂商的debug做免费存储,这事,用户同意过吗?

编程战场,烧穿的不只是SSD

有意思的是,被点名的并不只有Codex。

评论区马上有人补刀:Claude Code也往本地猛写调试日志,有人只好把日志目录软链到内存盘(tmpfs),给SSD续命。

两家旗舰,犯的是同一类毛病。

社区里的评论,很快从一个bug,放大到整个AI编程工具的质量问题。

有人吐槽这些智能体GPU常年跑满、内存动辄70GB,有人干脆给这代软件起了名字:劣质软件。

那位开发者的建议本来极简:给应用设条线,别超过3GB。就这一条线,Codex拖了9个Issue、好几个月才肯画下来。

问题是一个时刻把「AGI」挂在嘴边的公司,为什么会栽在实习工程师都能看出来的问题上?

为什么这毛病能藏这么久,有条评论也说到了点子上。

放十年前,日志开到TRACE,程序当场卡死,当天就被修掉;如今CPU够快、内存够大、磁盘够猛,这点毛病被硬件性能悄悄消化,程序照跑、界面照常、用户无感,直到某天SSD提前报废。

这两年,软件被AI生成的代码塞满,功能越堆越多、抽象层越叠越厚、资源消耗一路狂飙,全靠硬件厂商每年用更快的芯片硬兜。

于是有了一个荒诞循环:软件越写越烂,硬件越造越猛。用户揣着「好像没变慢」的错觉掏钱换新机,其实只是新机器勉强撑住了更烂的软件。

一个小bug当然无法压垮OpenAI。但Codex和Claude Code的竞争已经从模型能力,蔓延到了开发者工作流的入口。

在这条战线上,快速作出改变,响应开发者需求从来不是加分项,只是入场券。

参考资料:

https://github.com/openai/codex/issues/28224

https://news.ycombinator.com/item?id=48626930

本文来自微信公众号“新智元”,作者:ASI启示录

你可能也喜欢

高息无债无稀释，比特币国库公司为何狂推优先股融资

以比特币为抵押的优先股市场正快速增长，目前规模约130亿美元，占全球优先股市场近1%。这类产品由持有比特币作为国库资产的公司（如MicroStrategy和Strive）发行，旨在解决融资难题：既能筹集长期资本增持比特币，又避免稀释普通股股东权益，且无固定还款压力。优先股为投资者提供高达10.8%至15.2%的收益率，远超传统储蓄产品。该市场供需失衡显著：机构资金需求巨大，但供给受限于可用作抵押的企业比特币持有量（约126万枚）。优先股通常维持3.8至4.5倍的高抵押覆盖率，安全性高于多数债券。然而，发行门槛较高，需公司资产负债表干净、规模足够且团队专业。风险方面，相关公司普通股波动可能放大比特币跌势，但发行方声称已预留充足现金储备应对股息支付。报告认为，当前市场仍处早期阶段，需求远超供给，为合格发行人创造了有利窗口。

Foresight News48分钟前

Foresight News48分钟前

NEAR Protocol 最新升级的意义，可能远不止其5%的价格上涨

近日，谷歌警告称未来量子计算机可能威胁比特币等加密货币的安全，促使更多区块链项目着手应对此类风险。NEAR Protocol成为最新采取行动的区块链，其2.13版本升级已在测试网上线。本次升级主要包括两大核心改进：一是引入基于NIST认证FIPS-204签名方案的后量子安全访问密钥，以增强账户安全并抵御量子计算攻击；二是推出动态分片技术，使网络能够根据需求自动扩展，无需硬分叉即可实现状态分片。市场对此反应积极。7月1日至2日，NEAR现货买盘量超过卖盘，出现正Delta值，显示需求回升。衍生品交易量增长19%，未平仓合约增加7.5%，表明投资者因升级消息而加大持仓。NEAR价格在触及1.70美元支撑后反弹至1.92美元，日内涨幅5.4%，交易量上升16%。技术指标上，日线RSI形成看涨交叉并升至46，+DI指标也升至19，显示上涨动能增强。若需求持续，RSI有望突破50，推动NEAR测试2美元阻力位，并可能进一步上探2.5美元；若买盘动力不足，价格或回落至1.70美元附近。整体来看，此次升级不仅提升了NEAR的量子安全性与可扩展性，也短期内提振了市场情绪与价格表现。

ambcrypto48分钟前

ambcrypto48分钟前

任何人可轻松创建预测市场，Limitless 的用户自建市场能长久吗？

加密领域长期以来面临用户自由创建预测市场的难题，多个早期项目如Augur、Omen等均因流动性分散、发现性差和结算争议等问题而失败。Limitless近期推出了用户生成市场功能，允许用户创建加密价格预测市场，并尝试通过一系列设计解决这些痛点。其市场创建基于客观价格目标，依托预言机自动结算，避免了主观争议。平台已有一定用户基础，采用订单簿模式降低创建门槛。创建市场需消耗LMTS代币作为成本，同时创建者可获得市场交易费用的50%作为激励，以此平衡垃圾市场泛滥和创作者收益。这一设计试图从结算可靠性、流动性和经济机制三方面突破历史局限。若成功，或可为开放预测市场提供一个可行路径。

Foresight News1小时前

Foresight News1小时前

参议员辛西娅·拉米斯为《清晰法案》辩护，反驳伊丽莎白·沃伦的批评

参议员辛西娅·卢米斯强烈反驳了伊丽莎白·沃伦参议员对《清晰法案》可能为非法加密货币活动留下漏洞的批评。这场交锋显示了国会目前在数字资产立法方面的分歧。沃伦认为，该法案当前版本可能削弱通过加密货币打击洗钱和逃避制裁的努力，并以伊朗公司通过CoinEx交易所洗钱约38.4亿美元的报道为例，强调国会应加强而非制造监管漏洞。她还提及对消费者保护和国家安全的广泛关切。卢米斯则驳斥指控，称《清晰法案》包含超过十六项旨在防止非法融资的措施，批评沃伦的指责毫无根据。她指出，法案增强了合规义务并扩展了打击非法金融活动的工具，例如第201条将《银行保密法》及反洗钱条款适用于特定加密货币活动，第303条授权对伊朗等从事非法融资的司法管辖区实施制裁，第305条允许交易所在调查期间临时冻结某些数字资产交易。该法案的讨论因银行问题、道德和加密货币监管等争议而延迟。法案旨在厘清SEC与CFTC职责，并为投资者和消费者提供更多保护。沃伦则主张应针对特朗普总统披露的14亿美元加密货币收益，采取更严格的道德准则。预测市场估计该法案通过概率约为39%。

TheNewsCrypto1小时前

TheNewsCrypto1小时前

女首富做VC

女首富周群飞低调进军VC圈。她掌舵的蓝思科技近期投资了具身智能独角兽跨维智能，个人及公司双线布局硬科技赛道。周群飞以个人主体“群欣投资”布局了芯爱科技、驰芯半导体等芯片公司，并作为LP出资多家创投基金。蓝思科技则战略投资了强脑科技、星海图、擎天租、普渡科技等AI明星企业。其投资逻辑强调产业协同与先试用后投资。周群飞出身贫寒，从深圳打工妹一路创业，将蓝思科技打造成苹果等巨头的核心供应商，市值一度突破3000亿元，她也成为湖南首富。不仅是周群飞，九安医疗刘毅、汇川技术朱兴明、立讯精密王来春等一批靠实业起家的中国富豪，正集体将目光从传统领域转向AI、具身智能、脑机接口等前沿科技，用资本押注中国下一场科技未来。

marsbit2小时前

marsbit2小时前

交易

现货

一年吃掉一块固态硬盘，Codex日志bug被骂“劣质软件”

文章摘要

640TB,到底是怎么写出来的

文件才1GB,写入却是640TB

根因,一行被无视的RUST_LOG

这不是第一个,至少是第九个

修了,但修得很OpenAI

编程战场,烧穿的不只是SSD

热门币种推荐

相关问答

你可能也喜欢

高息无债无稀释，比特币国库公司为何狂推优先股融资

NEAR Protocol 最新升级的意义，可能远不止其5%的价格上涨

任何人可轻松创建预测市场，Limitless 的用户自建市场能长久吗？

参议员辛西娅·拉米斯为《清晰法案》辩护，反驳伊丽莎白·沃伦的批评

女首富做VC

交易

热门文章

如何购买T

相关讨论

热门问答

热门分类

热门标签