造ChatGPT的人，已经不用ChatGPT干活了

marsbit發佈於 2026-06-26更新於 2026-06-26

文章摘要

不到一年时间，OpenAI已将内部主力AI工具从ChatGPT聊天机器人转向了智能体Codex。截至2026年6月，Codex处理了公司每周99.8%的输出token，而10个月前这一比例还不足10%。这一转变始于去年9月左右，Codex在接入了更强模型、补齐更多能力后，能够承担更复杂的任务。员工发现，与其进行一问一答的对话，不如将整件长周期任务直接交给它自主运行。如今，OpenAI人均超过85%的输出token由Codex产生，各部门均将其作为头号AI工具。智能体正在改变知识工作的基本单位：从单次问答转变为可“丢出去”独立执行数分钟到数小时的任务。如今近四分之一的Codex请求对应的是人类需耗时一小时以上的工作。最初是工程师广泛采用Codex，但火势迅速蔓延至法务、财务、招聘等非技术部门。到2026年4月前后，这些部门集体转向，使用速度甚至超过工程部。一个关键信号是，大量原本不写代码的用户开始使用Codex。例如，财务团队用它处理了数万份税表，公关团队搭建了自动处理邀约的Slack智能体。业务人员用Codex完成的工作中，超过四分之一涉及编程，岗位界限正在模糊。 Codex的角色已从代码补全工具转变为通用工作流智能体，能独立完成包括实现、调试、测试在内的完整工程链。重度用户单日可调度Codex产出超过60小时的智能体工作量。其底层模型GPT-5.5不仅能高效处理长任务，甚至被用于优化自身的系统负载算法，提升了性能。报告显示，办公的默认动作正从打开聊天框提问，转变为将整件事交给智能体执行。未来的差距将取决于人们敢于将多大规模的任务交由AI独立完成。

造ChatGPT的人,已经不太用ChatGPT干活了?

不到一年时间,OpenAI就把主力AI从聊天框换成了AI智能体(AI Agent)。

到2026年6月,Codex已经吃下OpenAI全公司每周99.8%的输出token。

就在10个月前,这个数字还不到10%。

转折发生在去年9月前后。Codex接上更强的模型、补齐更多能力,能接的活越来越重。

员工慢慢发现,与其在对话框里一问一答,不如把一大摊任务直接丢给它自己跑。

而这并非某个工程小组在尝鲜。整整一家公司,法务、财务、招聘,每个部门都把它摆上了头号AI工具的位置。

到今天,OpenAI人均超过85%的输出token产自Codex。重度用户本就更费token,全公司加权下来,占比被推到99.8%。

一个聊天机器人,就这样在自己诞生的公司,被同门替换掉了。

https://openai.com/index/how-agents-are-transforming-work/

OpenAI在最新的一篇博客里把话挑明了:

智能体(Agent)正在改写知识工作的基本单位——从一来一回的单次问答,变成一整件可以「丢出去」的长周期任务。

聊天机器人一次只接一个短问题,智能体却能独立跑上几分钟到几小时,自己调工具、自己跟环境交互、自己迭代到交活为止。

如今近四分之一的Codex请求,对应的都是人类得花一小时以上才能干完的活。

OpenAI总裁Greg Brockman转发这份报告时,说道:智能体正在被飞快采纳,加速所有人的工作。

他配的图,就是公司内部这条陡峭的上升曲线。

火从工程师工位,烧到法务办公室

最先改变的是工程师。

这不意外,Codex本就是为写代码的人造的。

2025年12月起,OpenAI的平均工程师就把大部分活儿挪到了Codex上,如今平均一个工程师99%的输出token都走Codex,留给ChatGPT的只剩个零头。

但这把火,并没只停在工程部。

法务、财务、招聘这些根本不碰代码的部门,在2026年4月前后集体越界,把Codex用成了头号工具,而且转得比工程师还快。

如今OpenAI一个律师或招聘,人均超过85%的输出token也产自Codex。

各部门的用量,也像被点着的火一样快速向上攀升。

按OpenAI自报,到2026年6月,研究部门的中位用量翻了56倍,客服32倍,工程27倍,连转得最慢的法务也涨到13倍。

当律师把活儿交给智能体,这画面本身就比任何跑分都更有说服力。

真正的信号,是那些原本不写代码的人

如果只看到工程师偏爱Codex,你可能就漏掉了一个最关键的信号。

从2025年8月起,非开发者用户的增长全面反超开发者:个人端涨了137倍,组织端189倍,OpenAI内部12倍。

一个起家于写代码的工具,正被越来越多压根不懂代码的人用起来。

他们拿Codex干什么?

财务团队用它处理了24771份K-1税表,足足71637页。这套脱敏流程跑下来,团队比去年提前两周收工。

公关团队更直接,搭了一个自动分流的Slack智能体:低风险的演讲邀约自动处理,高风险的转人工审核。

敢交给它的活,也越来越重。

到2026年5月,80.6%的个人用户提过预计超过30分钟的任务,70.2%超过1小时,还有25.6%直接甩给它8小时以上的活。

更微妙的是,业务岗用Codex干的活里,超过四分之一其实是编程。一个做财务的人,正悄悄跨进工程师的地盘。

岗位之间那道墙正在慢慢消失。

OpenAI各部门用Codex干的活,按工作类型拆开看:财务岗里31%是编程,产品营销岗25%,连非技术的「其他」部门都有50%在写代码。岗位的墙,正被Codex一点点抹平。

到这一步,Codex已经不只是编程智能体——它越界成了通用工作流智能体。

这才是它真正让人后背发凉的地方。

从工具到执行者,Codex换了一个身份

撑起这一切的,是Codex角色的彻底转身。

它早已不是那个写代码的补全插件,如今它能接手一整条工程任务链:实现、重构、调试、测试、验证,一条龙全包。

早期版本就能单次自主运行7小时以上,自己迭代实现、修掉测试报错,最后交出一个能跑的方案。

这已经不只是帮你写两行代码,而是你交代一摊事,它自己从头跑到尾。

更能说明问题的是并行规模。

到2026年6月,跑在P99分位的重度用户,单日能让Codex产出超过60小时的智能体轮次,分散在好几个并行的智能体身上。

用户早就不满足于问一个答案,而是一天里同时指挥一支智能体小队。

OpenAI内部Codex的单日智能体运行时长,从普通用户到最重度用户分成五档。到2026年6月,最重度的用户,单日能跑出60小时以上的智能体工作量。

一个人,一天,调度出60小时的活,这是别人一周的活。

Codex的底座是GPT-5.5。它能用更少的token,扛更长的任务。

其中最让人惊讶的,是GPT-5.5干的另一件事。

为了在不拖慢速度的前提下提速,OpenAI让它去重写负载均衡和分区的启发式算法。

GPT-5.5分析了数周的真实流量,写出定制方案,把token生成速度硬生生拉高20%以上。

于是,GPT-5.5成了一台开始优化自己的引擎。

有提前用上它的英伟达工程师甚至说,失去对GPT-5.5的访问权限,感觉像被截了肢。

这一切的背后,人和AI搭班的对象悄悄换了:从一问一答的聊天机器人,变成能独立跑长活的智能体。

不变的是发指令、做判断、担责任的这些依然是人。改变的是办公的默认动作:从打开聊天框问一句,变成把一整件事交给智能体去跑。

这份报告,更像是一次办公方式换挡的预演。

往后真正拉开差距的,是你敢把多大的一摊事,整个交给AI。

参考资料:

https://openai.com/index/introducing-codex/https://openai.com/index/codex-for-every-role-tool-workflow/

https://x.com/gdb/status/2070199649823297653

https://openai.com/index/how-agents-are-transforming-work/https://openai.com/index/harness-engineering/

本文来自微信公众号“新智元”,作者:ASI启示录;编辑:元宇

你可能也喜歡

谷歌「推理之王」也跑路Meta了，当年还是李飞飞挖来的

谷歌顶尖AI人才、被誉为“推理之王”的周登勇已低调离职，加入Meta任职研究科学家。他由李飞飞当年引入谷歌，工作八年多，在思维链等LLM基础研究上贡献卓著。几乎同时，Meta还迎来了“安全教母”、伯克利教授宋晓冬及其初创团队。此举是谷歌近期人才流失潮的又一例证。此前，Transformer核心作者Noam Shazeer转投OpenAI，诺贝尔奖得主、AlphaFold负责人John Jumper以及多名Gemini核心成员也相继加入Anthropic。报道指出，深层原因可能与谷歌内部战略重心转移有关。为追赶在AI编程（Coding）领域的竞争对手，谷歌成立了由高层直接领导的“Coding突击队”，并大幅提升其优先级和资源，旨在让Gemini成为编程主力。这一“Coding为王”的实用路线，与DeepMind部分研究人员倡导的“世界模型”AGI长远愿景产生冲突。有离职者透露，其算力资源被分配给了其他团队，这或许是顶级人才纷纷出走的重要推力。

marsbit44 分鐘前

marsbit44 分鐘前

6月26日SpaceX开始闯入指数后，几百亿的资金是如何买入的？SpaceX是否会被爆拉？

SpaceX($SPCX)将于6月26日被宣布纳入罗素美国指数和纳斯达克100指数，导致市场预期数百亿美元被动资金将流入。然而，这些资金并非在生效日（7月6日）集中买入。罗素指数在宣布日（6月26日）收盘后即生效，主要被动资金通过收盘集合竞价（MOC订单）完成交易，市场难以察觉。纳斯达克100指数则有10天窗口期，期间三波资金参与：套利基金在宣布后抢先买入；部分指数基金提前布局；大部分被动基金在生效日收盘集合竞价时完成最终买入。因此，生效日当天冲入的散户可能成为接盘者。 SpaceX因IPO不久，自由流通盘可能较小。为避免在公开市场推高股价，指数基金常通过场外大宗交易或与受限股东签订收益互换协议等方式“暗度陈仓”，真实交易不会完全体现在公开市场成交量中。对散户而言，追涨风险高。相对稳健的策略包括：等待生效日后情绪平复再长期布局；或利用期权市场波动率飙升的机会，例如卖出宽跨式期权，赚取权利金。总之，巨额被动资金的买入是分散、隐蔽且提前进行的，生效日当天难现股价“爆拉”，行情更多在预热期博弈中体现。

marsbit57 分鐘前

6月26日SpaceX开始闯入指数后，几百亿的资金是如何买入的？SpaceX是否会被爆拉？

marsbit57 分鐘前

0.7nm制程芯片问世，摩尔定律又活了

摩尔定律迎来转机？IBM推出全球首款0.7纳米（7埃米）制程芯片技术，首次突破1纳米门槛。该技术可在指甲盖大小的芯片上集成近1000亿个晶体管，密度是当前2纳米芯片的两倍，能带来50%的性能提升或70%的能效提升。实现这一突破的关键是IBM的新型“纳米堆叠”（NanoStack）架构。该架构将两片带有纳米片晶体管的晶圆垂直堆叠并互联，形成三维结构，使晶体管密度大幅增加，并让n型和p型晶体管能独立优化。IBM已在实验室验证了该技术的可行性，并在SRAM上实现了40%的面积缩减，这对AI芯片的高带宽需求尤为重要。 IBM副总裁指出，高性能与高能效是当前AI算力竞赛的核心需求，而70%的能效提升正对此至关重要。虽然IBM自身不生产芯片，但其研发的制造工艺将授权给合作伙伴。IBM预计，基于NanoStack的技术最早能在未来五年内实现量产，并将芯片微缩进程至少再延续十年。

marsbit1 小時前

marsbit1 小時前

灰度在MSOL上市前削减费用——机构会推动Solana的下一次上涨吗？

灰度投资在摩根士丹利推出MSOL前下调费率，会推动Solana下一轮上涨吗？当前加密市场整体疲软，总市值跌至1.99万亿美元，SOL价格也随大势周跌5.7%。然而，机构动作显现分化迹象：灰度将其现货SOL ETF年费从0.35%大幅降至0.19%，此举被认为是对摩根士丹利计划以0.14%超低费率推出MSOL的竞争性回应。与此同时，哈萨克斯坦证券交易所上市了Solana ETF，拓宽了机构准入渠道。尽管技术面仍弱，但Solana的链上基本面为机构布局提供了支撑：其现实世界资产领域总锁仓值创历史新高，突破31亿美元，持有者数量超过29万。开发商层面的代币经济学改进、资产代币化交易以及 meme 币和 AI 领域的活跃也构成了长期基础。有观点认为，在ETF竞争加剧与链上积极信号开始汇聚的背景下，Solana可能正进入机构资金流与基本面逐渐匹配的阶段，为其第三季度的表现奠定了基础。

ambcrypto2 小時前

ambcrypto2 小時前

Arthur Hayes出售NEAR、Worldcoin与Zcash，轮动至能源股

加密货币交易员Arthur Hayes近期调整投资组合，转向更防御性的策略。他清仓了NEAR、Worldcoin、Zcash和Hyperliquid等山寨币，但维持对比特币和以太坊的核心看涨观点。Hayes认为，人工智能相关债务的激增扭曲了全球流动性状况，吸收了市场资金，短期内不利于高风险的山寨币表现。他因此将部分资金轮动至国债和能源股。 Hayes强调，比特币作为对冲货币贬值的工具，以太坊作为核心智能合约平台，长期前景依然稳固。此次调整并非看空加密货币整体，而是对宏观流动性的选择性应对。他长期仍看好比特币达到100万美元的目标，但指出路径可能更加波折。对于市场参与者而言，关键启示在于需密切关注全球信贷条件、AI融资及央行政策等宏观流动性指标，而不仅仅是代币自身的叙事。在流动性收紧阶段，资金可能更集中于比特币和以太坊等深层次市场。

bitcoinist2 小時前

Arthur Hayes出售NEAR、Worldcoin与Zcash，轮动至能源股