OpenAI 曝光「北极星」项目，「2028 大失业」可能真要来了

marsbit發佈於 2026-03-24更新於 2026-03-24

文章摘要

OpenAI近期曝光“北极星”项目，目标在2028年前建成全自动多智能体研究系统。其首席科学家Jakub Pachocki表示，第一阶段目标将于今年9月落地——推出能独立处理研究问题的“自主AI研究实习生”。该项目整合了推理模型、智能体和可解释性三大技术路线，旨在实现AI自主进行科学研究。与此同时，Anthropic也推出Claude Code Channels，将AI深度嵌入开发者工作流程，使其从“工具”转变为“同事”。两家公司路径不同，但均指向智能体研发的核心方向。 OpenAI承认目前对大语言模型的控制力仍不足，安全与可控性仍是挑战。但技术上已有进展，例如“卡帕西循环”框架和实际案例中AI夜间实验提升模型性能19%。商业层面，预测到2029年，智能体业务年收入可达290亿美元，包括月费2000美元的“知识代理”和2万美元的“研究代理”。后者成本远低于人类研究员，且可24小时工作，重新定义科研生产效率。若AI能自主推动科学研究，其进步速度将不再受人类研究者限制，这可能引发2028年前后大规模的就业结构变革。

不久前,一篇「2028 年预测」的文中疯传网络,该文章指出由于 AI 的进步,2028 年将会有很大一波失业浪潮,很多人的工作,将会被 AI 取代。

文章一出,叠加中东局势,重挫了当天美国股市。此事堪称玄幻,毕竟那篇文章一看就是由 AI 写的,但看起来正契合了人们对于「AI 带来大失业」的恐惧心理,所以造成了如此大的影响。

近日,OpenAI 曝光的一则消息,则让人们意识到,「2028 年大失业」,可能并非是空穴来风。

近期,OpenAI 首席科学家 Jakub Pachocki 在接受 MIT Technology Review 独家专访时说了一句让人脊背发凉的话——他们的「北极星」,是在 2028 年之前建成一套全自动的多智能体研究系统。

今年 9 月,第一阶段目标就会落地:

一个能独立处理特定研究问题的「自主 AI 研究实习生」。

这不是产品路线图里的占位符,也不是 Altman 在 X 上的一句随口豪言。这是 OpenAI 在把整个公司资源押注在一个方向上。

「北极星」的意义

科技公司说「北极星」的时候,通常意味着两件事:一是其他事情要为它让路,二是公司内部已经达成共识。

从过去两周 OpenAI 的动作来看,这个判断基本成立。

3 月 19 日,OpenAI 宣布收购开发者工具公司 Astral,团队并入 Codex 部门;同一时间,公司宣布整合 ChatGPT、Codex 和浏览器为一个统一的桌面「超级应用」,由应用主管 Fidji Simo 主导,Greg Brockman 协助推进组织改革。

碎片化产品时代宣告终结,OpenAI 正在把所有筹码往一个方向推。

而这个方向,指向的是「让 AI 自己做研究」。

Pachocki 的逻辑其实很清晰:推理模型、智能体、可解释性,这三条技术路线在 OpenAI 内部原本各自为战,现在要整合到一个目标下——造出能在数据中心里自主运行很长时间的 AI 研究员。他说,一旦这件事成了,「这是我们真正依赖的东西。」

前 OpenAI 研究员 Andrej Karpathy 的看法更直接——「所有大语言模型前沿实验室都会这样做,这是最终的 BOSS 战。」他补了一句话值得细品:「规模化当然会更复杂,但做这件事只是工程问题,它会成功。」

注意他的用词:不是「能不能」,是「什么时候」。

Anthropic 在行动

就在 OpenAI 宣布「北极星」的同一天,Anthropic 悄悄上线了 Claude Code Channels——一个让开发者可以通过 Telegram 和 Discord 直接与正在运行的 Claude Code 会话交互的功能。

这件事单独看很小,放进整体趋势里看,就很重要。

Anthropic 的逻辑是:与其告诉开发者 AI 未来能做什么,不如现在就让它嵌进开发者的真实工作流。 Telegram 和 Discord 不是学术论文,是程序员每天工作的地方。让 Claude Code 活在这里,意味着它从「工具」变成了「同事」。

社区里的反应印证了这个判断。

有用户直接说:「Claude 通过这次更新把 OpenClaw 给杀了,你不再需要买一台 Mac Mini。」这句话背后的含义是,Anthropic 的基础设施改进,已经让开源替代方案失去了成本优势。

而从更宏观的时间线看,Anthropic 在 Claude Code 上的迭代速度确实惊人。短短数周内,它融合了文本处理、数千个 MCP 技能集成和自主 bug 修复能力。OpenAI 在通过收购 Astral 补强 Codex 的同时,Anthropic 已经把 Claude Code 直接送进了开发者的聊天窗口。

两家公司都在奔向同一个终点,路线却截然不同——OpenAI 在做「2028 年的全自动研究员」,Anthropic 在做「今天就能用的智能体工具」。

真正的难题

不过,这里有一个细节不能绕过去。

Pachocki 在专访中做了一件很罕见的事——他主动谈到了安全和可控性的挑战,而且说得相当坦诚。

他说,他们的想法是用其他大语言模型,来「监控 AI 研究员的便签」,在行为出问题之前就捕捉到不良行为。但紧接着他承认:「对大语言模型的理解度,不足以让我们完全控制它们,要真正说『这个问题已经解决了』,还需要很长时间。」

一家公司的首席科学家说「我们还没有完全的控制力」,同时宣布要在 2028 年交出全自动 AI 研究系统,这两件事放在一起,值得所有人认真想一想。

这不是在唱衰,而是在理解这件事的真实难度。Pachocki 能说出这句话,本身说明 OpenAI 内部对这条路的艰难有清醒认知。

技术层面,有一个被研究者总结的「卡帕西循环」值得参考——成功的自动化 AI 研究框架需要三个要素:一个有权修改单个文件的智能体、一个可以客观测试的单一指标、固定的实验时间限制。

这套框架已经开始在实际环境中产生结果。Shopify CEO Tobias Lütke 就公开分享过一个案例:他让 autoresearch 智能体在夜间运行,第二天早上,智能体跑了 37 次实验,把模型性能提升了 19%。

从概念到落地,这条路比想象中要短。

20000 美元订阅费的未来

「北极星」项目不仅是技术上的优势,更是商业上的胜负手。

Paul Roetzer 的一组数字让人想多看几遍:他援引 OpenAI 内部预测,到 2029 年,智能体业务单独就能带来 290 亿美元年收入,其中包括月费 2000 美元的「知识代理」和月费 20000 美元的「研究代理」。

这组数字说明,「AI 研究员」从来不只是一个技术目标,它是一条收入路线图。

月费 20000 美元的「研究代理」,换算一下,是一个资深研究员年薪的几分之一,但它可以 24 小时不间断工作,同时跑 37 个实验。这不是替代某一个具体的人,而是重新定义了「研究生产力」本身是什么。

这让我想起 Karpathy 那句话——「这是最终的 BOSS 战」。他说的 BOSS,不是竞争对手,而是 AI 能力的天花板本身。

一旦 AI 能够自主推进科学研究,AI 进步的速度,将不再受限于人类研究员的数量和工时。

Pachocki 也说了同样的意思,只是表达得更克制——「一旦系统能够在数据中心里自主运行很长时间,这是我们真正依赖的东西。」

2026 年 9 月的 AI 研究实习生,不是终点,而是一个重要的起点。

你可能也喜歡

a16z AI方向合伙人的八年创业笔记

a16z AI合伙人回顾八年生成式AI创业历程：从2018年创立Rosebud AI，在GPT尚未出现时押注“合成媒体”领域，通过CycleGAN等早期技术探索AI创意工具。在模型不成熟阶段，团队通过设计交互流程放大“将就但好用”的体验，成功推动Tokkingheads等产品实现自然增长。2023年GPT-4的突破使代码生成趋于成熟，推动文字转游戏等功能的实现。作者指出，当前AI竞争重点已从“证明能做什么”转向能力产品化与商业化，并强调创业者需在实验室技术路径外寻找创新空间。如今作者卸任CEO投身a16z，将专注于投资前沿模型栈及基础设施，支持AI领域创业者。

marsbit1 小時前

marsbit1 小時前

杨植麟离“追光的月亮”还有多少个Token？

《杨植麟离“追光的月亮”还有多少个Token？》一文聚焦于月之暗面创始人杨植麟在大模型竞争中的战略焦虑与行业格局。文章通过对比DeepSeek与Kimi的技术路线、商业化策略和资本估值，揭示了中国AI独角兽面临的共同挑战。 DeepSeek以15个月沉默换来V4模型突破，强调技术深耕与开源生态，估值超200亿美元；而Kimi虽在长文本和Agent集群技术上领先，却面临商业化转化慢、巨头竞争和上市压力。杨植麟的焦虑源于技术、资本与市场的三重包围，其高估值（180亿美元）需更多收入支撑。两者技术相互借鉴，共同推动国产模型全球竞争力（中美模型差距仅2.7%），但路径分化：DeepSeek追求算力自主与成本优化，Kimi聚焦智能上限与Agent落地。文章指出，中国AI需多元竞争生态，开源模型或成主流。杨植麟的焦虑是行业缩影，其突破需更深扎根技术与市场。

marsbit2 小時前

TechFlow 情报局：ChatGPT 助业余数学家破解 60 年难题，CFTC 起诉纽约州监管 Coinbase 和 Gemini

一位业余数学家借助ChatGPT破解了匈牙利数学家Erdős于1960年代提出的组合数学难题，标志着AI在数学推理领域实现从辅助验证到实质突破的进化。OpenAI推出隐私过滤工具提升企业数据合规性，而Qwen3.6-27B模型在消费级GPU上实现高性能推理，推动算力本地化普及。加密领域监管冲突升级：美国CFTC起诉纽约州监管机构干预Coinbase和Gemini的联邦管辖权，Tether配合冻结3.44亿美元伊朗央行关联资金，暴露中心化稳定币的管控风险。KelpDAO漏洞后DeFi协议联合成立恢复基金，巴西封禁预测市场平台，Litecoin因隐私漏洞首次回滚3小时交易记录。科技与政策层面，特朗普启用《国防生产法》解决AI算力电力瓶颈，同时解雇整个国家科学委员会引发学术担忧。小米宣布推出性能电动车YU7 GT，iPhone被曝自动安装神秘应用。A股机构抱团时长创2007年以来第二高，估值风险凸显。核心矛盾凸显：AI赋能个体突破的同时，中心化权力结构（政府/协议）的控制力持续强化，去中心化的实现本质上关乎政治经济学而非纯技术问题。

marsbit2 小時前

TechFlow 情报局：ChatGPT 助业余数学家破解 60 年难题，CFTC 起诉纽约州监管 Coinbase 和 Gemini

marsbit2 小時前

伊朗加密货币生命线遭重创，美国冻结3.44亿美元资金

美国财政部宣布冻结与伊朗军事和政治团体相关的3.44亿美元加密货币资金，这些资金存放在Tron区块链上的两个钱包中，与伊朗伊斯兰革命卫队和真主党有关。此前伊朗被曝通过向霍尔木兹海峡过境船只收取比特币"过路费"获取收入。稳定币发行商Tether应美国执法要求，提前一天已主动锁定等额资金。此次行动显示尽管伊朗试图规避制裁，但通过中心化稳定币发行商的配合，美国仍能有效切断其加密货币融资渠道。美财政部称将继续系统性削弱德黑兰的资金生成和转移能力。

bitcoinist3 小時前

bitcoinist3 小時前

加密市场震荡下，谁在逆势买入？

2026年第一季度加密市场经历大幅回调，比特币下跌超25%，以太坊跌逾35%，但机构资金仍逆势涌入。企业金库、主权财富基金和ETF发行商成为主要买家，而对冲基金及矿企则大幅抛售。上市公司中，Strategy（原MicroStrategy）单季度增持超100亿美元比特币，占据上市公司净增持量的94%。贝莱德、摩根士丹利等机构推出多支现货及质押型ETF，涵盖BTC、ETH、SUI、DOT等资产。阿布扎比主权基金穆巴达拉增持贝莱德IBIT达46%，哈佛大学等高校基金也开始配置加密资产。风险投资领域呈现两极分化：融资总额约50-68亿美元，但交易笔数骤降49%。支付、预测市场和金融赛道占据超70%融资额，其中BVNK（18亿美元）、Kalshi（10亿美元）和Polymarket（6亿美元）三笔大额交易占半壁江山。行业趋势显示，加密投资正从投机性叙事转向受监管的金融科技模式，但美国国家比特币储备仍未实际部署资金，市场目前由企业和主权资金主导布局。

marsbit3 小時前

marsbit3 小時前

交易

現貨

合約

OpenAI 曝光「北极星」项目，「2028 大失业」可能真要来了

文章摘要

「北极星」的意义

Anthropic 在行动

真正的难题

20000 美元订阅费的未来

相關問答

你可能也喜歡

a16z AI方向合伙人的八年创业笔记

杨植麟离“追光的月亮”还有多少个Token？

TechFlow 情报局：ChatGPT 助业余数学家破解 60 年难题，CFTC 起诉纽约州监管 Coinbase 和 Gemini

伊朗加密货币生命线遭重创，美国冻结3.44亿美元资金

加密市场震荡下，谁在逆势买入？

交易

熱門分類

熱門標籤

OpenAI 曝光 「北极星」项目，「2028 大失业」可能真要来了

文章摘要

「北极星」的意义

Anthropic 在行动

真正的难题

20000 美元订阅费的未来

相關問答

你可能也喜歡

a16z AI方向合伙人的八年创业笔记

杨植麟离“追光的月亮”还有多少个Token？

TechFlow 情报局：ChatGPT 助业余数学家破解 60 年难题，CFTC 起诉纽约州监管 Coinbase 和 Gemini

伊朗加密货币生命线遭重创，美国冻结3.44亿美元资金

加密市场震荡下，谁在逆势买入？

交易

熱門分類

熱門標籤

OpenAI 曝光「北极星」项目，「2028 大失业」可能真要来了