OpenAI 曝光 「北极星」项目,「2028 大失业」可能真要来了

marsbit發佈於 2026-03-24更新於 2026-03-24

文章摘要

OpenAI近期曝光“北极星”项目,目标在2028年前建成全自动多智能体研究系统。其首席科学家Jakub Pachocki表示,第一阶段目标将于今年9月落地——推出能独立处理研究问题的“自主AI研究实习生”。该项目整合了推理模型、智能体和可解释性三大技术路线,旨在实现AI自主进行科学研究。 与此同时,Anthropic也推出Claude Code Channels,将AI深度嵌入开发者工作流程,使其从“工具”转变为“同事”。两家公司路径不同,但均指向智能体研发的核心方向。 OpenAI承认目前对大语言模型的控制力仍不足,安全与可控性仍是挑战。但技术上已有进展,例如“卡帕西循环”框架和实际案例中AI夜间实验提升模型性能19%。 商业层面,预测到2029年,智能体业务年收入可达290亿美元,包括月费2000美元的“知识代理”和2万美元的“研究代理”。后者成本远低于人类研究员,且可24小时工作,重新定义科研生产效率。 若AI能自主推动科学研究,其进步速度将不再受人类研究者限制,这可能引发2028年前后大规模的就业结构变革。

不久前,一篇「2028 年预测」的文中疯传网络,该文章指出由于 AI 的进步,2028 年将会有很大一波失业浪潮,很多人的工作,将会被 AI 取代。

文章一出,叠加中东局势,重挫了当天美国股市。此事堪称玄幻,毕竟那篇文章一看就是由 AI 写的,但看起来正契合了人们对于「AI 带来大失业」的恐惧心理,所以造成了如此大的影响。

近日,OpenAI 曝光的一则消息,则让人们意识到,「2028 年大失业」,可能并非是空穴来风。

近期,OpenAI 首席科学家 Jakub Pachocki 在接受 MIT Technology Review 独家专访时说了一句让人脊背发凉的话——他们的「北极星」,是在 2028 年之前建成一套全自动的多智能体研究系统

今年 9 月,第一阶段目标就会落地:

一个能独立处理特定研究问题的「自主 AI 研究实习生」

这不是产品路线图里的占位符,也不是 Altman 在 X 上的一句随口豪言。这是 OpenAI 在把整个公司资源押注在一个方向上。

「北极星」的意义

科技公司说「北极星」的时候,通常意味着两件事:一是其他事情要为它让路,二是公司内部已经达成共识。

从过去两周 OpenAI 的动作来看,这个判断基本成立。

3 月 19 日,OpenAI 宣布收购开发者工具公司 Astral,团队并入 Codex 部门;同一时间,公司宣布整合 ChatGPT、Codex 和浏览器为一个统一的桌面「超级应用」,由应用主管 Fidji Simo 主导,Greg Brockman 协助推进组织改革。

碎片化产品时代宣告终结,OpenAI 正在把所有筹码往一个方向推。

而这个方向,指向的是「让 AI 自己做研究」

Pachocki 的逻辑其实很清晰:推理模型、智能体、可解释性,这三条技术路线在 OpenAI 内部原本各自为战,现在要整合到一个目标下——造出能在数据中心里自主运行很长时间的 AI 研究员。 他说,一旦这件事成了,「这是我们真正依赖的东西。」

前 OpenAI 研究员 Andrej Karpathy 的看法更直接——「所有大语言模型前沿实验室都会这样做,这是最终的 BOSS 战。」他补了一句话值得细品:「规模化当然会更复杂,但做这件事只是工程问题,它会成功。」

注意他的用词:不是「能不能」,是「什么时候」

Anthropic 在行动

就在 OpenAI 宣布「北极星」的同一天,Anthropic 悄悄上线了 Claude Code Channels——一个让开发者可以通过 Telegram 和 Discord 直接与正在运行的 Claude Code 会话交互的功能。

这件事单独看很小,放进整体趋势里看,就很重要。

Anthropic 的逻辑是:与其告诉开发者 AI 未来能做什么,不如现在就让它嵌进开发者的真实工作流。 Telegram 和 Discord 不是学术论文,是程序员每天工作的地方。让 Claude Code 活在这里,意味着它从「工具」变成了「同事」

社区里的反应印证了这个判断。

有用户直接说:「Claude 通过这次更新把 OpenClaw 给杀了,你不再需要买一台 Mac Mini。」这句话背后的含义是,Anthropic 的基础设施改进,已经让开源替代方案失去了成本优势。

而从更宏观的时间线看,Anthropic 在 Claude Code 上的迭代速度确实惊人。短短数周内,它融合了文本处理、数千个 MCP 技能集成和自主 bug 修复能力。OpenAI 在通过收购 Astral 补强 Codex 的同时,Anthropic 已经把 Claude Code 直接送进了开发者的聊天窗口。

两家公司都在奔向同一个终点,路线却截然不同——OpenAI 在做「2028 年的全自动研究员」,Anthropic 在做「今天就能用的智能体工具」。

真正的难题

不过,这里有一个细节不能绕过去。

Pachocki 在专访中做了一件很罕见的事——他主动谈到了安全和可控性的挑战,而且说得相当坦诚。

他说,他们的想法是用其他大语言模型,来「监控 AI 研究员的便签」,在行为出问题之前就捕捉到不良行为。但紧接着他承认:「对大语言模型的理解度,不足以让我们完全控制它们,要真正说『这个问题已经解决了』,还需要很长时间。」

一家公司的首席科学家说「我们还没有完全的控制力」,同时宣布要在 2028 年交出全自动 AI 研究系统,这两件事放在一起,值得所有人认真想一想。

这不是在唱衰,而是在理解这件事的真实难度。Pachocki 能说出这句话,本身说明 OpenAI 内部对这条路的艰难有清醒认知。

技术层面,有一个被研究者总结的「卡帕西循环」值得参考——成功的自动化 AI 研究框架需要三个要素:一个有权修改单个文件的智能体、一个可以客观测试的单一指标、固定的实验时间限制

这套框架已经开始在实际环境中产生结果。Shopify CEO Tobias Lütke 就公开分享过一个案例:他让 autoresearch 智能体在夜间运行,第二天早上,智能体跑了 37 次实验,把模型性能提升了 19%。

从概念到落地,这条路比想象中要短。

20000 美元订阅费的未来

「北极星」项目不仅是技术上的优势,更是商业上的胜负手。

Paul Roetzer 的一组数字让人想多看几遍:他援引 OpenAI 内部预测,到 2029 年,智能体业务单独就能带来 290 亿美元年收入,其中包括月费 2000 美元的「知识代理」和月费 20000 美元的「研究代理」

这组数字说明,「AI 研究员」从来不只是一个技术目标,它是一条收入路线图

月费 20000 美元的「研究代理」,换算一下,是一个资深研究员年薪的几分之一,但它可以 24 小时不间断工作,同时跑 37 个实验。这不是替代某一个具体的人,而是重新定义了「研究生产力」本身是什么。

这让我想起 Karpathy 那句话——「这是最终的 BOSS 战」。他说的 BOSS,不是竞争对手,而是 AI 能力的天花板本身

一旦 AI 能够自主推进科学研究,AI 进步的速度,将不再受限于人类研究员的数量和工时

Pachocki 也说了同样的意思,只是表达得更克制——「一旦系统能够在数据中心里自主运行很长时间,这是我们真正依赖的东西。」

2026 年 9 月的 AI 研究实习生,不是终点,而是一个重要的起点。

相關問答

QOpenAI的「北极星」项目的主要目标是什么?

AOpenAI的「北极星」项目的主要目标是在2028年之前建成一套全自动的多智能体研究系统,该系统能够自主推进科学研究,包括独立处理研究问题、运行实验并提升模型性能。

QOpenAI首席科学家Jakub Pachocki在专访中承认了什么关键挑战?

AJakub Pachocki承认,目前对大语言模型的理解度不足以完全控制它们,安全和可控性仍是重大挑战,需要长时间才能解决,尽管公司正致力于通过其他大语言模型监控AI行为来应对这一问题。

QAnthropic的Claude Code Channels更新如何改变开发者与AI的交互方式?

AAnthropic的Claude Code Channels允许开发者通过Telegram和Discord等日常聊天工具直接与Claude Code会话交互,使AI从单纯工具转变为嵌入工作流的“同事”,提升了实用性和集成度。

Q根据文章,月费20000美元的“研究代理”可能带来哪些商业影响?

A月费20000美元的“研究代理”预计能以远低于人类资深研究员的成本提供24小时不间断工作能力,同时处理多个实验,重新定义研究生产力,并为OpenAI带来显著收入增长,到2029年智能体业务年收入可能达290亿美元。

Q“卡帕西循环”提出的成功自动化AI研究框架需要哪三个要素?

A“卡帕西循环”提出的三个要素是:一个有权修改单个文件的智能体、一个可以客观测试的单一指标,以及固定的实验时间限制,这些要素共同确保AI研究框架的高效和可落地性。

你可能也喜歡

交易

現貨
合約
活动图片