OpenAI为何造手机?苹果不给的权限,ChatGPT自己抢

marsbit2026-05-18 tarihinde yayınlandı2026-05-18 tarihinde güncellendi

Özet

2026年,OpenAI被曝正在加速研发其首款AI Agent手机,计划最快2027年上半年量产。这一看似激进的举动,源于其面临的核心困境:尽管ChatGPT拥有约9亿周活用户,但其作为“会说话”的AI,缺乏“会办事”的能力。 早期,OpenAI坚信“模型即入口”,认为只要智能足够强,用户和商业模式会自然涌现。ChatGPT的空前成功似乎验证了这一点。然而,竞争对手Anthropic通过聚焦“把事情干完”的Claude Code,在开发者等高付费群体中取得了更高的商业效率,这迫使OpenAI重新审视其战略。 OpenAI意识到,要让AI真正接管用户任务(如订票、支付),不仅需要强大的模型,更需要深度系统权限来调用屏幕、相机、文件、支付等。然而,作为合作伙伴的苹果和微软,不可能将这样的核心系统权限和默认入口让渡给ChatGPT。这使得ChatGPT始终“住在别人的房子里”,无法成为真正的智能代理(Agent)。 因此,造手机对OpenAI而言,本质是争夺“主权”——为ChatGPT打造一个能看见、能调用、能执行的“身体”,获得属于自己的默认入口和控制权。这标志着其战略从依赖“模型信仰”,转向必须掌握终端设备和用户入口,以在AI Agent时代实现商业闭环。

今年夏天,马斯克要做一件历史上从未发生过的事。把一家大模型公司,塞进一家造火箭的公司里,一起上市。

OpenAI 现在最不该做的事,可能就是造手机。但萨姆·奥尔特曼似乎不这么想。

今年一季度,OpenAI 的营收和用户增长都没达到预期。对手 Anthropic 靠 Claude Code,抢走了最愿意付钱的那群人。按这个剧本,OpenAI 现在应该收缩、聚焦,先把能赚钱这件事证明一遍,服务于今年底或明年初的 IPO 。

但供应链的消息正好相反。它要去挑战全世界最成熟、最封闭、也是最赚钱的消费电子品类,iPhone。

据爆料,OpenAI 正在加速第一款 AI Agent 手机,最快 2027 年上半年量产,未来两年目标出货 3000 万台。

它是疯了吗?

可能不是。OpenAI 大概已经看清楚一个更危险的问题, ChatGPT 很聪明,但它没有手。

它能回答你,却很难替你完成任务。它住在别人的系统里——苹果的、微软的、操作系统的、浏览器的——所以拿不到真正的权限。

下面想聊的,不是 OpenAI 为什么要造一台手机。而是这家公司怎么一步步意识到,没有自己的终端设备,ChatGPT 就无法翻身。

ChatGPT的成功,也是一种路径依赖

2026 年 4 月,SpaceX 拿到了一项选择权:可以在今年晚些时候,以最高 600 亿美元收购 Cursor。

OpenAI 最早相信的不是手机,不是浏览器,也不是某个 App。它相信的是模型——更准确地说,是智能本身。

在它的世界观里,只要模型足够强,入口、产品和商业模式,都会被智能推着往前走。

这不是一句空话。2020 年,OpenAI 发布了那篇后来被反复引用的 Scaling Laws 论文,定下一个相对乐观的信念:模型、数据、算力一起放大,智能就会以可预测的方式提升。

换句话说,最重要的事不是先去抢入口,而是把模型继续做强。智能足够强,世界自然会让路。

这个信仰,在 2022 年 11 月 30 日被兑现。

那一天 ChatGPT 上线。它没有酷炫界面,没有硬件,没有平台预装,只是一个网页里的输入框。但它给了普通人一种从未有过的体验,你发一句话,它像人一样回答你。

震撼之处不只在于 AI 会说话,更在于它几乎没有借助任何传统入口。没有手机厂商帮它推送,没有操作系统把它放在显眼位置,用户是自己找上它的。

两个月,月活破亿,人类历史上增长最快的消费级应用。

OpenAI 看起来对了。微软立刻加深下注,把它的能力嵌进 Copilot、Office 和 Bing;苹果也在 2024 年 WWDC 上,把 ChatGPT 接进 Apple Intelligence。

这时候,OpenAI 站在了时代中心。最强的模型、最大的用户、最深的合作。

但问题恰恰从这里开始。

ChatGPT 的成功太耀眼了。耀眼到它很容易让 OpenAI 相信:模型本身就是入口。它不需要先拥有一台手机,也不需要先控制一个操作系统——只要智能足够震撼,用户会自己找过来。

后来真正的裂缝,也是从这里开始的。

Claude Code 改写了赚钱规则

第一道裂缝,来自 Anthropic。

2025 年 5 月,它发布了 Claude Code。没有华丽 demo,也没有炸场发布会。这个产品只是进入开发者的终端、代码库和 Git 工作流,帮工程师把活干完。

上线半年后,Claude Code 的年化收入跑到 10 亿美元;不到一年,超过 25 亿美元。到 2026 年 4 月,Anthropic 整体年化收入越过 300 亿美元。

而同期的 OpenAI,月收入 20 亿美元,年化约 240 亿。

Anthropic 用比 ChatGPT 少得多的用户,跑出了更高的收入。这才是 OpenAI 真正该慌的地方。

原因很简单——它击穿了一批最愿意付钱的人。

问题是,OpenAI 为什么慢了一步?

不是因为它看不到 Agent。是 ChatGPT 的成功太耀眼了,耀眼到 OpenAI 沿着原来的惯性继续往前:做更强的模型,扩大用户规模,寻找下一个通用入口。

所以这两年,你能看到 OpenAI 推出过很多 0 到 1 的尝试——GPT Store、Sora、Operator、Deep Research,都是这种思路下长出来的。它们共同指向一个判断:只要模型够强,新产品、新入口、新商业模式会自然长出来。

但 Anthropic 选了另一条路。它没有先做一个覆盖所有人的超级入口,而是把 Claude Code 钉进开发者工作流里,反复打磨一件事——让 AI 把活干完。

这就是 OpenAI 慢的地方。它不是没做新产品,而是没有第一时间把一个高付费场景,从 1 做到 100。

Sora 就是典型例子。发布时震撼全场,但视频生成消耗海量算力,用户留存和商业模式都不够清楚。后来 OpenAI 关掉 Sora,某种程度上是一次剪枝——它开始意识到,制造一个惊艳的 AI demo,和打穿一个高付费工作流,是两件事。

模型能力可以制造高光,但商业效率来自持续交付结果。

到这里,OpenAI 终于意识到:Agent 不是一个附加功能,而是下一阶段 AI 商业化的核心。ChatGPT 不能只证明自己很聪明,它必须证明自己能替用户把事情做完。

但当它真的开始接管任务,撞上的不是模型能力的天花板,而是权限的天花板。

9 亿用户,怎么变成钱

OpenAI 当然也在追。2025 年 5 月,它推出 Codex,正面回应 Claude Code。到 2026 年 4 月,Codex 周活做到 300 万。

但 coding 这一仗,OpenAI 短期内很难赢回来——Anthropic 已经抢先占住 coding Agent 的心智,后来者只能补课。

这也是为什么,OpenAI 开始重新分配资源:把注意力从那些容易制造高光、但难以打穿商业闭环的项目,转向 Agent、企业市场和更底层的研究。

但它真正要看的,是手里那张更大的牌——9 亿周活用户。

这些人不是程序员,不会为代码付钱。但他们每个人都有需求:写邮件、做方案、查资料、订旅行、买东西、整理文件。

如果 ChatGPT 能从一个"会说话"的入口,变成一个"会办事"的入口,那才是 OpenAI 真正的商业能力。

想象这样一个场景:你想买机票,告诉 ChatGPT 时间、预算、偏好,它帮你查航班、比价、看酒店,最后给你一个确认按钮。

这一刻,携程的一部分价值就被绕过去了。比价、广告位、佣金、用户决策影响力,全部会被重新分配。买保险、还信用卡、交水电费,也都是同样的逻辑。只要 Agent 能替你完成任务,里面的每一笔交易佣金、每一次广告影响,OpenAI 都有机会分到一份。

这才是 9 亿用户真正值钱的地方——ChatGPT 不再只回答问题,而是开始接管任务和交易入口。

可一旦 AI 开始办事,它就不再只是聊天框里的模型。它要知道你在哪,要看见你屏幕上发生了什么,要调用你的文件、日历、邮件和支付。

问题于是从"模型够不够强",变成了"谁有权限"。

而权限,恰恰是 OpenAI 缺的东西。

ChatGPT 住在别人的房子里

OpenAI 最早以为,合作可以解决入口问题。苹果给它 iPhone,微软给它 Office、Windows 和企业客户。在当时看,这是 OpenAI 模型信仰的一次胜利。

但 Agent 时代到来后,问题变了。

在苹果那里,ChatGPT 是一个被调用的外部专家。它可以回答问题,但不能真正接管屏幕、相机、通知、支付和文件——这些权限苹果不会交出来。否则 iPhone 的"灵魂"就不再属于苹果。

微软那边也一样。过去,OpenAI 负责提供模型,微软负责把 AI 做进 Office 等入口里。但当 OpenAI 自己开始做 Codex 和企业 Agent,它就走进了微软的地盘——Agent 天然要进入工作流,要写代码、处理文件、替员工完成任务,而这些正是微软最核心的主权范围。

所以,OpenAI 和微软的关系没有立刻破裂,但边界已经变了。2026 年 4 月,双方重新调整协议,微软的独家授权变成非独家,OpenAI 可以在任何云上服务客户。

这件事的意思很清楚:OpenAI 不想只做微软体系里的供应商。它要自己面对客户、自己交付 Agent、自己拿入口。

走到这一步,它和苹果、微软的关系变得微妙。因为 Agent 要的不是一个展示位置,而是默认入口、系统权限、和用户每天第一个接触到的智能终端。

这些东西,苹果不会给,微软也不会给。它们也不能给。

说到底,ChatGPT 很强,但它始终住在别人的房子里——苹果的房子、微软的房子、浏览器的房子、操作系统的房子。它可以被调用,可以被接入,也可以是一个很好的供应商,但它不能决定自己什么时候出现,也不能决定自己能拿到什么权限。

而手机,是最贴近它资源禀赋的那一个。9 亿周活用户已经愿意把问题交给 ChatGPT——把这层心智迁移到一台设备上,比从零做一个操作系统、做一个浏览器都要短。

它要造的不是再造一台装满 App 的 iPhone,而是一台 Agent 专用的手机——一个让 ChatGPT 能看见、能调用、能执行任务的身体。

这也是为什么 2025 年 5 月,OpenAI 花了约 65 亿美元收购 Jony Ive 的硬件公司。这个人是初代 iPhone 的工业设计师,是乔布斯身边最重要的人之一。OpenAI 找他,不只是为了做一件漂亮硬件,是要重新定义 AI 时代的个人设备。

回到开头那个问题,一家大模型公司,为什么要造手机?

OpenAI 想要的不是一台手机,是主权。

它要给 ChatGPT 找到一个属于自己的默认入口。但手机这件事,本质上会把 OpenAI 推向苹果的对立面。过去,苹果可以把 ChatGPT 当成一个供应商;如果 OpenAI 真要做 AI 时代的手机,它就不再是供应商,而是苹果在个人入口上的竞争者。

回头看这几年,OpenAI 的故事其实发生了一次反转。

它曾经相信,只要模型足够强,世界就会主动围着智能重新组织。ChatGPT 的爆发,也确实证明过这件事——它没有硬件、没有预装,只靠一个网页输入框,就把几亿用户拉进了 AI 时代。

但 Agent 时代来了之后,OpenAI 发现,自己还缺一件最关键的东西:主权。

ChatGPT 的成功是一种胜利,也是一种路径依赖。它让 OpenAI 太长时间相信,模型本身就是答案。直到 Claude Code 跑出 25 亿美元年化收入,直到苹果、微软都不愿意把系统权限交出来——OpenAI 才意识到,模型再强,也要拿到入口、权限和任务。

所以 OpenAI 造手机,真正想造的不是一台手机,是 ChatGPT 的第一具身体。

本文来自微信公众号“像素301”,作者:像素301

İlgili Sorular

QOpenAI为什么要造手机?

AOpenAI造手机的目的是为了给ChatGPT一个属于它自己的、拥有完整系统权限的默认入口和‘身体’,以便AI Agent能够真正地‘看见’和‘执行’用户的任务,而不是仅仅作为一个被调用的、权限受限的模型。它要争夺在AI时代的个人入口主权,摆脱对苹果、微软等平台在权限和入口上的依赖。

Q根据文章,Claude Code的成功给OpenAI带来了什么启示?

AClaude Code的成功启示OpenAI,AI的商业化核心不仅是模型能力和用户规模,更重要的是能够深度融入并完成用户的高价值、高付费场景任务(如编码工作流)。这迫使OpenAI认识到,制造惊艳的AI demo与打穿一个可持续的商业闭环是两回事,从而调整资源分配,更专注于Agent、企业市场等能持续交付结果的领域。

Q文章指出ChatGPT在Agent时代面临的主要困境是什么?

AChatGPT面临的主要困境是缺乏‘主权’。它虽然模型强大、用户众多,但‘住’在别人的系统里(如苹果的iOS、微软的Windows/Office),无法获得接管屏幕、相机、文件、支付等关键系统权限。这导致它难以真正‘替用户把事情做完’,从而限制了其从智能对话工具向任务执行代理(Agent)的进化。

QOpenAI收购Jony Ive的硬件公司目的是什么?

AOpenAI收购由初代iPhone设计师Jony Ive创立的硬件公司,目的不仅是为了获得顶级的硬件设计能力,更是为了重新定义AI时代的个人设备。这标志着OpenAI意图打造一台以AI Agent为核心、而非传统App堆砌的手机,为ChatGPT构建一个能够深度整合与交互的物理载体。

Q文章如何描述OpenAI与苹果、微软合作关系的变化?

A文章描述,随着OpenAI向Agent领域深入,它与苹果、微软的合作关系变得微妙且边界重塑。过去,OpenAI是提供模型的供应商,合作是‘胜利’。但在Agent时代,当OpenAI需要系统权限和默认入口来执行任务时,就进入了苹果和微软的‘主权’范围。因此,合作演变为竞争与合作并存,例如OpenAI与微软重新调整协议,从独家变为非独家,以便更独立地发展自己的Agent和客户业务。

İlgili Okumalar

Warsh's Debut: Will the FED Chair Who Knows Crypto Best Bring Surprises or Shocks to the Market?

Kevin Warsh, the new Federal Reserve Chairman, prepares for his inaugural press conference amidst a challenging macroeconomic landscape: resurgent inflation, a bond market sell-off, and political pressure from President Trump for rate cuts. Uniquely, Warsh holds indirect investments in over 20 crypto and Web3 entities (e.g., Solana, dYdX), making him the first Fed Chair with disclosed crypto exposure. His stance may combine a hawkish, inflation-focused monetary policy with a crypto-friendly regulatory philosophy that shifts from Powell’s “same risk, same rule” approach toward a framework acknowledging blockchain’s productivity value. Warsh’s leadership could impact crypto markets across three dimensions: a paradigm shift in regulation (potentially accelerating pro-innovation legislation and stable币 rules), a re-pricing of risk premiums based on clearer communication and his view of AI as a structural disinflationary force, and a long-term reallocation of global institutional capital driven by increased legitimacy. Two potential scenarios for the press conference are outlined. A “positive surprise” would involve a dovish-leaning tone on rates coupled with signals of regulatory openness, potentially boosting crypto asset valuations. Conversely, a “negative shock” would see a more hawkish-than-expected stance on inflation and rates, triggering a broad risk-asset selloff that crypto markets would not escape. While ethics rules required Warsh to divest his crypto holdings upon confirmation, his deep understanding of the technology may fundamentally lower policy uncertainty and build a more receptive long-term foundation for digital assets’ integration into the mainstream financial system.

marsbit1 saat önce

Warsh's Debut: Will the FED Chair Who Knows Crypto Best Bring Surprises or Shocks to the Market?

marsbit1 saat önce

İşlemler

Spot
Futures

Popüler Makaleler

LA Nasıl Satın Alınır

HTX.com’a hoş geldiniz! Lagrange (LA) satın alma işlemlerini basit ve kullanışlı bir hâle getirdik. Adım adım açıkladığımız rehberimizi takip ederek kripto yolculuğunuza başlayın. 1. Adım: HTX Hesabınızı OluşturunHTX'te ücretsiz bir hesap açmak için e-posta adresinizi veya telefon numaranızı kullanın. Sorunsuzca kaydolun ve tüm özelliklerin kilidini açın. Hesabımı Aç2. Adım: Kripto Satın Al Bölümüne Gidin ve Ödeme Yönteminizi SeçinKredi/Banka Kartı: Visa veya Mastercard'ınızı kullanarak anında Lagrange (LA) satın alın.Bakiye: Sorunsuz bir şekilde işlem yapmak için HTX hesap bakiyenizdeki fonları kullanın.Üçüncü Taraflar: Kullanımı kolaylaştırmak için Google Pay ve Apple Pay gibi popüler ödeme yöntemlerini ekledik.P2P: HTX'teki diğer kullanıcılarla doğrudan işlem yapın.Borsa Dışı (OTC): Yatırımcılar için kişiye özel hizmetler ve rekabetçi döviz kurları sunuyoruz.3. Adım: Lagrange (LA) Varlıklarınızı SaklayınLagrange (LA) satın aldıktan sonra HTX hesabınızda saklayın. Alternatif olarak, blok zinciri transferi yoluyla başka bir yere gönderebilir veya diğer kripto para birimlerini takas etmek için kullanabilirsiniz.4. Adım: Lagrange (LA) Varlıklarınızla İşlem YapınHTX'in spot piyasasında Lagrange (LA) ile kolayca işlemler yapın.Hesabınıza erişin, işlem çiftinizi seçin, işlemlerinizi gerçekleştirin ve gerçek zamanlı olarak izleyin. Hem yeni başlayanlar hem de deneyimli yatırımcılar için kullanıcı dostu bir deneyim sunuyoruz.

389 Toplam GörüntülenmeYayınlanma 2025.06.04Güncellenme 2026.06.02

LA Nasıl Satın Alınır

Tartışmalar

HTX Topluluğuna hoş geldiniz. Burada, en son platform gelişmeleri hakkında bilgi sahibi olabilir ve profesyonel piyasa görüşlerine erişebilirsiniz. Kullanıcıların LA (LA) fiyatı hakkındaki görüşleri aşağıda sunulmaktadır.

活动图片