OpenAI为何造手机?苹果不给的权限,ChatGPT自己抢

marsbitPublié le 2026-05-18Dernière mise à jour le 2026-05-18

Résumé

2026年,OpenAI被曝正在加速研发其首款AI Agent手机,计划最快2027年上半年量产。这一看似激进的举动,源于其面临的核心困境:尽管ChatGPT拥有约9亿周活用户,但其作为“会说话”的AI,缺乏“会办事”的能力。 早期,OpenAI坚信“模型即入口”,认为只要智能足够强,用户和商业模式会自然涌现。ChatGPT的空前成功似乎验证了这一点。然而,竞争对手Anthropic通过聚焦“把事情干完”的Claude Code,在开发者等高付费群体中取得了更高的商业效率,这迫使OpenAI重新审视其战略。 OpenAI意识到,要让AI真正接管用户任务(如订票、支付),不仅需要强大的模型,更需要深度系统权限来调用屏幕、相机、文件、支付等。然而,作为合作伙伴的苹果和微软,不可能将这样的核心系统权限和默认入口让渡给ChatGPT。这使得ChatGPT始终“住在别人的房子里”,无法成为真正的智能代理(Agent)。 因此,造手机对OpenAI而言,本质是争夺“主权”——为ChatGPT打造一个能看见、能调用、能执行的“身体”,获得属于自己的默认入口和控制权。这标志着其战略从依赖“模型信仰”,转向必须掌握终端设备和用户入口,以在AI Agent时代实现商业闭环。

今年夏天,马斯克要做一件历史上从未发生过的事。把一家大模型公司,塞进一家造火箭的公司里,一起上市。

OpenAI 现在最不该做的事,可能就是造手机。但萨姆·奥尔特曼似乎不这么想。

今年一季度,OpenAI 的营收和用户增长都没达到预期。对手 Anthropic 靠 Claude Code,抢走了最愿意付钱的那群人。按这个剧本,OpenAI 现在应该收缩、聚焦,先把能赚钱这件事证明一遍,服务于今年底或明年初的 IPO 。

但供应链的消息正好相反。它要去挑战全世界最成熟、最封闭、也是最赚钱的消费电子品类,iPhone。

据爆料,OpenAI 正在加速第一款 AI Agent 手机,最快 2027 年上半年量产,未来两年目标出货 3000 万台。

它是疯了吗?

可能不是。OpenAI 大概已经看清楚一个更危险的问题, ChatGPT 很聪明,但它没有手。

它能回答你,却很难替你完成任务。它住在别人的系统里——苹果的、微软的、操作系统的、浏览器的——所以拿不到真正的权限。

下面想聊的,不是 OpenAI 为什么要造一台手机。而是这家公司怎么一步步意识到,没有自己的终端设备,ChatGPT 就无法翻身。

ChatGPT的成功,也是一种路径依赖

2026 年 4 月,SpaceX 拿到了一项选择权:可以在今年晚些时候,以最高 600 亿美元收购 Cursor。

OpenAI 最早相信的不是手机,不是浏览器,也不是某个 App。它相信的是模型——更准确地说,是智能本身。

在它的世界观里,只要模型足够强,入口、产品和商业模式,都会被智能推着往前走。

这不是一句空话。2020 年,OpenAI 发布了那篇后来被反复引用的 Scaling Laws 论文,定下一个相对乐观的信念:模型、数据、算力一起放大,智能就会以可预测的方式提升。

换句话说,最重要的事不是先去抢入口,而是把模型继续做强。智能足够强,世界自然会让路。

这个信仰,在 2022 年 11 月 30 日被兑现。

那一天 ChatGPT 上线。它没有酷炫界面,没有硬件,没有平台预装,只是一个网页里的输入框。但它给了普通人一种从未有过的体验,你发一句话,它像人一样回答你。

震撼之处不只在于 AI 会说话,更在于它几乎没有借助任何传统入口。没有手机厂商帮它推送,没有操作系统把它放在显眼位置,用户是自己找上它的。

两个月,月活破亿,人类历史上增长最快的消费级应用。

OpenAI 看起来对了。微软立刻加深下注,把它的能力嵌进 Copilot、Office 和 Bing;苹果也在 2024 年 WWDC 上,把 ChatGPT 接进 Apple Intelligence。

这时候,OpenAI 站在了时代中心。最强的模型、最大的用户、最深的合作。

但问题恰恰从这里开始。

ChatGPT 的成功太耀眼了。耀眼到它很容易让 OpenAI 相信:模型本身就是入口。它不需要先拥有一台手机,也不需要先控制一个操作系统——只要智能足够震撼,用户会自己找过来。

后来真正的裂缝,也是从这里开始的。

Claude Code 改写了赚钱规则

第一道裂缝,来自 Anthropic。

2025 年 5 月,它发布了 Claude Code。没有华丽 demo,也没有炸场发布会。这个产品只是进入开发者的终端、代码库和 Git 工作流,帮工程师把活干完。

上线半年后,Claude Code 的年化收入跑到 10 亿美元;不到一年,超过 25 亿美元。到 2026 年 4 月,Anthropic 整体年化收入越过 300 亿美元。

而同期的 OpenAI,月收入 20 亿美元,年化约 240 亿。

Anthropic 用比 ChatGPT 少得多的用户,跑出了更高的收入。这才是 OpenAI 真正该慌的地方。

原因很简单——它击穿了一批最愿意付钱的人。

问题是,OpenAI 为什么慢了一步?

不是因为它看不到 Agent。是 ChatGPT 的成功太耀眼了,耀眼到 OpenAI 沿着原来的惯性继续往前:做更强的模型,扩大用户规模,寻找下一个通用入口。

所以这两年,你能看到 OpenAI 推出过很多 0 到 1 的尝试——GPT Store、Sora、Operator、Deep Research,都是这种思路下长出来的。它们共同指向一个判断:只要模型够强,新产品、新入口、新商业模式会自然长出来。

但 Anthropic 选了另一条路。它没有先做一个覆盖所有人的超级入口,而是把 Claude Code 钉进开发者工作流里,反复打磨一件事——让 AI 把活干完。

这就是 OpenAI 慢的地方。它不是没做新产品,而是没有第一时间把一个高付费场景,从 1 做到 100。

Sora 就是典型例子。发布时震撼全场,但视频生成消耗海量算力,用户留存和商业模式都不够清楚。后来 OpenAI 关掉 Sora,某种程度上是一次剪枝——它开始意识到,制造一个惊艳的 AI demo,和打穿一个高付费工作流,是两件事。

模型能力可以制造高光,但商业效率来自持续交付结果。

到这里,OpenAI 终于意识到:Agent 不是一个附加功能,而是下一阶段 AI 商业化的核心。ChatGPT 不能只证明自己很聪明,它必须证明自己能替用户把事情做完。

但当它真的开始接管任务,撞上的不是模型能力的天花板,而是权限的天花板。

9 亿用户,怎么变成钱

OpenAI 当然也在追。2025 年 5 月,它推出 Codex,正面回应 Claude Code。到 2026 年 4 月,Codex 周活做到 300 万。

但 coding 这一仗,OpenAI 短期内很难赢回来——Anthropic 已经抢先占住 coding Agent 的心智,后来者只能补课。

这也是为什么,OpenAI 开始重新分配资源:把注意力从那些容易制造高光、但难以打穿商业闭环的项目,转向 Agent、企业市场和更底层的研究。

但它真正要看的,是手里那张更大的牌——9 亿周活用户。

这些人不是程序员,不会为代码付钱。但他们每个人都有需求:写邮件、做方案、查资料、订旅行、买东西、整理文件。

如果 ChatGPT 能从一个"会说话"的入口,变成一个"会办事"的入口,那才是 OpenAI 真正的商业能力。

想象这样一个场景:你想买机票,告诉 ChatGPT 时间、预算、偏好,它帮你查航班、比价、看酒店,最后给你一个确认按钮。

这一刻,携程的一部分价值就被绕过去了。比价、广告位、佣金、用户决策影响力,全部会被重新分配。买保险、还信用卡、交水电费,也都是同样的逻辑。只要 Agent 能替你完成任务,里面的每一笔交易佣金、每一次广告影响,OpenAI 都有机会分到一份。

这才是 9 亿用户真正值钱的地方——ChatGPT 不再只回答问题,而是开始接管任务和交易入口。

可一旦 AI 开始办事,它就不再只是聊天框里的模型。它要知道你在哪,要看见你屏幕上发生了什么,要调用你的文件、日历、邮件和支付。

问题于是从"模型够不够强",变成了"谁有权限"。

而权限,恰恰是 OpenAI 缺的东西。

ChatGPT 住在别人的房子里

OpenAI 最早以为,合作可以解决入口问题。苹果给它 iPhone,微软给它 Office、Windows 和企业客户。在当时看,这是 OpenAI 模型信仰的一次胜利。

但 Agent 时代到来后,问题变了。

在苹果那里,ChatGPT 是一个被调用的外部专家。它可以回答问题,但不能真正接管屏幕、相机、通知、支付和文件——这些权限苹果不会交出来。否则 iPhone 的"灵魂"就不再属于苹果。

微软那边也一样。过去,OpenAI 负责提供模型,微软负责把 AI 做进 Office 等入口里。但当 OpenAI 自己开始做 Codex 和企业 Agent,它就走进了微软的地盘——Agent 天然要进入工作流,要写代码、处理文件、替员工完成任务,而这些正是微软最核心的主权范围。

所以,OpenAI 和微软的关系没有立刻破裂,但边界已经变了。2026 年 4 月,双方重新调整协议,微软的独家授权变成非独家,OpenAI 可以在任何云上服务客户。

这件事的意思很清楚:OpenAI 不想只做微软体系里的供应商。它要自己面对客户、自己交付 Agent、自己拿入口。

走到这一步,它和苹果、微软的关系变得微妙。因为 Agent 要的不是一个展示位置,而是默认入口、系统权限、和用户每天第一个接触到的智能终端。

这些东西,苹果不会给,微软也不会给。它们也不能给。

说到底,ChatGPT 很强,但它始终住在别人的房子里——苹果的房子、微软的房子、浏览器的房子、操作系统的房子。它可以被调用,可以被接入,也可以是一个很好的供应商,但它不能决定自己什么时候出现,也不能决定自己能拿到什么权限。

而手机,是最贴近它资源禀赋的那一个。9 亿周活用户已经愿意把问题交给 ChatGPT——把这层心智迁移到一台设备上,比从零做一个操作系统、做一个浏览器都要短。

它要造的不是再造一台装满 App 的 iPhone,而是一台 Agent 专用的手机——一个让 ChatGPT 能看见、能调用、能执行任务的身体。

这也是为什么 2025 年 5 月,OpenAI 花了约 65 亿美元收购 Jony Ive 的硬件公司。这个人是初代 iPhone 的工业设计师,是乔布斯身边最重要的人之一。OpenAI 找他,不只是为了做一件漂亮硬件,是要重新定义 AI 时代的个人设备。

回到开头那个问题,一家大模型公司,为什么要造手机?

OpenAI 想要的不是一台手机,是主权。

它要给 ChatGPT 找到一个属于自己的默认入口。但手机这件事,本质上会把 OpenAI 推向苹果的对立面。过去,苹果可以把 ChatGPT 当成一个供应商;如果 OpenAI 真要做 AI 时代的手机,它就不再是供应商,而是苹果在个人入口上的竞争者。

回头看这几年,OpenAI 的故事其实发生了一次反转。

它曾经相信,只要模型足够强,世界就会主动围着智能重新组织。ChatGPT 的爆发,也确实证明过这件事——它没有硬件、没有预装,只靠一个网页输入框,就把几亿用户拉进了 AI 时代。

但 Agent 时代来了之后,OpenAI 发现,自己还缺一件最关键的东西:主权。

ChatGPT 的成功是一种胜利,也是一种路径依赖。它让 OpenAI 太长时间相信,模型本身就是答案。直到 Claude Code 跑出 25 亿美元年化收入,直到苹果、微软都不愿意把系统权限交出来——OpenAI 才意识到,模型再强,也要拿到入口、权限和任务。

所以 OpenAI 造手机,真正想造的不是一台手机,是 ChatGPT 的第一具身体。

本文来自微信公众号“像素301”,作者:像素301

Questions liées

QOpenAI为什么要造手机?

AOpenAI造手机的目的是为了给ChatGPT一个属于它自己的、拥有完整系统权限的默认入口和‘身体’,以便AI Agent能够真正地‘看见’和‘执行’用户的任务,而不是仅仅作为一个被调用的、权限受限的模型。它要争夺在AI时代的个人入口主权,摆脱对苹果、微软等平台在权限和入口上的依赖。

Q根据文章,Claude Code的成功给OpenAI带来了什么启示?

AClaude Code的成功启示OpenAI,AI的商业化核心不仅是模型能力和用户规模,更重要的是能够深度融入并完成用户的高价值、高付费场景任务(如编码工作流)。这迫使OpenAI认识到,制造惊艳的AI demo与打穿一个可持续的商业闭环是两回事,从而调整资源分配,更专注于Agent、企业市场等能持续交付结果的领域。

Q文章指出ChatGPT在Agent时代面临的主要困境是什么?

AChatGPT面临的主要困境是缺乏‘主权’。它虽然模型强大、用户众多,但‘住’在别人的系统里(如苹果的iOS、微软的Windows/Office),无法获得接管屏幕、相机、文件、支付等关键系统权限。这导致它难以真正‘替用户把事情做完’,从而限制了其从智能对话工具向任务执行代理(Agent)的进化。

QOpenAI收购Jony Ive的硬件公司目的是什么?

AOpenAI收购由初代iPhone设计师Jony Ive创立的硬件公司,目的不仅是为了获得顶级的硬件设计能力,更是为了重新定义AI时代的个人设备。这标志着OpenAI意图打造一台以AI Agent为核心、而非传统App堆砌的手机,为ChatGPT构建一个能够深度整合与交互的物理载体。

Q文章如何描述OpenAI与苹果、微软合作关系的变化?

A文章描述,随着OpenAI向Agent领域深入,它与苹果、微软的合作关系变得微妙且边界重塑。过去,OpenAI是提供模型的供应商,合作是‘胜利’。但在Agent时代,当OpenAI需要系统权限和默认入口来执行任务时,就进入了苹果和微软的‘主权’范围。因此,合作演变为竞争与合作并存,例如OpenAI与微软重新调整协议,从独家变为非独家,以便更独立地发展自己的Agent和客户业务。

Lectures associées

Début de Warsh : le président de la Fed le plus au fait du Crypto de l'histoire apportera-t-il des surprises ou des chocs au marché ?

**Résumé :** Kevin Warsh, nouveau président de la Réserve fédérale américaine, s'apprête à tenir sa première conférence de presse monétaire. Sa nomination est historique : il est le premier président de la Fed à détenir personnellement des actifs numériques (investissements indirects dans Solana, dYdX, etc.), montrant une compréhension unique du secteur. Son dilemme est majeur : il doit faire face à une résurgence de l'inflation, qui exige une politique monétaire stricte (position "de faucon"), tout en répondant aux pressions politiques pour des baisses de taux. Parallèlement, son attitude envers les crypto-actifs diffère fondamentalement de celle de son prédécesseur. Il ne les considère pas comme de simples actifs spéculatifs, mais plutôt comme un "bon policier" pour la politique économique et une composante de la compétitivité américaine. Son impact potentiel sur le marché crypto s'articule autour de trois axes : 1. Un changement de paradigme réglementaire, passant de la prévention à l'intégration et à l'innovation. 2. Une reprixation des actifs liée aux taux d'intérêt, où sa clarté de communication pourrait réduire la prime d'incertitude. 3. Une légitimation accrue pouvant attirer les capitaux institutionnels traditionnels. Deux scénarios principaux sont envisagés pour sa première intervention : * **Scénario "Surprise"** : Un ton modéré ("de colombe") sur les taux combiné à des signaux favorables à l'innovation numérique pourrait booster le marché. * **Scénario "Choc"** : Un message excessivement restrictif sur les taux pourrait entraîner une vente généralisée des actifs risqués, y compris les cryptos. Bien qu'il ait dû vendre ses actifs crypto pour des raisons d'éthique, la compréhension intrinsèque de Warsh pour la technologie blockchain pourrait, à long terme, poser les bases d'une intégration plus structurelle des actifs numériques dans le système financier.

marsbitIl y a 3 h

Début de Warsh : le président de la Fed le plus au fait du Crypto de l'histoire apportera-t-il des surprises ou des chocs au marché ?

marsbitIl y a 3 h

XRP Ledger Lance le Rebranding XRPld Avec la Mise à Niveau Version 3.2.0

La version 3.2.0 du XRP Ledger (XRPL) est désormais disponible, introduisant une refonte majeure incluant le changement de nom du logiciel principal de « rippled » à « xrpld ». Cette mise à niveau se concentre principalement sur les améliorations des performances, de la sécurité et de l'évolutivité de l'infrastructure sous-jacente, plutôt que sur de nouvelles fonctionnalités utilisateur. Les principales avancées incluent des optimisations de mémoire pouvant réduire jusqu'à 40% l'utilisation de la mémoire serveur. Sur le plan de la sécurité, la modification `fixCleanup3_2_0` renforce plusieurs modules, notamment les coffres-forts à actif unique, le protocole de prêt, les échanges décentralisés et les jetons multi-usages. De nouveaux contrôles d'invariance garantissent la cohérence du registre après la suppression de comptes. Pour les développeurs, la mise à jour permet désormais de récupérer des informations sur les définitions du protocole et du serveur XRPL sans nécessiter de connexion active, facilitant ainsi la création de portefeuilles, d'explorateurs de blockchain et d'APIs. En termes d'évolutivité et de stabilité, les améliorations comprennent des tailles de bloc configurables, un stockage de base de données optimisé via nuDB, et le support optionnel de TLS/mutual TLS pour le serveur gRPC. Le port de peering par défaut est également passé du 51235 au 2459. Divers correctifs ont été apportés aux fonctions liées aux Market Makers Automatisés, aux paiements, aux séquestres de jetons et aux carnets d'ordres. Une note importante : les invariants de transaction ont été temporairement désactivés dans la v3.2.0 en raison d'un impact sur les performances, mais cela ne présente pas de risque pour la sécurité.

TheNewsCryptoIl y a 3 h

XRP Ledger Lance le Rebranding XRPld Avec la Mise à Niveau Version 3.2.0

TheNewsCryptoIl y a 3 h

L'AGI n'est pas l'arrivée, nouveau document de DeepMind : Vers l'ASI, le véritable progrès de l'IA ne fait que commencer

Si l'intelligence artificielle générale (IAG) était atteinte demain, quelle serait la prochaine étape ? Une étude de Google DeepMind suggère que l'IAG n'est pas un point final, mais une étape vers une superintelligence artificielle (ISA) dépassant les collectifs d'experts humains. L'étude distingue trois concepts : l'IAG (niveau médian humain), l'ISA (supérieure aux meilleurs collectifs humains dans presque tous les domaines) et l'IA universelle (limite théorique). Elle propose quatre voies potentielles vers l'ISA : 1. **Extension des ressources** : augmentation de la puissance de calcul, des données et des modèles. 2. **Évolution algorithmique** : améliorations incrémentales ou nouveaux paradigmes (apprentissage continu, utilisation d'outils, modèles du monde). 3. **Auto-amélioration récursive** : des IA plus performantes conçoivent la génération suivante, créant une boucle de rétroaction positive. 4. **Coordination multi-agents** : des systèmes IAG collaborant atteignent une intelligence collective supérieure. L'étude identifie six principaux goulets d'étranglement : 1. **Le mur des données** : les données humaines de haute qualité pourraient s'épuiser. 2. **Pressions économiques et ressources naturelles** : coûts énergétiques et matériels. 3. **Limites des paradigmes neuronaux actuels** : problèmes d'apprentissage continu, de raisonnement robuste, d'hallucinations. 4. **Difficulté croissante de la recherche**. 5. **Barrières à l'abstraction** : difficulté à former de nouveaux concepts fondamentaux. 6. **Régulation, gouvernance et réaction sociale**. Un défi crucial est l'évaluation des capacités de l'IA au-delà du niveau humain, nécessitant de nouveaux benchmarks. L'étude conclut que la progression vers l'ISA reste incertaine, soumise à des contraintes physiques et de ressources, et appelle à un effort de recherche interdisciplinaire pour mieux anticiper cette évolution.

marsbitIl y a 4 h

L'AGI n'est pas l'arrivée, nouveau document de DeepMind : Vers l'ASI, le véritable progrès de l'IA ne fait que commencer

marsbitIl y a 4 h

Trading

Spot
Futures

Articles tendance

Comment acheter LA

Bienvenue sur HTX.com ! Nous vous permettons d'acheter Lagrange (LA) de manière simple et pratique. Suivez notre guide étape par étape pour commencer votre parcours crypto.Étape 1 : Création de votre compte HTXUtilisez votre adresse e-mail ou votre numéro de téléphone pour ouvrir un compte sur HTX gratuitement. L'inscription se fait en toute simplicité et débloque toutes les fonctionnalités.Créer mon compteÉtape 2 : Choix du mode de paiement (rubrique Acheter des cryptosCarte de crédit/débit : utilisez votre carte Visa ou Mastercard pour acheter instantanément Lagrange (LA).Solde :utilisez les fonds du solde de votre compte HTX pour trader en toute simplicité.Prestataire tiers :pour accroître la commodité d'utilisation, nous avons ajouté des modes de paiement populaires tels que Google Pay et Apple Pay.P2P :tradez directement avec d'autres utilisateurs sur HTX.OTC (de gré à gré) : nous offrons des services personnalisés et des taux de change compétitifs aux traders.Étape 3 : stockage de vos Lagrange (LA)Après avoir acheté vos Lagrange (LA), stockez-les sur votre compte HTX. Vous pouvez également les envoyer ailleurs via un transfert sur la blockchain ou les utiliser pour trader d'autres cryptos.Étape 4 : tradez des Lagrange (LA)Tradez facilement Lagrange (LA) sur le marché Spot de HTX. Il vous suffit d'accéder à votre compte, de sélectionner la paire de trading, d'exécuter vos trades et de les suivre en temps réel. Nous offrons une expérience conviviale aux débutants comme aux traders chevronnés.

356 vues totalesPublié le 2025.06.04Mis à jour le 2026.06.02

Comment acheter LA

Discussions

Bienvenue dans la Communauté HTX. Ici, vous pouvez vous tenir informé(e) des derniers développements de la plateforme et accéder à des analyses de marché professionnelles. Les opinions des utilisateurs sur le prix de LA (LA) sont présentées ci-dessous.

活动图片