文|Sleepy
北京时间 2026 年 6 月 9 日凌晨,苹果的 WWDC 2026 如期而至。
在发布会上,它把 Siri 改名叫 Siri AI,公布了和 Google 的深度合作,用 Gemini 的模型能力训练自己的新一代基础模型,把 Private Cloud Compute 第一次延伸到了 Google Cloud 和 Nvidia 的 GPU 上。
它发布了五个 Apple Foundation Models,端侧最小 30 亿参数,云端最大的专为 Nvidia GPU 优化。几乎每一个日常 App 都被重写了一遍。Siri 还有了自己的独立应用,能保存对话,跨设备同步,有了记忆。
这是苹果这些年信息量最大的一场发布会。
驯化一个未来
苹果的 AI 故事,可以追溯到 2011 年秋天,iPhone 4S 发布会,Siri 第一次站到台前。
那时乔布斯已经病重,苹果正站在一个时代的交界处。Siri 像一个从科幻电影里跑出来的小东西,你问天气,问餐馆,叫它设闹钟,它会用一种略带机械的口气回答你,你第一次觉得手机不只是一块没有温度的玻璃。
Siri 脱胎于 SRI International 的 CALO 项目,原本是美国国防高级研究计划局资助的军事级人工智能助手。2010 年苹果将它收入囊中,据 TechCrunch 报道这笔交易可能超过两亿美元。一年后 Siri 随 iPhone 4S 亮相,苹果说它能理解自然语言,能像个人助理一样替你办事。
那一刻,苹果拿到了全世界最好的个人智能入口。然后它耽误了十几年。
今天回看,Siri 最早改变的是人和机器说话的姿势。2011 年,iPhone 正在把手机从通信工具变成个人计算设备,App Store 重新定义了软件分发,移动互联网从 PC 桌面迁进掌心。Siri 出现在一个上升期的浪尖。可进了苹果之后,它很快从一个有野心的个人助理变成了一个听话的语音遥控器。
苹果骨子里信奉封闭和控制。但一个真正的个人助理必须接入更多服务,理解更多上下文,容忍更多不确定性。而不确定性意味着出错,意味着隐私风险,意味着苹果最不擅长应对的失序。
于是 Siri 只被允许做确定性任务,像一个被驯化的未来。它有名字、有声音、有人格包装,唯独缺少真正人格所需要的主动性和记忆。用户最初被它惊艳,后来拿它开玩笑,再后来干脆不怎么用了。
苹果最早把「个人助理」放进了手机,又最早把它关了起来。
今天全行业都在做的 Agent,回头看,2011 年的 Siri 几乎就是它的原型。可以说苹果是最早做出 Agent 雏形的公司,最后反而成了最晚把它做完的那一个。
不像 AI 的 AI
Siri 没长大的这些年,苹果的 AI 止步不前了吗?
答案恰好相反。苹果做了很多 AI,只是做得太不像 AI 了。
如果按发布会声量算,苹果像是 2024 年才突然开始认真讲 AI。可如果沿着技术路径倒着看,苹果从十年前就在行动了。
它在 2015 年连续收购了两家公司,一个补自然语言对话,一个探索在手机上直接跑深度学习。同年 WWDC 讲 Proactive Assistant,试图让系统在用户开口之前就给出建议。这个想法很超前,但在当时的技术条件下更像一句口号。
第二年推出 SiriKit,有限地把 Siri 向开发者打开一条缝,又公开讲了 Differential Privacy,表态要在保护个体隐私的前提下从大规模数据中学习。2017 年 iPhone X 带来 Neural Engine,Face ID 和相机开始依赖设备端机器学习,苹果同时推出 Core ML 让开发者在苹果设备上跑模型,又买下了 Workflow,也就是后来的快捷指令。
这是一组很苹果的答案。它又想要 AI,又不想像 Google 那样把赌注押在云端和海量个人数据上。又要开发者,又不想让 Siri 变成一锅乱炖。所以苹果选了一条最难也最慢的路,做端侧,做隐私,做系统集成。
到了 2020 年前后,苹果又接连买了几家做低功耗边缘 AI 和语音理解的公司。同年 M1 芯片发布,16 核 Neural Engine 登上 Mac,端侧 AI 算力从口袋里的手机一路推进到电脑。第二年 Live Text 和 Visual Look Up 落地,照片里的文字可以直接复制,相机能认花认草,更多语音请求不出本机就能处理。
苹果这十几年确实没推出一个单独的 AI App,但它确实让手机变聪明了。
选择走这条路有它的道理。手机上的 AI 不只是答题机器,它要看照片,听语音,理解联系人,调用 App,感知电量、位置和时间。它最好能在没网的时候也做一点事,最好不要每个请求都把用户的生活打包上传到云端。苹果的硬件控制力让它有资格走这条路。
可局部聪明和整体智能之间,隔着一道很深的鸿沟。苹果擅长把技术拆成可靠的零件,可生成式 AI 要求它把零件拼回一个整体。
这些零件安安静静地埋在系统里,等着一个契机。
契机没有先来。ChatGPT 先来了。
2022 年底 ChatGPT 出现的时候,苹果并非毫无准备。Tim Cook 在多个场合反复强调 AI 和机器学习是苹果产品多年来的核心技术,Bloomberg 2023 年也披露苹果内部有 Ajax 大模型框架和内部 Chatbot 项目。
可问题不在苹果手里有没有牌,问题在于牌桌上的规则变了。
ChatGPT 把用户的注意力从「功能」拉到了「能力」。用户开始默认手机上必须有 AI,然后去比谁更强。当 ChatGPT 已经能把一段乱七八糟的想法整理成一篇邮件的时候,Siri 还在说「我在网上找到了这些内容」。
2024 年 WWDC,苹果把 Apple Intelligence 摆上台面。写作工具,通知摘要,照片搜索,Siri 个性化理解,ChatGPT 接入。苹果终于承认只靠自研模型,至少在 2024 年,它追不上用户的期待。但它画的饼最后没能按宣传的节奏落地。
请 Google 当家教
Apple Intelligence 延期的背后,不只是技术跟不上,而是整个 Siri 团队的结构跟不上这一轮 AI。
多家媒体确认,苹果原 AI 负责人 John Giannandrea 退场,Craig Federighi 接管 AI 方向,Vision Pro 负责人 Mike Rockwell 被调来执掌 Siri 团队,大量 Siri 工程师被送去学 AI 编程工具。这不是一次体面的轮岗,苹果内部已经意识到,靠原来的人和原来的节奏,赶不上趟了。
2026 年 1 月苹果和 Google 发表联合声明,苹果将借助 Gemini 技术为 iPhone 和其他产品定制 Apple Intelligence 功能。据报道苹果计划每年向 Google 支付约 10 亿美元,使用一个 1.2 万亿参数级别的定制 Gemini 模型来支撑 Siri 改造。苹果此前也测试过 OpenAI 和 Anthropic 的模型,最后还是选择了 Google。
这和 2024 年的 ChatGPT 接入完全不同。那一次 ChatGPT 更像是 Siri 答不上时用户授权请的救兵,品牌是 OpenAI 的,界面是弹窗式的。这一次 Gemini 直接进了底层,变成苹果新一代基础模型的一部分。
关键动作是蒸馏。Google 给了苹果对 Gemini 的完整访问权限,苹果在 Google 数据中心里用大模型生成高质量的答案和推理过程,再拿这些结果去训练更小更便宜能在 iPhone 上跑的模型。
WWDC 前一天苹果公布的技术文章把这套合作包装成第三代 Apple Foundation Models,和 Google 定制合作开发了五个模型。端侧有 30 亿参数的 AFM 3 Core,还有 200 亿参数但按请求只激活一部分的稀疏模型 AFM 3 Core Advanced。云端有 AFM 3 Cloud 和图像模型 ADM 3 Cloud,以及最强的 AFM 3 Cloud Pro。
更现实的变化在算力上。端侧模型再聪明也无法完成所有任务,苹果 Private Cloud Compute 的基础设施难以独自承载完整的 Gemini 级推理,部分请求会跑在 Google Cloud 的 Nvidia GPU 上。苹果随后确认 PCC 首次扩展到苹果自有数据中心之外,技术栈覆盖了 Nvidia Confidential Computing、Intel TDX 和 Google Titan 芯片。苹果强调仍由自己控制 PCC 软件,设备只信任经过苹果加密批准的程序,相关二进制文件也会对安全研究人员开放检查。
苹果没有真正放弃控制权,但放弃了全自研的体面。
骨头是借来的
理解苹果在 AI 时代的位置,要先看清它最核心的资产是什么。
不是芯片,不是模型,是设备。设备里装着相册、邮件、日历、地图和支付,承载着大量普通人的生活碎片。哪个 AI 能调动这些碎片,它就不只是一个聊天机器人,它就能成为真正的个人智能中枢。
苹果很早就开始为这个中枢铺路。2017 年买下的 Workflow 后来变成快捷指令,和 Siri 以及系统自动化深度绑定。2022 年推出的 App Intents 让第三方应用把自己的能力暴露给系统入口。到了 Apple Intelligence 时代,这些接口就成了 AI 调用真实世界动作的手和脚。
有了这些接口,OpenAI 可以进来,Gemini 也进来了,中国市场将来可以找本土伙伴。但它们进来的方式不是直接接管 iPhone,而是被装进苹果的权限框架和隐私规则里。
苹果最怕的不是谁的模型比自己强。它怕的是用户开始绕过系统,直接把生活交给另一个入口。如果有一天用户每天打开的不是 App 而是一个能替他调度一切的 AI 助手,苹果就沦为一个做工不错的壳。
所以从此以后,Apple Intelligence 这几个字里的 Apple 更多代表产品控制权,而不再代表完整的技术主权。皮肤是自己长的,衣服是自己裁的,可骨头是借来的。Google 提供了骨架,Nvidia 提供了关节,苹果要做的是让这副身体穿上自己的衣服走出去。
Google 从这笔交易里得到的是一次巨大的背书,连苹果都承认 Gemini 的底层能力更可靠。Nvidia 得到的是另一个证明,哪怕苹果有最强的消费级芯片和自研服务器的野心,到了前沿推理和复杂 agent 任务面前,还是绕不开 GPU 云。
可骨头借得越多,身体就越不完全是自己的。每一根借来的骨头背后都有供应商的商业算盘、监管和技术节奏。万一哪天有人要把骨头抽回去,苹果能不能站得住,这个问题它暂时还不需要回答,但迟早要回答。
住进系统里的新房客
普通人不关心模型参数。普通人关心的是手机能不能少烦他一点。
苹果在 WWDC26 台上说:「There are times when you expect more from Siri.」
对苹果来说这几乎算是道歉了。
然后它试图让你看到一个不一样的早晨。
你醒来,屏幕上堆着二十条通知。过去你得一条条划掉,现在系统已经替你分好了轻重缓急,老板发的排在前面,广告和促销被收拢成一行灰字。你打开邮件,一封长长的工作邮件已经被摘成了三句话,你决定回复,Siri 根据你平和这个人说话的语气替你起了个草稿。你想起下午要给一个商家打电话退货,还没拨出去,系统已经从你前两天的邮件里翻出了订单号贴在通话界面上。
这就是苹果想讲的故事,一层铺在系统底下的智能,替你省掉那些每天重复的认知杂活。少读一点废话,少找一会儿文件,少被通知打断一次。
为了讲好这个故事,苹果几乎重做了 Siri 的入口。iPhone 上它被放进灵动岛,下拉就能对话。iPad 和 Mac 上跟 Spotlight 合在一起。它有了独立的 App,能保存和继续过去的对话,通过 iCloud 跨设备同步。苹果想让 Siri 变成一个住在系统里的 AI 助手,有记忆有上下文,但又尽量不让它看起来像 ChatGPT。
视觉也是一个重要的方向。相机里新增了 Siri mode,对着食物拍一下就给出营养信息,对着看不懂的东西拍一下就能识别和搜索。系统级听写不只是语音转字了,还会自动加标点调格式,把口语变成能直接发出去的文本。
开发者侧也在铺路。苹果开放了 Core AI 框架,让第三方在设备上加载自己的模型。App Intents 升级后 Siri 更容易理解第三方应用。Foundation Models Framework 不再只调用自家端侧模型,还支持接入 Claude 和 Gemini 这些外部供应商。苹果在给整个生态铺一条路,以后 Siri 要跨 App 做事,开发者必须把内容和动作交给系统去理解。
这些规划如果落地,苹果 AI 就不再只是「会聊天的 Siri」。
只是这次苹果比过去谨慎了许多。Siri AI 今年晚些时候才以 beta 形式向用户开放,英语先行。而同一个 Apple Intelligence 到了中国,很可能已经不是同一个产品。
中国用户看苹果 AI,基本上也就是图一乐。发布会是热闹,功能是好看,但中国地区「暂不支持」。
中国市场对生成式 AI 有备案、内容安全和数据本地化一整套规矩。苹果需要找本土模型合作方,需要过监管审批。Apple Intelligence 在中国不只是晚几个月上线的问题,它从底层就可能不是同一套东西。
美国用户看到的是自研模型加 Gemini 的组合,中国用户看到的可能是苹果系统权限、本地云服务、本土模型和监管要求共同揉出来的版本。它们都叫 Apple Intelligence,但实际能力和可触达的边界可能完全不同。
iCloud 中国大陆服务由云上贵州运营。云盘保存文件,AI 要理解文件;云盘存照片,AI 要看懂照片;云盘同步备忘录,AI 要从备忘录里抽出你的计划、习惯和人际关系。这些数据在 AI 时代有了全新的用法,自然也要面对不同分量的监管。
更现实的威胁来自竞争。国产手机厂商在端侧大模型、中文助手和影像 AI 上动作很快。对中国用户来说,花一两万买一台新 iPhone,结果最核心的 AI 功能用不上,那不如换个品牌。
中国市场的日常场景对苹果又格外棘手,微信、支付宝、美团、抖音、网约车、政务服务、医院挂号,这些才是很多人每天真正用手机处理的事。一个 AI 助手如果进不了这些场景,看不懂群聊、票据、验证码和各种只有本地人才能秒懂的表达,它就很难称得上「智能」。
理解一个人
Apple Intelligence 还有个问题,它并没有覆盖所有的 iPhone。
iOS 27 可以覆盖到 iPhone 11 和第二代 iPhone SE,但 Apple Intelligence 至少要求 iPhone 15 Pro 及更新机型、M 系列 iPad 和 Mac。最强的端侧模型还要求更高,iPhone 17 Pro、iPhone Air、至少 12GB 统一内存的 M4 iPad 或 M3 Mac。
过去几年换机周期越拉越长。屏幕够好,拍照够用,很多人不再每年换手机。AI 也许能成为苹果重新刺激换机的理由,端侧 AI 确实需要更强的芯片和更大的内存,硬件门槛不可避免。一个被包装成「更懂你」的个人能力,最后却变成一道价格门槛。
苹果过去十几年不断追问「iPhone 之后是什么」,试过手表,试过耳机,试过电视,试过那个传了十年最后被砍掉的造车项目。2024 年造车团队的部分员工被转入生成式 AI 团队。
AI 来得正好,它给了苹果一个不用从零造新硬件品类的下一代故事,改造已经握在十几亿用户手里的设备就行。iPhone 之后也许还是 iPhone,只是它必须变成另一种东西。
Tim Cook 的接班人 Ternus 负责的硬件产品未来的规划暗示了苹果的下一步。他在推进一组未发布的 AI 设备,带摄像头的眼镜和可穿戴设备,用计算机视觉理解周围环境。如果这些产品成真,Apple Intelligence 会从手机继续往外蔓延,手机、耳机、眼镜和家庭中枢都可能成为新的感官。
可不管感官怎么延伸,核心问题始终是同一个。
人和手机的关系,大多数时候不是坐下来长谈,而是在极琐碎的场景里互相打扰。你在赶地铁,孩子在哭,老板在催,屏幕上堆着 20 条通知。Apple Intelligence 对普通人最具体的意义不是万能助手,而是让手机开始替你分担一部分认知杂活。少读一点废话,少找一会儿文件,少被通知打断一次。
苹果一直把自己塑造成站在用户这一边的公司。它说隐私是基本人权,说设备属于用户,说技术应该服务于人。AI 时代,这套话会遇到真正的考验。因为一个系统一旦开始理解你,就不只是在保护你的数据,它也在塑造你的行动。它给你摘要、给你建议、替你筛选信息、替你判断什么重要什么可以忽略。
个人智能的难点从来不只是智能,还有「个人」。一个人的生活不是数据库,里面有情绪、误会、不体面,有不想被任何系统看见的角落。AI 要进入这些地方,就不能只拿效率当通行证。
石黑一雄在《克拉拉与太阳》里写过一个人工智能陪伴者克拉拉。她花了全部的存在去理解一个女孩,学会了观察光线的变化,学会了读懂表情和沉默,学会了在该安静的时候安静。
但整本书最动人的地方在于克拉拉最后终于明白那个女孩身上有她永远触碰不到的部分。她不是不够聪明,而是她懂得一件事,理解一个人和拥有一个人的数据是完全不同的两件事。
苹果花了十五年才走到承认 Siri 不够好这一步。WWDC 这一夜它向 Google 借了模型,向 Nvidia 借了算力,向用户借了又一年耐心。它证明了自己愿意低头,但低头只是开始。
接下来它要学的,是克拉拉早就知道的那件事。不是怎么变得更聪明,而是在走进一个人的生活之后,知道在哪里停下来。
-END-















