Gemini 3.5来了！今夜，谷歌亲手淘汰谷歌

链捕手发布于2026-05-20更新于2026-05-20

文章摘要

在谷歌I/O 2026大会上，谷歌发布了多项重磅AI进展。核心产品包括全新的全能多模态模型“Gemini Omni”，它可以接收任意形式的输入（如图片、音频、视频、文字）并生成高质量视频，且能通过聊天方式进行实时编辑，其生成内容在物理逻辑和场景连贯性上表现突出。同时，谷歌推出了新一代旗舰模型“Gemini 3.5 Flash”。该模型在编码、智能体任务等多项基准测试中，性能全面超越了前代旗舰Gemini 3.1 Pro，输出速度极快，并对标甚至超越了竞争对手的同类模型。与之配套的“Antigravity 2.0”代理开发平台也升级为独立桌面应用，现场演示了由93个子代理在12小时内从零编写出一个功能完整的操作系统内核。此外，谷歌发布了个人AI代理“Gemini Spark”。它由Gemini 3.5驱动，深度集成谷歌办公套件，能够7×24小时在云端运行，根据用户指令自动跨应用（如Gmail、Docs、Sheets）处理复杂任务，如汇总信息、起草邮件、规划活动等。其他重要发布还包括：Gemini App改版并改为算力计费、AI Ultra订阅计划调整以及谷歌搜索25年来最大升级（接入Gemini 3.5 Flash）。整场大会展示了谷歌在实现全模态理解与生成、以及全天候自主智能代理方面的重大突破，标志着AI技术正朝着更强大、更自主的方向加速演进。

作者：新智元

谷歌 I/O 2026 大会，火力全开！

刚刚，劈柴和 Demis Hassabis 同台登场，把攒了半年的大招一口气全部亮了出来。

没有一丝悬念，今晚最大的主角，Gemini Omni 正式亮相！

作为一个真正「全能」的大模型，Omni 可以接收任意形式的输入，生成任意内容。并且首发支持视频输出，堪称「视频版 Nano Banana」。

今晚的另一个高潮，属于 Gemini 3.5 Flash。

在几乎所有的基准测试中，3.5 Flash 都实现了对自家前代旗舰 Gemini 3.1 Pro 的碾压。输出速度也直接翻倍，对比 GPT-5.5 和 Opus 4.7 更是快了 4 倍有余。更强的 3.5 Pro，则会在下个月发布。

此外，亮相的还有一大波重磅新品：

Antigravity 2.0：全新独立桌面应用，从 IDE 进化为 Agent 开发平台
Gemini Spark：个人 AI 特工，7×24h 云端运行
Gemini App 改版：代号 Neural Expressive，改为算力计费
AI Ultra 订阅计划：新增 100 美元版本，最高档从 250 降至 200 美元
谷歌搜索 25 年最大升级：接入 3.5 Flash，新增智能搜索框、自动生成 mini 应用等

......

毫不夸张地说，这场 I/O 的干货密度，堪称历年之最。

Gemini Omni 首发：一个「全能」 AI 诞生了

正如预热视频疯狂暗示的那样，万众期待的 Gemini Omni 终于来了。Hassabis 亲自登台宣布，「我们正迈出下一个重要的一步——Gemini Omni，这是一个可从任何输入创建内容的全新模型」。

这个排面就说明了一切。谷歌这一次要打造的，是一个「全能」的 AI 创作引擎。它把 Gemini 的智能与最强的生成式 AI 融为一体，在世界理解、多模态和编辑三个维度上，全部拉满。直白讲，给到图片、音频、视频、文字的任意组合，它就能生成一段高质量视频。而且，可以用聊天的方式编辑视频。

更关键的，Omni 不只是「看起来像」，它真的在理解物理世界。Hassabis 的原话是，以前的系统在模拟重力、动能这些概念时经常翻车，但 Omni 实现了一个「阶跃变化」。它把 Gemini 的「世界知识」和「推理能力」注入进了视频生成。

给它一句 prompt「用粘土动画解释蛋白质折叠」，生成的视频里氨基酸链折叠成 α 螺旋和 β 折叠的每一步都科学准确，视觉上是精致的定格动画。

又比如为英文 26 个字母配置对应物体。C 是水豚（Capybara），D 是迪斯科球，L 是熔岩灯。Omni 不是在拼贴素材，它真的在把语言、图像和语义联结在一起。

不得不说，从逼真到有意义，这一步跨得太大了。

在台上，Hassabis 掏出一段自拍视频开始现场魔改。手掌上随手画的圈变成了黑洞，傍晚散步的街道变成了赛博朋克场景。一句话重写画面，一句话改变世界。任何东西都可以成为创造全新现实的画布。再比如，自拍掌中玩火，一张纸画了一个圈立即变黑洞，各种脑洞大开玩法都可实现。

而且，这不是一次性生成完事。你可以接着聊。Gemini Omni 输出的视频，角色保持一致，物理逻辑成立，场景记忆连贯。

从一段原始的演奏画面开始。第二轮，「把小提琴手传送到这张图片的环境里」，附一张雪山草地的参考图，场景瞬间切换，动作、光影全部适配新环境。
第三轮，「把镜头切到小提琴手的肩膀后方」，视角旋转，但演奏动作和音乐完全连续。

不论场景如何变幻，画面的主体都不会崩坏。

更让人细思极恐的是，Omni 的输入灵活性。图片、文字、视频、音频，任何参考物都可以混合输入，生成一个连贯的输出。你甚至可以创建自己的 Avatar，让 AI 版的你出现在任何场景中，说你的声音、做你没做过的事。

目前，Omni Flash 已正式上线，API 版则会在未来几周开放。而更强的 Omni Pro 也在路上了。凭借着谷歌强大的整合能力，Omni 首发就接入了 Gemini App、Google Flow 和 YouTube Shorts，YouTube Shorts 用户甚至可以免费用。

Flash 干翻 Pro：3.5 重写了「旗舰」的定义

Gemini Omni 之后，I/O 大会本场另一重头戏，就是全新旗舰 Gemini 3.5 Flash 的发布。谷歌给它的定义是，迄今为止最强的编码、智能体模型。

现场，劈柴亲口宣布，「3.5 Flash 在几乎所有基准测试中，全面胜出 Gemini 3.1 Pro」！要物，3.1 Pro 可是谷歌三个月前才推出的旗舰模型，现在，一个 Flash 级别的模型就把它碾了。

没想到，谷歌竟在如此短时间内，交出了亮眼的成绩单：

Terminal-Bench 2.1（编码）：76.2%
GDPval-AA（真实世界 Agent 任务）：1656 Elo
MCP Atlas（大规模工具使用）：83.6%
CharXiv Reasoning（多模态理解）：84.2%

以上四大基准测试，相较于 Gemini 3.1 Pro，3.5 Flash 堪称断层跃迁。在速度方面，3.5 Flash 独占一个象限，289 tokens/秒，比其他前沿模型快 4 倍还要多。另外，3.5 Flash 在一部分基准测试中，性能媲美，甚至是足以碾压 GPT-5.5、Claude Opus 4.7。不得不说，3.5 Flash 又快又强，几乎没有对手。

参数太抽象，不如看看真实的极限演示。只需一瞬间，3.5 Flash 就能消化一篇天书般的学术论文，并写出一个带有完美交互的可视化网站。在智能体任务中，通过 Antigravity，它可以完成多步工作流，自动对铺屏的资产完成分类和命名。亦或是，利用两个 Agent，在短短六小时内复现了 AlphaZero 论文，并编写出一款可完整运行的游戏。

93 个 Agent 造出 OS，仅 12 小时

可以看到，3.5 Flash 这一切能力的实现，全部是借助全新 Antigravity 2.0 实现的。今天，谷歌 Agent 开发平台 Antigravity 升级到了 2.0，从 IDE 变成了独立桌面应用，彻底拥抱 Agent-first 设计。

Varun 上台给出一个让全场屏息的 Demo。他让 Antigravity 搭载 3.5 Flash，从零开始构建一个操作系统。93 个子 Agent 并行工作，发出超 15000 次模型请求，处理 26 亿个 token，12 小时后，一个完全空白的项目变成了功能完整的 OS 内核。调度程序、内存管理、文件系统，每一行代码都是 Agent 写的，Agent 测的，Agent 审计的。API 费用不到 1000 美元。

接着，他试着在这个 AI 写的操作系统上运行 DOOM。第一次尝试失败了，缺少视频和键盘驱动。于是他当场在 Antigravity 2.0 里输入修复指令，Agent 开始自动补写驱动代码。等了一会儿，DOOM 的画面出现在屏幕上，全场沸蓬。

总结一下，Antigravity 2.0 带来核心升级包括：

子 Agent 可以动态生成，主 Agent 把任务拆成子任务分配出去，互不干扰地并行跑；
异步任务管理让长耗时操作不再阻塞主线程；
Scheduled Tasks 可设「定时任务」让 Agent 自动执行，比如每天检查一次 PR 状态、每小时跑一次健康检查脚本。
新的斜杠命令：/goal 让 Agent 一口气跑完，/grill-me 反过来让 Agent 搞清楚需求再动手，/browser 显式控制浏览器使用。

不过，这些都是内部已经跑通的能力。谷歌内部用 Antigravity 处理 token 的速度，3 月份是每天 5000 亿。如今，每天狂飙 3 万亿。而且，这个 12 倍加速版的 Flash，今天起在 Antigravity 里就能用了。

3.5 Flash 同时成为 Gemini App 和 Google 搜索 AI Mode 的默认模型，面向全球所有用户。开发者通过 Antigravity 2.0、Gemini API、Google AI Studio 调用。企业用户通过 Gemini Enterprise Agent Platform 接入。更炸裂的是，3.5 Pro 正在内部测试中，下个月发布。

7x24h 个人管家：谷歌 Spark 终于来了

今晚第三大发布，当属于 Gemini Spark！劈柴给它的定位非常明确：你的个人 AI Agent。即使合上笔记本电脑，它也不停歇。它跑在云端的专用虚拟机上，可以实现 7x24 小时在线。

Gemini Spark 由 Gemini 3.5 + Antigravity 框架驱动，深度整合谷歌「办公全家桶」。产品副总裁 Josh Woodward 上台演示了两个场景，直接让全场陷入疯狂。

第一个是工作场景：输入一条指令，「帮我起草一封给团队的邮件，汇总过去一周关于 Gemini Live 发布的所有信息」。Spark 自动跨 Gmail、Docs、聊天记录抓取信息，还调用了 Woodward 自己编写的一个「ghostwriter」技能，让邮件自动匹配他的个人语气。整个过程在后台完成，人类只需审核和发送。没错，Spark 支持自定义技能（skills），让它学会你的口吻、你的偏好、你的工作方式。

第二个是生活场景：规划一场街区派对。Spark 收到任务后一步步执行。它创建了一个 Google Sheets 的 RSVP 追踪表，直接连接 Gmail，谁回复了自动更新。给没报名的邻居，Spark 自动起草催促邮件，生成草稿等确认后再发。然后，它还生成了一个 Google Slides 的宣传 deck，连街区里要放充气城堡的信息都写进去了。全程没有打开任何一个 App。

不仅如此，Spark 还具备了强大的语音输入能力。现场，Woodward 掏出手机，直接用语音甩出三个任务：「找到所有跟 Sundar 的会议标成亮粉色」「给新邻居 John 写邀请函加入 block party 名单」「创建一个文档列出学年结束前要为孩子做的事，按截止日期排序」。

语音直接转成了文字指令，Spark 自动把一段连续的语音拆成了三个独立任务线程，在后台并行执行。

定价方面，AI Ultra 订阅每月 100 美元可用 Spark Beta。最高级 Ultra 计划从 250 美元降到了 200 美元。Spark 则会在下周率先对美国 AI Ultra 用户开放 Beta 版试用。

这一夜，谷歌撕开了 ASI 入口

回过头看这场 I/O，真正让人后背发凉的，不是某一个产品。是所有能力同时到位。

全模态理解，全模态生成，全天候在线 Agent——这三块拼图，谷歌在一夜之间全部拼上了。Omni 把一句话变成一个世界，不需要人类提供任何素材；93 个 Agent 从零造出操作系统，不需要人类写一行代码；Spark 7×24 小时替你工作，不需要人类打开一个 App。

当 AI 不再需要人类「喂料」，而是自己理解、自己决策、自己执行、自己迭代——这条路的终点，叫 ASI（超级智能）。

没有人能给出确切的时间表。但今晚的 Google I/O，让所有人意识到一件事：通往超级智能的路上，已经没有「技术上做不到」这个障碍了。剩下的，只是工程部署的速度。半年前我们还在争论 AGI 是不是泡沫。半年后，谷歌已经在用 Agent 写操作系统了。这个行业的加速度，已经超出了人类直觉能感知的范围。

参考资料：

https://youtu.be/wYSncx9zLIU
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-5/
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni/
https://antigravity.google/blog/introducing-google-antigravity-2-0
https://antigravity.google/blog/google-io-2026-feature-deep-dive

编辑：桃子摩西

你可能也喜欢

对话达利欧：当下正处AI泡沫中，投资组合的1%是比特币

桥水基金创始人瑞·达利欧在访谈中指出，当前AI热潮已显现经典泡沫特征，高估值与过度借贷可能在未来经济变故下引发资产抛售与衰退。他强调，这背后是更宏大的“大周期”在起作用，即贫富差距、政府债务高企及地缘政治变动共同驱动的约80年循环，目前全球秩序正处力量交替的衰退阶段。为应对不确定性，达利欧建议个人投资者进行多元化资产配置，包括股票、黄金、债券等，而非仅持有现金。他透露自己投资组合中约有1%为比特币，认为其具备硬通货特性，但个人更偏好实物黄金。对于AI的影响，他认为这将在更高层面替代人类思维，加剧贫富差距，而善于运用人类情感、直觉并与AI协作的人将更具优势。谈及英美热议的“财富税”，达利欧认为操作困难，可能引发资本外流或刺破泡沫。关于世界秩序，他预判未来可能走向区域化发展，而非单一主导。最后，他指出美国卷入伊朗冲突暴露了其军事与经济影响力的脆弱性，类似历史上大英帝国的衰落征兆。

marsbit3小时前

marsbit3小时前

单日 7.2 万亿韩元，外资周五净买入创纪录！华尔街：韩股资金面逆风已经消退

韩国股市资金面出现实质性转机。7月31日，外资单日净买入KOSPI股票约7.2万亿韩元，创历史最高纪录，标志着持续数月的外资净流出趋势发生根本逆转。7月外资净卖出规模已大幅收窄至9.8万亿韩元，远低于5、6月的水平。同时，国内养老金及基金在7月转为净买入1.0万亿韩元。监管层面，韩国金融服务委员会自7月31日起收紧散户投资单股杠杆ETF的门槛，新规实施后相关产品成交量已降至月均水平的约50%，有助于平抑市场短期波动。花旗研究维持KOSPI年内目标点位10000点不变，认为资金面逆风正在消退。支撑因素包括存储芯片行业基本面稳健、KOSPI估值处于历史低位、韩国经济基本面强劲以及政策环境友好。花旗还指出，若有必要，韩国金融当局存在提供流动性支持的可能性，为市场提供了政策底部支撑。

marsbit3小时前

marsbit3小时前

突发！OpenAI下一代AI攻克10项菲尔兹奖级难题

OpenAI发布其下一代AI模型Astra，在数学领域取得轰动性突破，一举攻克了10个长期未解的难题，其中多项成果被专家评价为“菲尔茨奖级别”。这些突破涵盖了高维几何、群论、算子代数等多个核心数学分支，相关论文长达249页。最引人注目的成果包括：构造出首个无限有限呈现的“非sofic群”，否定了自1999年提出相关猜想；在高维球体堆积问题上，打破了自1978年以来人类未能突破的理论极限；推翻了菲尔兹奖得主Alain Connes提出的“刚性猜想”，构造出无限多不同构但生成相同冯·诺依曼代数的群。据称，生成这10项证明的总计算成本仅约2000美元。所有证明均通过了Lean 4形式化验证，确保了其严密性。这一系列成果被视作AI在深度推理和数学直觉上的重大飞跃，标志着AI已成为数学研究领域的强大工具。

marsbit4小时前

marsbit4小时前

如何让自己变得让人工智能永远也无法取代

面对人工智能的冲击，许多人担心工作被取代。然而，真正的威胁在于个人对他人和系统的依赖，以及由此产生的“薪资奴役”——即为生存而从事无意义、枯燥的工作。摆脱这种困境的关键，不是抵制技术，而是成为拥有高自主性的“不可受雇”个体。文章提出了成功抵御AI替代的五个核心要素：自主性（主动行动的能力）、品味（判断事物价值的经验）、说服力（让他人关注你工作的能力）、毅力（坚持并从错误中学习）和迭代（根据反馈持续改进）。这些能力无法仅通过理论学习获得，必须通过实践来培养。要启动转变，首先要彻底改变环境，重塑身份认同。其次，应选择一个能获得真实、快速反馈的实践领域，例如创业。在众多技能中，内容创作（媒体）比编写代码更具优势，因为其价值是主观的，需要独特的审美和判断力，这正是AI目前难以完全复制的。具体行动上，可以从三个步骤开始： 1. **挖掘原始素材**：反思自己长期痴迷的知识领域、轻松解决的难题或童年被压抑的兴趣，找到独特的个人经验。 2. **确立反向思考主轴**：找出你坚信但主流观点错误的地方，或行业内普遍忽视的“皇帝新衣”，形成独特的批判性视角。 3. **立即发布**：将前两步的思考融合，撰写并发布第一个核心内容（如帖子、视频），勇敢接受真实世界的反馈，并在此基础上持续学习和迭代。最终，抵御AI的关键在于构建一份与自身身份深度契合的毕生事业，通过持续的内容创作和真实互动，建立无法被自动化取代的独特价值和影响力。行动，从今天发布第一个想法开始。

marsbit5小时前

marsbit5小时前

通过掷骰子离线保管比特币密钥：并非人人愿意为之

文章探讨了通过投掷骰子生成比特币钱包种子短语的安全方法及其现实挑战。核心观点如下： **1. 骰子提供物理熵源** 骰子结果由众多微小变量决定，理论上虽可预测，但实践中无法被攻击者复制或计算，从而提供高质量的随机性。每个六面骰子投掷约产生2.585比特熵，50次投掷即可满足典型12词助记词（128比特熵）的安全需求。 **2. Coldcard漏洞事件凸显手工熵源的价值** 近期Coldcard硬件钱包因固件漏洞导致其内部随机数生成器存在缺陷，致使约1128枚比特币被盗。但那些**完全**通过足量骰子投掷生成种子短语的用户未受此漏洞影响，因为他们的主密钥未使用有缺陷的生成器。 **3. 重要警示：手工种子并非万能保护** 安全研究员指出，即使用户使用骰子生成了安全的种子，若他们使用了Coldcard的其他功能（如生成纸钱包、克隆密钥、共享签名密钥、密码等），这些**衍生密钥**仍可能调用有漏洞的随机数生成器，从而存在风险。安全种子不保证设备生成的所有秘密都安全。 **4. 手工生成熵源的现实局限性** 尽管数学上可靠，但该方法对大多数用户并不友好： * **过程繁琐易错**：需投掷50-99次，精确记录，任何输入错误都会导致钱包完全不同。 * **引入新风险**：用户可能在记录、转换过程中泄露信息，或使用有偏的骰子/投掷方式。 * **用户体验差**：难以想象大规模推广需要用户手动投掷近百次骰子。安全措施需适应现实生活场景和普通用户的知识水平。 **5. 给用户的建议** 受影响的Coldcard用户应： * 更新固件至最新版。 * 检查是否使用过有漏洞的功能生成了次级密钥或密码，如有则需立即更换。 * 考虑采用多签方案，使用不同厂商的设备分散风险。 **结论**：手工投掷骰子生成熵源是技术娴熟用户的一个有效安全选项，但其过程复杂、容易出错，不适合作为主流用户的默认方法。长远目标是依赖安全、透明且无需专业知识的硬件/软件随机数生成方案。

cryptonews.ru8小时前

cryptonews.ru8小时前

交易

现货

Gemini 3.5来了！今夜，谷歌亲手淘汰谷歌

文章摘要

Gemini Omni 首发：一个「全能」 AI 诞生了

Flash 干翻 Pro：3.5 重写了「旗舰」的定义

93 个 Agent 造出 OS，仅 12 小时

7x24h 个人管家：谷歌 Spark 终于来了

这一夜，谷歌撕开了 ASI 入口

相关问答

你可能也喜欢

对话达利欧：当下正处AI泡沫中，投资组合的1%是比特币

单日 7.2 万亿韩元，外资周五净买入创纪录！华尔街：韩股资金面逆风已经消退

突发！OpenAI下一代AI攻克10项菲尔兹奖级难题

如何让自己变得让人工智能永远也无法取代

通过掷骰子离线保管比特币密钥：并非人人愿意为之

交易

热门分类

热门标签