谷歌正式宣战

链捕手發佈於 2026-05-21更新於 2026-05-21

文章摘要

2026年Google I/O开发者大会，谷歌展现出强势进攻姿态，宣布全面将AI深度整合至其生态系统，并向竞争对手发起明确挑战。大会核心亮点是**Gemini 3.5 Flash模型**。它虽为轻量版，但通过“极限知识蒸馏”技术和创新的细粒度MoE（混合专家）架构，在数学推理、代码生成等多项基准测试中表现超越前代Pro版，且首字响应时间低于65毫秒，达到近乎无感的交互速度。谷歌同步发布了三款关键产品/能力： 1. **Gemini Omni Flash**：原生多模态视频模型，能实时理解视频中的物理规律，延迟仅120毫秒。演示中可在水杯将满时提前预警，标志着AI开始成为现实世界的实时辅助工具。 2. **智能助手Spark**：被深度集成至Android 17系统底层，可通过语音指令直接操控手机API，自动完成跨应用的复杂任务流程（如处理邮件、整理日程），有望简化甚至取代大量传统App操作。 3. **智能眼镜**：作为AI的物理入口，主打轻薄与实用，搭载端侧AI芯片，可实现离线实时翻译、场景识别，并与Spark联动，将AI服务嵌入用户第一视角。谷歌同时宣布了极具竞争力的市场数据与定价策略：**Gemini月活用户已突破9亿**；并大幅下调服务价格，其中Gemini 3.5 Flash的API调用成本降至行业均价的十分之一左右。这得益于其自研TPU算力与高效模型架构带来的成本优势。 **战略意图与行业影响**：谷歌此举宣告了大模型竞争进入新阶段，单纯的模型性能竞赛已过时，未来是“端+云+生态+硬件”的全栈竞争。通过将AI“填鸭式”塞入搜索、浏览器、安卓系统、可穿戴设备等所有核心流量入口，谷歌正重塑流量分发逻辑——从用户主动搜索变为AI智能体主动分发服务。此举将对纯模型提供商（如OpenAI、Anthropic）的商业模式构成直接价格压力，同时也对苹果等依赖屏幕交互的巨头形成挑战，预示着基于视觉/语音的无屏交互时代将加速到来。谷歌凭借其技术、庞大用户基数、垂直整合的算力设施与激进定价，正式打响了一场全方位的AI生态战争。

2026年Google I/O开发者大会,给人的感觉只有两个字:张狂。

不仅把AI智能体像填鸭一样,无缝塞进搜索、浏览器、手机、智能眼镜等所有核心流量入口,还连续甩出Gemini 3.5 Flash、视频模型Omni、全新AI助手Spark三张王炸。

亮完肌肉后,劈柴甚至炫耀般地宣布,Gemini月活破9亿;并同步官宣大幅降价。

意思再直白不过了:我比你强,还比你便宜。

这不是宣战是什么?

01

大会上最让人惊艳的,毫无疑问是Gemini 3.5 Flash的亮相。

正常来说,“Pro”代表中坚力量,“Flash”代表轻量级和快。

从模型参数量来看,3.5 Flash也确实小于3.1 Pro,但在几乎所有推理和编码基准测试上,前者的表现居然更优异:

复杂数学推理的GSM8K测试,3.5 Flash拿下了95.8%的分数,超越3.1 Pro的93.2%;代码生成能力的SWE-bench完整版中,3.5 Flash解决率达到38.4%,远远超过3.1 Pro的32.1%......

为什么?

根据DeepMind发布的《Gemini 3.5 Technical Report》,最重要的核心技术有两个。

极限知识蒸馏:谷歌这次没有单纯靠堆算力来训练Flash,而是使用了从未公开的“Gemini 3.5 Ultra”作为教师模型,对Flash进行降维蒸馏。

根据DeepMind首席科学家Jeff Dean的推文解析,3.5 Flash在高质量逻辑链数据集上的微调比例,比上一代提升了400%。

这意味着它继承了超大模型的“逻辑脑”,而不是死记硬背的“知识库”。

全新的MoE架构(混合专家模型):在3.5 Flash内部,谷歌采用了更细颗粒度的专家网络。

传统的MoE可能只有8个或16个专家,每次仅激活1-2个,足够支持万亿级参数规模的模型。

而根据a16z的2026年AI基建投资备忘录分析,3.5 Flash采用了256个微型专家,每次推理可激活其中最高效的4个。

所以它才能在保持极低激活参数量的同时,覆盖极其庞大的多模态特征空间。

在TTFT(Time to First Token,首字输出时间)指标上,3.5 Flash已经达到了65毫秒以内。

而人类眨眼一次需要100-150毫秒。

简而言之,当其作为智能体运行时,在人类的生理视角中,根本无法察觉到任何停顿。

对于需要频繁调用工具、进行多轮反思、极低延迟的开发者而言,这是真正完美的超级代理底座。

只有依托如此极致的工程优化,才可能在竞争剧烈的环境中,建立起“端侧落地”的统治力。

第一个,原生多模态Gemini Omni Flash。

Omni的意思是全能,对标早先的GPT-4o,只看名字,都能感受到火药味有多浓。

至少从表现来看,Gemini Omni Flash远比GPT-4o有资格用“o”这个字符。

早期的Sora或Gemini 1.5,基本都是缝合怪,即把语音转文本、文本再转视觉。

但这次发布的Omni,是真正的原生端到端多模态对齐。不仅能原生理解视频中的时间连贯性和物理规律,延迟也从400-600毫秒的行业平均水平降至120毫秒。

举个发布会上的例子:用户戴着摄像头倒水,水杯快满了,Omni能在水溢出前0.5秒说出“停停停!”

这种对现实世界物理状态的实时推断,看似简单,但意义重大:AI从屏幕里的聊天机器人正式进化为现实世界的辅助工具。

尽管只是初级阶段。

第二个,智能助手Spark。

根据The Verge专访Android工程副总裁的爆料,Spark 被赋予了Android 17系统底层的原生API操控权。

简而言之,你以前需要点开很多App才能完成的复杂流程,现在不需要动手,只需要吩咐Spark一声,它能帮你全部搞定,甚至能根据你的口吻、偏好去发送信息、整理邮件、汇总日程、追踪网页动态、识别账单隐性扣费、批量处理文档等等等等......

换句话说,以后有了AI助手,我们基本用不上App,任何复杂的操作都被简化成唯一。

第三个,智能眼镜。

为什么又是眼镜?

至少在谷歌方面看来,视觉和听觉的无缝接入,就是多模态大模型的最终宿主。

这副眼镜看起来没有任何花哨的外观,全部聚焦于实用能力:

重量仅4克的Micro-OLED全彩光波导镜片,透光率高达85%;

搭载自研轻量化Gemini端侧芯片,本地推理延迟≤12ms,无需联网即可完成实时翻译、图像识别、场景分析;

原生联动Spark智能体,同步手机、云端数据,实现日程提醒、实时翻译、环境预警等个性化服务。

简而言之,就是越过手机屏幕,把智能体通过眼镜塞进人类的第一视角。

内容实在太多,谷歌似乎一次性清仓了所有大招,向市场宣告了一个真理:

没有入口的算法,什么都不是。

卷大模型的参数、卷跑分的时代已经过去,单纯的模型提供商已经没有护城河,未来是“端+云+生态+硬件”的四维空间战。

把AI 塞进全家桶,其实是在重塑整个互联网的流量分发逻辑:从“用户主动搜索/点击”,变成了“AI 智能体主动分发服务”。

对广大的开发者和中小企业而言,这再好不过,因为底层算力和模型变得极其廉价,大家可以专心做应用层的创新。

但其它竞争对手,此刻恐怕只想破口大骂。

02

当劈柴在台上云淡风轻地宣布“Gemini月活跃用户正式突破9亿”时,在台下造成了不小的轰动。

9亿,比美国所有对手的MAU加起来都要多。

怎么做到的?

答案简单粗暴:硬塞。

谷歌不需要像独立AI公司那样去花广告费买量,只需要在Chrome浏览器的地址栏旁边加一个图标,在30亿台安卓手机的底部导航栏集成一个呼出快捷键,在Google Workspace里全量推送更新......

获客成本基本上等于0。

更关键的是,加下来一段时间,9 亿活跃用户每天用智能眼镜看商品时停留的眼神、用 Spark 处理事务时修正的逻辑以及与Omni视觉模型的交互,产生的海量高质量、多模态真实世界反馈数据,统统会成为滋养Gemini 4的养料。

这是个极其坚固的壁垒:模型越好用->用的人越多->产生的数据越多->模型变得更好用。

为了速速强化这个闭环,谷歌直接向所有对手宣布打价格战:AI Ultra套餐从249.99美元/月砍到99.9美元/月。

3.5 Flash的百万token输入价格干到了0.02美元,百万Token输出价格0.08美元。

这是个什么神仙价格?

对比一下,行业同级别模型的均价分别在0.15-0.2美元和0.6-1美元。

劈柴算了笔账:头部客户每天处理约1万亿个token。把80%的工作负载切到Gemini 3.5 Flash上一年,能省超过10亿美元。

为什么敢把AI卖成白菜价?

最大的依仗就是:垂直整合的算力基础设施。

包括OpenAI、Anthropic等巨头,看似风光,本质上其实还是“算力租客”,需要向微软、亚马逊买算力,而后者又要去给老黄交钱。

而谷歌有自家的TPU,再加上3.5 Flash极其变态的MoE稀疏激活效率,将算力成本压缩到了极致。

完全可以利用重资产优势去降维打击单纯的算法公司。

逻辑很清晰。

基础大模型正在快速商品化。就像水和电一样,你见过哪家自来水公司有暴利的?

谷歌不怕大模型本身不赚钱,因为可以通过搜索广告、云服务和安卓生态的抽成把钱赚回来。

但对于纯靠卖大模型API 为生OpenAI、Anthropic、Cohere、Mistral,这就不可能。

投资人现在大概很想按着奥特曼的头问:“谷歌的API价格只要你的十分之一,性能还比你好,你告诉我,你的商业模式怎么跑通?”

多个行业的竞争格局,将因此进入加速洗牌期。

AI厂商不必多说,必须尽快找到更便宜的算力来源,或者自己下场做芯片。

其次是仍在闭门造车的苹果。

智能眼镜+ Omni视频大模型+ Spark原生系统级接管的组合,毫无疑问已经威胁到了iPhone。

根据麦格理的《消费电子趋势预测报告》:未来三年内,基于视觉/语音的无屏交互时长占比,预计将从目前的8%跃升至35%。

如果用户习惯了用眼镜和语音完成日常工作和娱乐,屏幕的使用时长必然大幅压缩。

苹果如果拿不出足够惊艳的穿戴设备反击(Vision Pro太重太贵,注定只是少数人的玩具),其在移动互联网时代的入口垄断权将受到史无前例的挑战。

这不是迭代,是革命。

谷歌用技术、流量、价格三把刀,给所有对手下了战书。

此时此刻,还有人嘲笑它得了大企业病吗?

你可能也喜歡

突发！OpenAI下一代AI攻克10项菲尔兹奖级难题

OpenAI发布其下一代AI模型Astra，在数学领域取得轰动性突破，一举攻克了10个长期未解的难题，其中多项成果被专家评价为“菲尔茨奖级别”。这些突破涵盖了高维几何、群论、算子代数等多个核心数学分支，相关论文长达249页。最引人注目的成果包括：构造出首个无限有限呈现的“非sofic群”，否定了自1999年提出相关猜想；在高维球体堆积问题上，打破了自1978年以来人类未能突破的理论极限；推翻了菲尔兹奖得主Alain Connes提出的“刚性猜想”，构造出无限多不同构但生成相同冯·诺依曼代数的群。据称，生成这10项证明的总计算成本仅约2000美元。所有证明均通过了Lean 4形式化验证，确保了其严密性。这一系列成果被视作AI在深度推理和数学直觉上的重大飞跃，标志着AI已成为数学研究领域的强大工具。

marsbit1 小時前

marsbit1 小時前

如何让自己变得让人工智能永远也无法取代

面对人工智能的冲击，许多人担心工作被取代。然而，真正的威胁在于个人对他人和系统的依赖，以及由此产生的“薪资奴役”——即为生存而从事无意义、枯燥的工作。摆脱这种困境的关键，不是抵制技术，而是成为拥有高自主性的“不可受雇”个体。文章提出了成功抵御AI替代的五个核心要素：自主性（主动行动的能力）、品味（判断事物价值的经验）、说服力（让他人关注你工作的能力）、毅力（坚持并从错误中学习）和迭代（根据反馈持续改进）。这些能力无法仅通过理论学习获得，必须通过实践来培养。要启动转变，首先要彻底改变环境，重塑身份认同。其次，应选择一个能获得真实、快速反馈的实践领域，例如创业。在众多技能中，内容创作（媒体）比编写代码更具优势，因为其价值是主观的，需要独特的审美和判断力，这正是AI目前难以完全复制的。具体行动上，可以从三个步骤开始： 1. **挖掘原始素材**：反思自己长期痴迷的知识领域、轻松解决的难题或童年被压抑的兴趣，找到独特的个人经验。 2. **确立反向思考主轴**：找出你坚信但主流观点错误的地方，或行业内普遍忽视的“皇帝新衣”，形成独特的批判性视角。 3. **立即发布**：将前两步的思考融合，撰写并发布第一个核心内容（如帖子、视频），勇敢接受真实世界的反馈，并在此基础上持续学习和迭代。最终，抵御AI的关键在于构建一份与自身身份深度契合的毕生事业，通过持续的内容创作和真实互动，建立无法被自动化取代的独特价值和影响力。行动，从今天发布第一个想法开始。

marsbit1 小時前

marsbit1 小時前

通过掷骰子离线保管比特币密钥：并非人人愿意为之

文章探讨了通过投掷骰子生成比特币钱包种子短语的安全方法及其现实挑战。核心观点如下： **1. 骰子提供物理熵源** 骰子结果由众多微小变量决定，理论上虽可预测，但实践中无法被攻击者复制或计算，从而提供高质量的随机性。每个六面骰子投掷约产生2.585比特熵，50次投掷即可满足典型12词助记词（128比特熵）的安全需求。 **2. Coldcard漏洞事件凸显手工熵源的价值** 近期Coldcard硬件钱包因固件漏洞导致其内部随机数生成器存在缺陷，致使约1128枚比特币被盗。但那些**完全**通过足量骰子投掷生成种子短语的用户未受此漏洞影响，因为他们的主密钥未使用有缺陷的生成器。 **3. 重要警示：手工种子并非万能保护** 安全研究员指出，即使用户使用骰子生成了安全的种子，若他们使用了Coldcard的其他功能（如生成纸钱包、克隆密钥、共享签名密钥、密码等），这些**衍生密钥**仍可能调用有漏洞的随机数生成器，从而存在风险。安全种子不保证设备生成的所有秘密都安全。 **4. 手工生成熵源的现实局限性** 尽管数学上可靠，但该方法对大多数用户并不友好： * **过程繁琐易错**：需投掷50-99次，精确记录，任何输入错误都会导致钱包完全不同。 * **引入新风险**：用户可能在记录、转换过程中泄露信息，或使用有偏的骰子/投掷方式。 * **用户体验差**：难以想象大规模推广需要用户手动投掷近百次骰子。安全措施需适应现实生活场景和普通用户的知识水平。 **5. 给用户的建议** 受影响的Coldcard用户应： * 更新固件至最新版。 * 检查是否使用过有漏洞的功能生成了次级密钥或密码，如有则需立即更换。 * 考虑采用多签方案，使用不同厂商的设备分散风险。 **结论**：手工投掷骰子生成熵源是技术娴熟用户的一个有效安全选项，但其过程复杂、容易出错，不适合作为主流用户的默认方法。长远目标是依赖安全、透明且无需专业知识的硬件/软件随机数生成方案。

cryptonews.ru4 小時前

cryptonews.ru4 小時前

迈克尔·塞勒声称，他所反对的比特币更新现在已不可能被采纳！

迈克尔·塞勒表示，他所反对的比特币升级提案BIP-110在当前的挖矿难度周期内已无法获得55%的自愿支持阈值，这在数学上已成为不可能。数据显示，截至区块960561，本难度调整周期内共产生946个区块，其中仅24个区块在其版本字段中发出了支持BIP-110的信号。塞勒指出，所有这些信号均来自通过OCEAN矿池分享奖励的DATUM矿工，而OCEAN以外的矿工未发出任何支持信号。因此，他认为现有信号不能代表矿工的普遍共识，BIP-110无法在本周期内达到所需的支持水平。 BIP-110提案旨在限制除货币转账外的大容量数据（如图片、文本）被写入比特币网络，其支持者主张“比特币应仅用于发送货币，无关数据不应堵塞网络”。塞勒对此表示反对，他认为比特币网络不应裁决哪些交易是必要的，规则也不应随少数人的意愿而改变。他还指出，较高的支持率可能源于某些软件的自动化信号过程，并未真实反映矿工意愿。 *本文不构成投资建议。

cryptonews.ru5 小時前

cryptonews.ru5 小時前

关于比特币的负面评论数量达到历史新高：这意味着什么？

加密货币分析公司Santiment报告称，社交媒体上对比特币的负面情绪达到了历史最高水平。其监测数据显示，在X、Reddit、Telegram等平台上，比特币的正面与负面评论比例降至该公司采用现代监测系统以来的最低点。 Santiment指出，Coldcard硬件钱包固件漏洞是引发市场担忧的主要原因之一。该事件直接动摇了投资者对个人存储系统和冷钱包安全性的信心，而这类方式被广泛认为是最安全的资产保护方法。公司回顾了过去更严重的危机，如FTX和Mt. Gox崩溃以及疫情期间的“黑色星期四”，但认为Coldcard事件对个人投资者的影响有所不同。本次讨论焦点转向了硬件安全和冷钱包本身，而非常受批评的中心化交易所、跨链桥或杠杆交易平台。数据显示，每条比特币负面评论仅对应0.58条正面评论，恐惧情绪历史上显著压倒贪婪。Santiment强调，当前数据仅涵盖单日，但恐慌水平已超过今年早些时候战争担忧的高峰，以及以往重大加密货币危机期间的社交媒体恐慌峰值。

cryptonews.ru6 小時前

cryptonews.ru6 小時前

交易

現貨

谷歌正式宣战

文章摘要

01

02

熱門幣種推薦

相關問答

你可能也喜歡

突发！OpenAI下一代AI攻克10项菲尔兹奖级难题

如何让自己变得让人工智能永远也无法取代

通过掷骰子离线保管比特币密钥：并非人人愿意为之

迈克尔·塞勒声称，他所反对的比特币更新现在已不可能被采纳！

关于比特币的负面评论数量达到历史新高：这意味着什么？

交易

熱門文章

如何購買WAR

相關討論

熱門問答

熱門分類

熱門標籤