谷歌正式宣战

链捕手发布于2026-05-21更新于2026-05-21

文章摘要

2026年Google I/O开发者大会,谷歌展现出强势进攻姿态,宣布全面将AI深度整合至其生态系统,并向竞争对手发起明确挑战。 大会核心亮点是**Gemini 3.5 Flash模型**。它虽为轻量版,但通过“极限知识蒸馏”技术和创新的细粒度MoE(混合专家)架构,在数学推理、代码生成等多项基准测试中表现超越前代Pro版,且首字响应时间低于65毫秒,达到近乎无感的交互速度。 谷歌同步发布了三款关键产品/能力: 1. **Gemini Omni Flash**:原生多模态视频模型,能实时理解视频中的物理规律,延迟仅120毫秒。演示中可在水杯将满时提前预警,标志着AI开始成为现实世界的实时辅助工具。 2. **智能助手Spark**:被深度集成至Android 17系统底层,可通过语音指令直接操控手机API,自动完成跨应用的复杂任务流程(如处理邮件、整理日程),有望简化甚至取代大量传统App操作。 3. **智能眼镜**:作为AI的物理入口,主打轻薄与实用,搭载端侧AI芯片,可实现离线实时翻译、场景识别,并与Spark联动,将AI服务嵌入用户第一视角。 谷歌同时宣布了极具竞争力的市场数据与定价策略:**Gemini月活用户已突破9亿**;并大幅下调服务价格,其中Gemini 3.5 Flash的API调用成本降至行业均价的十分之一左右。这得益于其自研TPU算力与高效模型架构带来的成本优势。 **战略意图与行业影响**:谷歌此举宣告了大模型竞争进入新阶段,单纯的模型性能竞赛已过时,未来是“端+云+生态+硬件”的全栈竞争。通过将AI“填鸭式”塞入搜索、浏览器、安卓系统、可穿戴设备等所有核心流量入口,谷歌正重塑流量分发逻辑——从用户主动搜索变为AI智能体主动分发服务。 此举将对纯模型提供商(如OpenAI、Anthropic)的商业模式构成直接价格压力,同时也对苹果等依赖屏幕交互的巨头形成挑战,预示着基于视觉/语音的无屏交互时代将加速到来。谷歌凭借其技术、庞大用户基数、垂直整合的算力设施与激进定价,正式打响了一场全方位的AI生态战争。

2026Google I/O开发者大会,给人的感觉只有两个字:张狂。

不仅把AI智能体像填鸭一样,无缝塞进搜索、浏览器、手机、智能眼镜等所有核心流量入口,还连续甩出Gemini 3.5 Flash、视频模型Omni、全新AI助手Spark三张王炸。

亮完肌肉后,劈柴甚至炫耀般地宣布,Gemini月活破9亿;并同步官宣大幅降价。

意思再直白不过了:我比你强,还比你便宜

这不是宣战是什么?

01

大会上最让人惊艳的,毫无疑问是Gemini 3.5 Flash的亮相。

正常来说,Pro”代表中坚力量,“Flash”代表轻量级和快。

从模型参数量来看,3.5 Flash也确实小于3.1 Pro,但在几乎所有推理和编码基准测试上,前者的表现居然更优异:

复杂数学推理的GSM8K测试,3.5 Flash拿下了95.8%的分数,超越3.1 Pro93.2%;代码生成能力的SWE-bench完整版中,3.5 Flash解决率达到38.4%,远远超过3.1 Pro32.1%......

为什么?

根据DeepMind发布的《Gemini 3.5 Technical Report》,最重要的核心技术有两个。

极限知识蒸馏:谷歌这次没有单纯靠堆算力来训练Flash,而是使用了从未公开的Gemini 3.5 Ultra作为教师模型,对Flash进行降维蒸馏。

根据DeepMind首席科学家Jeff Dean的推文解析,3.5 Flash在高质量逻辑链数据集上的微调比例,比上一代提升了400%

这意味着它继承了超大模型的逻辑脑,而不是死记硬背的知识库

全新的MoE架构(混合专家模型):在3.5 Flash内部,谷歌采用了更细颗粒度的专家网络。

传统的MoE可能只有8个或16个专家,每次仅激活1-2个,足够支持万亿级参数规模的模型。

而根据a16z2026AI基建投资备忘录分析,3.5 Flash采用了256个微型专家,每次推理可激活其中最高效的4个。

所以它才能在保持极低激活参数量的同时,覆盖极其庞大的多模态特征空间。

TTFT(Time to First Token,首字输出时间)指标上,3.5 Flash已经达到了65毫秒以内。

而人类眨眼一次需要100-150毫秒。

简而言之,当其作为智能体运行时,在人类的生理视角中,根本无法察觉到任何停顿。

对于需要频繁调用工具、进行多轮反思、极低延迟的开发者而言,这是真正完美的超级代理底座。

只有依托如此极致的工程优化,才可能在竞争剧烈的环境中,建立起端侧落地”的统治力。

第一个,原生多模态Gemini Omni Flash

Omni的意思是全能,对标早先的GPT-4o,只看名字,都能感受到火药味有多浓。

至少从表现来看,Gemini Omni Flash远比GPT-4o有资格用“o”这个字符。

早期的SoraGemini 1.5,基本都是缝合怪,即把语音转文本、文本再转视觉。

这次发布的Omni,是真正的原生端到端多模态对齐。不仅能原生理解视频中的时间连贯性和物理规律,延迟也从400-600毫秒的行业平均水平降至120毫秒。

举个发布会上的例子:用户戴着摄像头倒水,水杯快满了,Omni能在水溢出前0.5秒说出“停停停!”

这种对现实世界物理状态的实时推断,看似简单,但意义重大:AI从屏幕里的聊天机器人正式进化为现实世界的辅助工具

尽管只是初级阶段。

第二个,智能助手Spark

根据The Verge专访Android工程副总裁的爆料,Spark 被赋予了Android 17系统底层的原生API操控权。

简而言之,你以前需要点开很多App才能完成的复杂流程,现在不需要动手,只需要吩咐Spark一声,它能帮你全部搞定,甚至能根据你的口吻、偏好去发送信息、整理邮件、汇总日程、追踪网页动态、识别账单隐性扣费、批量处理文档等等等等......

换句话说,以后有了AI助手,我们基本用不上App,任何复杂的操作都被简化成唯一。

第三个,智能眼镜。

为什么又是眼镜?

至少在谷歌方面看来,视觉和听觉的无缝接入,就是多模态大模型的最终宿主。

这副眼镜看起来没有任何花哨的外观,全部聚焦于实用能力:

重量仅4克的Micro-OLED全彩光波导镜片,透光率高达85%;

搭载自研轻量化Gemini端侧芯片,本地推理延迟≤12ms,无需联网即可完成实时翻译、图像识别、场景分析;

原生联动Spark智能体,同步手机、云端数据,实现日程提醒、实时翻译、环境预警等个性化服务。

简而言之,就是越过手机屏幕,把智能体通过眼镜塞进人类的第一视角

内容实在太多,谷歌似乎一次性清仓了所有大招,向市场宣告了一个真理:

没有入口的算法,什么都不是。

卷大模型的参数、卷跑分的时代已经过去,单纯的模型提供商已经没有护城河,未来是“端++生态+硬件”的四维空间战。

AI 塞进全家桶,其实是在重塑整个互联网的流量分发逻辑:从“用户主动搜索/点击”,变成了“AI 智能体主动分发服务”。

对广大的开发者和中小企业而言,这再好不过,因为底层算力和模型变得极其廉价,大家可以专心做应用层的创新。

但其它竞争对手,此刻恐怕只想破口大骂。

02

当劈柴在台上云淡风轻地宣布Gemini月活跃用户正式突破9亿”时,在台下造成了不小的轰动。

9亿,比美国所有对手的MAU加起来都要多。

怎么做到的?

答案简单粗暴:硬塞

谷歌不需要像独立AI公司那样去花广告费买量,只需要在Chrome浏览器的地址栏旁边加一个图标,在30亿台安卓手机的底部导航栏集成一个呼出快捷键,在Google Workspace里全量推送更新......

获客成本基本上等于0

更关键的是,加下来一段时间,9 亿活跃用户每天用智能眼镜看商品时停留的眼神、用 Spark 处理事务时修正的逻辑以及与Omni视觉模型的交互,产生的海量高质量、多模态真实世界反馈数据,统统会成为滋养Gemini 4的养料。

这是个极其坚固的壁垒:模型越好用->用的人越多->产生的数据越多->模型变得更好用

为了速速强化这个闭环,谷歌直接向所有对手宣布打价格战:AI Ultra套餐从249.99美元/99.9美元/

3.5 Flash的百万token输入价格干到了0.02美元,百万Token输出价格0.08美元。

这是个什么神仙价格?

对比一下,行业同级别模型的均价分别在0.15-0.2美元和0.6-1美元。

劈柴算了笔账:头部客户每天处理约1万亿个token。把80%的工作负载切到Gemini 3.5 Flash上一年,能省超过10亿美元。

为什么敢把AI卖成白菜价?

最大的依仗就是:垂直整合的算力基础设施

包括OpenAIAnthropic等巨头,看似风光,本质上其实还是“算力租客”,需要向微软、亚马逊买算力,而后者又要去给老黄交钱。

而谷歌有自家的TPU,再加上3.5 Flash极其变态的MoE稀疏激活效率,将算力成本压缩到了极致。

完全可以利用重资产优势去降维打击单纯的算法公司

逻辑很清晰。

基础大模型正在快速商品化。就像水和电一样,你见过哪家自来水公司有暴利的?

谷歌不怕大模型本身不赚钱,因为可以通过搜索广告、云服务和安卓生态的抽成把钱赚回来。

但对于纯靠卖大模型API 为生OpenAIAnthropicCohereMistral,这就不可能。

投资人现在大概很想按着奥特曼的头问:谷歌的API价格只要你的十分之一,性能还比你好,你告诉我,你的商业模式怎么跑通?

多个行业的竞争格局,将因此进入加速洗牌期。

AI厂商不必多说,必须尽快找到更便宜的算力来源,或者自己下场做芯片。

其次是仍在闭门造车的苹果。

智能眼镜+ Omni视频大模型+ Spark原生系统级接管的组合,毫无疑问已经威胁到了iPhone

根据麦格理的《消费电子趋势预测报告》:未来三年内,基于视觉/语音的无屏交互时长占比,预计将从目前的8%跃升至35%

如果用户习惯了用眼镜和语音完成日常工作和娱乐,屏幕的使用时长必然大幅压缩。

苹果如果拿不出足够惊艳的穿戴设备反击(Vision Pro太重太贵,注定只是少数人的玩具),其在移动互联网时代的入口垄断权将受到史无前例的挑战。

这不是迭代,是革命。

谷歌用技术、流量、价格三把刀,给所有对手下了战书。

此时此刻,还有人嘲笑它得了大企业病吗?

相关问答

Q2026年Google I/O开发者大会上,谷歌宣布其AI智能助手Spark具有什么特殊权限和能力?

ASpark被赋予了Android 17系统底层的原生API操控权,能够代表用户操作手机应用、处理信息、整理邮件、汇总日程、追踪网页动态、识别账单隐性扣费等复杂流程,用户只需通过语音或指令即可完成,而无需手动操作多个App。

Q根据文章,谷歌全新的Gemini 3.5 Flash模型在性能上超越了其“Pro”版本,其主要依赖于哪两项核心技术?

AGemini 3.5 Flash主要依赖于两项核心技术:一是极限知识蒸馏,使用未公开的“Gemini 3.5 Ultra”作为教师模型进行高比例高质量逻辑链数据集的微调;二是全新的、颗粒度更细的MoE架构(混合专家模型),采用多达256个微型专家,每次推理仅激活其中最高效的4个,从而在保持低激活参数量的同时实现高性能。

Q文章中提到谷歌全新的Gemini Omni Flash视频模型在延迟和实际应用示例上有什么突破?

AGemini Omni Flash将行业平均的400-600毫秒延迟降至120毫秒,实现了原生端到端多模态对齐,能实时理解视频连贯性和物理规律。其演示示例是:当用户戴摄像头倒水时,它能在水溢出前的0.5秒内及时发出“停停停!”的预警。

Q谷歌通过哪几种方式使其Gemini的月活跃用户数(MAU)迅速突破9亿?

A谷歌主要通过将AI功能“硬塞”进其巨大的现有产品流量入口来实现用户增长,具体包括:在Chrome浏览器地址栏旁添加图标、在数十亿台安卓手机的底部导航栏集成呼出快捷键、以及在Google Workspace等核心应用中全量推送更新,使得获客成本几乎为零。

Q谷歌敢于大幅降低其AI模型API定价(例如Gemini 3.5 Flash)的主要原因是什么?这对其他AI公司可能产生什么影响?

A谷歌敢于大幅降价的主要原因是其垂直整合的算力基础设施,特别是其自研的TPU和Gemini 3.5 Flash模型高效的MoE稀疏激活架构,能将算力成本压缩到极致。这对依赖售卖API的纯AI算法公司(如OpenAI、Anthropic等)构成巨大压力,因为谷歌可以用更低的价格提供高性能服务,这可能迫使竞争对手寻找更便宜的算力或自研芯片,并加速行业洗牌。

你可能也喜欢

脱钩时代来临,比特币不再是加密的唯一罗盘

文章指出,加密市场正告别以比特币为单一风向标的时代,分化为“内生型”和“外生型”两大资产阵营。 内生型资产(如比特币和多数传统加密货币)的价值仍与加密市场整体行情深度绑定。而外生型资产的崛起成为新趋势,其价值主要依托自身业务的真实需求和基本面,日益独立于比特币价格波动。 例如,Hyperliquid作为混合型案例,其部分合约交易已转向非加密资产。Venice等项目则完全脱离加密市场,其商业模式更接近消费级AI服务,收入来自用户为AI推理付费。Figure公司利用区块链技术提升贷款效率,其核心价值在于金融科技业务本身。 此外,稳定币等赛道的企业收购与高增长(如BVNK、Bridge),也显示了其发展与加密牛熊周期的脱钩。 这一转变意味着行业分析逻辑的根本改变:研究外生型资产需要像分析传统企业一样,专注于用户群体、经济模型和行业护城河等基本面,而非紧盯比特币价格。文章列举了多个具备潜力的外生型赛道,包括链上金融服务、AI与加密融合、新型数字银行、支付、非金融消费产品等。 目前,投资相关企业股权仍是主要途径,代币机制仍需优化。但核心趋势已定:加密市场的驱动力正变得多元,行业研究重心将从解读比特币图表转向深耕企业基本面。未来,加密市场齐涨共跌的局面或将不再。

marsbit30分钟前

脱钩时代来临,比特币不再是加密的唯一罗盘

marsbit30分钟前

在下一周期,由于更高的增长速度,这五种加密货币可能超越比特币表现

比特币主导着市场走向,但随着其市值增长,分析师普遍认为下一周期最高的百分比涨幅将来自具有更高增长潜力的资产。尽管比特币可能稳步上涨,但一些加密货币——从成熟平台到新兴的AI基础设施项目——有望实现相对于比特币的超额回报。 以下是分析师认为在百分比涨幅上可能超越比特币的五种资产,其中Ozak AI被视为本周期增长潜力最大的黑马。 **Ozak AI ($OZ)**:这是一款处于预售阶段(价格0.014美元)的AI基础设施代币,目标是上市价格达到1美元。它正在构建一个完整的AI原生区块链生态系统,包括用于AI预测的预测代理、实时数据交付网络、共享安全层、可扩展执行层以及结构化AI数据集。其极低的起始估值意味着其具备比特币难以比拟的增长倍数潜力。 **以太坊 (ETH)**:作为主导性的智能合约平台,以太坊支撑着DeFi、资产代币化和Layer-2扩展。由于其网络活动和费用生成能力以及机构采用,分析师认为其相对上涨弹性仍优于比特币的价值存储模式。 **Solana (SOL)**:其高吞吐量、低费用和不断扩展的开发者生态,使其在流动性回归时能够迅速增长。历史上SOL在风险偏好改善时展现过大幅超越比特币的能力。 **Chainlink (LINK)**:作为领先的预言机提供商,LINK处于DeFi、代币化资产乃至AI驱动区块链应用的中心。其对整个加密经济的杠杆效应使其常在扩张周期中实现强劲的百分比涨幅。 **Avalanche (AVAX)**:其子网架构和对企业友好的设计,使其在Layer-1平台中具有独特地位。随着现实世界资产代币化和机构区块链部署的增长,AVAX有望获得不成比例的利益。 **总结**:比特币的上涨需要巨大的资金流入,而像Ozak AI这样的早期阶段资产,其估值重估速度可以非常快。随着市场周期加速,资本可能轮动到以AI为重点的早期基础设施代币中,以寻求最高的增长潜力。对于寻求平衡稳定性和指数级上行潜力的投资者而言,Ozak AI可能成为增长最快的领域。

TheNewsCrypto1小时前

在下一周期,由于更高的增长速度,这五种加密货币可能超越比特币表现

TheNewsCrypto1小时前

黄仁勋的「Agent工厂」里,装了什么新故事?

在COMPUTEX 2026期间,英伟达CEO黄仁勋发表了主题演讲,核心聚焦于“Agent AI”时代的到来。此次发布的关键在于,英伟达正围绕智能体生态,构建从芯片、数据中心到软件平台的全栈技术体系。 硬件层面,专为Agent工作负载设计的Vera Rubin平台已进入量产,其处理Agent任务的效率是上一代Grace Blackwell平台的10倍。该平台引入共封装光学(CPO)网络技术以降低能耗,并强化了机密计算安全能力。同时,英伟达推出了新型处理器“Vera” CPU,这是首款为AI智能体设计的CPU,与Rubin GPU通过高速NVLink互联,优化了Agent任务中的数据传递。 软件与模型方面,英伟达推出“AI工厂运营工具箱”DSX,整合了设计、仿真、建设到运营的全流程。发布了5500亿参数的混合专家模型Nemotron 3 Ultra,以及配套的NemoClaw、OpenShell等工具,旨在帮助企业构建能安全接入业务流程的“数字同事”。此外,面向物理AI的世界基础模型Cosmos 3正式发布,它能统一理解、生成和预测物理世界信息。 在物理AI领域,英伟达联合宇树发布了基于Isaac GR00T平台的人形机器人参考设计H2 Plus,旨在降低开发门槛。还开源了一套物理AI技能工具集,让智能体能直接调用标准化操作。 产品布局上,推出了“DGX Station for Windows”桌面AI超算工作站,让Agent能在企业本地Windows环境中安全运行。并与微软合作推出基于Arm架构的RTX Spark SoC,瞄准AI PC市场。 最后,英伟达升级了AI原生存储架构,在BlueField-4 STX中强化了针对Agent数据访问的安全管控能力。 总结来看,英伟达正通过Vera Rubin、DSX、Nemotron、Cosmos 3、H2 Plus等一系列产品,从算力供给、模型智能、安全管控、物理形态到部署运营,全方位构建服务于Agent的基础设施,宣告一个以智能体为核心的新计算时代已经开启。

marsbit1小时前

黄仁勋的「Agent工厂」里,装了什么新故事?

marsbit1小时前

交易

现货
合约

热门文章

如何购买WAR

欢迎来到HTX.com!我们已经让购买WAR(WAR)变得简单而便捷。跟随我们的逐步指南,放心开始您的加密货币之旅。第一步:创建您的HTX账户使用您的电子邮件、手机号码注册一个免费账户在HTX上。体验无忧的注册过程并解锁所有平台功能。立即注册第二步:前往买币页面,选择您的支付方式信用卡/借记卡购买:使用您的Visa或Mastercard即时购买WAR(WAR)。余额购买:使用您HTX账户余额中的资金进行无缝交易。第三方购买:探索诸如Google Pay或Apple Pay等流行支付方法以增加便利性。C2C购买:在HTX平台上直接与其他用户交易。HTX场外交易台(OTC)购买:为大量交易者提供个性化服务和竞争性汇率。第三步:存储您的WAR(WAR)购买完您的WAR(WAR)后,将其存储在您的HTX账户钱包中。您也可以通过区块链转账将其发送到其他地方或者用于交易其他加密货币。第四步:交易WAR(WAR)在HTX的现货市场轻松交易WAR(WAR)。访问您的账户,选择您的交易对,执行您的交易,并实时监控。HTX为初学者和经验丰富的交易者提供了友好的用户体验。

600人学过发布于 2024.12.11更新于 2026.06.01

如何购买WAR

相关讨论

欢迎来到HTX社区。在这里,您可以了解最新的平台发展动态并获得专业的市场意见。以下是用户对WAR(WAR)币价的意见。

活动图片