谷歌真急了，深夜更新Deep Research智能体，支持MCP、原生图表

marsbit发布于2026-04-22更新于2026-04-22

文章摘要

谷歌深夜推出新一代自主研究智能体Deep Research和Deep Research Max，基于Gemini 3.1 Pro模型构建，支持通过API调用融合网络数据与企业私有信息，并原生生成图表。Deep Research注重低延迟和低成本，适合实时场景；Max版本则侧重深度分析，适用于异步任务如夜间生成尽调报告。新智能体还支持Model Context Protocol（MCP），可安全连接第三方数据源和内部数据库，并能够处理多模态输入。此外，系统支持原生图表生成及协作规划功能，增强了分析的透明度和可控性。目前仅通过API开放，未向Gemini App用户提供。谷歌旨在将Deep Research打造为企业级基础设施，应对来自OpenAI和Anthropic等对手的竞争。

文 | 字母AI

谷歌真是急了。

前脚刚传来消息，称谷歌联合创始人谢尔盖·布林重启“创始人模式”，亲自督战并组建精英“突击队”，全力提升Gemini在AI编程和自主智能体等关键能力上追赶Anthropic等对手。

后脚谷歌就深夜宣布重大更新，推出了两款基于Gemini 3.1 Pro模型构建的新一代自主研究智能体：Deep Research和Deep Research Max。

不仅在模型底层加强推理能力，还大力推动自主研究智能体向企业级、开发者平台方向演进，通过API开放、支持私有数据、后台异步任务等方式，试图在“AI研究/分析工具”这个高价值场景中抢占先机，应对来自OpenAI（Hermes）、Perplexity等对手的竞争。

这两款智能体首次允许开发者通过单次API调用，将开放网络数据与企业专有信息进行融合，并在研究报告中原生生成图表和信息图，同时还可通过Model Context Protocol（MCP）连接任意第三方数据源。

两款智能体即日起通过Gemini API的付费套餐以公开预览版形式开放，可通过谷歌于2025年12月首次推出的Interactions API进行访问。

没错，这些新代理目前只能通过API使用，普通用户在Gemini的App里是享受不到的，就算付费订阅了也不行。看到更新的消息却发现自己用不到，有用户幽怨表示：“谷歌不知何故，持续惩罚着我们这些Gemini App的Pro订阅用户……”

谷歌首席执行官桑达尔·皮查伊（Sundar Pichai）也亲自下场在X上吆喝：“当你需要速度和效率时，请使用Deep Research；当你追求最高质量的上下文收集与综合时，请使用Max版本——它通过扩展测试时计算，达到了DeepSearchQA 93.3%和HLE 54.6%的成绩。”

18个月前，谷歌Deep Research的目标还是要帮助研究生避免被海量浏览器标签页淹没。如今，谷歌却希望它能够取代投资银行初级分析师的基础研究工作。

这两个目标之间的差距——以及这项技术能否真正弥合这一差距——将决定自主研究代理究竟会成为企业软件领域的变革性产品，还是仅仅成为又一个在基准测试中光鲜亮丽却在会议上令人失望的人工智能演示。

两种版本，适配不同工作负载

标准版Deep Research有更低的延迟和更低的成本，适合拼速度的场景。

Deep Research Max则优先考虑深度而非速度。该智能体通过扩展测试时计算（extended test-time compute），进行深入推理、搜索和迭代，最终生成报告。

谷歌指出，异步后台工作流是其理想使用场景，例如通过定时任务（cron job）在夜间运行，第二天早上就能为分析师团队交付一份完整的尽职调查报告。

在谷歌自己的基准测试中，Deep Research Max在检索和推理任务上取得了显著进步。该智能体能够从比之前版本更多的来源中获取信息，并捕捉到旧模型容易忽略的细微差别。

谷歌也给出了与竞对的横比。

不过，与OpenAI的GPT-5.4和Anthropic的Opus 4.6进行比较并不完全公平。GPT-5.4在自主网络搜索方面表现优秀，但并未针对深度研究进行专门优化。为此，OpenAI提供了自己的DR智能体，该智能体在2月更新后切换到了GPT-5.2，而非GPT-5.4。OpenAI最强的搜索模型实际上是GPT-5.4 Pro，但谷歌显然未将其纳入对比范围。

根据OpenAI的数据，GPT-5.4 Pro在智能体搜索基准测试BrowseComp上的得分最高可达89.3%，而GPT-5.4的得分为82.7%。

基于Anthropic自己的报告，Opus 4.6在BrowseComp上的得分高于谷歌所展示的数值，具体为84%。该得分是在关闭推理功能的情况下取得的，模型的表现反而优于谷歌在API基准测试中所使用的高强度推理设置。

这些差距很可能源于测试方法的不同——模型是通过原始API进行评估，还是被封装在各实验室自己的工具链中。谷歌的数据未必错误，但值得谨慎解读。无论如何，其呈现方式缺乏足够的透明度。

MCP支持

本次发布中最具影响力的功能，或许是新增了对Model Context Protocol（MCP）的支持。这一功能将Deep Research从一个强大的网络研究工具，转变为更接近“通用数据分析师”的存在。

MCP是一种新兴的开放标准，用于将AI模型连接到外部数据源。它让Deep Research能够安全地查询私有数据库、内部文档库以及专业的第三方数据服务——整个过程中，敏感信息无需离开其原始环境。

实际应用中，这意味着一家对冲基金可以同时将Deep Research指向其内部交易流数据库和金融数据终端，然后要求智能体将两者与来自网络的公开信息相结合，综合生成洞见。

谷歌透露，目前正与FactSet、标普（S&P）和PitchBook等公司积极合作，共同设计其MCP服务端，这清晰地表明谷歌正在寻求与华尔街及更广泛金融服务行业日常依赖的数据提供商进行深度整合。

根据谷歌DeepMind产品经理Lukas Haas和Srinivas Tadepalli撰写的博客文章，其目标是“让共同客户能够将金融数据产品集成到由Deep Research驱动的工作流中，并通过利用其海量数据宇宙，以闪电般的速度收集上下文，从而实现生产力的飞跃。”

这一功能直接解决了企业采用AI时最顽固的痛点之一：模型在开放互联网上能找到的信息，与组织实际决策所需的信息之间存在巨大差距。此前，弥合这一差距需要大量定制化工程工作。

而MCP支持结合Deep Research的自主浏览和推理能力，将大部分复杂性简化为一次配置即可完成。开发者现在可以让Deep Research同时使用谷歌搜索、远程MCP服务端、URL Context、代码执行和文件搜索——或者完全关闭网络访问，仅在自定义数据上进行搜索。

系统还支持多模态输入，包括PDF、CSV、图像、音频和视频，作为grounding（grounding上下文）使用。

原生图表

第二个重磅功能是原生图表和信息图生成。

之前的Deep Research版本只能生成纯文本报告。如果用户需要可视化，就必须将数据导出并自行制作图表。这个短板大大削弱了“端到端自动化”的定位。

现在，新一代智能体能够在报告中原生内嵌高质量图表和信息图，以HTML或谷歌的Nano Banana格式动态渲染复杂数据集，使其直接成为分析叙事的一部分。

对于企业用户——尤其是金融和咨询行业中需要产出可直接交付给利益相关者的成果的用户而言——这一功能将Deep Research从一个“加速研究阶段”的工具，转变为能够生成接近最终分析产品的工具。

此外，结合新增的协作式规划功能（允许用户在执行前审查、指导和优化智能体的研究计划），以及实时流式输出中间推理步骤，新系统让开发者能够对调查范围进行细粒度控制，同时保持监管行业所要求的高度透明度。

Deep Research正在变成谷歌提供给企业的“基础设施”的一部分

谷歌的官方博客文章明确指出，当开发者使用Deep Research智能体进行构建时，他们所调用的是“为谷歌旗下多款热门产品（如Gemini App、NotebookLM、Google Search和Google Finance）提供研究能力的同一套自主研究基础设施”。这表明，通过API提供的智能体并非谷歌内部版本的简化版，而是同一套系统，以平台规模对外提供服务。

这一演进过程进展极为迅速。

谷歌于2024年12月首次在Gemini App中推出Deep Research，作为C端功能，当时由Gemini 1.5 Pro驱动。谷歌将其描述为个人AI研究助手，能够在几分钟内综合网络信息，帮助用户节省数小时工作时间。

2025年3月，谷歌使用Gemini 2.0 Flash Thinking Experimental对Deep Research进行了升级，并向所有人开放试用。随后升级至Gemini 2.5 Pro Experimental，谷歌报告称，评测者对它的报告偏好度超过竞争对手的2比1。

2025年12月是重要的转折点，谷歌推出了Interactions API，首次以编程方式提供Deep Research，由Gemini 3 Pro驱动，并同步发布了开源的DeepSearchQA基准测试。

驱动本次改进的底层模型是Gemini 3.1 Pro，该模型于2026年2月19日发布。它在核心推理能力上实现了重大飞跃：在评估模型解决新型逻辑模式的ARC-AGI-2基准测试中，3.1 Pro的得分达到77.1%，是Gemini 3 Pro的两倍多。

你可能也喜欢

对话达利欧：当下正处AI泡沫中，投资组合的1%是比特币

桥水基金创始人瑞·达利欧在访谈中指出，当前AI热潮已显现经典泡沫特征，高估值与过度借贷可能在未来经济变故下引发资产抛售与衰退。他强调，这背后是更宏大的“大周期”在起作用，即贫富差距、政府债务高企及地缘政治变动共同驱动的约80年循环，目前全球秩序正处力量交替的衰退阶段。为应对不确定性，达利欧建议个人投资者进行多元化资产配置，包括股票、黄金、债券等，而非仅持有现金。他透露自己投资组合中约有1%为比特币，认为其具备硬通货特性，但个人更偏好实物黄金。对于AI的影响，他认为这将在更高层面替代人类思维，加剧贫富差距，而善于运用人类情感、直觉并与AI协作的人将更具优势。谈及英美热议的“财富税”，达利欧认为操作困难，可能引发资本外流或刺破泡沫。关于世界秩序，他预判未来可能走向区域化发展，而非单一主导。最后，他指出美国卷入伊朗冲突暴露了其军事与经济影响力的脆弱性，类似历史上大英帝国的衰落征兆。

marsbit3小时前

marsbit3小时前

单日 7.2 万亿韩元，外资周五净买入创纪录！华尔街：韩股资金面逆风已经消退

韩国股市资金面出现实质性转机。7月31日，外资单日净买入KOSPI股票约7.2万亿韩元，创历史最高纪录，标志着持续数月的外资净流出趋势发生根本逆转。7月外资净卖出规模已大幅收窄至9.8万亿韩元，远低于5、6月的水平。同时，国内养老金及基金在7月转为净买入1.0万亿韩元。监管层面，韩国金融服务委员会自7月31日起收紧散户投资单股杠杆ETF的门槛，新规实施后相关产品成交量已降至月均水平的约50%，有助于平抑市场短期波动。花旗研究维持KOSPI年内目标点位10000点不变，认为资金面逆风正在消退。支撑因素包括存储芯片行业基本面稳健、KOSPI估值处于历史低位、韩国经济基本面强劲以及政策环境友好。花旗还指出，若有必要，韩国金融当局存在提供流动性支持的可能性，为市场提供了政策底部支撑。

marsbit3小时前

marsbit3小时前

突发！OpenAI下一代AI攻克10项菲尔兹奖级难题

OpenAI发布其下一代AI模型Astra，在数学领域取得轰动性突破，一举攻克了10个长期未解的难题，其中多项成果被专家评价为“菲尔茨奖级别”。这些突破涵盖了高维几何、群论、算子代数等多个核心数学分支，相关论文长达249页。最引人注目的成果包括：构造出首个无限有限呈现的“非sofic群”，否定了自1999年提出相关猜想；在高维球体堆积问题上，打破了自1978年以来人类未能突破的理论极限；推翻了菲尔兹奖得主Alain Connes提出的“刚性猜想”，构造出无限多不同构但生成相同冯·诺依曼代数的群。据称，生成这10项证明的总计算成本仅约2000美元。所有证明均通过了Lean 4形式化验证，确保了其严密性。这一系列成果被视作AI在深度推理和数学直觉上的重大飞跃，标志着AI已成为数学研究领域的强大工具。

marsbit4小时前

marsbit4小时前

如何让自己变得让人工智能永远也无法取代

面对人工智能的冲击，许多人担心工作被取代。然而，真正的威胁在于个人对他人和系统的依赖，以及由此产生的“薪资奴役”——即为生存而从事无意义、枯燥的工作。摆脱这种困境的关键，不是抵制技术，而是成为拥有高自主性的“不可受雇”个体。文章提出了成功抵御AI替代的五个核心要素：自主性（主动行动的能力）、品味（判断事物价值的经验）、说服力（让他人关注你工作的能力）、毅力（坚持并从错误中学习）和迭代（根据反馈持续改进）。这些能力无法仅通过理论学习获得，必须通过实践来培养。要启动转变，首先要彻底改变环境，重塑身份认同。其次，应选择一个能获得真实、快速反馈的实践领域，例如创业。在众多技能中，内容创作（媒体）比编写代码更具优势，因为其价值是主观的，需要独特的审美和判断力，这正是AI目前难以完全复制的。具体行动上，可以从三个步骤开始： 1. **挖掘原始素材**：反思自己长期痴迷的知识领域、轻松解决的难题或童年被压抑的兴趣，找到独特的个人经验。 2. **确立反向思考主轴**：找出你坚信但主流观点错误的地方，或行业内普遍忽视的“皇帝新衣”，形成独特的批判性视角。 3. **立即发布**：将前两步的思考融合，撰写并发布第一个核心内容（如帖子、视频），勇敢接受真实世界的反馈，并在此基础上持续学习和迭代。最终，抵御AI的关键在于构建一份与自身身份深度契合的毕生事业，通过持续的内容创作和真实互动，建立无法被自动化取代的独特价值和影响力。行动，从今天发布第一个想法开始。

marsbit5小时前

marsbit5小时前

通过掷骰子离线保管比特币密钥：并非人人愿意为之

文章探讨了通过投掷骰子生成比特币钱包种子短语的安全方法及其现实挑战。核心观点如下： **1. 骰子提供物理熵源** 骰子结果由众多微小变量决定，理论上虽可预测，但实践中无法被攻击者复制或计算，从而提供高质量的随机性。每个六面骰子投掷约产生2.585比特熵，50次投掷即可满足典型12词助记词（128比特熵）的安全需求。 **2. Coldcard漏洞事件凸显手工熵源的价值** 近期Coldcard硬件钱包因固件漏洞导致其内部随机数生成器存在缺陷，致使约1128枚比特币被盗。但那些**完全**通过足量骰子投掷生成种子短语的用户未受此漏洞影响，因为他们的主密钥未使用有缺陷的生成器。 **3. 重要警示：手工种子并非万能保护** 安全研究员指出，即使用户使用骰子生成了安全的种子，若他们使用了Coldcard的其他功能（如生成纸钱包、克隆密钥、共享签名密钥、密码等），这些**衍生密钥**仍可能调用有漏洞的随机数生成器，从而存在风险。安全种子不保证设备生成的所有秘密都安全。 **4. 手工生成熵源的现实局限性** 尽管数学上可靠，但该方法对大多数用户并不友好： * **过程繁琐易错**：需投掷50-99次，精确记录，任何输入错误都会导致钱包完全不同。 * **引入新风险**：用户可能在记录、转换过程中泄露信息，或使用有偏的骰子/投掷方式。 * **用户体验差**：难以想象大规模推广需要用户手动投掷近百次骰子。安全措施需适应现实生活场景和普通用户的知识水平。 **5. 给用户的建议** 受影响的Coldcard用户应： * 更新固件至最新版。 * 检查是否使用过有漏洞的功能生成了次级密钥或密码，如有则需立即更换。 * 考虑采用多签方案，使用不同厂商的设备分散风险。 **结论**：手工投掷骰子生成熵源是技术娴熟用户的一个有效安全选项，但其过程复杂、容易出错，不适合作为主流用户的默认方法。长远目标是依赖安全、透明且无需专业知识的硬件/软件随机数生成方案。

cryptonews.ru8小时前

cryptonews.ru8小时前

交易

现货

谷歌真急了，深夜更新Deep Research智能体，支持MCP、原生图表

文章摘要

两种版本，适配不同工作负载

MCP支持

原生图表

Deep Research正在变成谷歌提供给企业的“基础设施”的一部分

热门币种推荐

相关问答

你可能也喜欢

对话达利欧：当下正处AI泡沫中，投资组合的1%是比特币

单日 7.2 万亿韩元，外资周五净买入创纪录！华尔街：韩股资金面逆风已经消退

突发！OpenAI下一代AI攻克10项菲尔兹奖级难题

如何让自己变得让人工智能永远也无法取代

通过掷骰子离线保管比特币密钥：并非人人愿意为之

交易

热门文章

如何购买NIGHT

热币学习周3：“UNIfication”治理提案截止12月25日，NIGHT或为 Cardano 2026 增长催化剂

相关讨论

热门问答

热门分类

热门标签