Google DeepMind 发布 Lyria 3 Pro:AI 音乐从"30秒试听"变成完整歌曲

marsbit发布于2026-03-26更新于2026-03-26

文章摘要

Google DeepMind于3月25日发布Lyria 3 Pro,距离上一版本仅六周。此次升级的核心是将AI音乐时长从30秒大幅提升至3分钟,并新增“结构感知”能力,使模型能够理解歌曲的内部结构,支持用户通过提示词指定前奏、主歌、副歌等段落,实现更自然的衔接和动态变化,标志着AI音乐工具从“生成器”向“创作工具”迈进。 尽管Suno和Udio早在2025年初已具备类似能力,但Google凭借Gemini生态的分发优势,有望覆盖更广泛的用户群体。同时,通过Vertex AI开放企业级接入,Google正将Lyria嵌入企业工作流。 Lyria 3 Pro支持文字、图片、视频输入,可自动匹配音乐风格,生成包含人声、歌词和乐器的多语言音乐,并自动添加SynthID水印标注AI来源。目前仅限Gemini付费用户使用,按套餐分层提供每日生成次数,免费用户仍限用30秒版本。开发者可通过API接入,企业级应用也已逐步集成。 版权方面,Google称训练数据遵循与艺术家的协议,但未披露具体来源和授权范围,与行业面临的版权争议一致。该功能正逐步开放,部分地区可能存在延迟。

Google DeepMind 于 3 月 25 日推出 Lyria 3 Pro。距离上一版 Lyria 3 发布仅六周,这次升级的核心只有一件事:把生成时长从 30 秒拉到 3 分钟,同时让模型真正理解一首歌的内部结构。

这个跨度不是小幅迭代。 30 秒够用来生成背景音效,但写不了一首歌——没有段落、没有转折、没有高潮。Lyria 3 Pro 新增的"结构感知"能力,允许用户在提示词里指定前奏、主歌、副歌、桥段,模型据此安排段落衔接和动态变化。这是 AI 音乐工具从"生成器"向"创作工具"迈出的关键一步。

Suno 和 Udio 已经做了一年

坦白说,这个能力 Suno 和 Udio 在 2025 年初就具备了,两者生成时长更长,结构控制也更灵活。Google 在这个节点跟上,代表的是它在音乐 AI 赛道真正转入竞争状态——背靠 Gemini 生态的分发能力,Lyria 3 Pro 的用户覆盖面会比任何独立音乐 AI 工具都大得多。

Vertex AI 的同步开放则是另一个信号:Google 不只想做消费端工具,还要把 Lyria 嵌进企业工作流。

具体能做什么

输入支持文字、图片和视频,模型根据内容情绪自动匹配音乐风格。生成内容包含人声、歌词和乐器,覆盖多种语言。所有输出自动嵌入 SynthID 水印,标注 AI 来源——这是 DeepMind 在内容溯源上的一贯做法。

谁能用,怎么用

Gemini App 付费用户现已可以使用。按套餐分层:AI Plus 每天约 10 首,Pro 约 20 首,Ultra 约 50 首。免费用户仍停留在 Lyria 3 的 30 秒版本。

支持语言覆盖英文、日文、韩文、印地语、西班牙文、葡萄牙文、德文、法文等,限 18 岁以上用户使用。操作路径:Gemini App → Create Music → 选择"Thinking"或"Pro"模式。

开发者可通过 Google AI Studio 和 Gemini API 接入;Vertex AI 已进入公开预览,面向企业级按需生成场景。Google Vids 和旗下音乐制作工具 ProducerAI 也已开始集成。企业版 Workspace 支持预计数日内到位。

版权问题仍是悬案

Google 表示训练数据的使用遵循与艺术家的相关协议,但没有披露具体来源和授权范围。这和 Suno、Udio 面临的版权诉讼处于同一背景下——行业对 AI 音乐训练数据的法律争议尚未有定论,Google 的表态更多是立场声明,而非完整答案。

Lyria 3 Pro 目前正在逐步向用户开放,部分地区可能存在延迟。

相关问答

QGoogle DeepMind 最新发布的 Lyria 3 Pro 相比前代版本有哪些主要升级?

ALyria 3 Pro 主要升级包括将生成时长从 30 秒延长至 3 分钟,并新增了'结构感知'能力,允许用户通过提示词指定歌曲的前奏、主歌、副歌、桥段等结构,使模型能够理解并安排段落衔接和动态变化。

QLyria 3 Pro 的'结构感知'能力具体指什么?

A'结构感知'能力是指 Lyria 3 Pro 能够理解一首歌曲的内部结构,用户可以在提示词中指定前奏、主歌、副歌、桥段等段落,模型会根据这些指示来安排音乐的段落衔接和动态变化,从而生成更完整的歌曲。

Q哪些用户可以使用 Lyria 3 Pro,使用限制是什么?

AGemini App 的 AI Plus、Pro 和 Ultra 付费用户可以使用 Lyria 3 Pro,每日生成歌曲数量根据套餐不同分别为约 10 首、20 首和 50 首。免费用户只能使用 Lyria 3 的 30 秒版本。此外,使用需年满 18 岁,支持多种语言,包括英文、日文、韩文等。

QGoogle 如何通过 Lyria 3 Pro 拓展企业级应用?

AGoogle 通过 Vertex AI 开放 Lyria 3 Pro 的公开预览,面向企业级按需生成场景。同时,Google Vids、ProducerAI 等工具已开始集成 Lyria,企业版 Workspace 的支持也预计在数日内到位,旨在将 Lyria 嵌入企业工作流。

QLyria 3 Pro 在版权问题上是如何处理的?

AGoogle 表示训练数据的使用遵循与艺术家的相关协议,但未披露具体来源和授权范围。目前 AI 音乐训练数据的法律争议尚未有定论,Google 的表态更多是立场声明,而非完整答案,这与 Suno、Udio 等工具面临的版权诉讼背景相同。

你可能也喜欢

BTC“数字黄金”的叙事是不是失败了?

这篇文章从三个核心问题探讨了比特币的现状与未来,强调提供的是思考框架而非投资建议。 **如何看待比特币资产?** 作者认为比特币是一种全新的、更优秀的“黄金”资产。其优势在于总量恒定、转移便捷、交易可审计。尽管早期与灰色地带关联,但合规化是趋势。目前全球数字货币渗透率仅3%-4%,类比互联网和电商的早期阶段,意味着比特币仍处于发展初期,潜力巨大但波动性也极高。 **如何理解本轮下跌?** 比特币自2025年10月高点(近12.6万美元)持续下跌,2026年2月一度跌破6.1万美元,单日跌幅达15%,随后又快速反弹。这被解读为遵循四年减半周期的共识性获利了结。特别之处在于,美国比特币ETF的批准引入了机构资金,也促使早期低成本持有者(如矿工和信仰者)进行大规模“换手”,这是资产迈向主流化的必经过程。历史数据显示,比特币历次大跌的幅度在收窄(从93%到当前的约50%),表明资产正在成熟,波动率逐步下降,但高波动仍是其获取超额回报的固有特征。 **长期如何看待发展?** 长期价值可对标黄金。当前比特币市值仅为黄金市值的约7%,若“数字黄金”叙事实现一半,上行空间依然显著。但作者提醒,短期市场脆弱,换手可能未完,底部无法预测。真正的风险并非资产归零(概率较低),而在于错误的仓位管理(如All-in或加杠杆)以及对资产缺乏深刻理解。投资者必须计算并承受潜在的最大回撤(例如从已跌50%的位置再跌50%),才能存活至长期价值兑现。 文章最后以亚马逊在互联网泡沫后暴涨为例,指出关键不在于比特币未来是否上涨,而在于投资者能否通过理性的仓位管理和深度认知,扛过剧烈波动存活到那一天。文末提问引导读者反思:当前黄金涨、比特币跌的局面,究竟意味着“数字黄金”叙事失败,还是资产进化过程中的换手阵痛?这取决于每个人对比特币最底层的信仰。

marsbit33分钟前

BTC“数字黄金”的叙事是不是失败了?

marsbit33分钟前

BTC“数字黄金”的叙事是不是失败了?

标题:BTC“数字黄金”的叙事是不是失败了? 作者:@wuk_Bitcoin 本文从三个核心问题出发,探讨比特币的现状与未来。 **如何看待比特币?** 作者认为比特币是一种全新的、更优秀的“黄金”类资产。其优势在于:总量恒定(2100万枚);资产可转移性极强,在全球不确定性时代具备溢价;所有交易链上可审计,透明度高。反驳了比特币主要用于灰色地带的过时观点,指出其正走向合规。目前全球数字货币渗透率仅约3%-4%,类比互联网和电商早期,意味着该资产类别仍处早期,潜力与巨大波动并存。 **如何理解本轮下跌?** 比特币自2025年10月高点(近12.6万美元)持续下跌,2026年2月初曾单日暴跌15%,跌破6.1万美元。这被视为遵循其四年减半周期的规律性回调,是长期持有者在周期高点锁定利润的结果。本轮下跌的特殊性在于:美国比特币ETF的批准引入了大量机构新资金,但也促使成本极低的早期持有者(矿工、OG)进行历史性抛售,即从“早期信仰者”向“长期配置机构”的换手过程。历史数据显示,比特币历次大回撤的跌幅在逐步收窄(从93%到目前的约50%),表明资产在成熟,波动率在下降,但高波动仍是获取超额回报的代价。 **长期怎么看?** 若将比特币视为“数字黄金”,其当前总市值(约1.4万亿美元)仅为黄金总市值(约20万亿美元)的7%。即使该叙事仅部分实现,上行空间依然可观。但作者强调短期风险:换手可能未结束,市场脆弱,不排除进一步下跌。真正的风险不在于资产归零(概率极低),而在于错误的仓位管理(如All-in、加杠杆)和对资产缺乏深度理解,这可能导致投资者无法承受巨大波动而提前被迫出局。 **最后对比** 作者以亚马逊在互联网泡沫破裂后股价跌95%又最终上涨42倍为例,指出关键在于“活着等到那一天”。对于比特币,核心同样是能否通过理性仓位管理活到其价值兑现之时。文末提问:当黄金大涨而比特币大跌,这究竟是“数字黄金”叙事的失败,还是资产进化过程中的阵痛?答案取决于每个人对比特币最底层的信仰。

链捕手43分钟前

BTC“数字黄金”的叙事是不是失败了?

链捕手43分钟前

从代码到认知:机器人大脑进化的万字指南

本文概述了机器人大脑从传统代码控制到现代人工智能模型驱动的演进历程。文章首先回顾了前大型语言模型(LLM)时代,机器人依赖手工编码的模块化技术栈(感知、状态估计、规划、控制)和行为树,虽稳定但泛化能力差。随后,深度学习改进了感知,强化学习和模仿学习进入了控制层,但策略仍较为狭窄。 ChatGPT的出现带来了转折。LLM最初被用作自然语言编译器,将指令转化为机器人可执行的原子技能序列(如谷歌的SayCan)。但更重要的突破是视觉-语言-动作模型(VLA),例如谷歌的RT-2和开源的OpenVLA,它能将视觉、语言信息融合,直接输出动作指令,实现了推理与行动的耦合。 目前最先进的系统采用“双脑”架构(如Figure AI的Helix、NVIDIA GR00T):一个慢速、参数多的“系统2”负责高层次推理和规划;一个快速、小巧的“系统1”负责高频动作生成。其下还可能有一个“系统0”反射层处理平衡等底层控制。出于延迟和可靠性考虑,安全关键的控制回路通常在机器人本地(如NVIDIA Jetson模块)运行,而对话界面和集群学习等任务可交由云端。 开源模型(如OpenVLA、GR00T、π0)降低了行业门槛,让初创公司能在其基础上用自有数据微调。然而,当前VLA机器人仍存在任务中途恢复能力弱、样本效率低、缺乏物理常识和长期规划能力等局限。 这催生了下一代方向:世界模型。这类模型(如NVIDIA Cosmos、Meta V-JEPA)能根据当前状态和动作预测未来结果,让机器人在行动前进行模拟和评估,从而改善恢复能力、泛化能力和长期规划。架构上主要分为像素级视频扩散、联合嵌入预测架构(JEPA)和潜在动作世界模型等流派。 文章最后指出,数据采集(特别是远程操作数据)是核心竞争力,仿真训练至关重要,机器人成本正在迅速下降。当前物理AI的发展阶段大约相当于“GPT-2时代”,虽未完全自主,但正通过架构的持续演进(从代码到感知、规划、策略,最终到世界模型),朝着更通用、更强大的方向稳步前进。

marsbit1小时前

从代码到认知:机器人大脑进化的万字指南

marsbit1小时前

AI 泡沫正在破裂

近期市场剧烈波动,“AI泡沫论”甚嚣尘上。桥水达利欧认为AI市场存在“相对较高”的泡沫,而英伟达黄仁勋则强调AI算力需求才刚刚开始。两者观点看似矛盾,实则揭示了技术革命初期的典型特征:市场因高估短期影响而产生泡沫,却往往低估其长期颠覆性力量。 回顾2000年互联网泡沫,纳指暴跌78%,超5万亿美元财富蒸发,大量公司破产。然而,泡沫破裂后留下的廉价电信基础设施(如海底光缆),却成为日后流媒体、云计算乃至移动互联网崛起的基石。这符合“阿玛拉定律”:人们高估技术的短期影响,低估其长期影响。泡沫是创新必须缴纳的“智商税”,其破裂能淘汰投机者,沉淀下坚固的基础设施,滋养真正伟大的公司。 当前AI行业同样呈现巨大的“投入-产出”不对称:2026年,五大云服务商的AI基础设施资本开支预计达6900亿美元,而头部纯AI厂商的总收入预计不超过400亿美元。但深层逻辑正在演变:AI推理成本在两年内暴跌超过99.7%,接近零的边际成本解锁了海量长尾需求,驱动企业AI支出翻倍增长。这印证了“杰文斯悖论”——效率提升导致总消耗量指数级上升。如今,各行业关心的已非“是否用AI”,而是如何更有效地整合AI。 市场已进入“幻灭的低谷”前夕,缺乏护城河的套壳公司正批量死亡,这是市场的自我净化。与此同时,价值转移正在发生:1. 从资本开支(CapEx,如硬件)向运营开支(OpEx,如解决垂直行业痛点的应用)转移;2. 高估值正被高速增长的业绩逐步消化。AI已深入制造业(缩短研发周期)、金融(微秒级定价)、法律、医疗等专业领域,成为实质性的生产力工具。 历史总在重演“创造性毁灭”。当下近7000亿美元的基建投资短期内无法全部转化为利润,市场洗牌不可避免。但洗牌之后,廉价的算力与高度优化的算法将赋能千行百业。正如互联网泡沫后我们迎来了数字时代,AI泡沫的喧嚣过后,我们将不可逆转地迈向一个所有行业都由AI深度赋能的智能全盛时代。泡沫终会破裂,但底层先进生产力的势能,没有水分。

链捕手1小时前

AI 泡沫正在破裂

链捕手1小时前

交易

现货
合约

热门文章

加密市场宏观研报:原油飓风、AI巨浪与比特币的十字路口

全球金融市场正经历一场由地缘冲突引发的系统性重估:霍尔木兹海峡封锁导致原油一度暴涨30%,G7紧急释放储备后涨幅收窄,滞胀风险取代通胀成为核心担忧,美元成为“唯一避风港”并逼近100大关,亚太及美股遭遇“黑色星期一”全线重挫;AI领域则冰火两重天,国家发改委提出“十五五”末10万亿规模目标,OpenClaw项目火爆推动概念股狂飙;比特币在宏观风暴中跌破70000美元关键防线。

548人学过发布于 2026.03.12更新于 2026.03.12

加密市场宏观研报:原油飓风、AI巨浪与比特币的十字路口

相关讨论

欢迎来到HTX社区。在这里,您可以了解最新的平台发展动态并获得专业的市场意见。以下是用户对AI(AI)币价的意见。

活动图片