跳到主要内容

Lyria 3

Google 的音乐与环境音模型家族。两个变体共用同一套提示词接口，用时长换运行速度：

Lyria 3 Clip —— 短片段、循环、预览，最长 30 秒（约 30 秒运行时间）。
Lyria 3 Pro —— 含主歌、副歌、过渡段的完整曲目，最长约 2 分钟（约 1 分钟运行时间）。

两个变体都输出 48 kHz 立体声音频。

能力

特性	Lyria 3 Clip	Lyria 3 Pro
文生音频	支持	支持
最长时长	30 秒	约 2 分钟
输出	48 kHz 立体声（MP3 / WAV）	48 kHz 立体声（MP3 / WAV）
人声 + 乐器	支持	支持
参考音频	不支持	不支持
反向提示词	不支持	不支持
参考图像	支持	支持

何时用哪个

Lyria 3 Clip —— 单一音乐想法的快速迭代、SFX 风格的循环、短小的过场或转场音效。
Lyria 3 Pro —— 制作级音乐，包含完整曲式（前奏 → 主歌 → 副歌 → 过渡段 → 尾奏），或较长的氛围铺垫 / 音景。

两者的提示词写法通用 —— 先用 Clip 把曲风、配器和情绪敲定，再用 Pro 重跑生成完整作品。

提示词技巧

先点曲风和情绪。 "电影管弦乐，慢节奏，忧伤感"胜过"悲伤的音乐"。
明确点名乐器。 "独奏钢琴，轻微混响，远处大提琴"给模型可锚定的元素。
Pro 模式描述结构。 "钢琴前奏慢启 → 人声主歌 → 弦乐主导的副歌 → 回到钢琴" 能直接塑造编曲走向。
用提示词控制人声。 写"纯器乐"或"含人声 hook" —— 模型会照办。

局限

不支持参考音频输入 —— 通过提示词与可选的参考图像驱动模型
不支持种子 / 确定性 —— 每次生成都是新的
不支持反向提示词 —— 请描述你想要的，而不是想避免的
输出作为单次最终结果交付，无法原地重跑

能力
何时用哪个
提示词技巧
局限