Lyria 3
Google 的音乐与环境音模型家族。两个变体共用同一套提示词接口,用时长换运行速度:
- Lyria 3 Clip —— 短片段、循环、预览,最长 30 秒(约 30 秒运行时间)。
- Lyria 3 Pro —— 含主歌、副歌、过渡段的完整曲目,最长约 2 分钟(约 1 分钟运行时间)。
两个变体都输出 48 kHz 立体声音频。
能力
| 特性 | Lyria 3 Clip | Lyria 3 Pro |
|---|---|---|
| 文生音频 | 支持 | 支持 |
| 最长时长 | 30 秒 | 约 2 分钟 |
| 输出 | 48 kHz 立体声(MP3 / WAV) | 48 kHz 立体声(MP3 / WAV) |
| 人声 + 乐器 | 支持 | 支持 |
| 参考音频 | 不支持 | 不支持 |
| 反向提示词 | 不支持 | 不支持 |
| 参考图像 | 支持 | 支持 |
何时用哪个
- Lyria 3 Clip —— 单一音乐想法的快速迭代、SFX 风格的循环、短小的过场或转场音效。
- Lyria 3 Pro —— 制作级音乐,包含完整曲式(前奏 → 主歌 → 副歌 → 过渡段 → 尾奏),或较长的氛围铺垫 / 音景。
两者的提示词写法通用 —— 先用 Clip 把曲风、配器和情绪敲定,再用 Pro 重跑生成完整作品。
提示词技巧
- 先点曲风和情绪。 "电影管弦乐,慢节奏,忧伤感"胜过"悲伤的音乐"。
- 明确点名乐器。 "独奏钢琴,轻微混响,远处大提琴"给模型可锚定的元素。
- Pro 模式描述结构。 "钢琴前奏慢启 → 人声主歌 → 弦乐主导的副歌 → 回到钢琴" 能直接塑造编曲走向。
- 用提示词控制人声。 写"纯器乐"或"含人声 hook" —— 模型会照办。
局限
- 不支持参考音频输入 —— 通过提示词与可选的参考图像驱动模型
- 不支持种子 / 确定性 —— 每次生成都是新的
- 不支持反向提示词 —— 请描述你想要的,而不是想避免的
- 输出作为单次最终结果交付,无法原地重跑