跳到主要内容

Lyria 3

Google 的音乐与环境音模型家族。两个变体共用同一套提示词接口,用时长换运行速度:

  • Lyria 3 Clip —— 短片段、循环、预览,最长 30 秒(约 30 秒运行时间)。
  • Lyria 3 Pro —— 含主歌、副歌、过渡段的完整曲目,最长约 2 分钟(约 1 分钟运行时间)。

两个变体都输出 48 kHz 立体声音频。

能力

特性Lyria 3 ClipLyria 3 Pro
文生音频支持支持
最长时长30 秒约 2 分钟
输出48 kHz 立体声(MP3 / WAV)48 kHz 立体声(MP3 / WAV)
人声 + 乐器支持支持
参考音频不支持不支持
反向提示词不支持不支持
参考图像支持支持

何时用哪个

  • Lyria 3 Clip —— 单一音乐想法的快速迭代、SFX 风格的循环、短小的过场或转场音效。
  • Lyria 3 Pro —— 制作级音乐,包含完整曲式(前奏 → 主歌 → 副歌 → 过渡段 → 尾奏),或较长的氛围铺垫 / 音景。

两者的提示词写法通用 —— 先用 Clip 把曲风、配器和情绪敲定,再用 Pro 重跑生成完整作品。

提示词技巧

  • 先点曲风和情绪。 "电影管弦乐,慢节奏,忧伤感"胜过"悲伤的音乐"。
  • 明确点名乐器。 "独奏钢琴,轻微混响,远处大提琴"给模型可锚定的元素。
  • Pro 模式描述结构。 "钢琴前奏慢启 → 人声主歌 → 弦乐主导的副歌 → 回到钢琴" 能直接塑造编曲走向。
  • 用提示词控制人声。 写"纯器乐"或"含人声 hook" —— 模型会照办。

局限

  • 不支持参考音频输入 —— 通过提示词与可选的参考图像驱动模型
  • 不支持种子 / 确定性 —— 每次生成都是新的
  • 不支持反向提示词 —— 请描述你想要的,而不是想避免的
  • 输出作为单次最终结果交付,无法原地重跑