快科技 2 月 19 日消息,近日,谷歌 DeepMind 正式发布最新一代 AI 音乐生成模型 Lyria 3,现已作为测试版(Beta)集成至 Gemini 应用,面向全球 18 岁以上用户免费开放。
这款被称为谷歌 " 最先进音乐生成模型 " 的产品,带来了三大核心突破,彻底改变了 AI 音乐创作的游戏规则。

其最引人注目的是其全场景创作能力,用户无需任何音乐基础,即可通过三种方式生成音乐。
文本描述:输入自然语言提示,如 " 一首欢快的雷鬼音乐,适合海滩派对 " 或 " 一首关于太空探索的史诗电子乐 ",即可生成带有人声、歌词和乐器伴奏的完整 30 秒歌曲,且自动匹配描述的风格、情绪和节奏。
上传图像:用户上传照片或截图(风景、人物、插画等),模型分析画面氛围,生成契合场景的原创配乐,自动生成专辑封面。
上传视频:上传短视频片段,模型将为视频创作专属背景音乐,完美匹配画面节奏与情感基调。
生成过程仅需几秒,输出为高保真音频,支持多种语言人声,用户可精确控制曲风(流行、摇滚、爵士等)、人声类型(男声、女声、和声)和速度。
目前 Lyria 3 有两个主要限制:生成音乐长度固定为 30 秒,且仅限非商业用途,谷歌表示,未来将逐步扩展功能,包括更长音乐生成、更多语言支持和商业授权选项。
值得一提的是,谷歌为 Lyria 3 生成的音乐内置了 SynthID 水印技术,可识别 AI 生成内容,解决版权归属问题,同时,谷歌强调模型训练数据合规性。



登录后才可以发布评论哦
打开小程序可以发布评论哦