近日,一则消息引爆音乐圈。人工智能歌手萨尼娅 · 莫奈成为首位凭借电台播放量登上美国公告牌成人 R&B 电台播放榜的 AI 艺人,随着单曲《How was I supposed to know》的走红甚至签下了价值约 300 万美元的唱片合约。AI 艺人上榜速度还在迅速加快,连续四周均有 AI 艺人亮相 " 新兴艺人榜 "。
整个音乐产业的反应撕裂成两极,而更值得关注的,或许是这一现象背后所揭示的创作转向:AI 歌手的兴起并非意在取代人类,而是行走在拓展音乐语言边界的轨道上,成为一种与人类情感和想象力并行不悖,甚至可相互激发的新艺术表达形式,它迫使我们重新思考创作的本质和艺术的定义。

从 " 工具 " 到 " 语言 ":AI 歌手的演进
与初音未来、洛天依这类 " 声库工具 " 有所区别,萨尼娅 · 莫奈所代表的是由 " 生成式人工智能 " 推动的创作主体。她的创造者特丽莎 · 妮基 · 琼斯在美国哥伦比亚广播早间新闻节目里坦言了她利用 AI 创作的原始动机:圆一个未曾实现的音乐梦。
特丽莎从小在唱诗班的氛围中长大,内心蕴藏着对音乐的深切热爱,然而,由于自己的嗓音条件并不出众,她始终未曾踏上职业音乐人的道路。这份深藏心底的遗憾,成为了她日后创作的情感基石。直到她接触到人工智能音乐创作平台 Suno,才发现自己可以用另外一种形式唱出心中的旋律。于是她潜心研究如何能与 AI 进行对话。
特丽莎的创作始于她的诗库,这些诗歌是她个人情感和经历的结晶,构成了歌曲的歌词部分,这也是整个创作过程中最具有 " 人性 " 和原创性的元素。随后,她会将这些歌词输入到 Suno 平台中,并辅以一系列详细的文本提示词。这些提示词涵盖了音乐的各个方面,比如:慢节奏的 R&B 风格、女性灵魂唱腔、轻柔的吉他、沉重的鼓点等。这个输入的阶段,也是连接人类创意和 AI 执行的关键桥梁。AI 会根据歌词的情感基调和节奏,在几秒内创作出与之匹配的旋律线条。同时,它会根据提示词中指定的乐器,进行自动化的编曲和混音。人声部分,AI 会生成一个符合指令描述的声音,并根据旋律和歌词演唱,甚至能处理复杂的转音、颤音技巧,流畅且富有灵魂的、类似人类歌手演唱时的微情感变化。这个 " 处理 " 阶段,是 AI 将抽象的文字指令转化成具体音乐实体的核心环节。AI 生成音乐的最后一步是 " 输出 " 与 " 筛选 "。Suno 通常会生成两个版本的歌曲供特丽莎选择,听完后如果不符合她的创作意图,特丽莎就会继续调整提示词,或者保持原有设置,再次生成新的版本。这个过程可能需要重复成百上千次,直至她寻到心中的那个最完美的版本为止。
谈到上榜歌曲的创作背景,特丽莎透露,这首歌的灵感来源于她八岁时失去父亲的创伤经历。这种源于生命早期的深刻情感,为歌曲注入了无法伪造的真实性,使得许多有过相似经历的听众能够产生强烈的共鸣。当听众了解到歌词背后的真实故事后,AI 赋予的外壳便显得不那么重要,因为传递情感的核心,歌词以及背后的故事是百分之百真实的。正如特丽莎所言:" 萨尼娅 · 莫奈是我的延伸,她的形象就是我本人。"

创作的新劳动:从 " 指令 " 到 " 对话 "
在 AI 参与创作的过程中,人类创作者的核心能力正在发生转变。他们不再仅仅依赖音乐理论和技艺的打磨,而是需要发展出一种新的表达能力:如何用精准、生动、富有启发性的语言,将内心的真实情感经历和音乐想象力转化为 AI 能够理解并执行的 " 创意指令 "。
在创作中为获得 " 恰到好处的哽咽感 ",特丽莎曾尝试了 32 种提示词变体——有的让 AI 理解成了随机噪音,有时提示词则导致了机器停顿,最终使用 "Stochastic" 这一数学中描述不确定性的标准术语,而精准触发了 Suno 模型中 " 随机性中断的不完美发声 " 节点,生成出了目标效果。
有时 AI 能执行却 " 误解 " 的指令,反倒成为了创作者灵感的富矿。特丽莎在生成《How was I supposed to know》时,最初提示词指向 " 温暖的灵魂乐 ",但是 AI 某次输出时却混入了冷感的电子故障音。这个意外使得歌曲获得了听感上的 " 情感温差 "," 误打误撞 " 产生的失真噪声反而强化了歌词中 " 无法预知命运 " 的无力感。
人与 AI 之间启发,也被启发;引导,也被引导,使得创作不仅是产出音乐,更像是一场 AI 倒逼的自我解剖。这个过程,本质上是一场人机之间的对话。使用者输入相似的指令,可能会得到风格迥异、质量不一的多个版本。创作过程不再是从零到一的线性推进,而更像是一种不断地开盲盒的体验,不断从开出的盲盒中筛选、寻找出符合自己愿景的声音。每个盲盒都是算法对人性的一次统计学翻译,而创作者的任务是在数百个 " 翻译版本 " 中,听见那个能反向照亮自己情感盲区的回声。
AI 是一面镜子,也是一扇窗
AI 歌手能够稳定地产出批量的、兼具熟悉感与新意的作品,这正是其能快速在流行榜单中占据一席之地的原因。在流媒体主导的音乐消费时代,听众越来越倾向于 " 场景化 " 的聆听,音乐不再只是需要凝神欣赏的完整艺术品,更是陪伴、氛围与情绪的载体。
AI 像一面镜子,映照出当下音乐工业的某些困境:套路化生产、创意重复、情感稀薄。当 AI 能在五分钟内就批量炮制出当代最流行模版的歌曲,是不是也说明人类的创作早已化为了 " 人肉算法 "?据公告牌的研究所揭示,过去十三年间,80% 的冠军单曲都建立在相同的四种和弦框架上。AI 能用几十秒写出一首歌,因为它可以直接调取硬盘里的模版数据;而人类可能得花上数倍的时间,因为人类靠的是经验和记忆去调取创作模版,这就是 " 人肉算法 "。人类和 AI 干的是同一件事,只不过人类读取的是 " 生物硬盘 ",读取速度要慢得多。
AI 也是一扇窗,为我们打开了新的可能。特丽莎创造出的 AI 艺人已与唱片公司签署价值高达 300 万美元合约。这种现象不仅是资本市场对 AI 歌手商业潜力的敏锐捕捉,在更深层次上也是对这种以 AI 为笔、书写个人故事的独特性的一种肯定。在套路可以被无限复制的时代,纯粹的个人故事反而成为了最稀缺的资产。传统音乐工业要创作出一首优质歌曲,需要写词、作曲、编曲、演唱、表演各个环节人才的分工配合,或者创作者样样都得精通。而 AI 的出现,重新定义了音乐的创作,它将技术性劳动和创意决策分开。AI 创作者更像是一位创意导演,一位与 AI 协作的 " 画师 ",用语言和想象力勾勒出音乐的轮廓与色彩。你可以是一名心理疗愈师,将患者的故事写成歌词来生成疗愈音乐;也可以是一名公司上班的白领,在午休时用手机录下随意哼唱的旋律,让 AI 来延展你的情绪;同样你也可以是一名退休老教师,用 AI 谱出属于自己的流金岁月。AI 的发展并非要取代人类的创造力,而是将其从某些重复性、技术性的劳动中解放出来,促使创作者去探索那些真正属于人类的情感深度与艺术独特性。
AI 的独特价值,在于在 " 不懂 " 中拓展表达的边界,它可能不理解人类世界中的悲与喜、爱与恨,但却能将这些情感符号转化为非人的声学结构,而这种结构却反向地让人意识到在 AI 的这些 " 错误 " 里,是不是能照见更深层的自我,发现自我从未想过的表达路径?
萨尼娅 · 莫奈的登榜,绝非一个终点,而是一个起点。AI 歌手作为一种已然存在且不可逆的新兴艺术形式,是我们必须直面的现实。未来,AI 歌手与人类歌手、创作者之间并非一场你死我活的取代,而更可能走向一种深度与功能化分化的共生。AI 将不断拓展音乐艺术的技术边界,满足娱乐工业对效率、规模与先锋体验的追求,而人类歌手将会更加向内回归,专注于那些唯有人类才能感知并且赋予意义的思考与情感。而对于音乐创作者而言,在这场人机共奏的新乐章中,会有更多来自各行各业的新人群汇入。真正的挑战不仅是如何与 AI 对话,更是在这一过程中,保留住我们自己的语言与情感温度。


登录后才可以发布评论哦
打开小程序可以发布评论哦