|
谷歌的新人工智能系统可以通过从文本描述中生成音乐
MusicLM 是谷歌开发的一个人工智能系统,它可以从文本描述中生成任何类型的音乐。
虽然这不是该领域的第一个人工智能系统,但它绝对是第一个克服了其他系统的所有限制而真正完成这项工作的系统。
虽然谷歌目前不打算发布它,但一份详细的学术论文显示,MusicLM 在 280,000 小时的音乐数据集上来学习如何生成由相关性的歌曲,以学习如何根据创作者解释为非常复杂的描述来生成连贯的歌曲。其中一些文本描述的示例包括诸如“具有低低音和强劲底鼓的柏林 90 年代电子乐”来生成音乐。 而它生成的音乐听起来尽管不一定具有创造性或非常耐听,但明显的像是人类艺术家的作曲。
MusicLM 的人工智能功能不仅限于生成歌曲短片。谷歌研究人员表明,该系统可以建立在现有旋律的基础上,无论是哼唱、演唱、吹口哨还是在乐器上演奏。此外,MusicLM 可以采用几个按顺序编写的描述(例如“冥想时间”、“起床时间”、“跑步时间”、“100% 全力以赴时间”)并创建一段旋律组成的故事,或是长达好几分钟的叙事——非常适合电影配乐。
解决为什么还没有公开发布这个的任何计划,共同作者在测试期间发现系统生成的大约 1% 的音乐是直接从它训练的歌曲中复制的,他们写道,“我们承认风险与用例相关的创造性内容的潜在盗用。我们强烈强调未来需要开展更多工作来应对这些与音乐生成相关的风险。”
该模型从丰富的字幕中生成 24 KHZ 音乐,例如“雷鬼和电子舞曲的融合,具有空间感、超凡脱俗的声音。引发迷失在太空中的体验。”
PIC.TWITTER.COM/XPV0PEQBUH
|
|