|
Meta 分享一套用于生成音乐和音频的人工智能工具
# F* v+ ^3 b/ m* `2 R; U* ^6 RAudioCraft 工具可供研究人员使用,其中包括 MusicGen,它能够根据文本和旋律提示生成音乐片段。
& m( Z7 d S2 } |0 @- G& t( T: ?, f( a" \- Q/ t
Meta 发布了一套生成式人工智能工具,旨在根据文本提示创建音乐和音频剪辑。+ {# ]9 B( r, L7 j7 F+ {8 c
+ x J$ \5 J; L* p: k
这些工具(统称为 AudioCraft)可供研究人员使用,“以加深人们对技术的理解”。
2 c& B$ S6 P% q3 u- p
! _1 P7 O3 p; w+ P4 H
该人工智能工具套件包括MusicGen, Meta 在 6 月份发布的音乐制作人工智能模型。MusicGen 构建在 Meta 的 EnCodec 音频标记器之上,可以通过文本和旋律进行提示。这意味着它既可以根据用户输入的文本生成短音乐片段,也可以通过其人工智能变压器模型完成它听到的旋律。/ c1 I) D! A3 C+ u. a0 I
8 ^( D- ^/ r2 L
据 Meta 称,AudioCraft 还包括 EnCodec 的改进版本,它能够以更少的音损生成更高质量的音乐。- x, S; B# z7 T5 n( s
* A) D6 i3 E+ @# N" ^第三个工具称为 AudioGen,它能够根据文本提示生成各种音频剪辑。其中包括环境声音或声音效果,例如狗叫声、汽车喇叭声或木地板上的脚步声。
: U; v K) c- l6 X2 ^
% B s* x3 n4 xMeta 表示,MusicGen 是使用 Meta 拥有且专门授权的音乐进行训练的,而 AudioGen 则是使用公开的音效进行训练。
0 `3 J; q/ ~- I( {2 y7 E
: L( X7 @7 Q. x, R1 B: f' `6 c. GMeta 在博客文章中表示:“AudioCraft 系列模型能够产生具有长期一致性的高质量音频,并且可以通过自然界面轻松交互。”
% R2 S) B, E9 N- V" }* @# \& I$ r9 p* X, m* F& v. D. q
“与该领域之前的工作相比,通过 AudioCraft,我们简化了音频生成模型的整体设计 - 为人们提供了使用 Meta 在过去几年中开发的现有模型的完整方法,同时也使他们能够推动限制并开发自己的模型。”$ ]+ l$ L4 x9 v4 Y; w6 S
3 h6 M8 ]$ H. p! _' jMeta 声称 AudioCraft 是开源的,该公司对其许多人工智能模型也是如此。但某些团体对这一说法提出了质疑,因为这些模型是用于研究目的,而不是遵循开源许可证的具体规则。
) [/ \7 J0 F2 g2 |6 }3 ?! W, q6 ~& T% ^2 Q% a
Voices of Open Source 组织声称 Meta 的 LLaMA 许可证不符合开源标准,因为它“限制了某些用户的商业用途,并限制了模型和软件用于某些目的”。
; j( S: X! K n" T2 _. I2 G3 c L+ N& u1 Q% J# S* e! M
近年来,随着 Dall-E 等文本到图像生成器的兴起,生成式 AI 声名狼藉。但将生成式人工智能应用到各种应用程序中的热潮很大程度上是由去年 11 月发布的 OpenAI 的 ChatGPT 聊天机器人的受欢迎程度的上升推动的。 `; |5 J2 {2 b+ @4 M
|
|