|
Stability AI 发布人工智能音乐生成器 Stable Audio; P5 [6 g; k- O. e0 }% J
7 j7 X3 Q: u, C n5 [* c
stability AI 是一家总部位于伦敦的初创公司,开发了开源图像生成人工智能模型 Stable Diffusion,该公司发布了Stable Audio ,这是一种能够使用“潜在扩散”技术创建用于商业用途的高质量音乐的工具。 ) K7 {$ e8 ^' C# r3 s2 R& C: f4 m
! c0 G- B! t# [- \7 F9 ?' [0 u5 l就在这家人工智能初创公司开始探索生成音频并软发布其 Dance Diffusion AI 音乐工具一年后,据报道,Stability AI 面临着投资者的压力,要求为其创收产品注入超过 1 亿美元的资金。
4 N0 {. j9 a; \* m( S* x- p0 |5 C: u/ }2 [: K7 |+ Q# A
据彭博社最初报道,该公司已筹集了超过 1.25 亿美元的资金,最近又在 6 月份通过可转换票据筹集了 2500 万美元。此次交易预计将使该初创公司最初的 10 亿美元估值增加至 40 亿美元。( A( B& ?. j( d0 |
. L* D1 a/ ~' Y) u5 M# A& I
怎么运行的; }" x% ~- a: H4 x/ A+ q, C
据TechCrunch 独家报道,Stable Audio 是由 Stability 的音频团队开发的,该团队于 4 月份正式成立,从 Dance Diffusion 中汲取灵感。
& b4 ~+ N0 Y y7 q7 q/ c$ D" ^
9 y* \( Y7 v+ t+ g5 G据 Stability AI 称,这款新工具是“首款用于音乐和音效生成的产品”,能够创建用于商业用途的高质量 44.1 kHz 立体声。通过利用其音频模型的潜在扩散,与其他一些生成式人工智能模型相比,它还能够生成具有更连贯和旋律效果的器乐。 8 n! ]$ s# j/ a& n; j* @
* _* e9 Y9 |( }4 d$ v/ K& X
值得注意的是,生成的音乐曲目长约 90 秒,其连贯性超出了其他人工智能工具通常生成的较短音频片段的范围。3 v7 z4 K! o1 _* v% s0 w/ ]0 o
7 W$ E0 N+ i" O( A与 Dance Diffusion(从有限的声音采样生成简短的随机音频片段)不同,Stable Audio 可以生成更长的音频 - 长达 90 秒,用户还可以利用文本提示更好地控制音乐曲目的生成和所需的长度。 ; W# j9 H% M. [: D, I
# V- Q# }3 O- ~5 B. X, j2 A
稳定音频输出背后的秘密是“潜在扩散”,这种技术类似于稳定扩散中用于生成图像的技术。该模型逐渐从起始歌曲中减去噪音,使其更接近所提供的文本描述。它在商业音乐库 AudioSparx 的帮助下,对一系列歌曲(不包括声乐曲目)进行了训练,以避免道德和版权问题。
1 L- U6 G3 ]! x8 P) @* G6 w
6 l% K( [: l$ i1 ]& `2 V8 z7 G s* Q% H; ?Stability AI 音频副总裁 Ed Newton-Rex 通过电子邮件告诉TechCrunch,该初创公司目前正在跨各种内容类型(或“模式”)构建“基础人工智能模型”。
# N7 z/ h3 T! U
) [# K( f# @; T3 f8 A% q他详细阐述了稳定扩散的扩展,包括语言、代码和音乐。“我们相信生成人工智能的未来是多模态的,”他解释道。
# _: {2 B& P) G2 E. K5 g0 J ^2 M) w( Y4 J1 @+ O
稳定音频目前通过网络应用程序提供,因为它不是开源的。在 Pro Tier 会员资格下,用户每月可以创建 500 首商业化曲目,最长长度为 90 秒,费用为 11.99 美元。
( D! X$ ^( K% O5 _0 ^
% J" v% \( Y4 ^& I* A' w另一方面,免费用户每月只能播放 20 首非商业化曲目,每首曲目时长 20 秒。 - ?9 w" N4 ?' N$ ?! F
2 v6 i2 H J5 z3 ]
据TechCrunch 报道,Stable Audio 的服务条款还表明,Stability 可能会将用户的提示、歌曲和数据用于各种目的,包括开发未来的模型和服务。; t1 h( c: S" i# I* A2 a* G6 ^9 s
$ S1 l" @1 C. R, n" r; S% Z8 p/ j版权问题
4 `( g! N* J: K/ B9 d虽然稳定音频等生成式人工智能工具具有商业用途的潜力,但它们引起了版权和道德方面的担忧。
2 }. h$ Y! t9 D3 l* i1 L: b. H# N- q/ ^0 Q- g. H
虽然美国版权局(USCO)尚未发布其对人工智能生成音乐的官方立场;上个月,一位联邦法官裁定人工智能生成的音乐不能获得版权保护。
( S" k$ I- L: Q, M) F- Z% h9 {3 [; L" V! m% e1 x. c+ P* u
在斯蒂芬·塞勒诉希拉·珀尔穆特和美国版权局一案中,贝丽尔·豪厄尔法官强调,“人类作者身份是版权的基本要求”,其中“公众是版权法的主要受益者”。USCO 发言人同意豪威尔法官的决定,但没有提供任何进一步评论。
. @0 B6 V: g/ z& B- u& W& `. O+ V9 R( P+ Q4 r0 U/ @
本月早些时候,USCO 拒绝向另一个涉及使用 Midjourney 的人工智能生成艺术项目提供版权保护,理由是它“不是人类创作的产物”。
X6 l: b/ P) V' f( f, j) L/ R& J$ m5 q% z W2 g5 I* G
Stability 的方法也没有考虑直接补偿艺术家在训练模型时使用他们的作品。然而,一些艺术家可以选择从训练数据集中删除他们的作品。Stability 的合作伙伴 AudioSparx 为平台上的音乐家提供收入分成,如果他们选择参加培训或为未来版本做出贡献,他们就可以从 Stable Audio 中获利。1 y; }/ s# ?. n5 q
: f8 ^4 R8 H7 O7 AStability AI 最近面临财务问题,包括延迟向员工付款和工资税,尽管该公司否认有任何此类困难。虽然该公司的目标是通过 Stable Audio 和其他人工智能模型扭转命运,但要成为生成人工智能和音乐领域的有力竞争者,它肯定面临一些挑战。 + @; o$ Z' Y8 n" }" [
' w- x g0 `& Q; |5 e. f, p编者注:本文由nft now工作人员与OpenAI的GPT-3.5合作撰写。
b9 a# ?8 K1 p+ z
U1 J9 Y0 D7 C" shttps://stability.ai/stable-audio |
|