音频应用

 找回密码
 快速注册

QQ登录

只需一步,快速开始

阅读: 3931|回复: 0
收起左侧

[资讯] Stability AI 发布人工智能音乐生成器 Stable Audio

[复制链接]

669

积分

1

听众

23

音贝

音频应用新手发布

Rank: 3

积分
669
发表于 2023-9-15 | |阅读模式
音频应用公众号资讯免费发布推广
Stability AI 发布人工智能音乐生成器 Stable Audio' a4 j5 ^) Z$ u, H" O

. ~  {# V) @3 V# @stability AI 是一家总部位于伦敦的初创公司,开发了开源图像生成人工智能模型 Stable Diffusion,该公司发布了Stable Audio ,这是一种能够使用“潜在扩散”技术创建用于商业用途的高质量音乐的工具。
% Y& f! T9 k0 i# R
+ L& _- Y) r% ^# Y% F5 J就在这家人工智能初创公司开始探索生成音频并软发布其 Dance Diffusion AI 音乐工具一年后,据报道,Stability AI 面临着投资者的压力,要求为其创收产品注入超过 1 亿美元的资金。
5 p6 A4 G, m7 U2 w* R3 d8 k# u* T6 ]
据彭博社最初报道,该公司已筹集了超过 1.25 亿美元的资金,最近又在 6 月份通过可转换票据筹集了 2500 万美元。此次交易预计将使该初创公司最初的 10 亿美元估值增加至 40 亿美元。
, C9 H  p' p( k/ Q8 W# T Gradient_1 (2).png
0 e" |( }0 P" u9 p! a, t: f怎么运行的
' D; _- a" K6 u' |7 n2 t% Y) B据TechCrunch 独家报道,Stable Audio 是由 Stability 的音频团队开发的,该团队于 4 月份正式成立,从 Dance Diffusion 中汲取灵感。3 j' ~* r- \. p
* o& X' U  T% |" v" W0 T
据 Stability AI 称,这款新工具是“首款用于音乐和音效生成的产品”,能够创建用于商业用途的高质量 44.1 kHz 立体声。通过利用其音频模型的潜在扩散,与其他一些生成式人工智能模型相比,它还能够生成具有更连贯和旋律效果的器乐。
  b# H2 M3 s; A( q2 L
; A* k8 i5 Y0 c8 @值得注意的是,生成的音乐曲目长约 90 秒,其连贯性超出了其他人工智能工具通常生成的较短音频片段的范围。9 u- S1 ^6 K" w2 }

2 E% H9 s! C# y! D# g6 x; y5 d9 H与 Dance Diffusion(从有限的声音采样生成简短的随机音频片段)不同,Stable Audio 可以生成更长的音频 - 长达 90 秒,用户还可以利用文本提示更好地控制音乐曲目的生成和所需的长度。
! z/ _; F! A, l8 u$ `+ u5 Z" e! s" t; ~+ C: c% V# T  Y' Y
稳定音频输出背后的秘密是“潜在扩散”,这种技术类似于稳定扩散中用于生成图像的技术。该模型逐渐从起始歌曲中减去噪音,使其更接近所提供的文本描述。它在商业音乐库 AudioSparx 的帮助下,对一系列歌曲(不包括声乐曲目)进行了训练,以避免道德和版权问题。
9 N7 A' }* E$ H" {) u5 `, i
1 k6 F* F* A) p2 JStability AI 音频副总裁 Ed Newton-Rex 通过电子邮件告诉TechCrunch,该初创公司目前正在跨各种内容类型(或“模式”)构建“基础人工智能模型”。$ U6 _7 N+ ~2 c
5 i* W, M+ Z' q5 S# ~! g3 K
他详细阐述了稳定扩散的扩展,包括语言、代码和音乐。“我们相信生成人工智能的未来是多模态的,”他解释道。 3 ]. W+ t# Z3 U1 I! x. w2 k

8 v4 l- `) V& L- G/ _5 a/ Q稳定音频目前通过网络应用程序提供,因为它不是开源的。在 Pro Tier 会员资格下,用户每月可以创建 500 首商业化曲目,最长长度为 90 秒,费用为 11.99 美元。
7 w8 Q" E+ j5 Y# {
) p' l% N, a4 I" A) D  c9 Y. x$ n另一方面,免费用户每月只能播放 20 首非商业化曲目,每首曲目时长 20 秒。
) o" `3 W' S  K
  c4 Z; I; x; x3 V据TechCrunch 报道,Stable Audio 的服务条款还表明,Stability 可能会将用户的提示、歌曲和数据用于各种目的,包括开发未来的模型和服务。
& h& m  ~# r- S- K" E5 Q/ f. c' y8 f9 G! m" x2 E
版权问题
9 A5 M# Y5 v; t1 N虽然稳定音频等生成式人工智能工具具有商业用途的潜力,但它们引起了版权和道德方面的担忧。 : ]' W/ z0 u* B9 e% j" `( k5 Y2 D
( [$ ]3 N9 N* Y3 L  W4 ?9 f
虽然美国版权局(USCO)尚未发布其对人工智能生成音乐的官方立场;上个月,一位联邦法官裁定人工智能生成的音乐不能获得版权保护。
% _; e0 ~! B5 [8 p/ X/ M( W4 H5 `/ X. |. y
在斯蒂芬·塞勒诉希拉·珀尔穆特和美国版权局一案中,贝丽尔·豪厄尔法官强调,“人类作者身份是版权的基本要求”,其中“公众是版权法的主要受益者”。USCO 发言人同意豪威尔法官的决定,但没有提供任何进一步评论。  m  n8 C4 m4 o, _4 P7 g1 I8 _

  i7 g/ y& P2 U" w' o本月早些时候,USCO 拒绝向另一个涉及使用 Midjourney 的人工智能生成艺术项目提供版权保护,理由是它“不是人类创作的产物”。
8 c  L; P2 p6 J/ d! A: ]- i
9 R; G) w# J- N* |Stability 的方法也没有考虑直接补偿艺术家在训练模型时使用他们的作品。然而,一些艺术家可以选择从训练数据集中删除他们的作品。Stability 的合作伙伴 AudioSparx 为平台上的音乐家提供收入分成,如果他们选择参加培训或为未来版本做出贡献,他们就可以从 Stable Audio 中获利。9 t2 p: ~' k, G

. n$ k* m* w8 E5 f8 }Stability AI 最近面临财务问题,包括延迟向员工付款和工资税,尽管该公司否认有任何此类困难。虽然该公司的目标是通过 Stable Audio 和其他人工智能模型扭转命运,但要成为生成人工智能和音乐领域的有力竞争者,它肯定面临一些挑战。 3 s% d; {2 w9 x8 a' s

, }% o' I( i( T/ X* ?; f- Z编者注:本文由nft now工作人员与OpenAI的GPT-3.5合作撰写。# U+ N9 \% {# T3 `

8 |+ Q4 f( L1 L# l) Yhttps://stability.ai/stable-audio
欢迎厂家入驻,推文!免费!微信:yinpinyingyong
您需要登录后才可以回帖 登录 | 快速注册

本版积分规则

音频应用搜索

小黑屋|手机版|音频应用官网微博|音频招标|音频应用 (鄂ICP备16002437号)

Powered by Audio app

快速回复 返回顶部 返回列表