Stability AI 发布人工智能音乐生成器 Stable Audio

hewin · 发表于 2023-9-15 22:39:57

Stability AI 发布人工智能音乐生成器 Stable Audio

stability AI 是一家总部位于伦敦的初创公司，开发了开源图像生成人工智能模型 Stable Diffusion，该公司发布了Stable Audio ，这是一种能够使用“潜在扩散”技术创建用于商业用途的高质量音乐的工具。

就在这家人工智能初创公司开始探索生成音频并软发布其 Dance Diffusion AI 音乐工具一年后，据报道，Stability AI 面临着投资者的压力，要求为其创收产品注入超过 1 亿美元的资金。

据彭博社最初报道，该公司已筹集了超过 1.25 亿美元的资金，最近又在 6 月份通过可转换票据筹集了 2500 万美元。此次交易预计将使该初创公司最初的 10 亿美元估值增加至 40 亿美元。

怎么运行的
据TechCrunch 独家报道，Stable Audio 是由 Stability 的音频团队开发的，该团队于 4 月份正式成立，从 Dance Diffusion 中汲取灵感。

据 Stability AI 称，这款新工具是“首款用于音乐和音效生成的产品”，能够创建用于商业用途的高质量 44.1 kHz 立体声。通过利用其音频模型的潜在扩散，与其他一些生成式人工智能模型相比，它还能够生成具有更连贯和旋律效果的器乐。

值得注意的是，生成的音乐曲目长约 90 秒，其连贯性超出了其他人工智能工具通常生成的较短音频片段的范围。

与 Dance Diffusion（从有限的声音采样生成简短的随机音频片段）不同，Stable Audio 可以生成更长的音频 - 长达 90 秒，用户还可以利用文本提示更好地控制音乐曲目的生成和所需的长度。

稳定音频输出背后的秘密是“潜在扩散”，这种技术类似于稳定扩散中用于生成图像的技术。该模型逐渐从起始歌曲中减去噪音，使其更接近所提供的文本描述。它在商业音乐库 AudioSparx 的帮助下，对一系列歌曲（不包括声乐曲目）进行了训练，以避免道德和版权问题。

Stability AI 音频副总裁 Ed Newton-Rex 通过电子邮件告诉TechCrunch，该初创公司目前正在跨各种内容类型（或“模式”）构建“基础人工智能模型”。

他详细阐述了稳定扩散的扩展，包括语言、代码和音乐。“我们相信生成人工智能的未来是多模态的，”他解释道。

稳定音频目前通过网络应用程序提供，因为它不是开源的。在 Pro Tier 会员资格下，用户每月可以创建 500 首商业化曲目，最长长度为 90 秒，费用为 11.99 美元。

另一方面，免费用户每月只能播放 20 首非商业化曲目，每首曲目时长 20 秒。

据TechCrunch 报道，Stable Audio 的服务条款还表明，Stability 可能会将用户的提示、歌曲和数据用于各种目的，包括开发未来的模型和服务。

版权问题
虽然稳定音频等生成式人工智能工具具有商业用途的潜力，但它们引起了版权和道德方面的担忧。

虽然美国版权局（USCO）尚未发布其对人工智能生成音乐的官方立场；上个月，一位联邦法官裁定人工智能生成的音乐不能获得版权保护。

在斯蒂芬·塞勒诉希拉·珀尔穆特和美国版权局一案中，贝丽尔·豪厄尔法官强调，“人类作者身份是版权的基本要求”，其中“公众是版权法的主要受益者”。USCO 发言人同意豪威尔法官的决定，但没有提供任何进一步评论。

本月早些时候，USCO 拒绝向另一个涉及使用 Midjourney 的人工智能生成艺术项目提供版权保护，理由是它“不是人类创作的产物”。

Stability 的方法也没有考虑直接补偿艺术家在训练模型时使用他们的作品。然而，一些艺术家可以选择从训练数据集中删除他们的作品。Stability 的合作伙伴 AudioSparx 为平台上的音乐家提供收入分成，如果他们选择参加培训或为未来版本做出贡献，他们就可以从 Stable Audio 中获利。

Stability AI 最近面临财务问题，包括延迟向员工付款和工资税，尽管该公司否认有任何此类困难。虽然该公司的目标是通过 Stable Audio 和其他人工智能模型扭转命运，但要成为生成人工智能和音乐领域的有力竞争者，它肯定面临一些挑战。

编者注：本文由nft now工作人员与OpenAI的GPT-3.5合作撰写。

https://stability.ai/stable-audio

帐号		自动登录	找回密码
密码			快速注册

[资讯] Stability AI 发布人工智能音乐生成器 Stable Audio

相关帖子

浏览过的版块