9 款最佳的免费 AI 词干分割器和人声去除器

mvsep · 发表于 2024-5-7

AI 主干分离器（或词干分离器）是一种软件工具，可以将完全混合的歌曲文件拆分为每个乐器层的单独声音文件。这些层称为茎。人声去除器专门用于隔离人声，而其他主干分离器可以分离成更多主干，例如贝司、鼓和“其他乐器”。
_url=https://blog-api.landr.com/wp-content/uploads/2024/04/The-X-Best-AI-Stem-Sp.jpg

_url=https://blog-api.landr.com/wp-content/uploads/2024/04/The-X-Best-AI-Stem-Sp.jpg

主干分离器最常见的用途是创建混音、混搭、DJ 编辑和卡拉 OK 乐器。

这些工具使用机器学习算法，这些算法经过训练可以识别特定声音的频率素材并自动隔离它们（因此称为“AI”）。

_url=https://blog-api.landr.com/wp-content/uploads/2020/01/How-to-Remix-a-Song_f.jpg

_url=https://blog-api.landr.com/wp-content/uploads/2020/01/How-to-Remix-a-Song_f.jpg

许多人工智能词干分离器和声音去除器使用相同的开源算法，这些算法被封装在不同的包装器中。

两种主要的开源词干分割算法是 Spleeter（由Deezer 的音频研究团队开发）和 Demucs（由Meta 位于巴黎的 AI 研究实验室开发）。

我们比较了多个选项，即使它们使用相同的算法，因为可用性和功能存在差异。
_url=https://blog.landr.com/_next/image/?url=https%3A%2F%2Fblog-api.landr.com%2F.jpg

_url=https://blog.landr.com/_next/image/?url=https%3A%2F%2Fblog-api.landr.com%2F.jpg

1. Ultimate Vocal Remover 5 人声取出插件

_url=https://blog-api.landr.com/wp-content/uploads/2024/04/Ultimate-Vocal-Remove.jpg

对于那些密切关注音频分离技术的人来说，UVR5 是一款不可或缺的人工智能音干分离器和人声去除器，而且完全免费。

你不仅可以选择不同的算法，甚至还可以使用 “合奏 ”模式，同时使用多种算法，让每种算法都能为你带来特定乐器的优势。

我们将它设置为 Demucs v4 模式，用了大约 6 分钟就把一首 6 分钟的歌曲分成了 4 个音轨（人声、贝斯、鼓和 “其他”）。

虽然我们没有对每种算法和每个音乐层都进行测试，但总体结果质量很高。你的结果可能会有所不同，这取决于你的使用情况和设置。

我们还让它为我们的测试歌曲提供了一个乐器版本，具体做法就是去掉人声。

有些人一开始可能会觉得参数有点吓人，但其实很容易学会，尤其是有了这样一份指南。

作为一款应用软件，它的整体可用性非常出色，我们认为对于任何想要进行人声去除或乐器分离的人来说，它都是不二之选。

链接：https://ultimatevocalremover.com/

2. Gaudio Studio
_url=https://blog-api.landr.com/wp-content/uploads/2024/04/Gaudio-Studiointext-1.webp.jpg

_url=https://blog-api.landr.com/wp-content/uploads/2024/04/Gaudio-Studiointext-1.webp.jpg

市面上有很多基于浏览器的人工智能音干分离器和人声去除器。

这些软件可能会在其专用处理器上运行你的分离效果，而不是在你电脑上的本地处理器上运行，这有时可能意味着更好的效果。

其中很多都不是免费的，但 Gaudio Studio 是个明显的例外。你只需用谷歌账户登录即可。

登录后，上传要分割的歌曲、选择要分离的乐器层并将歌曲提交到队列中就非常简单了。

大约花了五分钟，Gaudio Studio 就把我们六分钟的测试歌曲分成了人声、低音、鼓和 “其他 ”主干。

音质相当出色，即使与我们的 UVR5 测试相比，音源的清晰度也非常高。

截至 2024 年 4 月，它目前还处于测试阶段，5 月份将升级到新版本。该网站没有解释此次升级的内容，因此我们希望这并不意味着他们计划在短期内将其货币化。
链接：https://studio.gaudiolab.io/

3. MVSEP
_url=https://blog-api.landr.com/wp-content/uploads/2024/04/MVSEPintext.webp.jpg

_url=https://blog-api.landr.com/wp-content/uploads/2024/04/MVSEPintext.webp.jpg

如果你要使用音干分音器进行采样，最好储备一些专业的高质量材料。LANDR Samples 拥有出色的人声、低音、鼓声和乐器音色库，可供探索。

这款词干分割器有点像 UVR5，但它是基于浏览器的，而不是独立的。

它允许你选择多种不同的型号、质量级别和输出格式。

不过，你能使用的设置数量和其他优势取决于你选择的服务层级。

我们注册了一个免费账户进行测试，并将六分钟的测试歌曲分为人声、低音、鼓和 “其他 ”主干。

我们使用 Demucs v4 模型来查看与 UVR5 的质量是否有差异。我们用了大约五分钟，听起来质量没有明显差别。

我们不确定在 UVR5 免费的情况下付费购买 MVSEP 是否有优势，但你可以自己进行比较来确定。

事实上，MVSEP 网站的主要优势可能在于其文档和资源，而非工具本身。

你可以在他们的网站上找到不同音频分离算法的质量评级比较表，以及不同分离类型的庞大测试结果数据库。

链接：https://studio.gaudiolab.io/

4. StemRoller
_url=https://blog-api.landr.com/wp-content/uploads/2024/04/StemRollerintext.webp.jpg

_url=https://blog-api.landr.com/wp-content/uploads/2024/04/StemRollerintext.webp.jpg

StemRoller 是另一款使用 Demucs v4 制作的免费 AI 音干分割器和人声去除器。

它可在电脑上独立运行，但与 UVR5 不同的是，它不允许你使用不同的算法或其他设置。相比之下，它的功能设置要少得多。

不过，如果你因为要在太多配置中做出选择而感到茫然，这款软件或许值得一试。

你只需将文件拖入窗口，它就会立即开始处理。

结果与在 UVR5 中运行 Demucs v4 的质量基本相同。

除了常见的四个主干外，它还自动为我们提供了一个完整的器乐音轨，没有任何人声痕迹，听起来非常棒。

开发者警告说，它可能需要大量的处理能力，并需要长达 15 分钟的时间来生成结果，但在我们的 M2 MacBook Air 上只用了几分钟。

链接：https://mvsep.com/en

5. Spleeter for Max
_url=https://blog-api.landr.com/wp-content/uploads/2024/04/Spleeter-for-Maxintext.webp.jpg

_url=https://blog-api.landr.com/wp-content/uploads/2024/04/Spleeter-for-Maxintext.webp.jpg

如果在 Live 中运行基于 Spleeter 或 Demucs 的音干分割器，它不会产生实时效果。它仍需要时间将源音频片段处理成干，这些干将以排列视图显示在时间线上。

我们有一个好消息要告诉各位 Max for Live 用户--有好心人制作了一款基于 Spleeter 的设备，你可以在 Ableton Live 中将其用作人工智能音茎分离器。

不过，对于不熟悉命令行安装的人来说，设置过程可能比较麻烦。你需要遵循几个步骤，在 macOS 上使用终端，在 Windows 上使用 CMD。

另一个问题是，由于 Spleeter 算法无法在 M1/M2/M3 Mac 上本地运行，因此这款设备也无法运行。

尽管如此，我们还是在配备英特尔处理器的老款 MacBook Pro 上进行了测试。我们发现它很容易使用，甚至比我们测试过的基于 Demucs 的分音器更快地传送音茎。

我们发现，它的质量不如 UVR5 或 Gaudio 好，但直接在 Ableton Live 中使用的便利性对某些用户来说可能是值得的。

因此，如果你不介意安装步骤，又有一台兼容的机器，这可能是一个方便的选择。

另外，如果你愿意花上 20 美元，也可以购买这款使用 Demucs v4 制作的 Max for Live 音干分割器。

链接：https://www.maxforlive.com/library/device/5956/spleeter-for-max

6. Vocal Remover人声移除器
_url=https://blog-api.landr.com/wp-content/uploads/2024/04/Vocal-Removerintext.webp.jpg

_url=https://blog-api.landr.com/wp-content/uploads/2024/04/Vocal-Removerintext.webp.jpg

使用它是免费的，网站似乎也没有明确列出任何限制。

然而，当我们试图进行多次测试或尝试完整的声干分离服务时，却被告知要么稍后再试，要么订阅开发者的 Patreon。

由此我们推测，除非你选择付费订阅，否则免费版的 Vocal Remover 在两次使用之间会有一段不明确的等待时间。

我们的人声移除测试很快，只花了几分钟就完成了人声和乐器的移除。

但我们发现，与 UVR5 和 Gaudio Studio 相比，人声音轨与乐器之间有大量渗漏。

链接：https://vocalremover.org/

7.Fadr Stems
_url=https://blog-api.landr.com/wp-content/uploads/2024/04/Fadrintext.webp.jpg

_url=https://blog-api.landr.com/wp-content/uploads/2024/04/Fadrintext.webp.jpg

该网站提供人工智能词干分割器和自动混音工具。

注册账户并选择免费计划后，Fadr 会将歌曲分成四个音干，并允许你以 MP3 格式下载。

如果你想将歌曲分解成四个以上的主干，下载 WAV 格式的歌曲，并使用其他功能，你就必须切换到付费订阅选项。
免费版并不限制每月可分割的歌曲数量，而且 200MB 的文件大小限制似乎对免费版和付费版都适用。

它能在五分钟内处理我们的测试歌曲，但处理结果并不是我们所见过的同类产品中质量最高的。

链接：https://fadr.com/stems

8. Audacity 的 OpenVINO 插件
_url=https://blog-api.landr.com/wp-content/uploads/2024/04/OpenVINO-Plugins-for-.jpg

_url=https://blog-api.landr.com/wp-content/uploads/2024/04/OpenVINO-Plugins-for-.jpg

如果你还没有使用 Audacity 作为你的音频编辑工具，那么你一定要考虑一下它。

如果你已经使用 Audacity，那么你可能还不知道它可以承载通过英特尔 OpenVINO AI 工具包设计的人工智能音干分割器插件。

我们不知道他们是否利用其中一个开源模型构建了这一功能，但我们很想知道它的性能如何。

由于这款产品仅限 PC 使用，我们在 Windows 笔记本电脑上进行了测试。安装不像大多数插件那样简单，但也不复杂。

使用 GitHub 页面上的说明进行设置后，插件就非常容易使用了。
只用了不到十分钟，插件就制作出了人声、低音、鼓声和 “其他 ”音轨，并自动将它们作为独立音轨放置在时间轴上。
就我们的耳朵而言，它的质量还不错，但比不上 UVR5 或 Gaudio Studio。不过，如果你经常使用 Audacity 并喜欢它的工作流程，它可能是一个不错的选择。

链接：https://github.com/intel/openvino-plugins-ai-audacity

AI 词干分离器和人声移除器的历史实际上比你想象的要长。

因此，你可以在自己已经拥有的音乐软件中找到音干分离功能。

iZotope RX 有 “音乐再平衡 ”功能，FL Studio 的制作人版及以上版本也有词干分离功能。

这也成为 Serato DJ、rekordbox 和 VirtualDJ 等 DJ 软件的一项功能。

帐号		自动登录	找回密码
密码			快速注册

[后期] 9 款最佳的免费 AI 词干分割器和人声去除器

相关帖子