音频应用

 找回密码
 快速注册

QQ登录

只需一步,快速开始

查看: 17141|回复: 0
收起左侧

[后期] 9 款最佳的免费 AI 词干分割器和人声去除器

[复制链接]

694

积分

0

听众

13

音贝

音频应用新手发布

Rank: 3

积分
694
发表于 2024-5-7 18:22:15 | 显示全部楼层 |阅读模式

4 s+ o7 Q+ w$ _! e0 J5 a  H) w7 S) u8 j& x; l- o
AI 主干分离器(或词干分离器)是一种软件工具,可以将完全混合的歌曲文件拆分为每个乐器层的单独声音文件。这些层称为茎。人声去除器专门用于隔离人声,而其他主干分离器可以分离成更多主干,例如贝司、鼓和“其他乐器”。
: K9 L8 g" x7 X5 `" O3 g _url=https://blog-api.landr.com/wp-content/uploads/2024/04/The-X-Best-AI-Stem-Sp.jpg
) ~7 O/ p" a+ T, r' Q( @主干分离器最常见的用途是创建混音、混搭、DJ 编辑和卡拉 OK 乐器。+ _  V5 o+ y$ }- v, w

% u( U- m& O$ b这些工具使用机器学习算法,这些算法经过训练可以识别特定声音的频率素材并自动隔离它们(因此称为“AI”)。
# N/ p+ q3 C1 q/ w! k2 c; w2 K7 p9 k
2 A& H) Q+ w) e9 x" K- S; J6 P _url=https://blog-api.landr.com/wp-content/uploads/2020/01/How-to-Remix-a-Song_f.jpg
& x4 l! G5 e1 t" E- \' A许多人工智能词干分离器和声音去除器使用相同的开源算法,这些算法被封装在不同的包装器中。
" p' }4 \/ u; |) d0 b4 j1 ~! N5 G. e5 A. O8 f6 I0 }  W* `
两种主要的开源词干分割算法是 Spleeter(由Deezer 的音频研究团队开发)和 Demucs(由Meta 位于巴黎的 AI 研究实验室开发)。
, N3 V5 d* G8 Z7 \- h
* [: z$ Q2 Y- o我们比较了多个选项,即使它们使用相同的算法,因为可用性和功能存在差异。
! m5 l# c- y5 K' {) |, d! G" q! ` _url=https://blog.landr.com/_next/image/?url=https%3A%2F%2Fblog-api.landr.com%2F.jpg ( h; p$ v% j' K+ ~
5 d: t0 U' B- J* m
- K( x5 B& X& ~2 P6 p. Q% v3 L. C  c
1. Ultimate Vocal Remover 5 人声取出插件+ g# D2 a- z) g; _! @+ y6 x* l" H
7 x- U# e) _  Y0 e& f0 ?
_url=https://blog-api.landr.com/wp-content/uploads/2024/04/Ultimate-Vocal-Remove.jpg
9 G0 C+ ?( F( O, q) k对于那些密切关注音频分离技术的人来说,UVR5 是一款不可或缺的人工智能音干分离器和人声去除器,而且完全免费。
! R- G! m& Y- d5 O) j, K
% a$ t, Z" |! P$ c  R1 N  m* S! ~3 ^你不仅可以选择不同的算法,甚至还可以使用 “合奏 ”模式,同时使用多种算法,让每种算法都能为你带来特定乐器的优势。
+ r6 g* t( b  E6 q4 o& e
# k7 ^$ W0 }$ r0 U; G: D我们将它设置为 Demucs v4 模式,用了大约 6 分钟就把一首 6 分钟的歌曲分成了 4 个音轨(人声、贝斯、鼓和 “其他”)。
  Z9 Y- d( Q. i  P; U7 f$ I
, O& G9 S% Z+ c虽然我们没有对每种算法和每个音乐层都进行测试,但总体结果质量很高。你的结果可能会有所不同,这取决于你的使用情况和设置。
: Z3 w) e! r# |( L) v. H/ J
7 L6 X9 @* _6 U: z我们还让它为我们的测试歌曲提供了一个乐器版本,具体做法就是去掉人声。
: }9 H% [: E, W# j
9 N4 x' v. Q: Q7 W有些人一开始可能会觉得参数有点吓人,但其实很容易学会,尤其是有了这样一份指南。8 H$ V$ s3 ~: `' m; w
) L4 A% F9 \) [0 F. {) o
作为一款应用软件,它的整体可用性非常出色,我们认为对于任何想要进行人声去除或乐器分离的人来说,它都是不二之选。
, j! N/ B4 k: S, L# H1 ]4 p& k0 H* J4 V2 f
链接:https://ultimatevocalremover.com/
& V7 k% ^6 o1 X6 _$ g
2 u6 \# B1 C8 L# T3 E0 E0 H2. Gaudio Studio4 I; ]% K- p; X5 o: f$ y, J
_url=https://blog-api.landr.com/wp-content/uploads/2024/04/Gaudio-Studiointext-1.webp.jpg 7 @' ?5 k, I5 K1 Q; u: x. q: c
市面上有很多基于浏览器的人工智能音干分离器和人声去除器。$ a. d* w: ^4 f7 [* x0 l3 M
; o, N* Z  A$ G/ f
这些软件可能会在其专用处理器上运行你的分离效果,而不是在你电脑上的本地处理器上运行,这有时可能意味着更好的效果。/ j, w9 h, M, |: w& q
( y1 I% a( w) d# F+ G* R+ k. E
其中很多都不是免费的,但 Gaudio Studio 是个明显的例外。你只需用谷歌账户登录即可。6 Z% b3 P/ p3 e3 |: Y. x9 K/ A

( s0 h0 ]- Y& c+ l登录后,上传要分割的歌曲、选择要分离的乐器层并将歌曲提交到队列中就非常简单了。; O3 }$ O5 ~) S( Q

* G! W# q9 y5 q$ G9 ?大约花了五分钟,Gaudio Studio 就把我们六分钟的测试歌曲分成了人声、低音、鼓和 “其他 ”主干。
& x- ]4 e  l, ~$ j6 ^/ F$ U+ l( e" k* U& o
音质相当出色,即使与我们的 UVR5 测试相比,音源的清晰度也非常高。
8 S7 [- R5 h% l% a6 M. v7 o
2 ~* i8 l' U+ K  a截至 2024 年 4 月,它目前还处于测试阶段,5 月份将升级到新版本。该网站没有解释此次升级的内容,因此我们希望这并不意味着他们计划在短期内将其货币化。
4 @. r( F3 c& O: _  a链接:https://studio.gaudiolab.io/
' n5 Z7 ]6 t2 i$ W* u* b5 }" @7 \) l* y, Z5 y/ f1 {
3. MVSEP
- ]' t# w! d$ Y. [' `% F: H3 a _url=https://blog-api.landr.com/wp-content/uploads/2024/04/MVSEPintext.webp.jpg " p. y! {# t( v/ `

7 _! Q. q. F+ V. H; L. C* w如果你要使用音干分音器进行采样,最好储备一些专业的高质量材料。LANDR Samples 拥有出色的人声、低音、鼓声和乐器音色库,可供探索。
2 u5 A: p4 U  N. d& }8 W& f7 K
4 z+ s/ S9 `. k6 j6 D; X9 m
9 E: M! Y9 ]# l# I: t& E, S这款词干分割器有点像 UVR5,但它是基于浏览器的,而不是独立的。
) Q, p. T" `9 m9 C1 d6 W- h& F  R! O% y% {3 v
它允许你选择多种不同的型号、质量级别和输出格式。
2 F9 c/ Z' G; y, y* G* C9 L/ x5 b* ~+ K+ q  r" X) s6 a$ v  s0 B3 b3 d
不过,你能使用的设置数量和其他优势取决于你选择的服务层级。
0 d& D. @% K+ @+ v6 L, e7 P9 N. R- }( z
" [+ C% A- Q6 R" c我们注册了一个免费账户进行测试,并将六分钟的测试歌曲分为人声、低音、鼓和 “其他 ”主干。
. W! ?# z: ]" N3 h; Z& E# C: ?! L, f2 M) F& G( O) ^- t- Y
我们使用 Demucs v4 模型来查看与 UVR5 的质量是否有差异。我们用了大约五分钟,听起来质量没有明显差别。
) F- b7 Z+ n* S' W" H# H
) T5 V9 P( }0 j6 Q我们不确定在 UVR5 免费的情况下付费购买 MVSEP 是否有优势,但你可以自己进行比较来确定。
3 B& ]9 N% i8 V, J) y7 l& N" g
2 W' H: ^& M# J/ _( [事实上,MVSEP 网站的主要优势可能在于其文档和资源,而非工具本身。
6 `& g+ q. g0 ]' x8 K; e! ]. h4 R8 ?0 \
你可以在他们的网站上找到不同音频分离算法的质量评级比较表,以及不同分离类型的庞大测试结果数据库。
( @* T7 y/ z! R; p0 z: l1 q" j+ R: s
链接:https://studio.gaudiolab.io/7 b8 x( P# u  B4 z
3 u" K! q! C  J/ g! H  q% k' I6 R
4. StemRoller: r3 ]+ s1 S# F8 n4 x
_url=https://blog-api.landr.com/wp-content/uploads/2024/04/StemRollerintext.webp.jpg
  H, D' G, }4 ]7 D; LStemRoller 是另一款使用 Demucs v4 制作的免费 AI 音干分割器和人声去除器。6 H: l# a/ {, [7 H2 @' v
% j. v7 |" |  V8 F! x  B9 c
它可在电脑上独立运行,但与 UVR5 不同的是,它不允许你使用不同的算法或其他设置。相比之下,它的功能设置要少得多。
' M* [; O* D7 E$ Z8 J* @% z5 E* [- w" H
不过,如果你因为要在太多配置中做出选择而感到茫然,这款软件或许值得一试。
( E- h! r- v; X0 U: l9 m& r2 ~/ P) s5 _( C2 p) ~
你只需将文件拖入窗口,它就会立即开始处理。: C" g- ~% a9 {4 P
1 s/ S0 n9 n* N+ C
结果与在 UVR5 中运行 Demucs v4 的质量基本相同。
0 o% \& r- @' E5 d, x/ E) ?9 S/ u! X
除了常见的四个主干外,它还自动为我们提供了一个完整的器乐音轨,没有任何人声痕迹,听起来非常棒。
7 b7 q) h( o  h. J. O+ n: g. j3 C- u. ^1 P/ m
开发者警告说,它可能需要大量的处理能力,并需要长达 15 分钟的时间来生成结果,但在我们的 M2 MacBook Air 上只用了几分钟。. J1 A' i) I8 }- H5 Q$ J

: y' O5 C# ^- K8 N& j: @; m0 \1 i8 ?, O' w
链接:https://mvsep.com/en( U5 y5 R7 n: G  r. J1 H. \

# v* k# J/ n1 z* p( @9 L' H- R. L' o+ R; H2 Z
- v: a: ]0 S+ v' C
5. Spleeter for Max% d2 x/ G" g" c! U$ K/ f
_url=https://blog-api.landr.com/wp-content/uploads/2024/04/Spleeter-for-Maxintext.webp.jpg
" |9 ?8 @$ B4 t% k, R; A
7 U* O9 p+ B$ Z2 l如果在 Live 中运行基于 Spleeter 或 Demucs 的音干分割器,它不会产生实时效果。它仍需要时间将源音频片段处理成干,这些干将以排列视图显示在时间线上。# g% ^% s9 G  A% X- X% m# ~8 J

0 Q9 f) n4 e9 D6 T+ G& Q) F& Z! |8 P3 ~3 `5 E, F3 R! A& T1 F
我们有一个好消息要告诉各位 Max for Live 用户--有好心人制作了一款基于 Spleeter 的设备,你可以在 Ableton Live 中将其用作人工智能音茎分离器。
% y, \& q; q8 P4 r( ?' J9 [& Y' z+ Z; N+ U
不过,对于不熟悉命令行安装的人来说,设置过程可能比较麻烦。你需要遵循几个步骤,在 macOS 上使用终端,在 Windows 上使用 CMD。
5 W6 i2 D& q& O, |# D- x4 E
5 d! w5 g/ b) n. ~$ x. p  q' e: `另一个问题是,由于 Spleeter 算法无法在 M1/M2/M3 Mac 上本地运行,因此这款设备也无法运行。: ~" L8 Q3 i, @- q

, j6 x" E! ~+ P/ f- P# e尽管如此,我们还是在配备英特尔处理器的老款 MacBook Pro 上进行了测试。我们发现它很容易使用,甚至比我们测试过的基于 Demucs 的分音器更快地传送音茎。  L9 B% u( f, [- {  m3 N& ~

" `7 ]: r( \4 i3 }我们发现,它的质量不如 UVR5 或 Gaudio 好,但直接在 Ableton Live 中使用的便利性对某些用户来说可能是值得的。
" C" n8 u7 O5 d  N+ i, U/ P& E2 h* K+ D! K# l4 ]
因此,如果你不介意安装步骤,又有一台兼容的机器,这可能是一个方便的选择。5 A" j; N( \" k/ C# G' Y
+ T! m! z3 A" N6 y
另外,如果你愿意花上 20 美元,也可以购买这款使用 Demucs v4 制作的 Max for Live 音干分割器。
& o- P; R4 G* y$ u( N
, W: g. A) ^, F& {- F链接:https://www.maxforlive.com/library/device/5956/spleeter-for-max1 C3 W, C8 }1 x- R1 V3 h! }1 Q4 V

6 i, P- P, F1 l3 p( t6. Vocal Remover人声移除器( b, b! ?8 W5 |
_url=https://blog-api.landr.com/wp-content/uploads/2024/04/Vocal-Removerintext.webp.jpg $ Q* l5 O3 ?! N& E
3 l: _% b( m7 h5 N& y, A
使用它是免费的,网站似乎也没有明确列出任何限制。7 Y+ i/ x9 j( ?  t" Z; `+ e) y# B
/ e$ M4 p% R8 P% y( g: A) v+ W
然而,当我们试图进行多次测试或尝试完整的声干分离服务时,却被告知要么稍后再试,要么订阅开发者的 Patreon。& _) D6 U( k/ y# I

. B5 `6 ?% [8 ^- E- o3 m+ O  T4 S由此我们推测,除非你选择付费订阅,否则免费版的 Vocal Remover 在两次使用之间会有一段不明确的等待时间。+ H. {9 M2 D6 f3 R- @7 o# m
7 ]9 A' j8 m7 D' L9 }, R8 K5 k
我们的人声移除测试很快,只花了几分钟就完成了人声和乐器的移除。
1 [+ @! z3 I- E& e4 s2 s! n# E5 s/ O* p+ J; |
但我们发现,与 UVR5 和 Gaudio Studio 相比,人声音轨与乐器之间有大量渗漏。
  A( Q! E! F! K# {5 x. b' V1 |2 j
链接:https://vocalremover.org/" A, J$ r2 {6 ^* |

$ w% J4 L" g$ Z9 E0 i7.Fadr Stems7 G+ K( e- \" a: W0 @
_url=https://blog-api.landr.com/wp-content/uploads/2024/04/Fadrintext.webp.jpg 8 k2 A& s5 {& D# t2 S
该网站提供人工智能词干分割器和自动混音工具。
- Y8 O  h+ P0 d* ^* `9 V' o3 Q5 O+ X9 f
注册账户并选择免费计划后,Fadr 会将歌曲分成四个音干,并允许你以 MP3 格式下载。( J. I* c" b8 `+ M- b4 }

) k7 C( N( |" R3 U& L; E如果你想将歌曲分解成四个以上的主干,下载 WAV 格式的歌曲,并使用其他功能,你就必须切换到付费订阅选项。# s' A/ t, o; A& V( K! V) x% {
免费版并不限制每月可分割的歌曲数量,而且 200MB 的文件大小限制似乎对免费版和付费版都适用。
2 m8 A) D# [% m$ B7 f
  z" S" C2 P5 F2 g0 \; _# t它能在五分钟内处理我们的测试歌曲,但处理结果并不是我们所见过的同类产品中质量最高的。
: I# ~* L4 z$ J( ?* y3 [. M# u( k1 C+ |( P0 W1 F3 m; t! m. i
链接:https://fadr.com/stems
. g% P, M+ }6 r
' S# I3 g  D  z2 r! e1 i# F7 Y! o$ `) S+ x
* a/ S* `+ f' z+ Y
8. Audacity 的 OpenVINO 插件2 U9 p! ]) C) R/ W  T& n; Y
_url=https://blog-api.landr.com/wp-content/uploads/2024/04/OpenVINO-Plugins-for-.jpg 6 a2 p  W5 r3 V) K8 W3 V

+ [, M4 H/ r/ z* s2 W! U如果你还没有使用 Audacity 作为你的音频编辑工具,那么你一定要考虑一下它。% y* k* {) |7 l

4 Y/ d% n5 A1 Y% O  g如果你已经使用 Audacity,那么你可能还不知道它可以承载通过英特尔 OpenVINO AI 工具包设计的人工智能音干分割器插件。8 Y' I2 a; ~' U2 P8 T2 T

; B! ^+ E  z1 s5 Y我们不知道他们是否利用其中一个开源模型构建了这一功能,但我们很想知道它的性能如何。
9 p! o, t  R1 T; f, a% {- s1 P* a" f1 b4 J) q: j; e
由于这款产品仅限 PC 使用,我们在 Windows 笔记本电脑上进行了测试。安装不像大多数插件那样简单,但也不复杂。& [- z, L0 y# V! o* q$ u0 E& \

/ C1 R  Z( w% o$ e使用 GitHub 页面上的说明进行设置后,插件就非常容易使用了。
& D% |$ H/ s' }: l; J8 k' I只用了不到十分钟,插件就制作出了人声、低音、鼓声和 “其他 ”音轨,并自动将它们作为独立音轨放置在时间轴上。
. R& g; G! L$ {  c) D( K8 `就我们的耳朵而言,它的质量还不错,但比不上 UVR5 或 Gaudio Studio。不过,如果你经常使用 Audacity 并喜欢它的工作流程,它可能是一个不错的选择。- s; n  r& E/ X: P0 r& X& x" c5 J# K
" ]0 d9 Q) ]0 O  q. X
链接:https://github.com/intel/openvino-plugins-ai-audacity
  ?  T& W, l2 P4 U# Y1 n# E1 I" Y; S+ a2 {1 O& G$ Q

9 o' W0 s; c9 ^9 Y  n* ?, v) o7 VAI 词干分离器和人声移除器的历史实际上比你想象的要长。1 Z! n# m# y( e% v9 E; c

2 N$ [$ S# D, W" }7 f, ^因此,你可以在自己已经拥有的音乐软件中找到音干分离功能。
7 c* O! O- b6 T: r8 `  t3 V
7 D$ F* U$ N% C  W. M2 o1 X$ y( @4 riZotope RX 有 “音乐再平衡 ”功能,FL Studio 的制作人版及以上版本也有词干分离功能。
* a" }. v4 W" ?0 C" z4 `8 w7 _. B
这也成为 Serato DJ、rekordbox 和 VirtualDJ 等 DJ 软件的一项功能。8 N/ ^6 R6 b: Z+ t; Z7 a
, n& a: `/ L% `5 G6 s! j) W
; F0 s& B! ^6 n* d, ~
欢迎厂家入驻,推文!免费!微信:yinpinyingyong
您需要登录后才可以回帖 登录 | 快速注册

本版积分规则

音频应用搜索

小黑屋|手机版|音频应用官网微博|音频应用 ( 鄂ICP备16002437号-6 )

GMT+8, 2025-7-15 04:17 , Processed in 0.032073 second(s), 9 queries , Redis On.

Powered by Audio app

快速回复 返回顶部 返回列表