|
, D1 V+ j E0 q# G$ ?+ z
2 J9 {8 \' h' U( `AI 主干分离器(或词干分离器)是一种软件工具,可以将完全混合的歌曲文件拆分为每个乐器层的单独声音文件。这些层称为茎。人声去除器专门用于隔离人声,而其他主干分离器可以分离成更多主干,例如贝司、鼓和“其他乐器”。$ B6 z6 A4 F6 _/ L9 S0 P
) k, \" C) {/ k! w. Y主干分离器最常见的用途是创建混音、混搭、DJ 编辑和卡拉 OK 乐器。
/ i% }8 d' t+ r2 ?! E( ]" S, I! b* a
这些工具使用机器学习算法,这些算法经过训练可以识别特定声音的频率素材并自动隔离它们(因此称为“AI”)。# H( O. }9 Q5 j' ~4 a- z
9 L( | T7 Z$ b
4 M( o! I1 u0 L3 E许多人工智能词干分离器和声音去除器使用相同的开源算法,这些算法被封装在不同的包装器中。; V. p0 p3 I) d
, A! x2 i- _$ }, [
两种主要的开源词干分割算法是 Spleeter(由Deezer 的音频研究团队开发)和 Demucs(由Meta 位于巴黎的 AI 研究实验室开发)。( R) }& i0 w* K: _6 c
3 b% J; M; x0 L0 Q+ r1 V
我们比较了多个选项,即使它们使用相同的算法,因为可用性和功能存在差异。4 C4 ^! y3 r& n- C% S# `# w
6 V$ `" j# f3 O8 N( a" Y* R
, _7 ^/ d3 h9 J \! P2 f5 [4 ?
3 C" g7 t2 X6 k. X( w5 ^5 H& R
1. Ultimate Vocal Remover 5 人声取出插件
( l% \8 R6 @- F, m3 v9 n5 A1 W: A2 R7 R8 K4 R6 v3 U
7 v7 o& ]7 R) _2 g+ i7 n# F: |
对于那些密切关注音频分离技术的人来说,UVR5 是一款不可或缺的人工智能音干分离器和人声去除器,而且完全免费。7 ^& F7 b6 p; k- _
8 p7 H R8 S: }你不仅可以选择不同的算法,甚至还可以使用 “合奏 ”模式,同时使用多种算法,让每种算法都能为你带来特定乐器的优势。
0 N; ~1 M i! m6 R6 u! }& J6 S7 z `2 i
我们将它设置为 Demucs v4 模式,用了大约 6 分钟就把一首 6 分钟的歌曲分成了 4 个音轨(人声、贝斯、鼓和 “其他”)。
) Q$ v0 R7 S+ Y3 y6 b* o& w* U" c/ a/ j. {9 w% f
虽然我们没有对每种算法和每个音乐层都进行测试,但总体结果质量很高。你的结果可能会有所不同,这取决于你的使用情况和设置。$ g% u/ X9 T5 }3 U5 l5 \$ M
& }8 T. N: J |( m3 G; B. u- j
我们还让它为我们的测试歌曲提供了一个乐器版本,具体做法就是去掉人声。6 i, H/ ?6 o' R v9 j; ` `
2 ~: W* M: @- W& w5 h
有些人一开始可能会觉得参数有点吓人,但其实很容易学会,尤其是有了这样一份指南。
/ q6 i. }/ L9 |6 m5 Z( v7 ]6 N( O! u- ]' a% ?
作为一款应用软件,它的整体可用性非常出色,我们认为对于任何想要进行人声去除或乐器分离的人来说,它都是不二之选。
7 Y# @2 c# k$ E2 K/ O
* T2 Q1 s# @, t/ s链接:https://ultimatevocalremover.com/
( J7 a3 V8 m+ o) l) c
, Q9 X8 ?9 t7 J2 t7 Y2. Gaudio Studio. }- |8 B8 r8 v+ p; `9 }" j
( p; X2 M2 ~# p1 H市面上有很多基于浏览器的人工智能音干分离器和人声去除器。
) K( ~) o$ K; \8 W! I& h P9 ~7 R* O! S+ M
这些软件可能会在其专用处理器上运行你的分离效果,而不是在你电脑上的本地处理器上运行,这有时可能意味着更好的效果。
2 \! o) k9 t' [+ Z9 ^" F. k, L9 R9 p' K4 S4 X
其中很多都不是免费的,但 Gaudio Studio 是个明显的例外。你只需用谷歌账户登录即可。* b- A: Q7 S* b6 G* @( }
) p Z9 r7 D1 j1 K& E# e. o
登录后,上传要分割的歌曲、选择要分离的乐器层并将歌曲提交到队列中就非常简单了。
( c4 p' h% M0 m# }7 M$ f
a) g* e: m2 W& F大约花了五分钟,Gaudio Studio 就把我们六分钟的测试歌曲分成了人声、低音、鼓和 “其他 ”主干。6 \% M) t# I7 _ n: y# t
$ r; r4 m) R1 x3 b" a; ^音质相当出色,即使与我们的 UVR5 测试相比,音源的清晰度也非常高。
, A A1 z7 H4 Q6 {% I# a- E
" R) x; d& U" a截至 2024 年 4 月,它目前还处于测试阶段,5 月份将升级到新版本。该网站没有解释此次升级的内容,因此我们希望这并不意味着他们计划在短期内将其货币化。
3 [' ]/ M( U4 p% V链接:https://studio.gaudiolab.io// e- e A @ ^0 A, \; N
4 V% J% z& o! V- |( U) l1 j
3. MVSEP
$ A7 [. e. _3 b& z4 l( l
; V. C9 V o% } l( E. e0 ^! {) l: o- |1 ~
如果你要使用音干分音器进行采样,最好储备一些专业的高质量材料。LANDR Samples 拥有出色的人声、低音、鼓声和乐器音色库,可供探索。/ P2 X2 \8 r& k% k
' C2 J/ J; F) S, S+ H; z1 Y
/ }, f8 W. Y6 S& q这款词干分割器有点像 UVR5,但它是基于浏览器的,而不是独立的。
$ A/ |# x6 a- X3 W# r: ^0 G2 W, F1 R* |8 R l9 y4 O
它允许你选择多种不同的型号、质量级别和输出格式。6 t1 e/ u3 u! L( {: `
# m" o+ |) J1 `1 h$ v& }, n$ d
不过,你能使用的设置数量和其他优势取决于你选择的服务层级。/ V! ~& R; c& k) Z! P6 X' u- l
9 C; e# e+ U l8 w/ N7 H我们注册了一个免费账户进行测试,并将六分钟的测试歌曲分为人声、低音、鼓和 “其他 ”主干。( L$ z6 S& G! ^8 t/ Q3 L% Q
4 A$ R+ A9 i. m我们使用 Demucs v4 模型来查看与 UVR5 的质量是否有差异。我们用了大约五分钟,听起来质量没有明显差别。" p" G1 p0 G: d- ?3 F" a8 K# M8 j
$ o2 q* U! Y- Y; c( V( a; e我们不确定在 UVR5 免费的情况下付费购买 MVSEP 是否有优势,但你可以自己进行比较来确定。
' U( X( p. D$ O2 [+ O2 A! ]2 t/ A/ p; q5 z* i
事实上,MVSEP 网站的主要优势可能在于其文档和资源,而非工具本身。% j }; \% s t# W- d0 A: I2 a/ d
- I5 K, f6 U9 Q0 w你可以在他们的网站上找到不同音频分离算法的质量评级比较表,以及不同分离类型的庞大测试结果数据库。. f2 A+ \' k, h6 F9 l& @
1 f' ~* |3 D- F, G8 r3 |
链接:https://studio.gaudiolab.io/
3 u) ]' D0 J8 K- X/ A5 L7 E& q% m8 w& H5 D7 n
4. StemRoller
1 ]1 f/ G/ Z% p5 m0 Q
* a0 x7 y8 S! u1 ]. K% p
StemRoller 是另一款使用 Demucs v4 制作的免费 AI 音干分割器和人声去除器。2 q2 D+ \$ k' C9 w0 i
5 `" w, |( U0 W6 f+ {它可在电脑上独立运行,但与 UVR5 不同的是,它不允许你使用不同的算法或其他设置。相比之下,它的功能设置要少得多。
) t' f# `9 [0 t1 g" Q* r4 m4 `& A8 e% O. H/ Z
不过,如果你因为要在太多配置中做出选择而感到茫然,这款软件或许值得一试。4 v; ]' ?9 `; u" v" \) D
* Z3 r& h0 s k8 y9 e: U1 f7 ~
你只需将文件拖入窗口,它就会立即开始处理。
5 e' U7 M7 W8 |( U" Y* y0 A0 t4 m) i
. E8 V ?4 z8 j结果与在 UVR5 中运行 Demucs v4 的质量基本相同。
, T2 f/ o# q j( U
& x/ d) X+ |/ s2 J/ _除了常见的四个主干外,它还自动为我们提供了一个完整的器乐音轨,没有任何人声痕迹,听起来非常棒。; e% O1 b9 U0 w
/ K& e( y7 k; M
开发者警告说,它可能需要大量的处理能力,并需要长达 15 分钟的时间来生成结果,但在我们的 M2 MacBook Air 上只用了几分钟。
# `! n+ {1 f* v
8 L- ~: b Z8 D+ X( Z# }9 j$ a1 l) w# q6 C
链接:https://mvsep.com/en- b7 \% q9 V; c2 v; Z: H9 E: X# i
4 f0 D+ s$ p; b, M. K
) W0 L% L8 e. }+ @" ?! c# Q. |: z: ~, [9 M p
5. Spleeter for Max4 B$ K% R$ |9 X+ V+ f" i F
. f9 ?+ `. E! C1 R( l) {) {1 I
2 g) x( O4 B7 G9 \( l如果在 Live 中运行基于 Spleeter 或 Demucs 的音干分割器,它不会产生实时效果。它仍需要时间将源音频片段处理成干,这些干将以排列视图显示在时间线上。
9 ]" Z9 g5 `' \: ?( t0 j/ Z8 d6 `2 X$ u+ E& B) b" ]/ H7 X
$ u) F9 y% a% P! p8 f% a) u我们有一个好消息要告诉各位 Max for Live 用户--有好心人制作了一款基于 Spleeter 的设备,你可以在 Ableton Live 中将其用作人工智能音茎分离器。
# ?! h4 k/ H7 D/ Z0 N' r) b' }
7 n, N$ N8 i/ g不过,对于不熟悉命令行安装的人来说,设置过程可能比较麻烦。你需要遵循几个步骤,在 macOS 上使用终端,在 Windows 上使用 CMD。
2 `4 Q/ a" u! M+ [) Q4 E7 g7 s' f. _
3 i& k9 ]+ J' Q另一个问题是,由于 Spleeter 算法无法在 M1/M2/M3 Mac 上本地运行,因此这款设备也无法运行。) |1 A: S2 m) f# V% u7 ]
1 S1 @8 A8 V9 Y: r# e. w6 x* X
尽管如此,我们还是在配备英特尔处理器的老款 MacBook Pro 上进行了测试。我们发现它很容易使用,甚至比我们测试过的基于 Demucs 的分音器更快地传送音茎。
9 p' }! f. W) ?! ~; B$ P3 Q3 Q# p
我们发现,它的质量不如 UVR5 或 Gaudio 好,但直接在 Ableton Live 中使用的便利性对某些用户来说可能是值得的。
# |: ?% @9 j$ [3 J* ^( B; |0 _
因此,如果你不介意安装步骤,又有一台兼容的机器,这可能是一个方便的选择。+ U9 @5 W" n) N4 i
4 o; O8 q9 q O, _4 u6 }
另外,如果你愿意花上 20 美元,也可以购买这款使用 Demucs v4 制作的 Max for Live 音干分割器。
) E8 d& L6 u2 Y9 V$ ^! f4 X7 |) w, [+ z; m
链接:https://www.maxforlive.com/library/device/5956/spleeter-for-max- |: R; m9 c( E& r' C
! U4 |7 b3 O2 ~/ a j! l+ B1 N6. Vocal Remover人声移除器
5 G9 Q* r7 P0 l: A4 m5 _+ Z6 [5 p
# H/ D- s) V8 ^7 P6 s- R
4 i5 J; B7 d) J; `4 ?- W
使用它是免费的,网站似乎也没有明确列出任何限制。5 h1 i2 F$ L) N8 T" d6 m
4 N: ^+ C c# g* L/ e然而,当我们试图进行多次测试或尝试完整的声干分离服务时,却被告知要么稍后再试,要么订阅开发者的 Patreon。9 p; T% O; U- W K0 R2 M8 T
* R* L/ O9 [+ p- w+ C Q* C9 n; [2 C由此我们推测,除非你选择付费订阅,否则免费版的 Vocal Remover 在两次使用之间会有一段不明确的等待时间。
# A7 e8 Q7 D" W
' I$ t) a5 z2 K7 T我们的人声移除测试很快,只花了几分钟就完成了人声和乐器的移除。7 G% a. ^ J$ l8 Z6 p
+ j9 W" k$ d0 @! m6 s4 q
但我们发现,与 UVR5 和 Gaudio Studio 相比,人声音轨与乐器之间有大量渗漏。
, Y4 B- F! a* G! r6 S7 i: M+ ~) ^2 _1 V0 k
链接:https://vocalremover.org/
1 T7 {) Q3 g5 Y( M* Q5 r7 z$ q
1 c8 b. b: X+ n+ t- b4 A. Q7.Fadr Stems
, W2 Q x! M1 U4 Q1 v8 f7 [
3 P3 n% M% g, a i) e0 z该网站提供人工智能词干分割器和自动混音工具。/ _8 Z' w5 B/ c
: t/ J& T; o3 q+ R! A注册账户并选择免费计划后,Fadr 会将歌曲分成四个音干,并允许你以 MP3 格式下载。
- S, W& J$ u5 f, |& [4 a( x. x
& W- T( E0 r+ ]; O如果你想将歌曲分解成四个以上的主干,下载 WAV 格式的歌曲,并使用其他功能,你就必须切换到付费订阅选项。
; s, v- Q7 e3 \/ w- \. k免费版并不限制每月可分割的歌曲数量,而且 200MB 的文件大小限制似乎对免费版和付费版都适用。6 T- [. P6 A' w) o' U ]
" ~$ G& N; N. H. p! B4 f
它能在五分钟内处理我们的测试歌曲,但处理结果并不是我们所见过的同类产品中质量最高的。
+ W/ w: G k. R6 H) T- x1 d
0 C' f+ i" |8 W5 s$ S! a$ w. B- }/ k链接:https://fadr.com/stems+ i/ w* B% t4 L) n/ O9 p/ |; o1 I
' J; N# @9 Q% n( o
. ~7 Z! d" U/ j) _* D9 _) T* `# [
" D+ Q5 I' T1 c, x8. Audacity 的 OpenVINO 插件! X+ y2 q1 }; k9 D% G8 M& s2 |. K
% |4 V, V, u2 G. ]1 U
: f( m" Y& n7 e, B" e0 t; W* A
如果你还没有使用 Audacity 作为你的音频编辑工具,那么你一定要考虑一下它。$ m7 V" J9 R4 G$ c4 |; ~" l- J
* a" {0 k! L, b- a! l4 k5 W& b0 V; o3 v
如果你已经使用 Audacity,那么你可能还不知道它可以承载通过英特尔 OpenVINO AI 工具包设计的人工智能音干分割器插件。
9 T9 n0 ?$ m* @, ?3 Y% _* Y4 J0 E. i" [
我们不知道他们是否利用其中一个开源模型构建了这一功能,但我们很想知道它的性能如何。5 d+ T' f; [. ^3 f
1 C- a) Y% C" u6 e
由于这款产品仅限 PC 使用,我们在 Windows 笔记本电脑上进行了测试。安装不像大多数插件那样简单,但也不复杂。8 |8 ?* r7 O+ V, f; K/ n6 \7 h
, ~0 L6 }! z& |% d, P使用 GitHub 页面上的说明进行设置后,插件就非常容易使用了。
% M* J1 x8 f8 G6 s只用了不到十分钟,插件就制作出了人声、低音、鼓声和 “其他 ”音轨,并自动将它们作为独立音轨放置在时间轴上。
" C I) E# s' _8 [) k就我们的耳朵而言,它的质量还不错,但比不上 UVR5 或 Gaudio Studio。不过,如果你经常使用 Audacity 并喜欢它的工作流程,它可能是一个不错的选择。8 k9 `/ d4 c2 n2 s
9 o- L9 M$ ]+ p* |% J% x0 h4 l链接:https://github.com/intel/openvino-plugins-ai-audacity$ N3 x6 m0 ~0 @: c
* Z0 t$ c3 G9 R! J: ]+ g% @! d$ A& ?
AI 词干分离器和人声移除器的历史实际上比你想象的要长。! c8 A( t- r/ j5 h
' G, y. `& ]4 d/ m! t8 |因此,你可以在自己已经拥有的音乐软件中找到音干分离功能。- s! \" q( J- A2 I
, }" `4 A6 p# v+ T$ {7 T( o [! k
iZotope RX 有 “音乐再平衡 ”功能,FL Studio 的制作人版及以上版本也有词干分离功能。
! [8 h$ [4 H2 R! v! s) M. i! [0 M! P o2 x; D/ o7 M" [
这也成为 Serato DJ、rekordbox 和 VirtualDJ 等 DJ 软件的一项功能。# l0 [. B, H( V6 M" D
% h/ ?) \8 o B
4 b( @; | k- M2 b, s- q) i
|
|