|
! a: _5 K( b7 @( F0 W" p* t& d7 f' S1 z5 G' y
AI 主干分离器(或词干分离器)是一种软件工具,可以将完全混合的歌曲文件拆分为每个乐器层的单独声音文件。这些层称为茎。人声去除器专门用于隔离人声,而其他主干分离器可以分离成更多主干,例如贝司、鼓和“其他乐器”。( }9 }: ^% y1 C
- f$ G/ J% g4 R- e I主干分离器最常见的用途是创建混音、混搭、DJ 编辑和卡拉 OK 乐器。9 W4 [4 j" z0 g! v1 ?$ A
/ @8 l' n0 o* a/ F3 G这些工具使用机器学习算法,这些算法经过训练可以识别特定声音的频率素材并自动隔离它们(因此称为“AI”)。& B* O: I9 V' I. c6 c
8 N9 ?$ Q! _: t+ a6 I
( P- P9 [- ^6 ~# b. z许多人工智能词干分离器和声音去除器使用相同的开源算法,这些算法被封装在不同的包装器中。
4 n$ ~+ p5 t9 l3 Q6 Q3 e7 { m2 l0 s. F; _2 S
两种主要的开源词干分割算法是 Spleeter(由Deezer 的音频研究团队开发)和 Demucs(由Meta 位于巴黎的 AI 研究实验室开发)。& o+ A! l+ [4 M+ g- k9 K: {
9 h/ N5 f+ ]: ?: `我们比较了多个选项,即使它们使用相同的算法,因为可用性和功能存在差异。
$ t% T& J2 C0 d# z
4 _# V# g; i! B/ @- j
! G0 a! `, i' A- |( c% ?- `! s5 ^6 H( E+ y
1. Ultimate Vocal Remover 5 人声取出插件
4 M0 q! y0 V( m3 @) d/ ^( L& d6 O8 i2 e8 i
/ L' [6 m& x$ `! O7 j1 H! g对于那些密切关注音频分离技术的人来说,UVR5 是一款不可或缺的人工智能音干分离器和人声去除器,而且完全免费。% G- q' f& x( }) ^9 k' l
/ M! R% y: J6 u5 _* F/ d5 c% `你不仅可以选择不同的算法,甚至还可以使用 “合奏 ”模式,同时使用多种算法,让每种算法都能为你带来特定乐器的优势。( q' q. B# e- J: ^& r2 S7 v; }
! v' g" }5 f( Y! h- H我们将它设置为 Demucs v4 模式,用了大约 6 分钟就把一首 6 分钟的歌曲分成了 4 个音轨(人声、贝斯、鼓和 “其他”)。0 G# e! F& {% k9 f+ `% e
& x i, D6 O7 W虽然我们没有对每种算法和每个音乐层都进行测试,但总体结果质量很高。你的结果可能会有所不同,这取决于你的使用情况和设置。6 m8 ^" h# _( h" s
5 Y: ]+ ~. _+ N! H4 J& p$ s
我们还让它为我们的测试歌曲提供了一个乐器版本,具体做法就是去掉人声。$ j/ Q7 W% k8 O% T
6 b% ?6 K7 H/ l9 d& j有些人一开始可能会觉得参数有点吓人,但其实很容易学会,尤其是有了这样一份指南。
3 Y+ N# g" f I" w
$ g% Q9 F% ]% ], ^4 p9 t作为一款应用软件,它的整体可用性非常出色,我们认为对于任何想要进行人声去除或乐器分离的人来说,它都是不二之选。9 }8 O6 g3 T* J* ]- s9 `6 e. x
3 e# c; f% U3 y, O+ R- u& F链接:https://ultimatevocalremover.com/# C! {& O& V, c6 s: A$ g
# _5 U3 j% D; H8 W" P+ Q2. Gaudio Studio& D4 V$ v+ ^) O f' M) p
2 T, [; l/ P# E) P9 M9 U: V9 D$ |
市面上有很多基于浏览器的人工智能音干分离器和人声去除器。: u$ x; z: a9 ?7 ~0 a& Y
, K1 |" F* ^7 E+ c+ r
这些软件可能会在其专用处理器上运行你的分离效果,而不是在你电脑上的本地处理器上运行,这有时可能意味着更好的效果。0 m7 E- k9 e0 |
T$ F$ Q0 g# [/ i" F2 }其中很多都不是免费的,但 Gaudio Studio 是个明显的例外。你只需用谷歌账户登录即可。7 S5 i' t/ ^; y; }
3 T3 W n4 _$ W* N8 S/ X8 ~登录后,上传要分割的歌曲、选择要分离的乐器层并将歌曲提交到队列中就非常简单了。& n4 B3 ^: [8 t
0 Y9 ?- k( A8 T ~; M' ?
大约花了五分钟,Gaudio Studio 就把我们六分钟的测试歌曲分成了人声、低音、鼓和 “其他 ”主干。
$ m! O) P7 M' T, E9 b7 E7 L
5 K% ]/ J' f0 f# C5 [: D音质相当出色,即使与我们的 UVR5 测试相比,音源的清晰度也非常高。" r: G: K( X, Q1 Q
: a* _3 z4 T$ _ [- S3 ]截至 2024 年 4 月,它目前还处于测试阶段,5 月份将升级到新版本。该网站没有解释此次升级的内容,因此我们希望这并不意味着他们计划在短期内将其货币化。
7 g& l. P8 D5 Q+ K3 H2 m链接:https://studio.gaudiolab.io/
/ R8 D r2 H+ s% g; a* H+ p% h( }, n
3. MVSEP, {. j+ V8 q: M; z( Y: ~
+ ~ i. X! q$ _
8 h( k5 Q& s: ]2 Y, B/ m如果你要使用音干分音器进行采样,最好储备一些专业的高质量材料。LANDR Samples 拥有出色的人声、低音、鼓声和乐器音色库,可供探索。+ {3 U+ a4 [: }& m5 h r. ^
: j( F4 Z2 S1 C( P
0 y# L3 M* [8 r; X( n! y这款词干分割器有点像 UVR5,但它是基于浏览器的,而不是独立的。0 w% [! N4 e7 Z+ \' j
1 _ g; }% |: O; w- X
它允许你选择多种不同的型号、质量级别和输出格式。* D' V' _( O, p" C2 \, {" o% A
3 N/ C ~: d- @, ?; w不过,你能使用的设置数量和其他优势取决于你选择的服务层级。
# O8 K; j2 J; G, I' t
; V3 |! @% U+ q0 {2 \2 [我们注册了一个免费账户进行测试,并将六分钟的测试歌曲分为人声、低音、鼓和 “其他 ”主干。& ~- T. g4 G7 j" z2 C5 t! X5 u1 H% q9 r
0 X8 Z) R, M' L# Z
我们使用 Demucs v4 模型来查看与 UVR5 的质量是否有差异。我们用了大约五分钟,听起来质量没有明显差别。
6 @4 O/ u6 R1 j! B" U8 a# a$ `
# _/ T, `2 h+ T' u' f' V我们不确定在 UVR5 免费的情况下付费购买 MVSEP 是否有优势,但你可以自己进行比较来确定。' ?9 w9 x% C' d0 p/ @
0 P, C' J- r. M# Q& Y' u事实上,MVSEP 网站的主要优势可能在于其文档和资源,而非工具本身。
. C0 @# i5 D" ^% m l t3 o! \- C- y9 }- P& K
你可以在他们的网站上找到不同音频分离算法的质量评级比较表,以及不同分离类型的庞大测试结果数据库。
9 x2 M( \! _6 d2 l; x$ c2 \ G) B3 o. n0 c
链接:https://studio.gaudiolab.io/) J6 l) S- Y5 b
, S. y" _" @9 v$ g. L
4. StemRoller
U+ } }( a# m+ |2 ?0 ]
( ]# q v2 }* H# xStemRoller 是另一款使用 Demucs v4 制作的免费 AI 音干分割器和人声去除器。9 T0 E4 `' r* B0 y* }. b
0 k2 a5 ]5 o$ _7 E* b/ g9 K! q
它可在电脑上独立运行,但与 UVR5 不同的是,它不允许你使用不同的算法或其他设置。相比之下,它的功能设置要少得多。
- W) g8 p% O) D( u% \& y e3 C" Z
不过,如果你因为要在太多配置中做出选择而感到茫然,这款软件或许值得一试。8 W6 O- U5 h- q( I* x& d6 \
: x4 B7 I. x7 X4 u2 T你只需将文件拖入窗口,它就会立即开始处理。2 @0 O1 b0 z+ z
2 |+ a5 |: J# D) K; b
结果与在 UVR5 中运行 Demucs v4 的质量基本相同。2 m9 y+ c! b0 k1 f; `* Y
: x( A2 l4 H0 O1 [- m1 p
除了常见的四个主干外,它还自动为我们提供了一个完整的器乐音轨,没有任何人声痕迹,听起来非常棒。
7 i1 V# X" T: n# I6 C: w; T" R# M4 X/ I1 P B1 r! s
开发者警告说,它可能需要大量的处理能力,并需要长达 15 分钟的时间来生成结果,但在我们的 M2 MacBook Air 上只用了几分钟。
4 c2 E0 ~1 D3 d# W
# L" u5 g7 {, b/ l& ]2 V4 C7 t* z1 b( r
链接:https://mvsep.com/en
; n+ A2 v; L3 P% p4 C' I" z
# s$ V9 w! q" R3 I
$ r8 ^* z4 K" N7 b7 H& ~
# u# {% Z2 E9 Z! \6 e' S5. Spleeter for Max
4 g- p8 w H/ ]. z
- T# G. N+ [. w* A
8 t0 k# _# L1 y0 }6 f3 D* G如果在 Live 中运行基于 Spleeter 或 Demucs 的音干分割器,它不会产生实时效果。它仍需要时间将源音频片段处理成干,这些干将以排列视图显示在时间线上。
3 y5 a9 T' r) h. Y2 Z% z2 U9 g! D% d# g
0 I/ ]4 d; K8 D7 y% X1 D
我们有一个好消息要告诉各位 Max for Live 用户--有好心人制作了一款基于 Spleeter 的设备,你可以在 Ableton Live 中将其用作人工智能音茎分离器。
" n" J# m9 v# T8 I- i9 P, X
! Z& E; ^4 s" @* c& V不过,对于不熟悉命令行安装的人来说,设置过程可能比较麻烦。你需要遵循几个步骤,在 macOS 上使用终端,在 Windows 上使用 CMD。0 k5 Z/ d( [0 ~0 @
/ j. [9 c. N& H6 @' |另一个问题是,由于 Spleeter 算法无法在 M1/M2/M3 Mac 上本地运行,因此这款设备也无法运行。& ]+ y ^% X$ H! \4 B$ L# P
3 \; _, k% p4 S& q' s
尽管如此,我们还是在配备英特尔处理器的老款 MacBook Pro 上进行了测试。我们发现它很容易使用,甚至比我们测试过的基于 Demucs 的分音器更快地传送音茎。
9 ` H# ?6 c# F$ g2 P( b
' P4 _' d: X0 S9 c0 U. W4 W+ e我们发现,它的质量不如 UVR5 或 Gaudio 好,但直接在 Ableton Live 中使用的便利性对某些用户来说可能是值得的。5 D1 ~& [3 @0 `2 S' u0 e
- l9 Y* L8 Y% w+ M( c6 D8 c z因此,如果你不介意安装步骤,又有一台兼容的机器,这可能是一个方便的选择。2 e7 A4 m; C" {" W7 T" i" a5 `
y; v3 k# G9 R( U另外,如果你愿意花上 20 美元,也可以购买这款使用 Demucs v4 制作的 Max for Live 音干分割器。
6 X) o& |, u, X2 r+ g/ i; c8 E/ c2 W& e/ m9 j# J0 J- M9 i. v7 Q) ]
链接:https://www.maxforlive.com/library/device/5956/spleeter-for-max
0 f$ R" L( r# }8 f* }5 ?# W' P2 Z3 K1 E3 p. g# O$ O
6. Vocal Remover人声移除器
) Z1 V3 X; A8 ` J, ^
1 q: n' ~# x/ t% y$ g% h8 ~
3 S) }2 n0 @' V8 r+ I' f# S使用它是免费的,网站似乎也没有明确列出任何限制。3 P2 R4 X$ _# {) E' `% l
( ?' [- d8 V; m5 Y+ @然而,当我们试图进行多次测试或尝试完整的声干分离服务时,却被告知要么稍后再试,要么订阅开发者的 Patreon。8 q& {, I# W+ d) N! u t) D3 e8 R
9 F2 h! [1 }/ f) R' t由此我们推测,除非你选择付费订阅,否则免费版的 Vocal Remover 在两次使用之间会有一段不明确的等待时间。4 f1 P( B0 H5 M' }7 v$ J9 m
_# f9 `* y! N; t- k
我们的人声移除测试很快,只花了几分钟就完成了人声和乐器的移除。
5 n% c# ?- X. {* @; ]9 S8 k/ \3 b% C; @- V+ T7 G3 O- z
但我们发现,与 UVR5 和 Gaudio Studio 相比,人声音轨与乐器之间有大量渗漏。7 k( V! H6 }: D ~
# s, J0 j( [! c+ m0 p. J
链接:https://vocalremover.org/
' W( c9 {2 i, c: E5 y0 k! r Z/ `9 k- B1 F
7.Fadr Stems0 g4 v/ h0 s6 d8 _% n- M, V+ f+ U- t
. D1 S6 V7 [: Z5 w4 D
该网站提供人工智能词干分割器和自动混音工具。; B8 R8 E7 q$ y2 f+ g
- G4 `; C, E! @0 C7 U% {注册账户并选择免费计划后,Fadr 会将歌曲分成四个音干,并允许你以 MP3 格式下载。! L$ g) h" T, c
+ q) f: J5 m7 A% Y1 B+ ^如果你想将歌曲分解成四个以上的主干,下载 WAV 格式的歌曲,并使用其他功能,你就必须切换到付费订阅选项。
! B: {' e- `0 `免费版并不限制每月可分割的歌曲数量,而且 200MB 的文件大小限制似乎对免费版和付费版都适用。
' L; M/ u5 r4 _; ` c7 F7 v" ]: p: B/ }. o8 q, K- i% Q# ?' ^
它能在五分钟内处理我们的测试歌曲,但处理结果并不是我们所见过的同类产品中质量最高的。
* L& Q- P. `4 R! W. c7 `, Q, F* T; w
链接:https://fadr.com/stems
: j" M. b6 Z& J; y2 ~
" f, x! d' A/ T
" J$ L+ D7 O; W" e# C/ w
5 V8 M8 `" u* l7 l2 v" p8. Audacity 的 OpenVINO 插件
* `. Y/ w7 k" Y# u1 U4 \
% v& U' e' l c9 w' ^( z- l- |; a2 b& @: k3 I: [
如果你还没有使用 Audacity 作为你的音频编辑工具,那么你一定要考虑一下它。
% z" w' C1 O: r' l; G& ^: Y9 `
1 l# I& y; T( K" a. Z如果你已经使用 Audacity,那么你可能还不知道它可以承载通过英特尔 OpenVINO AI 工具包设计的人工智能音干分割器插件。
. R) P6 x+ w' H1 H) C% J* I+ `9 o y1 y5 n3 P( J$ [
我们不知道他们是否利用其中一个开源模型构建了这一功能,但我们很想知道它的性能如何。9 U) @! X0 t7 q0 A) U7 ~1 I4 ^$ G
% ]: y. @0 ]. K& @, J由于这款产品仅限 PC 使用,我们在 Windows 笔记本电脑上进行了测试。安装不像大多数插件那样简单,但也不复杂。& T3 N# o5 k( `6 A) i
; N: k! X9 `, U) v1 n, s使用 GitHub 页面上的说明进行设置后,插件就非常容易使用了。
( }' V7 F0 @& Y K只用了不到十分钟,插件就制作出了人声、低音、鼓声和 “其他 ”音轨,并自动将它们作为独立音轨放置在时间轴上。
4 U D) y7 O" f$ m% _2 F+ l就我们的耳朵而言,它的质量还不错,但比不上 UVR5 或 Gaudio Studio。不过,如果你经常使用 Audacity 并喜欢它的工作流程,它可能是一个不错的选择。7 x/ Q- l7 M# D, O$ h
( m+ c6 H) n& i% f; z( h链接:https://github.com/intel/openvino-plugins-ai-audacity
! _* M0 @# f$ m' Z3 v! N% r( c* R/ S: d2 i3 X" m
0 x. }4 i; P* {5 @' H0 o
AI 词干分离器和人声移除器的历史实际上比你想象的要长。
( J8 a( _/ |3 }4 N. E" Q0 ^7 B
6 J! T. D1 T/ J* C因此,你可以在自己已经拥有的音乐软件中找到音干分离功能。. H; E' h' Q1 V S
# l8 z0 h _2 }' u, a1 U2 o5 P: V
iZotope RX 有 “音乐再平衡 ”功能,FL Studio 的制作人版及以上版本也有词干分离功能。. h5 @ @. B' P! Y" x$ K
: |) n4 l" l/ M! d2 n这也成为 Serato DJ、rekordbox 和 VirtualDJ 等 DJ 软件的一项功能。
$ x' C3 o- S% I2 E* }6 R4 _, I2 h8 C4 V% u- y1 c* W7 r( D
" Z3 {: ?: J' \8 C
|
|