|
% T: h" M: @& z7 [7 E4 }) ]
- F: J! d% n% u! @% {AI 主干分离器(或词干分离器)是一种软件工具,可以将完全混合的歌曲文件拆分为每个乐器层的单独声音文件。这些层称为茎。人声去除器专门用于隔离人声,而其他主干分离器可以分离成更多主干,例如贝司、鼓和“其他乐器”。, X. c/ I: u0 }( Y7 C
. Y6 Y; ^4 P7 J
主干分离器最常见的用途是创建混音、混搭、DJ 编辑和卡拉 OK 乐器。- f6 h+ E4 F# A# D; [
( w H X& \7 g5 M1 g" a q
这些工具使用机器学习算法,这些算法经过训练可以识别特定声音的频率素材并自动隔离它们(因此称为“AI”)。& c* p5 Y% `+ i% d1 E
! }& ~' Q' B) M- a1 _# U
( N. Q7 Q) A" S9 P许多人工智能词干分离器和声音去除器使用相同的开源算法,这些算法被封装在不同的包装器中。9 e: r, k @ h, \ Y
4 n3 D0 h, C5 w* s- e1 {两种主要的开源词干分割算法是 Spleeter(由Deezer 的音频研究团队开发)和 Demucs(由Meta 位于巴黎的 AI 研究实验室开发)。1 }6 o! u+ K4 @2 ~9 d; a
2 b+ x& q/ ^+ L" N) d, w9 b我们比较了多个选项,即使它们使用相同的算法,因为可用性和功能存在差异。6 Y$ g3 r4 U: r7 I0 {
9 o/ f4 p- D; z9 E9 t" T
+ ?1 ~2 ]6 ~7 d" c0 T4 [, N: m$ p7 S' w5 ?( ]4 W( `' j: }/ ^
1. Ultimate Vocal Remover 5 人声取出插件4 @1 ~, Y% e! ^
/ |- ]6 a" p+ R) I. Y
' r$ ]3 w* X) n% a' p8 D* e% O- O' [对于那些密切关注音频分离技术的人来说,UVR5 是一款不可或缺的人工智能音干分离器和人声去除器,而且完全免费。1 f* g: K8 Y8 a" b# x# x* X
7 z! Y4 S) d8 m% a4 l7 G你不仅可以选择不同的算法,甚至还可以使用 “合奏 ”模式,同时使用多种算法,让每种算法都能为你带来特定乐器的优势。2 @5 q, X+ ^' w( D
K. b. M; k! S' R( C, k$ y2 _我们将它设置为 Demucs v4 模式,用了大约 6 分钟就把一首 6 分钟的歌曲分成了 4 个音轨(人声、贝斯、鼓和 “其他”)。$ T1 k: Y) Q3 |1 E u5 n2 U3 ]1 A7 _
3 V ^7 A" b7 \虽然我们没有对每种算法和每个音乐层都进行测试,但总体结果质量很高。你的结果可能会有所不同,这取决于你的使用情况和设置。* q: t3 [3 ]3 O( @# {- O1 U8 u
; l" v4 _# m* _: X, }* v& |我们还让它为我们的测试歌曲提供了一个乐器版本,具体做法就是去掉人声。+ {3 \: w% a3 k1 y9 p. Z7 J
- x- Z# l, T" u6 F7 Q* ~0 c6 U
有些人一开始可能会觉得参数有点吓人,但其实很容易学会,尤其是有了这样一份指南。/ P! c& E6 }0 V! `* M, i
& w# C- c+ m: n! G: `
作为一款应用软件,它的整体可用性非常出色,我们认为对于任何想要进行人声去除或乐器分离的人来说,它都是不二之选。! G" e( J: V7 h; G: e
+ H! |: Z, P. r! P. g链接:https://ultimatevocalremover.com/
/ v" E8 f6 y- e$ [
, g8 Z4 w3 J$ p& x. J2. Gaudio Studio; y# F1 h9 R' j7 Q7 {8 Q) f
' I+ r: Q# J4 g0 i$ j2 M9 h0 }市面上有很多基于浏览器的人工智能音干分离器和人声去除器。
# H9 P) R9 l5 c, \3 U& V R* P+ l, B! t( H6 h) }2 z0 l2 f* a
这些软件可能会在其专用处理器上运行你的分离效果,而不是在你电脑上的本地处理器上运行,这有时可能意味着更好的效果。
% k& s6 |0 s4 p. L* F2 ^* m4 _( |
其中很多都不是免费的,但 Gaudio Studio 是个明显的例外。你只需用谷歌账户登录即可。
3 y0 \. ~; v! _9 {" N
7 e9 M% w9 {5 j% v6 w登录后,上传要分割的歌曲、选择要分离的乐器层并将歌曲提交到队列中就非常简单了。
/ B7 Z* u+ w& V: w: b
: X1 P) M( m* ^, \大约花了五分钟,Gaudio Studio 就把我们六分钟的测试歌曲分成了人声、低音、鼓和 “其他 ”主干。+ B( g& m9 X( o: Z! L
8 d& Z7 `: _; k" ~
音质相当出色,即使与我们的 UVR5 测试相比,音源的清晰度也非常高。
2 N7 _! y* O# C0 q r8 @
1 g+ t- m/ t- A8 T9 j' c截至 2024 年 4 月,它目前还处于测试阶段,5 月份将升级到新版本。该网站没有解释此次升级的内容,因此我们希望这并不意味着他们计划在短期内将其货币化。
/ p M% M- V& n% M& ?) q0 {链接:https://studio.gaudiolab.io/
$ w j! \) j1 ]% a1 G: G1 U- \! V7 k& a: D. Y+ b; n
3. MVSEP
, q$ q, z- _# g8 f
* u y y* e( N8 N: i F" Y, e
如果你要使用音干分音器进行采样,最好储备一些专业的高质量材料。LANDR Samples 拥有出色的人声、低音、鼓声和乐器音色库,可供探索。; }( V% N5 r0 E$ P( M; c, p0 G
) f: o" v, H" G* o, ]
1 f ^+ D0 M7 ?这款词干分割器有点像 UVR5,但它是基于浏览器的,而不是独立的。
+ d, l# H5 Y( w+ ?; F6 `# ~
- Y+ i3 u8 z1 O% [ A, X4 c它允许你选择多种不同的型号、质量级别和输出格式。
5 t ?2 B! l& ^" M: y" i+ Y4 w4 i9 {- v8 A$ h: b
不过,你能使用的设置数量和其他优势取决于你选择的服务层级。8 j* K, C7 L' K4 T f$ L7 P
" J! H N, G) ^% ?1 n我们注册了一个免费账户进行测试,并将六分钟的测试歌曲分为人声、低音、鼓和 “其他 ”主干。
" g9 C7 U0 b+ u+ U1 G0 I$ o7 Z& Y/ {
我们使用 Demucs v4 模型来查看与 UVR5 的质量是否有差异。我们用了大约五分钟,听起来质量没有明显差别。
) O! V- u& g3 `* I
; e! n3 j( s) O: E$ y我们不确定在 UVR5 免费的情况下付费购买 MVSEP 是否有优势,但你可以自己进行比较来确定。4 H, ~" k" ]/ \2 z. C2 z" |
- u5 d% ~ p7 a# o4 g! k# y
事实上,MVSEP 网站的主要优势可能在于其文档和资源,而非工具本身。
" e7 u+ D, p! l2 i8 F. S' X7 ~3 C0 f2 P2 \6 \2 w4 \0 i5 w7 g
你可以在他们的网站上找到不同音频分离算法的质量评级比较表,以及不同分离类型的庞大测试结果数据库。
3 p* S- }3 o" P$ v: Y6 h5 \) o9 P% B' ]. f* k* o
链接:https://studio.gaudiolab.io/8 P; X$ y# S6 k' `5 O7 c7 _
; V$ m& m2 s5 E& t9 k' P2 q; [5 F4. StemRoller
. q: H3 H, O$ F& C
/ m$ V( N" J8 s) c: U+ q
StemRoller 是另一款使用 Demucs v4 制作的免费 AI 音干分割器和人声去除器。" Y+ [5 z- u7 D( v5 i1 }% |
+ b' f8 f* P& Z, c1 r' Z( g
它可在电脑上独立运行,但与 UVR5 不同的是,它不允许你使用不同的算法或其他设置。相比之下,它的功能设置要少得多。$ P. T% y3 c" A' Z3 k5 r, N
7 G- _9 }. ~/ r5 p- `3 q不过,如果你因为要在太多配置中做出选择而感到茫然,这款软件或许值得一试。
9 N& U9 ]( ?5 l t. f2 e% V3 e4 r8 I
" m0 V- {. g$ V, e* }你只需将文件拖入窗口,它就会立即开始处理。
2 F% z& c/ k5 y, Z. R) f! @! z5 w( E8 T5 G3 [
结果与在 UVR5 中运行 Demucs v4 的质量基本相同。
2 [7 j' N( r5 Y- v* H* g) N5 b! Y" S s
除了常见的四个主干外,它还自动为我们提供了一个完整的器乐音轨,没有任何人声痕迹,听起来非常棒。
& S( y+ \4 N% C/ N: K* H5 f+ T6 V# w2 y+ J% ^9 i
开发者警告说,它可能需要大量的处理能力,并需要长达 15 分钟的时间来生成结果,但在我们的 M2 MacBook Air 上只用了几分钟。
8 i+ B5 a; T" L0 j* {& }4 Y" n
1 o. D$ o0 z) A5 u! w3 T) ?3 r& J L! p7 k
链接:https://mvsep.com/en% o& ^: T" [" |: a2 g; h
0 V( E& d1 q3 `: w& K+ ^/ \: S8 o$ M% K; ]& n/ e
) e" k0 ]+ q! C* \5 m7 K5. Spleeter for Max% r1 m1 p+ u- T
1 v$ _& R; S! T6 @ F/ D0 H
% j1 i1 ^2 e# }- f% ]
如果在 Live 中运行基于 Spleeter 或 Demucs 的音干分割器,它不会产生实时效果。它仍需要时间将源音频片段处理成干,这些干将以排列视图显示在时间线上。* V. I& b3 X3 ^
) ?# R5 d6 i D& D; \$ p
3 q _7 T7 H7 R2 B7 z/ ?* I& |我们有一个好消息要告诉各位 Max for Live 用户--有好心人制作了一款基于 Spleeter 的设备,你可以在 Ableton Live 中将其用作人工智能音茎分离器。# k$ m+ ?' Z+ P* l0 P
0 p/ V7 A( q% S# ]2 G
不过,对于不熟悉命令行安装的人来说,设置过程可能比较麻烦。你需要遵循几个步骤,在 macOS 上使用终端,在 Windows 上使用 CMD。
( M4 T) n. c4 d) N+ ]" s; t; V" ] K. r. k# B7 Z3 J. k* i
另一个问题是,由于 Spleeter 算法无法在 M1/M2/M3 Mac 上本地运行,因此这款设备也无法运行。$ N, s+ ~/ b, V
, g+ r+ _/ R9 C, U9 N% t% u) D尽管如此,我们还是在配备英特尔处理器的老款 MacBook Pro 上进行了测试。我们发现它很容易使用,甚至比我们测试过的基于 Demucs 的分音器更快地传送音茎。' _- l0 ]( t, `6 K9 W% R/ q
- K9 a- J- k, @! s我们发现,它的质量不如 UVR5 或 Gaudio 好,但直接在 Ableton Live 中使用的便利性对某些用户来说可能是值得的。, t R* x8 X( [% C7 D9 u: X* h
. E3 y8 n) d+ z8 w0 {因此,如果你不介意安装步骤,又有一台兼容的机器,这可能是一个方便的选择。' H2 p+ Q0 Z; q5 V% [0 m* {
5 [# A1 W; X" D2 J- ]+ V另外,如果你愿意花上 20 美元,也可以购买这款使用 Demucs v4 制作的 Max for Live 音干分割器。9 G8 O) H( c: J/ R& j& ~1 ]
7 U6 Y7 s8 g+ D1 s9 M链接:https://www.maxforlive.com/library/device/5956/spleeter-for-max6 e5 ~3 y3 x: D7 a) c2 G0 T
% f+ H3 Q1 f9 @+ { u6. Vocal Remover人声移除器: o. d" }7 t8 _6 J2 S
8 z, R2 |, }5 A9 d% R2 k) \! A9 a5 I k7 I
使用它是免费的,网站似乎也没有明确列出任何限制。
# v5 K4 ~9 D( \7 ~0 W8 c3 F- L7 a( r& F9 ^$ [
然而,当我们试图进行多次测试或尝试完整的声干分离服务时,却被告知要么稍后再试,要么订阅开发者的 Patreon。
6 z- Z3 X" m% _) a0 I r% V) E Y, K j* v
由此我们推测,除非你选择付费订阅,否则免费版的 Vocal Remover 在两次使用之间会有一段不明确的等待时间。
+ O0 u0 v9 i- z% E+ @4 g. n# a/ C, Z6 a8 p" o9 j* s: @
我们的人声移除测试很快,只花了几分钟就完成了人声和乐器的移除。9 k1 m+ ^5 J0 T
; E1 K+ `- O! n. E5 t! \: L但我们发现,与 UVR5 和 Gaudio Studio 相比,人声音轨与乐器之间有大量渗漏。! l; Q. R& ]/ e% T( J
* J( r1 `, b- r# M) T0 b
链接:https://vocalremover.org/# x4 e1 }5 n# O7 P6 O$ R7 d
1 M7 q' V$ E/ y; j2 \
7.Fadr Stems: [+ J$ ?) W# p4 a3 W! i
0 J& Z$ ^9 L3 e- Z6 ^该网站提供人工智能词干分割器和自动混音工具。1 O. C1 w) T6 c# ?" T
( ^6 Z- D7 G( R \! C% {
注册账户并选择免费计划后,Fadr 会将歌曲分成四个音干,并允许你以 MP3 格式下载。
I. O7 A7 ]/ J" q! t+ L; H0 x4 k' R/ f6 V( q
如果你想将歌曲分解成四个以上的主干,下载 WAV 格式的歌曲,并使用其他功能,你就必须切换到付费订阅选项。2 M) Q# H$ v6 Z7 q) S
免费版并不限制每月可分割的歌曲数量,而且 200MB 的文件大小限制似乎对免费版和付费版都适用。1 D3 M0 n2 j _: @: G8 k. K
r. n( R& M, ^: h它能在五分钟内处理我们的测试歌曲,但处理结果并不是我们所见过的同类产品中质量最高的。$ Z& A% H% @ [, e. _5 }0 a4 `
- D1 d. o- w6 [9 E$ c) u链接:https://fadr.com/stems& P* K: d k7 F8 F
& l+ Z5 e9 X7 N) L7 X
4 j+ I+ ]6 l- H ]2 p N8 p: L
, r. B$ x/ l) f9 t8. Audacity 的 OpenVINO 插件) U+ f9 t8 C8 l% H; y9 P
$ b1 Z9 e5 B, Y2 I3 Y# K! h# c2 v
9 x5 K+ A3 [# r: {3 D- S' B" f如果你还没有使用 Audacity 作为你的音频编辑工具,那么你一定要考虑一下它。
/ T( i9 e8 S. o5 b T, J
0 a0 B7 `3 k1 C2 M' z3 a& g2 _! c如果你已经使用 Audacity,那么你可能还不知道它可以承载通过英特尔 OpenVINO AI 工具包设计的人工智能音干分割器插件。
& `2 q- r8 q: r
' `6 o8 h# ~# A$ p4 [! J我们不知道他们是否利用其中一个开源模型构建了这一功能,但我们很想知道它的性能如何。
3 r( X+ N4 H: d* Z! \; Y. S& s
3 q- Z2 K8 l5 D* F由于这款产品仅限 PC 使用,我们在 Windows 笔记本电脑上进行了测试。安装不像大多数插件那样简单,但也不复杂。! `- ?3 B( T* \9 |9 v+ a) a
( }1 J8 x: N/ g5 Q- y9 _' `$ c v+ F
使用 GitHub 页面上的说明进行设置后,插件就非常容易使用了。
0 h3 L) u. Q- J只用了不到十分钟,插件就制作出了人声、低音、鼓声和 “其他 ”音轨,并自动将它们作为独立音轨放置在时间轴上。, E3 M1 ]) S- G( g
就我们的耳朵而言,它的质量还不错,但比不上 UVR5 或 Gaudio Studio。不过,如果你经常使用 Audacity 并喜欢它的工作流程,它可能是一个不错的选择。* W3 I$ g& s) `% Z) S
: C i% S- b9 t, o: C
链接:https://github.com/intel/openvino-plugins-ai-audacity
w1 I+ A+ y- n1 ^& O: v$ D/ i' J1 T
2 `8 r+ _; T- T2 j' |& i7 z8 ^5 n7 E' r; ^" |' }* U
AI 词干分离器和人声移除器的历史实际上比你想象的要长。
% y) ]. W8 T& B2 c, z1 b
& [0 w, B) j, Y& ], F1 O6 V6 s' u因此,你可以在自己已经拥有的音乐软件中找到音干分离功能。+ c3 U+ J+ u2 l( z9 Q. s, t* m1 O
, n L# H* _; I% H1 G
iZotope RX 有 “音乐再平衡 ”功能,FL Studio 的制作人版及以上版本也有词干分离功能。1 j# i0 U2 w8 Q# \# H
- l8 d5 c$ z5 f9 z$ q这也成为 Serato DJ、rekordbox 和 VirtualDJ 等 DJ 软件的一项功能。
) t ^ y6 b7 U& l/ m) J; p% p2 ~3 [) t5 L: N
& V! [$ k/ r" K6 w [
|
|