|
: I+ d2 z; d7 J$ g3 q |2 k$ `1 T! ?: c) Q0 F; y
AI 主干分离器(或词干分离器)是一种软件工具,可以将完全混合的歌曲文件拆分为每个乐器层的单独声音文件。这些层称为茎。人声去除器专门用于隔离人声,而其他主干分离器可以分离成更多主干,例如贝司、鼓和“其他乐器”。
$ D( {4 N; ~, U0 s/ o
9 Q! m7 q! u* S/ x9 z; r. K9 M/ h( K
主干分离器最常见的用途是创建混音、混搭、DJ 编辑和卡拉 OK 乐器。
# G n# o% {+ L% e$ T) Y: M C/ F, z8 M2 p0 @2 C7 ^* v
这些工具使用机器学习算法,这些算法经过训练可以识别特定声音的频率素材并自动隔离它们(因此称为“AI”)。
m! C% Y: |7 C, ^, ]$ K( }1 M/ W4 @- n6 G3 V4 _: d
( {4 n/ g% m2 q9 u
许多人工智能词干分离器和声音去除器使用相同的开源算法,这些算法被封装在不同的包装器中。* `' v2 S( R0 }- y2 K
V0 N: ~1 L! n" w. j) U两种主要的开源词干分割算法是 Spleeter(由Deezer 的音频研究团队开发)和 Demucs(由Meta 位于巴黎的 AI 研究实验室开发)。
5 R. o( [7 m' @0 I: o# q i, s% b
9 C5 s8 d& R# Q; I我们比较了多个选项,即使它们使用相同的算法,因为可用性和功能存在差异。
% o; D+ l( H% n
2 x- j- y3 k) H) O3 X# I; ?3 c1 w; m& d% h
4 B2 u6 [9 Y1 @( ]
1. Ultimate Vocal Remover 5 人声取出插件
. ~# o' u5 r& w' r& K) q+ ~& E$ M- }' @3 Z' \8 [0 ]
/ q2 A2 r v/ f- u R
对于那些密切关注音频分离技术的人来说,UVR5 是一款不可或缺的人工智能音干分离器和人声去除器,而且完全免费。4 j! d3 J6 K8 X/ |1 V8 a. @9 f* C
" v9 {' b% C: T; h: m4 J
你不仅可以选择不同的算法,甚至还可以使用 “合奏 ”模式,同时使用多种算法,让每种算法都能为你带来特定乐器的优势。
* j. X$ X# n, u) `' v6 r. v1 M
7 U5 {+ S$ Z1 u# t4 K; G, t0 h* Y我们将它设置为 Demucs v4 模式,用了大约 6 分钟就把一首 6 分钟的歌曲分成了 4 个音轨(人声、贝斯、鼓和 “其他”)。( g& W( j) I: T: `2 ?0 L5 V
5 E$ G0 Q2 ~& Z8 @8 X
虽然我们没有对每种算法和每个音乐层都进行测试,但总体结果质量很高。你的结果可能会有所不同,这取决于你的使用情况和设置。
0 q$ m6 G9 i* J4 F" L! l$ a* _9 H; _0 z
我们还让它为我们的测试歌曲提供了一个乐器版本,具体做法就是去掉人声。+ I2 s0 r: A& ?: Y# b, x
- [) Z& c$ R" ~& K8 Q有些人一开始可能会觉得参数有点吓人,但其实很容易学会,尤其是有了这样一份指南。
3 M# M, u2 a( G0 S% O( }! `4 i
* @* _; v8 | Z; ]7 ~作为一款应用软件,它的整体可用性非常出色,我们认为对于任何想要进行人声去除或乐器分离的人来说,它都是不二之选。
3 i- V" w' b ?- M& T; L. d" }/ f5 b7 u+ O% B# w8 ?- r2 s E) V
链接:https://ultimatevocalremover.com/7 Q2 L. N! t# _
3 m# \8 V5 L' m. S ~* v" T
2. Gaudio Studio
, @! N% x7 w1 N: o) B0 ? }& T
) \3 p2 g! C+ [) ~市面上有很多基于浏览器的人工智能音干分离器和人声去除器。# W9 d- A. M3 a$ `
; Q7 l3 @ {" x/ g( j" c
这些软件可能会在其专用处理器上运行你的分离效果,而不是在你电脑上的本地处理器上运行,这有时可能意味着更好的效果。
2 N6 |2 G; W7 g! q! H
* f( O/ Z \7 l' k# A, G# O其中很多都不是免费的,但 Gaudio Studio 是个明显的例外。你只需用谷歌账户登录即可。
/ c6 I; i# W2 Y) W% ~! ^; L e7 X' {
7 c L! }# a& {% o' X1 j( }, L登录后,上传要分割的歌曲、选择要分离的乐器层并将歌曲提交到队列中就非常简单了。
5 o7 e8 N& _) j$ o) \0 [* y' [' ^ r9 F3 g
大约花了五分钟,Gaudio Studio 就把我们六分钟的测试歌曲分成了人声、低音、鼓和 “其他 ”主干。5 i1 b6 v8 ^7 C0 j
/ q: H+ y# N1 f' f8 a1 P
音质相当出色,即使与我们的 UVR5 测试相比,音源的清晰度也非常高。
- j. v1 F9 s+ f/ B0 U: f% l# o
# t' @+ _1 k+ n7 v截至 2024 年 4 月,它目前还处于测试阶段,5 月份将升级到新版本。该网站没有解释此次升级的内容,因此我们希望这并不意味着他们计划在短期内将其货币化。' n' K* F& f' T: \0 J1 Z0 V
链接:https://studio.gaudiolab.io/
0 t' F I% J. r
& e7 ]; c* X# {! {) O$ f) m3. MVSEP! z0 R" Q1 q. ^) b" F
# x, _& s( B7 f- h
" J4 |) ]0 ?1 m1 t3 w如果你要使用音干分音器进行采样,最好储备一些专业的高质量材料。LANDR Samples 拥有出色的人声、低音、鼓声和乐器音色库,可供探索。
: Z. E* X9 c& [
" V" O+ J$ R q# u) B* ^
7 O: u: v& L$ p# v+ U这款词干分割器有点像 UVR5,但它是基于浏览器的,而不是独立的。
% f Z4 H5 I% G! B! _: S6 D$ \
它允许你选择多种不同的型号、质量级别和输出格式。
* d4 o8 g$ i# d6 [. o9 p% h" L; D0 D+ p( P2 N2 z) e0 G- M5 Y; c
不过,你能使用的设置数量和其他优势取决于你选择的服务层级。' ]. r- ^; |+ B5 g% @4 `9 E! d/ P8 ]
3 y2 u# X6 f% x P Y
我们注册了一个免费账户进行测试,并将六分钟的测试歌曲分为人声、低音、鼓和 “其他 ”主干。
3 S' I. y- V+ X/ y( S, P* L8 b4 F5 t
我们使用 Demucs v4 模型来查看与 UVR5 的质量是否有差异。我们用了大约五分钟,听起来质量没有明显差别。; l, |1 t4 ?+ N! g% T5 H! ~
9 B W# C1 U7 _+ K1 J' x7 N0 x我们不确定在 UVR5 免费的情况下付费购买 MVSEP 是否有优势,但你可以自己进行比较来确定。
+ K4 k. e' M1 G& T9 {( W T6 B7 W0 y- q5 R# z
事实上,MVSEP 网站的主要优势可能在于其文档和资源,而非工具本身。 _) q: w( S* ? w7 n
$ D& ~* Y# t9 j9 B- i. `
你可以在他们的网站上找到不同音频分离算法的质量评级比较表,以及不同分离类型的庞大测试结果数据库。8 a& P" `; {" |0 r. i4 W
: |' M0 _! t' J; Z1 q, w链接:https://studio.gaudiolab.io/, T& f4 |: l4 n* H C% `' }
. F) `# N; m% Z. T' z; v% S+ ]2 ]
4. StemRoller2 K& N2 H" B/ E4 ]9 O
* k4 e' t$ J1 c" h+ f, GStemRoller 是另一款使用 Demucs v4 制作的免费 AI 音干分割器和人声去除器。
) `2 K1 t- m1 f" b4 H- e8 n& H1 a
% y, d2 N5 R+ j! B它可在电脑上独立运行,但与 UVR5 不同的是,它不允许你使用不同的算法或其他设置。相比之下,它的功能设置要少得多。/ L2 |/ g* q! T4 x
9 u( x/ L# E- U5 {4 M$ Z; h" {( J3 i
不过,如果你因为要在太多配置中做出选择而感到茫然,这款软件或许值得一试。
7 }9 S7 Q6 X3 _
3 j) I, v' ?5 I( T$ a! q# r. o7 @你只需将文件拖入窗口,它就会立即开始处理。0 C L- ?+ J; e& c! C- F
( v& U+ x5 m, ^. h结果与在 UVR5 中运行 Demucs v4 的质量基本相同。
4 S" Y0 r' F2 E" U: |! U2 z1 R5 b( K6 g: g; u
除了常见的四个主干外,它还自动为我们提供了一个完整的器乐音轨,没有任何人声痕迹,听起来非常棒。
: S2 k: G) }4 b- @# h. i+ F$ K3 U
! F( Z H7 R9 [1 D8 M开发者警告说,它可能需要大量的处理能力,并需要长达 15 分钟的时间来生成结果,但在我们的 M2 MacBook Air 上只用了几分钟。& J0 |1 }9 T* q5 p' {# d
+ W$ }5 u( ]) [ q$ {7 k. v
9 c7 M1 a9 O" S! n. l; K3 V! m链接:https://mvsep.com/en
4 c/ z( o4 s6 Y0 x4 ~0 S3 j8 Q1 T* B. ^1 M
3 C: p+ ~5 _! ]$ X
( q7 p& T Z' v' D4 y1 Q5. Spleeter for Max3 K- L! B. y* G' i, f' ?! D
# E9 m% N, B$ u" {4 i6 z: y3 T* V- z( w+ x: z
如果在 Live 中运行基于 Spleeter 或 Demucs 的音干分割器,它不会产生实时效果。它仍需要时间将源音频片段处理成干,这些干将以排列视图显示在时间线上。( Z! l |4 N0 t. f
. X$ U5 d* C3 u9 q% ^ M
4 I: X5 j+ x- n2 _& |) J; a我们有一个好消息要告诉各位 Max for Live 用户--有好心人制作了一款基于 Spleeter 的设备,你可以在 Ableton Live 中将其用作人工智能音茎分离器。
. U- }$ ^: l, x" b" g' s+ ?9 D, z O! |
不过,对于不熟悉命令行安装的人来说,设置过程可能比较麻烦。你需要遵循几个步骤,在 macOS 上使用终端,在 Windows 上使用 CMD。2 M) x) h6 O( e. N
2 x4 h0 D1 J: L0 P5 t# g, b另一个问题是,由于 Spleeter 算法无法在 M1/M2/M3 Mac 上本地运行,因此这款设备也无法运行。
7 A# N- E: c. e, n
4 {; }" S7 o, ?0 t( y尽管如此,我们还是在配备英特尔处理器的老款 MacBook Pro 上进行了测试。我们发现它很容易使用,甚至比我们测试过的基于 Demucs 的分音器更快地传送音茎。
9 U" P( v& ]/ W# |/ ]+ S# v6 }7 b. W6 g% p2 Z
我们发现,它的质量不如 UVR5 或 Gaudio 好,但直接在 Ableton Live 中使用的便利性对某些用户来说可能是值得的。
) g6 ~5 A9 f5 t6 Y: E
" i9 y0 t( ?- ~因此,如果你不介意安装步骤,又有一台兼容的机器,这可能是一个方便的选择。+ O& G- f6 }- ^* p, k" L8 R" n4 ^
! \. A! g4 o+ C8 V
另外,如果你愿意花上 20 美元,也可以购买这款使用 Demucs v4 制作的 Max for Live 音干分割器。
" S2 ~; d' M- V! g l2 p0 t0 Z. \/ H/ T" ^! Q2 \
链接:https://www.maxforlive.com/library/device/5956/spleeter-for-max E% T% R: J- V( l! \( G( h# m
- F# b! Y) L, `. F+ \& D/ b
6. Vocal Remover人声移除器
3 `) |- x/ F% d# U5 E7 w5 Z8 s6 s& n
) b" K- z2 w7 g' X. S
: h9 V2 E5 j! E使用它是免费的,网站似乎也没有明确列出任何限制。
4 N6 B0 F% ]5 R* o6 b0 L! O
5 d" B% v" ?8 E6 x6 G4 h# v! Z然而,当我们试图进行多次测试或尝试完整的声干分离服务时,却被告知要么稍后再试,要么订阅开发者的 Patreon。
' o: A' z$ t3 I4 b+ ?- U
6 R4 e4 ^2 H7 M4 ~" N9 d由此我们推测,除非你选择付费订阅,否则免费版的 Vocal Remover 在两次使用之间会有一段不明确的等待时间。9 _ @& H- B- P
( v I: b5 X7 v. N8 U我们的人声移除测试很快,只花了几分钟就完成了人声和乐器的移除。3 A, r) m) J1 A5 r% V- L. K2 y! n. F) `
& }$ ?) I. D5 B% P# n* q8 b但我们发现,与 UVR5 和 Gaudio Studio 相比,人声音轨与乐器之间有大量渗漏。) Q/ B* s9 X- P
" g: k( v: M: C3 x" J! s" }' T, Z- Z" m
链接:https://vocalremover.org/* R- ?7 U) H( ^* [, u
, L/ m5 c: }5 N+ C7 z6 C- n7.Fadr Stems
, g; F2 I5 n2 M* o& H( Q# i7 a6 p6 h, Y
+ [, P- s- ?7 Z& w7 I
该网站提供人工智能词干分割器和自动混音工具。: R* F, Z, e3 i9 ]2 Q+ h
9 `; v4 G: z5 [- K8 {8 ^/ V
注册账户并选择免费计划后,Fadr 会将歌曲分成四个音干,并允许你以 MP3 格式下载。
9 ~* {: u+ ]: ^9 l7 u
; l7 f- I( G; d0 E4 K, |) M2 {, @如果你想将歌曲分解成四个以上的主干,下载 WAV 格式的歌曲,并使用其他功能,你就必须切换到付费订阅选项。. t- m, {/ X8 A3 h" I) F
免费版并不限制每月可分割的歌曲数量,而且 200MB 的文件大小限制似乎对免费版和付费版都适用。" j( s3 R1 q2 M8 @
( Z0 o& B, y% x& v1 S0 L& j7 f
它能在五分钟内处理我们的测试歌曲,但处理结果并不是我们所见过的同类产品中质量最高的。
4 X: y' I" L q4 z+ R% E: N8 |5 _1 U) ~
链接:https://fadr.com/stems1 y! D' |7 K! r- I9 n4 h5 |2 S
6 j5 H Z- l4 k G5 `
" b" Y/ j4 y; m4 a" b/ u$ ~
; R( d! ]- K# K3 w8. Audacity 的 OpenVINO 插件
. J; e. \* |' \9 O, ^
; y2 C! y8 ~8 f, V [3 L
% [7 i6 t' ?5 r) C% U; |# Q! `3 i如果你还没有使用 Audacity 作为你的音频编辑工具,那么你一定要考虑一下它。% M5 T1 W5 t- j5 f/ v
( a' U( I0 h6 A2 j0 r0 x* p
如果你已经使用 Audacity,那么你可能还不知道它可以承载通过英特尔 OpenVINO AI 工具包设计的人工智能音干分割器插件。
4 h; O* Q0 ~( K! a3 X% t6 W7 w( `
8 @' {5 M2 j0 [+ x# w, `) r我们不知道他们是否利用其中一个开源模型构建了这一功能,但我们很想知道它的性能如何。
% s, S: t6 S: x! t' [9 m, O
, D6 J% Z# f, N6 ^由于这款产品仅限 PC 使用,我们在 Windows 笔记本电脑上进行了测试。安装不像大多数插件那样简单,但也不复杂。 h; V1 }8 ~8 p' {9 `
A1 \0 t6 @* V- r6 M5 O使用 GitHub 页面上的说明进行设置后,插件就非常容易使用了。
0 u# L3 b6 K5 y1 S" V* |8 |只用了不到十分钟,插件就制作出了人声、低音、鼓声和 “其他 ”音轨,并自动将它们作为独立音轨放置在时间轴上。
6 Z( x6 x+ y4 @! `2 K$ n/ v就我们的耳朵而言,它的质量还不错,但比不上 UVR5 或 Gaudio Studio。不过,如果你经常使用 Audacity 并喜欢它的工作流程,它可能是一个不错的选择。
4 T* K. b! r0 i, y: P0 E
' z1 N/ R! n% l7 y, h链接:https://github.com/intel/openvino-plugins-ai-audacity
5 k4 K9 V+ C) O; \( d
& }, T/ F% m% ?' q% B) b; v; i
' e" U. J) E: x/ @0 {" u& M1 oAI 词干分离器和人声移除器的历史实际上比你想象的要长。
3 ~# @* a) }- a* T, C. @+ h
" f1 A1 _0 Y! e4 P# C% C+ t# u因此,你可以在自己已经拥有的音乐软件中找到音干分离功能。' B+ g) A' o3 w, `8 M, P
6 W+ J; P& A/ M, n' P* N
iZotope RX 有 “音乐再平衡 ”功能,FL Studio 的制作人版及以上版本也有词干分离功能。1 p: `/ L0 o `6 \, R
# t9 A& {. }& K$ N. Q( G
这也成为 Serato DJ、rekordbox 和 VirtualDJ 等 DJ 软件的一项功能。' \5 a* d2 u% _' E% a7 }
2 N* z' ^7 |- j) P% r2 z
# V. {- E: _+ f |
|