音频应用

 找回密码
 快速注册

QQ登录

只需一步,快速开始

阅读: 1096|回复: 0
收起左侧

[后期] 9 款最佳的免费 AI 词干分割器和人声去除器

[复制链接]

694

积分

0

听众

13

音贝

音频应用新手发布

Rank: 3

积分
694
发表于 2024-5-7 | |阅读模式
音频应用公众号资讯免费发布推广

$ [6 ]+ F4 r+ u/ b
+ b1 i" n" ^8 d; @/ Q5 ]" m* k3 A* M9 W4 DAI 主干分离器(或词干分离器)是一种软件工具,可以将完全混合的歌曲文件拆分为每个乐器层的单独声音文件。这些层称为茎。人声去除器专门用于隔离人声,而其他主干分离器可以分离成更多主干,例如贝司、鼓和“其他乐器”。
; V, l: t  P; g5 O1 k. Y _url=https://blog-api.landr.com/wp-content/uploads/2024/04/The-X-Best-AI-Stem-Sp.jpg
4 p( j8 F' }5 n, [3 }9 {# j6 H主干分离器最常见的用途是创建混音、混搭、DJ 编辑和卡拉 OK 乐器。9 K2 F# H, u8 d6 r5 p  V
. ~, B1 g$ i  h
这些工具使用机器学习算法,这些算法经过训练可以识别特定声音的频率素材并自动隔离它们(因此称为“AI”)。
( R7 b9 x9 E* y3 o
8 n' W* z3 @5 s$ v9 K" P9 ` _url=https://blog-api.landr.com/wp-content/uploads/2020/01/How-to-Remix-a-Song_f.jpg
, F& E: @& k1 C6 r8 ?( `4 t6 A# h许多人工智能词干分离器和声音去除器使用相同的开源算法,这些算法被封装在不同的包装器中。$ j* X. d1 _3 a! c
- s( Z7 ~3 j& V0 R
两种主要的开源词干分割算法是 Spleeter(由Deezer 的音频研究团队开发)和 Demucs(由Meta 位于巴黎的 AI 研究实验室开发)。" X6 J4 j- i5 n* k" O4 H# h

7 Z9 b6 O) |' s2 \8 a我们比较了多个选项,即使它们使用相同的算法,因为可用性和功能存在差异。
5 v0 V5 y. Z; V5 k% S, I _url=https://blog.landr.com/_next/image/?url=https%3A%2F%2Fblog-api.landr.com%2F.jpg : [1 f5 k9 x, l9 T; ?2 v' q' G

3 X  b1 o9 w5 b- T- _2 H. `; P7 h# ]' B9 N3 G/ F
1. Ultimate Vocal Remover 5 人声取出插件
" D7 s" f- w9 K, }
; q3 S- c  Z, q! h _url=https://blog-api.landr.com/wp-content/uploads/2024/04/Ultimate-Vocal-Remove.jpg
7 @: p! x, i( r% ~: b! W对于那些密切关注音频分离技术的人来说,UVR5 是一款不可或缺的人工智能音干分离器和人声去除器,而且完全免费。
5 ]. _$ @2 \* M8 g  H' a$ P, Q6 s! {( D% \7 }" N) W
你不仅可以选择不同的算法,甚至还可以使用 “合奏 ”模式,同时使用多种算法,让每种算法都能为你带来特定乐器的优势。, k  f  v8 R* |, F- h
1 A% S& Y; f( b
我们将它设置为 Demucs v4 模式,用了大约 6 分钟就把一首 6 分钟的歌曲分成了 4 个音轨(人声、贝斯、鼓和 “其他”)。
" F+ {1 A0 }; a' L% s% Y6 v* h! d) \$ w+ K
虽然我们没有对每种算法和每个音乐层都进行测试,但总体结果质量很高。你的结果可能会有所不同,这取决于你的使用情况和设置。# h3 j4 k; b# }

- `9 V( l7 Y5 M8 z7 c我们还让它为我们的测试歌曲提供了一个乐器版本,具体做法就是去掉人声。$ K6 O. Q3 V; M1 f; ^

( C, S4 g1 ~) ?  I4 n! I- l5 H9 Z有些人一开始可能会觉得参数有点吓人,但其实很容易学会,尤其是有了这样一份指南。: m. L/ j1 U7 @# a

! v/ E4 V/ Z7 p7 u# R- D0 N1 ~作为一款应用软件,它的整体可用性非常出色,我们认为对于任何想要进行人声去除或乐器分离的人来说,它都是不二之选。
; o8 f& ~+ }, P0 \; w" c% `/ W0 R9 G: e2 o, L
链接:https://ultimatevocalremover.com/
6 f  v' R0 t2 ?  }( X" a& n7 Q' H' }5 S
2. Gaudio Studio2 Z4 G" E9 b& N8 L
_url=https://blog-api.landr.com/wp-content/uploads/2024/04/Gaudio-Studiointext-1.webp.jpg " x; ]7 ?! d9 w! [1 @7 p: U# s
市面上有很多基于浏览器的人工智能音干分离器和人声去除器。' V3 s3 P* N$ e* h) D9 K$ c0 R9 p

' B: J8 L- `1 b$ t, ^这些软件可能会在其专用处理器上运行你的分离效果,而不是在你电脑上的本地处理器上运行,这有时可能意味着更好的效果。8 ?4 L8 W+ T  O$ W3 d  w+ O  j! `
9 i! d$ p( c# n- P9 L+ p- K
其中很多都不是免费的,但 Gaudio Studio 是个明显的例外。你只需用谷歌账户登录即可。
9 O; I! q: u7 M6 i! w- F3 t6 D
. K+ A, u" y2 z  j7 ^- P8 D! ?登录后,上传要分割的歌曲、选择要分离的乐器层并将歌曲提交到队列中就非常简单了。
4 ^) m* A" }0 |# {! T+ \* \. C0 u. A  V: Y% M
大约花了五分钟,Gaudio Studio 就把我们六分钟的测试歌曲分成了人声、低音、鼓和 “其他 ”主干。
! u. m& i, r5 j4 P+ }1 T0 T
- N& x8 b4 w2 P8 b! c9 u0 e音质相当出色,即使与我们的 UVR5 测试相比,音源的清晰度也非常高。7 i8 u4 J3 u. m; j7 y
* ]$ O+ b. `' U$ W1 |/ l
截至 2024 年 4 月,它目前还处于测试阶段,5 月份将升级到新版本。该网站没有解释此次升级的内容,因此我们希望这并不意味着他们计划在短期内将其货币化。5 E* s# l4 E' _% ~! Q  q
链接:https://studio.gaudiolab.io/; n5 p( |% O0 Y  G; \" j# u
: ?  |4 N/ ^% b1 A( U: }! W
3. MVSEP
1 g  U- A# R2 ?4 F  }  t2 U4 w _url=https://blog-api.landr.com/wp-content/uploads/2024/04/MVSEPintext.webp.jpg % ?# x) q1 \5 P& X7 y
( A8 ~5 t! t6 |0 B
如果你要使用音干分音器进行采样,最好储备一些专业的高质量材料。LANDR Samples 拥有出色的人声、低音、鼓声和乐器音色库,可供探索。2 x% B- B" w2 L9 e1 E

. [7 p: f8 [% ]4 Q2 H, p# n
& n; A) `7 x2 K! ?. P这款词干分割器有点像 UVR5,但它是基于浏览器的,而不是独立的。
( W+ y0 U2 \3 o: e! j  K' t% z; e( `. w. u/ g
它允许你选择多种不同的型号、质量级别和输出格式。
5 k3 R, ]8 \4 ~3 i9 G6 |" x* ^' @* R/ N( V$ E3 o
不过,你能使用的设置数量和其他优势取决于你选择的服务层级。
# Y" J: l; M1 Y; ?2 m) F7 e+ b
/ z: F1 B, p# _: V4 O, D. S$ z我们注册了一个免费账户进行测试,并将六分钟的测试歌曲分为人声、低音、鼓和 “其他 ”主干。
% ~& Q% c& x+ f8 A- q" O0 C5 E: C
3 c1 n; k5 v) @- m我们使用 Demucs v4 模型来查看与 UVR5 的质量是否有差异。我们用了大约五分钟,听起来质量没有明显差别。
) J& _) r* h  w2 e( C
* \- |# }, f" F. M2 M. m我们不确定在 UVR5 免费的情况下付费购买 MVSEP 是否有优势,但你可以自己进行比较来确定。) F- }! ?# T/ J9 L6 n* c5 D

, s8 M0 a( Q; V+ ~事实上,MVSEP 网站的主要优势可能在于其文档和资源,而非工具本身。
2 o, |, Y% k8 O; o) J* |3 a
; A+ F/ b$ H" H. B: {+ ~你可以在他们的网站上找到不同音频分离算法的质量评级比较表,以及不同分离类型的庞大测试结果数据库。
6 _  i3 \- p0 w
3 ]8 I5 g! |4 a9 O链接:https://studio.gaudiolab.io/
% W" {- I$ q& h: H& X; ]
' G( c9 ~: M, v0 E4. StemRoller2 R# o' r' H: ~
_url=https://blog-api.landr.com/wp-content/uploads/2024/04/StemRollerintext.webp.jpg + p6 W% ~( l3 b1 o
StemRoller 是另一款使用 Demucs v4 制作的免费 AI 音干分割器和人声去除器。: N% B0 f! ~8 r& x2 `% p5 @# z

/ g; z; [. p! G/ {: @它可在电脑上独立运行,但与 UVR5 不同的是,它不允许你使用不同的算法或其他设置。相比之下,它的功能设置要少得多。
$ l3 k3 r) c* O+ i; [% H; [2 k) M2 [
不过,如果你因为要在太多配置中做出选择而感到茫然,这款软件或许值得一试。0 K! y" c& g( [. A" u6 Q+ d

5 a! D, z; p7 u+ D0 q6 ^1 n! n: x你只需将文件拖入窗口,它就会立即开始处理。
! B+ Q2 D5 q0 H! m+ T; J5 [0 O) u4 s- s) G2 G( i
结果与在 UVR5 中运行 Demucs v4 的质量基本相同。3 r! X- C. O: l4 k( |
9 {% l8 _) M- m& n1 p, O* E# Z1 {6 z1 G
除了常见的四个主干外,它还自动为我们提供了一个完整的器乐音轨,没有任何人声痕迹,听起来非常棒。
/ {3 x. t; w8 @$ {* P* x. J* B7 v2 Z/ A/ {$ M, B
开发者警告说,它可能需要大量的处理能力,并需要长达 15 分钟的时间来生成结果,但在我们的 M2 MacBook Air 上只用了几分钟。. `9 h; w4 D1 R! m7 Q

. }2 R; g& d1 S" E$ e6 N) d& T" l# R  G" L
链接:https://mvsep.com/en9 p5 r/ I) ^: s) m6 H/ @
& e$ ~5 g9 u) C. H

7 U, `* K: L! x
; k3 r7 V& h: K! C3 W5. Spleeter for Max( H4 }: }; q; I4 j3 t
_url=https://blog-api.landr.com/wp-content/uploads/2024/04/Spleeter-for-Maxintext.webp.jpg
3 u, w& |0 {4 N4 m9 w4 l6 ?- D6 R/ c5 X% P  Y
如果在 Live 中运行基于 Spleeter 或 Demucs 的音干分割器,它不会产生实时效果。它仍需要时间将源音频片段处理成干,这些干将以排列视图显示在时间线上。
; C2 J" y5 I, n7 I% J8 d$ S! o
! V! E7 G; |3 s# V9 }* ^% N' S. C4 g; K
我们有一个好消息要告诉各位 Max for Live 用户--有好心人制作了一款基于 Spleeter 的设备,你可以在 Ableton Live 中将其用作人工智能音茎分离器。* w9 ?% F/ `! F+ i  J6 V: H
" \- y& A3 M1 a) x& C  q- o5 I% l- V
不过,对于不熟悉命令行安装的人来说,设置过程可能比较麻烦。你需要遵循几个步骤,在 macOS 上使用终端,在 Windows 上使用 CMD。
8 m4 r5 P! v* D2 f  q
1 h( O  C6 M2 k7 x. j  U# l3 b. l另一个问题是,由于 Spleeter 算法无法在 M1/M2/M3 Mac 上本地运行,因此这款设备也无法运行。5 b* A0 [! K, l0 ?) y

" l: s: T$ T% R8 G- S* t7 L% f尽管如此,我们还是在配备英特尔处理器的老款 MacBook Pro 上进行了测试。我们发现它很容易使用,甚至比我们测试过的基于 Demucs 的分音器更快地传送音茎。6 E7 Q" r+ H2 J$ G6 a
: |3 T+ ~  P$ K) @  U" g
我们发现,它的质量不如 UVR5 或 Gaudio 好,但直接在 Ableton Live 中使用的便利性对某些用户来说可能是值得的。5 G+ n7 ]+ Y$ z/ V9 p& C
0 p/ r" l# x' B$ [. J# `: N
因此,如果你不介意安装步骤,又有一台兼容的机器,这可能是一个方便的选择。
+ J) t* d( k2 g" D) R7 @$ R4 c" M( x" R' [) e5 Y1 F0 Y
另外,如果你愿意花上 20 美元,也可以购买这款使用 Demucs v4 制作的 Max for Live 音干分割器。7 y$ E7 b- E, |

( }) d# O" E. ~5 g链接:https://www.maxforlive.com/library/device/5956/spleeter-for-max* [" @' B( g# m1 x  e6 n
# [1 q; D0 }5 v+ R; W
6. Vocal Remover人声移除器
4 l6 B  \% Z  n0 q% k& X% e& Q; a2 b _url=https://blog-api.landr.com/wp-content/uploads/2024/04/Vocal-Removerintext.webp.jpg * B" \2 G' s+ x4 ?& _

4 _  ?! a& H* v# d使用它是免费的,网站似乎也没有明确列出任何限制。0 R+ N( l- c: m1 R6 h
" S  D5 ~* k* H- `( U& v$ X
然而,当我们试图进行多次测试或尝试完整的声干分离服务时,却被告知要么稍后再试,要么订阅开发者的 Patreon。  y5 B- m  ~! D
; k2 B: v, D4 e' W0 u2 l- V, a. C
由此我们推测,除非你选择付费订阅,否则免费版的 Vocal Remover 在两次使用之间会有一段不明确的等待时间。
* p9 z9 g; T- J! ]/ Z! Q- D6 I% Z6 V# |( c5 Z" b# z1 Y( F
我们的人声移除测试很快,只花了几分钟就完成了人声和乐器的移除。) i. ^7 S8 [7 N

$ G4 `4 j- E, ]$ z但我们发现,与 UVR5 和 Gaudio Studio 相比,人声音轨与乐器之间有大量渗漏。, ^& D/ X" n+ _* |) d- b7 e1 u
  E% d9 H: f! v9 ?
链接:https://vocalremover.org/' G: k# f- v3 s* s5 H1 b

% ?4 [2 N2 N3 _! l7.Fadr Stems0 b' N8 z5 r, ?! h+ v
_url=https://blog-api.landr.com/wp-content/uploads/2024/04/Fadrintext.webp.jpg 9 j3 X1 M( E6 u& q0 v( N$ T
该网站提供人工智能词干分割器和自动混音工具。/ `/ a* Y+ S0 r& V3 T" D
  t; F( C  G  H
注册账户并选择免费计划后,Fadr 会将歌曲分成四个音干,并允许你以 MP3 格式下载。. S/ f7 C+ R4 ]2 g- p" ?( h, _& [$ f
* I/ m: S: Y: S& {4 i1 z
如果你想将歌曲分解成四个以上的主干,下载 WAV 格式的歌曲,并使用其他功能,你就必须切换到付费订阅选项。- a+ h$ T; [: J) b4 t0 B% a1 k
免费版并不限制每月可分割的歌曲数量,而且 200MB 的文件大小限制似乎对免费版和付费版都适用。
" ]/ Q$ s9 D/ ?0 y& u- a1 `3 t3 E7 l6 E
它能在五分钟内处理我们的测试歌曲,但处理结果并不是我们所见过的同类产品中质量最高的。2 F( K$ P4 q# [" i2 _, I4 a
6 z( {5 ]! j7 y! {+ M  Y
链接:https://fadr.com/stems
4 b9 @0 d# T+ ^# F: `
- u  q: t0 Z8 p5 [% T9 V3 m" q, Q8 _& @* B. ?, Z8 k

: Z) Q; n& [" x# s5 t: _: q/ Z8. Audacity 的 OpenVINO 插件
( w% K6 l. Q4 i! o0 v. b7 o/ L _url=https://blog-api.landr.com/wp-content/uploads/2024/04/OpenVINO-Plugins-for-.jpg
5 L" L9 A/ Y4 x4 \: W9 y& L# ?9 J; P
1 E9 g: N! O' l' l' f" R. V如果你还没有使用 Audacity 作为你的音频编辑工具,那么你一定要考虑一下它。* B: s. u' q) C& r

& ?. @9 R) K2 b- v) M如果你已经使用 Audacity,那么你可能还不知道它可以承载通过英特尔 OpenVINO AI 工具包设计的人工智能音干分割器插件。
7 k+ R& I0 @6 }" t" ~. \7 q4 U
$ t% z1 L% v+ a% n0 U3 k% D我们不知道他们是否利用其中一个开源模型构建了这一功能,但我们很想知道它的性能如何。8 U$ L( O# V! b: i) k, X
4 X' [( N6 ?2 S, M  w. ~8 H" F6 W
由于这款产品仅限 PC 使用,我们在 Windows 笔记本电脑上进行了测试。安装不像大多数插件那样简单,但也不复杂。. ]5 m  ]; D$ K8 I& S

, }. J$ y2 h% k$ }( u3 z使用 GitHub 页面上的说明进行设置后,插件就非常容易使用了。8 J! z# Q1 Q( w: a1 X( B- n
只用了不到十分钟,插件就制作出了人声、低音、鼓声和 “其他 ”音轨,并自动将它们作为独立音轨放置在时间轴上。6 ]1 H, G. q5 g! c
就我们的耳朵而言,它的质量还不错,但比不上 UVR5 或 Gaudio Studio。不过,如果你经常使用 Audacity 并喜欢它的工作流程,它可能是一个不错的选择。6 p6 h8 P% i2 \0 I7 x' _' s

& R! m! s  c. D4 V. K+ B' Z2 W链接:https://github.com/intel/openvino-plugins-ai-audacity2 Y8 i' I  R6 g7 J3 D! k* H

, o4 L, Q' |* O$ X  z/ \( k) r0 r5 Z! N1 |9 Z  A
AI 词干分离器和人声移除器的历史实际上比你想象的要长。7 f$ t0 Z( w0 C
% Q! g" S4 t' v4 [
因此,你可以在自己已经拥有的音乐软件中找到音干分离功能。- S! ?; l  d- `) [0 a
0 s8 A5 A( U: j, _1 d4 e( Q# ~
iZotope RX 有 “音乐再平衡 ”功能,FL Studio 的制作人版及以上版本也有词干分离功能。
. f0 e+ ]: c: l7 s( t
/ `0 w1 `8 i$ C) a, [3 X* t这也成为 Serato DJ、rekordbox 和 VirtualDJ 等 DJ 软件的一项功能。2 [' ^% w" ^% c) D* k

2 \: C6 g! u+ `' H" K; Y9 P0 P1 ]  }
欢迎厂家入驻,推文!免费!微信:yinpinyingyong
您需要登录后才可以回帖 登录 | 快速注册

本版积分规则

音频应用搜索

小黑屋|手机版|音频应用官网微博|音频招标|音频应用 (鄂ICP备16002437号)

Powered by Audio app

快速回复 返回顶部 返回列表