音频应用

 找回密码
 快速注册

QQ登录

只需一步,快速开始

阅读: 1902|回复: 0
收起左侧

[后期] 9 款最佳的免费 AI 词干分割器和人声去除器

[复制链接]

694

积分

0

听众

13

音贝

音频应用新手发布

Rank: 3

积分
694
发表于 2024-5-7 | |阅读模式
音频应用公众号资讯免费发布推广

: `4 z9 o3 U4 L% F7 s' T# q: {5 u6 i8 H0 @( s
AI 主干分离器(或词干分离器)是一种软件工具,可以将完全混合的歌曲文件拆分为每个乐器层的单独声音文件。这些层称为茎。人声去除器专门用于隔离人声,而其他主干分离器可以分离成更多主干,例如贝司、鼓和“其他乐器”。
1 _7 o4 |# P' y! ^$ _8 Q _url=https://blog-api.landr.com/wp-content/uploads/2024/04/The-X-Best-AI-Stem-Sp.jpg
/ E. P7 {. p7 U/ J; D; E4 l; X主干分离器最常见的用途是创建混音、混搭、DJ 编辑和卡拉 OK 乐器。- T: `( T* p8 g
0 |: i) D2 g# v: w" m' F( w- U2 P0 w. I
这些工具使用机器学习算法,这些算法经过训练可以识别特定声音的频率素材并自动隔离它们(因此称为“AI”)。
$ ~; d2 t0 D# d1 [3 d. \& `' t, Q& o2 s; P7 ]5 _
_url=https://blog-api.landr.com/wp-content/uploads/2020/01/How-to-Remix-a-Song_f.jpg # R( ~# o! E7 C6 q5 G
许多人工智能词干分离器和声音去除器使用相同的开源算法,这些算法被封装在不同的包装器中。7 K9 e9 S5 E+ h* X) A
, G; O$ _( d1 E- b4 r
两种主要的开源词干分割算法是 Spleeter(由Deezer 的音频研究团队开发)和 Demucs(由Meta 位于巴黎的 AI 研究实验室开发)。" o/ g% D4 G) E, w/ ~
. \4 B2 a! v- }2 T. n( O' g7 y9 j- v
我们比较了多个选项,即使它们使用相同的算法,因为可用性和功能存在差异。3 P" ^' d4 h7 E! `& G2 l  L0 M2 e0 X
_url=https://blog.landr.com/_next/image/?url=https%3A%2F%2Fblog-api.landr.com%2F.jpg
+ N( b/ H# o4 W. I8 U
- K! _/ l: E1 n, p9 _: R' b9 T4 {3 i% L- K3 S& r& t
1. Ultimate Vocal Remover 5 人声取出插件2 H3 A* q  `2 [* `+ Z1 h

- L, Z; `' m0 o: g _url=https://blog-api.landr.com/wp-content/uploads/2024/04/Ultimate-Vocal-Remove.jpg ; |4 k' U& X3 n8 I# M2 S1 |( n
对于那些密切关注音频分离技术的人来说,UVR5 是一款不可或缺的人工智能音干分离器和人声去除器,而且完全免费。
3 G. W5 p6 ^5 Q# Z& K
! R6 \; W# i4 P2 _, T# [7 b; |* M你不仅可以选择不同的算法,甚至还可以使用 “合奏 ”模式,同时使用多种算法,让每种算法都能为你带来特定乐器的优势。0 g7 |: @) _1 r
6 E# A# n3 R) X( r) K2 [
我们将它设置为 Demucs v4 模式,用了大约 6 分钟就把一首 6 分钟的歌曲分成了 4 个音轨(人声、贝斯、鼓和 “其他”)。7 R7 p. E1 }+ X- C: \5 j; V
. k* ^3 I. ^* L$ Z) F5 l2 _# w& g
虽然我们没有对每种算法和每个音乐层都进行测试,但总体结果质量很高。你的结果可能会有所不同,这取决于你的使用情况和设置。$ i2 n3 C1 B: a: {: F( K2 }+ X1 g

0 e) Q. k% p3 w我们还让它为我们的测试歌曲提供了一个乐器版本,具体做法就是去掉人声。
! w+ J& @, L5 d: H" E( s8 ~; m1 L/ I9 T- E8 I; C- {- i6 j
有些人一开始可能会觉得参数有点吓人,但其实很容易学会,尤其是有了这样一份指南。
, Y: a5 e, O% X3 h5 n- m# k. W; Y9 r5 j4 {
作为一款应用软件,它的整体可用性非常出色,我们认为对于任何想要进行人声去除或乐器分离的人来说,它都是不二之选。, J, V0 n8 p* Q; Q1 B

* v/ i' k8 |* z# P5 m) }+ }链接:https://ultimatevocalremover.com/' z, [" O5 B  ~6 w5 v

9 }$ [; J/ J/ {6 ?3 q# Y2. Gaudio Studio
5 {  o; M1 ?9 B6 E5 U% ] _url=https://blog-api.landr.com/wp-content/uploads/2024/04/Gaudio-Studiointext-1.webp.jpg ' ?& {. z1 O; }0 T) T
市面上有很多基于浏览器的人工智能音干分离器和人声去除器。+ U, p9 m" c, s4 n/ z  m6 j

# m, \0 f* x9 g  `这些软件可能会在其专用处理器上运行你的分离效果,而不是在你电脑上的本地处理器上运行,这有时可能意味着更好的效果。
0 B) |4 J/ x* {' q) A7 w& U8 @. R! h. _( B3 _; s6 R& _
其中很多都不是免费的,但 Gaudio Studio 是个明显的例外。你只需用谷歌账户登录即可。9 y7 K* F9 y+ K2 p8 Z

* S) z! [" k% G+ l; H! d登录后,上传要分割的歌曲、选择要分离的乐器层并将歌曲提交到队列中就非常简单了。
4 y  K, y9 y9 Y& [7 Z; B' f7 D4 N# L* O% x! G5 g; y- w
大约花了五分钟,Gaudio Studio 就把我们六分钟的测试歌曲分成了人声、低音、鼓和 “其他 ”主干。
1 `- d8 i; h+ O6 d: C
. c; I. g. r) B音质相当出色,即使与我们的 UVR5 测试相比,音源的清晰度也非常高。
) S& H& ]0 R! W/ o/ ^- [/ ^3 e4 @. R7 G$ d. a4 R7 O
截至 2024 年 4 月,它目前还处于测试阶段,5 月份将升级到新版本。该网站没有解释此次升级的内容,因此我们希望这并不意味着他们计划在短期内将其货币化。1 C0 F& u$ ]2 O6 d: |+ g! ^
链接:https://studio.gaudiolab.io/
4 Y0 ^5 {# J8 t5 X4 s6 F' Q8 ^  `3 U  L9 q- g6 a4 K3 t& s2 J9 d
3. MVSEP. g/ \* {: f- ]& m8 J
_url=https://blog-api.landr.com/wp-content/uploads/2024/04/MVSEPintext.webp.jpg
& d' }+ [5 X" ~6 [
7 t) Y9 ^# s5 w1 _' I7 Y* m' }% \如果你要使用音干分音器进行采样,最好储备一些专业的高质量材料。LANDR Samples 拥有出色的人声、低音、鼓声和乐器音色库,可供探索。4 v  \1 F: B3 R  M$ p
1 @# r6 B- ~! C, I' W" A9 g
3 g4 x: `( }: R; C+ _
这款词干分割器有点像 UVR5,但它是基于浏览器的,而不是独立的。
) n  _& U' e4 x* V$ n& o4 ?" A; x/ }0 f3 l/ H) y; O0 I$ V% J
它允许你选择多种不同的型号、质量级别和输出格式。0 o; `/ g7 H+ e7 c

% i- X. h( S' g$ n! m: `% ^不过,你能使用的设置数量和其他优势取决于你选择的服务层级。5 a3 D9 [* r2 L) S0 ~

  A/ g' \7 a7 x" z我们注册了一个免费账户进行测试,并将六分钟的测试歌曲分为人声、低音、鼓和 “其他 ”主干。( O1 ~% l7 y% s# ~/ ]% z' y9 Z
3 _) c  H5 ^! J+ N. k, E
我们使用 Demucs v4 模型来查看与 UVR5 的质量是否有差异。我们用了大约五分钟,听起来质量没有明显差别。' _, a# [5 a$ E$ @

' q9 L! c% T0 t我们不确定在 UVR5 免费的情况下付费购买 MVSEP 是否有优势,但你可以自己进行比较来确定。$ T* m' ?+ g5 D  h$ C

- k  I! p1 r, ?/ V6 H; Y3 i4 ~4 W事实上,MVSEP 网站的主要优势可能在于其文档和资源,而非工具本身。% u% t; D0 \! s! q4 C- q+ B9 U

) j, b3 z8 o! s9 u  v' N你可以在他们的网站上找到不同音频分离算法的质量评级比较表,以及不同分离类型的庞大测试结果数据库。% u4 r/ ?6 q# R1 G; p
0 W/ E6 Z5 G/ G# e* ?( A: }  @
链接:https://studio.gaudiolab.io/
/ c2 H6 {) _* L' a
7 d  p" ], C$ o4 z$ m( g  e6 y4. StemRoller
7 C* ?5 K) |5 ]9 T* M& P _url=https://blog-api.landr.com/wp-content/uploads/2024/04/StemRollerintext.webp.jpg
2 f( r% X: P6 r8 jStemRoller 是另一款使用 Demucs v4 制作的免费 AI 音干分割器和人声去除器。& |! }' ?( ~. c4 o

. R/ V. Y' ~4 z% }6 e+ Q它可在电脑上独立运行,但与 UVR5 不同的是,它不允许你使用不同的算法或其他设置。相比之下,它的功能设置要少得多。
& H. h6 V7 W& g8 M8 ^, O& d0 e% s, F3 l- a0 a
不过,如果你因为要在太多配置中做出选择而感到茫然,这款软件或许值得一试。
5 I: N0 R8 C. Z6 ~( G: Y. P5 C; e
' k' E% S9 _. N9 M1 T你只需将文件拖入窗口,它就会立即开始处理。7 d: V1 N7 S' u. f8 R6 V
; g% j5 k/ d" I2 t/ T" p+ F5 r
结果与在 UVR5 中运行 Demucs v4 的质量基本相同。
+ n1 j9 a+ S5 }# w
* u! x2 t* K4 K4 i  J除了常见的四个主干外,它还自动为我们提供了一个完整的器乐音轨,没有任何人声痕迹,听起来非常棒。( u7 A  ~8 m6 y4 U

5 z1 ]# F5 Y% c5 G) z2 X, Z' ~开发者警告说,它可能需要大量的处理能力,并需要长达 15 分钟的时间来生成结果,但在我们的 M2 MacBook Air 上只用了几分钟。
0 \7 K9 w8 S2 E0 O, r7 x
& c  S, L7 [7 r+ S
3 K/ L( d/ {6 Y! p2 i链接:https://mvsep.com/en% d8 h: K3 g0 w$ K  N4 I" \' f  O

' J9 ?% X0 v3 }: f/ X" n# A
  G+ a0 x" M2 n# V: ?7 y( D: ?% H1 x5 W) w# T- M% I
5. Spleeter for Max! C0 h, `. l1 f; n! M5 |) f) t9 c
_url=https://blog-api.landr.com/wp-content/uploads/2024/04/Spleeter-for-Maxintext.webp.jpg % k" A& r# C% K

1 `6 N9 w8 ^6 r/ a' b: n如果在 Live 中运行基于 Spleeter 或 Demucs 的音干分割器,它不会产生实时效果。它仍需要时间将源音频片段处理成干,这些干将以排列视图显示在时间线上。' N6 G# L3 m6 g$ E5 A4 t, o6 D

0 \, {0 Z9 X8 L% v6 W$ Y6 F: ?  ~( p
我们有一个好消息要告诉各位 Max for Live 用户--有好心人制作了一款基于 Spleeter 的设备,你可以在 Ableton Live 中将其用作人工智能音茎分离器。
5 k) ]( G. _' f% a! D
: ~  t) W4 k% U! Q3 _6 Z/ ^( f不过,对于不熟悉命令行安装的人来说,设置过程可能比较麻烦。你需要遵循几个步骤,在 macOS 上使用终端,在 Windows 上使用 CMD。
  K7 H2 j; A% z' P! Z/ z  c6 V6 F/ I' X" ~
另一个问题是,由于 Spleeter 算法无法在 M1/M2/M3 Mac 上本地运行,因此这款设备也无法运行。; W& j- n* e; k. b! B

" u' Z& m$ ?; _" g4 V( e尽管如此,我们还是在配备英特尔处理器的老款 MacBook Pro 上进行了测试。我们发现它很容易使用,甚至比我们测试过的基于 Demucs 的分音器更快地传送音茎。
: Y- ~7 |# b- U: ]- c
" G. p# X( h9 h  ]% |! K( @; s我们发现,它的质量不如 UVR5 或 Gaudio 好,但直接在 Ableton Live 中使用的便利性对某些用户来说可能是值得的。( P  g% V+ J" ^& z

$ V- G. e2 ]' P4 Q因此,如果你不介意安装步骤,又有一台兼容的机器,这可能是一个方便的选择。
* B. i( e; s9 J6 F2 H2 U" O+ v3 |: {5 B# N8 Y8 J$ D' B' i: c
另外,如果你愿意花上 20 美元,也可以购买这款使用 Demucs v4 制作的 Max for Live 音干分割器。! L3 E# }$ l$ Z# ]* F( k
4 G$ J3 \8 ~- I0 S2 l9 j: {$ J
链接:https://www.maxforlive.com/library/device/5956/spleeter-for-max. H- N. n: e* r2 ^+ N
4 [: }- l1 z/ J$ |
6. Vocal Remover人声移除器
" q/ ?! p* @- g! u& ^) } _url=https://blog-api.landr.com/wp-content/uploads/2024/04/Vocal-Removerintext.webp.jpg 7 q9 q6 k/ n, n2 A1 Y5 ]
" X: a4 O& b" E! o- a7 f
使用它是免费的,网站似乎也没有明确列出任何限制。
4 _( C& k5 A% A' M
" ]# N; A* h* P# v- J然而,当我们试图进行多次测试或尝试完整的声干分离服务时,却被告知要么稍后再试,要么订阅开发者的 Patreon。4 n/ Z- {8 e  b/ i& Y
6 _5 ]2 v( w3 N8 V, D' f
由此我们推测,除非你选择付费订阅,否则免费版的 Vocal Remover 在两次使用之间会有一段不明确的等待时间。. h; r  P' Y4 w
; ^7 B( {; b+ B$ X  T, ^
我们的人声移除测试很快,只花了几分钟就完成了人声和乐器的移除。  s9 L0 _4 K1 [) t
- k# T$ m) e2 m% N: D! P
但我们发现,与 UVR5 和 Gaudio Studio 相比,人声音轨与乐器之间有大量渗漏。% y1 ^3 w3 c: q  k* \1 \1 z. z" D
+ h/ G# t  G$ `) p8 Y5 |0 l
链接:https://vocalremover.org/
9 F. A! v( ~2 B7 r  u# R3 v- ^& Q$ W
6 G3 [# w+ }. c8 P$ B/ Z7.Fadr Stems1 u/ g2 l8 ]9 j9 O7 V' [
_url=https://blog-api.landr.com/wp-content/uploads/2024/04/Fadrintext.webp.jpg 7 F  C/ P1 z3 v+ ]# p
该网站提供人工智能词干分割器和自动混音工具。; }/ o9 {9 I: H3 u/ N

) L8 R5 |. {+ P$ g# Z4 g' d' D注册账户并选择免费计划后,Fadr 会将歌曲分成四个音干,并允许你以 MP3 格式下载。% {3 N" c$ Z' {1 o5 X/ x/ ^3 t9 U

# E  I- U( @7 Y  L! A5 }如果你想将歌曲分解成四个以上的主干,下载 WAV 格式的歌曲,并使用其他功能,你就必须切换到付费订阅选项。
" C& S, O! o6 U免费版并不限制每月可分割的歌曲数量,而且 200MB 的文件大小限制似乎对免费版和付费版都适用。( A! T5 [! X. V! U9 m! D* f4 }
& Y8 c- Z- t1 f9 P8 h& `
它能在五分钟内处理我们的测试歌曲,但处理结果并不是我们所见过的同类产品中质量最高的。
0 f* T* Y# X% y8 u0 v
& N3 S2 j/ i) {  p% z6 S链接:https://fadr.com/stems
0 K" o) P7 A& H) t7 `/ K0 E
- u8 e8 b5 ]. ^1 k7 `1 T% ]/ B+ f7 u6 B0 f
) s% S! Q0 L0 x) T, e5 J' b  }
8. Audacity 的 OpenVINO 插件" S* Q" b! E0 _8 M0 j, a3 _" V
_url=https://blog-api.landr.com/wp-content/uploads/2024/04/OpenVINO-Plugins-for-.jpg
4 v3 y7 ^+ |- Z0 J* s' E3 O$ Q8 s$ Z2 l1 e& E  {4 s& ~& p1 V
如果你还没有使用 Audacity 作为你的音频编辑工具,那么你一定要考虑一下它。
5 D5 ~; Z/ Q! i: T, W5 s6 o$ {6 J* M$ H- X$ ?+ {2 S
如果你已经使用 Audacity,那么你可能还不知道它可以承载通过英特尔 OpenVINO AI 工具包设计的人工智能音干分割器插件。
% ~! T( s. B" G+ x# P1 |8 }# [: e7 y
我们不知道他们是否利用其中一个开源模型构建了这一功能,但我们很想知道它的性能如何。
1 l; x7 u* n! x% w5 T3 i
7 e) }$ v" ~3 _) f8 Q- D由于这款产品仅限 PC 使用,我们在 Windows 笔记本电脑上进行了测试。安装不像大多数插件那样简单,但也不复杂。) y; n4 B% ]% ?& W

. [' r5 W" Z. G! z  [- ]0 R1 @# k0 C使用 GitHub 页面上的说明进行设置后,插件就非常容易使用了。
6 b, \* {# U8 t; p只用了不到十分钟,插件就制作出了人声、低音、鼓声和 “其他 ”音轨,并自动将它们作为独立音轨放置在时间轴上。/ _5 L/ T' p% U
就我们的耳朵而言,它的质量还不错,但比不上 UVR5 或 Gaudio Studio。不过,如果你经常使用 Audacity 并喜欢它的工作流程,它可能是一个不错的选择。
8 m& [* |( Y4 O9 `# N0 E( ~# w, U6 S" B8 c
链接:https://github.com/intel/openvino-plugins-ai-audacity3 x2 n2 k4 {; m/ j
- [+ ?$ J2 @% c; K
; g7 V; e6 Z9 P5 t
AI 词干分离器和人声移除器的历史实际上比你想象的要长。# f. l' |) V( @, d4 K
' W! a, n1 c& o' k0 |  ~" l
因此,你可以在自己已经拥有的音乐软件中找到音干分离功能。$ T9 J% C, [6 ]& T8 R0 x$ ?. b" U

  Z2 _0 b) {1 l  P2 n! WiZotope RX 有 “音乐再平衡 ”功能,FL Studio 的制作人版及以上版本也有词干分离功能。# z' ^) q% b/ K7 l

; F8 d( E) G  b; d7 J( m这也成为 Serato DJ、rekordbox 和 VirtualDJ 等 DJ 软件的一项功能。
7 F$ p' B7 I: e; N6 `
# H; q4 ?" C+ F+ a: [6 h8 V5 V' p
1 ~$ e+ \3 |# E' ?! Q2 u1 g. m! `
欢迎厂家入驻,推文!免费!微信:yinpinyingyong
您需要登录后才可以回帖 登录 | 快速注册

本版积分规则

音频应用搜索

小黑屋|手机版|音频应用官网微博|音频招标|音频应用 (鄂ICP备16002437号)

Powered by Audio app

快速回复 返回顶部 返回列表