音频应用

 找回密码
 快速注册

QQ登录

只需一步,快速开始

阅读: 485|回复: 0

[后期] 9 款最佳的免费 AI 词干分割器和人声去除器

[复制链接]

694

积分

0

听众

13

音贝

音频应用新手发布

Rank: 3

积分
694
发表于 2024-5-7 | |阅读模式
音频应用公众号资讯免费发布推广

5 ?+ R6 I7 V+ |4 R) v5 Z/ V7 j3 _9 m3 V
AI 主干分离器(或词干分离器)是一种软件工具,可以将完全混合的歌曲文件拆分为每个乐器层的单独声音文件。这些层称为茎。人声去除器专门用于隔离人声,而其他主干分离器可以分离成更多主干,例如贝司、鼓和“其他乐器”。$ u! Z* ~7 E5 r. _
_url=https://blog-api.landr.com/wp-content/uploads/2024/04/The-X-Best-AI-Stem-Sp.jpg
, _' [4 N# P3 S8 D( O主干分离器最常见的用途是创建混音、混搭、DJ 编辑和卡拉 OK 乐器。
% r( l: z, g0 W1 z' u  t9 L7 N: W8 X" _# \+ ?
这些工具使用机器学习算法,这些算法经过训练可以识别特定声音的频率素材并自动隔离它们(因此称为“AI”)。5 t1 z' s7 j4 S& ~; C9 d
" l# q1 f# F2 K+ ^: D( L
_url=https://blog-api.landr.com/wp-content/uploads/2020/01/How-to-Remix-a-Song_f.jpg
; [8 d  c/ H- {: I# X8 q许多人工智能词干分离器和声音去除器使用相同的开源算法,这些算法被封装在不同的包装器中。
) m6 f) r+ Y; M4 c1 y: O" u6 n5 q
两种主要的开源词干分割算法是 Spleeter(由Deezer 的音频研究团队开发)和 Demucs(由Meta 位于巴黎的 AI 研究实验室开发)。1 H" u9 \# b% a# [9 v9 W1 k3 L

# Z8 k* C& v3 [9 g我们比较了多个选项,即使它们使用相同的算法,因为可用性和功能存在差异。  h: F6 c$ A" r# f
_url=https://blog.landr.com/_next/image/?url=https%3A%2F%2Fblog-api.landr.com%2F.jpg
# q4 m2 r2 ?' l# P# M0 k6 _4 o# \% A2 S, O- [
, ~$ F% g4 V- L* z0 g  R8 b
1. Ultimate Vocal Remover 5 人声取出插件* F5 w- ~% f6 r2 P/ M! q

# B$ A' H4 {' @* F _url=https://blog-api.landr.com/wp-content/uploads/2024/04/Ultimate-Vocal-Remove.jpg
$ ?$ `$ Z  b# ]* I+ j- X( Y对于那些密切关注音频分离技术的人来说,UVR5 是一款不可或缺的人工智能音干分离器和人声去除器,而且完全免费。6 ~* ^+ D+ c- o) }! ~/ z

' `3 ?4 Z6 j2 X7 m; g你不仅可以选择不同的算法,甚至还可以使用 “合奏 ”模式,同时使用多种算法,让每种算法都能为你带来特定乐器的优势。
/ f, C' F) E$ }. @
% d0 q. ?# D2 z" d1 T( d  Y# S我们将它设置为 Demucs v4 模式,用了大约 6 分钟就把一首 6 分钟的歌曲分成了 4 个音轨(人声、贝斯、鼓和 “其他”)。
+ s6 O. d# G1 D
3 P0 w- L8 t4 T% O- N" n5 p0 D虽然我们没有对每种算法和每个音乐层都进行测试,但总体结果质量很高。你的结果可能会有所不同,这取决于你的使用情况和设置。
, U( K; _  A4 o& @5 }- l# a/ g' N/ B, J( o
$ n/ ]$ R* U" K7 u  i我们还让它为我们的测试歌曲提供了一个乐器版本,具体做法就是去掉人声。: g5 D2 F4 x, r# }' D
. O2 d0 i( e( J  f* t4 a
有些人一开始可能会觉得参数有点吓人,但其实很容易学会,尤其是有了这样一份指南。
- P5 ?( x1 M" n4 G# ]
0 r$ `2 ?" C) z1 `9 v* E作为一款应用软件,它的整体可用性非常出色,我们认为对于任何想要进行人声去除或乐器分离的人来说,它都是不二之选。
( n" _5 D. h$ e$ f6 f. F3 p* a% `% A# L. b1 Y# m( X+ ~8 z# o1 o
链接:https://ultimatevocalremover.com/
+ ]2 b+ L' a1 j; b: Y8 P6 s
! H5 K0 ?2 u/ s- c6 Q( H: f/ S2. Gaudio Studio
4 }0 F! K4 _- H/ W9 R _url=https://blog-api.landr.com/wp-content/uploads/2024/04/Gaudio-Studiointext-1.webp.jpg
; `7 @+ z5 B% Z/ c! e" I! [市面上有很多基于浏览器的人工智能音干分离器和人声去除器。: h! b$ T  x0 X; u: _- G

; V; m! ^6 O! r5 i8 _4 }* Z这些软件可能会在其专用处理器上运行你的分离效果,而不是在你电脑上的本地处理器上运行,这有时可能意味着更好的效果。
8 w/ p; H; `: ~3 z2 P$ Q( P1 M( T+ T5 q( Z" N; }
其中很多都不是免费的,但 Gaudio Studio 是个明显的例外。你只需用谷歌账户登录即可。
' k# V! \9 J( e
6 S: [) R9 B; Q- X: U登录后,上传要分割的歌曲、选择要分离的乐器层并将歌曲提交到队列中就非常简单了。0 _% u1 t; ^0 V

3 v* r8 q& C7 W4 p; b; ?大约花了五分钟,Gaudio Studio 就把我们六分钟的测试歌曲分成了人声、低音、鼓和 “其他 ”主干。0 x; P: A8 K* m2 Y; g8 y
' j4 r# ^% f( L- e& Y4 B7 J' k- U4 i
音质相当出色,即使与我们的 UVR5 测试相比,音源的清晰度也非常高。
- M& K) h- P5 |& r, e+ R% l, K% r: B' k
截至 2024 年 4 月,它目前还处于测试阶段,5 月份将升级到新版本。该网站没有解释此次升级的内容,因此我们希望这并不意味着他们计划在短期内将其货币化。
& `+ k- {/ A( e! O) j0 ]链接:https://studio.gaudiolab.io/
1 e, J$ t; x% a% H. A% n  M9 y% `2 G( h! a4 V, A
3. MVSEP# B; h2 L, W; U
_url=https://blog-api.landr.com/wp-content/uploads/2024/04/MVSEPintext.webp.jpg $ d( P0 o# B* P+ v& R8 F  T
6 C0 u/ t9 h# Q
如果你要使用音干分音器进行采样,最好储备一些专业的高质量材料。LANDR Samples 拥有出色的人声、低音、鼓声和乐器音色库,可供探索。" c: }, i4 c. F- r% ~4 P6 {

- e" t2 Y# H3 C! G5 S* M! F( T
$ E( b" ?5 e/ L5 T! B" Q这款词干分割器有点像 UVR5,但它是基于浏览器的,而不是独立的。9 x/ H, B8 ~/ G" _3 }
) ?6 B' M# w& E; I. g* `$ G
它允许你选择多种不同的型号、质量级别和输出格式。
6 y  N1 X0 z* t, d& q) S
; z% E) t- j( e! g1 @不过,你能使用的设置数量和其他优势取决于你选择的服务层级。
0 ~% f8 c3 g9 H
, K. h( _* w% g) _! F) c* \我们注册了一个免费账户进行测试,并将六分钟的测试歌曲分为人声、低音、鼓和 “其他 ”主干。- `& a4 {% s! R
5 Z- D( ^* V; p0 N
我们使用 Demucs v4 模型来查看与 UVR5 的质量是否有差异。我们用了大约五分钟,听起来质量没有明显差别。* ]3 L$ Q) U$ g. h8 t, m& k5 n, X8 w

0 r" a: z& V( g0 X, r我们不确定在 UVR5 免费的情况下付费购买 MVSEP 是否有优势,但你可以自己进行比较来确定。
, i+ L% y; f/ z5 c$ S- ?6 o- s5 Y7 u# q% P0 r& c- c$ }
事实上,MVSEP 网站的主要优势可能在于其文档和资源,而非工具本身。
' }3 n- t9 q+ ~2 |( ?* I' G$ V
) w+ j9 T/ ]  A$ c你可以在他们的网站上找到不同音频分离算法的质量评级比较表,以及不同分离类型的庞大测试结果数据库。
9 |" `/ y- B- `$ l7 E4 [+ G4 @& ^
4 C/ u/ X# o! q$ s. p链接:https://studio.gaudiolab.io/
2 o1 k; R6 ~% `% d. W. v* V- Y% t# q  Q8 P, b% u; z
4. StemRoller
& W7 _7 l$ j& y7 L. ?. Q; O _url=https://blog-api.landr.com/wp-content/uploads/2024/04/StemRollerintext.webp.jpg
& f, F/ g; L1 G0 V  HStemRoller 是另一款使用 Demucs v4 制作的免费 AI 音干分割器和人声去除器。
" p$ {) U" x, X$ x4 g8 w# I( l
它可在电脑上独立运行,但与 UVR5 不同的是,它不允许你使用不同的算法或其他设置。相比之下,它的功能设置要少得多。
1 F4 r$ Y) v6 I" w5 {) y/ ^
, S- i; s0 q. q+ G不过,如果你因为要在太多配置中做出选择而感到茫然,这款软件或许值得一试。- @0 {* p# P( W$ r9 p: u

9 G4 ^4 `( [+ i! `& ^  y你只需将文件拖入窗口,它就会立即开始处理。
+ S" j6 a& T" W2 o3 }$ p" O& U& U% L* |  o* s$ a( D
结果与在 UVR5 中运行 Demucs v4 的质量基本相同。
7 k. e4 L2 n6 {, Z" c
3 Z8 ?$ b9 |2 }7 s" J- ^除了常见的四个主干外,它还自动为我们提供了一个完整的器乐音轨,没有任何人声痕迹,听起来非常棒。
+ p8 {: {. z. q6 }) H7 C4 ~/ G% n7 @2 _; l' q8 z' x
开发者警告说,它可能需要大量的处理能力,并需要长达 15 分钟的时间来生成结果,但在我们的 M2 MacBook Air 上只用了几分钟。2 d% g/ K' D  U

* H5 t- I* F  m6 `* g/ s& l# f& [: n3 r  A* D
链接:https://mvsep.com/en
# u  K( M. c1 a/ B" A/ L0 M( d5 k3 e- q
: x5 @  P$ K' \5 z7 m$ l$ H7 u7 |  [
  a# A$ r) C9 }+ w' k
5. Spleeter for Max" W) m: ?9 P; \3 t6 ^- t$ K
_url=https://blog-api.landr.com/wp-content/uploads/2024/04/Spleeter-for-Maxintext.webp.jpg * x( `4 V1 F: h7 Y( D& |1 |+ U

0 T% A; `% ?: M* i如果在 Live 中运行基于 Spleeter 或 Demucs 的音干分割器,它不会产生实时效果。它仍需要时间将源音频片段处理成干,这些干将以排列视图显示在时间线上。
- t( \' z4 S2 J8 C/ ]; L6 F0 f/ X( d: K) C/ M5 q7 e

  |3 O+ `1 D( K我们有一个好消息要告诉各位 Max for Live 用户--有好心人制作了一款基于 Spleeter 的设备,你可以在 Ableton Live 中将其用作人工智能音茎分离器。, G4 N. o3 G3 }8 R" K; A6 X9 P, r+ _) G, O

0 p1 Z1 R: r; f不过,对于不熟悉命令行安装的人来说,设置过程可能比较麻烦。你需要遵循几个步骤,在 macOS 上使用终端,在 Windows 上使用 CMD。
" o9 b) k* v! k$ Y5 c6 Q
+ \( x$ p" L& n: K) E% \/ v另一个问题是,由于 Spleeter 算法无法在 M1/M2/M3 Mac 上本地运行,因此这款设备也无法运行。
3 m3 n$ h& e$ |: B
% E) L- m# w- X2 f尽管如此,我们还是在配备英特尔处理器的老款 MacBook Pro 上进行了测试。我们发现它很容易使用,甚至比我们测试过的基于 Demucs 的分音器更快地传送音茎。: L# o6 S' J! o5 u4 @1 R3 _: n
' X+ O; b+ x5 j7 P: p  E1 [% {
我们发现,它的质量不如 UVR5 或 Gaudio 好,但直接在 Ableton Live 中使用的便利性对某些用户来说可能是值得的。% y5 E/ m: V% @5 e; b

# V0 l* S' U' M( J& r) s. A因此,如果你不介意安装步骤,又有一台兼容的机器,这可能是一个方便的选择。
$ [* _4 N+ B( F" e7 |6 j, Z" E- a; F: b" }" E" p/ f
另外,如果你愿意花上 20 美元,也可以购买这款使用 Demucs v4 制作的 Max for Live 音干分割器。
4 J' l/ _/ u4 {5 f+ R( h8 Z: P: @( F( ^& G' \
链接:https://www.maxforlive.com/library/device/5956/spleeter-for-max) I& \# m9 X% I/ }
8 m4 E# o+ t0 U! O5 E
6. Vocal Remover人声移除器0 I7 p# N* p" M
_url=https://blog-api.landr.com/wp-content/uploads/2024/04/Vocal-Removerintext.webp.jpg + @0 W) q& b0 w
9 f: _8 m* C; u: H/ c$ \$ u
使用它是免费的,网站似乎也没有明确列出任何限制。: n" R) c+ }8 B) _0 n% V4 y
) H+ C: _1 j! M4 ^
然而,当我们试图进行多次测试或尝试完整的声干分离服务时,却被告知要么稍后再试,要么订阅开发者的 Patreon。
* S' D6 `6 Q% \6 ]2 j, R$ S! t
* i) i9 Y: e, W由此我们推测,除非你选择付费订阅,否则免费版的 Vocal Remover 在两次使用之间会有一段不明确的等待时间。* m9 P6 c  _' z; b" m- Q; |

$ J; D6 W& g7 r! ^6 ?我们的人声移除测试很快,只花了几分钟就完成了人声和乐器的移除。
2 L! G5 S5 O, l
5 ?- r, S; i' i3 d但我们发现,与 UVR5 和 Gaudio Studio 相比,人声音轨与乐器之间有大量渗漏。
6 m; S4 ^9 K; |) ^
  J" F8 }2 k8 h- n9 ]5 Q( Z9 {( I% H链接:https://vocalremover.org/
4 x. w$ \6 I6 K3 W- H/ }
2 T9 s, d5 T. G- i7.Fadr Stems
, ~. X3 y4 M8 V _url=https://blog-api.landr.com/wp-content/uploads/2024/04/Fadrintext.webp.jpg
, P$ s, U: X* D; f" j# V该网站提供人工智能词干分割器和自动混音工具。
( v9 O" p; e) N3 I! {4 U6 d  k7 p# W! n' j* x6 p8 C. |, Q
注册账户并选择免费计划后,Fadr 会将歌曲分成四个音干,并允许你以 MP3 格式下载。! X( X+ k8 Z. L' I6 `& [
9 M: I$ K/ V+ U3 L0 Z
如果你想将歌曲分解成四个以上的主干,下载 WAV 格式的歌曲,并使用其他功能,你就必须切换到付费订阅选项。
3 a0 }' C( g; e. C免费版并不限制每月可分割的歌曲数量,而且 200MB 的文件大小限制似乎对免费版和付费版都适用。) o" y9 V: ~; {5 i& G* i( |

/ d/ `; v! g. m. S" ~8 x它能在五分钟内处理我们的测试歌曲,但处理结果并不是我们所见过的同类产品中质量最高的。
: ^6 s7 _0 H; M' a6 R" c5 E3 ^( K" Z5 E: G1 `) L" x  K
链接:https://fadr.com/stems
/ h# o; e8 u; H( N
# z6 F! ?9 u& l6 z, {* E) x
5 ^$ T. H2 O  L
: i$ B/ v2 }3 r* E- V3 C8. Audacity 的 OpenVINO 插件
, Q: |) v5 l: Y6 q0 C- M- ^% s _url=https://blog-api.landr.com/wp-content/uploads/2024/04/OpenVINO-Plugins-for-.jpg
% f" P! N8 h( [0 C4 Z' Z
9 f, [+ q- u; v* H8 E  A如果你还没有使用 Audacity 作为你的音频编辑工具,那么你一定要考虑一下它。) E: B, `3 B% ]
; j" P9 N3 M) q1 |* f; F
如果你已经使用 Audacity,那么你可能还不知道它可以承载通过英特尔 OpenVINO AI 工具包设计的人工智能音干分割器插件。: I1 f5 v/ {- q( r7 i

& v( \& Z/ H* c+ x* N3 F2 r$ d: d我们不知道他们是否利用其中一个开源模型构建了这一功能,但我们很想知道它的性能如何。! d( B3 w/ U+ G9 y

3 V4 N* V% W; B; n/ p/ K. l由于这款产品仅限 PC 使用,我们在 Windows 笔记本电脑上进行了测试。安装不像大多数插件那样简单,但也不复杂。
9 {) T3 O% l0 B% v: P. \7 b2 d7 {& D; H1 ]( }& a* ^
使用 GitHub 页面上的说明进行设置后,插件就非常容易使用了。
! R9 A; Q/ S8 P2 W只用了不到十分钟,插件就制作出了人声、低音、鼓声和 “其他 ”音轨,并自动将它们作为独立音轨放置在时间轴上。
  R& k: ~# k/ w4 L1 a+ Y' K0 A& Q+ T就我们的耳朵而言,它的质量还不错,但比不上 UVR5 或 Gaudio Studio。不过,如果你经常使用 Audacity 并喜欢它的工作流程,它可能是一个不错的选择。! h1 @) ~# X, H, A8 T6 i) M
& `+ B! R2 \# N) p% H8 j3 y, ^9 X: o
链接:https://github.com/intel/openvino-plugins-ai-audacity
- x! A& c( M% t) ?4 ~
, X, L8 o" j; @" X* l+ r" `
5 `: _! w3 m9 k) y& l. J1 D9 w, y3 cAI 词干分离器和人声移除器的历史实际上比你想象的要长。
4 [9 m& b/ f+ Z, u# S4 z  D& x6 {) j" k" ~, k# ^. \: ]
因此,你可以在自己已经拥有的音乐软件中找到音干分离功能。
0 u8 T, L. o6 H* U4 @' Y
6 P. w# ]  r4 Z3 S$ N; N$ LiZotope RX 有 “音乐再平衡 ”功能,FL Studio 的制作人版及以上版本也有词干分离功能。
  o" C7 @6 p4 e, {1 A: v
, N2 [8 e* ?! ^这也成为 Serato DJ、rekordbox 和 VirtualDJ 等 DJ 软件的一项功能。5 J/ R0 F/ t# \2 s& u( L
* v. E. |9 [- p4 s# w! [
0 F5 b  _0 y: ?1 d: G
欢迎厂家入驻,推文!免费!微信:yinpinyingyong
您需要登录后才可以回帖 登录 | 快速注册

本版积分规则

音频应用搜索

小黑屋|手机版|音频应用官网微博|音频招标|音频应用 (鄂ICP备16002437号)

Powered by Audio app

快速回复 返回顶部 返回列表