音频应用

 找回密码
 快速注册

QQ登录

只需一步,快速开始

查看: 32744|回复: 0
收起左侧

[转载] 人工智能中语音合成技术的进步远比我们想象的要快

[复制链接]

321

积分

2

听众

149

音贝

音频应用

Rank: 1

积分
321
发表于 2020-5-26 10:35:03 | 显示全部楼层 |阅读模式
人工智能中语音合成技术的进步远比我们想象的要快4 G3 ^: y, E4 q" F9 C6 c0 Q
人工智能让 Jay-Z 唱起了《哈姆雷特》,语音合成技术的进步远比我们想象的要快0 L2 D' t; r- l' t7 w' |
  
; u( F' c8 g0 B3 [4 V语音合成的技术发展远比我们想象的要快。今年 4 月份 YouTube 曾经下架了一个视频,视频的内容是知名说唱歌手 Jay-Z 唱起了 “To Be, Or Not To Be ”。当然这不是 Jay-Z 本人之举,而是由语音合成技术利用计算机生成逼真的人类语音。& E5 z0 m1 p" T  o4 t

5 N! O  X' A% m3 l/ M8 S7 S9 u& v# n  V* b$ Q

/ ]" p, l7 i0 O 3223_1590355457_thumb.jpg 8 K' S7 y& u4 D, b! I8 G4 M
虽然 Jay-Z 的经纪公司 Roc Nation LLC 声称,这段视频 “非法使用人工智能来模仿我们客户的声音”, 但这不得不再次引发我们对于语音合成器技术的关注和思考。3 f+ K- e: C' A3 V5 A

; [1 ^0 i: W2 `7 H
  A  {4 P5 a- ]. e; p* c- A. O3 V- h* g% n  p3 c' `8 M) Z
  YouTube 链接:https://youtu.be/m7u-y9oqUSw
2 E2 p4 x" k- ]/ W/ S2 r, a2 z& D* u$ i2 v& ]: K5 [' e) T

& f/ ?  S( _3 D: }3 V# V0 Z* S0 _7 p. ?2 r* [0 y0 k  m9 y
语音合成技术,是通过神经网络,在经过人声示例和文本内容的训练下,只需提供文本即可生成接近人类的语音。除了上面的案例,下面还有一个知名说唱歌手 The Notorious B.I.G 用说唱的方式朗诵 “创世纪” 的视频:
1 x3 `, l4 J) }( A4 v" H
) e* l( v  N6 [2 T0 e: A+ W1 G& I) y) v. M  O6 L
/ M& T8 \! n3 {
YouTube 链接:https://youtu.be/_OsRR7HIICU% r  }0 P& }( L& ]3 Q; n) ~

! v- f; N0 S' w7 ?
" ?7 T! V: M; i! s% b: i) s0 C
2 J2 u* H* s  T6 l9 v) E0 c我们都知道 Biggie 已经走了很久,这段音频显然不可能是本人为之,而语音合成生成的结果甚至能够达到以假乱真的程度了。通过这个案例,我们可以大致了解语音合成的步骤:Biggie 的声音由计算器合成,需要使用 Biggie 的人声片段以及对应的文本,让人工智能在音频与文本的对比下进行 “学习” ,明白每个字的 “念法”。经过大量的训练后,语音合成器就能够形成模型,然后只要输入文本,人工智能就会在模型中选取符合读法并进行合成。
% W  A% ?& ?/ }; n. t7 z) Z) l/ @2 `3 n; ?) v% Z7 j3 @) ^$ M
虽然这样的人声合成方式看上去并不是很智能,并且当前的语音合成器还有一些问题,比如复杂单词难以发音,无法进行实时生成,以及不能引导合成人声的情绪,但在普通情况下语音合成技术已经为我们展现了惊人的成果。3 J$ F/ A& v) u" d* ~, ]; f1 j( N9 Z
3 c0 f& g4 Q- F! ?
语音合成去得到了如此重大的进步,一方面这项技术带来了更多可能性,比如可以让你与已故的 Biggie 一同合作;另一面它也可能带来法律问题,侵犯版权和艺术家的公开权。我们应该更加谨慎的对待这项技术,因为它很可能被用来造价,但我们也不能因此而否定这项技术所带来的正面价值。
欢迎厂家入驻,推文!免费!微信:yinpinyingyong
您需要登录后才可以回帖 登录 | 快速注册

本版积分规则

音频应用搜索

QQ|小黑屋|手机版|音频应用官网微博|音频应用 ( 鄂ICP备16002437号 )

GMT+8, 2025-5-29 08:19 , Processed in 0.028307 second(s), 8 queries , File On.

Powered by Audio app

快速回复 返回顶部 返回列表