音频应用

 找回密码
 快速注册

QQ登录

只需一步,快速开始

查看: 32695|回复: 0
收起左侧

[转载] 人工智能中语音合成技术的进步远比我们想象的要快

[复制链接]

321

积分

2

听众

149

音贝

音频应用

Rank: 1

积分
321
发表于 2020-5-26 10:35:03 | 显示全部楼层 |阅读模式
人工智能中语音合成技术的进步远比我们想象的要快: C. O% b: c& t3 q" m
人工智能让 Jay-Z 唱起了《哈姆雷特》,语音合成技术的进步远比我们想象的要快
8 K6 f3 w, v& b4 F! s2 M6 L  
" f4 u7 R& j( K1 h+ ~语音合成的技术发展远比我们想象的要快。今年 4 月份 YouTube 曾经下架了一个视频,视频的内容是知名说唱歌手 Jay-Z 唱起了 “To Be, Or Not To Be ”。当然这不是 Jay-Z 本人之举,而是由语音合成技术利用计算机生成逼真的人类语音。8 _7 Y6 @$ A' [$ {* a
7 w7 K& r* M5 I+ Q( M
7 ]! m( j7 ^7 X% Q+ L3 f
& |6 J, e. q9 v/ v: V& F
3223_1590355457_thumb.jpg 3 [- k) y7 ?% I1 f, Z  m
虽然 Jay-Z 的经纪公司 Roc Nation LLC 声称,这段视频 “非法使用人工智能来模仿我们客户的声音”, 但这不得不再次引发我们对于语音合成器技术的关注和思考。
# _' q2 O; n- r& f  x. @4 m* p+ Z+ }4 K- k" b; a  m+ U1 |! G
4 v# m' R$ L% F9 g! |
) ]$ r  @1 v6 [: l
  YouTube 链接:https://youtu.be/m7u-y9oqUSw+ C2 V1 |) D) q- ~
& i$ @. U% U3 C9 r

  q0 h4 V+ s+ H) I: f7 p6 z' d' z( e2 z5 P1 \8 @* G5 O
语音合成技术,是通过神经网络,在经过人声示例和文本内容的训练下,只需提供文本即可生成接近人类的语音。除了上面的案例,下面还有一个知名说唱歌手 The Notorious B.I.G 用说唱的方式朗诵 “创世纪” 的视频:
# S1 k. h/ `6 n. d$ w: ~& i2 p- Y2 r- a2 z

- x+ a/ k( C8 O/ h8 H& J* r
. B7 j" C. q7 Q" m# A: n YouTube 链接:https://youtu.be/_OsRR7HIICU5 B! ~( U0 u& I+ P/ U5 g

2 e/ P+ S4 @% ~7 t: l1 [7 r
. x* M, d& w+ a1 T- C4 a8 D. m
; a% r6 N* {8 U我们都知道 Biggie 已经走了很久,这段音频显然不可能是本人为之,而语音合成生成的结果甚至能够达到以假乱真的程度了。通过这个案例,我们可以大致了解语音合成的步骤:Biggie 的声音由计算器合成,需要使用 Biggie 的人声片段以及对应的文本,让人工智能在音频与文本的对比下进行 “学习” ,明白每个字的 “念法”。经过大量的训练后,语音合成器就能够形成模型,然后只要输入文本,人工智能就会在模型中选取符合读法并进行合成。
6 W9 [; _% p/ b: P2 s
- K* s0 G" ^' N' |7 s) c8 Y虽然这样的人声合成方式看上去并不是很智能,并且当前的语音合成器还有一些问题,比如复杂单词难以发音,无法进行实时生成,以及不能引导合成人声的情绪,但在普通情况下语音合成技术已经为我们展现了惊人的成果。! \0 k- N$ u3 S8 D- i& @# b
' L  R& F9 F- d
语音合成去得到了如此重大的进步,一方面这项技术带来了更多可能性,比如可以让你与已故的 Biggie 一同合作;另一面它也可能带来法律问题,侵犯版权和艺术家的公开权。我们应该更加谨慎的对待这项技术,因为它很可能被用来造价,但我们也不能因此而否定这项技术所带来的正面价值。
欢迎厂家入驻,推文!免费!微信:yinpinyingyong
您需要登录后才可以回帖 登录 | 快速注册

本版积分规则

音频应用搜索

QQ|小黑屋|手机版|音频应用官网微博|音频应用 ( 鄂ICP备16002437号 )

GMT+8, 2025-5-28 06:41 , Processed in 0.041061 second(s), 12 queries , File On.

Powered by Audio app

快速回复 返回顶部 返回列表