亚马逊团队在Interspeech 2020深度噪声抑制挑战赛中获得第一名
该团队的非实时系统是性能最好的,而它的实时系统在整个系统中排名第三,在实时系统中排名第二,尽管只使用了4%的CPU核心。
在电子语音通信中,噪音和混响不仅会损害语音清晰度,而且会导致听者在长时间努力理解低质量语音时感到疲劳。在COVID-19大流行期间,我们花在远程会议上的时间越来越多,这一问题比以往任何时候都更加重要。
在今年的Interspeech会议上的深度噪声抑制挑战便是为了帮助解决这个问题的一个尝试,分别在实时语音增强和非实时语音增强上进行比赛。在19个团队中,Amazon取得了最好的结果,在非实时赛道上获得了第一名(阶段1 |阶段2-final),在实时赛道上获得了第二名。
上面是一个有噪声的语音样本(上图)
下面是被研究者的系统抑制了噪声的同一个样本(下图)
为了满足真实世界的需求,我们将实时输入限制在CPU使用量的4%(在i7-8565U内核上测量),这远远低于竞赛所允许的最大限度。
然而,我们的实时输入非常接近(0.03平均意见分数)的第一名,并且击败了其他非实时的输入。
Amazon团队实时和非实时噪声抑制结果的音频示例可以在这里找到。
我们还发表了两篇论文(paper1-offline | paper2-
...查看全文