音频应用   音频插件联盟,正版插件,欢迎大家选择!

 找回密码
 快速注册

QQ登录

只需一步,快速开始

阅读: 18515|回复: 1

[教程] 宽带语音编码--机遇与实施挑战

[复制链接]

78

积分

2

听众

-1

音贝

音频应用

Rank: 1

积分
78
发表于 2007-9-26 | |阅读模式
音频应用公众号资讯免费发布推广
引言
随着 IP 电话的广泛应用以及 3G 无线手持终端即将大量投产,通过"新型"分组电话网络提供优于普通长话音质的音频性能面临巨大机遇。我们可利用数据网络不受目前电话网络 8 KHZ 采样率(4 KHZ 通频带)限制的功能来实现优于普通长话音质的语音。我们提供低价的 DSP 进行宽带信号压缩,便于其在分组网络上传输,这也是目前上述功能成为现实的原因之一。
本文所讨论的课题就是宽带语音编码器及其实施所面临的挑战。我们将探讨标准化的宽带语音编码器,并讨论当前技术状态以及发展方向。此外,我们还将讨论系统影响以及广泛采用所面临的一些障碍。
宽带语音编码器
目前 IP 语音 (VoIP) 系统使用的大多数语音编码器都经过调整,可通过传统 PSTN 的带宽,因为与传统 PSTN 的互操作性一直是一个关键要求。由于 PSTN 使用 8 KHZ 的采样率,该带宽限制在大约 200-3400 HZ。宽带语音编码器将可用通频带扩展到 50-7000 HZ,针对的是不直接与传统数字 PSTN 进行互操作的应用。这就大大改善了语音交谈的音质,让我们能更清楚地听到通话,并更好地识别讲话者。此外,传输更高质量的音频信号(如音乐)也由此成为可能。
标准组织多年来一直在努力为上述应用定义宽带语音编码器标准。早期宽带编码器的主要用途是电视会议,不过近期工作则集中在 VoIP 与无线应用上。
以下部分将介绍宽带语音编码器的各种不同标准。
宽带语音编码--机遇与实施挑战
G.722 (SB-ADPCM)
ITU G.722 于 1988 年标准化,是第一个用于 16 KHZ 采样率的标准化宽带语音编码算法。该编解码器将 16 KHZ 的频带分为两个子频带,并用 ADPCM 算法在子频带中进行编码。其总延迟约 3 ms,这已经很小,不致造成电信网络中的回声问题。此外,该编解码器传输位误差率仅为 10-3,其性能可以接受。即使遇到最差的网络传输条件,上述要求也可确保性能只是稍稍下降。
G.722 编解码器在 16 kHz 频率上接收 16 位数据(带宽从 50 Hz 至 7 kHz),并将其压缩为 64、56 与 48 Kbit/s。
G.722.1(转换 (Transform) 编码器)
ITU G.722.1 于 20 世纪 90 年代末开发,可实现比 G.722 编解码器更低的比特率以及更大的压缩。目标是以大约一半的比特率实现与 G.722 大致相当的质量。该编解码器由 Picturetel 开发,使用了转换编码的方法。其在 16 KHZ 频率上接收 16 位数据(带宽从 50 Hz 至 7 kHz),并将其压缩为 32 与 24 Kbits/s。目前大多用于电视会议系统。
G.722.2 (AMR-WB)
AMR-WB 是一种最初为 GSM 无线网络定义的宽带编解码器,但最近扩展为包括有线系统。由于其计算强度很大,因此要充分利用多年来显著提高的 DSP 处理能力。AMR-WB 建立在 CELP 语音编码器基础上,音频带宽为 50-7000 HZ,在 6.6 至 23.85 Kbit/s 间提供 9 种语音编码。
AMR-WB 于 2001 年标准化,用于 GSM 与 WCDMA 网络。2002 年底,ITU 决定它还将作为有线应用的宽带标准。它是第一个具有双重应用范围的编解码器。
宽带语音编码--机遇与实施挑战
VMR-WB
VMR-WB 是新型可变速率多模式宽带语音编解码器,专为无线 CDMA 2000标准而设计,目的在于在 50 至 7000 HZ 的频带上进行语音编码,采样率为 16 KHZ。VMR-WB 基于 3GPP AMR-WB (G722.2) 编解码器,在每秒速率12.65 Kbit 上可实现互操作。
VMR-WB 工作模式有四种,具体选择哪种应视网络的流量情况而定。前三种模式专门针对 CDMA 系统,而第四种模式为 AMR-WB 互操作性模式。
VMR-WB 与 AMR-WB 的互操作性允许 GSM/WCDMA 与 CDMA2000 系统无须进行自动解码即可通信,这就不至于增加额外的延迟以及引起语音质量下降。
实施宽带编解码器的系统影响
电话系统设计有两个主要领域会因使用宽带编解码器而受影响:1) 模数输入/输出子系统,2) DSP 中进行的软件处理。
以下给出了 IP 电话的样例结构图,并在该图右下方显示了 DSP 处理器与A/D I/O 子系统之间的关系。
宽带语音编码--机遇与实施挑战
模数输入/输出子系统
A/D I/O 子系统包括扬声器、麦克风与硬件编解码器,对音频信号进行采样并将其数字化,以传输至 DSP。在能够进行宽带语音编码的电话中,重要的是让上述所有组件都支持 50-7000 Hz 的频带,这是宽带语音编码器的要求。
这意味着通常用于标准 PSTN 功能电话中的扬声器与麦克风将不再适用,从面将限制基于其设计的带宽。我们必须用具有宽带功能的扬声器与麦克风来替代它们。
此外,用于传统 PSTN 应用的标准硬件编解码器中的滤波器会带有防混淆滤波器,它将带宽限制在 200-3400 Hz。因此,设计具有宽带功能电话时的另一重要考虑因素就是使用支持 50-7000 Hz 带宽的硬件编解码器,并能以 16 Khz 进行信号采样。
软件
关于具有宽带功能电话软件的主要考虑因素之一是,要求串行输入端口与宽带语音编码器之间的处理组件必须运行于 16 KHz。该要求使单位时间必须处理的数据量翻番,通常也造成处理需求翻番。下页的结构图显示了从左侧 PCM 接口单元开始的受影响的组件。对处理要求影响最大的模块是回声抵消器,它的运行速率必须为传统 IP 电话的两倍,这影响相当大,因为回声抵消器占用大量的计算资源。
第二大受影响领域就是宽带语音编码器本身需要的处理要求。下页的表显示了AMR-WB 编解码器的处理要求相对于原先基于的 G.722 ADPCM 编码器增加了多少。AMR-WB 的 25 MIPS 要求相对于 12 MIPS 范围内的窄带 AMR 编解码器而言也是一个巨大的飞越。


欢迎厂家入驻,推文!免费!微信:yinpinyingyong
您需要登录后才可以回帖 登录 | 快速注册

本版积分规则

音频应用搜索

小黑屋|手机版|音频应用官网微博|音频招标|音频应用 (鄂ICP备16002437号)

Powered by Audio app

快速回复 返回顶部 返回列表