|

楼主 |
发表于 2005-9-12 05:37:00
|
显示全部楼层
音频编码基本手段
, \+ Q' \* x; j* E# V" i( i编码基本手段(1):量化和量化器" L* Z( }3 W- \. Y+ M
基本概念:2 X) y9 j3 \, y5 D4 Z7 ?
( p* U& y* W! B量化和量化器:量化是把离散时间上的连续信号,转化成离散时间上的离散信号。
* g; x$ C }/ `/ N1 W8 k5 t: k7 K, r+ a. ~" t, {. t
常见的量化器有:均匀量化器,对数量化器,非均匀量化器。
% q6 B4 \! h) P6 X u* s0 k2 E& U5 K4 |$ X% ?
量化过程追求的目标是:最小化量化误差,并尽量减低量化器的复杂度(这2者本身就是一个矛盾)。
6 U2 r) Z0 k$ n1 F4 G4 U. n1 f% N) _) V9 z
4 C# ?7 ~2 l# |3 g
0 C9 h8 }: Z `* r+ ~
" d3 ~* I! U- x" e) G
`4 l' W& p/ @; h s常见的量化器的优缺点:
6 t; K% m+ g) w7 w. K. |" ^+ p% i4 J. |0 Z5 L
(a)均匀量化器:最简单,性能最差,仅适应于电话语音。" i5 _8 C @2 ]% u' Z
. }% y& v7 z/ F4 Q
(b)对数量化器:比均匀量化器复杂,也容易实现,性能比均匀量化器好。
, x# v6 ?% X4 ~0 M$ r/ a+ Q" Z7 U- u& `! S5 C* |
(c)非均匀(Non-uniform)量化器:根据信号的分布情况,来设计量化器。信号密集的地方进行细致的量化,稀疏的地方进行粗略量化。
: t+ F0 X D: K% _8 Y y5 D4 \
! i& J+ ~5 o% c; Z$ H- F! \9 M8 Q+ |7 e) I6 U6 w0 Z3 m
0 i( m; j3 x y6 j3 D+ N+ J# q; v. p! n
/ Z0 ^1 c$ w2 a3 k7 \编码基本手段(2):语音编码器+ f T; i9 L: N( P/ z, N7 Z/ d5 b
1基本概念
$ n* o' T% k& b1 y+ i% a
' m6 ?0 P1 S& I4 |6 @! q( F: i; z& t* w' G$ ]7 P; k5 i9 A
语音编码器分为三种类形:(a)波形编器 、(b)声码器 、(c)混合编码器 。
# y; h+ v4 W' T( I0 w0 P5 P4 |& O) }9 I
' b9 c6 \5 A7 {, s6 _
& v: m- h# R! d* D: @3 Y( O
波形编码器以构造出背景噪单在内的模拟波形为目标。作用于所有输入信号,因此会产生高质量的样值并且耗费较高的比特率。 而声码器 (vocoder)不会再生原始波形。这组编码器 会提取一组参数 ,这组参数被送到接收端,用来导出语音产生模形。声码器语音质量不够好。混合编码器,它融入了波形编码器和声器的长处。
) n- H$ I0 ^" N! W5 i7 r" ? B) J* A8 ^' t& S! G% n. w. H4 i% o3 P5 x
( C+ _' ?5 Q/ W0 S/ \0 E8 |
3 H" f9 u9 [5 v: y0 }
2波形编码器
% k$ @# j3 U% J2 i' R" C波形编码器的设计常独立于信号,所以适应于各种信号的编码而不限于语音。- o$ o+ l# C: @7 _+ I' }# f
o6 ^2 @, I2 ]) ]( V8 ]: V
- N R, Y; `( m% W, e) Y
, ]6 i9 w/ \- w5 y( A( q时域编码:
+ @+ {" Z/ h; sa)PCM:pulse code modulation,是最简单的编码方式。仅仅是对信号的离散和量化,常采用对数量化。6 Z4 j1 p0 Q* K! u# u. l9 \
8 ~" S* N4 @7 p, K7 Nb)DPCM:differential pulse code modulation,差分脉冲编码,只对样本之间的差异进行编码。前一个或多个样本用来预测当前样本值。用来做预测的样本越多,预测值越精确。真实值和预测值之间的差值叫残差,是编码的对象。, M7 c2 k3 X- s) B" v% O: P2 |7 q
/ s. J7 A; ~7 Q% I- y F! F& G
image.png$ {( V& t1 K4 Y+ B7 s* [" X
5 x9 r, C: t! z# H a- x
c)ADPCM:adaptive differential pulse code modulation,自适应差分脉冲编码。即在DPCM的基础上,根据信号的变化,适当调整量化器和预测器,使预测值更接近真实信号,残差更小,压缩效率更高。; b0 h. l& V, f! Q' p# l
& |. E4 w* f9 g4 n
8 b1 ^% C# G1 A/ k$ T) ~4 R/ ^
5 q5 _8 i4 }- _, m' n8 ~0 u频域编码:. O. o# \2 B4 ~# B: u8 d
频域编码是把信号分解成一系列不同频率的元素,并进行独立编码。
* e) @/ O1 I& E" F$ s6 c, ^( d$ ]
. {8 u9 F) L8 D4 Da)sub-band coding:子带编码是最简单的频域编码技术。. N: E0 }# ~, t! f1 O; N+ [
, X; s& g6 E; k9 L& r是将原始信号由时间域转变为频率域,然后将其分割为若干个子频带,并对其分别进行数字编码的技术。
5 ~7 r- F* e' ~6 L6 T C, {( _0 c
它是利用带通滤波器(BPF)组把原始信号分割为若干(例如m个)子频带(简称子带)。将各子带通过等效于单边带调幅的调制特性,将各子带搬移到零频率附近,分别经过BPF(共m个)之后,再以规定的速率(奈奎斯特速率)对各子带输出信号进行取样,并对取样数值进行通常的数字编码,其设置m路数字编码器。将各路数字编码信号送到多路复用器,最后输出子带编码数据流。对不同的子带可以根据人耳感知模型,采用不同量化方式以及对子带分配不同的比特数。( E9 w. ]) ]- ~% z6 C1 L7 V
& s# t- Y4 }! s7 F3 A8 N
b)transform coding:DCT编码。2 y* f9 o0 `) ?7 W' ~0 h1 Q
9 W3 R* o2 M/ Z6 r- D
" m7 Q* I4 Y1 g5 T ?% W, n5 f
8 }' h" }/ O' ]% W3声码器9 M2 f( C# l; D) N% c1 Y' ^
channel vocoder: 利用人耳对相位的不敏感。' R. ?. l+ Z/ n; f
* D7 {) \- K! }$ v1 whomomorphic vocoder:能有效地处理合成信号。
4 _* T, B. w, u- u9 [$ s! E
2 j1 w5 P. P: _5 s& F9 q S6 Qformant vocoder: 以用语音信号的绝大部分信息都位于共振峰的位置与带宽上。
6 k: ^2 V* ^& a1 b5 J+ s' y: Y3 i$ x/ [
linear predictive vocoder:最常用的声码器。
8 _0 [4 B: U, z% P8 C8 ]9 W, e
( b7 r5 [6 Q+ a+ J
2 q3 K7 k# Q, }4 V( M- a- W( u! z2 p- Y. G( a
4混合编码器
9 F" s/ O* e/ u1 Y0 c% ~ 波形编码器试图保留被编码信号的波形,能以中等比特率(32kbps)提供高品质语音,但无法应用在低比特率场合。声码器试图产生在听觉上与被编码信号相似的信号,能以低比特率提供可以理解的语音,但是所形成的语音听起来不自然。& ^: {" s9 W q: y4 y
+ J# a( u7 P L
9 Z' n- Q# z; L3 H! T- p3 E8 _# s
! v7 s k) }9 k& N7 r/ Z混合编码器结合了2者的优点:: e( F# T# u S, A2 i
8 e! |1 [/ ]+ Q+ S) t# ^/ L: E; n: o4 D: T! C. ^0 Q& }
M# j8 l% |+ {( {4 r' ]6 r; `RELP: 在线性预测的基础上,对残差进行编码。
5 @6 F; d( C0 R! L
. I3 b: A( _" k; v. { 机制为:只传输小部分残差,在接受端重构全部残差(把基带的残差进行拷贝)。
: g: i2 R. d5 g2 n, [$ S
- F/ I D; k% @3 N. q" K( G- ]2 y5 oMPC: multi-pulse coding,对残差去除相关性,. o3 W) R% h* G, y
' e: [! Z9 @& a. [" S7 ] 用于弥补声码器将声音简单分为voiced和unvoiced,而没有中间状态的缺陷。! P1 A {; c, q3 v3 T
. G* O+ [! O* S' e/ pCELP: codebook excited linear prediction,
3 q0 V. r5 S' j @, Z$ w5 \3 f) {. f# `7 H- o2 s1 z# h! k
用声道预测其和基音预测器的级联,更好逼近原始信号。
( P( w3 V* @3 F7 V. N/ N7 p
: v' C! n, W$ `" N! WMBE: multiband excitation,% a5 |* Q: [! C, l, ^
( |& D( y: ` x! i
多带激励,目的是避免CELP的大量运算,获得比声码器更高的质量。 |
|