|

楼主 |
发表于 2005-9-12 05:37:00
|
显示全部楼层
音频编码基本手段
: s7 Y: i8 y8 d编码基本手段(1):量化和量化器9 I5 [, F O6 l* ]$ @$ M8 |
基本概念:
3 ]+ [/ E0 J% v \9 m3 _/ }/ W7 s& t8 Z2 q0 f! o) V% ~
量化和量化器:量化是把离散时间上的连续信号,转化成离散时间上的离散信号。6 i- _, L" M5 Y8 i' \
2 z0 I9 Q; g5 J, d+ {) ^5 P6 d: l
常见的量化器有:均匀量化器,对数量化器,非均匀量化器。
( q# r" H- C" @ C [/ @+ z2 ]: R5 }5 u5 z% D% N
量化过程追求的目标是:最小化量化误差,并尽量减低量化器的复杂度(这2者本身就是一个矛盾)。# F8 T6 i) Q# n2 r/ b+ }- _8 B7 b
_4 H. {, p9 v7 z, y7 z# T1 _# ]- P; E" i& \
) ?2 q& |3 Y( j6 ?! [4 w
3 F4 a( T8 E1 G+ {2 J+ I
! n: Y. C5 f1 b, \, q常见的量化器的优缺点:
* G% D. W# l C% r, v$ W# q
+ C8 k; J1 R& s1 i% A/ z(a)均匀量化器:最简单,性能最差,仅适应于电话语音。
8 {) P' s0 y0 I! i: t- y/ d" I* C2 S+ b1 D' `% F+ v4 E G) v
(b)对数量化器:比均匀量化器复杂,也容易实现,性能比均匀量化器好。
: I4 U* ~9 T1 F+ L% ^
) S' v3 P! v6 u w" j(c)非均匀(Non-uniform)量化器:根据信号的分布情况,来设计量化器。信号密集的地方进行细致的量化,稀疏的地方进行粗略量化。
. Q5 g5 M, }1 k
6 k% R6 w: x) u( F; J( m$ X% u1 E" N3 R6 k1 e
* U5 c" I1 w! g$ N
" I. a; R2 H* a6 |$ z7 B( p8 p' t/ F: Y$ T u4 d
编码基本手段(2):语音编码器
6 U# a) V/ e, G; f1 r1基本概念3 ~+ {4 L1 U: Y' n6 E* W7 Q
7 s4 z* @& h* o; w7 L% R( [, O8 R
& @: p0 n! w4 Y: M/ I* H语音编码器分为三种类形:(a)波形编器 、(b)声码器 、(c)混合编码器 。3 W3 G. Q+ y, w$ \
1 f" o' e: i. q l
: \$ ], `' W1 |. X! Z) ~
2 E! i5 }2 q# A8 P+ P波形编码器以构造出背景噪单在内的模拟波形为目标。作用于所有输入信号,因此会产生高质量的样值并且耗费较高的比特率。 而声码器 (vocoder)不会再生原始波形。这组编码器 会提取一组参数 ,这组参数被送到接收端,用来导出语音产生模形。声码器语音质量不够好。混合编码器,它融入了波形编码器和声器的长处。5 {2 [+ [' i, S! ~
j* T N+ J) I, w. W
- C8 F% \! q1 s6 A+ j+ y
/ S6 ~0 c! `5 Q D, |8 k0 l2波形编码器
. B# E9 ? B4 h: [2 Q6 R4 M2 B波形编码器的设计常独立于信号,所以适应于各种信号的编码而不限于语音。
4 Y4 R9 R3 F( @6 i- }0 w# l: J6 `. o/ ~+ U- V8 s
9 ^$ {) j* m8 s" P" H. c
; R5 v" e, L0 `) |8 Q
时域编码:
1 N- p$ _1 S$ z1 u( s( [a)PCM:pulse code modulation,是最简单的编码方式。仅仅是对信号的离散和量化,常采用对数量化。$ w5 F r& l4 H1 L4 x
9 }. _" X; d% M* |b)DPCM:differential pulse code modulation,差分脉冲编码,只对样本之间的差异进行编码。前一个或多个样本用来预测当前样本值。用来做预测的样本越多,预测值越精确。真实值和预测值之间的差值叫残差,是编码的对象。5 W: D7 H0 T5 w( a
) C% @) K& z3 `
image.png6 _' p7 M# t3 f
! Q' z5 E" J7 o5 v$ k
c)ADPCM:adaptive differential pulse code modulation,自适应差分脉冲编码。即在DPCM的基础上,根据信号的变化,适当调整量化器和预测器,使预测值更接近真实信号,残差更小,压缩效率更高。# j7 z( t$ ]- \, a W, e u$ N
/ g% J/ ]% g* ^2 Y# v7 T% B: A- T
/ L; E! @4 d1 y" a6 E: x2 Z
0 n6 b4 s% R e0 h& ?; N; U
频域编码:
8 p! G* V* Q8 t( C0 F- [ 频域编码是把信号分解成一系列不同频率的元素,并进行独立编码。
+ p% Q- F/ |1 x) n
* U& W+ n3 H& ^' k! x) ~a)sub-band coding:子带编码是最简单的频域编码技术。6 w9 j5 G% h6 k; R% o o
& |% L$ p S4 B! G1 F8 U5 A
是将原始信号由时间域转变为频率域,然后将其分割为若干个子频带,并对其分别进行数字编码的技术。6 V8 _- Z- T& t) g' ^
. o! R7 _) Y7 E) M+ o) F$ x& q
它是利用带通滤波器(BPF)组把原始信号分割为若干(例如m个)子频带(简称子带)。将各子带通过等效于单边带调幅的调制特性,将各子带搬移到零频率附近,分别经过BPF(共m个)之后,再以规定的速率(奈奎斯特速率)对各子带输出信号进行取样,并对取样数值进行通常的数字编码,其设置m路数字编码器。将各路数字编码信号送到多路复用器,最后输出子带编码数据流。对不同的子带可以根据人耳感知模型,采用不同量化方式以及对子带分配不同的比特数。8 V1 p6 Q5 T) @2 `8 K* J9 |
! w% T/ z; b: A! H
b)transform coding:DCT编码。 c' |9 E k5 g
6 W9 r8 H' a; H, D6 I
$ Q6 g# t& O# B; u6 n% K$ `( c; c7 @% M1 F' p2 F
3声码器
v0 w2 k& A$ {/ ~channel vocoder: 利用人耳对相位的不敏感。1 l* H! h6 O9 _: W" ]; m8 u, p
* {! U3 Z) G. ~2 Z5 T k, a
homomorphic vocoder:能有效地处理合成信号。
" c$ v. v4 H+ T: u% I9 |; x+ }7 X4 _8 T9 P3 ^. H& Z
formant vocoder: 以用语音信号的绝大部分信息都位于共振峰的位置与带宽上。
1 ?+ ~5 z. h a8 y; N& Y- M1 q* s; Q- S+ B8 i" A& Y* y$ H
linear predictive vocoder:最常用的声码器。
0 D* f' f8 Y; [. D9 o. @) T0 f4 Z) u/ s' s* q
. @6 s, c* R5 X' X( L- M4 I
( ^, J2 [* @# \, ?! R4混合编码器
& X# G5 G5 w) R: i! | 波形编码器试图保留被编码信号的波形,能以中等比特率(32kbps)提供高品质语音,但无法应用在低比特率场合。声码器试图产生在听觉上与被编码信号相似的信号,能以低比特率提供可以理解的语音,但是所形成的语音听起来不自然。$ r4 y9 G, `" j
% l8 E( V/ y7 G9 o* U
: I9 ~2 n* f f5 g. G/ _
$ w& J1 J2 B' L+ k1 i( _' I$ x
混合编码器结合了2者的优点:8 t% m. Y, q6 ^8 I
: b6 T& m/ Z8 i y3 q; c2 T# W! ~% L( u1 p, _( o! {
$ t I( F: K0 }$ mRELP: 在线性预测的基础上,对残差进行编码。
/ B2 Q; J+ I# c1 ?- h) B& `
7 H/ ?! z1 \7 \; l7 ]5 Z9 T. z 机制为:只传输小部分残差,在接受端重构全部残差(把基带的残差进行拷贝)。3 U1 N- o d7 n9 X7 L7 B; d. j4 ?2 H
$ i7 ~, }4 ]# l8 {! R
MPC: multi-pulse coding,对残差去除相关性,0 C* J8 C5 w! F2 j
" }7 Q3 T L- ~ t7 F4 {# _* ^, f; c
用于弥补声码器将声音简单分为voiced和unvoiced,而没有中间状态的缺陷。4 U5 n% I) P" L/ z- p5 X; F
$ Y3 e. e; g' @& X, ~, e+ x1 s# j. A
CELP: codebook excited linear prediction,6 k; k% {* B I- l* K: K
& x' B3 p' i& Y; f& z
用声道预测其和基音预测器的级联,更好逼近原始信号。
# m9 S: |5 t3 S8 c0 c/ d2 {9 \% y q/ Q$ c
MBE: multiband excitation,5 a7 G( g2 I, f+ A; `
- d' f) x) u5 k# u, h 多带激励,目的是避免CELP的大量运算,获得比声码器更高的质量。 |
|