浅析高清音频对于声卡的影响 ) A' i# V' z3 ^* a' i/ s) i+ h # F$ Z( W6 y* q x
众所周知,现在无论是板载声卡或者是独立声卡,对于音频规格的支持都有很多种。例如,现在无论是独立还是板载声卡,大都支持16Bit/44.1KHz,24Bit/48KHz和24Bit/96KHz的规格,而目前音源的规格,也从传统的CD到DVD,从蓝光到最新的HDTA,也都具备16Bit/44.1KHz24Bit/96KHz,甚至到32Bit/384KHz等不同的规格。那么,这些规格对于声音的音质究竟有什么影响呢?对于声卡来说,工作在什么规格下能够使得音质最好呢?) U. Z; z$ j5 ^. w+ Z8 L
! x/ {" ]( W1 _$ F 音频的不同规格中,我们常见16Bit/44.1KHz,这个规格是由两部分组成。第一部分是量化精度,也就是常说的24Bit或者16Bit,而后面,则是采样率。要了解它们对于音质有什么影响,我们首先要理解它们的具体含义。 1 H; _. c9 Y' t9 M/ b- u c1 s 9 M' {+ D3 ~9 _( `" t& B
● 24Bit对决16Bit,高量化精度所带来的优势- R G4 t) s- F3 l, L
, f. R8 @; Q# I6 u( |
首先我们需要理解量化精度的概念,也就是我们常说的16位,24位。音频系统中量化精度——即Bit的数目决定了声波振幅的范围(即动态范围,最大音量与最小音量的差距),如果这个位数越大,则能够表示的数值越大,描述波形更精确。每一个Bit的数据可以记录约等于6dB动态的信号。一般来说,16Bit可以提供最大96dB的动态范围(加高频颤动后只有92dB)。每增加一个Bit的量化精度,这个值就增加6dB,因此我们可以推断出20Bit可以达到120dB的动态范围,24Bit则可以提供高达144dB的动态范围。如图: , z+ V, K+ ^0 w9 F8 v ! r3 K; |/ ~7 |/ \$ s' }0 k24Bit则可以提供高达144dB的动态范围 4 H& \& p9 \2 k$ M" J# F4 ~8 k. F" s% @, ~
那么,动态范围大了,会有什么好处呢?动态范围是系统所能发出的最小音量和最大音量的差别(也是最大不失真电平功率与噪音功率的比值)。这个值越大,则系统可以承受很高的动态,比如1812序曲中的炮声。如果系统动态过小,高于动态范围的信号将被削波(Clipping, 高于0dB的溢出信号将被砍掉,会导致噼里啪啦的声音)。因此,HDTA等新一代高清音频格式具有比CD高很多的动态范围,能够从容重现大动态信号。而下面,是动态的对比。 $ }4 Z. N1 y4 |2 v0 Z0 k4 L6 P; s% h2 H. V% T- [- A: P. {
0 c5 u. S% t9 z& T 6 }8 ~! e+ E& A9 k i) RHDTA的动态 f! U ?, D. G. I. `1 u; P3 w: i; B
: ^0 N( N; ^2 k3 K9 l
; Y; q( e5 c) D2 ?- ^4 H) x
HDTA转成CD格式后的动态 2 N2 e: G: A; B1 S5 p. R ! V* Z! D- d" e/ i2 @# s% { 可以明显看出,CD的最高电平要小一些,而最低电平也要高于HDTA,这样在实质上,动态被压缩掉了。0 I+ ~! y& M0 n; s; r
6 z! I. _2 h: W l& r' b6 u- x3 E! C( | 更高的量化精度还有一个好处,就是在低电平时失真小。假设一个只有-90dB的声音信号,并且系统最大音量是96dB(以最小音量为0dB)。那么在16Bit的情况下,系统将只用1Bit的数据来表示这个信号,失真将会很大。而如果在24Bit的条件下,最大音量不变,则-90dB的声音信号将在这里变成一个相当于16Bit下的一个-32dB的信号(最小音量减少48dB),系统将使用9Bit的数据来表示这个信号。失真很明显将会降低许多。如图: $ z7 I1 \+ [! E% n$ f- }5 X C. Q% ]/ R! N" f! }
: P" a4 C( s1 N$ F
2 [( K; V! X$ g X; q( A2 ^高量化精度带来的小失真,大动态的效果- R! J( H, ]& N: `2 H9 [6 T
9 l: ^4 `/ v% R# q* f' g 因此,高量化精度带来的小失真,大动态的效果。听起来很棒!HDTA等新一代高清音频依靠24Bit的量化精度,将能够重现大动态的同时,对于声音的细节有明显的提高。
除了量化精度,还有一个采样频率也很重要。采样频率,也就是1秒钟以内采集多少个电流脉冲。比如44.1Khz,就是在1秒钟的时间内用44100个电流脉冲来表示波形。根据奈奎斯特采样定理,其大致的含义就是如果想要采样一个频率范围,需要至少2倍的采样率,比如我们的采样率为40Khz,则我们可以精确确定一个20Khz信号上的两个点。我们常说的44.1Khz采样率就是根据这个定的。 HDTA号称支援最大到32Bit/384KHz,加上以前我们常听到的192KHz,96KHz,那么他们相对44.1KHz有什么优势呢?% R6 K. t* W. H8 ]% ]
}6 z( E' H A
) D0 \4 ?# C: n: n9 h
* w% M6 y( @9 O 上图为HDTA的频率响应,可以看到一直到60KHz都是平滑的曲线。这样看上去对于听感改善很大,虽然由于人耳的上限为20KHz,因此这种改善被限制了。但是从这里,带来了一个新改进。在原先44.1KHz的情况下,所有的噪音和失真都将落在20-20KHz这个区域,而很不幸,这些噪音和失真将全部被人耳听到。而由于HDTA这样高采样频率带来的频宽。噪音和失真将只有一部分落入20-20KHz这个人耳区域。因此在听感上,384KHz下的听到的失真,理论上只有44.1KHz的八分之一左右。6 m7 F# f: _! \" U
( d! y! T6 T7 ], k6 r8 w' w
由上述理论可知,高清音频相对于传统的CD具有很大的提高。那么实践中,高清音频能够为声卡带来什么好处呢?下面我们就来看看一个典型的独立声卡RMAA测试。7 [" A, m I% c1 `5 J0 D$ A l$ B
! K' ?+ H# o+ J5 q7 T & K# H8 \# W0 D$ W& Z, X' n# h6 j( b0 S; j) n: K
在上面的图中大家可以看到,独立声卡在24Bit/96KHz下的音质最高,比16Bit/44.1KHz提高很多,在失真方面也有很大的降低,更加接近我们上面所述的理论。也就是说24Bit/96KHz的规格更适合这块声卡音质的发挥。下面,我们再看看一个板载声卡的RMAA测试。 o) t5 O' V* I$ I" M6 ^7 |' Y * V1 M/ D6 E5 R. B1 `! u3 W* g' Q: V5 |, H
8 ^$ P. |7 q& h2 l9 t! f2 b4 V 我们看到了,我们找不出一个绝对明显的综合性能指标最高的规格来,板载声卡在16Bit/44.1KHz到24Bit/96KHz各种不同规格下的性能指标差不多,各个参数有升有降,可以算是没有提高,也就是说工作在24Bit/96KHz下不会对音质起到任何提高的作用。, U8 I: t, q) V/ v: F
7 d% l% d3 U! \6 t/ \4 z 对于独立声卡来说,如果在Foobar中加入SRC插件,将16Bit/44.1KHz的音源SRC到24Bit/96KHz,对于音质会有提高。而板载声卡,则基本没有办法。但是有朋友说了,从16Bit/44.1KHz SRC到24Bit/96KHz,这是个有损音质的转换过程,因此不推荐。实际上目前软件SRC的失真,绝大部分都在-120dB以下,这个损失对于千元级声卡来说是可以忽略不计的。而使声卡工作在24Bit/96KHz所得到的音质提高是大大超过这个损失的,因此总体上我们的音质还是提高的。 - C* P9 L2 ]' m0 ~4 o; n3 j ! j+ T. _3 ^. ~, g 由此,我们可以总结,对于音源来说,采样率和精度越高,会使得声音源头的品质更加出众。而对于大部分独立声卡,尤其是音乐卡来说,工作在24Bit/96KHz甚至以上的规格下,都可以使得音质有所提高。而对于绝大部分板载声卡来说,对不起,和高清音频是沾不上什么关系的。