|
关于声音的一些基本知识; u- h% H, ]0 F/ \( [( o( W- t- E
前些天的时候需要做一个单片机放音乐的程序。我觉得有必要稍微了解一下关于声音的基本知识。1 f& W4 H! _. x: a* r# Z% I1 e+ J
0 q$ J* j1 z5 b9 a" K我觉得应该重点看看这篇文章的音高和音色部分。既然我们编程的目的还是为了描述物理世界,那么就有必要了解一些基本的知识。4 F4 y4 m- v }1 C2 e; K
% b8 ? H4 F1 l
- d% m7 E3 N6 |" {1 ~$ }
6 u% g) G% Z1 X. k; g由于人耳听觉系统非常复杂,迄今为止人类对它的生理结构和听觉特性还不能从生理解剖角度完全解释清楚。所以,对人耳听觉特性的研究目前仅限于在心理声学和语言声学。
. ]1 m$ Y. \7 O2 K9 a5 x: ?- |' ? 人耳对不同强度、不同频率声音的听觉范围称为声域。在人耳的声域范围内,声音听觉心理的主观感受主要有响度、音高、音色等特征和掩蔽效应、高频定位等特性。其中响度、音高、音色可以在主观上用来描述具有振幅、频率和相位三个物理量的任何复杂的声音,故又称为声音“三要素”;而在多种音源场合,人耳掩蔽效应等特性更重要,它是心理声学的基础。下面简单介绍一下以上问题。 - V6 A1 R# T, M9 Y. W5 C4 V% j8 m
! [& R) F. P- D
. [3 q% Z7 i Y1 N% k一、声音三要素
" t/ H2 B4 f( l( w/ u- Z+ @
! V/ _2 T: v2 T9 B1 ]
9 s( J( u) L+ N4 b8 V3 A1.响度
( C. P" X G% t4 h- _% C& e6 e
# h9 L% U1 P, `( `) U
X- i8 }! o6 f' b8 k7 M& N 响度,又称声强或音量,它表示的是声音能量的强弱程度,主要取决于声波振幅的大小。声音的响度一般用声压(达因/平方厘米)或声强(瓦特/平方厘米)来计量,声压的单位为帕(Pa),它与基准声压比值的对数值称为声压级,单位是分贝(dB)。对于响度的心理感受,一般用单位宋(Sone)来度量,并定义lkHz、40dB的纯音的响度为1宋。响度的相对量称为响度级,它表示的是某响度与基准响度比值的对数值,单位为口方(phon),即当人耳感到某声音与1kHz单一频率的纯音同样响时,该声音声压级的分贝数即为其响度级。可见,无论在客观和主观上,这 两个单位的概念是完全不同的,除1kHz纯音外,声压级的值一般不等于响度级的值,使用中要注意。
* _( B. b* H6 O7 m
: ]1 v9 T+ u0 a" D6 Q5 o) [8 O5 l3 X! I, |/ ], B/ v
响度是听觉的基础。正常人听觉的强度范围为0dB—140dB(也有人认为是-5dB—130dB)。固然,超出人耳的可听频率范围(即频域)的声音,即使响度再大,人耳也听不出来(即响度为零)。但在人耳的可听频域内,若声音弱到或强到一定程度,人耳同样是听不到的。当声音减弱到人耳刚刚可以听见时,此时的声音强度称为“听阈”。一般以1kHz纯音为准进行测量,人耳刚能听到的声压为0dB(通常大于0.3dB即有感受)、声强为10-16W/cm2 时的响度级定为0口方。而当声音增强到使人耳感到疼痛时,这个阈值称为“痛阈”。仍以1kHz纯音为准来进行测量,使 人耳感到疼痛时的声压级约达到140dB左右。
! n$ t5 k* Q$ R( E. l: J3 R) G# e
# N. j: p- R) u; N) @( s
+ W$ Z, F7 f, |' Z 实验表明,闻阈和痛阈是随声压、频率变化的。闻阈和痛阈随频率变化的等响度曲线(弗莱彻—芒森曲线)之间的区域就是人耳的听觉范围。通常认为,对于1kHz纯音,0dB—20dB为宁静声,30dB--40dB为微弱声,50dB—70dB为正常声,80dB—100dB为响音声,110dB—130dB为极响声。而对于1kHz以外的可听声,在同一级等响度曲线上有无数个等效的声压—频率值,例如,200Hz的30dB的声音和1kHz的10dB的声音在人耳听起来具有相同的响度,这就是所谓的“等响”。小于0dB闻阈和大于140dB痛阈时为不可听声,即使是人耳最敏感频率范围的声音,人耳也觉察不到。人耳对不同频率的声音闻阈和痛阈不一样,灵敏度也不一样。人耳的痛阈受频率的影响不大,而闻阈随频率变化相当剧烈。人耳对3kHz—5kHz声音最敏感,幅度很小的声音信号都能被人耳听到,而在低频区(如小于800Hz)和高频区(如大于5kHz)人耳对声音的灵敏度要低得多。响度级较小时,高、低频声音灵敏度降低较明显,而低频段比高频段灵敏度降低更加剧烈,一般应特别重视加强低频音量。通常200Hz--3kHz语音声压级以60dB—70dB为宜,频率范围较宽的音乐声压以80dB—90dB最佳。 * m! K0 N9 b6 D$ }' K, O1 y
3 k% ]& |2 A( G2 u7 n: [1 D& T6 P
8 m& D; p% H- k- _6 s2.音高
y. p2 R; a" g" B/ l! F- O2 ~/ N. N; F( D
" U# z, p" @) O8 z4 ]+ W- [( f 音高也称音调,表示人耳对声音调子高低的主观感受。客观上音高大小主要取决于声波基频的高低,频率高则音调高,反之则低,单位用赫兹(Hz)表示。主观感觉的音高单位是“美”,通常定义响度为40方的1kHz纯音的音高为1000美。赫兹与“美”同样是表示音高的两个不同概念而又有联系的单位。 + O2 @! X5 |* I+ O2 O, Y" E8 T6 K% v
. M- n, Y8 Z" x9 y
& i4 O4 d/ z3 I# n; H2 i人耳对响度的感觉有一个从闻阈到痛阈的范围。人耳对频率的感觉同样有一个从最低可听频率20Hz到最高可听频率别20kHz的范围。响度的测量是以1kHz纯音为基准,同样,音高的测量是以40dB声强的纯音为基准。实验证明,音高与频率之间的变化并非线性关系,除了频率之外,音高还与声音的响度及波形有关。音高的变化与两个频率相对变化的对数成正比。不管原来频率多少,只要两个40dB的纯音频率都增加1个倍频程(即1倍),人耳感受到的音高变化则相同。在音乐声学中,音高的连续变化称为滑音,1个倍频程相当于乐音提高了一个八度音阶。根据人耳对音高的实际感受,人的语音频率范围可放宽到80Hz--12kHz,乐音较宽,效果音则更宽。
, P I! V- {0 ], g/ B0 ^3 T; ^( ^
9 [! |( O' |$ b: N
4 L) D& ^- @- J; D$ R" {% E& w3.音色
6 J0 ]% N2 V7 q( \, p
2 r0 Q5 V( {3 \# ?5 t8 q
* s! m$ i2 o, B+ [ 音色又称音品,由声音波形的谐波频谱和包络决定。声音波形的基频所产生的听得最清楚的音称为基音,各次谐波的微小振动所产生的声音称泛音。单一频率的音称为纯音,具有谐波的音称为复音。每个基音都有固有的频率和不同响度的泛音,借此可以区别其它具有相同响度和音调的声音。声音波形各次谐波的比例和随时间的衰减大小决定了各种声源的音色特征,其包络是每个周期波峰间的连线,包络的陡缓影响声音强度的瞬态特性。声音的音色色彩纷呈,变化万千,高保真(Hi—Fi)音响的目标就是要尽可能准确地传输、还原重建原始声场的一切特征,使人们其实地感受到诸如声源定位感、空间包围感、层次厚度感等各种临场听感的立体环绕声效果。
" p$ `) r' i; t, J" E' o8 v0 r! X+ Q! {1 K
) U6 @4 C( T' g4 x/ K9 V9 f, K
另外,表征声音的其它物理特性还有:音值,又称音长,是由振动持续时间的长短决定的。持续的时间长,音则长;反之则短。从以上主观描述声音的三个主要特征看,人耳的听觉特性并非完全线性。声音传到人的耳内经处理后,除了基音外,还会产生各种谐音及它们的和音和差音,并不是所有这些成分都能被感觉。人耳对声音具有接收、选择、分析、判断响度、音高和音品的功能,例如,人耳对高频声音信号只能感受到对声音定位有决定性影响的时域波形的包络(特别是变化快的包络在内耳的延时),而感觉不出单个周期的波形和判断不出频率非常接近的高频信号的方向;以及对声音幅度分辨率低,对相位失真不敏感等。这些涉及心理声学和生理声学方面的复杂问题。
" M# n% M* H+ Q# E* E% D D4 x! I5 T# a2 H. c/ k
/ A8 [1 H. Q' i
二、人耳的掩蔽效应 # n: B- {: L6 I: i+ p9 ?
6 l2 T6 h9 n- B7 h. Y% U
8 E8 x5 h- u1 B2 B) x/ c
一个较弱的声音(被掩蔽音)的听觉感受被另一个较强的声音(掩蔽音)影响的现象称为人耳的“掩蔽效应”。被掩蔽音单独存在时的听阈分贝值,或者说在安静环境中能被人耳听到的纯音的最小值称为绝对闻阈。实验表明,3kHz—5kHz绝对闻阈值最小,即人耳对它的微弱声音最敏感;而在低频和高频区绝对闻阈值要大得多。在800Hz--1500Hz范围内闻阈随频率变化最不显著,即在这个范围内语言可储度最高。在掩蔽情况下,提高被掩蔽弱音的强度,使人耳能够听见时的闻阈称为掩蔽闻阈(或称掩蔽门限),被掩蔽弱音必须提高的分贝值称为掩蔽量(或称阈移)。
* [$ x* t; g) P9 g# ]- Z% |2 C! F+ V6 v
2 O5 g. @. l3 p+ `$ U1.掩蔽效应
5 R; K2 ~0 d- Y( T- _! [7 H0 T M6 @ R. k$ t- ^) `; p5 n
2 z' \- K4 V! G" [9 ~+ T
已有实验表明,纯音对纯音、噪音对纯音的掩蔽效应结论如下:
4 Z6 {: M8 Z" o0 j: X* H$ o2 \, z1 m8 Z- d; E6 ]/ q7 n& T- t& Y, Q
4 ]% s* X+ j1 N0 a2 @) @3 mA.纯音间的掩蔽
/ t0 G2 P; S) N) u- Q2 s- j' }; F; o
( Y( h" }0 R: k' T4 H①对处于中等强度时的纯音最有效的掩蔽是出现在它的频率附近。 4 r8 B/ G) D. A& E4 c* e9 Q+ ~
②低频的纯音可以有效地掩蔽高频的纯音,而反过来则作用很小。 6 {7 q; Z$ K4 P$ s' W" u6 k" r
& \2 k3 ^+ a0 d( ]
" I- t/ d* U- {5 b! IB.噪音对纯音的掩蔽噪音是由多种纯音组成,具有无限宽的频谱
; V1 X: S" z. ]+ h8 M
* j; `* \# P' t) a7 P5 u" U- Z: N0 o { @$ Q" _# g3 ]7 }
若掩蔽声为宽带噪声,被掩蔽声为纯音,则它产生的掩蔽门限在低频段一般高于噪声功率谱密度17dB,且较平坦;超过500Hz时大约每十倍频程增大10dB。若掩蔽声为窄带噪声,被掩蔽声为纯音,则情况较复杂。其中位于被掩蔽音附近的由纯音分量组成的窄带噪声即临界频带的掩蔽作用最明显。所谓临界频带是指当某个纯音被以它为中心频率,且具有一定带宽的连续噪声所掩蔽时,如果该纯音刚好能被听到时的功率等于这一频带内噪声的功率,那么这一带宽称为临界频带宽度。临界频带的单位叫巴克(Bark),1Bark=一个临界频带宽度。频率小于500Hz时,1Bark约等于freq/100;频率大于500Hz时,1Bark约等于9+41og(freq/1000),即约为某个纯音中心频率的20%。 通常认为,20Hz--16kHz范围内有24个子临界频带。而当某个纯音位于掩蔽声的临界频带之外时,掩蔽效应仍然存在。 - ]) w7 ^6 v1 @0 F1 j3 N% d5 B7 y5 }
5 m( D; }! H7 j. I- H4 |* ^+ g6 N3 C) Z* I4 @; e
2.掩蔽类型
# s2 A. k* j i# f9 j2 M0 ^
7 [9 Z3 {, D5 ?: S! l" N& D- w( ]& E5 }$ A; c
(1)频域掩蔽
: C, d4 `3 J# ?& G# j" p& V$ z- F4 G6 E+ p: e, x' U9 m5 D7 l
; e9 i9 h, L7 w6 T/ v' ]- I 所谓频域掩蔽是指掩蔽声与被掩蔽声同时作用时发生掩蔽效应,又称同时掩蔽。这时,掩蔽声在掩蔽效应发生期间一直起作用,是一种较强的掩蔽效应。通常,频域中的一个强音会掩蔽与之同时发声的附近的弱音,弱音离强音越近,一般越容易被掩蔽;反之,离强音较远的弱音不容易被掩蔽。例如,—个1000Hz的音比另一个900Hz的音高18dB,则900Hz的音将被1000Hz的音掩蔽。而若1000Hz的音比离它较远的另一个1800Hz的音高18dB,则这两个音将同时被人耳听到。若要让1800Hz的音听不到,则1000Hz的音要比1800Hz的音高45dB。一般来说,低频的音容易掩蔽高频的音;在距离强音较远处,绝对闻阈比该强音所引起的掩蔽阈值高,这时,噪声的掩蔽阈值应取绝对闻阈。
" \" J. n: `6 J- }. X1 V6 r" F) ^4 g3 E! H$ w( M b
, y* ?) W" Z: u( J4 \6 s(2)时域掩蔽
, T1 x6 }# `6 Q, p# r/ S/ F" i7 l/ [2 B$ ~
' x1 [7 J' p) T" q0 F! Z 所谓时域掩蔽是指掩蔽效应发生在掩蔽声与被掩蔽声不同时出现时,又称异时掩蔽。异时掩蔽又分为导前掩蔽和滞后掩蔽。若掩蔽声音出现之前的一段时间内发生掩蔽效应,则称为导前掩蔽;否则称为滞后掩蔽。产生时域掩蔽的主要原因是人的大脑处理信息需要花费一定的时间,异时掩蔽也随着时间的推移很快会衰减,是一种弱掩蔽效应。一般情况下,导前掩蔽只有3ms—20ms,而滞后掩蔽却可以持续50ms—100ms& Y/ d# n$ Y* P' Q% w h+ e4 Q* X
|
|