音频知识

qqmusic · 发表于 2008-12-2 10:26:58

音频知识
音频，英文是AUDIO，也许你会在录像机或VCD的背板上看到过AUDIO输出或输入口。这样我们可以很通俗地解释音频，只要是我们听得见的声音，就可以作为音频信号进行传输。有关音频的物理属性由于过于专业，请大家参考其他资料。自然界中的声音非常复杂，波形极其复杂，通常我们采用的是脉冲代码调制编码，即PCM编码。PCM通过采样、量化、编码三个步骤将连续变化的模拟信号转换为数字编码。

一、音频基本概念

1、什么是采样率和采样大小（位/bit）。

声音其实是一种能量波，因此也有频率和振幅的特征，频率对应于时间轴线，振幅对应于电平轴线。波是无限光滑的，弦线可以看成由无数点组成，由于存储空间是相对有限的，数字编码过程中，必须对弦线的点进行采样。采样的过程就是抽取某点的频率值，很显然，在一秒中内抽取的点越多，获取得频率信息更丰富，为了复原波形，一次振动中，必须有2个点的采样，人耳能够感觉到的最高频率为20kHz，因此要满足人耳的听觉要求，则需要至少每秒进行40k次采样，用40kHz表达，这个40kHz就是采样率。我们常见的CD，采样率为44.1kHz。光有频率信息是不够的，我们还必须获得该频率的能量值并量化，用于表示信号强度。量化电平数为2的整数次幂，我们常见的CD位16bit的采样大小，即2的16次方。采样大小相对采样率更难理解，因为要显得抽象点，举个简单例子：假设对一个波进行8次采样，采样点分别对应的能量值分别为A1-A8，但我们只使用2bit的采样大小，结果我们只能保留A1-A8中4个点的值而舍弃另外4个。如果我们进行3bit的采样大小，则刚好记录下8个点的所有信息。采样率和采样大小的值越大，记录的波形更接近原始信号。

2、有损和无损

根据采样率和采样大小可以得知，相对自然界的信号，音频编码最多只能做到无限接近，至少目前的技术只能这样了，相对自然界的信号，任何数字音频编码方案都是有损的，因为无法完全还原。在计算机应用中，能够达到最高保真水平的就是PCM编码，被广泛用于素材保存及音乐欣赏，CD、DVD以及我们常见的WAV文件中均有应用。因此，PCM约定俗成了无损编码，因为PCM代表了数字音频中最佳的保真水准，并不意味着PCM就能够确保信号绝对保真，PCM也只能做到最大程度的无限接近。我们而习惯性的把MP3列入有损音频编码范畴，是相对PCM编码的。强调编码的相对性的有损和无损，是为了告诉大家，要做到真正的无损是困难的，就像用数字去表达圆周率，不管精度多高，也只是无限接近，而不是真正等于圆周率的值。

3、为什么要使用音频压缩技术

要算一个PCM音频流的码率是一件很轻松的事情，采样率值×采样大小值×声道数 bps。一个采样率为44.1KHz，采样大小为16bit，双声道的PCM编码的WAV文件，它的数据速率则为 44.1K×16×2 =1411.2 Kbps。我们常说128K的MP3，对应的WAV的参数，就是这个1411.2 Kbps，这个参数也被称为数据带宽，它和ADSL中的带宽是一个概念。将码率除以8,就可以得到这个WAV的数据速率，即176.4KB/s。这表示存储一秒钟采样率为44.1KHz，采样大小为16bit，双声道的PCM编码的音频信号，需要176.4KB的空间，1分钟则约为10.34M，这对大部分用户是不可接受的，尤其是喜欢在电脑上听音乐的朋友，要降低磁盘占用，只有2种方法，降低采样指标或者压缩。降低指标是不可取的，因此专家们研发了各种压缩方案。由于用途和针对的目标市场不一样，各种音频压缩编码所达到的音质和压缩比都不一样，在后面的文章中我们都会一一提到。有一点是可以肯定的，他们都压缩过。

4、频率与采样率的关系

采样率表示了每秒对原始信号采样的次数，我们常见到的音频文件采样率多为44.1KHz，这意味着什么呢？假设我们有2段正弦波信号，分别为20Hz和20KHz，长度均为一秒钟，以对应我们能听到的最低频和最高频，分别对这两段信号进行40KHz的采样，我们可以得到一个什么样的结果呢？结果是：20Hz的信号每次振动被采样了40K/20=2000次，而20K的信号每次振动只有2次采样。显然，在相同的采样率下，记录低频的信息远比高频的详细。这也是为什么有些音响发烧友指责CD有数码声不够真实的原因，CD的44.1KHz采样也无法保证高频信号被较好记录。要较好的记录高频信号，看来需要更高的采样率，于是有些朋友在捕捉CD音轨的时候使用48KHz的采样率，这是不可取的！这其实对音质没有任何好处，对抓轨软件来说，保持和CD提供的44.1KHz一样的采样率才是最佳音质的保证之一，而不是去提高它。较高的采样率只有相对模拟信号的时候才有用，如果被采样的信号是数字的，请不要去尝试提高采样率。

5、流特征

随着网络的发展，人们对在线收听音乐提出了要求，因此也要求音频文件能够一边读一边播放，而不需要把这个文件全部读出后然后回放，这样就可以做到不用下载就可以实现收听了。也可以做到一边编码一边播放，正是这种特征，可以实现在线的直播，架设自己的数字广播电台成为了现实。

　

几个补充概念：

什么是分频器？
分频器是指将不同频段的声音信号区分开来，分别给于放大，然后送到相应频段的扬声器中再进行重放。在高质量声音重放时，需要进行电子分频处理。它可分为两种：（1）功率分频器：位于功率放大器之后，设置在音箱内，通过LC滤波网络，将功率放大器输出的功率音频信号分为低音，中音和高音，分别送至各自扬声器。连接简单，使用方便，但消耗功率，出现音频谷点，产生交*失真，它的参数与扬声器阻抗有的直接关系，而扬声器的阻抗又是频率的函数，与标称值偏离较大，因此误差也较大，不利于调整。（2）电子分频器：将音频弱信号进行分频的设备，位于功率放大器前，分频后再用各自独立的功率放大器，把每一个音频频段信号给予放大，然后分别送到相应的扬声器单元。因电流较小故可用较小功率的电子有源滤波器实现，调整较容易，减少功率损耗，及扬声器单元之间的干扰。使得信号损失小，音质好。但此方式每路要用独立的功率放大器，成本高，电路结构复杂，运用于专业扩声系统。（摘自av_world）
什么是激励器？
激励器是一种谐波发生器，利用人的心理声学特性，对声音信号进行修饰和美化的声处理设备。通过给声音增加高频谐波成分等多种方法，可以改善音质、音色、提高声音的穿透力，增加声音的空间感。现代激励器不仅可以创造出高频谐波，而且还具有低频扩展和音乐风格等功能，使低音效果更加完美、音乐更具表现力。使用激励器提高声音的清晰度，可懂性和表现力。使声音更加悦耳动听，降低听音疲劳，增加响度。虽然激励器只给声音增加了0.5dB左右的谐波成分，但实际听起来，音量好像增加了10dB左右。使声音的听觉响度明显增加，声音图像的立体感，以及声音的分离度的增加；改善了声音的定位和层次感，还可以提高重放声音的音质，磁带的复制率。因为声信号在传送和录制过程中会损失高频谐波成分，出现高频噪声。此时前者用激励器先对信号进行补偿，后者可用滤波器将高频噪声滤掉后，再营造出高音成分，保证重放音质。激励器的调节需要音响师对系统的音质和音色进行判别，再根据主观听音评价进行调整。（
什么是均衡器？
均衡器是一种可以分别调节各种频率成分电信号放大量的电子设备，通过对各种不同频率的电信号的调节来补偿扬声器和声场的缺陷，补偿和修饰各种声源及其它特殊作用，一般调音台上的均衡器仅能对高频、中频、低频三段频率电信号分别进行调节。均衡器分为三类：图示均衡器，参量均衡器和房间均衡器。1．图示均衡器：亦称图表均衡器，通过面板上推拉键的分布，可直观地反映出所调出的均衡补偿曲线，各个频率的提升和衰减情况一目了然，它采用恒定Q值技术，每个频点设有一个推拉电位器，无论提升或衰减某频率，滤波器的频带宽始终不变。常用的专业图示均衡器则是将20Hz~20kHz的信号分成10段、15段、27段、31段来进行调节。这样人们根据不同的要求分别选择不同段数的频率均衡器。一般来说10段均衡器的频率点以倍频程间隔分布，使用在一般场合下，15段均衡器是2/3倍频程均衡器，使用在专业扩声上，31段均衡器是1/3倍频程均衡器，多数有在比较重要的需要精细补偿的场合下，图示均衡器结构简单，直观明了，故在专业音响中应用非常广泛。2．参量均衡器：亦称参数均衡器，对均衡调节的各种参数都可细致调节的均衡器，多附设在调音台上，但也有独立的参量均衡器，调节的参数内容包括频段、频点、增益和品质因数Q值等，可以美化（包括丑化）和修饰声音，使声音（或音乐）风格更加鲜明突出，丰富多彩达到所需要的艺术效果。3．房间均衡器，用于调整房间内的频率响应特性曲线的均衡器，由于装饰材料对不同频率的吸收（或反射）量不同以及简正共振的影响造成声染色，所以必须用房间均衡器对由于建声方面的频率缺陷加以客观地补偿调节。频段分得越细，调节的峰越尖锐，即Q值（品质因数）越高，调节时补偿得越细致，频段分的越粗则调节的峰就比较宽，当声场传输频率特性曲线比较复杂时较难补偿。（
什么是压缩限幅器？
压缩限幅器是压缩器和限幅器的统称。它是音频信号的一种处理设备，可以将音频电信号的动态进行压缩或进行限制。压缩器为可变增益放大器，其放大倍数(增益)可以随输入信号的强弱而自动变化，是成反比的。当输入信号达到一定程度（阈值也称临界值）时，输出信号随输入信号的增加而增加，这种情况称为压缩（Compressor）；不再增加则称为限制（Limiter）。过去的压限器采用硬拐点（Hard-knee）技术，输入信号一达到阈值。增益就立即减少，这样就会出现信号在拐点（增益变化的转折点）处动态突变现象，使人耳明显地感觉到强信号被突然压缩的现象。为了解决这一不足，现代新型压限器采用了软拐点（soft-knee）技术，这种压限器在阈值前后的压缩比变化是平衡的，渐变的，使压缩变化难以察觉，音质进一步提高。压限器在录音过程中可以使乐器和歌唱者的音量保持一定的平衡；保证各种信号强度的均衡。有时也用来消除歌唱者的口齿声，或利用改变压缩和释放时间，产生声音由小变大的“反转声”特殊效果。在广播系统中是用它来压缩较大动态范围的节目信号在防止调制失真和防止发射机过载的前提下，提高平均发射电平。在歌舞厅的扩声系统中，压限器是将信号通过压缩在保持原节目的风貌下，降低音乐的动态，以满足扩声系统和艺术活动的要求。虽然压限器有多种用途，现代压缩器普通采用了软拐点等新技术，可进一步减小压限器的压缩器的副作用，但是并不意味着压限器对音质的破坏作用就已不复存在了。所以，在扩声系统中，不要滥用压限器，即使要用也应该慎用减少用压限器对信号进行处理。这不仅是保护功放、音箱的需要，也是对改善音质的需要。
什么是信噪比(S/N)？
信噪比指的是线路中某一参考点的信号功率与无信号时固有的噪音功率
之比值，用分贝（dB）表示，其数值越高越好,表示杂音起少。
什么是分贝
分贝（dB）为表示相对功率或幅度电平的标准单位。用dB表示。分贝数越大代表的所发出的声音越大，分贝在计算上是每增加 10 分贝，则声音大小约是原来的十倍。
dB: deciBel分贝。用以表达两个电压、功率或声音的相对水准。
dBm: 分贝的一个变种，0dB = 1mW into 600 Ohms
dBv: 分贝的一个变种，0dB = 0.775 volts.
dBV: 分贝的一个变种，0dB = 1 volt.
dB/Octave: 分贝/八度。滤波器斜率的表达方式，每个八度的分贝数越大说明斜线更陡直。

这个概念相对较为复杂，我们用物理学计算来说明：

为了表示声音的强弱程度，人们引入了“声强”的概念，并用1秒内垂直穿过单位面积的声能多少来量度它的大小，声强用字母“I”表示，它的单位是“瓦／米2”。根据规定可知，如果1秒内垂直穿过单位面积的声能加倍，那么声强的值也变为原来的2倍。所以说声强是不随人们感觉而转移的客观物理量。
　　虽然声强是个客观物理量，但是声强的大小和人们主观感到的声音强弱，却有非常大的差异。为了符合人们对声音强弱的主观感觉，物理学里又引入了“声强级”的概念，分贝就是声强级的一个单位，它是贝尔的十分之一。
　　声强级又是怎样规定的呢？它和声强有什么关系呢？
　　测量证明，人耳对不同频率的声波，敏感程度是不同的。对于3000赫兹的声波最敏感。只要这个频率的声强达到I0＝10－12瓦／米2，就能引起人耳的听觉。声强级就是以人耳能听到的这个最小声强I0为基准规定的，并把I0＝10－12瓦／米2的声强规定为零级声强，也就是说这时的声强级为零贝尔（也是零分贝）。当声强由I0加倍为2I0时，人耳感到的声音强弱并没有加倍。只有当声强达到10I0时，人耳感到的声音强弱才增大一倍，这个声强对应的声强级为1贝尔＝10分贝；当声强变为100I0时，人耳感到的声音强弱增大2倍，对应的声强级为2贝尔＝20分贝；当声强变为1000I0时，人耳感到的声音强弱增大3倍，对应的声强级为3贝尔＝30分贝，依此类推。人耳能承受的最大声强为1瓦／米2＝1012I0，它对应的声强级为12贝尔＝120分贝。
公式：声压级(dB)=20Lg(测量到的声压/参考声压值)
老鱼注：当测量到的和参考声压一样大小时，取对数后的计算结果就是0dB。在模拟的音频设备上，是可以大于过0dB的，但数字设备没有，数字计算需要一个量度，无限的值是没有的。所以在我们用的数字设备和软件中，0dB成了一个参考标准值。

账号		自动登录	找回密码
密码			快速注册

[原创] 音频知识

浏览过的版块