音频分类前置知识
音频
音频常常被表示为波形图,其中横轴为时间,纵轴为幅值。音频多种多样,分类中一般分为语音、音乐、噪音、静音和环境音等。
采样频率
每秒从模拟信号中采集的样本个数,基本单位为Hz。信号的采样频率一般遵循奈奎斯特采样定理,即采样频率必须大于被采样信号最高频率的两倍。一般而言:
8000Hz为电话信号使用的采样率;
11025Hz通话音质更高,可分辨出通话人;
16000Hz可覆盖几乎所有的乐器和人声频率,也是大多数成年人能够听到的声音频率;
22050Hz为无线电广播长采用的频率;
32000Hz为VCD等多媒体数据文件所使用的采样率;
44100Hz为CD音频使用的采样率;
192000Hz为蓝光音轨和高清晰度DVD音轨的采样率。
采样位数
每一个采样点所使用的二进制位数,即计算机对声音信号的解析度。通常使用的采样位数有8位,16位和24位。
音频的构成要素
声学三要素:声音的音调、音色和响度。
音调:也称音高,对应音频信号的频率。音频信号的音调越高月能够给人以明亮和尖锐的感觉,音调越低越是给人厚重和低沉的感觉。
音色:也称音品,对应音频信号的相位。主要由音频信号波形的包络和信号谐波的频谱,包含不同包络和不同谐波的音频信号的内容也不同。音频信号频谱
...查看全文