详解采样率，比特深度 & 音频缓冲区

maping · 发表于 2023-4-10 20:32:52

详解采样率，比特深度 & 音频缓冲区

Sample Rate采样率
采样率指的是一秒钟内音频信号被采集样本的次数，类似于视频领域的 frame-rate（帧率）。
采样率数值通常使用 kHz (千赫兹)作为描述单位。

采样率一般有如下设置组合可供选用：

44.1kHz & 48kHz
双倍 - 88.2kHz & 96kHz
三倍 - 176.4kHz & 192 kHz
例如：当采样率设置为 48kHz时，您的音频录制设备将针对信号每秒钟记录 48000个样本。

随着采样率的提升，您每秒钟可以记录到的音频信号样本数量也随之增加。

录音设备可以准确拾取到的信号最高频率会受到设备的采样率设置所限制。

对此简单的描述公式如下：

采样率 ÷ 2 = 可以精确采集到的信号最高频率

这意味着，当使用48kHz采样率时，我们可以记录的音频最高频率为 24kHz。

人耳可聆听到的频率范围大概是20Hz - 20kHz (尽管随着年龄增长，我们会丧失聆听到较高频率声音的能力），因此，采样率44.1 & 48kHz 已经足够覆盖人类可聆听到的声音频谱范围。

正因如此，大部分数字音乐（Spotify/Apple Music, CD等等）发行时所使用的采样率是44.1kHz ，而影视中的音频则偏向使用48kHz。

设置更高采样率的意义何在？

由于44.1/48kHz的采样率允许我们可以采集超越人类听觉所及范围的频率，因此您可能会好奇更高的采样率设置，目的是什么？针对上述提及的应用情景（例如：一般的录音）之外的使用，设置更高采样率是否有价值？目前音频界对此仍然存在争论，我们就不在此进行讨论了。
640 (58).jpg

Bit Depth（比特深度）
比特深度指的是每秒钟采样所记录到的比特数。

随着比特深度的变化，动态范围也随之变化。动态范围指的是可被记录的信号最低音量与最高音量之间的差异。提高比特深度，您可以扩展录音软件聆听到或者录制到的音频界限。然而，人类耳朵通常听力所及的最高上限不超过 120dB。

通常的比特深度设置包括：16, 24, 32-bit浮点

Buffer Size（音频缓冲区）
音频缓冲区指的是允许计算机对声卡或者音频接口的音频数据进行处理的时限。

这适用于调节延迟，也就是实时处理音频的时间延迟。您可以缩减缓冲区大小来降低延迟，但这样可能会给计算机带来更高的运算负担，从而引起音频处理故障或者卡顿。

这类问题通常可以通过在DAW或者驱动控制面板上提升缓冲区的大小来解决。

当要为您的工程加入更多的音轨时，您可能需要较大的音频缓冲区，以便实现无失真且延迟有限的精准信号录制。提升音频缓冲区允许计算机有更多时间进行无失真的音频记录。

为您的工程找到合适的音频缓冲区大小是很重要的，这需要根据音轨、插件、音频文件等的数量而变化。我们不建议使用特定的缓冲区设置，因为这取决于您的特定音频工程的具体情况。然而，有一般性的规则可供参考：

录音时：

可考虑将缓冲区大小设置得尽可能低，以降低延迟。如果您开始听到过载和破音时，或者DAW弹出错误信息时，您可以再提高缓冲区或者减少工程所使用的效果插件/音轨数量。

混音时：

混音时，延迟并非一个真正的影响因素，您可以考虑将缓冲区设置较大数值。这样做可以有效降低在添加效果插件时，您听到声音过载或者破音的几率。

工程录制外的普通音乐或音频聆听：

在DAW以外，纯粹为了聆听音乐，那么延迟并非一个影响因素。所以可以将缓冲区设置为较高数值。

补充说明

上述论述基于假设：无论是模拟电路还是模数转换器，在信号输入端都不具有任何滤波进行高频的截止或者衰减。
论述基于奈奎斯特定理。
影视的音频偏向采用48kHz或48kHz的更高倍数采样率进行录制是为了更好地与电影的帧速率同步。

账号		自动登录	找回密码
密码			快速注册

[资讯] 详解采样率，比特深度 & 音频缓冲区

相关帖子

浏览过的版块