了解音频采样率转换_数字音频技术/多媒体技术

lokkaon 发表于 2009-6-28 09:15:36

了解音频采样率转换

现在，"数字制作嗡嗡声 "又开始全面制作了，我最近一直在思考音频问题，特别是音频采样率。

当模拟音频被数字化时，它就从波转换成了采样。每秒采样越多，数字化声音的精度就越高。

奈奎斯特定理（Nyquist Theorem）指出，如果将采样率除以 2，得到的数字就代表了该采样率所能再现的最高频率。因此，48,000 个采样率 / 2 = 24,000 Hz。由于正常人的听力只能听到高达 20,000 Hz 的频率，48K 采样率意味着在其他条件相同的情况下，数字音频片段的频率将超过正常人的听力要求。

背景

我思考采样率的原因是，在制作《嗡嗡声》时，我使用了两种不同的采样率： 48,000（称为 "48K"）和 44,100（称为 "44.1K"）。这两种采样率都超过了正常人的听力要求，但这并不意味着它们是一样的。

在周四晚上的直播节目中，我会回放一个 "节目床"，这是一个 QuickTime 电影，包含所有录制的元素，如开场、结尾、广告和音乐提示，以及可视化片段计时。这大大简化了现场节目的音频制作。这个 QuickTime 节目床电影是用 48K 采样率制作的立体声版本。

节目是用马兰士 PMD-661 数字录音机录制的，采样率也是 48K。

然后，将节目导入 Adobe Audition 进行必要的清理；最常见的是调整音频电平。

注：这里有一篇关于我如何处理音频电平的最新文章，包括我使用的设置。

然后，为了节省文件大小，我会以 44.1K 的单声道输出节目和所有单个访谈。这样在压缩之前，文件就减少了约 60%。

这又回到了我最初的问题：我把音频从 48K 转换成 44.1K，会对我的音频造成什么伤害？于是，我联系了 Adobe Systems 公司音频和 Adobe Audition 产品经理 Durin Gleaves，以了解答案。

Audition 的采样率转换算法是目前最好的。我建议大家查看 http://src.infinitewave.ca/，它比较了 50 或 60 种 DAW 和音频工具，测量了将 96kHz 的录音降采样到 44.1kHz 时的伪音。它提供了一个非常直观的例子

某些应用算法可能留下的伪影。

[Larry 补充：此图来自 Infinite Wave，比较了 Audition CS6（上图）与 ProTools HD 10.3.5。请注意 ProTools 测量（下图）中从原始扫频中脱落的回声伪像。］

[Larry 继续：下面是 Infinite Wave 制作的另一张 Audition CS6（上图）与 Sony Vegas 9.0 的对比图。看看使用索尼维加斯进行降采样时产生的音频混乱。］

在你的例子中，你录制的音频频率是 48K，这意味着能捕捉到的最高频率是 24kHz。(奈奎斯特定理（Nyquist Theorem）认为数字录音能以采样率的一半重现频率）。

当你将采样率向下转换到 44.1kHz 时，你基本上就切断了高于 22,050 Hz 的任何频率。Audition 提供了一个 "质量 "滑块和一个前/后滤波器，两者都能减少伪音和假反射。从上面的无限波截图中可以看出，向下采样过程有时会将高于 22.5KHz 的频率向下 "弹回"，这当然不是你想要的。除非你使用的是非常糟糕的音频设备，否则你根本不会改变音高或时序。(现在或过去的某些声卡只能以单一的采样率工作，虽然它们会尝试进行实时采样率转换以实现不匹配的回放，但有时里程数会有变化）。

在 Audition 中，除了或多或少会损失一些我们听不到的高频率外，对声音的损害并不大。

处理过程中的另一个步骤可能还包括降低比特深度，这也是可能发生损坏的另一个步骤。Audition 以 32 位进行录制和处理，这意味着它能为每个样本存储大量的潜在动态范围。音频 CD 固定为 16 位，这意味着最大动态范围为 96dB（最安静信号和最响亮信号之间的差异），但通过使用抖动技术，加入真正安静的噪音，可感知的动态范围实际上会更大一些。

实际上，对于一般的语音和普通音频，您不需要做太多的调整，默认值通常就能正常工作。如果你以 192K 采样率和 32 位深度录制并混音了交响乐团，并准备将其制作成标准音频 CD，那么抖动可以弱化数字量化所产生的刺耳噪音，有时在淡出的尾音部分可以听到这种噪音。

- - -

Larry 补充道：谢谢你的评论，Durin。和所有的转码一样，我尽量只在采样与采样之间进行转换。

页: [1]

音频应用's Archiver

了解音频采样率转换