lokkaon 发表于 2009-6-28 09:15:36

了解音频采样率转换

现在,"数字制作嗡嗡声 "又开始全面制作了,我最近一直在思考音频问题,特别是音频采样率。


当模拟音频被数字化时,它就从波转换成了采样。每秒采样越多,数字化声音的精度就越高。



奈奎斯特定理(Nyquist Theorem)指出,如果将采样率除以 2,得到的数字就代表了该采样率所能再现的最高频率。因此,48,000 个采样率 / 2 = 24,000 Hz。由于正常人的听力只能听到高达 20,000 Hz 的频率,48K 采样率意味着在其他条件相同的情况下,数字音频片段的频率将超过正常人的听力要求。




背景


我思考采样率的原因是,在制作《嗡嗡声》时,我使用了两种不同的采样率: 48,000(称为 "48K")和 44,100(称为 "44.1K")。这两种采样率都超过了正常人的听力要求,但这并不意味着它们是一样的。




在周四晚上的直播节目中,我会回放一个 "节目床",这是一个 QuickTime 电影,包含所有录制的元素,如开场、结尾、广告和音乐提示,以及可视化片段计时。这大大简化了现场节目的音频制作。这个 QuickTime 节目床电影是用 48K 采样率制作的立体声版本。




节目是用马兰士 PMD-661 数字录音机录制的,采样率也是 48K。




然后,将节目导入 Adobe Audition 进行必要的清理;最常见的是调整音频电平。




注:这里有一篇关于我如何处理音频电平的最新文章,包括我使用的设置。



然后,为了节省文件大小,我会以 44.1K 的单声道输出节目和所有单个访谈。这样在压缩之前,文件就减少了约 60%。




这又回到了我最初的问题:我把音频从 48K 转换成 44.1K,会对我的音频造成什么伤害?于是,我联系了 Adobe Systems 公司音频和 Adobe Audition 产品经理 Durin Gleaves,以了解答案。




Audition 的采样率转换算法是目前最好的。我建议大家查看 http://src.infinitewave.ca/,它比较了 50 或 60 种 DAW 和音频工具,测量了将 96kHz 的录音降采样到 44.1kHz 时的伪音。它提供了一个非常直观的例子


某些应用算法可能留下的伪影。




[Larry 补充: 此图来自 Infinite Wave,比较了 Audition CS6(上图)与 ProTools HD 10.3.5。请注意 ProTools 测量(下图)中从原始扫频中脱落的回声伪像。]







[Larry 继续: 下面是 Infinite Wave 制作的另一张 Audition CS6(上图)与 Sony Vegas 9.0 的对比图。看看使用索尼维加斯进行降采样时产生的音频混乱。]




在你的例子中,你录制的音频频率是 48K,这意味着能捕捉到的最高频率是 24kHz。(奈奎斯特定理(Nyquist Theorem)认为数字录音能以采样率的一半重现频率)。




当你将采样率向下转换到 44.1kHz 时,你基本上就切断了高于 22,050 Hz 的任何频率。Audition 提供了一个 "质量 "滑块和一个前/后滤波器,两者都能减少伪音和假反射。从上面的无限波截图中可以看出,向下采样过程有时会将高于 22.5KHz 的频率向下 "弹回",这当然不是你想要的。除非你使用的是非常糟糕的音频设备,否则你根本不会改变音高或时序。(现在或过去的某些声卡只能以单一的采样率工作,虽然它们会尝试进行实时采样率转换以实现不匹配的回放,但有时里程数会有变化)。












在 Audition 中,除了或多或少会损失一些我们听不到的高频率外,对声音的损害并不大。




处理过程中的另一个步骤可能还包括降低比特深度,这也是可能发生损坏的另一个步骤。Audition 以 32 位进行录制和处理,这意味着它能为每个样本存储大量的潜在动态范围。音频 CD 固定为 16 位,这意味着最大动态范围为 96dB(最安静信号和最响亮信号之间的差异),但通过使用抖动技术,加入真正安静的噪音,可感知的动态范围实际上会更大一些。




实际上,对于一般的语音和普通音频,您不需要做太多的调整,默认值通常就能正常工作。如果你以 192K 采样率和 32 位深度录制并混音了交响乐团,并准备将其制作成标准音频 CD,那么抖动可以弱化数字量化所产生的刺耳噪音,有时在淡出的尾音部分可以听到这种噪音。




- - -




Larry 补充道: 谢谢你的评论,Durin。和所有的转码一样,我尽量只在采样与采样之间进行转换。
页: [1]
查看完整版本: 了解音频采样率转换