choirs 发表于 2008-6-9 02:32:48

数字音频的独特弊病以及如何克服它们

我们对数字音频的批评再熟悉不过了。我们听到过数字音频被描述为刺耳、脆弱、死气沉沉、紧张、冰冷和非音乐性。也许我们每个人都可以将自己的形容词添加到这个列表中。我们周围都是质量低劣的数字系统。我们的消费级 CD 播放器、DVD 播放器、高清电视机和便携式媒体播放器通常配备最便宜的数字转换器。我们都知道这些设备缺乏 1982 年 CD 所具有的“永远完美的声音”。


为了回答这些问题,我们将研究数字系统中失真和噪声的根本原因。我们将研究它们与模拟系统中的失真和噪声有何不同。最重要的是,我们将研究当今解决方案对这些数字问题的有效性。

谐波失真在模拟系统中占主导地位
所有乐器和人声都会产生丰富的泛音(也称为泛音)。这些和声赋予音乐源温暖和个性。小提琴的和声将其声音与小号的声音区分开来。模拟系统总是会添加一些谐波失真(以 THD 测量),但这种失真会产生直接落在音乐源中自然出现的谐波之上的谐波。

谐波失真可能很难检测到,甚至可能会给某些音乐源增添温暖感。在某些情况下,谐波失真在开始改变乐器声音之前可能会达到相对较高的水平。即使可以听到,如果不大量接触未放大的现场乐器,乐器声音的这些细微变化也很难识别。

一些模拟系统受到 IMD 的影响——比 THD 更容易听到
模拟系统通常会引入少量的 IMD(互调失真)。对于给定的电平,IMD 通常比 THD 更容易听到。谐波失真模仿乐器的自然泛音,而 IMD 产生与音乐没有谐波关系的失真音调。存在转换速率问题的模拟系统可能会受到过度 IMD 的影响。具有 RF(射频)不稳定性和敏感性的电路也可能会引入 IMD。

通过良好的电路设计技术,可以将 IMD 降低到可忽略不计的水平。由于可用组件的限制,许多早期的晶体管音频设备(产生于 60 年代和 70 年代)都面临着高 IMD 的问题。如今,我们拥有丰富的高质量音频运算放大器可供选择,IMD 问题已不再那么常见。有些现代运算放大器的转换速率不足以支持音频,但这些运算放大器通常只能用于低成本产品。在现代高端模拟设备中,显着的 IMD 水平是不可原谅的。

数字引起的失真通常类似于 IMD

在许多方面,数字系统引起的失真与早期晶体管音频设备和当今一些低成本音频设备产生的IMD 非常相似。与 IMD 一样,数字引起的失真可能发生在音频频段的任何位置。数字失真伪影通常出现在现场音乐源中不存在的音调上。数字失真伪影可能会出现在正在演奏的音符上方和下方。这些失真伪影没有被乐器的自然谐波掩盖,因此比谐波失真更明显、更令人不安。

数字系统失真的独特原因—​​—数字的“邪恶”
有多种机制可以产生数字系统特有的失真特征。这些机制包括:抖动、量化误差和混叠。我们将研究每一个数字“罪恶”来确定我们的策略。我们能否成功地攻击这些“邪恶”,还是应该退出数字领域,回到安全舒适的模拟系统?

1 - 抖动
DAC - 接口抖动容限 FFT
抖动是一个样本与下一个样本之间的时间间隔的变化。为了正常工作,数字系统在每个连续样本之间必须有一个已知的时间间隔。如果 A/D 转换器中的时间间隔发生变化,则会在错误的时间对输入信号进行采样,并会出现幅度误差。 D/A 转换器中的定时误差会在错误的时间产生正确的幅度。在这两种情况下,都可以证明这些误差“相位调制”了音频。

抖动导致相位调制
颤音是相位调制的音乐术语。这是音高的周期性变化。从概念上讲,抖动产生类似于颤音的效果。不幸的是,抖动的影响通常在音乐上并不令人愉悦。我们都熟悉由哇音和颤振引起的低频相位调制。这些常见于劣质盒式磁带、廉价转盘和老电影音轨。在许多老电影中,可以听到音乐的音高随着电影的帧速率而颤动。抖动会引起类似的影响,但它可能会同时发生在许多频率上。抖动在达到明显水平之前就可能会导致刺耳、混乱和不自然的声音。 SPDIF、AES、i2S 和其他数字传输格式往往会同时在多个频率上引起高频抖动。如果允许这种抖动到达A/D或D/A转换电路,就会产生相位调制失真。

某些数字系统存在可闻抖动引起的失真
抖动并不是数字系统的根本限制,而只是一种缺陷。如果A/D和D/A采样的时序足够精确,Jitter引起的失真可以降低到听不见的水平。保证听不见所需的计时精度相当令人惊讶。抖动必须减少到大约 +/- 20 皮秒(+/- 20 万亿分之一秒),以绝对保证它永远不会超过在相当响亮的听力水平下的听力阈值。幸运的是,抖动引起的失真的很大一部分通常被音乐掩盖。由于这种掩蔽,较高水平的抖动可能是可以接受的。关于抖动可听度的阈值仍然存在相当多的争论。

有些系统有足够的抖动,可以轻松达到可听级别。例如,许多消费类设备的抖动超过 +/- 2 纳秒(+/- 2 十亿分之一秒)。此类设备会产生抖动引起的失真,测量结果仅比峰值音频电平低 78 dB。这些消费级设备会产生抖动引起的伪影,这些伪影在大多数播放级别都远高于听觉阈值。这种抖动引起的失真足够大,只要没有被音乐内容掩盖,就可以听到。

消除抖动
锁相环(PLL)电路用于过滤时钟信号。 PLL 是相当于飞轮的电子器件。在 CD 出现之前,廉价的电唱机很丰富。这些通常有轻质冲压金属盘。相比之下,高端转盘有巨大的转盘来帮助它们以恒定的速度旋转。 PLL 存储和释放电能的方式与飞轮存储和释放机械能的方式大致相同。有些转盘有重型飞轮,有些则没有。同样,一些 PLL 具有足够慢的响应和足够的惯性来充分消除抖动,而其他 PLL 则不然。我们可以通过转盘看到飞轮的大小,但我们无法通过数字转换器看到PLL电路中包含的“电子飞轮”的大小。抖动衰减规范对于评估 PLL 的有效性至关重要。


尝试用高采样率消除混叠
如果我们要加快电影的帧速率,它们就可以捕获更广泛的旋转速度而不会出现锯齿。同样,96 kHz、192 kHz 甚至 2.8224 MHz 音频系统可以准确地表示比 44.1 kHz CD 系统更广泛的频率范围。尽管如此,只要音频输入频率超过采样频率的一半,仍然会出现混叠。高采样率并不能保证不会出现混叠现象。

用低通滤波器消除混叠
如果我们在采样之前去除高频信号,就不会出现混叠。在电影的示例中,当运动速度太快以至于辐条模糊到不再可见时,锯齿就会停止。相机打开的快门会产生一个低通滤波器,使运动模糊。如果模糊足够,就可以防止锯齿。

在 CD 系统中,我们必须滤除所有高于 22.050 kHz 的信号,同时尝试保持可听频率不变。我们希望无损耗地通过 20 kHz,同时去除 22 kHz。这是一项非常困难的任务,它需要一个非常陡峭的低通滤波器。在数字音频的早期,这些“砖墙”滤波器是模拟滤波器。不幸的是,构建具有必要性能的模拟滤波器非常困难。因此,许多早期的录音和回放系统都遇到了一些可听混叠问题和/或一些频率响应损失。

构建砖墙数字抗混叠滤波器要容易得多。转换器可以配置为以所需采样率的某个倍数“过采样”。当音频下采样到所需的输出采样率时,可以应用砖墙数字滤波器。仍然必须使用非常简单的模拟低通滤波器来从过采样转换器的输入中去除非常高频的信号。现在几乎所有数字音频系统都使用过采样 A/D 和 D/A 转换器。在这些较新的“过采样”音频转换器中,混叠很少成为问题。

A/D 中应用低通滤波器以防止混叠。低通滤波器应用于 D/A 转换器,以消除采样伪影并产生没有通过采样系统证据的连续波形。从端到端来看,数字音频系统与带宽受限的模拟系统无法区分。

总之
量化
量化失真可以通过抖动完全消除。位数、采样率和所采用的抖动类型将共同决定数字传输系统的 SNR。

抖动
抖动引起的失真可以降低到远低于可听度的水平。许多较新的录音基本上是无抖动的。如果通过低抖动 D/A 转换器进行再现,抖动引起的失真甚至不会达到可听度。

混叠
通过使用过采样转换器,实际上已经消除了混叠。精心设计的 44.1 kHz 系统中不应存在可听混叠伪影。

CD 的限制
音频行业已经制作了数以千计的 CD 作品,其中包含了可听级别的所有 3 个“数字罪恶”。这些较旧的录音并不能准确地代表 CD 系统的功能。显然,CD 格式尚未提供“永远完美的音频”,但它现在可以提供“近乎完美的音频”。 28年来,我们没有走错路;我们花了这么长时间才完善这个系统。很少有商业录音能够达到 CD 格式所能达到的性能。因此,44.1 kHz 16 位系统仍然是高质量录音的可行发行格式。虽然 CD 格式非常适合分发成品,但 Benchmark 不建议将此格式用于录制或制作用途,因为在应用处理时质量会迅速下降。

DSD(1 位数字系统)
理论上,DSD 系统可以提供比噪声整形 CD 系统稍好的信噪比。它还可以提供稍宽的可用带宽。不幸的是,这些功能在完全用 DSD 录制和制作的录音中都无法实现。

DSD 依赖于对噪声整形的非常积极的使用,因此,它在制作环境中的稳定性甚至不如 CD 格式。 DSD 1 位信号不容易处理,并且在混音和母带制作操作中质量会迅速下降。由于这些原因,Benchmark 不建议将 DSD 用于生产用途。我们认为 DSD 录音通常无法提供该格式所声称的好处。

高分辨率PCM
如果设计得当,高分辨率 96 kHz 24 位系统基本上不会产生伪影。在这些系统中,所有失真和噪声伪影都可以保持在远低于可听度的水平。这些高分辨率数字系统可以捕获、存储、处理和再现模拟信号,而不会出现任何量化、抖动或混叠的情况。这些系统具有足够的分辨率,可以承受数字处理的多个阶段,非常适合录制、制作和发行。
页: [1]
查看完整版本: 数字音频的独特弊病以及如何克服它们