|
Rupert Neve 与 Greg Simmons 模拟和数字声音之间的技术话题访谈
音乐性、温暖感、通透感……在专业音频的发展史上,有一个名字一直是这些品质的同义词。在我们采访的第一部分中,Rupert Neve与Greg Simmons谈论了模拟和数字声音之间的区别,对宽幅带宽频率的需求,以及他对AMEK 公司的“SYSTEM 9098”设备的设计。
Rupert Neve。这个名字和一些最珍贵最持久的专业音频设备融合在一起。经历了四十载专业音频生涯,他的敬业的精神使得Rupert Neve这个名字誉满天下,你应该亲耳听听他设计的产品,也亲耳听听用户们的评价。
他建立了里模拟音频领域两个最著名的公司:Neve和Focusrite,最近又和英国著名的调音台制造商AMEK一起合作,研发了一系列的产品,这些产品统称为“System 9088”,当Rupert Neve设计某些东西时,都会引起音频专业人士的关注。我们也听说了这个消息。然后找到他本人做了一次访谈。
Greg Simmons(本文作者,下文简称G):让我们先聊聊你的调音台研发背景。
Rupert Neve(下文简称R):我不是科班出身,没有学院派的资历。我把自己这种经历称为:QBE-Qualified By Experience(实践资历)。我是伴随着电子管技术时代成长起来的,所以我从开始就一直是将电子管技术融入调音台的设计。有一次我的一个客户跟我说:“你有没有听说过最新的晶体管?你觉得它们会不会也挺好使?”我一时间不知道该怎么回答。随着越来越多的客户都对我提出同样的问题,我意识到自己应该去试着寻找答案了。
我又从半导体知识开始自学,随后我便意识到用半导体能实现的功能比电子管多很多,这些知识点醒了我。但是有很多业内传言说半导体元件底噪大且性能不稳定。所以首先我得确定经过半导体元件处理后的音频品质需要和经过电子管处理后一样好。这意味着大量的聆听对比和大量的数据测量对比。随着我对此项技术的深入研究,我自己也逐渐变成了一个完美主义者。我相信不只是我一个人会这样,很多音频同行也是如此——当你发现产品还有进步空间,你就会要求不断鞭策自己去探索。
那个时期我也没有什么竞争对手——当时只有一两家大点的公司,而且客户还都偏爱小作坊产品——我就自己一个人干。由于个体经营日常维护开支很少,所以即使各个配件进货成本高一些,我也可以生产出品质更好的设备。所以我就持续制造着高品质的调音台。
G:你刚才提到晶体管电路能实现比电子管电路更多的功能。我相信你更倾向于大动态范围和与其相符的高供电电压,由电子管电路转向晶体管电路的设计过程中,上述的电子管所具备的先天优势是否能够得以传承。
R:在电子管电路上,你可以调用更高的电压实现更高的输出电平,但是内部阻抗也都很高,导致了底噪的增加。如果能把阻抗都降下来,就能获得更大的动态范围。
如果选用晶体管设计,只需要几个不同类型的元件简单组合就能解决上述的输入底噪问题,比方说——使用“Low Rbb Type Transistor”(低非本征基极电阻型晶体管)。在一些早期的设计方案里面,我通过大量的晶体管并联排布方式来降低底噪,但是这种设计方案比较“臃肿”。后来人们发明了集成电路——我并没有马上把他们应用于设计,但是观察了一段时间之后还是决定使用——集成电路轻易解决了底噪问题,降低了设计研发的整体难度。
在半导体电路设计中,很难获得像电子管设备那样好的动态范围。但是使用电子管电路也有很多缺点,我们只能两害相权取其轻。
“我在想,我们的一些社会问题是否不应归咎于CD媒介。”
G:所以你后续选用了半导体技术?
R:是的。拿出一个理由就足够说明原因了——我们一旦开始使用低底噪设备,就再也回不了头——有一天,一个离我家不远的芯片制造商跑来找到我说他们那里生产24bit 96KHz的芯片,能不能试着把这些芯片用于调音台的研发设计。当我止住笑声,他们又说:“我们没有在开玩笑啊,我们该如何把音频输入芯片?你能做一个24bit的音频设备吗?”这时我决定尝试一下,我说:“那么在24bit下,动态范围有144dB吗?”【注:理论上,数字电路的动态范围是6dB/bit,所以24bit的电路理论上能提供144dB的动态范围(准确得说是6.0206dB/bit,但是大多数设计师会简化到‘6dB’)】他们回答:“哎呀,没有没有,我们没能实现144dB的动态范围,在内部设计落地的过程中妥协掉一部分,大概能做到120dB到126dB这么多吧。”
G:所以他们其实失去了4bit的编码空间?
R:是的,对于每个人来说,如果按实际的情况测算,没人能实现每一bit就有6dB的动态范围,那是理论值。所以我对他们说:“只需要找到合适的设备就可以,你们是芯片制造商,也许能给我做一些芯片,然后我们多增加几条电压轨道……【在电气学中,“轨道”通常被用来描述供电电压,它是“供电轨道”的缩写。多数电气设备同时拥有正极和负极两种供电轨道】”他们说:“不不不,我的意思是说只需要+5伏的电压,用一个轨道电压都能达到这个动态范围。”
理论上这是可行的——我现在要说点题外话——事实上这是非常可行的。问题是你必须重新考虑元件和材料的选取以及电路设计。
G:所以他们当时的想法是通过0伏特到+5伏特正极轨道电压,而不介入负极轨道电压设计就达到这个动态范围?就像“TTL”(Transistor-Transistor-Logic,晶体管-晶体管逻辑电路 )芯片那样?
R:对,就是这样。+5伏电压下能够实现这个动态范围,但问题是你不能再提升轨道电压了,只能降低本底噪音来获取更大的动态范围。而降低本底噪音的唯一方式是把输入阻抗降低到一个非常低的实际数值,需要用到很特殊的晶体管输入。
然后你会发现,比如说,你设计的设备输入阻抗是4欧姆。然后,你去找到话筒制造商,告诉他设备上的输入端负载是4欧姆,请他产生一个0.8欧姆源阻抗的话筒,对方会发疯的!这根本不现实。
另一个实现的方法是用变压器,但是成本太大。一个能搞定问题的优秀输入变压器的体积和价格都至少是芯片的20倍。也许未来有一天可能会用到它,但是我觉得意义不大。
G:您刚才提到了数字技术,本次采访中即将出现的下一个问题就是:“您对24bit,96KHz的数字技术有什么看法?”如果不介意的话,能否详谈一下。
R:当然没问题,前提是你有足够的耐心听我讲完。(笑)
G:绝对没问题。
R:好的。bit数没问题,但是采样率满足不了要求,我们得提升到2倍,到192KHz来获得可靠的频率覆盖范围,捕捉到的音频频率需要达到75KHz【注:理论上,数字电路中的最高可被采样频率是采样率的一半,比如捕捉75KHz的信号,需要采样率达到150KHz。在现实中,我们会尝试着尽通过可能提高采样率来生成更多频率空间,用于进行后续的类似反锯齿滤波的信号处理过程】。才没有信号失真和噪音的产生。我现在没办法证明它,但是有很多具有丰富聆听经验的人们提供了很多证据足以证明这一点,所以如果我们的能捕捉到的实际频率提升到75KHz,就会绝对不会错失声音世界中的任何细节。96KHz的采样只能大概捕捉到频率上限大概为50Khz的声音,还是不够——基于时间来恒定的采样分辨率还达不到无损要求。
我们可以从96kHz的开始提升采样率,每提升几个kHz就会让音质更好一点。
G:我发现“SYSTEM 9098”采用的元件频宽都高达100KHz,很明显,设计理念和你刚才说的高采样率需求相符。有些设计师会假定人类的听力上限会止步于20kHz,这似乎有点傲慢。
R:是这样,对我们大多数人来说,人类的听力范围也许还不到20KHz。健康的八岁孩童大概能听清22KHz或者更高的频率。但是随着我们年龄的增加,就会不可避免的损失高频感知力。那些能运用自己听力在专业领域工作的人听力衰减的情况会好一些,因为他们平日里会锻炼自己的听力感知。这种训练过程的原理,就是不断调整平衡,同时让大脑内部神经元之间的信号流保持活跃。就像运动员一样,你明白吗,如果你平时坚持锻炼身体,年纪大的时候身体也能保持良好的机能,不必躺在扶手椅里面度过余生。
对于音频专业人士来说更重要的一点是,你得清楚自己该听什么素材,从中寻找什么信息。你也许会聆听一些常规声音素材,那么此时你寻找的就是那些赋予声音独有特性的人工干预痕迹。这种锻炼会让你的思路清晰很多。听得越多,就越敏感,对信息的辨识捕捉就更容易。
如果你不是一个音频专业人士并且从容易别人那里接受意见和判断,比如“数字格式音频是目前音质最好的”,你就会相信这个说法,直到另一些人带给你到不同的理念。接着你会开始聆听并且加以比较。随着时间的推移,你就可以把自己锻炼到不需要仔细对比,就能在远处靠听力区分出来哪些音频是数字格式。它带着与生俱来的标签,那种特殊的声音特征。这些听感上的差别你已经能够做到轻易区分。如果想具备上述这些能力,都与学习和练习密不可分。
G:您对于当今数字音频技术的观点,让我想起来你当时对早期的B类晶体管放大器【注:B类放大器使用的是两套放大电路,一套负责正极半周期的音频信号放大,另一套负责负极半周期的音频信号放大。交叉失真产生于两极信号交叉的原点,即一套放大电路“关闭”同时另一套放大电路“开启”的瞬间。】发表过评论,采用了“拉链咬合般的严重交叉失真”这句话。当时的设备评论家曾经这样预言它:“我们都应该适应的未来的声音发展趋势”【注:这些评论曾出现在AMEK “ 9098”调音台的促销文档中。】这种论调令人颇为震惊。CD品质的数字音频似乎也发生了同样的事情。我能否把这两个事情之间建立起一些共同的联系?
R:是的,这种论调很相似,同时也很危险。我们现在还在世的几代人,其中大部分,并没听到过什么像样的好声音。除非你经常去现场音乐会,听真正的歌手演唱和乐器演奏,否则你会认为数字音乐就是你所需要的一切。
数字处理,如你所知,本质就是采样,你听到的每一个波形的采样都会产生一个开关的咔哒声。这个咔哒声强度跟被采样信号的变化率相关。一个咔哒声就是一个傅立叶频率序列,它是完全随机的。这和音乐本身没有关系。这些咔哒声其实就像你用电灯开关产生出来的一样,你可能会在高保真设备或调音台中发现这种现象……嗯,我生产的调音台中可没有这种瑕疵,但你可能会在别的品牌的调音台中发现它!(笑)要是让我生产出这种品质的产品 ,还不如直接让我去死好了。
G:那是必须的!
R:你看,这种开关咔哒声就是随机生成的频率。它可能会出现在整个频宽范围内,直到你的系统某个节点不再让它通过的时候才会消失。它远超过音频信号范畴,与音乐无关,也不属于谐波。
交叉失真也是同样的道理,B类功放产生的交叉失真并不连贯,两个半周期交替工作的功率放大器轮流工作也会产生咔哒声。同样也和音乐无关,也不属于谐波范畴。就是一种噪声。
AMEK公司的System 9098系列机架设备,由Rupert Neve负责设计。从上开始分别是
遥控话筒放大器的主控制器,双通道话筒放大器,均衡器,双通道压缩器/限制器,遥控话筒放大器。
G:就像电灯开关那样?
R:的确就是那样。数字音频和B类功放的交叉失真的区别是交叉失真在每个处理周期会出现两次,你用一个1Khz的正弦波做测试,交叉失真就会在一秒钟内生成2000个咔哒声。采样率为44.1KHz的CD则生成44100个咔哒声,是与采样率相关的。
噪声的振幅也略有不同,但是坦白的说,你已经对它们知道的够多了。我们感知20kHz以上频段发生变化的机制尚不清楚。关于这方面,我有自己的看法,但目前还不是很清晰。但毫无疑问,一个人的感知远远高于可闻频率,虽然并不明显——一般人也不需要那么明显的感知力。你可以通过20kHz以上的频响很差的设备发送信号,但你仍然可以意识到超出频响范围的频率存在与否。或者你会意识到那些在20kHz以上的频段的迸发的开合瞬态。
数码音乐玩家可狡猾啦,他们宣扬人类听不到20kHz以上的频段范围,然后他们就通过滤波器抹掉了20KHz以上的被称之为“量化噪音”的开合瞬态。现在的数字声音标准是否可以被接受的整个问题的关键就是滤波器。Apogee公司的产品口碑很高,就是因为他们知道如何去选择滤波器。
G:当您谈及滤波器和可闻范围之外的量化噪音的时候,是否指的是输出端的低通滤波或是噪音塑形?
R:指的就是这两个。但是输出端的滤波器实际上满足不了要求。你还是需要通过人为手段将可闻范围的噪音移除,但我对数字音频的了解也就这么多了。
G:好的。让我们继续下一个问题。
R:让我来给你讲一个很有颠覆性的理论。日本人不久前指出,在不同的情绪和情绪刺激下,大脑会产生电子辐射【注:参考“可听范围以上的高频声音影响脑电活动和声音感知”,作者:Tsutomi Oohashi, Emi Nishina, Norie Kawai, Yoshitaka Fuwamoto和Hiroshi Imai。AES预印本第3207号(第91届AES大会,纽约市)】。如果你在听一个模拟格式音乐,制作很好,没有交叉失真,没有数字采样,将会是一段非常令人陶醉的经历。
当你开始欣赏音乐的时候,你就会像我们这些上年纪的人年轻时候那样,在结束漫长的一天后回到家中,放上一张能够长时间播放的唱片,放松一下。即使唱片有点粗糙,依然不妨碍你欣赏它,享受它,放松身心。但是就目前趋势看起来这样的好日子不多了…
G:因为失真的CD品质音乐和廉价的晶体管电路造成的吗?
R:日本人已经证明,事实上我们很多人都很乐意接受这些失真——首先是缺乏20kHz以上的音乐相关频率,其次是20kHz以上的开合瞬态噪音——实际上产生了一种不同形式的大脑辐射。它们会产生一种与不适、沮丧甚至愤怒有关的情绪。有时候我会想,我们的一些社会问题是否不应该归咎于CD。
G:果然很颠覆……
R:你可以跟别人也聊聊,别只听我一人之词。比方去和George Massenburg聊聊,我想他和我的态度应该也是一样的。他以前也是经常一回到家就开始欣赏唱片,以此来放松自己。现在他会因为听到CD格式音乐而感到不安和沮丧,被迫起身关掉它。所以你现在看到一些社会上的年轻人情绪沮丧或者容易愤怒,或许是因为他们听的音乐有百分之九十九是CD格式的数字音频,而且……你懂,我想其中可能存在一定关联。
G:黑胶唱片也有失真,尽管它们往往存在于介质本身而非音频信号,你听歌的时候,失真和音乐是剥离的。但在CD或其他数字格式声源上,失真被嵌入到信号本身……
R:对,绝对正确!
G:好的,但是CD格式的音乐,20KHz以上的频段已经被滤波器切的差不多了,那么20KHz以上的开合瞬态如何能通过滤波器呢?
R:它们以噪声的形态通过。如果你能把噪声频谱绘制出来,你会发现在20kHz到40kHz的这个倍频内,噪音非常小,几乎没有。但是从40KHz到80kHz这个倍频内较为明显。这就是为什么我认为把带宽频率扩展到100kHz是非常重要的。还原所有的信息,才是正确的做法。尽量不要弄巧成拙,自讨没趣。
G:在AMEK公司的产品指南里,你提到了不能产生共鸣和“响铃声”的重要性。
R:是的。是有这部分说明。所有犀利的滤波器,就像数字设备里使用的那些,都会产生出回响。
如果你曾经听过很早以前那种基于长铜线传输的长途电话线路——不像今天的无线电技术这样成熟的时候,长途电话还是基于铜线的——你会听出来2.5KHz到3KHz之间的频段均衡受到了严重的影响,通过提升临场感来提高语音信号的清晰度和辨识度。你能从中听出那种回响,那种经过过度均衡处理的线路信号,特征非常明显。
它的名字叫做“Ringing”(响铃声),因为听起来就像铃声的频率。它有着明显的自身频率——可以轻易找到这些频率特性。在常见的音频素材里把这些频率增强,就会做出这种音频效果。但当到达一个临界值后,它就不会更加明显了。这就回到了我最初的观点,即使这种频率在我们说的可闻范围之外,经过听感训练的人也会听到它。这是Geoff Emerick多年前验证过的事情。
G:你说的这个Geoff Emerick是不是那个著名的英国制作人?
R:对,就是他,他带领我走上了这条职业生涯。1977年我卖掉了Neve公司后不久。他们自己研发一个新的48路调音台,George Martin的“Air Studios”买了一台, Geoff Emerick对此非常不满。George Martin打电话给我:“快来哄哄Geoff,他生气了,我们这边的工作都停了”
他们有来自新Neve公司的工程师,还有其他技术人员。重点在于,如果你对Geoff Emerick这样的人的意见不敏感,你不尊重他们的事业,那么你就不会听懂他们的要表达的意思。不幸的是,新公司里有一群年轻的工程师(我得赶紧声明,这是我卖掉公司之后发生的事情,跟我没关系!)不明白他在抱怨什么。所以他们回到公司,做了一份报告,说顾客疯了,没有什么问题。别管它,把这个问题抛在脑后,它就会自动消失。他们的行为就像二手车推销员。我很生气。所以我去了那里,在George Martin的要求下,在那里呆了一段时间,Geoff终于向我阐述了他所听到的问题是什么,然后我也开始发现这些问题了。
Geoff曾经拥有黄金听力——现在仍然是,他能觉察到一些我没有关注到的细节。我和他相处了一段时间,通过他对声音观察的引导,我才开始学习去感知他所能听到的东西。当我开始能够听到他说的这些声音信号,哦,是的,我马上就知道他在说什么了。我们测量了那个调音台的信号,发现在全部48个通道中,有3个输出变压器的关闭功能有故障,在54kHz处产生了3dB的增益。当时在场的那些人都说:“哦,不,他不可能听到这个频段的声音。”解决办法就是给这三个通道的每个通道上都增加一个电容。当我们修复这个问题时,Geoff马上就变得开心起来!这就应证了那些日本人提出的快乐/不快乐的情绪理论。
G:这些人能听到50KHz的3dB增益啊,我能想像出这个事情能给予你多么大的精神力量。
R:这就是为什么Geoff不开心,这问题一直困扰着他。所以后来我又回头,仔细地深究了这个问题,“我不一定要研究为何他能听得到可闻范围之外高频这个问题,但是我知道这部分高频会影响实际听感,所以我得防止这类问题出现在自己的产品上。”如果Geoff这样的家伙能听到50KHz以上的高频,那么他们的听力上限到底是多少?我做了一些后续功课,研发出一种新的电路,它有着更宽的频宽,而其相对容易实现。所以我重新设计了所有的变压器和信号输出部分的电路,还有常规电气部分。
G:看起来这些经验对于技术人员和设备设计师都很重要啊。
R:这就是问题所在,你经历的正统教育资历越多,你“知道”的就越多,你思维上的牢笼就越坚固,很多事情在意识层面里已经失去了可能性,你会“知道”这种设计方案不会实现,也会从根本上拒绝去尝试。而像我这样无知的傻瓜并不知道有什么是不可能的,所以也没有这种顾虑,就能勇于尝试然后发明出一些能用的设备来!(大笑)
在上一期发表的采访的第一部分中,Rupert Neve总结了“知识”有时是如何阻碍进步的:“这就是问题所在,你经历的正统教育资历越多,你“知道”的就越多,你思维上的牢笼就越坚固,很多事情在意识层面里已经失去了可能性,你会“知道”这种设计方案不会实现,也会从根本上拒绝去尝试。而像我这样无知的傻瓜并不”第二部分的访谈接着从这一点开始……
Greg Simmons(本文作者,下文简称G):信念的力量是很有影响力的,尤其是当你有一个强大的理论背景的时候。例如,我的电子学培训经历指出,只要电阻和电容足够低,不同的扬声器信号线不会对声音产生任何影响。多年来我一直坚信这一点,正是这种坚定的信念让我听不到其他的意见。直到偶尔一天,在对两只工作室监听音箱评进行测的时候,我发现了不同的信号线之间的差别。这件事动摇了我对相关学术的认知。
Rupert Neve(下文简称R):是啊,你知道为什么它们有那么大的差异?
G:我想电感的高低大概是其中一个因素。
R:我在这个领域可不是专家,但是我知道一个世界顶级的线材设计师。他现在住在德克萨斯州的奥斯汀离我家不远。顺便说一句,他也是个英国人,但和我一样,他背叛了自己的祖国来到美国生活!他告诉我说,这与电缆的设计方式有关,电缆的铺设,表皮效应,以及电缆的绝缘——介电常数——以及诸如此类的东西。它们影响音质的方式在以前都被公认为是不可能的。
G:在发烧友圈子里,绝缘材料是线材的一大卖点,不论是空气还是特佛龙,都是噱头。
R:我对很多事情都很愤世嫉俗。我甚至可以说 Alexander Graham Bell 【注:亚历山大·格雷厄姆·贝尔(1847-1922)被公认为是电话的发明者。贝尔电话线由一对相隔4英寸的导线组成,产生了600欧姆的阻抗。这种阻抗‘标准’被应用于早期广播和音乐工作室的设备中,它与现代工作室设备没有什么关联。】从来没有遇到过这个问题,因为一对导线间隔4英寸,每隔6英寸使用木质垫片或别的什么,造就了600欧姆阻抗。这就是原来的600欧姆商业标准的由来。现在,你在现代化的演播室里找不到接近600欧姆阻抗的线材。所以你需要考虑阻抗匹配之类的琐事。
G:下面我们要谈及变压器领域了……
R:需要说明,大多数现代电缆的自然阻抗范围为100欧姆或更小。所以如果你有一个很长的电缆,比如60英尺,自然阻抗就开始产生线材损耗和反射。大多数现代工作室设备,不会选择使用输出变压器,而用一些小得可怜的IC芯片试图驱动阻抗。制造商宣称它可以将输出阻抗驱动到10000欧姆,或1000欧姆,甚至600欧姆。当你使用短距线材在测试平台上实验的时候,它是成立的。但当你尝试驱动一根长距线缆的时候,这些IC就会抽他们的脸了。它们会产生疯狂的回转率失真。它们的设计初衷并非用来驱动75到100欧姆之间的低阻抗的,但是现在却被要求做这样的工作。因此,在我研发的设备的输出层级,我使用变压器和相当强大的功率放大器来驱动线缆【注:‘强大的功率放大器’通常指的是‘线路放大器’。它们首先将信号送到变压器,然后由变压器将信号传递给线路】我已经这样做很多年了。 |
|