|
发表于 2010-3-13
|
|阅读模式
首先,CD 格式正在成为高品质音频事实上的标准。要传输仅仅四分钟的 CD 质量音频,以当时 9.6 kb/s 的典型调制解调器速度需要花费近 10 个小时。这就提出了一个挑战:传输(或存储)高质量音频库几乎是不可能的。其次,数字信号处理 (DSP) 突飞猛进,CPU 迅速变得更快,内存变得越来越便宜,强大的便携式设备开始出现在市场上。第三,心理声学研究数据变得越来越容易获取,这向我们表明,由于人类听力的限制,CD 格式中存在大量不相关的信息,因此有可能节省大量数据速率。
音频编码是一个多学科交叉的领域,在过去 30 年里,它凭借研究和技术的进步而蓬勃发展。通过利用 DSP 的进步以更加紧凑和高效的方式表示音频信号,应用启发式模型来识别不相关的组件,并优化失真率权衡,音频编码使高质量音频的传输/存储成为现实,并且从根本上改变了我们对待音频的方式。我们很少有人敢想象音频编码会对数字媒体的一般消费产生革命性的影响。
快进到今天——快速宽带连接和大容量云存储已广泛使用;我们开始观看超高清电视,并且很快我们将通过 5G 电话网络进行通信。我们还需要担心压缩音频吗?我相信答案是“是的!” 尽管带宽和存储变得越来越丰富,但我们需要更多的音频通道、空间控制、可定制性、更小格式的沉浸式技术,以及我们消费的音频的普遍性和可用性。为了满足这些需求,我们在许多方向上继续开展工作,包括 3D 声音;沉浸式 6 自由度 (6 Dof) 音频;以及更多设备中立、个性化的方法来表示/渲染音频。 |
|