音频应用

 找回密码
 快速注册

QQ登录

只需一步,快速开始

查看: 8469|回复: 0
打印 上一主题 下一主题
收起左侧

[资讯] ADM 模型中定义的 5 种音频类型

[复制链接]

270

积分

0

听众

10

音贝

音频应用

Rank: 1

积分
270
跳转到指定楼层
1#
发表于 2024-6-8 22:29:34 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式


在本文中,Julian 解释了 ADM 模型中定义的 5 种音频类型。虽然 ADM 技术性很强,但列表指出的这五种类型之间的差异很有趣。


我们经常谈论 “元数据”。我们中的大多数人都知道它的意思是 “关于数据的数据”,或者换一种说法是 “关于信息的信息”。解释这一点的一个常见例子是数字图像中的元数据,其中包括显示图像拍摄地点、时间和日期的地理标记,以及使用的相机和光圈设置等内容。数据的数据量很大。

如果音频文件能包含使用了哪种麦克风的信息就更好了,但这并不是我所期望的。不过,音频定义模型(Audio Definition Model)包含大量元数据,在本博客中,最熟悉的可能是作为杜比全景声混音交付文件的 ADM。我们通常将其与平移元数据联系在一起,因为平移元数据可以正确渲染对象,但基于对象的音频、元数据和音频定义模型远不止 Atmos 平移数据。

我在 EBU 网站的一份文件中发现了一个有趣的例子,我在撰写关于 ADM 模型的文章时使用了该文件。它描述了 ADM 中包含的五种音频 “类型”。我完全不确定音频的 “类型 ”是什么。但对它们的描述都说明了我意识到的区别,但我从未在脑海中清晰地将它们归类。它们就在这里。希望你和我一样觉得它们很有趣。

基于通道
我们都已经习惯了这一点,也习惯了基于声道的音频的不同宽度之间的区别。特定宽度的音频(单声道、立体声、5.1、9.1.6 等)可由相同声道数的播放系统直接重现。如果声道数不同,则可以进行相应处理,例如将 5.1 声道缩混成立体声。


立体声是两个声道,但哪个是哪个呢?

每个声道都需要适当标注,以确保中置声道到达的是中置扬声器,而不是 5.1 播放系统的左后环绕声扬声器。

基于场景
基于场景的音频的一个例子是 Ambisonics。每个声道并不代表播放系统中的某个扬声器,而是代表声场的某个特定方面,并且独立于用于重建声场的播放系统。

声场代表了音频到达空间点的完整图像,在该空间点上正在采集音频。它是音频的球形表示,包含捕获发生位置的所有特定方向信息。

捕捉到的声道数量决定了声音的空间分辨率。通道越多,位置越清晰。这些通道被称为 Ambisonics 的 “阶次”。一阶包含 4 个声道,二阶在一阶声道的基础上增加 5 个声道,三阶增加 7 个声道,总共 16 个声道。


由 Franz Zotter 博士 zotter@iem.at CC BY-SA 3.0 或 GFDL 提供,通过维基共享资源

这些 Ambisonic 信号通过一组解码方程转换为基于声道的音频,适合在特定布局的播放系统上重放。Ambisonics 至少在表面上为大多数音频专业人士所熟悉,但您知道它是基于 “场景 ”的音频的一个例子吗?


基于对象

杜比全景声渲染器中的对象

当我开始了解杜比全景声(Dolby Atmos)的概念时,我才第一次接触到对象(Objects)的概念以及与之相伴的元数据。也正是对象和音床之间的这种区别,以及杜比全景声与传统的基于声道的环绕声(如 5.1)之间的区别,让我了解到音频对象的概念。Atmos 对象可能是最著名的,但还有其他类型的对象。这个词有两种含义。第一种是带有位置元数据以及大小和距离的音频。但对象还有其他使用方式,例如,体育赛事中的另一种语言版本或人群嘈杂声的音量可能会在广播中作为一个对象呈现,并可在两者之间切换或对其音量进行调节。


中间侧录制

基于矩阵
您可能听说过矩阵用于生成不同格式的音频通道。您熟悉的一个例子就是 Mid-Side。它必须重构为 L+R 立体声才能正确收听。这可以通过解码矩阵中的简单数学计算来实现。这不仅适用于巧妙的母带技术或麦克风阵列,也适用于广播,例如调频广播。矩阵音频的另一个例子是使用 Lt/Rt 将 5.1 音频向下混合为立体声。



Neumann KU100 双耳麦克风

双耳音频远比过去更为人所熟悉,也更为主流。双耳音频曾是发烧友的小众技术,如今已成为消费者获取杜比 Atmos 和空间音频音乐的事实标准方式。过去这种格式的弱点是只能通过耳机才能正确体验,因此作为消费者格式的用途非常有限,而现在由于元数据将基于双耳的音频识别为只适合耳机,这个问题已经不复存在。

这有什么用?
播放系统能够获取有关音频流中包含何种内容的信息,并合理使用这些信息,这正是音频定义模型中的音频定义要点。从将正确的声道内容引导到正确的扬声器,到利用大量音轨和一些元数据创建令人信服的身临其境的声场,告诉渲染器如何处理播放系统上的众多扬声器,如果没有相关信息,这些都是不可能实现的。

欢迎厂家入驻,推文!免费!微信:yinpinyingyong
您需要登录后才可以回帖 登录 | 快速注册

本版积分规则

音频应用搜索

小黑屋|手机版|音频应用官网微博|音频应用 (鄂ICP备16002437号)

Powered by Audio app

快速回复 返回顶部 返回列表