音频应用

 找回密码
 快速注册

QQ登录

只需一步,快速开始

查看: 7089|回复: 4
收起左侧

[音频] MPEG-H 音频格式

[复制链接]

2万

积分

5

听众

-1644

音贝

音频应用初级会员

Rank: 6Rank: 6

积分
23972
发表于 2005-8-28 23:31:00 | 显示全部楼层 |阅读模式
当前,下一代广播电视标准是全球广播电视领域热议的话题。沉浸式、互动式等技术特点成为了未来广播电视标准中能够为用户带来更高价值的核心竞争力。融汇4K超高清、虚拟现实VR、裸眼3D等视听新技术,若要转换为家庭用户的消费内容,构建以视听为核心的全新产业链,就离不开沉浸式音频系统的支撑。本文将全方位为您解读这一未来广播电视标准。



MPEG-H电视音频系统是什么?



MPEG-H电视音频系统基于音频编码标准化组织MPEG最新开发的MPEG-H 3D音频标准,能够为家庭端带来沉浸式声音体验,增强电视节目的真实感和沉浸感,并通过音频对象为观众呈现个性化的音频内容。为了方便用户使用交互性功能,广播电视公司可以提供“预设”服务,即预定义对象增益和位置的混音效果。而沉浸式声音的制作播出则可通过将基于声道的信号或基于场景的声音元素与静态或动态音频对象相结合的方式来实现。改良后的响度和动态范围控制,能够根据不同类型的用户设备和收听环境来定制声音效果,从而实现最佳的声音还放。



目前,MPEG-H电视音频系统已经被DVB标准采纳,并已成为ATSC 3.0数字电视标准中的正式音频标准。支持ATSC 3.0标准(包含MPEG-H电视音频系统)的电视机已经在韩国正式销售,韩国的广播电视公司将在2018年平昌冬季奥运会上采用MPEG-H电视音频系统进行电视转播。



MPEG-H电视音频系统不平凡的发展历程



2010年,ATSC举办了下一代广播电视最新技术研讨会。在这次会议上,Fraunhofer IIS提出了全新方案,即通过对象与声道相结合的方式作为下一代音频技术标准。2012年,ATSC成立了专门用于筹备征集下一代音频系统标准和方案的工作小组。2014年12月,ATSC发布征集标准方案的公告。2015年1月,为响应标准方案征集公告,由几家公司组成的联盟向工作组提交了基于MPEG-H 3D音频标准的提案。除了MPEG-H电视音频系统以外,ATSC还收到了另外两份提案。图3为MPEG-H电视音频系统在ATSC 3.0标准发展过程中的大事记。



MPEG-H电视音频系统发展大事记



在2015年1月完成MPEG-H电视音频系统方案注册后,联盟于2015年3月提交了所有提案预认证所需的文件和测试结果。工作组根据预认证阶段所提交的文件,对三套系统进行了评估,其中两套系统获准进入下一阶段的遴选,包括正式的多站点双盲聆听测试和系统特征评估。听音测试结果表明:两套提案均实现了所需的编码效率,在某些项目中稍微倾向于选择MPEG-H电视音频系统,特别是具有低码流语音的项目(MPEG-H电视音频系统编解码器的语音编码工具可在其中使用)。2015年5、6月,ATSC评估员到访两个提案方的实验室,以评估提案特征的演示。最终,两套系统均符合ATSC规定的所有要求。2015年7月,ATSC组织了一次特别的演示活动并对MPEG-H测试床进行了展示。2015年11月,ATSC将两套系统升级为候选标准状态,并建议每个区域使用一套系统。2016年底,两套系统均被升级为ATSC建议标准。2017年3月,两套系统被确认为ATSC 3.0的最终标准。目前,两个系统信息都能够在ATSC官网A/342标准中下载。



MPEG-H电视音频系统的几大法宝



沉浸式声音



MPEG-H电视音频系统能够通过在垂直维度上扩展声像实现“3D”声音还放,进而实现沉浸式声音并区分于传统环绕声。该功能能够使声音听起来更加真实,使用户不再是一名旁观者,而是体验身临其境一般的感受。研究表明,与环绕声相比较,在沉浸式声音环境下,人们感知到的整体音质明显改善,两者之间的差异就像立体声与环绕声之间的差异一样大。



交互功能/个性化定制



MPEG-H电视音频系统中包含“预设”功能。内容创作者可以定义“预设”内容,以及涵盖不同声音元素的组合以及调整不同元素在位置和音量上的关系。如此一来,广播电视公司可以让用户轻而易举地选择不同的声音体验。另外,通过MPEG-H电视音频系统,用户能够通过与其他混音元素的比较,直接选择和调整不同混音元素在位置和音量上的关系,从而对声音体验进行微调。其中一个典型的用例是调高或调低解说员的声音(也称为“对白增强”)或者选择不同的解说评论的语言,而实现传输交互内容其实也并不复杂,只需对现有制作流程稍作调整便能够为内容创作者提供全新选择,也能够为观众带来更好的体验。而广播电视公司对于用户所能实现的个性化功能调整享有完全的控制权。



图片


通用传输



在多平台环境下,相同的MPEG-H内容通过不同的分发网络进行传输(例如:广播电视网络、移动网络和宽带网络),并且在不同的环境(如嘈杂的公交车和安静的客厅)和设备上(如电视机、移动设备和AVR)进行播放。为了满足以上需求,MPEG-H电视音频系统针对每个完整混音甚至是单一音频元素提供响度和动态范围控制,以及对输出的峰值和削波预防进行控制。此外,全新的主动下混算法能够带来更高质量的下混音频信号。为了能通过耳机聆听沉浸声和环绕声音频内容,MPEG-H电视音频系统还包含binaural渲染器。



MPEG-H电视音频系统的核心性能



码流效率



下一代广播电视节目需要能够通过各种方式向用户提供内容,其中包括最高质量的有线电视和卫星电视传输方式以及移动设备上的流媒体传输方式等。为此,电视音频系统需要传输各种音频内容,从立体声道到5.1声道、7.1声道和用于沉浸式音频内容的更多声道。MPEG-H音频规范的目标码流范围旨在满足质量和效率的双重目标。对于当今的5.1环绕声,96~256 kbit/s的码流便能够提供良好甚至优异的音频质量。对于未来具有更多声道(5.1 +4H或者7.1+4H)的音频内容,256 kbit/s~1.2 Mbit/s的码流即可实现相同的音频质量。



MPEG-H音频编解码器能够利用相同的码流承载更高质量和/或更多声道的音频内容。例如,在常用的广播音频数据传输码率(384 kbit/s)下,MPEG-H能够传输最多包括四个附加对象的7.1+4H音频声道的信号,从而实现高度扬声器播放效果。



动态范围控制



动态范围控制(DRC)技术能够使产生的音频信号适应于不同的还放设备和聆听环境。在MPEG-H电视音频系统的DRC框架内,通过信号传输的不同DRC增益序列能够在播放设备中实现由编码器控制的动态范围处理。多个单独的DRC增益序列可以通过高分辨率信号传输,以适用于各种播放设备和收听环境,如:移动环境和家庭环境。通过MPEG-H DRC技术,还可以实现更好的削波预防和峰值限制效果。



响度标准化



为了符合不同的响度规范并带来一致的用户体验,响度信号传送和标准化对于任何下一代音频系统都扮演着至关重要的角色。在MPEG-H电视音频系统中,基于EBU R128或ITU-R BS.1770-3所有响度相关测量数据都被嵌入到用于响度标准化的数据流之中,并通过解码器对音频信号进行标准化,从而将节目响度映射至还放所需的目标响度。例如,在移动设备上,目标响度范围为-12至-15dB LKFS,而在家庭AVR(音视频接收机)上,目标响度通常设置为-31dB LKFS。然而,通过下混和动态范围控制,可能会改变信号的响度。因此,可以将专用的节目响度元数据植入到MPEG-H比特流中,以确保在还放端实现正确的响度标准化。



音频对象



将音频对象作为附加音轨嵌入到音频节目内容中,可以实现一系列的全新应用。其中,最突为突出的应用就是允许用户通过改变混音效果实现交互性功能。用户可以选择不同的语言音轨、附加音轨,例如导演对电影的评论或针对视障者的场景叙述等。同时,用户能够调节特定音轨声音,以便获取个性化收听体验,例如调高解说评论的声音使其高于背景音。



诸如对白的音频对象可以根据其动态范围进行单独控制,这样可确保在任何压缩模式下都能清晰地听到对白内容。利用音频对象的概念,还可以在不同播放场景下,实现准确的空间声音还放。



Ambisonics



Ambisonics能够通过特定的数学方程式呈现声场压力。随着Ambisonics阶数的提升,其还放准确度也随之升高。此外,Ambisonics的呈现不受终端扬声器配置的影响,因此,在声音还放之前可以轻而易举地对其进行调整。得益于以上特性,Ambisonics还放技术非常适用于当今的虚拟现实应用。目前,结合音频对象的FOA(一阶高保真)技术和HOA(高阶高保真)技术在虚拟现实制作中的应用越来越广泛。



流媒体



对于传输系统和其所涉及的媒体来说,将互联网流媒体音频内容传输到移动设备的过程极具挑战性。甚至当今常用的3GPP或LTE网络的移动数据连接也无法保证提供恒定的带宽。为了确保内容还放的连续性,最新的广播电视设备采用了诸如MPEG-DASH等动态自适应流媒体技术,从而确保内容码流能够完全适应于当前的信号连接质量。



其实,自适应流媒体的概念并不新鲜,早在MPEG-4 HE-AAC流媒体应用中已经采用了这一方式。MPEG-H电视音频系统在设计阶段就已考虑到自适应流媒体的需求,进而可以更容易地实现基于DASH服务。音频帧的内置概念缩短了调准时间,并且显著降低了实施复杂性,从而可以在制作过程中轻松进行码流拼接和广告插播,即使是在本地接收机端也可实现个性化广告内容。



灵活的渲染和还放



针对立体声和5.1声道的音频制作和监听扬声器的安装已经很成熟了。然而,消费者家中扬声器的配置、数量和位置都有所不同,为了应对这些问题,在MPEG-H电视音频系统中,可以通过格式转换器实现针对不同扬声器布局的灵活渲染,从而使内容格式适应于播放端的扬

声器设置。



在过去几年间,媒体消费已更多地转向移动设备,而用户也主要通过耳机收听音频内容。因此,MPEG-H电视音频系统解码器中集成了binaural渲染组件,专门应用于将沉浸声和环绕声内容还放到耳机端。
欢迎厂家入驻,推文!免费!微信:yinpinyingyong

2万

积分

4

听众

-1573

音贝

音频应用初级会员

Rank: 6Rank: 6

积分
27872
发表于 2005-8-28 23:35:00 | 显示全部楼层
[em10][em10][em17][em17]
欢迎厂家入驻,推文!免费!微信:yinpinyingyong

9854

积分

2

听众

-1760

音贝

音频应用注册会员

Rank: 4Rank: 4

积分
9854
发表于 2005-8-28 23:45:00 | 显示全部楼层
支持!哈哈[em01][em01][em10]

欢迎厂家入驻,推文!免费!微信:yinpinyingyong

3万

积分

9

听众

-3559

音贝

音频应用初级会员

Rank: 6Rank: 6

积分
34564
发表于 2005-8-29 00:05:00 | 显示全部楼层
欣赏 [em17][em17]
欢迎厂家入驻,推文!免费!微信:yinpinyingyong

3555

积分

3

听众

-740

音贝

音频应用新手发布

Rank: 3

积分
3555
发表于 2005-8-29 08:42:00 | 显示全部楼层
欣赏中!
欢迎厂家入驻,推文!免费!微信:yinpinyingyong
您需要登录后才可以回帖 登录 | 快速注册

本版积分规则

音频应用搜索

QQ|小黑屋|手机版|音频应用官网微博|音频应用 ( 鄂ICP备16002437号 )

GMT+8, 2025-5-31 06:46 , Processed in 0.032332 second(s), 7 queries , Redis On.

Powered by Audio app

快速回复 返回顶部 返回列表