MPEG-H实际上已经成为ATSC3.0最有利的音频备选方案。
3月21日,CCBN—BDF论坛之超高清发展论坛在北京皇家大饭店召开。会上,Fraunhofer IIS中国区业务代表Toni Fiedler作了题为《下一代广播电视音频解决方案:MPEG-H》的精彩演讲。
作为唯一一个外国嘉宾(德国),Toni Fiedler首先对全球范围内3D音频最新的进展阐述了自己的看法。
他个人觉得最大的一个新的进展就是在音频领域,他本人过去在音频编解码技术方面作了很多重要的工作,可能最知名的是他在开发MP3格式方面做出了自己的贡献。他所在的研究所在德国也对音频技术建功卓著,影响非常大的格式就是HE-AAC在很多手机当中都有应用。当然最新的技术一个是叫EVS,也就是改善性语音系统,主要应用在LTE、或者是语音通讯当中,另外一个就是他们提出的MPEG-H。
相比过去关注音频格式、音频编解码器,未来更为关注音频功能或者特性这个方向。
Fiedler现场展示了一个编码器的总图,图中虚线代表着从编解码器当中去汲取一些信息,应用在终端用户或者是终端的设备当中,通过终端用户的一些反馈实现正循环,再将这些信息反馈回去。这些也是从各种信息源搜集来的信息,音频的格式相关的信息,称之为元信息、元数据。
“元数据其实大有用途”
实际上元数据有几种用途。在实现3D音频系统当中,通常是需要很多扬声器的,现在甚至有人提出最大的就是22.2声道的格式,实际上需要的扬声器的数量就非常多。Fiedler希望能够用相对较少的扬声器的数量,但是相对较少从绝对量上来说,依然是非常大的,所以他们是希望通过利用这些元数据能够帮助在家庭当中的用户,从而实现同样的音效的体验。比如说就可以使用条状的音箱,实际上可以用元数据在条状音箱当中实现这种3D的音响效果。
Fiedler讲到,实际上他们希望能够给用户提供互动式的节目体验,所以在这个方面,他们利用元数据将一些声音对象从声音流当中分离出来,能够让用户对于整个音频体验有完全地操控感。
对于未来的很多电视内容来说,Fiedler希望能够将电视的内容很好地混到相应的用户所使用的设备当中去,因为现在其实并不是每个人都是坐在家里,或者在设备非常完善的环境下去观看电视剧的内容,获得非常好的设备并提供沉浸式的效果。
MPEG-H方案实际在韩国已步入实施
MPEG-H实际上在韩国已经到了具体的实施阶段,韩国也是计划在2018年冬奥会的时候使用这项技术,所以现在Fraunhofer整个团队也是非常忙,帮助韩国的广告商熟悉他们的软件,帮助编解码相关工作人员实施具体的技术方案来进行优化,包括帮助一些芯片的厂商能够更好地将他们的技术潜入到电视和机顶盒当中去。
在未来,除了将声道数量进一步提升,Fraunhofer还会对声音对象进行更多的操作,所以对于声音对象的编码来所,这一切都是基础,未来需要对于声音的元素来进行更多的剥离和分离,让用户能够有更强的对于声音的控制感,实现更高阶的音效。
Fraunhofer技术体系与中国国情不断适配
Fraunhofer提出了一些技术解决方案和体系,当然都是基于一些技术和产品来适应中国未来的3D音频系统,所做的这些工作都是基于中国官方机构给提出了一个具体的需求文件来进行的,来满足中国未来电视系统的一些要求。
比如说支持5.1+四个高扬声器的配置,并且实现全渲染能够产生所需要的格式,并且用元数据来进行声音和对象的描述,同时数据流能够通过SDR和HDR的方式进行传输,数据在192—768之间,整个数据流不超过10%,能够产生分散的扬声器和调状的音箱当中,并且能够用于一系列声音制作和后期的一系列工具。
打造下一代的音频体系 使广电体系更完整
对于整个中国业界(包括设备制造商等等上下游各个环节),Fraunhofer与其合作的可能性是非常多的,当然中国未来肯定会和美国、欧洲有所差别,Fiedler表示他们也希望帮助中国的合作伙伴共同满足需求,打造下一代的音频体系。
他们也希望能和行业一起来打造一个全新的合作框架,充分利用到这个系统当中的一些全新的功能和特性,包括从广播站到消费的级别,把项目的内容以更好的品质传输到消费者的家中,之后一步一步再利用到系统当中最新的功能,从而使得大家制作的音频效果更具有说服力。
在建立了一个全新的大的框架之后,大家可以一步一步地去尝试一些新的东西,而且使用这些新技术,其速度仍然是取决于整个广电的体系。