当前位置: 主页 > 视频资讯 > 视频行业标准 > MPEG-4标准和应用(2)

MPEG-4标准和应用(2)

2008-07-12   互联网 / AV110.net 点击: 标签:
  

2、MPEG-4标准的构成
1)DMIF

DMIF即多媒体传送整体框架,它主要解决交互网络中、广播环境下以及磁盘应用中多媒体应用的操作问题。通过DMIF,MPEG-4可以建立具有特殊品质服务(QoS:Quality of Service)的信道和面向每个基本流的带宽。

2)数据平面

MPEG-4中的数据平面可以分为两部分:传输关系部分和媒体关系部分。为了使基本流和AV对象在同一场景中出现,MPEG-4引用了对象描述(OD)和流图桌面(SMT)的概念。OD传输与特殊AV对象相关的基本流的信息流图。桌面把每一个流与一个CAT(Channel Association Tag)相连,CAT可实现该流的顺利传输。

3)缓冲区管理和实时识别

MPEG-4定义了一个系统解码模式(SDM),该解码模式描述了一种理想的处理比特流句法语义的解码装置,它要求特殊的缓冲区和实时模式。通过有效的管理,可以更好地利用有限的缓冲区空间。

4)音频编码

MPEG-4的优越之处在于,它不仅支持自然声音,而且支持合成声音。MPEG-4的音频部分将音频的合成编码和自然声音的编码相结合,并支持音频的对象特征。

5)视频编码

与音频编码类似,MPBG-4也支持对自然和合成的视觉对象的编码。合成的视觉对象包括2D、3D动画和人面部表情动画等。

6)场景描述

MPEG-4提供了一系列工具,用于组成场景中的一组对象。一些必要的合成信息就组成了场景描述。

3、MPEG-4 标准的视频编码技术

为了支持基于内容的交互性,即支持对内容独立地进行编、解码,MPEG一4视频检验模型引入了视频对象面(VOP:Video Object Plane)的概念。假设输入的视频序列的每一帧都被分割成多个任意形状的图像区域(视频对象面),每个区域可能覆盖场景中特定的感兴趣的图像或视频内容。输入进行编码的VOP可以是任意形状的,且形状和位置可随帧而变。属于场景中同一物理对象的连续VOP序列称为视频对象。同一视频对象的VOP序列的形状、运动和纹理信息被编码传输,或者编码为一个隔离的视频对象层(VOL:Video Object Layer)。

MPEG-4视频编码器的基本结构包括形状编码(对于任意形状的VOS)、运动补偿和基于DCT的纹理编码(采用标准的 8 X 8 DCT或根据形状的自适应DCT)。具体的编码方法为:首先对输入的原图像序列进行场景分析和对象分割,以划分不同的VOP,得到各个VOP的形状和位置信息,它可以用alpha平面来表示。发送端只需传送alðha平面,接收端就可以确定VOP的形状和位置。alpha平面所需的比特数较多,需要进行压缩编码。显然,只要对VOP的轮廓进行编码和传送,接收端就可以恢复alpha平面,轮廓信息在轮廓编码器中进行编码。提取的形状和位置信息又用来控制VOP的运动和纹理编码。对运动和纹理信息编码仍然采用经典的类似MPEG-1/2标准的运动预测/补偿法。输入第N帧的VOP与帧存储器中存储的N-1帧的VOP进行比较,找到运动矢量,然后对两帧VOP的差值进行量化、编码。对不同对象的运动和纹理信息的编码可因地制宜地采用不同的方祛,以提高编码效率。编码后得到的纹理信息,与运动编码器和形状编码器输出的运动信息和形状信息复接形成该VOP的比特流层。不同视频对象的VOP序列分别进行编码,形成各自的比特流层,经复接后在信道上传送。传送的顺序依次为形状信息、运动信息和纹理信息。接收端的解码过程是编码过程的逆操作。

虽然MPEG-4标准体系完整广泛,但此标准之部分相关技术尚处开发阶段。

四、MPEG4的应用

MPEG4的应用前景将是非常广阔的。 它的出现将对以下各方面产生较大的推动作用:数字电视、动态图象、万维网(WWW)、实时多媒体监控、低比特率下的移动多媒体通信、内容存储和检索多媒系统、Internet/Intranet上的视频流与可视游戏、基于面部表情模拟的虚拟会议、DVD上的交互多媒体应用、基于计算机网络的可视化合作实验室场景应用、演播电视等。

基于MPEG4标准的解决方案纷纷推出,有的为硬件方案,有的为软件方案。前者为设计一个MPEG-4专属解码芯片,但由于部分MPEG-4相关技术(如:串流格式),尚处百家争鸣时期,主流尚未浮现,这使得芯片厂商仅能择一而为之。再由成本角度来看,因为多加了解码芯片,系统成本也随之提高。后者软件方案则用既有的系统CPU来进行解码。此法较具有弹性,可随时依市场需求态势改版更新,又因省去了解码芯片而降低系统成本。

目前已经开发好的基于MPEG4标准的方案有:视频会议、远程监控、交互教学、远程医疗、视频通讯,等等。

五、结束语

MPEG-4标准可用“博大精深”四个字来形容。其涵盖领域之广大,已超越了单纯视音频编解码范畴,成为以对象内容为主体的多媒体展示架构。

对多媒体内容创作业者而言,MPEG-4使多媒体内容更多元化、更具有弹性、多媒体组件能更容易被再利用。它将现今各自发展的技术及应用,如互联网、动画、视频、音频、互动电视等整合至单一架构之下,而且提供更佳的资源管理方法和保护著作权的机能。

对网络服务业者而言,MPEG-4是透明度很高的信息传递工具。它可以藉由与其它国际标准的兼容相通而存在于各种形式网络上,如有线电视网络、电信网络以及无线传输等。尤其在单纯以视频音频传输为主的应用中,相较于MPEG-l或MPEG-2,MPEG-4仅需较小的比特率,即可达成相同音画质效果,如此即意味着较高的频宽使用效率。

对终端消费者而言,MPEG-4能让消费者在原创作者限定的操作功能范围之内,与节目内容中的对象互动,体会前所未有的娱乐效果。而且在移动式低传输速率网络中,促使多媒体应用得以实现。这包括了交互式多媒体广播和移动通讯。

因应市场的需求,我们将会看到更多、更灵活的MPEG-4应用。比如手机、机顶盒、电视的互动,有线、无线多媒体内容的传送,节目制作与增值服务业的串联等等,都将会是MPEG-4的贡献。

顶一下
(0)
0%
踩一下
(0)
0%
精彩推荐