一、 引言
人们对信息的获取是十分贪婪的,已经不再满足于过去的文字或语音等单一信息信息载体,纷纷追求多媒体的享受。俗话说:百闻不如一见;可见图像给人的信息是巨大的。此外人们在追求高清晰的图像时,还希望有高质量的声音。信息的数字化是提供高质量多媒体信息的关键。电子计算机的出现和不断的推陈出新,为数字化技术的发展提供了一个良好的舞台。数字业务的发展一日千里,产品琳琅满目,大家迫切需要一个统一的标准,MPEG正是适应这个时代而产生的,它将继续随着数字业务的发展而发展的。
MPEG(Moving Pictures Experts Group)即活动图像专家组,始建于1988年,专门负责为CD建立视频和音频标准,其成员均为视频、音频及系统领域的技术专家。ISO/IEC1172压缩编码标准就是由此小组提出并制定,MPEG由此扬名世界。目前MPEG已完成MPEG-1、MPEG-2和MPEG-4等三个版本的制订,适用于不同带宽和数字影像质量的要求。
据统计,当今信息量以每1.6年翻一倍的速度急剧增长,由于internet的普及和广播,电信,计算机三网合一的钻头露面,以数字视频、音频信息为代表的多媒体信息越来越多。多媒体信息具有信息量大、难描述的特点,因此,如何对这些浩如烟海的信息进行组织、建库以达到快速、有效的检索呢?MPEG-7标准正是为解决这个难题而制定,它将于2001年7月"闪亮登场"。
据透露,MPEG-21标准也开始启动,它是由MPEG-7发展而来,主要规定数字节目的网上实时交换协议。
本文首先回顾MPEG在这十几年来为多媒体信息处理方面作出的巨大贡献,简单介绍各种标准,就它们的目标、主要特点以及应用领域作了比较,并把重点放在MPEG-4和MPEG-7上。
二、 MPEG标准概况
2.1 MPEG-1
ISO的活动图像专家组(MPEG)在1991年11月提出了ISO/IECⅡ172标准草案,通称MPEG-1标准。该标准于1992年11月通过,1993年8月公布。它是为工业级标准而设计的,可适用于不同带宽的设备,如 CD-ROM、Video-CD、CD-I等。MPEG-1的编码速率最高可达4-5Mbits/s。
2.2 MPEG-2
1995年出台的MPEG-2(ISO/IEC 13818),它所追求的是CCIR601建议的图像质量,即为DVB、HDTV和DVD等制定的3Mbps-10Mbps的运动图像及其伴音的编码标准。
MPEG-2在NTSC制式下的分辨率可达720×486,MPEG-2还可提供广播级的视像和CD级的音质。MPEG-2的音频编码可提供左右中及两个环绕声道,以及一个重低音声道,和多达7个伴音声道(DVD可有8种语言配音的原因)。同时,由于MPEG-2的出色性能表现,已能适用于HDTV,使得原打算为HDTV设计的MPEG-3,还没出世就被抛弃了。
对于最终用户来说,由于电视机分辨率限制,MPEG-2所带来的高清晰度画面质量(如 DVD画面)在电视上效果并不明显,倒是其音频特性(如重低音,多伴音声道等)更引人注目。
2.3 MPEG-4
MPEG专家组继成功定义了MPEG-1和MPEG-2之后,于1994年开始制定全新的MPEG-4标准。MPEG-4标准将众多的多媒体应用集成于一个完整的框架内,旨在为多媒体通信及应用环境提供标准的算法及工具,用于实现音视频(audio-visual)数据的有效编码及更为灵活的存取。
MPEG-4试图达到两个目标:一是低比特率下的多媒体通信;二是多工业的多媒体通信的综合。据此目标,MPEG-4引入了AV(Audio/Visaul Objects)对象,使得更多的交互操作成为可能。
2.4 MPEG-7
网络应用最重要的目标之一就是进行多媒体通信。而其中的关键就是多媒体信息的检索和访问,这样MPEG-7就应运而生。
MPEG 7的目标就是对日渐庞大的图像、声音信息的管理和迅速搜索。针对这个问题MPEG-7于1998年10月提出,预计于2001年7月最终完成并公布。MPEG-7将对各种不同类型的多媒体信息进行标准化的描述,并将该描述与所描述的内容相联系,以实现快速有效的搜索。其正式的称谓是"多媒体内容描述接口"。
三、 MPEG系列标准的比较
MPEG-1直接针对1.2Mb/s的标准数据流压缩率,其基本算法对于每秒24~30逐行描帧,分辨率360×280,运动图象有很好压缩效果。但随着速率的提高,解码后图像质量较差,并且它没有定义用于对额外数据流进行编码的格式,因此这种机制未被广泛采用。
MPEG-2力争获得更高的分辨率(720×486),提供广播级视频和CD级的音频。作为MPEG-1的一种兼容型扩展,MPEG-2支持隔行扫描视频格式和其它先进功能。MPEG-2以可扩展档次的形式来定义,每个档次支持一种特殊应用所需的功能,因此它是一种通用标准。但是MPEG-2标准数据量依然很大,一部影片的数据量大到8G字节左右,不便存放和传输。
MPEG-4视频格式大大优于MPEG-1与MPEG-2: 视频质量与分辨率高,而数据率相对较低。主要的原因在MPEG-4采用了ACE(高级译码效率)技术,它是一套首次使用于MPEG-4的编码运算规则。与ACE有关的目标定向可以启用很低的数据率。这可以将整部视频电影以完全PAL或者NTSC的分辨率与立体声(16位, 48 kHz)存储在单个CD-ROM上。具体而言:700 MB的容量对多数110分钟的电影来说绰绰有余了,而MPEG-2格式的电影在相同的分辨率下需要约11倍以上的储存空间。当MPEG-2的数据率加倍至接近真正的特性时,MPEG-4可以在声频与视频流上在广泛的领域上升级。当视频在5 Kbit/s与10 Mbit/s之间变化时,声频信号可以在2 Kbit/s 与24 Kbit/s之间进行处理。由于这种可升级性,声频与视频数据可以经专门调整适应真正的环境。
另外,由于MPEG-1和MPEG-2标准均为高层媒体的表示与结构标准,其交互性及灵活性较低。而计算机网络具有很高的灵活性和交互性,但它遵循的标准确与MPEG标准不兼容。MPEG-4的制订有效的促进三网的融合。MPEG-4中一个重要概念是视频对象(VO),一幅图像的编码时分割成很多任意形状的VO,分别对各VO进行帧内、帧间编码。必要时只传输某些VO,大大地提高了传输效率。如果视频没进行分割,那么编码结构就退化为只处理标准矩形的一层,这种处理方式与MPEG-1/MPEG-2标准类似,从而达到与MPEG-1/MPEG-2的兼容。
继MPEG-4之后,人们又对解决日渐庞大的图像、声音信息的管理和迅速搜索产生了兴趣,MPEG提出了解决方案MPEG-7。它重点放在用于描述多媒体素材(描述与内容有关的信息以方便检索等)的通用接口标准上,因此MPEG-7并不是兼容以前的标准,而是以前标准的扩展和延伸。