多媒体数据压缩的必要性与可能性 - 行业新闻 - 新闻

021-24209369

新闻

多媒体数据压缩的必要性与可能性

在信息时代，人们越来越依靠计算机获取和利用信息。而数字化后的音频和视频等媒体信息具有媒体海量性，与当前硬件技术所能提供的计算机存储资源和网络带宽之间有很大差距。这样，就对多媒体信息的存储和传输造成了很大的困难，成为阻碍人们有效获取和利用信息的一个瓶颈问题。语音、图像与视频等多媒体数据的压缩编码是解决多媒体数据的存储与传输的关键技术之一。由于图像和视频信息的数据量非常大，使得图像和视频的存储与处理问题更为突出。下面将介绍数据压缩的基本原理和方法，并介绍声音、图像和视频的国际压缩标准。

多媒体数据压缩的必要性

我们每天接收的外部信息中，大部分内容是通过听觉和视觉系统接收的。据分析，在人类的感官所接收的外部信息中，通过耳朵接收的听觉信息约占总信息量的20％左右，而通过人眼的视觉接收的信息则高达60％以上。由于图像、视频信息具有信息量大、直观性强的特点，而且特别适合人们在信息交流中所需要的直接、亲切等生理和心理的要求特点，图像、视频信息在通信中的地位显得尤为重要。图像、视频文件的特点是占用空间大，想把此图像、视频等多媒体数据文件存储和传输则需要更多的资源。因此，研究多媒体数据编码与压缩是数字处理与通信必不可少的内容。近年来，随着计算机与数字通信技术的快速发展，特别是 Internet 的兴起和多媒体系统在众多领域的广泛应用，多媒体数据编码与压缩作为数据压缩的一个分支，已受到越来越多的关注。

图像编码与压缩从本质上来说就是对要处理的图像源数据按一定的规则进行变换和组合，从而达到用尽可能少的代码（符号）来表示尽可能多的数据信息。图像数据的特点之一是数据量大。例如，一张A4（210mmx297mm）幅面的图片，若用中等分辨率（600dpi）的扫描仪按真彩色扫描，共有（600x210／25.4）x（600x297／25.4）个像素，每个像素占用3个字节，其数据量为144MB字节。在多媒体计算机中，大量数据的传送和存储问题是面临的极大难题之一。若不进行编码压缩处理，一张640MB容量的普通光盘只能存放45s的原始电视数据。显然，电视信号数字化后直接保存的方法是不能接受的，因此必须采取图像数据压缩后再保存。彩色图像也是数据量极大的一类数据。

例如，存储一幅标准VGA模式的图像（640x480x256像素）时，大约需要0.3MB。若要求达到每秒钟25帧的全动态显示要求，每秒所需的存储容量为7.5MB，640MB的光盘也只能存放1分25秒的图像数据。又如，在Internet上，基于传统字符界面的应用被能浏览图像信息的www方式所代替。www具有更加吸引人的外观，但也带来了一个重大的问题：图像信息的数据量非常庞大，使原来就已经很紧张的网络带宽资源变得更加不堪重负，在现有资源下不进行图像数据的合理编码和压缩已经完全无法正常应用。

从传送的角度来看，则更要求数据量压缩。首先某些图像采集有时间性，例如遥感卫星图像传回地面有一定时间限制，某地区卫星过境后无法再得到数据，否则就要增加地面站的数量；而且图像存储体的存储时间也有限制。它取决于存储器件的极短存取时间，若单位时间内大量图像数据来不及存储，就会丢失信息。在现代通信中，图像与视频传输也已成为重要内容。除要求设备可靠、图像保真度高以外，实时性将是重要技术指标之一。数字信号传

送规定一路数字电话为64kb，多个话路通道再组成一次群、二次群、三次群...通常一次群为32个数字话路，二次群为120路，三次群为480路，四次群为1920路...彩色电视的传送比较能体现数据压缩的重要性，我国的PAL制彩电传送用三倍副载波取样。若用8位量化约需100Mb，总数字话路为64kb，传送彩色电视需占用1600个数字话路，即使黑白电视用数字微波接力通信也占用900个话路。

总之，大数据量的图像信息会给存储器的存储容量，通信线路信道的带宽，以及计算机的处理速度增加了极大的压力。单单依靠增加存储器容量，提高信道带宽以及计算机的处理速度等方法来解决这个问题是不现实的。

可见，没有多媒体编码压缩技术的发展，大容量图像、视频信息的存储与传输是难以实现的，多媒体、信息高速公路等新技术在实际中的应用也会碰到很大困难。

多媒体数据压缩的可能性

由分析研究发现，没有图像与视频编码和压缩技术的发展，大容量图像和视频信息的存储和传输是难以实现的。众所周知，视频是一帧一帧的图像组成，图像的各像素之间，无论在行方向还是在列方向，都存在着一定的相关性，即冗余度。应用某种编码方法提取或减少冗余度，便可以达到压缩数据的目的。

图像数据表示中存在着大量的冗余，通过去除那些冗余数据可以使原始图像数据极大地减少，从而解决图像数据量巨大的问题。图像数据压缩技术就是研究如何利用图像数据的冗余性来减少图像数据量的方法。即进行图像压缩研究的起点是研究应用某种编码方法提取或减少图像数据的冗余度。

下面介绍常见的一些图像数据冗余的情况。

1.空间冗余

这是静态图像存在的比较重要的一种数据冗余。一幅图像记录了画面上可见景物的颜色。同一景物表面上各采样点的颜色之间往往存在着空间连贯性，但是基于离散像素采样来表示物体颜色的方式通常没有利用景物表面颜色的这种空间连贯性，从而产生了空间冗余。我们可以通过改变物体表面颜色的像素存储方式来利用空间连贯性，达到减少数据量的目的。例如：在静态图像中有一块表面颜色均匀的区域，在此区域中所有点的光强和色彩以及饱和度都是相同的，因此数据有很大的空间冗余。

2.时间冗余

这是序列图像（电视图像、运动图像）表示中经常包含的冗余。序列图像一般为位于一时间轴区间内的一组连续画面，其中的相邻帧往往包含相同的背景和移动物体，只不过移动物体所在的空间位置略有不同，所有后一帧的数据与前一帧的数据有许多共同的地方，这种共同性是由于相邻帧记录了相邻时刻的同一场景画面，所以称为时间冗余。

3.结构冗余

在许多图像的部分区域内存在较强的纹理结构或者具有规则形状，或是图像的各个部分存在强相似性；视频运动图像序列中不同帧之间的相关性引起的时间冗余，例如电视画面中的大部分区域信号变换缓慢，尤其是背景部分有时几乎不变，这些都是结构冗余的表现。

4.知识冗余

有些图像的理解与某些基础知识有相当大的相关性。例如：人脸的图像有固定的结构，比如说嘴的上方有鼻子，鼻子的上方有眼睛，鼻子位于脸的中线上等。这类规律性的结构可由先验知识和背景知识得到，称此类冗余为知识冗余。根据已有的知识，对某些图像中所包含的物体，可以构造其基本模型，并创建对应各种特征的图像库，进而图像的存储只需要保存一些特征参数，从而可以大大减少数据量。知识冗余是模型编码主要利用的特征。

5.视觉冗余

人眼感觉到的区域的亮度不仅仅取决于该区域的反射光，还取决于其他因素。产生这个现象是因为眼睛对视觉信息感受的灵敏性不同。人类的视觉系统对于图像的感知是非均匀和非线性的，人眼对一般图像中的许多信息并不敏感，并不是对图像中的任何变化都能察觉得到。然而在获取原始图像数据时，通常假定视觉系统是线性的和均匀的，对视觉敏感与否不进行设定，这样就会产生比较多的数据，这就是视觉冗余。如果压缩编码方案能够充分利用人眼的视觉系统特性，可以达到较高的压缩比。

6.图像区域的相同性冗余

它是指图像中的两个或多个区域所对应的所有像素值相同或相近而产生的数据重复性存储，这就是图像区域的相似性冗余。在以上情况下，记录了一个区域中各像素的颜色值，则与其相同或相近的其他区域就不再需记录其中各像素的值。向量量化方法就是针对这种冗余性的图像压缩编码方法。

7.纹理的统计冗余

有些图像纹理尽管不严格服从某一分布规律，但是它在统计的意义上服从该规律。利用这种性质也可以减少表示图像的数据量，所有我们称之为纹理的统计冗余。

上述各种形式的冗余，使得图像压缩成为可能。图像编码方法都是基于各种冗余信息和人类的视觉特性，以尽量少的比特数表示和重建原始图像的。

随着对人类视觉系统和图像模型的进一步研究，人们可能会发现更多的冗余性，使多媒体数据压缩编码的可能性越来越大，从而推动多媒体压缩技术的进一步发展。