MPEG1和MPEG2视频编码压缩技术及标准

时间:2005-06-08 17:29:37 作者:网友整理

游戏录屏软件v2.10.2 47.55M / 简体中文

点击下载

老外管理器pro版本v0.13.2 105.51M / 简体中文

点击下载

小熊文件工具箱app1.4.8 61.30M / 简体中文

点击下载

本文的目的在于给出有关MPEGl和MPEG2视频编码算法及标准的概述、以及它们在视频通信中的作用。论文的正文是这样安排的：首先回顾了与MPEG视频压缩标准有关的那些基本概念和技术：接着较详细地叙述了MPEGl和MPEG2的视频编码算法；最后的内容为标准中与其应用有关的一些特征。
MPEG视频压缩算法的基本原理　

　　一般说来，在帧内以及帧与帧之间，众多的视频序列均包含很大的统计冗余度和主观冗余度。视频源码的最终目标是：通过挖掘统计冗余度和主观冗余度，来降低存储和传送视频信息所需的比特率；并采用嫡编码技术，以便编制出"最小信息组"一个实用的编码方案，是在编码特性(具有足够质量的高压缩)与实施复杂性之间的一种折衷。对于MPEG压缩算法的开发来讲，计及到这些标准的寿命周期应考虑到现代超大规模集成电路技术的能力，这一点是最重要的。根据应用的要求，我们也许会想到视频数据的"无损失"编码和"有损失"编码"无损失"编码的目的在于：在保持原图像质量(即解码后的图像质量等同于编码前的图像质量)情况下，来减少需要存储和传送的图像或视频数据。与此相反，"有损失"编码技术(该技术跟MPEG-l和MPEG2视频标准未来的应用有关) 的目的是，去符合给定的存储和传送比特串。重要的一些应用包括；利用限定的带宽或很窄的带宽，通过通信频道采传送视频信息；有效地存储视频信息。在这些应用中，高的视频压缩是以降低视频质量的办法来实施的，即跟编码以前的原始图像相比，解码后的图像"客观"质量有所降低(也就是取原始图像和再现图像之间的均方差，作为评定客观图像质量的标准)频道的目标比特率越低；那么视频所必须进行的压缩率就越大，通常可察觉的编码人工产物也越多。有损失编码技术的最终目的是：在指定的目标比特串条件下，获取最佳的图像标准。这里应服从"客观"或"主观"上的最佳标准。这里应该指出，图像的降级程度(指客观降低以及可察觉到的人工产物的数量)取决于压缩技术的复杂性--对于结构简单的画面和视频活动少的图像来讲，就是采用简单的压缩技术，也许能获得根本不带可察觉人工产物的良好的再现图像　

(A)MPEG视频编码器源模式　

　　MPEG数字视频编码技术实质上是一种统计方法。在时间和空间方向上，视频列通常包含统计冗余度。MPEG压缩技术所依赖的基本统计特性为像素之间(interpel)的相关性，这里包含这样一个设想：即在各连续帧之间存在简单的相关性平移运动。这里假定：一个特殊画面上的像素量值，可以(采用帧内编码技术)根据同帧附近像素来加以预测，或者可以(采用帧间技术)根据附件帧中的像素来加以预测。直觉告诉我们：在某些场合，如一个视频序列镜头变化时，各附近帧中像素之间的时间相关性就很小，甚至消失 -这时，该视频镜头就成为一组无相关牲的静止画面的组合。在这种情况下，可采用帧内编码技术来开发空间相关性，来实现有效的数据压缩，MPEG压缩算法采用离散余弦变换(DCT)编码技术，以8×8像素的画面块为单位，有效地开发同一面面各附近像索之间的空间相关性。
　　然而，若附近帧中各像素间具有较大的相关性时，也就是说两个连续帧的内容很相似或相同时，就可以采用应用时间预测(帧间的运动补偿预测)的帧间DPCM编码技术。在多种MPEG视频编码方案中，若将时间运动补偿预测路剩余空间信息的变换码自适应地结合起来，就能实现数据的高压缩(视频的 DPCM/DCT混合编码) 图1给出了一个画面的帕内像素问相关性特性的举例，这里采用了一个非常简单，但很有价值的统计模式。这个假设的简单模式已包括了许多"典型"画面的一些基本的相关特性，也就是指相邻像素间的高度相关性，以及随着像素间距的增大相关性的单值衰减特性。我们以后将利用这一模式来展示变换区域编码的一些特性。图1一些"典型"画面的像素间的空间相关性，是应用具有高度像素间相关性的AR(1)GaussMarkov画面模式来加以计算的。变量X和Y分别表示像素之间在画面水平和垂直方向上的距离　

(B)二次取样和内插法　

　　几乎所有本论文中所叙述的视频编码技术，在编码之前，均大量地进行了二次取样和量化工序。二次取样的基本概念是想减少输入视频的Dimension 水平Dimension和或垂直Dimension)，并在进行编码处理之前先对像素进行编号。值得注意的是：在有些应用场合，在时间方向上也对视频进行二次取样，以便在编码之前降低帧频。在接收机端，已解码图像是通过内插法来加以显示的。这一方法可以认为是一种最简单的压缩技术，这种压缩技术利用了人眼特有的生理特姓，因而去除了视频数据中的含有的主观冗余度-即与色度信号的变化相比，人眼对亮度信号的变化更灵敏。故众多 MPEG编码方案首先将画面分成YUV与量信号(一个亮度分量和二个色度分量)接着，相对于亮度分量，对色度分量进行二次取样，对于一些特殊应用，有一个Y：U：V比率(即对于MPEG-2 标准，采用4：1：1或4：2：2.　

(C）运动补偿预测　

　　运动补偿预测是一个有力的工具，以便减小帧间的时间冗余度；并作为用于时间DPCM编码的预测技术，这一工具在MPEGl 和MPEG2视频编码标准中得到广泛应用。运动补偿概念是以对视频帧间运动的估算为基础的，也就是说，若视频镜头中所有物体均在空间上有一位移，那么用有限的运动参数(如对于像素的平移运动，可用运动矢量来描述)来对帧间的运动加以描述。在这一简单例子中，一个来自前编码帧的运动补偿预测像素，就能给出一个有效像素的最佳预测。通常，预测误差和运动矢量均传送至接收机。然而，将一个运动信息对每一个编码画面像素进行编码，这既不值得也没有这个必要。由于一些运动矢量之间的空间相关性通常较高，有时可以这样认为：一个运动矢量代表一个相邻像素块的运动。为了做到这一点，画面一般划分成一些不连接的像素块(在 MPEGl和MPEG2标准中一个像素块为16×16像素)，对于每一个这样的像素块，只对一个运动矢量进行估算、编码和传送(图2)。在MPEG压缩算法中，运动补偿预测技术用来减少帧间的时间冗余度，只对预测误差画面(原始画面与运动补偿预测画面之间的差别)加以编码。
　　总的来说，由于采用依据于前编码帧的预测，与图l中所示的帧内相关性相比较，待编码的运动补偿帧间误差图像中像素之间的相关性就差了。图2用于运动补偿的块匹配法：在待编码的第N有效帧中，为每一个画面块估算一个运动矢量(mv)该运动矢量针对前已编码的第N-l帧中同样大小的一个参照画面块。运动补偿预测误差是这样计算的：在带有前帧参照块中运动飘移对应物的面面块中，减去一个像素。　

(D)变换或编码　

　　二十年来，人们已对变换编码进行了大量的研究，它已成为用于静止画面编码和视频编码的一种非常流行的压缩方法。变换编码的目的在于去掉帧内或帧间误差图像内容的相关性，对变换系数进行编码，不是对画面的原始像素进行编码。为此，输入画面被分成不连接的b像素的画面块(即N×N像素)。以一个线性、可分离的和单元前向变换为基础，本变换可表示为一个矩阵操作，采用一个N×N变换矩阵A，采获取N×N变换系数C。 C＝AbAt 这里AT表示变换矩阵A的一种移项式。注意：这种变换是可逆的，原因是，采用线性和可分离的反向变换，可以再现原始的N×N个 b像素的画面块. b=AtCa 利用许多可能的方法，应用于较小的由8×8像素组成的画面块的离散余弦变换(DCT)已成为一种最佳的变换，用于静止画面和视频编码。事实上，由于基于DCT的方法具有较高的抗相关性能，并能获得快速DCT算法，适用于实时应用，已在大多数画面和视频编码标准中加以使用。VLSI技术的运行速率适合较广泛的视频应用范围，故已商业化。变换编码的主要目的是使尽量多的变换系数足够的小，使它仍无效(从统计和主观测量角度来看)。同时，应尽量减小系数之间的统计相关性，目的在于减少对剩余系数进行编码所需的比特数量。图3示出了帧内DCT系数8×8像素块的方差(能量)，这里是以图1中已讨论过的简单的统计模式设想为基础的。此处，每一个系数的方差，表示了系数(大量帧的乎均值)的可变性。与方差大的系数相比，方差小的系数在画面像素块再现时意义就不大了。如图3中所示，一般来说，为了获得画面像素块的有用的近似再现，只要将少量DCT系数传送给接收机就行。然而，那些最高有效位 DCT系数集中在左上角(低DCT系数)，面随着距离的增加，系数的有效牲就逐步下降。这意味着：与较低位的系数相比，较高位的 DCT系数在画面像素块再现时的重要性就差一些。采用运动补偿预测，DCT变换的结果是，使DCT定义域中的时间DPCM信号实现筒单的再现-这实质上继承了这种相似的统计相关性，如以DCT 定义域中的这个DPCM信号来再现图2中的帧内信号(虽然能量有所减少)-这就是为什么为了使帧间压缩获得成功MPEG算法要采用DCT编码的原因图3图示了DCT系数的方差分布情况，典型地计算了大量的画面块而获得的平均值。DCT系数方差计算是以图1中的统计模式为基础的。U和V分别该8×8块中水平和垂直画面变换域变量。大多数总方差集中在DCDC了系数周围(U＝0，v＝0) DCT跟离散傅里叶变换很接近，而认识到以下这点是重要的，即可以对DCT系数加以频率说明，使其更接近于DFTo在画面块内，低位的Dcr系数与较低的空间频率有关而高位的DCT系数与较高的频率有关。
　　这一特性在MPEG编码方案中被加以应用，以便去除画面数据中所包含的主观冗余度，这一切是以人类视觉系统标准为基础的。由于跟较高空间频率有关的再现误差比较，观众对较低空间频率的再现误差更加敏感，故在给定比特率情况后，为了要改进解码画面的视觉质量往往根据视觉(感觉量化)对系数进行频率自适应加权(量化) 上述两种技术-时间运动补偿预测和变换域编码-的结合，被认为是MPEG编码标准的关键点 MPEG算法的第三个特点是这两种技术的处理是较小的画面块(典型情况是：在16×16 像素上进行运动补偿，在8×8像素上进行DCT编码)。由于这个原因，MPEG编码算法通常又叫作基于画面块的DPCM/DCT混合算法.

MPEG-1：一个通用标准-一个应用于数字存储媒体　

（最高速率达1．5Mb／s)的活动图像和伴音的编码标准　

　　由MPEG-1开发出来的视频压缩技术的应用范围很广，包括从CD-ROM上的交互系统，到电信网络上的视频传送 MPEG1视频编码标准被认为是一个通用标准。为了支持多种应用，可有用户来规定多种多样的输人参数，包括灵活的图像尺寸和帧频。MPEG推荐了一组系统规定的参数：每一个MPEG-l兼容解码器至少必须能够支持视频源参数，最佳可达电视标准：包括每行最小应有720个像素，每个图像起码应有576行，每秒最少不低于 30帧，及最低比特率为1．86Mb／s，标准视频输入应包括非隔行扫描视频图像格式。应该指出：但并不是说，MPEGl的应用就限制于这一系统规定的参数组。根据JPiG和H。261活动，已开发出MPEG-l视频算法。当时的想法是：尽量保持与CCITT H．261标准的共同性，这样，支持两个标准的做法就似乎可能。当然，MPEGl主要目标在于多媒体CD-ROM的应用，这里需要由编码器和解码器支持的附加函数牲。由MPEGl提供的重要特性包括：基于帧的视频随机存取，通过压缩比特流的快进/快退搜索，视频的反向重放，及压缩比特流的编辑能力。

加载全部内容