数字视频压缩

紫外线 · 发表于 2004-12-16 03:14:00

视频压缩的目标是在尽可能保证视觉效果的前提下减少视频数据率。视频压缩比一般指压缩后的数据量与压缩前的数据量之比。由于视频是连续的静态图像，因此其压缩编码算法与静态图像的压缩编码算法有某些共同之处，但是运动的视频还有其自身的特性，因此在压缩时还应考虑其运动特性才能达到高压缩的目标。

在视频压缩中常需用到以下的一些基本概念：

一、有损和无损压缩：在视频压缩中有损（Lossy）和无损（Lossless）的概念与静态图像中基本类似。无损压缩也即压缩前和解压缩后的数据完全一致。多数的无损压缩都采用RLE行程编码算法。有损压缩意味着解压缩后的数据与压缩前的数据不一致。在压缩的过程中要丢失一些人眼和人耳所不敏感的图像或音频信息，而且丢失的信息不可恢复。几乎所有高压缩的算法都采用有损压缩，这样才能达到低数据率的目标。丢失的数据率与压缩比有关，压缩比越小，丢失的数据越多，解压缩后的效果一般越差。此外，某些有损压缩算法采用多次重复压缩的方式，这样还会引起额外的数据丢失。

二、帧内和帧间压缩：帧内（Intraframe）压缩也称为空间压缩（Spatialcompression）。当压缩一帧图像时，仅考虑本帧的数据而不考虑相邻帧之间的冗余信息，这实际上与静态图像压缩类似。帧内一般采用有损压缩算法，由于帧内压缩时各个帧之间没有相互关系，所以压缩后的视频数据仍可以以帧为单位进行编辑。帧内压缩一般达不到很高的压缩。

采用帧间（Interframe）压缩是基于许多视频或动画的连续前后两帧具有很大的相关性，或者说前后两帧信息变化很小的特点。也即连续的视频其相邻帧之间具有冗余信息，根据这一特性，压缩相邻帧之间的冗余量就可以进一步提高压缩量，减小压缩比。帧间压缩也称为时间压缩（Temporalcompression），它通过比较时间轴上不同帧之间的数据进行压缩。帧间压缩一般是无损的。帧差值（Framedifferencing）算法是一种典型的时间压缩法，它通过比较本帧与相邻帧之间的差异，仅记录本帧与其相邻帧的差值，这样可以大大减少数据量。

紫外线 · 发表于 2004-12-16 07:31:00

三、对称和不对称编码：对称性（Symmetric）是压缩编码的一个关键特征。对称意味着压缩和解压缩占用相同的计算处理能力和时间，对称算法适合于实时压缩和传送视频，如视频会议应用就以采用对称的压缩编码算法为好。而在电子出版和其它多媒体应用中，一般是把视频预先压缩处理好，尔后再播放，因此可以采用不对称（asymmetric）编码。不对称或非对称意味着压缩时需要花费大量的处理能力和时间，而解压缩时则能较好地实时回放，也即以不同的速度进行压缩和解压缩。一般地说，压缩一段视频的时间比回放（解压缩）该视频的时间要多得多。例如，压缩一段三分钟的视频片断可能需要10多分钟的时间，而该片断实时回放时间只有三分钟。

目前有多种视频压缩编码方法，但其中最有代表性的是MPEG数字视频格式和AVI数字视频格式。

为什么数字视频要压缩

数字视频之所以需要压缩，是因为它原来的形式占用的空间大得惊人。视频经过压缩后,存储时会更方便。数字视频压缩以后并不影响作品的最终视觉效果，因为它只影响人的视觉不能感受到的那部分视频。例如,有数十亿种颜色,但是我们只能辨别大约1024种。因为我们觉察不到一种颜色与其邻近颜色的细微差别，所以也就没必要将每一种颜色都保留下来。还有一个冗余图像的问题—如果在一个60秒的视频作品中每帧图像中都有位于同一位置的同一把椅子,有必要在每帧图像中都保存这把椅子的数据吗?

压缩视频的过程实质上就是去掉我们感觉不到的那些东西的数据。标准的数字摄像机的压缩率为5比1,有的格式可使视频的压缩率达到100比1。但过分压缩也不是件好事。因为压缩得越多,丢失的数据就越多。如果丢弃的数据太多,产生的影响就显而易见了。过分压缩的视频会导致无法辨认。

压缩视频的时候，请始终尝试几种压缩设置。目的是尽可能将数据压缩到最小，当数据丢失到从画面中能够明显看到时，再将压缩率稍微向回调一点儿。这样就可以在文件大小和画面质量之间达到最佳平衡。不要忘记,每个视频作品都各不相同—有些视频经过高度压缩后看上去仍不错，有些却不是，所以您需要通过试验才能得到最好的效果。

MPEG视频压缩算法采用了哪些技术？
为满足高压缩比和随机访问两方面的要求，MPEG视频算法采用了预测和插补两种帧间编码技术。MPEG视频压缩算法中包含两种基本技术：一种是基于16×16子块的运动补偿，用来减少帧序列的时域冗余；另一种是基于DCT的压缩，用于减少帧序列的空域冗余，在帧内压缩及帧间预测中均使用了DCT变换。

运动补偿：运动补偿是当前视频图像压缩技术中使用最普遍的方法之一。包括：

1、运动补偿预测

视频的相邻帧间的运动部分具有连续性，即当前画面上的图像可以看成是前画某时刻画面上图像的位移，位移的幅度值和方向在画面各处可以不同。利用运动位移信息与前面某时刻的图像对当前画面图像进行预测的方法，称为前向预测。反之，根据某时刻的图与位移信息预测该时刻之前的图像，称为后向预测。

MPEG的运动补偿将画面分成若干16×16的子图像块（称为补偿单元或宏块），并根据一定的条件分别进行帧内预测、前后预测、后向预测及平均预测。

2、运动补偿插值

以插补方法补偿运动信息是提高视频压缩比的最有效措施之一。在时域中插补运动补偿是一种多分辨率压缩技术。例如1/15秒或1/10秒时间隔选取参考子图，对时域较低分辨率子图进行编码，通过低分辨子图反映运动趋势的附加校正信息（运动夭量）进行插值，可得到满分辨率（帧率1/30秒）的视频信号。插值运动补偿也称为双向预测，因为它既利用了前面帧的信息又利用了后面帧的信息。

关键帧(KeyFrame)：在一些压缩方案中，有些帧被指定为关键帧。既然两帧之间的画面的大部分内容往往没有太大区别，就可以将后续帧和关键帧进行比较，而保存真正发生变化的部分。这样可以节省空间。

M-JPEG算法：Motion-JPEG（简称M-JPEG），它是针对活动图像而优化的JPEG压缩而称。而JPEG是针对一帧图像通过帧内的DCT(离散余弦变换)变换来对图像数据进行压缩，通过对电视数字信号（4:2:2数据）在帧内进行JPEG压缩，以减少电视数字信号数据量。因而，M-JPEG格式常常用于以帧为单位的电视编辑、特技制作等。而在监控系统等其它应用中,M-JPEG的主要问题是在一定的视频图像质量前提下,压缩比难以提高，占用的设备资源巨大，在实时压缩和传输方面难于实现。

CBR和VBR：

VBR（VariableBit-Rate，变比特率）：在给定目标码率要求下，码流可根据场景和线路条件变化，从而获得最优质量。通常用于视频流内容编码转换。

CBR（ConstantBit-Rate，定比特率）：按给定比特率提供码流，通常用于实时或在带宽条件有限的情况下的视频应用.

593326039 · 发表于 2004-12-16 07:51:00

分享，谢谢啊

账号		自动登录	找回密码
密码			快速注册

[资讯] 数字视频压缩

浏览过的版块