音频应用   音频插件联盟,正版插件,欢迎大家选择!

 找回密码
 快速注册

QQ登录

只需一步,快速开始

阅读: 16192|回复: 2

[音视频] 视频编码标准

[复制链接]

1万

积分

4

听众

2099

音贝

音频应用注册会员

Rank: 4Rank: 4

积分
19245
发表于 2009-5-27 | |阅读模式
音频应用公众号资讯免费发布推广
1 编码结构

h264

基本单元:最大为16x16,还可分为16x8、8x16、和8x8大小。8x8的宏块也被称为亚宏块(比16x16小一个尺寸),亚宏块可以继续细分成8X4、4x8、4x4大小,至此不可再分。共计7种划分方式。

h265:编码树单元(CodingTree Unit,CTU)、编码单元(Coding Unit,CU)、预测单元(Prediction Unit,PU)以及变换单元(Transform Unit,TU)。HEVC采用了具有灵活块划分特性的编码树单元,块(即编码单元)的尺寸可以达到最大为64x64像素大小。64x64像素大小的CTU即为编解码器的最基本处理单元

CU单元的实现步骤

编码开始,针对整个CTU进行所有预测模式下的RD-Cost,

对四叉树划分,选择对应的最佳的RD-cost,进行递归计算,对比来确定CTU四叉树的划分模式。【优化侧率,比如如何提前终止划分模式,来提升编码效率】

CU中skipp模式:不需要进行帧内预测模式,不需要考虑运动矢量和残差信息。

CU中non-skopped模式:根据实际情况选择帧内还是帧间

PU单元

PU是在CU的基础之上继续进行划分得到的。每个CU可能包含多个PU。PU是用于帧内预测和帧间预测的,存储了预测所需的相关信息。CU—定是正方形,但PU不需要。PU的这一设计是为了更好地还原图像的边界信息,尽可能与图像的真实像素相匹配。

TU单元

TU的划分用于预测残差变化和量化,以CU为基本单元进行四叉树深度递归划分,与CU的划分算法相同。

2 帧间预测

h264:帧内预测是为了降低宏块内部的像素空间冗余,而帧间预测则是为了减少视频图像的时域冗余。6x16、16x8、8x16、8x8、8x4、4x8、4x4。帧间预测采用了可变块运动估计/运动补偿技术,从而在参考帧中找到匹配的图像块,采用此技术较只使用16x16宏块的单一划分方式提高约15%的编码效率提升。运动矢量的精度可以细化到1/4像素或1/8像素,大大提升了预测精度,增强了在纹理特征较为复杂情况下的预测能力,编码率提升近20%
 

h2645:HEVC引入了高级运动矢量预测(Advanced Motion VectorPrediction,AMVP)对运动矢量进行预测和估计。AMVP具有较局的适应性,可以有效地利用空间相关性。AMVP从当前正在编码的预测单元相邻的预测单元中选择最佳的运动向量作为待编码预测单元的运动向量预测值。

HEVC还引入了Merge模式,对相关性较强的编码单元进行压缩合并,减少编码的比特数。H.265/HEVC和H.264/AVC标准都只对运动矢量(MV)进行编码。通过将时空域相邻的预测单元的MV进行候选,编码器从候选表中取出最符合的MV对应的候选块进行传输,这一过程就称为Merge技术,即运动合并技术。
 

3 帧内预测

h264: 视频是由连续图像序列组成的,每一幅图像称为一帧。帧内预测的目的是降低宏块间像素的空间冗余,降低编码过程中的数据量。具体是利用当前宏块周围邻近的像素值、在空间域上的方向特性和亚宏块像素间的相关性对当前待编码宏块进行预测,将预测像素和待编码像素进行残差计算,对残差进行编码,去除空间冗余,提高图像的编码压缩效率,降低编码时间。能够进行帧内预测的宏块必须为NxN类型,即大小为4x4、8x8和16x16的宏块。

亮度分量支持两种帧内预测模式,分别为4x4和16x16。其中4X4支持9种不同的预测模式。
                                                                                                     其中16X16支持4种不同的预测模式。

h265:H.265/HEVC将帧内预测模式的种类大大增加。角度模式增加至33种,在原来的直流模式(DC)以外还新增了平面模式。

特点:多增加了线性滤波处理:平面模式则是先对待编码单元上方和左方的参考像素进行线性滤波处理,降低预测像素的突变程度,使得计算值更加稳定和平缓,降低画面突兀的可能,优化视频帧的主观视觉效果。
 

4 变化量化

变化:空间域的像素转化茧变换域。改用变换域的变换系数进行度量描述,降低空间冗余,进一步结合蜇化技术、Z-order扫描、熵编码进行压缩数据。

量化:量化是为了使数字信号的连续取值对应至有限个离散值,以使信号取值较为规律,实现多对一的映射关系。上述提及的DCT变换对残差信号进行处理后得到的DCT系数取值范围一般很大,量化可以控制DCT系数的取值区间,降低编码量,提升压缩性能。
 

H264的变化:在H.264/AVC编码标准中,使用的依然是基于块的变换编码,但采用的是基于整数的DCT技术[25,26],以往标准只支持8x8大小的变换单元,新标准支持4x4、8x8大小的变换单元,运算速度有所提升,且在逆运算过程中不会存在精度问题。

H264的量化:H.264/AVC同时还米用了52级步长量化参数(QuantizationParameter,QP)。选用的量化步长QP越大,则视频帧的质量损耗越大;选用的量化步长QP越小,视频帧的质量损失也就越小。

H265的变化:在H.264/AVC编码标准中,使用的依然是基于块的变换编码,但采用的是基于整数的DCT技术[25,26],以往标准只支持8x8大小的变换单元,新标准支持4x4、8x8大小的变换单元,运算速度有所提升,且在逆运算过程中不会存在精度问题。

H265的量化:H.264/AVC同时还米用了52级步长量化参数(QuantizationParameter,QP)。选用的量化步长QP越大,则视频帧的质量损耗越大;选用的量化步长QP越小,视频帧的质量损失也就越小

常用的量化的方式

标量量化:每个样点的量化取值是一个标量,并且独立于其他点的取值。

矢量量化:将每个n维取值空间划分为若干个子空间,每个子空间用一个n维代表矢量来表示该子空间所有的矢量取值。

5 熵编码

依据熵编码这一手段可以进一步去除统计冗余。

H.264/AVC编码标准采用基于上下文的二进制算数编码和基于上下文的自适应可变长编码
 

H. 265采用了高性能的算数编码,提升编码效率

6 环路滤波

去方块滤波

采样自适应偏移
欢迎厂家入驻,推文!免费!微信:yinpinyingyong

3848

积分

3

听众

199

音贝

音频应用新手发布

Rank: 3

积分
3848
发表于 2009-5-27 |
顶起:victory::victory::victory:
欢迎厂家入驻,推文!免费!微信:yinpinyingyong

4326

积分

2

听众

-21

音贝

音频应用新手发布

Rank: 3

积分
4326
发表于 2009-5-27 |
:victory:视频编码标准  
欢迎厂家入驻,推文!免费!微信:yinpinyingyong
您需要登录后才可以回帖 登录 | 快速注册

本版积分规则

音频应用搜索

小黑屋|手机版|音频应用官网微博|音频招标|音频应用 (鄂ICP备16002437号)

Powered by Audio app

快速回复 返回顶部 返回列表