HM学习笔记来自博客整理精品文档.docx

资源描述

HM学习笔记来自博客整理精品文档.docx

《HM学习笔记来自博客整理精品文档.docx》由会员分享，可在线阅读，更多相关《HM学习笔记来自博客整理精品文档.docx（14页珍藏版）》请在冰点文库上搜索。

HM学习笔记来自博客整理精品文档.docx

HM学习笔记来自博客整理精品文档

HM学习笔记_来自博客

编辑整理：

尊敬的读者朋友们：

这里是精品文档编辑中心，本文档内容是由我和我的同事精心编辑整理后发布的，发布之前我们对文中内容进行仔细校对，但是难免会有疏漏的地方，但是任然希望（HM学习笔记_来自博客）的内容能够给您的工作和学习带来便利。

同时也真诚的希望收到您的建议和反馈，这将是我们进步的源泉，前进的动力。

本文可编辑可修改，如果觉得对您有帮助请收藏以便随时查阅，最后祝您生活愉快业绩进步，以下为HM学习笔记_来自博客的全部内容。

HEVC学习

（二）--HM的整体结构及一些基本概念

7个工程

1.TAppCommon

2。

TAppDecoder

3。

TAppEncoder

4。

TlibCommon

5。

TLibDecoder

6.TLibEncoder

7.TLibVideoIO

'T’代表’Test'（这一个的理解可能有误），'App’代表'Application',表明该工程主要包含一些应用函数'Lib’代表'Library'，表明该工程主要包含一些库函数.’Common’表明该工程包含的一些函数是编码器和解码器共用的,’Decoder'表明该工程包含的函数是解码器使用的，而’Encoder’表明该工程包含的函数是编码器使用的.'VideoIO’工程主要是实现对YUV文件的读写操作。

编码器和解码器的主函数分别在encmain。

cpp和decmain。

cpp中，相信光看源文件名都能看出来了。

（1）类的命名：

（2）变量的命名:

（3）函数的命名：

HEVC学习（三）—-帧内预测系列之一

fillReferenceSamples函数（填补当前PU周围相关的样本值）--Void TComPattern：

fillReferenceSamples

-—图像2（左上角为4个像素点，如无强调则以块为单位计算长度等？

）

PS:

此处有两块图像:

重建的YUV的大图像1、相对应的专用于预测的PU及其周边的参考样点图像2

Pel＊ piRoiTemp—-指向重建Yuv图像1的位置（临时使用，指向可随意变动）

Pel＊ piRoiOrigin——指向重建Yuv图像1对应于当前PU所在位置的首地址（对当前PU固定）

Int＊ piAdiTemp——图像2的感兴趣位置（变动的，用于赋值）

iPicStride ——重建YUV图像1的宽

iNumIntraNeighbor——指示PU周边可用邻块数

uiWidth=uiCuWidth＊2+1——图像2的宽,uiHeight=uiCuHeight*2+1—-图像2的高

uiCuWidth——图像2的CurrentPU部分的宽，uiCuHeight——图像2的CurrentPU部分的高

iTotalSamples——总样点数

iTotalUnits—-以4x4块为单位的块数

iUnitSize——块的大小

主要功能是在真正进行帧内预测之前，使用重建后的Yuv图像对当前PU（PredictUnit预测单元）的相邻样点进行赋值，为接下来进行的角度预测提供参考样点值.

PS：

关于一个PU的相邻点,以及它的相邻点的可用性如何判断的问题，是一个细节问题，并不会影响我们对这个函数实现功能的理解.

PS：

reference samples are partially available 部分没看，也看不懂

每个4x4块里的4个样点分别被赋值为对应位置的重建Yuv的样点值？

（4＊4块中不是16个样点吗）

HEVC学习（四）-—帧内预测系列之二

CU、PU地址计算方法

光栅扫描，即从左往右，由上往下，先扫描完一行,再移至下一行起始位置继续扫描。

H.264使用的主要就是光栅扫描顺序。

HEVC里同样也有光栅扫描顺序，但是，由于它对CU采用的是递归划分的方式，如果仍是采用光栅扫描顺序，对CU的寻址会很不方便。

HEVC定义了Z扫描顺序

Z扫描是针对一个CU来说的，它是用于递归扫描CU的分割。

定位一幅图像中的一个CU（或其分割）大致是这么个过程，首先，由于CU的尺寸的最大值是已知的,会根据这个定位到该CU左上角相对于图像左上角的位置，即得到它的坐标,接着，才是对当前块进行Z扫描，单位是4x4块，换句话说，Z扫描地址是对一个CU有效的，不能直接使用这个地址来确定它在图像中的位置。

HEVC学习（五）——帧内预测系列之三

initAdiPattern函数（预测的前期准备，得到PU的过程）——Void TComPattern:

initAdiPattern

获得iNumIntraNeighbor、bNeighborFlags等——将参数传入

（一）中的fillReferenceSamples函数赋值-—对周围样点进行3抽头的平滑滤波

主要功能有三个

（1）检测当前PU的相邻样点包括左上、上、右上、左、左下邻域样点值的可用性，或者说检查这些点是否存在；

（2）参考样点的替换过程；

（二）中已介绍过

（3）相邻样点即参考样点的平滑滤波。

Bool bNeighborFlags[4 ＊ MAX_NUM_SPU_W + 1]-—指示4个方向上相邻样点值的可用性

piAdiBuf=piAdiTemp

iNumUnitsInCu = uiCuWidth / iUnitSize； --CurrentPU宽（以块为单位，暂时理解4＊4块宽4）

iTotalUnits = （iNumUnitsInCu 〈〈 2） + 1-—左下、左、上、右上、1左上角

isAboveAvailable函数——计算返回左边可用邻块数

Int iBufSize=uiCuHeight2 + uiCuWidth2 + 1;-—滤波缓存区的大小，相邻块的个数

UInt uiWH=uiWidth * uiHeight-—一个缓存区中的元素个数，图像2中块的总总个数

piAdiBuf——指向滤波前的参考样点的首地址

piFilterBuf——将piAdiBuf所有参考样点拷贝到此区域—-经过滤波后所得值保存在

piFilterBufN中—-存放滤波后样点值的区域

piFilterBuf1 ——经过滤波的样点值（与piAdiBuf相差uiWH，因为滤波前后的值顺序存放）

存放顺序：

piAdiBuf—大小uiWH-piFilterBuf1—uiWH—piFilteredBuf2—uiWH—piFilterBuf—iBufSize（周边样本块数，只有这些才参与滤波）—piFilterBufN

PS：

piAdiBuf、piFilterBuf1 按照图像顺序存放，piFilterBuf、piFilterBufN将周边样点顺序存放，方便滤波

Q：

获取当前PU左上角LT，右上角RT以及左下角LB 以4x4块为单位的Zorder ？

不懂

HEVC参考软件代码总结

1.编码器程序从”TAppEncoder”工程中的encmain.cpp文件开始的，此文件中包含程序运行的入口函数”main”，在main函数中主要做了编码器对象的创建、分析配置文件,初始化配置参数,和编码器最重要的功能"encode”。

2。

在”encode”函数中，主要实现了读取YUV文件的数据、初始化工具对象例如：

GOPEncoder、SliceEncoder、CUEncder……。

在此函数里，还包括一个encode函数,调用CompressGOP函数来具体执行编码任务。

3.在CompressGOP函数中，完成了以下的功能：

一，InitGOP将文件的码流分成若干GOP以便后续程序能够顺利执行。

二，InitEncSlice创建编码的Slice。

三，在此函数中，还包括preCompressSlice和CompressSlice两个函数，前者的作用是选择不同的lamuda进行编码（编码是调用了CompressCU函数，后续介绍），后者是在最好的lamuda下进行编码。

四,循环滤波

五,……（熵编码等，还没看）.

4.在xCompressCU函数中（CompressCU函数的主体也是调用xComprssCU函数），先进行帧间预测xCheckRDCostMerge2Nx2N，xCheckRDCostInter等。

在做完帧间预测后进行阵内预测，这是调用的函数是xCheckRDCostIntra，在xCompressCU函数的后续部分，还递归调用自身以实现对每个CU的编码。

变换编码在encodeCoeff中实现,量化在xCheckIntraPCM完成。

5。

xCheckRDCostIntra函数，主要完成帧内预测的任务,对亮度的预测使用estIntraPredQT，对色度使用estIntraPredChromaQT。

6。

estIntraPredQT函数，在思想对亮度的处理和色度的处理是一样的，所以只介绍亮度的处理函数。

在estIntraPredQT函数中,主要完成了RDCost的选择,在其中predIntraLumaAng函数实现了方向的预测；calcHAD函数计算了SATD；xModeBitsIntra函数计算编码的码率；xUpdateCandList更新了最好的RDCost所使用的模式。

HEVC学习（六）—-帧内预测系列之四

实现亮度分量帧内预测的主函数的大体框架

estIntraPredQT函数（实现亮度分量帧内预测）——

HEVC学习（七）——帧内预测系列之五

predIntraLumaAng函数—-Void TComPrediction:

predIntraLumaAng

帧内预测的最为重要的函数之一predIntraLumaAng

1.getPreditorPtr函数-—Int* TComPattern:

：

getPredictorPtr

Int ＊ptrSrc——获得指向参考样点首地址的指针

数组m_aucIntraFilter-—里面存放了不同PU尺寸下滤波的阈值

getAdiOrgBuf函数-—返回指向未经滤波的参考样点的首地址

sw = 2 ＊ iWidth + 1？

（ptrSrc指向的是当前PU的左上邻点，故加上2＊iWidth指向下一行即当前PU的左邻点，加1指向当前PU的首地址）

PS：

若帧内预测模式满足滤波的条件，则返回的指针要加上uiWH（详见（五））

2.根据帧内预测模式调用以下函数

xPredIntraPlanar函数--进行Intra_Planar模式预测

xPredIntraAng函数-—进行Intra_DC、Intra_Angular（有角度的）模式预测

3.xDCPredFiltering函数—-Void TComPrediction：

xDCPredFiltering

xDCPredFiltering（ ptrSrc+sw+1， sw, pDst, uiStride, iWidth， iHeight）-—sw = 2 * iWidth + 1？

xDCPredFiltering（ Int＊ pSrc， Int iSrcStride, Pel*& rpDst， Int iDstStride， Int iWidth， Int iHeight ）

对Intra_DC模式的边界进行平滑滤波处理.

Int iSrcStride—-预测模块的

Int* pSrc=ptrSrc+sw+1-—ptrSrc指向当前PU的左上邻点，指向当前PU的首地址,

Q？

：

第一行的点，利用对应上邻点与其加权平均（不是与dcValue吗？

）

HEVC/H。

265参考代码跟踪

跟踪帧内预测:

4.在xCompressCU函数中（CompressCU函数的主体也是调用xComprssCU函数），先进行帧间预测xCheckRDCostMerge2Nx2N,xCheckRDCostInter等。

在做完帧间预测后进行帧内预测，这是调用的函数是xCheckRDCostIntra，在xCompressCU函数的后续部分，还递归调用自身以实现对每个CU的编码。

变换编码在encodeCoeff中实现，量化在xCheckIntraPCM完成。

5.xCheckRDCostIntra函数,主要完成帧内预测的任务,对亮度的预测使用estIntraPredQT，对色度使用estIntraPredChromaQT。

6。

estIntraPredQT函数,在思想对亮度的处理和色度的处理是一样的，所以只介绍亮度的处理函数.在estIntraPredQT函数中,主要完成了RDCost的选择，在其中predIntraLumaAng函数实现了方向的预测；calcHAD函数计算了SATD；xModeBitsIntra函数计算编码的码率；xUpdateCandList更新了最好的RDCost所使用的模式。

HEVC学习（八）——以SAO为例浅析跟踪代码方法

寻找到SAO真正实现功能的代码处

HEVC学习（九）——帧内预测系列之六

xPredIntraPlanar函数——Void TComPrediction:

：

xPredIntraPlanar

进行Intra_Planar模式预测（对于代码中的某些公式并未深究）

UInt blkSize = offset2D=width——图像2中CurrentPU的宽度

srcStride——图像2的宽

topRow[k]= = pSrc［k-srcStride］——存放上边界那一行的数组

leftColumn[k]=pSrc[k*srcStride—1］——存放左边界那一列的数组

1位置的值等于其上面的点的值

Q？

：

UInt shift1D = g_aucConvertToBit［ width ] + 2是什么鬼？

：

horPred = leftColumn[k］ + offset2D；？

为什么要加offset2D?

：

topRow［k］〈<= shift1D;?

HEVC学习（十一）—-帧内预测系列之七

xPredIntraAng函数——Void TComPrediction:

xPredIntraAng

进行Intra_DC、Intra_Angular（有角度的）模式预测

Int blkSize = width; //！

< 当前PU的宽度

Pel* pDst = rpDst； //!

< 指向预测样点区域首地址

Bool modeDC = dirMode < 2——DC模式为1，若是DC模式则modeDC为真

Bool modeHor= !

modeDC && （dirMode < 18）——modeDC为假且dirMode<18，则为水平模式

Bool modeVer = !

modeDC ＆& !

modeHor——垂直模式为真

Int intraPredAngle——角度偏移值

PS：

未看完

帧内预测过程:

1.判断当前TU相邻参考像素的可用性，并进行相应的处理

2.对参考像素进行三抽头滤波

3.根据滤波后的参考像素计算当前TU的预测像素值

HEVC学习（十）——与变换有关的几个主要函数及重要变量

在xCompressCU函数中，有这么几个函数值得我们注意的，xCheckRDCostInter、xCheckRDCostMerge2Nx2N、xCheckRDCostIntra.它们分别是实现帧间预测模式、Merge模式、帧内预测式的主函数。

前两个函数的子函数xEstimateResidualQT（实际上通过调用函数encodeResAndCalcRdInterCU）、第三个函数的子函数xRecurIntraCodingQT（实际上通过调用xIntraCodingLumaBlk、xIntraCodingChromaBlk）均会调用函数transformNxN。

函数transformNxN这个函数主要调用了xTransformSkip、xT、xQuant三个函数，分别实现对残差进行TS（TransformSkip）模式、普通变换模式以及量化的功能。

对于第二个函数xT来说,它调用了xTrNxN。

xTrNxN函数对帧内预测模式的4x4块进行DST变换,其余的根据块大小分别做蝶形快速变换（4x4，8x8，16x16，32x32）

HEVC学习（十二）—-CU的最终划分

CU是递归划分的，导致在寻找确定最佳分割位置时比较困难。

参考encodeCU这个函数的实现，因为它是最终将信息编码成码流的函数.该函数调用的是xEncodeCU来完成实际工作，其中调用了Void TEncEntropy：

encodeSplitFlag函数（用于编码CU分割信息的函数）——其中又调用了codeSplitFlag（ pcCU, uiAbsPartIdx， uiDepth ）函数——其中有代码UInt uiCurrSplitFlag = （ pcCU—〉getDepth（ uiAbsPartIdx ）〉 uiDepth ） ?

1 :

0；

通过判断pcCU-〉getDepth（uiAbsPartIdx）是否大于uiDepth来确定当前CU是否还要继续分割，后者我们知道，是当前CU的深度，那么前者呢？

自然就是在xCompressCU中确定下来的当前CU的最佳分割模式。

对compressCU的参数pcCU进行类似语句:

pcCU->getDepth（uiAbsPartIdx），即可获得Zorder为uiAbsPartIdx的4x4块的深度，如果把整个CU每个4x4块的深度确定下来，那么它的划分自然也就确定下来了.

HEVC中SAO—-自适应样点补偿详细分析解读

SAO原理:

SAO是在DB之后进行,输入是重建帧和原始帧数据，输出是SAO数据和SAO后的重建帧。

自适应样点补偿是一个自适应选择过程,在去块滤波后进行。

下面是整个HEVC的编码框图,可以看到SAO是在整个帧编码完成后得到重建帧后进行的，属于Slice级别（帧级）。

首先把Frame划分为若干LCU，然后对每个LCU中每个像素进行SAO操作。

将根据其LCU像素特征选择一种像素补偿方式,以减少源图像与重构图像之间的失真。

自适应样点补偿方式分为带状补偿（BandOffset,BO）和边缘补偿（EdgeOffset，EO）两大类。

带状补偿将像素值强度等级划分为若干个条带，每个条带内的像素拥有相同的补偿值。

进行补偿时根据重构像素点所处的条带,选择相应的带状补偿值进行补偿。

边缘补偿主要用于对图像的轮廓进行补偿.它将当前像素点值与相邻的2个像素值进行对比，用于比较的2个相邻像素可以在下图中所示的4种模板中选择，从而得到该像素点的类型.解码端根据码流中标示的像素点的类型信息进行相应的补偿校正。

SAO--自适应样点补偿意义何在：

SAO意义:

大量模拟测试和资料显示,SAO平均可以节约2％到6%的码率，而编解码的复杂度只增加2%左右!

SAO主要目的和操作原理减少源图像与重构图像之间的失真。

如果只看这点，实际上每帧编码后的码率反而会增加，因为多了SAO的相关语法和语义以及补偿值的编码!

其实不然，虽然当前帧的码率增加了几个字节或者几个bit,但是这点增加码字使得源图像与重构图像的失真减少，使接下来的预测残差更小了，从而大大的降低码率了！

HEVC学习（十三）～（十六）—-SAO函数解析之一~四

HEVC学习（十七）～（十九）—-NALunit的解码过程之一

HEVC学习（二十）——熵编码之一

VoidTAppEncTop：

encode（）{初始化%//mainencoderloop%//allocateoriginalYUVbuffer%//callencodingfunctionforoneframe}-—

调用VoidTEncTop：

encode（初始化、计算图像特征数据）//computeimagecharacteristics//compressfield0//compressGOP——

//callencodingfunctionforoneframe

调用VoidTEncGOP：

：

compressGOP——

//writebistreamtofileifnecessary

//deletebuffer

HM15。

0结构

TAppCommon和TlibCommon中的函数是编解码公用的应用函数和库函数

'VideoIO'工程主要是实现对YUV文件的读写操作。

从TappEncoder中的encmain。

cpp中的main函数开始编码，调用TlibEncoder项目中的函数,最后输出编码所用时间。

从TappDecoder中的decmain.cpp中的main函数开始解码，调用TlibDecoder项目中的函数，最后输出解码所用时间。

这个是H264到H265的转码，我做的是一进二出。

。

你先看看结构吧

展开阅读全文