CN111107359A

CN111107359A - 一种适用于hevc标准的帧内预测编码单元划分方法

Info

Publication number: CN111107359A
Application number: CN201911294238.9A
Authority: CN
Inventors: 石敏; 席诗华; 易清明
Original assignee: Jinan University
Current assignee: Jinan University
Priority date: 2019-12-16
Filing date: 2019-12-16
Publication date: 2020-05-05

Abstract

本发明公开了一种适用于HEVC标准的帧内预测编码单元划分方法，该方法的步骤为：从数据库中提取编码单元的训练样本；根据编码深度及训练样本训练出RBF‑SVM和Linear‑SVM决策模型；将训练后的决策模型移植到原始HM参考模型中；对于编码深度为0的帧内预测过程，运用RBF‑SVM进行划分决策；在编码深度为1的编码单元首先运用RBF‑SVM进行划分决策；在编码深度为2的编码单元采用级联SVM进行划分决策；在编码深度为3的编码单元执行原始帧内预测过程；结束当前编码树单元的帧内编码过程，遍历下一个编码树单元，输出帧内预测编码单元划分结果。本发明针对CU提前划分方式进行优化，提前判断划分，从而提高了编码速度，通过不同的纹理特征得到更好的预测效果。

Description

一种适用于HEVC标准的帧内预测编码单元划分方法

技术领域

本发明涉及视频编解码技术领域，具体涉及一种适用于HEVC标准的帧内预测编码单元划分方法。

背景技术

在HEVC编码过程中，首先对当前帧划分为若干个最大编码块(LCU)，然后对每一个LCU采用四叉树划分方式划分得到尺寸跟小编码单元CU，最后根据不同划分方式产生的率失真代价(RD-Cost)比较选择最佳划分方式。其中，CU大小一共有四种，即8×8、16×16、32×32和64×64，帧内预测编码块划分过程，RD-Cost比较是从最小块进行回溯比较，选择RD-Cost最小的作为最佳划分方式。CU划分过程需要全遍历计算每种划分代价信息，这样的划分方式运算量非常大，对产生90％以上流量的移动端，因其计算能力受限且性能层次不齐，无法使用原始HEVC编码器实现实时编码。因此，如何在保证视频质量基本不变的情况下降低编码复杂度，快速高效地编码，是亟待解决的问题。

现有方法中有提出基于相邻CU划分关系来预测当前CU划分，这种方法通过统计相邻CU率失真大小与是否划分的数据，设定阈值作为CU是否需要划分的判定标准，从而提前终止划分，减少因划分计算带来的损耗代价。设定阈值的方式在没有统计相当大量数据下，阈值误判会很高，而且单个特征阈值也会增加误判可能性，这种方法作为判断当前CU划分的适用性不强。

发明内容

为了克服现有技术存在的缺陷与不足，克服现有技术单一特征值设定阈值判定当前CU是否划分带来的缺陷，本发明提供一种适用于HEVC标准的帧内预测编码单元划分方法，通过统计当前CU的纹理同质性梯度复杂度以及与子CU的同质性梯度复杂度差值，根据向量机SVM决策模型提前判断LCU划分方式，针对CU提前划分方式进行优化，提前判断划分，从而大大地提高了编码速度，缩减编码时间。

为了达到上述目的，本发明采用以下技术方案：

本发明提供一种适用于HEVC标准的帧内预测编码单元划分方法，包括下述步骤：

从CPIH数据库中提取编码单元的训练样本；

根据编码深度及所述训练样本训练出RBF-SVM和Linear-SVM决策模型；

将训练后的决策模型移植到原始HM参考模型中；

对于编码深度为0的帧内预测过程，运用RBF-SVM进行划分决策，若决策函数判断为终止划分，则进行帧内预测过程；若判断为提前划分，则跳过帧内预测过程，直接划分至编码深度为1的编码单元；

在编码深度为1的编码单元首先运用RBF-SVM进行划分决策，若决策函数判断为终止划分，则进行帧内预测过程，不再向下划分；若不确定是否划分，则运用Linear-SVM在再决策；若判断为提前划分，则跳过帧内预测过程，直接划分至编码深度为2的编码单元；

在编码深度为2的编码单元采用级联SVM进行划分决策，若不确定划分与否，则运用原始HM参考模型进行帧内编码；

在编码深度为3的编码单元执行原始帧内预测过程；

结束当前编码树单元的帧内编码过程，遍历下一个编码树单元，输出帧内预测编码单元划分结果。

本发明与现有技术相比，具有如下优点和有益效果：

(1)本发明在CU划分决策中使用数据库进行线下训练，提高训练决策模型判断准确度，也增加了方案的可适用性。

(2)本发明定义了新的纹理复杂度和梯度复杂度方式，通过不同的纹理特征得到更好的预测效果。

(3)本发明针对CU提前划分方式进行优化，提前判断划分，从而大大地提高了编码速度，缩减编码时间，且视频质量基本不变。

附图说明

图1为本实施例的级联SVM结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

实施例

HEVC标准中，帧内预测编码单元需要判定是否需要划分的一共有3种大小，分别是16×16、32×32和64×64，如图1所示，本实施例提供一种适用于HEVC标准的帧内预测编码单元划分方法，通过引入机器学习中的SVM，根据学习机制，结合训练特征，提前判断当前CU是否需要划分，从而大大加速CU划分过程，具体步骤如下：

(1)从CPIH数据库中提取编码单元的训练样本；

(2)根据编码深度及对应的训练样本训练出RBF-SVM和Linear-SVM决策模型；

(3)将训练后的决策模型移植到原始HM16.0参考模型当中；

(4)对于编码深度为0的帧内预测过程，运用RBF-SVM进行划分决策，若决策函数判断为终止划分，则进行帧内预测过程，不再向下划分，跳过步骤(5)、(6)、(7)；若为提前划分，则跳过帧内预测过程，直接划分至编码深度为1的四个子单元，执行步骤(5)；

(5)在编码深度为1层的编码单元首先运用RBF-SVM进行划分决策，若终止划分，则进行帧内预测过程，不再向下划分，跳过步骤(6)、(7)，若不确定划分与否，则运用Linear-SVM在再决策，若提前划分，则跳过帧内预测过程，直接划分至编码深度为2的四个子单元，执行步骤(6)，若不确定划分与否，则运用原始HM模型进行帧内编码；

(6)编码深度为2的操作与上一层相同，用级联SVM进行划分决策；

(7)编码深度为3的编码单元执行原始帧内预测过程；

(8)结束当前编码树单元的帧内编码过程，遍历下一个编码树单元。

在本实施例中，HEVC标准的最大编码单元(LCU)大小在HM16.9参考模型中为64×64。

为了评估本实施例的性能，本实施例在实验过程中需保持一致的配置环境，并给出了衡量方法的性能指标，进行实验对比并分析结果：

1.实验环境

硬件配置：CPU：Intel(R)Core(TM)i5-3470 CPU；主频：3.2GHz；运行内存：4.00GB；

软件配置：Windows 7旗舰版64位操作系统；开发工具：Visual Studio 2013；测试模型：HM16.9；编译版本：vc2013；

测试序列：JCTVC-1100文档文档给出了一套共用的HEVC编码的视频测试序列，研究者可以用测试序列以及测试模型里的配置文件做相应的实验，以验证编码性能。为测试不同背景下预测方法的性能，本实施例选Class A～Class E共14个不同序列，对序列前20帧进行实验编码；

配置文件：本实施例在测试模型HM16.9上作实验，编码采用全帧内预测(AI)的Main Profile标准配置文件。为验证不同QP下，实验的有效性，QP分别设置为22、27、32和37对视频作实验，其他参数配置选择默认配置；

2.评价指标

客观视频编码性能指标主要依据是峰值信噪比(PSNR)、编码码率(BR)和编码时间这三个量来衡量。本实施例采用ΔTime、BD-BR、BD-PSNR三个指标来衡量快速预测方法性能：

(1)ΔTime表示本实施例提出的快速帧内预测方法编码时间缩减百分比，由式(1)计算可得：

式中，量化参数QP_i表示分别为22、27、32、37不同取值，Time_HM表示HM16.9原始编码时间，Time_proposed表示提出的方法在HM16.9参考软件下编码时间。

(2)BD-BR和BD-PSNR分别表示同客观质量下码率节省百分比和同码率下PSNR-Y比特差异，值越接近于0，则客观效果越好；

实验结果如表1所示：

表1帧内预测模式选择快速预测方法实验结果

由此可知，本实施例所提出的帧内预测方法与参考软件HM16.9相比，编码时间减少了42.5％，而BD-BR仅上升了0.30％，BD-PSNR仅降低了0.02％，本实施例根据CU大小选择不同的帧内预测方法，所以对不同复杂度视频以及不同分辨率的视频，节省时间都差不多，BD-BR上升也差不多，可以认为该方法下编码器能很好地适应不同纹理特征视频。本实施例不仅大大降低了HEVC编码器的计算复杂度，同时保证了视频编码的质量。

上述实施例为本发明较佳的实施方式，但本发明的实施方式并不受上述实施例的限制，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

Claims

1.一种适用于HEVC标准的帧内预测编码单元划分方法，其特征在于，包括下述步骤：

从CPIH数据库中提取编码单元的训练样本；

将训练后的决策模型移植到原始HM参考模型中；

在编码深度为3的编码单元执行原始帧内预测过程；