CN111107359A - 一种适用于hevc标准的帧内预测编码单元划分方法 - Google Patents
一种适用于hevc标准的帧内预测编码单元划分方法 Download PDFInfo
- Publication number
- CN111107359A CN111107359A CN201911294238.9A CN201911294238A CN111107359A CN 111107359 A CN111107359 A CN 111107359A CN 201911294238 A CN201911294238 A CN 201911294238A CN 111107359 A CN111107359 A CN 111107359A
- Authority
- CN
- China
- Prior art keywords
- coding
- intra
- division
- svm
- frame prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 230000008569 process Effects 0.000 claims abstract description 33
- 238000012549 training Methods 0.000 claims abstract description 15
- 238000000638 solvent extraction Methods 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 3
- 238000005192 partition Methods 0.000 description 8
- 238000002474 experimental method Methods 0.000 description 7
- 238000012360 testing method Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
- H04N19/122—Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/147—Data rate or code amount at the encoder output according to rate distortion criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/96—Tree coding, e.g. quad-tree coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明公开了一种适用于HEVC标准的帧内预测编码单元划分方法,该方法的步骤为:从数据库中提取编码单元的训练样本;根据编码深度及训练样本训练出RBF‑SVM和Linear‑SVM决策模型;将训练后的决策模型移植到原始HM参考模型中;对于编码深度为0的帧内预测过程,运用RBF‑SVM进行划分决策;在编码深度为1的编码单元首先运用RBF‑SVM进行划分决策;在编码深度为2的编码单元采用级联SVM进行划分决策;在编码深度为3的编码单元执行原始帧内预测过程;结束当前编码树单元的帧内编码过程,遍历下一个编码树单元,输出帧内预测编码单元划分结果。本发明针对CU提前划分方式进行优化,提前判断划分,从而提高了编码速度,通过不同的纹理特征得到更好的预测效果。
Description
技术领域
本发明涉及视频编解码技术领域,具体涉及一种适用于HEVC标准的帧内预测编码单元划分方法。
背景技术
在HEVC编码过程中,首先对当前帧划分为若干个最大编码块(LCU),然后对每一个LCU采用四叉树划分方式划分得到尺寸跟小编码单元CU,最后根据不同划分方式产生的率失真代价(RD-Cost)比较选择最佳划分方式。其中,CU大小一共有四种,即8×8、16×16、32×32和64×64,帧内预测编码块划分过程,RD-Cost比较是从最小块进行回溯比较,选择RD-Cost最小的作为最佳划分方式。CU划分过程需要全遍历计算每种划分代价信息,这样的划分方式运算量非常大,对产生90%以上流量的移动端,因其计算能力受限且性能层次不齐,无法使用原始HEVC编码器实现实时编码。因此,如何在保证视频质量基本不变的情况下降低编码复杂度,快速高效地编码,是亟待解决的问题。
现有方法中有提出基于相邻CU划分关系来预测当前CU划分,这种方法通过统计相邻CU率失真大小与是否划分的数据,设定阈值作为CU是否需要划分的判定标准,从而提前终止划分,减少因划分计算带来的损耗代价。设定阈值的方式在没有统计相当大量数据下,阈值误判会很高,而且单个特征阈值也会增加误判可能性,这种方法作为判断当前CU划分的适用性不强。
发明内容
为了克服现有技术存在的缺陷与不足,克服现有技术单一特征值设定阈值判定当前CU是否划分带来的缺陷,本发明提供一种适用于HEVC标准的帧内预测编码单元划分方法,通过统计当前CU的纹理同质性梯度复杂度以及与子CU的同质性梯度复杂度差值,根据向量机SVM决策模型提前判断LCU划分方式,针对CU提前划分方式进行优化,提前判断划分,从而大大地提高了编码速度,缩减编码时间。
为了达到上述目的,本发明采用以下技术方案:
本发明提供一种适用于HEVC标准的帧内预测编码单元划分方法,包括下述步骤:
从CPIH数据库中提取编码单元的训练样本;
根据编码深度及所述训练样本训练出RBF-SVM和Linear-SVM决策模型;
将训练后的决策模型移植到原始HM参考模型中;
对于编码深度为0的帧内预测过程,运用RBF-SVM进行划分决策,若决策函数判断为终止划分,则进行帧内预测过程;若判断为提前划分,则跳过帧内预测过程,直接划分至编码深度为1的编码单元;
在编码深度为1的编码单元首先运用RBF-SVM进行划分决策,若决策函数判断为终止划分,则进行帧内预测过程,不再向下划分;若不确定是否划分,则运用Linear-SVM在再决策;若判断为提前划分,则跳过帧内预测过程,直接划分至编码深度为2的编码单元;
在编码深度为2的编码单元采用级联SVM进行划分决策,若不确定划分与否,则运用原始HM参考模型进行帧内编码;
在编码深度为3的编码单元执行原始帧内预测过程;
结束当前编码树单元的帧内编码过程,遍历下一个编码树单元,输出帧内预测编码单元划分结果。
本发明与现有技术相比,具有如下优点和有益效果:
(1)本发明在CU划分决策中使用数据库进行线下训练,提高训练决策模型判断准确度,也增加了方案的可适用性。
(2)本发明定义了新的纹理复杂度和梯度复杂度方式,通过不同的纹理特征得到更好的预测效果。
(3)本发明针对CU提前划分方式进行优化,提前判断划分,从而大大地提高了编码速度,缩减编码时间,且视频质量基本不变。
附图说明
图1为本实施例的级联SVM结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施例
HEVC标准中,帧内预测编码单元需要判定是否需要划分的一共有3种大小,分别是16×16、32×32和64×64,如图1所示,本实施例提供一种适用于HEVC标准的帧内预测编码单元划分方法,通过引入机器学习中的SVM,根据学习机制,结合训练特征,提前判断当前CU是否需要划分,从而大大加速CU划分过程,具体步骤如下:
(1)从CPIH数据库中提取编码单元的训练样本;
(2)根据编码深度及对应的训练样本训练出RBF-SVM和Linear-SVM决策模型;
(3)将训练后的决策模型移植到原始HM16.0参考模型当中;
(4)对于编码深度为0的帧内预测过程,运用RBF-SVM进行划分决策,若决策函数判断为终止划分,则进行帧内预测过程,不再向下划分,跳过步骤(5)、(6)、(7);若为提前划分,则跳过帧内预测过程,直接划分至编码深度为1的四个子单元,执行步骤(5);
(5)在编码深度为1层的编码单元首先运用RBF-SVM进行划分决策,若终止划分,则进行帧内预测过程,不再向下划分,跳过步骤(6)、(7),若不确定划分与否,则运用Linear-SVM在再决策,若提前划分,则跳过帧内预测过程,直接划分至编码深度为2的四个子单元,执行步骤(6),若不确定划分与否,则运用原始HM模型进行帧内编码;
(6)编码深度为2的操作与上一层相同,用级联SVM进行划分决策;
(7)编码深度为3的编码单元执行原始帧内预测过程;
(8)结束当前编码树单元的帧内编码过程,遍历下一个编码树单元。
在本实施例中,HEVC标准的最大编码单元(LCU)大小在HM16.9参考模型中为64×64。
为了评估本实施例的性能,本实施例在实验过程中需保持一致的配置环境,并给出了衡量方法的性能指标,进行实验对比并分析结果:
1.实验环境
硬件配置:CPU:Intel(R)Core(TM)i5-3470 CPU;主频:3.2GHz;运行内存:4.00GB;
软件配置:Windows 7旗舰版64位操作系统;开发工具:Visual Studio 2013;测试模型:HM16.9;编译版本:vc2013;
测试序列:JCTVC-1100文档文档给出了一套共用的HEVC编码的视频测试序列,研究者可以用测试序列以及测试模型里的配置文件做相应的实验,以验证编码性能。为测试不同背景下预测方法的性能,本实施例选Class A~Class E共14个不同序列,对序列前20帧进行实验编码;
配置文件:本实施例在测试模型HM16.9上作实验,编码采用全帧内预测(AI)的Main Profile标准配置文件。为验证不同QP下,实验的有效性,QP分别设置为22、27、32和37对视频作实验,其他参数配置选择默认配置;
2.评价指标
客观视频编码性能指标主要依据是峰值信噪比(PSNR)、编码码率(BR)和编码时间这三个量来衡量。本实施例采用ΔTime、BD-BR、BD-PSNR三个指标来衡量快速预测方法性能:
(1)ΔTime表示本实施例提出的快速帧内预测方法编码时间缩减百分比,由式(1)计算可得:
式中,量化参数QPi表示分别为22、27、32、37不同取值,TimeHM表示HM16.9原始编码时间,Timeproposed表示提出的方法在HM16.9参考软件下编码时间。
(2)BD-BR和BD-PSNR分别表示同客观质量下码率节省百分比和同码率下PSNR-Y比特差异,值越接近于0,则客观效果越好;
实验结果如表1所示:
表1帧内预测模式选择快速预测方法实验结果
由此可知,本实施例所提出的帧内预测方法与参考软件HM16.9相比,编码时间减少了42.5%,而BD-BR仅上升了0.30%,BD-PSNR仅降低了0.02%,本实施例根据CU大小选择不同的帧内预测方法,所以对不同复杂度视频以及不同分辨率的视频,节省时间都差不多,BD-BR上升也差不多,可以认为该方法下编码器能很好地适应不同纹理特征视频。本实施例不仅大大降低了HEVC编码器的计算复杂度,同时保证了视频编码的质量。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (1)
1.一种适用于HEVC标准的帧内预测编码单元划分方法,其特征在于,包括下述步骤:
从CPIH数据库中提取编码单元的训练样本;
根据编码深度及所述训练样本训练出RBF-SVM和Linear-SVM决策模型;
将训练后的决策模型移植到原始HM参考模型中;
对于编码深度为0的帧内预测过程,运用RBF-SVM进行划分决策,若决策函数判断为终止划分,则进行帧内预测过程;若判断为提前划分,则跳过帧内预测过程,直接划分至编码深度为1的编码单元;
在编码深度为1的编码单元首先运用RBF-SVM进行划分决策,若决策函数判断为终止划分,则进行帧内预测过程,不再向下划分;若不确定是否划分,则运用Linear-SVM在再决策;若判断为提前划分,则跳过帧内预测过程,直接划分至编码深度为2的编码单元;
在编码深度为2的编码单元采用级联SVM进行划分决策,若不确定划分与否,则运用原始HM参考模型进行帧内编码;
在编码深度为3的编码单元执行原始帧内预测过程;
结束当前编码树单元的帧内编码过程,遍历下一个编码树单元,输出帧内预测编码单元划分结果。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201911294238.9A CN111107359A (zh) | 2019-12-16 | 2019-12-16 | 一种适用于hevc标准的帧内预测编码单元划分方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201911294238.9A CN111107359A (zh) | 2019-12-16 | 2019-12-16 | 一种适用于hevc标准的帧内预测编码单元划分方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN111107359A true CN111107359A (zh) | 2020-05-05 |
Family
ID=70423453
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201911294238.9A Pending CN111107359A (zh) | 2019-12-16 | 2019-12-16 | 一种适用于hevc标准的帧内预测编码单元划分方法 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN111107359A (zh) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN111654698A (zh) * | 2020-06-12 | 2020-09-11 | 郑州轻工业大学 | 一种针对h.266/vvc的快速cu分区决策方法 |
| CN114584771A (zh) * | 2022-05-06 | 2022-06-03 | 宁波康达凯能医疗科技有限公司 | 一种基于内容自适应的帧内图像编码单元划分方法与系统 |
Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN103517069A (zh) * | 2013-09-25 | 2014-01-15 | 北京航空航天大学 | 一种基于纹理分析的hevc帧内预测快速模式选择方法 |
| US20160301931A1 (en) * | 2015-04-07 | 2016-10-13 | Jiangtao Wen | Pre-encoding for high efficiency video coding |
| CN106713935A (zh) * | 2017-01-09 | 2017-05-24 | 杭州电子科技大学 | 一种基于贝叶斯决策的hevc块划分快速方法 |
| CN107071418A (zh) * | 2017-05-05 | 2017-08-18 | 上海应用技术大学 | 一种基于决策树的hevc帧内编码单元快速划分方法 |
| CN107483931A (zh) * | 2017-08-01 | 2017-12-15 | 南京邮电大学 | 一种基于显著度的hevc帧内编码深度划分快速决策方法 |
| CN109286816A (zh) * | 2018-09-12 | 2019-01-29 | 天津大学 | 一种hevc优化帧内预测分块的方法 |
-
2019
- 2019-12-16 CN CN201911294238.9A patent/CN111107359A/zh active Pending
Patent Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN103517069A (zh) * | 2013-09-25 | 2014-01-15 | 北京航空航天大学 | 一种基于纹理分析的hevc帧内预测快速模式选择方法 |
| US20160301931A1 (en) * | 2015-04-07 | 2016-10-13 | Jiangtao Wen | Pre-encoding for high efficiency video coding |
| CN106713935A (zh) * | 2017-01-09 | 2017-05-24 | 杭州电子科技大学 | 一种基于贝叶斯决策的hevc块划分快速方法 |
| CN107071418A (zh) * | 2017-05-05 | 2017-08-18 | 上海应用技术大学 | 一种基于决策树的hevc帧内编码单元快速划分方法 |
| CN107483931A (zh) * | 2017-08-01 | 2017-12-15 | 南京邮电大学 | 一种基于显著度的hevc帧内编码深度划分快速决策方法 |
| CN109286816A (zh) * | 2018-09-12 | 2019-01-29 | 天津大学 | 一种hevc优化帧内预测分块的方法 |
Non-Patent Citations (1)
| Title |
|---|
| 易清明等: "一种HEVC帧内编码快速决策组合算法", 《小型微型计算机系统》 * |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN111654698A (zh) * | 2020-06-12 | 2020-09-11 | 郑州轻工业大学 | 一种针对h.266/vvc的快速cu分区决策方法 |
| CN111654698B (zh) * | 2020-06-12 | 2022-03-22 | 郑州轻工业大学 | 一种针对h.266/vvc的快速cu分区决策方法 |
| CN114584771A (zh) * | 2022-05-06 | 2022-06-03 | 宁波康达凯能医疗科技有限公司 | 一种基于内容自适应的帧内图像编码单元划分方法与系统 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN105430407B (zh) | 应用于h.264到hevc转码的快速帧间模式决策方法 | |
| JP2015164358A (ja) | ビデオ復号化方法及び装置 | |
| CN104320658B (zh) | 一种hevc快速编码方法 | |
| CN111953966B (zh) | 一种编码测试的方法、装置、服务器和存储介质 | |
| CN115190300B (zh) | 属性信息的预测方法、编码器、解码器、及存储介质 | |
| CN108174208B (zh) | 一种基于特征分类的高效视频编码方法 | |
| CN102917225A (zh) | Hevc帧内编码单元快速选择方法 | |
| CN105791826A (zh) | 一种基于数据挖掘的hevc帧间快速模式选择方法 | |
| US20230319294A1 (en) | Point cloud encoding and decoding methods, encoder, decoder, and computer storage medium | |
| Mu et al. | Fast coding unit depth decision for HEVC | |
| CN107318016A (zh) | 一种基于零块分布的hevc帧间预测模式快速判定方法 | |
| CN105430391A (zh) | 基于逻辑回规分类器的帧内编码单元快速选择方法 | |
| CN110139106B (zh) | 一种视频编码单元分割方法及其系统、装置、存储介质 | |
| CN111107359A (zh) | 一种适用于hevc标准的帧内预测编码单元划分方法 | |
| Menon et al. | All-intra rate control using low complexity video features for versatile video coding | |
| CN106791828A (zh) | 基于机器学习的高性能视频转码方法及其转码器 | |
| CN113747177A (zh) | 基于历史信息的帧内编码速度优化方法、装置及介质 | |
| CN114666592B (zh) | 基于avs3编码历史信息的cu块划分方法、装置及介质 | |
| CN116095320A (zh) | 量化参数调整方法、装置、设备及存储介质 | |
| CN108063945B (zh) | 一种基于元素类别的线性码率估计方法 | |
| CN110418131A (zh) | 一种码率预估方法及基于码率预估快速模式决策方法 | |
| CN107820084B (zh) | 一种视频感知编码方法及装置 | |
| CN117294861B (zh) | 一种基于帧间预测的编码块划分方法及编码器 | |
| CN109361923B (zh) | 一种基于运动分析的滑动时间窗场景切换检测方法和系统 | |
| CN105812803B (zh) | 一种针对变换单元tu的残差舍弃方法及装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200505 |
|
| WD01 | Invention patent application deemed withdrawn after publication |