CN116886903A - 跳过hevc帧内编码的编码方法、装置及计算机设备 - Google Patents
跳过hevc帧内编码的编码方法、装置及计算机设备 Download PDFInfo
- Publication number
- CN116886903A CN116886903A CN202311003755.2A CN202311003755A CN116886903A CN 116886903 A CN116886903 A CN 116886903A CN 202311003755 A CN202311003755 A CN 202311003755A CN 116886903 A CN116886903 A CN 116886903A
- Authority
- CN
- China
- Prior art keywords
- coding
- threshold
- tree unit
- coding tree
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 83
- 230000003068 static effect Effects 0.000 claims abstract description 18
- 238000013139 quantization Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 8
- 238000005516 engineering process Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 101000712600 Homo sapiens Thyroid hormone receptor beta Proteins 0.000 description 1
- 101150049692 THR4 gene Proteins 0.000 description 1
- 102100033451 Thyroid hormone receptor beta Human genes 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/109—Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/14—Coding unit complexity, e.g. amount of activity or edge presence estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/147—Data rate or code amount at the encoder output according to rate distortion criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/96—Tree coding, e.g. quad-tree coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明公开一种跳过HEVC帧内编码的编码方法、装置及计算机设备,所述方法包括:获取编码树单元的纹理复杂度和运动静止特征;根据率失真代价RDO最小原则确定帧间预测模式并获取在所述帧间预测模式下所述编码树单元的帧间编码信息;根据所述编码树单元的纹理复杂度和运动静止特征设置特征阈值;若所述当前编码树单元在所述帧间预测模式下的RDO代价值小于所述特征阈值,跳过对所述当前编码单元的帧内编码过程。采用本发明,综合考虑纹理复杂度、运动静止特征和帧间编码信息,选择性地跳过帧内预测编码过程,降低编码复杂度。
Description
技术领域
本发明涉及视频编码技术领域,尤其涉及一种跳过HEVC帧内编码的编码方法、装置及计算机设备。
背景技术
H.265/HEVC作为新一代视频编码标准,相比上一代视频编码标准H.264/AVC在压缩效率上提升了一倍,但与此同时编码复杂度也大大增加。这主要是由于HEVC中引入了一些新的技术,比如大尺寸的四叉树分割、更高的预测精度、35种帧内预测模式以及RDO技术和SAO技术等。其中RDO过程需要计算每一种编码尺寸和预测单元的编码代价,从中选择代价最小的作为最佳尺寸和预测模式,因此,RDO过程是编码器编码过程中计算量最大的部分。
但是,由于HEVC中引入的新技术导致编码的复杂度极高,这对于视频会议等实时应用场景来说,极高的编码复杂度导致HEVC无法应用于大部分设备中。
发明内容
本发明实施例提供一种跳过HEVC帧内编码的编码方法、装置及计算机设备,综合考虑纹理复杂度、运动静止特征和帧间编码信息,选择性地跳过帧内预测编码过程,降低编码复杂度。
为实现上述目的,本申请实施例的第一方面提供一种跳过HEVC帧内编码的编码方法,包括:
获取编码树单元的纹理复杂度和运动静止特征;
根据率失真代价RDO最小原则确定帧间预测模式并获取在所述帧间预测模式下所述编码树单元的帧间编码信息;所述帧间编码信息包括所述编码树单元在所述帧间预测模式下的RDO代价值、当前编码树单元的4个编码子块的RDO代价值之和、所述当前编码单元的4个编码子块的预测模式信息和所述当前编码单元的量化系数信息;
根据所述编码树单元的纹理复杂度和运动静止特征设置特征阈值;
若所述当前编码树单元在所述帧间预测模式下的RDO代价值小于所述特征阈值,跳过对所述当前编码单元的帧内编码过程。
在第一方面的一种可能的实现方式中,还包括:
若所述当前编码单元的4个编码子块的RDO代价值之和大于所述当前编码树单元在所述帧间预测模式下的RDO代价值,
或者,所述当前编码单元的4个编码子块的预测模式都不是帧内预测模式,
或者,所述当前编码单元为全零块,
跳过对所述当前编码单元的帧内编码过程。
在第一方面的一种可能的实现方式中,所述根据所述编码树单元的纹理复杂度和运动静止特征设置特征阈值,具体包括:
若所述编码树单元为纹理平坦块或纹理绝对简单块,并且所述当前编码树单元为静止块,将纹理复杂度第一阈值设置为特征阈值;
若所述编码树单元为纹理平坦块或纹理绝对简单块,并且所述当前编码树单元不为静止块,将纹理复杂度第二阈值设置为特征阈值;
若所述编码树单元为纹理普通块,并且所述当前编码树单元为静止块,将纹理复杂度第三阈值设置为特征阈值;
若所述编码树单元为纹理普通块,并且所述当前编码树单元不为静止块,将差值图阈值设置为特征阈值。
其他情况下,将运动静止判断阈值设置为特征阈值。
在第一方面的一种可能的实现方式中,所述获取编码树单元的纹理复杂度和运动静止特征,具体包括:
采用Roberts梯度算子来获取编码树单元的纹理复杂度;
采用帧差法和OTSU方法来获取所述编码树单元的运动静止特征。
第一方面的一种可能的实现方式中,所述采用Roberts梯度算子来获取编码树单元的纹理复杂度,具体包括:
采用Roberts梯度算子计算编码树单元的平均梯度值;
若所述平均梯度值为零,判断编码树单元为绝对纹理平坦块;
若所述平均梯度值大于零且所述平均梯度值小于或等纹理复杂度第一阈值,判断编码树单元为纹理平坦块;
若所述平均梯度值大于纹理复杂度第一阈值且所述平均梯度值小于或等于纹理复杂度第二阈值,判断编码树单元为纹理普通块;
若所述平均梯度值大于纹理复杂度第二阈值且所述平均梯度值小于或等于纹理复杂度第三阈值,判断编码树单元为纹理复杂块;
若所述平均梯度值大于纹理复杂度第三阈值,判断编码树单元为绝对纹理复杂度块。
第一方面的一种可能的实现方式中,所述采用帧差法和OTSU方法来获取所述编码树单元的运动静止特征,具体包括:
计算当前帧1/4下采样图像与前一帧1/4下采样图像中每个像素点的差值,并根据所述差值计算绝对值得到差值图;
采用OTSU方法计算所述差值图阈值;
根据所述差值图阈值对所述差值图进行阈值化得到运动图像;
根据运动图像,统计所述编码树单元的下采样块中的运动像素点个数;
根据所述运动像素点个数和运动静止判断阈值,判断所述编码树单元的运动静止特征。
第一方面的一种可能的实现方式中,所述根据所述差值图阈值对所述差值图进行阈值化,具体包括:
将像素值大于或等于所述差值图阈值的像素点设置为运动像素点;
将像素值小于所述差值图阈值的像素点设置为非运动像素点;
分别统一全部运动像素点的像素值和全部非运动像素点的像素值。
第一方面的一种可能的实现方式中,所述根据所述运动像素点个数和运动静止判断阈值,判断所述编码树单元的运动静止特征,具体包括:
若所述运动像素点个数小于或等于运动静止判断阈值,判断所述编码树单元为静止块;
若所述运动像素点个数大于运动静止判断阈值并且所述运动像素点个数小于或等于两倍的运动静止判断阈值,判断所述编码树单元为运动平缓块;
若所述运动像素点个数大于两倍的运动静止判断阈值,判断所述编码树单元为运动剧烈块。
本申请实施例的第二方面提供一种跳过HEVC帧内编码的编码装置,包括:
特征获取模块,用于获取编码树单元的纹理复杂度和运动静止特征;
代价获取模块,用于根据率失真代价RDO最小原则确定帧间预测模式并获取在所述帧间预测模式下所述编码树单元的帧间编码信息;所述帧间编码信息包括所述编码树单元在所述帧间预测模式下的RDO代价值、当前编码树单元的4个编码子块的RDO代价值之和、所述当前编码单元的4个编码子块的预测模式信息和所述当前编码单元的量化系数信息;
设置模块,用于根据所述编码树单元的纹理复杂度和运动静止特征设置特征阈值;
判断模块,用于若所述当前编码树单元在所述帧间预测模式下的RDO代价值小于所述特征阈值,跳过对所述当前编码单元的帧内编码过程。
本申请实施例的第二方面提供一种计算机设备,包括处理器和存储器,所述存储器用于存储计算机程序,所述计算机程序被所述处理器执行时实现如上所述跳过HEVC帧内编码的编码方法。
相比于现有技术,本发明实施例提供一种跳过HEVC帧内编码的编码方法、装置及计算机设备,利用Roberts梯度算子计算当前编码树单元的纹理复杂度,并利用帧差法和OTSU阈值方法检测当前编码树单元的运动静止特征;然后计算所述编码树单元在所述帧间预测模式下的RDO代价值、当前编码树单元的4个编码子块的RDO代价值之和、所述当前编码单元的4个编码子块的预测模式信息和所述当前编码单元的量化系数信息,最后综合上述计算所得信息、纹理复杂度和运动静止特征,判断是否跳过帧内预测编码过程,从而降低编码单元的编码复杂度。
本发明实施例充分利用进行帧间预测后的帧间编码信息,并结合图像纹理特征和运动静止特征与预设的特征阈值相判断编码单元帧内预测编码过程在保证编码精度的同时能否跳过,进一步提高对编码单元帧内预测编码过程可跳性的判决准确度。
附图说明
图1是本发明一实施例提供的一种跳过HEVC帧内编码的编码方法的流程示意图;
图2是本发明一实施例提供的一种跳过HEVC帧内编码的编码装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参见图1,本发明一实施例提供一种跳过HEVC帧内编码的编码方法,包括:
S10、获取编码树单元的纹理复杂度和运动静止特征。
S11、根据率失真代价RDO最小原则确定帧间预测模式并获取在所述帧间预测模式下所述编码树单元的帧间编码信息;所述帧间编码信息包括所述编码树单元在所述帧间预测模式下的RDO代价值、当前编码树单元的4个编码子块的RDO代价值之和、所述当前编码单元的4个编码子块的预测模式信息和所述当前编码单元的量化系数信息。
S12、根据所述编码树单元的纹理复杂度和运动静止特征设置特征阈值。
S13、若所述当前编码树单元在所述帧间预测模式下的RDO代价值小于所述特征阈值,跳过对所述当前编码单元的帧内编码过程。
本申请利用Roberts梯度算子计算当前编码树单元(CTU)的纹理复杂度,并利用帧差法和OTSU阈值检测当前CTU的运动静止特征;然后计算帧间编码信息(帧间预测编码的最佳RDO代价和量化系数信息以及编码子块的RDO代价(RDcost,rate distortion cost,率失真代价)和预测模式信息),最后利用上述信息判断是否跳过帧内预测编码过程,从而降低编码单元(CU)编码复杂度。在判决过程中,将CU运动静止特征、纹理复杂度和预设阈值相结合,提高判决准确度,从而加速HEVC编码过程。
示例性地,S10具体包括:
S100、采用Roberts梯度算子来获取编码树单元的纹理复杂度;
S101、采用帧差法和OTSU方法来获取所述编码树单元的运动静止特征。
示例性地,S100具体包括:
采用Roberts梯度算子计算编码树单元的平均梯度值;
若所述平均梯度值为零,判断编码树单元为绝对纹理平坦块;
若所述平均梯度值大于零且所述平均梯度值小于或等纹理复杂度第一阈值,判断编码树单元为纹理平坦块;
若所述平均梯度值大于纹理复杂度第一阈值且所述平均梯度值小于或等于纹理复杂度第二阈值,判断编码树单元为纹理普通块;
若所述平均梯度值大于纹理复杂度第二阈值且所述平均梯度值小于或等于纹理复杂度第三阈值,判断编码树单元为纹理复杂块;
若所述平均梯度值大于纹理复杂度第三阈值,判断编码树单元为绝对纹理复杂度块。
采用Roberts梯度算子来衡量CTU块的纹理复杂度,具体计算公式如下:
Roberts梯度算子计算方法为:
gx=f(x+1,y)-f(x,y) (1)
gy=f(x,y+1)-f(x,y) (2)
G(x,y)=|gx+gy| (3)
其中,f(x,y)表示位置(x,y)处的像素值,gx表示(x,y)的水平方向梯度,gy表示(x,y)的垂直方向梯度,G(x,y)表示(x,y)处的梯度,Gavg表示当前CTU的平均梯度值。
其中,TC表示当前CTU的纹理复杂度,PSimple表示当前CTU为绝对纹理平坦块,Simple表示当前CTU为纹理平坦块,Common表示当前CTU为纹理普通块,Complex表示当前CTU为纹理复杂块,PComplex表示当前CTU为绝对纹理复杂度块。Thr1表示纹理复杂度第一阈值,Thr2表示纹理复杂度第二阈值,Thr3表示纹理复杂度第三阈值。在本实施例中,选择性地将Thr1设置为5,Thr2设置为10,Thr3设置为15。需要说明的是,在实际应用中,在保证Thr1<Thr2<Thr3的前提下,可以对Thr1、Thr2、Thr3的值作适当调整,比如Thr1设置范围可以为1-5,Thr2设置范围可以为6-10,Thr3范围可以为11-15。
示例性地,S101具体包括:
计算当前帧1/4下采样图像与前一帧1/4下采样图像中每个像素点的差值,并根据所述差值计算绝对值得到差值图;
采用OTSU方法计算所述差值图阈值;
根据所述差值图阈值对所述差值图进行阈值化得到运动图像;
根据运动图像,统计所述编码树单元的下采样块中的运动像素点个数;
根据所述运动像素点个数和运动静止判断阈值,判断所述编码树单元的运动静止特征。
示例性地,所述根据所述差值图阈值对所述差值图进行阈值化,具体包括:
将像素值大于或等于所述差值图阈值的像素点设置为运动像素点;
将像素值小于所述差值图阈值的像素点设置为非运动像素点;
分别统一全部运动像素点的像素值和全部非运动像素点的像素值。
本实施例采用阈值Thr4针对差值图进行阈值化,像素值大于等于Thr4的像素点为运动像素点,一般而言,会将其像素值设为255;像素值小于Thr4的像素点为非运动像素点,其像素值设为0;阈值化后的差值图记作运动图像。
示例性地,所述根据所述运动像素点个数和运动静止判断阈值,判断所述编码树单元的运动静止特征,具体包括:
若所述运动像素点个数小于或等于运动静止判断阈值,判断所述编码树单元为静止块;
若所述运动像素点个数大于运动静止判断阈值并且所述运动像素点个数小于或等于两倍的运动静止判断阈值,判断所述编码树单元为运动平缓块;
若所述运动像素点个数大于两倍的运动静止判断阈值,判断所述编码树单元为运动剧烈块。
采用帧差法和OTSU方法来检测CTU的运动静止特征,具体步骤如下:
(1)获取当前帧图像和前一帧图像的1/4下采样图像;
需要说明的是,这里的1/4下采样是指水平方向的像素点1/2下采样(间隔1个像素点取值),垂直方向的像素点1/2下采样,因此是1/4下采样图像。
(2)计算当前帧1/4下采样图像与前一帧1/4下采样图像中每个像素点的差值,并计算绝对值得到差值图;
(3)采用OTSU方法计算差值图的阈值,记作Thr4;
(4)采用阈值Thr4针对差值图进行阈值化,像素值大于等于Thr4的像素点为运动像素点,其像素值设为255;像素值小于Thr4的像素点为非运动像素点,其像素值设为0;阈值化后的差值图记作运动图像。
(5)在运动图像中获取当前CTU下采样块中含有运动像素点的个数N,则当前CTU的运动静止特征为:
其中MS表示当前CTU的运动静止特征,Static表示CTU为静止块,MotionLess表示当前CTU为运动平缓块,Motion表示当前CTU为运动剧烈块,Thr5表示运动静止判断阈值。在本实施例中,Thr5为32。需要说明的是,在实际应用中,可以对Thr5的值作适当调整,比如Thr5设置范围可以为20-40。
S11涵盖了帧间编码信息的获取过程,在帧间预测编码过程中,首先进行Merge/SKIP模式计算,然后进行Inter 2Nx2N、Inter2NxN、InterNx2N等模式的计算,在所有帧间模式计算完成之后,根据率失真代价RDO最小的原则确定关于CTU的最优帧间预测模式。
需要说明的是,每种模式的RDO计算方式是一样的,此处的计算过程是公知的,这里不进行赘述。一般而言,在应用过程中,默认编码器是将全部模式都计算一遍,其中也有一些快速算法用于加速编码。Merge模式、SKIP模式以及所有Inter模式和Intra模式都要计算一遍。
通过实施本实施例,可以得到帧间编码信息:
(1)帧间预测后的最优预测模式的RDO代价值;
(2)当前CU的4个编码子块的最优模式的RDO代价值之和;
(3)当前CU的4个编码子块的预测模式信息;
(4)当前CU的量化系数信息。
其中,当前CU的编码子块是指当前CU可继续划分为4个子CU;当前CU的量化系数信息是针对当前CU进行预测、变换和量化之后得到的。
示例性地,S12具体包括:
若所述编码树单元为纹理平坦块或纹理绝对简单块,并且所述当前编码树单元为静止块,特征阈值设置为为第一阈值;
若所述编码树单元为纹理平坦块或纹理绝对简单块,并且所述当前编码树单元不为静止块,特征阈值设置为第二阈值;
若所述编码树单元为纹理普通块,并且所述当前编码树单元为静止块,特征阈值为设置为第三阈值;
若所述编码树单元为纹理普通块,并且所述当前编码树单元不为静止块,特征阈值设置为第四阈值。
其他情况下,特征阈值设置为第五阈值。
在本实施例中,选择性地将第一阈值THR1为1600,第二阈值THR2为1400,第三阈值THR3为1200,第四阈值THR4为1000,第五阈值THR5为800。需要说明的是,在实际应用中,在保证Thr1<Thr2<Thr3<Thr4<Thr5的前提下,可以对Thr1、Thr2、Thr3、Thr4、Thr5的值作适当调整。
示例性地,所述编码方法还包括:
S14、若所述当前编码单元的4个编码子块的RDO代价值之和大于所述当前编码树单元在所述帧间预测模式下的RDO代价值,
或者,所述当前编码单元的4个编码子块的预测模式都不是帧内预测模式,
或者,所述当前编码单元为全零块,
跳过对所述当前编码单元的帧内编码过程。
本实施例中的全零块是指根据量化系数信息确定的,若当前CU的所有量化系数为0,则为全零块。
本实施例中,为了增加判断的准确性,除去在S13根据编码树单元在所述帧间预测模式下的RDO代价值和所述特征阈值的大小关系条件外,还额考虑了三个判断条件用于判断是否跳过对所述当前编码单元的帧内编码过程,换言之本实施例提供了四种判断条件,只要满足下面四个条件之一或者不同条件的任意组合,则跳过帧内预测编码过程。
条件一:所述当前编码树单元在所述帧间预测模式下的RDO代价值小于所述特征阈值。
条件二:所述当前编码单元的4个编码子块的RDO代价值之和大于所述当前编码树单元在所述帧间预测模式下的RDO代价值,
条件三:所述当前编码单元的4个编码子块的预测模式都不是帧内预测模式,
条件四:所述当前编码单元为全零块。
相比于现有技术,本发明实施例提供一种跳过HEVC帧内编码的编码方法、装置及计算机设备,利用Roberts梯度算子计算当前编码树单元的纹理复杂度,并利用帧差法和OTSU阈值方法检测当前编码树单元的运动静止特征;然后计算所述编码树单元在所述帧间预测模式下的RDO代价值、当前编码树单元的4个编码子块的RDO代价值之和、所述当前编码单元的4个编码子块的预测模式信息和所述当前编码单元的量化系数信息,最后综合上述计算所得信息、纹理复杂度和运动静止特征,判断是否跳过帧内预测编码过程,从而降低编码单元的编码复杂度。
本发明实施例充分利用进行帧间预测后的帧间编码信息,并结合图像纹理特征和运动静止特征与预设的特征阈值相判断编码单元帧内预测编码过程在保证编码精度的同时能否跳过,进一步提高对编码单元帧内预测编码过程可跳性的判决准确度。
参见图2,本申请一实施例提供一种跳过HEVC帧内编码的编码装置,包括:特征获取模块201、代价获取模块202、设置模块203和判断模块204。
特征获取模块201,用于获取编码树单元的纹理复杂度和运动静止特征;
代价获取模块202,用于根据率失真代价RDO最小原则确定帧间预测模式并获取在所述帧间预测模式下所述编码树单元的帧间编码信息;所述帧间编码信息包括所述编码树单元在所述帧间预测模式下的RDO代价值、当前编码树单元的4个编码子块的RDO代价值之和、所述当前编码单元的4个编码子块的预测模式信息和所述当前编码单元的量化系数信息;
设置模块203,用于根据所述编码树单元的纹理复杂度和运动静止特征设置特征阈值;
判断模块204,用于若所述当前编码树单元在所述帧间预测模式下的RDO代价值小于所述特征阈值,跳过对所述当前编码单元的帧内编码过程。
相比于现有技术,本发明实施例提供一种跳过HEVC帧内编码的编码装置,利用Roberts梯度算子计算当前编码树单元的纹理复杂度,并利用帧差法和OTSU阈值方法检测当前编码树单元的运动静止特征;然后计算所述编码树单元在所述帧间预测模式下的RDO代价值、当前编码树单元的4个编码子块的RDO代价值之和、所述当前编码单元的4个编码子块的预测模式信息和所述当前编码单元的量化系数信息,最后综合上述计算所得信息、纹理复杂度和运动静止特征,判断是否跳过帧内预测编码过程,从而降低编码单元的编码复杂度。
本发明实施例充分利用进行帧间预测后的帧间编码信息,并结合图像纹理特征和运动静止特征与预设的特征阈值相判断编码单元帧内预测编码过程在保证编码精度的同时能否跳过,进一步提高对编码单元帧内预测编码过程可跳性的判决准确度。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的定位装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请一实施例提供一种计算机设备,包括处理器和存储器,所述存储器用于存储计算机程序,所述计算机程序被所述处理器执行时实现如上所述跳过HEVC帧内编码的编码方法。
所述计算机设备可以是智能手机、平板电脑、桌上型计算机和云端服务器等计算设备。该计算机设备可包括但不仅限于处理器、存储器。本领域技术人员可以理解,计算机设备可以包括输入输出设备、网络接入设备等。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器在一些实施例中可以是所述计算机设备的内部存储单元,例如计算机设备的硬盘或内存。所述存储器在另一些实施例中也可以是所述计算机设备的外部存储设备,例如所述计算机设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器还可以既包括所述计算机设备的内部存储单元也包括外部存储设备。所述存储器用于存储操作系统、应用程序、引导装载程序(BootLoader)、数据以及其他程序等,例如所述计算机程序的程序代码等。所述存储器还可以用于暂时地存储已经输出或者将要输出的数据。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (10)
1.一种跳过HEVC帧内编码的编码方法,其特征在于,包括:
获取编码树单元的纹理复杂度和运动静止特征;
根据率失真代价RDO最小原则确定帧间预测模式并获取在所述帧间预测模式下所述编码树单元的帧间编码信息;所述帧间编码信息包括所述编码树单元在所述帧间预测模式下的RDO代价值、当前编码树单元的4个编码子块的RDO代价值之和、所述当前编码单元的4个编码子块的预测模式信息和所述当前编码单元的量化系数信息;
根据所述编码树单元的纹理复杂度和运动静止特征设置特征阈值;
若所述当前编码树单元在所述帧间预测模式下的RDO代价值小于所述特征阈值,跳过对所述当前编码单元的帧内编码过程。
2.如权利要求1所述跳过HEVC帧内编码的编码方法,其特征在于,还包括:
若所述当前编码单元的4个编码子块的RDO代价值之和大于所述当前编码树单元在所述帧间预测模式下的RDO代价值,
或者,所述当前编码单元的4个编码子块的预测模式都不是帧内预测模式,
或者,所述当前编码单元为全零块,
跳过对所述当前编码单元的帧内编码过程。
3.如权利要求1所述跳过HEVC帧内编码的编码方法,其特征在于,所述根据所述编码树单元的纹理复杂度和运动静止特征设置特征阈值,具体包括:
若所述编码树单元为纹理平坦块或纹理绝对简单块,并且所述当前编码树单元为静止块,特征阈值设置为第一阈值;
若所述编码树单元为纹理平坦块或纹理绝对简单块,并且所述当前编码树单元不为静止块,特征阈值设置为第二阈值;
若所述编码树单元为纹理普通块,并且所述当前编码树单元为静止块,特征阈值设置为第三阈值;
若所述编码树单元为纹理普通块,并且所述当前编码树单元不为静止块,特征阈值设置为第四阈值;
其他情况下,特征阈值设置为第五阈值。
4.如权利要求1所述跳过HEVC帧内编码的编码方法,其特征在于,所述获取编码树单元的纹理复杂度和运动静止特征,具体包括:
采用Roberts梯度算子来获取编码树单元的纹理复杂度;
采用帧差法和OTSU方法来获取所述编码树单元的运动静止特征。
5.如权利要求4所述跳过HEVC帧内编码的编码方法,其特征在于,所述采用Roberts梯度算子来获取编码树单元的纹理复杂度,具体包括:
采用Roberts梯度算子计算编码树单元的平均梯度值;
若所述平均梯度值为零,判断编码树单元为绝对纹理平坦块;
若所述平均梯度值大于零且所述平均梯度值小于或等纹理复杂度第一阈值,判断编码树单元为纹理平坦块;
若所述平均梯度值大于纹理复杂度第一阈值且所述平均梯度值小于或等于纹理复杂度第二阈值,判断编码树单元为纹理普通块;
若所述平均梯度值大于纹理复杂度第二阈值且所述平均梯度值小于或等于纹理复杂度第三阈值,判断编码树单元为纹理复杂块;
若所述平均梯度值大于纹理复杂度第三阈值,判断编码树单元为绝对纹理复杂度块。
6.如权利要求4所述跳过HEVC帧内编码的编码方法,其特征在于,所述采用帧差法和OTSU方法来获取所述编码树单元的运动静止特征,具体包括:
计算当前帧1/4下采样图像与前一帧1/4下采样图像中每个像素点的差值,并根据所述差值计算绝对值得到差值图;
采用OTSU方法计算所述差值图阈值;
根据所述差值图阈值对所述差值图进行阈值化得到运动图像;
根据运动图像,统计所述编码树单元的下采样块中的运动像素点个数;
根据所述运动像素点个数和运动静止判断阈值,判断所述编码树单元的运动静止特征。
7.如权利要求6所述跳过HEVC帧内编码的编码方法,其特征在于,所述根据所述差值图阈值对所述差值图进行阈值化,具体包括:
将像素值大于或等于所述差值图阈值的像素点设置为运动像素点;
将像素值小于所述差值图阈值的像素点设置为非运动像素点;
分别统一全部运动像素点的像素值和全部非运动像素点的像素值。
8.如权利要求6所述跳过HEVC帧内编码的编码方法,其特征在于,所述根据所述运动像素点个数和运动静止判断阈值,判断所述编码树单元的运动静止特征,具体包括:
若所述运动像素点个数小于或等于运动静止判断阈值,判断所述编码树单元为静止块;
若所述运动像素点个数大于运动静止判断阈值并且所述运动像素点个数小于或等于两倍的运动静止判断阈值,判断所述编码树单元为运动平缓块;
若所述运动像素点个数大于两倍的运动静止判断阈值,判断所述编码树单元为运动剧烈块。
9.一种跳过HEVC帧内编码的编码装置,其特征在于,包括:
特征获取模块,用于获取编码树单元的纹理复杂度和运动静止特征;
代价获取模块,用于根据率失真代价RDO最小原则确定帧间预测模式并获取在所述帧间预测模式下所述编码树单元的帧间编码信息;所述帧间编码信息包括所述编码树单元在所述帧间预测模式下的RDO代价值、当前编码树单元的4个编码子块的RDO代价值之和、所述当前编码单元的4个编码子块的预测模式信息和所述当前编码单元的量化系数信息;
设置模块,用于根据所述编码树单元的纹理复杂度和运动静止特征设置特征阈值;
判断模块,用于若所述当前编码树单元在所述帧间预测模式下的RDO代价值小于所述特征阈值,跳过对所述当前编码单元的帧内编码过程。
10.一种计算机设备,其特征在于,包括处理器和存储器,所述存储器用于存储计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至8任一项所述跳过HEVC帧内编码的编码方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202311003755.2A CN116886903A (zh) | 2023-08-10 | 2023-08-10 | 跳过hevc帧内编码的编码方法、装置及计算机设备 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202311003755.2A CN116886903A (zh) | 2023-08-10 | 2023-08-10 | 跳过hevc帧内编码的编码方法、装置及计算机设备 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN116886903A true CN116886903A (zh) | 2023-10-13 |
Family
ID=88258734
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202311003755.2A Pending CN116886903A (zh) | 2023-08-10 | 2023-08-10 | 跳过hevc帧内编码的编码方法、装置及计算机设备 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN116886903A (zh) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN117336548A (zh) * | 2023-10-16 | 2024-01-02 | 北京百度网讯科技有限公司 | 一种视频编码的处理方法、装置、设备及存储介质 |
| CN118018740A (zh) * | 2024-02-26 | 2024-05-10 | 重庆邮电大学 | 一种基于深度学习的360度视频帧间模式决策方法 |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN102186070A (zh) * | 2011-04-20 | 2011-09-14 | 北京工业大学 | 分层结构预判的快速视频编码方法 |
| US20170085892A1 (en) * | 2015-01-20 | 2017-03-23 | Beijing University Of Technology | Visual perception characteristics-combining hierarchical video coding method |
| CN108495130A (zh) * | 2017-03-21 | 2018-09-04 | 腾讯科技(深圳)有限公司 | 视频编码、解码方法和装置、终端、服务器和存储介质 |
| CN110351552A (zh) * | 2018-04-03 | 2019-10-18 | 朱政 | 视频编码中一种快速编码方法 |
| CN112637591A (zh) * | 2020-12-11 | 2021-04-09 | 百果园技术(新加坡)有限公司 | 一种视频预测编码的方法及装置 |
-
2023
- 2023-08-10 CN CN202311003755.2A patent/CN116886903A/zh active Pending
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN102186070A (zh) * | 2011-04-20 | 2011-09-14 | 北京工业大学 | 分层结构预判的快速视频编码方法 |
| US20170085892A1 (en) * | 2015-01-20 | 2017-03-23 | Beijing University Of Technology | Visual perception characteristics-combining hierarchical video coding method |
| CN108495130A (zh) * | 2017-03-21 | 2018-09-04 | 腾讯科技(深圳)有限公司 | 视频编码、解码方法和装置、终端、服务器和存储介质 |
| CN110351552A (zh) * | 2018-04-03 | 2019-10-18 | 朱政 | 视频编码中一种快速编码方法 |
| CN112637591A (zh) * | 2020-12-11 | 2021-04-09 | 百果园技术(新加坡)有限公司 | 一种视频预测编码的方法及装置 |
Non-Patent Citations (1)
| Title |
|---|
| 王欣欣,陆中成,程欣欣: "H.264/AVC帧间预测快速模式选择优化算法", 计算机应用, vol. 30, 30 June 2010 (2010-06-30) * |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN117336548A (zh) * | 2023-10-16 | 2024-01-02 | 北京百度网讯科技有限公司 | 一种视频编码的处理方法、装置、设备及存储介质 |
| CN118018740A (zh) * | 2024-02-26 | 2024-05-10 | 重庆邮电大学 | 一种基于深度学习的360度视频帧间模式决策方法 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6434196B1 (en) | Method and apparatus for encoding video information | |
| US8238421B2 (en) | Apparatus and method for estimating compression modes for H.264 codings | |
| US11375199B2 (en) | Interpolation filter for an inter prediction apparatus and method for video coding | |
| JP6615346B2 (ja) | 符号化処理におけるリアルタイムビデオノイズ低減のための方法、端末、および、不揮発性コンピュータ可読記憶媒体 | |
| US20090290641A1 (en) | Digital video compression acceleration based on motion vectors produced by cameras | |
| CN104982035B (zh) | 用于对数字图像的序列进行编码的方法 | |
| US11190766B2 (en) | Method and apparatus for determining division of coding unit, computing device, and readable storage medium | |
| CN116886903A (zh) | 跳过hevc帧内编码的编码方法、装置及计算机设备 | |
| KR20130130695A (ko) | 복수의 프로세서를 사용하여 비디오 프레임을 인코딩하는 방법 및 시스템 | |
| KR100575578B1 (ko) | 이동 단말 장치에서의 움직임 검출 방법 | |
| US10034016B2 (en) | Coding apparatus, computer system, coding method, and computer product | |
| CN110769255A (zh) | 一种图像编码方法及装置 | |
| WO2022110131A1 (zh) | 帧间预测方法、装置、编码器、解码器和存储介质 | |
| JP3812808B2 (ja) | スキップ領域検出型動画像符号化装置および記録媒体 | |
| CN110876082A (zh) | 一种视频帧的复杂度的确定方法及装置 | |
| WO2022037583A1 (en) | Systems and methods for intra prediction smoothing filter | |
| CN107592547A (zh) | 一种基于hevc压缩域的运动感知图提取方法 | |
| WO2011068429A1 (en) | Detecting artifacts in quantization noise in images compresses using discrete cosine transforms | |
| CN114584779A (zh) | 基于h264编码算法的视频编码方法、装置、设备及介质 | |
| CN109936741B (zh) | 视频编码方法和系统 | |
| US20140105305A1 (en) | Memory cache for use in video processing and methods for use therewith | |
| CN115086665A (zh) | 误码掩盖方法、装置、系统、存储介质和计算机设备 | |
| WO2020258052A1 (zh) | 图像分量预测方法、装置及计算机存储介质 | |
| JP2016213657A (ja) | 符号化ブロックサイズ決定装置、符号化装置、及びプログラム | |
| Nian et al. | A low complexity detection method for video data discontinuity implemented on SoC-FPGA by using pixel location prediction scheme |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination |