CN114731409A - 图像编码/解码方法和装置、以及存储比特流的记录介质 - Google Patents
图像编码/解码方法和装置、以及存储比特流的记录介质 Download PDFInfo
- Publication number
- CN114731409A CN114731409A CN202080080951.8A CN202080080951A CN114731409A CN 114731409 A CN114731409 A CN 114731409A CN 202080080951 A CN202080080951 A CN 202080080951A CN 114731409 A CN114731409 A CN 114731409A
- Authority
- CN
- China
- Prior art keywords
- block
- prediction
- gpm
- current block
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/577—Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/109—Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/186—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/80—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
- H04N19/82—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
在本说明书中公开了一种图像编码/解码方法。根据本发明的图像解码方法包括以下步骤:产生针对当前块的第一预测块;产生针对所述当前块的第二预测块;并且使用针对所述第一预测块和所述第二预测块的每样点加权和来产生针对所述当前块的最终预测样点,其中,基于当前亮度样点的位置和对所述当前块进行划分的几何预测模式(GPM)边界线来确定用于所述每样点加权和的权重。
Description
技术领域
本发明涉及一种用于对图像进行编码/解码的方法和设备、以及用于存储比特流的记录介质。
背景技术
最近,在各种应用中,针对诸如高清晰度(HD)图像或超高清晰度(UHD)图像的高分辨率和质量图像的需求已经增加。随着图像的分辨率和质量的提高,数据量相应地增加。当通过现有的诸如有线或无线宽带信道的传输介质传输图像数据时或者存储图像数据时,这是传输代价和存储代价增加的原因之一。为了解决高分辨率和高质量图像数据的这些问题,需要高效的图像编码/解码技术。
存在各种视频压缩技术,诸如从先前画面或后续画面内的像素的值预测当前画面内的像素的值的帧间预测技术、从当前画面的另一区域内的像素的值预测当前画面的区域内的像素的值的帧内预测技术、压缩残差信号的能量的变换和量化技术、以及将较短代码分配给频繁出现的像素值并且将较长代码分配给较少出现的像素值的熵编码技术。
公开内容
技术问题
本发明的一个目的在于提供一种具有改进的压缩效率的图像编码/解码方法和设备。
本发明的另一目的在于提供一种通过双向帧间预测的图像编码/解码方法和设备。
本发明的另一目的在于提供一种通过使用几何帧间预测的图像编码/解码方法和设备。
本发明的另一目的在于提供一种用于存储由根据本发明的图像编码/解码方法或设备产生的比特流的记录介质。
技术方案
根据本公开的对图像进行解码的方法包括:产生当前块的第一预测块;产生所述当前块的第二预测块;并且使用所述第一预测块与所述第二预测块的样点单位加权和产生所述当前块的最终预测样点,其中,用于所述样点单位加权和的权重基于当前亮度样点的位置和用于对所述当前块进行分区的几何预测模式(GPM)边界线被确定。
其中,所述对图像进行解码的方法还包括:获取所述当前块的GPM分区索引,并且基于所述GPM分区索引指定所述GPM边界线。
其中,所述GPM分区索引指示从所述当前块的中心至所述GPM边界线的距离或者所述GPM边界线的角度中的至少一个。
其中,所述GPM边界线基于从所述当前块的中心至所述GPM边界线的所述距离或者所述GPM边界线的所述角度中的至少一个被指定。
其中,基于当前样点与所述GPM边界线之间的距离来确定应用于所述当前亮度样点的权重。
其中,使用与当前色度样点相应的亮度样点的权重来确定应用于所述当前色度样点的权重。
其中,将应用于所述当前亮度样点的权重确定为{7/8,6/8,4/8,2/8,1/8}中的一个。
对图像进行解码的方法还包括推导所述当前块的合并候选列表,并且使用所述合并候选列表推导所述当前块的GPM候选列表。
其中,所述GPM候选列表的GPM候选0、GPM候选2或GPM候选4中的至少一个使用与所述GPM候选相应的合并候选的L0运动信息被推导。
其中,所述GPM候选列表的GPM候选1、GPM候选3或GPM候选5中的至少一个GPM候选使用与所述GPM候选相应的合并候选的L1运动信息被推导。
对图像进行解码的方法还包括:获取第一GPM索引和第二GPM索引;基于所述第一GPM索引和所述GPM候选列表获取第一运动信息;并且基于所述第二GPM索引和所述GPM候选列表获取第二运动信息,其中,所述第一预测块基于所述第一运动信息被产生,以及所述第二预测块基于所述第二运动信息被产生。
根据本公开的对图像进行解码的方法包括:产生当前块的第一预测块;产生所述当前块的第二预测块;使用所述第一预测块与所述第二预测块的样点单位加权和产生所述当前块的最终预测样点;并且对用于所述样点单位加权和的权重相关信息进行编码,其中,所述权重相关信息基于当前亮度样点的位置和用于对所述当前块进行分区的几何预测模式(GPM)边界线被确定。
其中,所述权重相关信息指示从所述当前块的中心至所述GPM边界线的距离或者所述GPM边界线的角度中的至少一个。
一种计算机可读记录介质,用于存储由图像解码设备接收并用于重建包括在当前画面中的当前块的比特流,其中,所述比特流通过根据本公开的图像编码方法被产生,所述图像编码方法包括:产生当前块的第一预测块,产生所述当前块的第二预测块,使用所述第一预测块与所述第二预测块的样点单位加权和产生所述当前块的最终预测样点,并且对用于所述样点单位加权和的权重相关信息进行编码,其中,所述权重相关信息基于当前亮度样点的位置和用于对所述当前块进行分区的几何预测模式(GPM)边界线被确定。
有益效果
根据本发明,可提供具有改进的压缩效率的图像编码/解码方法和设备、存储由具有改进的压缩效率的图像编码方法/设备产生的比特流的记录介质。
另外,根据本发明,可提供一种通过双向帧间预测的图像编码/解码方法和设备、存储由通过双向帧间预测的图像编码方法/设备产生的比特流的记录介质。
另外,根据本发明,可提供一种通过几何帧间预测的图像编码/解码方法和设备、存储由通过几何帧间预测的图像编码方法/设备产生比特流的记录介质。
附图说明
图1是示出根据应用了本发明的实施例的编码设备的配置的框图。
图2是示出根据应用了本发明的实施例的解码设备的配置的框图。
图3是示意性地示出当对图像进行编码和解码时图像的分区结构的示图。
图4是示出帧内预测处理的示图。
图5是示出画面间预测处理的实施例的示图。
图6是示出变换和量化处理的示图。
图7是示出能够用于帧内预测的参考样点的示图。
图8是示出根据本公开的实施例的图像解码方法的示图。
图9是示出根据本公开的实施例的图像编码方法的示图。
图10是示出根据本公开的另一实施例的图像解码方法的示图。
图11是示出根据本公开的另一实施例的图像编码方法的示图。
图12是示出基于历史的运动矢量预测因子(HMVP)候选列表的方法的示图。
图13是示出可在本发明的若干实施例中使用的空间邻近块的示图。
图14是示出可在本发明的若干实施例中使用的时间邻近块的示图。
图15是示出控制点运动矢量(CPMV)的示图。
图16是示出根据本公开的实施例的应用三角形预测模式(TPM)的方法的示图。
图17是示出根据本公开的实施例的可应用于TPM的权重的示图。
图18是示出根据本公开的另一实施例的应用几何预测模式(GPM)的方法的示图。
图19是示出根据本公开的另一实施例的可应用于GPM的权重的示图。
图20至图24是示出可应用于色度块的权重的示图,其中,根据本公开的若干实施例的GPM被应用于该色度块。
图25至图27是示出对块的运动信息进行编码/解码的方法的示图,其中,根据本公开的若干实施例的GPM被应用于该块。
图28至图30是示出对块的运动信息进行编码/解码的方法的其他示图,其中,根据本公开的若干实施例的GPM被应用于该块。
图31至图35是示出根据本公开的若干实施例的对帧内预测模式信息进行编码/解码的方法的示图。
图36和图37是示出对GPM信息进行熵编码/熵解码的方法的示图。
图38是示出根据本公开的另一实施例的图像解码方法的示图。
图39是示出根据本公开的另一实施例的图像编码方法的示图。
图40是示出根据本公开的另一实施例的图像解码方法的示图。
图41是示出根据本公开的另一实施例的图像编码方法的示图。
图42是示出根据本公开的实施例的运动改进范围的示图。
图43和图44是示出根据本公开的若干实施例的运动改进偏移的示图。
图45是示出根据本公开的实施例的运动改进方法的示图。
图46是示出根据本公开的实施例的运动改进方法的另一示图。
图47是示出根据本公开的另一实施例的运动改进方法的示图。
图46是示出根据本公开的另一实施例的运动改进方法的另一示图。
具体实施方式
可对本发明做出各种修改,并且存在本发明的各种实施例,现在将参照附图提供并详细描述本发明的各种实施例的示例。然而,尽管示例性实施例可被解释为包括本发明的技术构思和技术范围中的所有修改、等同形式或替代形式,但本发明不限于此。相似的参考标号指在各个方面相同或相似的功能。在附图中,为了清楚起见,元件的形状和尺寸可被夸大。在本发明的以下详细描述中,对通过图示的方式示出可实施本发明的具体实施例的附图进行参照。这些实施例被足够详细地描述以使本领域技术人员能够实施本公开。应当理解的是,本公开的各种实施例尽管不同,但不必是相互排他的。例如,在不脱离本公开的精神和范围的情况下,这里结合一个实施例描述的特定特征、结构和特性可在其它实施例中被实施。此外,应当理解的是,在不脱离本公开的精神和范围的情况下,每一个公开的实施例内的各个元件的位置或布置可被修改。因此,以下详细描述不应以限制的含义来理解,并且本公开的范围仅由所附权利要求(在合适的解释的情况下,还连同权利要求所要求保护的等同形式的全部范围)来限定。
在说明书中使用的术语“第一”、“第二”等可被用于描述各种组件,但这些组件并不被解释为受限于这些术语。这些术语仅被用于将一个组件与其它组件区分开。例如,在不脱离本发明的范围的情况下,“第一”组件可被称为“第二”组件,并且“第二”组件也可类似地被称为“第一”组件。术语“和/或”包括多个项的组合或者是多个项中的任意一项。
将理解的是,在本说明书中,当元件仅被称为“连接到”或“结合到”另一元件而不是“直接连接到”或“直接结合到”所述另一元件时,所述元件可“直接连接到”或“直接结合到”所述另一元件,或者在所述元件与所述另一元件之间具有其他元件的情况下连接到或结合到所述另一元件。相反,应当理解的是,当元件被称为“直接结合”或“直接连接”到另一元件时,不存在中间元件。
此外,在本发明的实施例中示出的组成部件被独立地示出,以便呈现彼此不同的特性功能。因此,这并不意味着每一个组成部件以单独的硬件或软件的组成单元被组成。换句话说,为了方便,每一个组成部件包括枚举的组成部件中的每一个。因此,每一个组成部件中的至少两个组成部件可被组合形成一个组成部件,或者一个组成部件可被划分为用于执行每一个功能的多个组成部件。在没有脱离本发明的本质的情况下,每一个组成部件被组合的实施例以及一个组成部件被划分的实施例也被包括在本发明的范围中。
在本说明书中使用的术语仅用于描述具体实施例,而不旨在限制本发明。除非以单数使用的表达在上下文中具有明显不同的含义,否则它包括复数表达。在本说明书中,将理解的是,诸如“包括……的”、“具有……的”等的术语旨在指明存在说明书中所公开的特征、数量、步骤、动作、元件、部件、或其组合,而并不旨在排除可存在或者可添加一个或更多个其它特征、数量、步骤、动作、元件、部件、或其组合的可能性。换句话说,当特定元件被称为“被包括”时,除相应元件以外的元件并不被排除,而是,附加的元件可被包括在本发明的实施例中或者是本发明的范围中。
此外,一些组成元件可能不是执行本发明的必要功能的不可缺的组成元件,而是仅提升其性能的可选组成元件。可通过仅包括用于实施本发明的实质的不可缺的组成部件而排除在提升性能时使用的组成元件来实施本发明。仅包括所述不可缺的组成元件而排除在仅提升性能时使用的可选组成元件的结构也被包括在本发明的范围中。
在下文中,将参照附图详细描述本发明的实施例。在描述本发明的示例性实施例时,因为公知的功能或结构可能不必要地模糊对本发明的理解,因此将不详细描述它们。附图中的相同的组成元件由相同的参考标号来表示,并且将省略对相同元件的重复描述。
在下文中,图像可指配置视频的画面,或者可指视频本身。例如,“对图像进行编码或解码或者进行编码和解码两者”可指“对运动画面进行编码或解码或者进行编码和解码两者”,并且可指“对运动画面的图像中的一个图像进行编码或解码或者进行编码和解码两者。”
在下文中,术语“运动画面”和“视频”可被用作相同的含义并且可彼此替换。
在下文中,目标图像可以是作为编码的目标的编码目标图像和/或作为解码的目标的解码目标图像。此外,目标图像可以是输入到编码设备的输入图像、以及输入到解码设备的输入图像。这里,目标图像可与当前图像具有相同的含义。
在下文中,术语“图像”、“画面”、“帧”和“屏幕”可被用作相同的含义并且彼此替换。
在下文中,目标块可以是作为编码的目标的编码目标块和/或作为解码的目标的解码目标块。此外,目标块可以是作为当前编码和/或解码的目标的当前块。例如,术语“目标块”和“当前块”可被用作相同的含义并且彼此替换。
在下文中,术语“块”和“单元”可被用作相同的含义并且彼此替换。或者“块”可表示特定单元。
在下文中,术语“区域”和“片段”可彼此替换。
在下文中,特定信号可以是表示特定块的信号。例如,原始信号可以是表示目标块的信号。预测信号可以是表示预测块的信号。残差信号可以是表示残差块的信号。
在实施例中,特定信息、数据、标志、索引、元素和属性等中的每一个可具有值。等于“0”的信息、数据、标志、索引、元素、和属性的值可表示逻辑假或第一预定义值。换句话说,值“0”、假、逻辑假和第一预定义值可彼此替换。等于“1”的信息、数据、标志、索引、元素、和属性的值可表示逻辑真或第二预定义值。换句话说,值“1”、真、逻辑真和第二预定义值可彼此替换。
当变量i或j用于表示列、行或索引时,i的值可以是等于或大于0的整数、或者等于或大于1的整数。也就是说,列、行、索引等可从0开始计数,或者可从1开始计数。
术语的说明
编码器:表示执行编码的设备。也就是说,表示编码设备。
解码器:表示执行解码的设备。也就是说,表示解码设备。
块:是M×N的样点阵列。这里,M和N可表示正整数,并且块可表示二维形式的样点阵列。块可指单元。当前块可表示在编码时成为目标的编码目标块,或者在解码时成为目标的解码目标块。此外,当前块可以是编码块、预测块、残差块和变换块中的至少一个。
样点:是构成块的基本单元。根据比特深度(Bd),样点可被表达为从0到2Bd-1的值。在本发明中,样点可被用作像素的含义。也就是说,样点、pel、像素可具有彼此相同的含义。
单元:可指编码和解码单元。当对图像进行编码和解码时,单元可以是通过对单个图像进行分区而产生的区域。此外,当在编码或解码期间将单个图像分区为子划分单元时,单元可表示子划分单元。也就是说,图像可被分区为多个单元。当对图像进行编码和解码时,可针对每一个单元执行预定的处理。单个单元可被分区为尺寸小于该单元的尺寸的子单元。依据功能,单元可表示块、宏块、编码树单元、编码树块、编码单元、编码块、预测单元、预测块、残差单元、残差块、变换单元、变换块等。此外,为了将单元与块区分开,单元可包括亮度分量块、与亮度分量块相关联的色度分量块、以及每一个颜色分量块的语法元素。单元可具有各种尺寸和形状,具体地,单元的形式可以是二维几何图形,诸如正方形形状、长方形形状、梯形形状、三角形形状、五边形形状等。此外,单元信息可包括指示编码单元、预测单元、变换单元等的单元类型以及单元尺寸、单元深度、单元的编码和解码的顺序等中的至少一个。
编码树单元:被配置有亮度分量Y的单个编码树块、以及与色度分量Cb和Cr相关的两个编码树块。此外,编码树单元可表示包括块和每一个块的语法元素。可通过使用四叉树分区方法、二叉树分区方法和三叉树分区方法中的至少一个对每一个编码树单元进行分区以配置诸如编码单元、预测单元、变换单元等的更低等级的单元。编码树单元可被用作用于指定在对作为输入图像的图像进行编码/解码时成为处理单元的样点块的术语。这里,四叉树可表示四元树。
当编码块的尺寸在预定范围内时,可仅使用四叉树分区进行划分。这里,预定范围可被定义为仅能够使用四叉树分区进行划分的编码块的最大尺寸和最小尺寸中的至少一个。可通过比特流用信号传送指示允许四叉树分区的编码块的最大/最小尺寸的信息,并且可在序列、画面参数、并行块组或条带(片段)中的至少一个单元中用信号传送所述信息。可选地,编码块的最大/最小尺寸可以是编码器/解码器中预定的固定尺寸。例如,当编码块的尺寸与256×256至64×64相应时,可仅使用四叉树分区来进行划分。可选地,当编码块的尺寸大于最大转换块的尺寸时,可仅使用四叉树分区来进行划分。这里,将被划分的块可以是编码块和变换块中的至少一个。在这种情况下,指示编码块的划分的信息(例如,split_flag)可以是指示是否执行四叉树分区的标志。当编码块的尺寸落入预定范围内时,可仅使用二叉树分区或三叉树分区来进行划分。在此情况下,四叉树分区的以上描述可以以相同方式被应用于二叉树分区或三叉树分区。
编码树块:可被用作用于指定Y编码树块、Cb编码树块和Cr编码树块中的任意一个的术语。
邻近块:可表示与当前块相邻的块。与当前块相邻的块可表示与当前块的边界接触的块、或者位于距当前块预定距离内的块。邻近块可表示与当前块的顶点相邻的块。这里,与当前块的顶点相邻的块可表示与水平相邻于当前块的邻近块垂直相邻的块、或者与垂直相邻于当前块的邻近块水平相邻的块。
重建的邻近块:可表示与当前块相邻并且已经在空间/时间上被编码或解码的邻近块。这里,重建的邻近块可表示重建的邻近单元。重建的空间邻近块可以是在当前画面内并且已经通过进行编码或解码或者进行编码和解码两者而被重建的块。重建的时间邻近块是在参考图像内的与当前画面的当前块相应的位置处的块或该块的邻近块。
单元深度:可表示单元的分区程度。在树结构中,最高节点(根节点)可与未被分区的第一单元相应。此外,最高节点可具有最小深度值。在这种情况下,最高节点的深度可以为等级0。深度为等级1的节点可表示通过对第一单元进行一次分区而产生的单元。深度为等级2的节点可表示通过对第一单元进行两次分区而产生的单元。深度为等级n的节点可表示通过对第一单元进行n次分区而产生的单元。叶节点可以是最低节点并且是不能被进一步分区的节点。叶节点的深度可以是最大等级。例如,最大等级的预定义值可以是3。根节点的深度可以是最低的,并且叶节点的深度可以是最深的。此外,当单元被表示为树结构时,单元所在的等级可表示单元深度。
比特流:可表示包括编码图像信息的比特流。
参数集:与比特流内的配置中的头信息相应。视频参数集、序列参数集、画面参数集和自适应参数集中的至少一个可被包括在参数集中。此外,参数集可包括条带(slice)头、并行块组头和并行块(tile)头信息。术语“并行块组”可表示一组并行块并且具有与条带相同的含义。
自适应参数集可指可通过在不同画面、子画面、条带、并行块组、并行块或分块(brick)中引用而共享的参数集。另外,可通过引用针对画面内部的子画面、条带、并行块组、并行块或分块的不同自适应参数集来使用自适应参数集中的信息。
另外,关于自适应参数集,可通过使用针对画面内部的子画面、条带、并行块组、并行块或分块的不同自适应参数集的标识符来引用不同的自适应参数集。
另外,关于自适应参数集,可通过使用针对子画面内部的条带、并行块组、并行块或分块的不同自适应参数集的标识符来引用不同的自适应参数集。
另外,关于自适应参数集,可通过使用针对条带内部的并行块或分块的不同自适应参数集的标识符来引用不同的自适应参数集。
另外,关于自适应参数集,可通过使用针对并行块内部的分块的不同自适应参数集的标识符来引用不同的自适应参数集。
关于自适应参数集标识符的信息可被包括在子画面的参数集或报头中,并且与自适应参数集标识符相应的自适应参数集可被用于子画面。
关于自适应参数集标识符的信息可被包括在并行块的参数集或报头中,并且与自适应参数集标识符相应的自适应参数集可被用于并行块。
关于自适应参数集标识符的信息可被包括在分块的报头中,并且与自适应参数集标识符相应的自适应参数集可被用于分块。
画面可被分区为一个或更多个并行块行和一个或更多个并行块列。
子画面可被分区为画面内的一个或更多个并行块行和一个或更多个并行块列。子画面可以是画面内具有矩形/正方形形式的区域,并且可包括一个或更多个CTU。另外,至少一个或多个并行块/分块/条带可被包括在一个子画面内。
并行块可以是画面内具有矩形/正方形形式的区域,并且可包括一个或更多个CTU。另外,并行块可被分区为一个或更多个分块。
分块可指并行块内的一个或更多个CTU行。并行块可被分区为一个或更多个分块,并且每一个分块可具有至少一个或多个CTU行。未被分区为两个或更多个的并行块可指分块。
条带可包括画面内的一个或更多个并行块,并且可包括并行块内的一个或更多个分块。
解析:可表示通过执行熵解码来确定语法元素的值,或者可表示熵解码本身。
符号:可表示编码/解码目标单元的语法元素、编码参数和变换系数值中的至少一个。此外,符号可表示熵编码目标或熵解码结果。
预测模式:可以是指示利用帧内预测编码/解码的模式或利用帧间预测编码/解码的模式的信息。
预测单元:可表示当执行预测(诸如帧间预测、帧内预测、帧间补偿、帧内补偿和运动补偿)时的基本单元。单个预测单元可被分区为具有更小尺寸的多个分区,或者可被分区为多个更低等级的预测单元。多个分区可以是在执行预测或补偿时的基本单元。通过对预测单元进行划分而产生的分区也可以是预测单元。
预测单元分区:可表示通过对预测单元进行分区而获得的形式。
参考画面列表可指包括用于帧间预测或运动补偿的一个或更多个参考画面的列表。存在几种类型的可用参考画面列表,所述可用参考画面列表包括LC(列表组合)、L0(列表0)、L1(列表1)、L2(列表2)、L3(列表3)。
帧间预测指示符可指当前块的帧间预测(单向预测、双向预测等)的方向。可选地,帧间预测指示符可指用于产生当前块的预测块的参考画面的数量。可选地,帧间预测指示符可指在对当前块执行帧间预测或运动补偿时所使用的预测块的数量。
预测列表利用标志指示是否使用特定参考画面列表中的至少一个参考画面来产生预测块。可使用预测列表利用标志来推导帧间预测指示符,并且相反地,可使用帧间预测指示符来推导预测列表利用标志。例如,当预测列表利用标志具有第一值零(0)时,它表示不使用参考画面列表中的参考画面来产生预测块。另一方面,当预测列表利用标志具有第二值一(1)时,它表示使用参考画面列表来产生预测块。
参考画面索引可指指示参考画面列表中的特定参考画面的索引。
参考画面可表示由特定块参考以实现对特定块进行帧间预测或运动补偿的目的的参考画面。可选地,参考画面可以是包括由当前块参考以进行帧间预测或运动补偿的参考块的画面。在下文中,术语“参考画面”和“参考图像”具有相同的含义并且可彼此替换。
运动矢量可以是用于帧间预测或运动补偿的二维矢量。运动矢量可表示编码/解码目标块与参考块之间的偏移。例如,(mvX,mvY)可表示运动矢量。这里,mvX可表示水平分量,并且mvY可表示垂直分量。
搜索范围可以是在帧间预测期间为了检索运动矢量而搜索的二维区域。例如,搜索范围的尺寸可以是M×N。这里,M和N均为整数。
运动矢量候选可指在对运动矢量进行预测时的预测候选块或预测候选块的运动矢量。此外,运动矢量候选可被包括在运动矢量候选列表中。
运动矢量候选列表可表示由一个或更多个运动矢量候选组成的列表。
运动矢量候选索引可表示指示运动矢量候选列表中的运动矢量候选的指示符。可选地,运动矢量候选索引可以是运动矢量预测因子的索引。
运动信息可表示包括以下项中的至少一项的信息:运动矢量、参考画面索引、帧间预测指示符、预测列表利用标志、参考画面列表信息、参考画面、运动矢量候选、运动矢量候选索引、合并候选和合并索引。
合并候选列表可表示由一个或更多个合并候选组成的列表。
合并候选可表示空间合并候选、时间合并候选、组合合并候选、组合双预测合并候选或零合并候选。合并候选可包括运动信息,诸如帧间预测指示符、针对每一个列表的参考画面索引、运动矢量、预测列表利用标志和帧间预测指示符。
合并索引可表示指示在合并候选列表中的合并候选的指示符。可选地,合并索引可指示在空间上/时间上与当前块相邻的重建块中的从其推导合并候选的块。可选地,合并索引可指示合并候选的至少一条运动信息。
变换单元:可表示在对残差信号执行编码/解码(诸如变换、逆变换、量化、反量化、变换系数编码/解码)时的基本单元。单个变换单元可被分区为具有更小尺寸的多个更低等级的变换单元。这里,变换/逆变换可包括第一变换/第一逆变换和第二变换/第二逆变换中的至少一个。
缩放:可表示将量化的等级乘以因子的处理。可通过对量化的等级进行缩放来产生变换系数。缩放也可被称为反量化。
量化参数:可表示当在量化期间使用变换系数来产生量化的等级时使用的值。量化参数还可表示当在反量化期间通过对量化的等级进行缩放来产生变换系数时使用的值。量化参数可以是被映射在量化步长上的值。
增量量化参数:可表示预测的量化参数与编码/解码目标单元的量化参数之间的差值。
扫描:可表示对单元、块或矩阵内的系数进行排序的方法。例如,将系数的二维矩阵改成为一维矩阵的操作可被称为扫描,将系数的一维矩阵改成为二维矩阵的操作可被称为扫描或反向扫描。
变换系数:可表示在编码器中执行变换之后产生的系数值。变换系数可表示在解码器中执行熵解码和反量化中的至少一个之后产生的系数值。通过对变换系数或残差信号进行量化而获得的量化的等级或者量化的变换系数等级也可落入变换系数的含义内。
量化的等级:可表示在编码器中通过对变换系数或残差信号进行量化而产生的值。可选地,量化的等级可表示作为在解码器中将被执行反量化的反量化目标的值。类似地,作为变换和量化的结果的量化的变换系数等级也可落入量化的等级的含义内。
非零变换系数:可表示具有除零之外的值的变换系数、或者具有除零之外的值的变换系数等级或量化的等级。
量化矩阵:可表示在被执行以提高主观图像质量或客观图像质量的量化处理或反量化处理中使用的矩阵。量化矩阵也可被称为缩放列表。
量化矩阵系数:可表示量化矩阵内的每一个元素。量化矩阵系数也可被称为矩阵系数。
默认矩阵:可表示在编码器或解码器中初步定义的预定量化矩阵。
非默认矩阵:可表示在编码器或解码器中未初步定义而是由用户用信号传送的量化矩阵。
统计值:针对具有可计算的特定值的变量、编码参数、常量值等之中的至少一个的统计值可以是相应特定值的平均值、总和值、加权平均值、加权和值、最小值、最大值、最频繁出现的值、中值、插值之中的一个或更多个。
图1是示出根据应用了本发明的实施例的编码设备的配置的框图。
编码设备100可以是编码器、视频编码设备或图像编码设备。视频可包括至少一个图像。编码设备100可顺序地对至少一个图像进行编码。
参照图1,编码设备100可包括运动预测单元111、运动补偿单元112、帧内预测单元120、切换器115、减法器125、变换单元130、量化单元140、熵编码单元150、反量化单元160、逆变换单元170、加法器175、滤波器单元180和参考画面缓冲器190。
编码设备100可通过使用帧内模式或帧间模式或者帧内模式和帧间模式两者来对输入图像执行编码。此外,编码设备100可通过对输入图像进行编码来产生包括编码信息的比特流,并输出产生的比特流。产生的比特流可被存储在计算机可读记录介质中,或者可通过有线/无线传输介质被流传输。当帧内模式被用作预测模式时,切换器115可被切换到帧内。可选地,当帧间模式被用作预测模式时,切换器115可被切换到帧间模式。这里,帧内模式可表示帧内预测模式,帧间模式可表示帧间预测模式。编码设备100可产生针对输入图像的输入块的预测块。此外,编码设备100可在产生预测块之后使用输入块和预测块的残差对残差块进行编码。输入图像可被称为作为当前编码目标的当前图像。输入块可被称为作为当前编码目标的当前块,或者被称为编码目标块。
当预测模式是帧内模式时,帧内预测单元120可使用已被编码/解码并与当前块相邻的块的样点作为参考样点。帧内预测单元120可通过使用参考样点来对当前块执行空间预测,或者通过执行空间预测来产生输入块的预测样点。这里,帧内预测可表示帧内部的预测。
当预测模式是帧间模式时,运动预测单元111可在执行运动预测时从参考图像检索与输入块最匹配的区域,并且通过使用检索到的区域来推导运动矢量。在这种情况下,搜索区域可被用作所述区域。参考图像可被存储在参考画面缓冲器190中。这里,当执行了对参考图像的编码/解码时,参考图像可被存储在参考画面缓冲器190中。
运动补偿单元112可通过使用运动矢量对当前块执行运动补偿来产生预测块。这里,帧间预测可表示帧之间的预测或运动补偿。
当运动矢量的值不是整数时,运动预测单元111和运动补偿单元112可通过将插值滤波器应用于参考画面的部分区域来产生预测块。为了对编码单元执行帧间画面预测或运动补偿,可确定将跳过模式、合并模式、高级运动矢量预测(AMVP)模式和当前画面参考模式之中的哪个模式用于对包括在相应编码单元中的预测单元的运动预测和运动补偿。然后,依据所确定的模式,可不同地执行帧间画面预测或运动补偿。
减法器125可通过使用输入块和预测块的差来产生残差块。残差块可被称为残差信号。残差信号可表示原始信号和预测信号之间的差。此外,残差信号可以是通过对原始信号与预测信号之间的差进行变换或量化或者变换和量化而产生的信号。残差块可以是块单元的残差信号。
变换单元130可通过对残差块执行变换来产生变换系数,并输出产生的变换系数。这里,变换系数可以是通过对残差块执行变换而产生的系数值。当变换跳过模式被应用时,变换单元130可跳过对残差块的变换。
可通过将量化应用于变换系数或应用于残差信号来产生量化的等级。在下文中,量化的等级在实施例中也可被称为变换系数。
量化单元140可通过根据参数对变换系数或残差信号进行量化来产生量化的等级,并输出产生的量化的等级。这里,量化单元140可通过使用量化矩阵对变换系数进行量化。
熵编码单元150可通过根据概率分布对由量化单元140计算出的值或者对在执行编码时计算出的编码参数值执行熵编码来产生比特流,并输出产生的比特流。熵编码单元150可对图像的样点信息和用于对图像进行解码的信息执行熵编码。例如,用于对图像进行解码的信息可包括语法元素。
当熵编码被应用时,符号被表示使得较少数量的比特被分配给具有高产生可能性的符号,并且较多数量的比特被分配给具有低产生可能性的符号,因此,可减小用于将被编码的符号的比特流的大小。熵编码单元150可使用诸如指数哥伦布、上下文自适应可变长度编码(CAVLC)、上下文自适应二进制算术编码(CABAC)等的用于熵编码的编码方法。例如,熵编码单元150可通过使用变长编码/码(VLC)表来执行熵编码。此外,熵编码单元150可推导目标符号的二值化方法和目标符号/二进制位的概率模型,并且通过使用推导的二值化方法和上下文模型来执行算术编码。
为了对变换系数等级(量化的等级)进行编码,熵编码单元150可通过使用变换系数扫描方法将二维块形式的系数改成为一维矢量形式。
编码参数可包括在编码器中被编码并且被用信号传送到解码器的诸如语法元素的信息(标志、索引等)以及在执行编码或解码时推导的信息。编码参数可表示在对图像进行编码或解码时所需要的信息。例如,以下项中的至少一个值或组合形式可被包括在编码参数中:单元/块尺寸、单元/块深度、单元/块分区信息、单元/块形状、单元/块分区结构、是否进行四叉树形式的分区、是否进行二叉树形式的分区、二叉树形式的分区方向(水平方向或垂直方向)、二叉树形式的分区形式(对称分区或非对称分区)、当前编码单元是否通过三叉树分区被分区、三叉树分区的方向(水平方向或垂直方向)、三叉树分区的类型(对称类型或非对称类型)、当前编码单元是否通过多类型树分区被分区、多类型树分区的方向(水平方向或垂直方向)、多类型树分区的类型(对称类型或非对称类型)和多类型树分区的树(二叉树或三叉树)结构、预测模式(帧内预测或帧间预测)、亮度帧内预测模式/方向、色度帧内预测模式/方向、帧内分区信息、帧间分区信息、编码块分区标志、预测块分区标志、变换块分区标志、参考样点滤波方法、参考样点滤波器抽头、参考样点滤波器系数、预测块滤波方法、预测块滤波器抽头、预测块滤波器系数、预测块边界滤波方法、预测块边界滤波器抽头、预测块边界滤波器系数、帧内预测模式、帧间预测模式、运动信息、运动矢量、运动矢量差、参考画面索引、帧间预测角度、帧间预测指示符、预测列表利用标志、参考画面列表、参考画面、运动矢量预测因子索引、运动矢量预测因子候选、运动矢量候选列表、是否使用合并模式、合并索引、合并候选、合并候选列表、是否使用跳过模式、插值滤波器类型、插值滤波器抽头、插值滤波器系数、运动矢量尺寸、运动矢量的表示精度、变换类型、变换尺寸、初级(第一次)变换是否被使用的信息、次级变换是否被使用的信息、初级变换索引、次级变换索引、残差信号是否存在的信息、编码块样式、编码块标志(CBF)、量化参数、量化参数残差、量化矩阵、是否应用环内滤波器、环内滤波器系数、环内滤波器抽头、环内滤波器形状/形式、是否应用去块滤波器、去块滤波器系数、去块滤波器抽头、去块滤波器强度、去块滤波器形状/形式、是否应用自适应样点偏移、自适应样点偏移值、自适应样点偏移类别、自适应样点偏移类型、是否应用自适应环路滤波器、自适应环路滤波器系数、自适应环路滤波器抽头、自适应环路滤波器形状/形式、二值化/反二值化方法、上下文模型确定方法、上下文模型更新方法、是否执行常规模式、是否执行旁路模式、上下文二进制位、旁路二进制位、有效系数标志、最后有效系数标志、针对系数组的单元的编码标志、最后有效系数的位置、关于系数的值是否大于1的标志、关于系数的值是否大于2的标志、关于系数的值是否大于3的标志、关于剩余系数值的信息、正负号信息、重建的亮度样点、重建的色度样点、残差亮度样点、残差色度样点、亮度变换系数、色度变换系数、量化的亮度等级、量化的色度等级、变换系数等级扫描方法、在解码器侧的运动矢量搜索区域的尺寸、在解码器侧的运动矢量搜索区域的形状、在解码器侧的运动矢量搜索的次数、关于CTU尺寸的信息、关于最小块尺寸的信息、关于最大块尺寸的信息、关于最大块深度的信息、关于最小块深度的信息、图像显示/输出顺序、条带标识信息、条带类型、条带分区信息、并行块标识信息、并行块类型、并行块分区信息、并行块组标识信息、并行块组类型、并行块组分区信息画面类型、输入样点的比特深度、重建样点的比特深度、残差样点的比特深度、变换系数的比特深度、量化的等级的比特深度、以及关于亮度信号的信息或关于色度信号的信息。
这里,用信号传送标志或索引可表示由编码器对相应的标志或索引进行熵编码并将其包括在比特流中,并且可表示由解码器从比特流对相应的标志或索引进行熵解码。
当编码设备100通过帧间预测执行编码时,编码的当前图像可被用作用于随后被处理的另一图像的参考图像。因此,编码设备100可对编码的当前图像进行重建或解码,或者将重建的或解码的图像作为参考图像存储在参考画面缓冲器190中。
量化的等级可在反量化单元160中被反量化,或者可在逆变换单元170中被逆变换。可由加法器175将经过反量化或逆变换的系数或者经过反量化和逆变换两者的系数与预测块相加。通过将经过反量化或逆变换的系数或者经过反量化和逆变换两者的系数与预测块相加,可产生重建块。这里,经过反量化或逆变换的系数或经过反量化和逆变换两者的系数可表示执行了反量化和逆变换中的至少一个的系数,并且可表示重建的残差块。
重建块可通过滤波器单元180。滤波器单元180可将去块滤波器、样点自适应偏移(SAO)和自适应环路滤波器(ALF)中的至少一个应用于重建样点、重建块或重建图像。滤波器单元180可被称为环内滤波器。
去块滤波器可去除在块之间的边界中产生的块失真。为了确定是否应用去块滤波器,可基于块中所包括的若干行或列中包括的样点来确定是否将去块滤波器应用于当前块。当将去块滤波器应用于块时,可根据所需的去块滤波强度来应用另一滤波器。
为了补偿编码误差,可通过使用样点自适应偏移将合适的偏移值与样点值相加。样点自适应偏移可以以样点为单位对经过去块的图像与原始图像的偏移进行校正。可使用考虑关于每一个样点的边缘信息来应用偏移的方法,或者可使用以下方法:将图像的样点分区为预定数量的区域,确定偏移被应用的区域,并对确定的区域应用偏移。
自适应环路滤波器可基于经过滤波的重建图像和原始图像的比较结果来执行滤波。可将包括在图像中的样点分区为预定组,可确定将被应用于每一个组的滤波器,并且可对每一个组执行差异化滤波。是否应用ALF的信息可通过编码单元(CU)被用信号传送,并且将被应用于每一个块的ALF的形式和系数可变化。
已经通过滤波器单元180的重建块或重建图像可被存储在参考画面缓冲器190中。由滤波器单元180处理的重建块可以是参考图像的一部分。也就是说,参考图像是由通过滤波器单元180处理的重建块组成的重建图像。存储的参考图像可稍后在帧间预测或运动补偿时被使用。
图2是示出根据应用了本发明的实施例的解码设备的配置的框图。
解码设备200可以是解码器、视频解码设备或图像解码设备。
参照图2,解码设备200可包括熵解码单元210、反量化单元220、逆变换单元230、帧内预测单元240、运动补偿单元250、加法器255、滤波器单元260和参考画面缓冲器270。
解码设备200可接收从编码设备100输出的比特流。解码设备200可接收存储在计算机可读记录介质中的比特流,或者可接收通过有线/无线传输介质被流传输的比特流。解码设备200可通过使用帧内模式或帧间模式对比特流进行解码。此外,解码设备200可产生通过解码而产生的重建图像或解码图像,并输出重建图像或解码图像。
当在解码时使用的预测模式是帧内模式时,切换器可被切换到帧内。可选地,当在解码时使用的预测模式是帧间模式时,切换器可被切换到帧间模式。
解码设备200可通过对输入比特流进行解码来获得重建的残差块,并产生预测块。当重建的残差块和预测块被获得时,解码设备200可通过将重建的残差块与预测块相加来产生为解码目标的重建块。解码目标块可被称为当前块。
熵解码单元210可通过根据概率分布对比特流进行熵解码来产生符号。产生的符号可包括量化的等级形式的符号。这里,熵解码方法可以是上述熵编码方法的逆过程。
为了对变换系数等级(量化的等级)进行解码,熵解码单元210可通过使用变换系数扫描方法将单向矢量形式的系数改成为二维块形式。
可在反量化单元220中对量化的等级进行反量化,或者可在逆变换单元230中对量化的等级进行逆变换。量化的等级可以是进行反量化或逆变换或者进行反量化和逆变换两者的结果,并且可被产生为重建的残差块。这里,反量化单元220可将量化矩阵应用于量化的等级。
当使用帧内模式时,帧内预测单元240可通过对当前块执行空间预测来产生预测块,其中,空间预测使用与解码目标块相邻并且已经被解码的块的样点值。
当使用帧间模式时,运动补偿单元250可通过对当前块执行运动补偿来产生预测块,其中,运动补偿使用运动矢量以及存储在参考画面缓冲器270中的参考图像。
加法器255可通过将重建的残差块与预测块相加来产生重建块。滤波器单元260可将去块滤波器、样点自适应偏移和自适应环路滤波器中的至少一个应用于重建块或重建图像。滤波器单元260可输出重建图像。重建块或重建图像可被存储在参考画面缓冲器270中并且在执行帧间预测时被使用。由滤波器单元260处理的重建块可以是参考图像的一部分。也就是说,参考图像是由通过滤波器单元260处理的重建块组成的重建图像。存储的参考图像可稍后在帧间预测或运动补偿时被使用。
图3是示意性地示出当对图像进行编码和解码时的图像的分区结构的示图。图3示意性地示出将单个单元分区为多个更低等级的单元的示例。
为了有效地对图像进行分区,当进行编码和解码时,可使用编码单元(CU)。编码单元可被用作当对图像进行编码/解码时的基本单元。此外,编码单元可被用作用于在对图像进行编码/解码时区分帧内预测模式与帧间预测模式的单元。编码单元可以是用于预测、变换、量化、逆变换、反量化或对变换系数的编码/解码处理的基本单元。
参照图3,图像300按照最大编码单元(LCU)被顺序地分区,并且LCU单元被确定为分区结构。这里,LCU可以以与编码树单元(CTU)相同的含义被使用。单元分区可表示对与该单元相关联的块进行分区。在块分区信息中,可包括单元深度的信息。深度信息可表示单元被分区的次数或程度或者单元被分区的次数和程度两者。可基于树结构将单个单元分区为与深度信息分层地相关联的多个更低等级的单元。换句话说,单元和通过对该单元进行分区而产生的更低等级的单元可分别与节点和该节点的子节点相应。分区出的更低等级的单元中的每一个可具有深度信息。深度信息可以是表示CU的尺寸的信息,并且可被存储在每一个CU中。单元深度表示与对单元进行分区相关的次数和/或程度。因此,更低等级的单元的分区信息可包括关于更低等级的单元的尺寸的信息。
分区结构可表示编码单元(CU)在LCU 310内的分布。可根据是否将单个CU分区为多个(等于或大于2的正整数个,包括2、4、8、16等)CU来确定这样的分布。通过分区产生的CU的水平尺寸和垂直尺寸可分别是分区之前的CU的水平尺寸和垂直尺寸的一半,或者可分别具有根据分区的次数而小于分区之前的水平尺寸和垂直尺寸的尺寸。CU可以被递归地分区为多个CU。通过递归分区,与分区之前的CU的高度和宽度之中的至少一个相比,分区之后的CU的高度和宽度之中的至少一个可减小。可递归地执行CU的分区,直到预定义的深度或预定义的尺寸为止。例如,LCU的深度可以是0,最小编码单元(SCU)的深度可以是预定义的最大深度。这里,如上所述,LCU可以是具有最大编码单元尺寸的编码单元,并且SCU可以是具有最小编码单元尺寸的编码单元。分区从LCU 310开始,随着CU的水平尺寸或垂直尺寸或者水平尺寸和垂直尺寸两者通过分区而减小,CU深度增加1。例如,对于每一个深度,未被分区的CU的尺寸可以为2N×2N。此外,在被分区的CU的情况下,可将尺寸为2N×2N的CU分区为尺寸为N×N的四个CU。随着深度增加1,N的大小可减半。
此外,可通过使用CU的分区信息来表示CU是否被分区的信息。分区信息可以是1比特信息。除SCU之外的所有CU可包括分区信息。例如,当分区信息的值为第一值时,可不对CU进行分区,当分区信息的值为第二值时,可对CU进行分区。
参照图3,深度为0的LCU可以是64×64的块。0可以是最小深度。深度为3的SCU可以是8×8的块。3可以是最大深度。32×32的块和16×16的块的CU可分别被表示为深度1和深度2。
例如,当单个编码单元被分区为四个编码单元时,分区出的四个编码单元的水平尺寸和垂直尺寸可以是CU在被分区之前的水平尺寸和垂直尺寸的一半尺寸。在一个实施例中,当尺寸为32×32的编码单元被分区为四个编码单元时,分区出的四个编码单元中的每一个的尺寸可以为16×16。当单个编码单元被分区为四个编码单元时,可称编码单元可被分区为四叉树形式。
例如,当一个编码单元被分区为两个子编码单元时,该两个子编码单元中的每一个的水平尺寸或垂直尺寸(宽度或高度)可以是原始编码单元的水平尺寸或垂直尺寸的一半。例如,当尺寸为32×32的编码单元被垂直分区为两个子编码单元时,该两个子编码单元中的每一个可具有16×32的尺寸。例如,当尺寸为8×32的编码单元被水平分区为两个子编码单元时,该两个子编码单元中的每一个可具有8×16的尺寸。当一个编码单元被分区为两个子编码单元时,可称编码单元被二元分区,或者根据二叉树分区结构被分区。
例如,当一个编码单元被分区为三个子编码单元时,可按照1:2:1的比例对编码单元的水平尺寸或垂直尺寸进行分区,从而产生水平尺寸或垂直尺寸的比例为1:2:1的三个子编码单元。例如,当尺寸为16×32的编码单元被水平分区为三个子编码单元时,该三个子编码单元以从最上方子编码单元到最下方子编码单元的顺序可分别具有16×8、16×16和16×8的尺寸。例如,当尺寸为32×32的编码单元被垂直划分为三个子编码单元时,该三个子编码单元以从左侧子编码单元到右侧子编码单元的顺序可分别具有8×32、16×32和8×32的尺寸。当一个编码单元被分区为三个子编码单元时,可称编码单元被三元分区或者根据三叉树分区结构被分区。
在图3中,编码树单元(CTU)320是四叉树分区结构、二叉树分区结构和三叉树分区结构全部被应用的CTU的示例。
如上所述,为了对CTU进行分区,可应用四叉树分区结构、二叉树分区结构和三叉树分区结构中的至少一个。可根据预定的优先级顺序将各种树分区结构顺序地应用于CTU。例如,可将四叉树分区结构优先应用于CTU。不能再使用四叉树分区结构进行分区的编码单元可与四叉树的叶节点相应。与四叉树的叶节点相应的编码单元可用作二叉树和/或三叉树分区结构的根节点。也就是说,与四叉树的叶节点相应的编码单元可根据二叉树分区结构或三叉树分区结构被进一步分区,或者可不被进一步分区。因此,通过阻止从与四叉树的叶节点相应的编码单元的二叉树分区或三叉树分区得到的编码单元被执行进一步的四叉树分区,块分区操作和/或用信号传送分区信息的操作可被有效执行。
可使用四元分区信息用信号传送与四叉树的节点相应的编码单元被分区的事实。具有第一值(例如,“1”)的四元分区信息可指示当前编码单元按照四叉树分区结构被分区。具有第二值(例如,“0”)的四元分区信息可指示当前编码单元不按照四叉树分区结构被分区。四元分区信息可以是具有预定长度(例如,一个比特)的标志。
在二叉树分区与三叉树分区之间可以没有优先级。也就是说,与四叉树的叶节点相应的编码单元可进一步被执行二叉树分区和三叉树分区中的任意分区。此外,通过二叉树分区或三叉树分区产生的编码单元可被执行进一步的二叉树分区或进一步的三叉树分区,或者可不被进一步分区。
在二叉树分区和三叉树分区之间不存在优先级的树结构被称为多类型树结构。与四叉树的叶节点相应的编码单元可用作多类型树的根节点。可使用多类型树分区指示信息、分区方向信息和分区树信息中的至少一个来用信号传送是否对与多类型树的节点相应的编码单元进行分区。为了对与多类型树的节点相应的编码单元进行分区,可顺序地用信号传送多类型树分区指示信息、分区方向信息和分区树信息。
具有第一值(例如,“1”)的多类型树分区指示信息可指示当前编码单元将被执行多类型树分区。具有第二值(例如,“0”)的多类型树分区指示信息可指示当前编码单元将不被执行多类型树分区。
当与多类型树的节点相应的编码单元按照多类型树分区结构被进一步分区时,所述编码单元可包括分区方向信息。分区方向信息可指示当前编码单元将在哪个方向上根据多类型树分区被分区。具有第一值(例如,“1”)的分区方向信息可指示当前编码单元将被垂直分区。具有第二值(例如,“0”)的分区方向信息可指示当前编码单元将被水平分区。
当与多类型树的节点相应的编码单元按照多类型树分区结构被进一步分区时,当前编码单元可包括分区树信息。分区树信息可指示将被用于对多类型树的节点进行分区的树分区结构。具有第一值(例如,“1”)的分区树信息可指示当前编码单元将按照二叉树分区结构被分区。具有第二值(例如,“0”)的分区树信息可指示当前编码单元将按照三叉树分区结构被分区。
分区指示信息、分区树信息和分区方向信息均可以是具有预定长度(例如,一个比特)的标志。
四叉树分区指示信息、多类型树分区指示信息、分区方向信息和分区树信息中的至少任意一个可被熵编码/熵解码。为了对那些类型的信息进行熵编码/熵解码,可使用关于与当前编码单元相邻的邻近编码单元的信息。例如,当前编码单元的左侧邻近编码单元和/或上方邻近编码单元的分区类型(被分区或不被分区、分区树和/或分区方向)与当前编码单元的分区类型相似的可能性很高。因此,可从关于邻近编码单元的信息推导用于对关于当前编码单元的信息进行熵编码/熵解码的上下文信息。关于邻近编码单元的信息可包括四元分区信息、多类型树分区指示信息、分区方向信息和分区树信息中的至少任意一个。
作为另一示例,在二叉树分区和三叉树分区中,可优先执行二叉树分区。也就是说,当前编码单元可首先被执行二叉树分区,并且随后可将与二叉树的叶节点相应的编码单元设置为用于三叉树分区的根节点。在这种情况下,对于与三叉树的节点相应的编码单元,可既不执行四叉树分区也不执行二叉树分区。
不能按照四叉树分区结构、二叉树分区结构和/或三叉树分区结构被分区的编码单元成为用于编码、预测和/或变换的基本单元。也就是说,所述编码单元不能被进一步分区以用于预测和/或变换。因此,在比特流中可不存在用于将编码单元分区为预测单元和/或变换单元的分区结构信息和分区信息。
然而,当编码单元(即,用于分区的基本单元)的尺寸大于最大变换块的尺寸时,可递归地对该编码单元进行分区,直到将该编码单元的尺寸减小到等于或小于最大变换块的尺寸为止。例如,当编码单元的尺寸为64×64时并且当最大变换块的尺寸为32×32时,可将该编码单元分区为用于变换的四个32×32的块。例如,当编码单元的尺寸为32×64并且最大变换块的尺寸为32×32时,可将该编码单元分区为用于变换的两个32×32的块。在这种情况下,不单独用信号传送编码单元的用于变换的分区,并且可通过编码单元的水平尺寸或垂直尺寸与最大变换块的水平尺寸或垂直尺寸之间的比较来确定编码单元的用于变换的分区。例如,当编码单元的水平尺寸(宽度)大于最大变换块的水平尺寸(宽度)时,可将该编码单元垂直地二等分。例如,当编码单元的垂直尺寸(高度)大于最大变换块的垂直尺寸(高度)时,可将该编码单元水平地二等分。
可在编码单元的更高等级用信号传送或确定编码单元的最大尺寸和/或最小尺寸的信息以及变换块的最大尺寸和/或最小尺寸的信息。所述更高等级可以是例如序列级、画面级、条带级、并行块组级、并行块级等。例如,可将编码单元的最小尺寸确定为4×4。例如,可将变换块的最大尺寸确定为64×64。例如,可将变换块的最小尺寸确定为4×4。
可在编码单元的更高等级用信号传送或确定与四叉树的叶节点相应的编码单元的最小尺寸(四叉树最小尺寸)的信息和/或多类型树的从根节点到叶节点的最大深度(多类型树的最大树深度)的信息。例如,所述更高等级可以是序列级、画面级、条带级、并行块组级、并行块级等。可针对帧内画面条带和帧间画面条带中的每一个用信号传送或确定四叉树的最小尺寸的信息和/或多类型树的最大深度的信息。
可在编码单元的更高等级用信号传送或确定CTU的尺寸与变换块的最大尺寸之间的差信息。例如,所述更高等级可以是序列级、画面级、条带级、并行块组级、并行块级等。可基于编码树单元的尺寸和所述差信息来确定与二叉树的各个节点相应的编码单元的最大尺寸(在下文中,称为二叉树的最大尺寸)的信息。与三叉树的各个节点相应的编码单元的最大尺寸(在下文中,称为三叉树的最大尺寸)可依据条带的类型而变化。例如,针对帧内画面条带,三叉树的最大尺寸可以是32×32。例如,针对帧间画面条带,三叉树的最大尺寸可以是128×128。例如,可将与二叉树的各个节点相应的编码单元的最小尺寸(在下文中,称为二叉树的最小尺寸)和/或与三叉树的各个节点相应的编码单元的最小尺寸(在下文中,称为三叉树的最小尺寸)设置为编码块的最小尺寸。
作为另一示例,可在条带级用信号传送或确定二叉树的最大尺寸和/或三叉树的最大尺寸。可选地,可在条带级用信号传送或确定二叉树的最小尺寸和/或三叉树的最小尺寸。
依据上述各种块的尺寸信息和深度信息,四元分区信息、多类型树分区指示信息、分区树信息和/或分区方向信息可被包括在比特流中或可不被包括在比特流中。
例如,当编码单元的尺寸不大于四叉树的最小尺寸时,该编码单元不包括四元分区信息。因此,可从第二值推断四元分区信息。
例如,当与多类型树的节点相应的编码单元的尺寸(水平尺寸和垂直尺寸)大于二叉树的最大尺寸(水平尺寸和垂直尺寸)和/或三叉树的最大尺寸(水平尺寸和垂直尺寸)时,该编码单元可不被二元分区或三元分区。因此,可不用信号传送多类型树分区指示信息,而是可从第二值推断多类型树分区指示信息。
可选地,当与多类型树的节点相应的编码单元的尺寸(水平尺寸和垂直尺寸)与二叉树的最大尺寸(水平尺寸和垂直尺寸)相同,和/或是三叉树的最大尺寸(水平尺寸和垂直尺寸)的两倍大时,该编码单元可不进一步被二元分区或三元分区。因此,可不用信号传送多类型树分区指示信息,而是可从第二值推导多类型树分区指示信息。这是因为,当按照二叉树分区结构和/或三叉树分区结构对编码单元进行分区时,产生了小于二叉树的最小尺寸和/或三叉树的最小尺寸的编码单元。
可选地,可基于虚拟管线数据单元的尺寸(在下文中,管线缓冲器大小)来限制二叉树分区或三叉树分区。例如,当通过二叉树分区或三叉树分区将编码单元划分为不适合管线缓冲器大小的子编码单元时,相应的二叉树分区或三叉树分区可能受到限制。管线缓冲器大小可以是最大变换块的尺寸(例如,64×64)。例如,当管线缓冲器大小是64×64时,可限制下面的划分。
-针对编码单元的N×M(N和/或M是128)三叉树分区
-针对编码单元的沿水平方向的128×N(N<=64)二叉树分区
-针对编码单元的沿垂直方向的N×128(N<=64)二叉树分区
可选地,当与多类型树的节点相应的编码单元的深度等于多类型树的最大深度时,可不对该编码单元进一步进行二元分区和/或三元分区。因此,可不用信号传送多类型树分区指示信息,而是可从第二值推断多类型树分区指示信息。
可选地,只有当垂直方向二叉树分区、水平方向二叉树分区、垂直方向三叉树分区和水平方向三叉树分区中的至少一个对于与多类型树的节点相应的编码单元是可行的时,才可用信号传送多类型树分区指示信息。否则,可不对该编码单元进行二元分区和/或三元分区。因此,可不用信号传送多类型树分区指示信息,而是可从第二值推断多类型树分区指示信息。
可选地,只有当垂直方向二叉树分区和水平方向二叉树分区两者或者垂直方向三叉树分区和水平方向三叉树分区两者对于与多类型树的节点相应的编码单元是可行的时,才可用信号传送分区方向信息。否则,可不用信号传送分区方向信息,而是可从指示可能的分区方向的值推断分区方向信息。
可选地,只有当垂直方向二叉树分区和垂直方向三叉树分区两者或者水平方向二叉树分区和水平方向三叉树分区两者对于与多类型树的节点相应的编码树是可行的时,才可用信号传送分区树信息。否则,可不用信号传送分区树信息,而是可从指示可能的分区树结构的值推断分区树信息。
图4是示出帧内预测处理的示图。
图4中的从中心到外部的箭头可表示帧内预测模式的预测方向。
可通过使用当前块的邻近块的参考样点来执行帧内编码和/或解码。邻近块可以是重建的邻近块。例如,可通过使用包括在重建的邻近块中的参考样点的值或编码参数来执行帧内编码和/或解码。
预测块可表示通过执行帧内预测产生的块。预测块可与CU、PU和TU中的至少一个相应。预测块的单元可具有CU、PU和TU中的一个的尺寸。预测块可以是尺寸为2×2、4×4、16×16、32×32或64×64等的正方形块,或者可以是尺寸为2×8、4×8、2×16、4×16和8×16等的矩形块。
可根据针对当前块的帧内预测模式来执行帧内预测。当前块可具有的帧内预测模式的数量可以是固定值,并且可以是根据预测块的属性不同地确定的值。例如,预测块的属性可包括预测块的尺寸和预测块的形状等。
不管块尺寸为多少,可将帧内预测模式的数量固定为N。可选地,帧内预测模式的数量可以是3、5、9、17、34、35、36、65或67等。可选地,帧内预测模式的数量可根据块尺寸或颜色分量类型或者块尺寸和颜色分量类型两者而变化。例如,帧内预测模式的数量可根据颜色分量是亮度信号还是色度信号而变化。例如,随着块尺寸变大,帧内预测模式的数量可增加。可选地,亮度分量块的帧内预测模式的数量可大于色度分量块的帧内预测模式的数量。
帧内预测模式可以是非角度模式或角度模式。非角度模式可以是DC模式或平面模式,并且角度模式可以是具有特定方向或角度的预测模式。帧内预测模式可由模式编号、模式值、模式数字、模式角度和模式方向中的至少一个来表示。帧内预测模式的数量可以是大于1的M,包括非角度模式和角度模式。为了对当前块进行帧内预测,可执行确定是否可将包括在重建的邻近块中的样点用作当前块的参考样点的步骤。当存在不能用作当前块的参考样点的样点时,通过对包括在重建的邻近块中的样点中的至少一个样点值进行复制或执行插值或者执行复制和插值两者而获得的值可被用于替换样点的不可用样点值,因此,经过替换的样点值被用作当前块的参考样点。
图7是示出能够用于帧内预测的参考样点的示图。
如在图7中所示出的,参考样点线0至参考样点线3中的至少一个可被用于当前块的帧内预测。在图7中,可分别用最接近片段B和片段E的样点来填充片段A和片段F的样点,来代替从重建的邻近块检索。可用信号传送指示将被用于当前块的帧内预测的参考样点线的索引信息。例如,在图7中,可用信号传送参考样点线指示符0、1和2作为指示参考样点线0、1和2的索引信息。在当前块的上方边界是CTU的边界时,仅参考样点线0可以是可用的。因此,在这种情况下,可以不用信号传送索引信息。当使用除了参考样点线0之外的参考样点线时,可以不执行稍后将描述的针对预测块的滤波。
当进行帧内预测时,可基于帧内预测模式和当前块尺寸将滤波器应用于参考样点和预测样点中的至少一个。
在平面模式的情况下,当产生当前块的预测块时,根据预测目标样点在预测块内的位置,可通过使用当前块的上侧参考样点与左侧参考样点以及当前块的右上侧参考样点与左下侧参考样点的加权和来产生预测目标样点的样点值。此外,在DC模式的情况下,当产生当前块的预测块时,可使用当前块的上侧参考样点与左侧参考样点的平均值。此外,在角度模式的情况下,可通过使用当前块的上侧参考样点、左侧参考样点、右上侧参考样点和/或左下侧参考样点来产生预测块。为了产生预测样点值,可执行实数单位的插值。
在颜色分量之间的帧内预测的情况下,可基于第一颜色分量的相应重建块来产生当前块的第二颜色分量的预测块。例如,第一颜色分量可以是亮度分量,并且第二颜色分量可以是色度分量。对于颜色分量之间的帧内预测,可基于模板推导第一颜色分量与第二颜色分量之间的线性模型的参数。模板可包括当前块的上方邻近样点和/或左侧邻近样点以及与其相应的第一颜色分量的重建块的上方邻近样点和/或左侧邻近样点。例如,可使用模板中的样点中的具有最大值的第一颜色分量的样点值和与其相应的第二颜色分量的样点值、以及模板中的样点中的具有最小值的第一颜色分量的样点值和与其相应的第二颜色分量的样点值推导线性模型的参数。当推导线性模型的参数时,可将相应重建块应用于线性模型以产生当前块的预测块。根据视频格式,可对第一颜色分量的重建块的邻近样点和相应重建块执行子采样。例如,当第二颜色分量的一个样点与第一颜色分量的四个样点相应时,可对第一颜色分量的四个样点进行子采样以计算一个相应样点。在此情况下,可基于相应子采样的样点执行线性模型的参数推导和颜色分量之间的帧内预测。可将是否执行颜色分量之间的帧内预测和/或模板的范围用信号传送为帧内预测模式。
可沿水平方向或垂直方向将当前块分区为两个或四个子块。可顺序地重建分区出的子块。也就是说,可对子块执行帧内预测以产生子预测块。另外,可对子块执行反量化和/或逆变换以产生子残差块。可通过将子预测块与子残差块相加来产生重建的子块。重建的子块可被用作子子块的帧内预测的参考样点。子块可以是包括预定数量(例如,16)或更多个样点的块。因此,例如,在当前块是8×4块或4×8块时,可将当前块分区为两个子块。此外,在当前块为4×4块时,可以不将当前块分区为子块。在当前块具有其它尺寸时,可将当前块分区为四个子块。可用信号传送关于是否基于子块和/或分区方向(水平或垂直)执行帧内预测的信息。基于子块的帧内预测可限于仅在使用参考样点线0时执行。当执行基于子块的帧内预测时,可以不执行稍后将描述的针对预测块的滤波。
可通过对帧内预测的预测块执行滤波来产生最终预测块。可通过将预定权重应用于滤波目标样点、左侧参考样点、上方参考样点和/或左上方参考样点来执行滤波。可基于块尺寸、帧内预测模式和预测块中的滤波目标样点的位置中的至少一个来确定用于滤波的权重和/或参考样点(范围、位置等)。可仅在预定帧内预测模式(例如,DC、平面、垂直、水平、对角线和/或相邻对角线模式)的情况下执行滤波。相邻对角线模式可以是将对角线模式与k相加或将对角线模式与k相减的模式。例如,k可以是8或更小的正整数。
可通过预测与当前块相邻存在的块的帧内预测模式来对当前块的帧内预测模式进行熵编码/熵解码。在当前块与邻近块的帧内预测模式相同时,可通过使用预定标志信息来用信号传送当前块与邻近块的帧内预测模式相同的信息。此外,可用信号传送多个邻近块的帧内预测模式中的与当前块的帧内预测模式相同的帧内预测模式的指示符信息。在当前块与邻近块的帧内预测模式不同时,可通过基于邻近块的帧内预测模式执行熵编码/熵解码来对当前块的帧内预测模式信息进行熵编码/熵解码。
图5是示出帧间画面预测处理的实施例的示图。
在图5中,矩形可表示画面。在图5中,箭头表示预测方向。根据画面的编码类型,可将画面分类为帧内画面(I画面)、预测画面(P画面)和双预测画面(B画面)。
可在不需要帧间画面预测的情况下通过帧内预测对I画面进行编码。可通过使用在相对于当前块的一个方向(即,正向或后向)上存在的参考画面,通过帧间画面预测来对P画面进行编码。可通过使用在相对于当前块的两个方向(即,正向和后向)上预设的参考画面,通过帧间画面预测来对B画面进行编码。当使用帧间画面预测时,编码器可执行帧间画面预测或运动补偿,并且解码器可执行相应的运动补偿。
在下文中,将对帧间画面预测的实施例进行详细描述。
可使用参考画面和运动信息来执行帧间画面预测或运动补偿。
可通过编码设备100和解码设备200中的每一个在帧间画面预测期间推导当前块的运动信息。可通过使用重建的邻近块的运动信息、同位块(也称为col块或共同定位块)的运动信息和/或与同位块相邻的块的运动信息来推导当前块的运动信息。同位块可表示先前重建的同位画面(也称为col画面或共同定位画面)内的在空间上与当前块位于相同位置的块。同位画面可以是包括在参考画面列表中的一个或更多个参考画面中的一个画面。
运动信息的推导方法可取决于当前块的预测模式而不同。例如,应用于帧间预测的预测模式包括AMVP模式、合并模式、跳过模式、具有运动矢量差的合并模式、子块合并模式、几何分区模式、组合帧间帧内预测模式、仿射模式等。这里,合并模式可被称为运动合并模式。
例如,当AMVP被用作预测模式时,可将重建的邻近块的运动矢量、同位块的运动矢量、与同位块相邻的块的运动矢量和(0,0)运动矢量中的至少一个确定为针对当前块的运动矢量候选,并且通过使用运动矢量候选产生运动矢量候选列表。可通过使用产生的运动矢量候选列表来推导当前块的运动矢量候选。可基于推导的运动矢量候选来确定当前块的运动信息。同位块的运动矢量或与同位块相邻的块的运动矢量可被称为时间运动矢量候选,并且重建的邻近块的运动矢量可被称为空间运动矢量候选。
编码设备100可计算当前块的运动矢量与运动矢量候选之间的运动矢量差(MVD),并且可对运动矢量差(MVD)执行熵编码。此外,编码设备100可对运动矢量候选索引执行熵编码并产生比特流。运动矢量候选索引可指示包括在运动矢量候选列表中的运动矢量候选中的最佳运动矢量候选。解码设备可对包括在比特流中的运动矢量候选索引执行熵解码,并且可通过使用经过熵解码的运动矢量候选索引从包括在运动矢量候选列表中的运动矢量候选中选择解码目标块的运动矢量候选。此外,解码设备200可将经过熵解码的MVD与通过熵解码而提取的运动矢量候选相加,从而推导解码目标块的运动矢量。
另外,编码设备100可对计算出的MVD的分辨率信息执行熵编码。解码设备200可使用MVD分辨率信息来调整熵解码的MVD的分辨率。
另外,编码设备100基于仿射模型计算当前块中的运动矢量与候选运动矢量之间的运动矢量差(MVD),并对MVD执行熵编码。解码设备200通过经由熵解码的MVD和仿射控制运动矢量候选的总和推导解码目标块的仿射控制运动矢量,来基于每一个子块推导运动矢量。
比特流可包括指示参考画面的参考画面索引。参考画面索引可通过编码设备100被熵编码,并且随后作为比特流被用信号传送到解码设备200。解码设备200可基于推导的运动矢量和参考画面索引信息来产生解码目标块的预测块。
推导当前的运动信息的方法的另一示例可以是合并模式。合并模式可表示合并多个块的运动的方法。合并模式可表示从邻近块的运动信息推导当前块的运动信息的模式。当应用合并模式时,可使用重建的邻近块的运动信息和/或同位块的运动信息来产生合并候选列表。运动信息可包括运动矢量、参考画面索引和帧间画面预测指示符中的至少一个。预测指示符可指示单向预测(L0预测或L1预测)或双向预测(L0预测和L1预测)。
合并候选列表可以是所存储的运动信息的列表。包括在合并候选列表中的运动信息可以是以下各项中的至少一个:与当前块相邻的邻近块的运动信息(空间合并候选)、在参考画面中的与当前块同位的块的运动信息(时间合并候选)、通过存在于合并候选列表中的运动信息的组合产生的新运动信息、作为在当前块之前被编码/解码的块的运动信息(基于历史的合并候选)和零合并候选。
编码设备100可通过对合并标志和合并索引中的至少一个执行熵编码来产生比特流,并且可将比特流用信号传送到解码设备200。合并标志可以是指示是否针对每一个块执行合并模式的信息,并且合并索引可以是指示当前块的邻近块中的哪个邻近块是合并目标块的信息。例如,当前块的邻近块可包括在当前块的左侧的左侧邻近块、被布置在当前块上方的上方邻近块和在时间上与当前块相邻的时间邻近块。
另外,编码设备100对合并候选的运动信息中的用于校正运动矢量的校正信息执行熵编码,并将其用信号传送给解码设备200。解码设备200可基于校正信息校正由合并索引选择的合并候选的运动矢量。这里,校正信息可包括关于是否执行校正的信息、校正方向信息和校正大小信息中的至少一个。如上所述,基于用信号传送的校正信息校正合并候选的运动矢量的预测模式可被称为具有运动矢量差的合并模式。
跳过模式可以是将邻近块的运动信息按照原样应用于当前块的模式。当应用跳过模式时,编码设备100可对哪个块的运动信息将被用作当前块的运动信息的事实的信息执行熵编码以产生比特流,并且可将比特流用信号传送到解码设备200。编码设备100可以不将关于运动矢量差信息、编码块标志和变换系数等级中的至少任意一个的语法元素用信号传送到解码设备200。
子块合并模式可表示以编码块(CU)的子块为单位推导运动信息的模式。当应用子块合并模式时,可使用参考图像中的与当前子块同位的子块的运动信息(基于子块的时间合并候选)和/或仿射控制点运动矢量合并候选来产生子块合并候选列表。
几何分区模式可表示通过将当前块分区为预定方向来推导运动信息、使用所推导出的运动信息中的每一个来推导每一个预测样点、并且通过对所推导出的预测样点中的每一个进行加权来推导当前块的预测样点的模式。
帧间-帧内组合预测模式可表示通过对由帧间预测产生的预测样点和由帧内预测产生的预测样点进行加权来推导当前块的预测样点的模式。
解码设备200可自行校正推导的运动信息。解码设备200可基于由推导出的运动信息指示的参考块搜索预定区域,并且推导具有最小SAD的运动信息作为校正的运动信息。
解码设备200可使用光流补偿经由帧间预测推导出的预测样点。
图6是示出变换和量化处理的示图。
如在图6中所示出的,对残差信号执行变换处理和/或量化处理以产生量化的等级信号。残差信号是原始块与预测块(即,帧内预测块或帧间预测块)之间的差。预测块是通过帧内预测或帧间预测产生的块。变换可以是初级变换、次级变换或者初级变换和次级变换两者。对残差信号进行初级变换产生变换系数,并且对该变换系数进行次级变换产生次级变换系数。
从各种预先定义的变换方案中选择的至少一种方案用于执行初级变换。例如,预定义的变换方案的示例包括离散余弦变换(DCT)、离散正弦变换(DST)和卡洛南-洛伊变换(Karhunen-Loève,KLT)。通过初级变换产生的变换系数可经历次级变换。可根据当前块和/或当前块的邻近块的编码参数来确定用于初级变换和/或次级变换的变换方案。可选地,可用信号传送指示变换方案的变换信息。基于DCT的变换可包括例如DCT-2、DCT-8等。基于DST的变换可包括例如DST-7。
可通过对残差信号或执行初级变换和/或次级变换的结果执行量化来产生量化的等级信号(量化系数)。取决于块的帧内预测模式或块尺寸/形状,可根据对角线右上扫描、垂直扫描和水平扫描中的至少一个来对量化的等级信号进行扫描。例如,当沿对角线右上扫描对系数进行扫描时,块形式的系数改成为一维矢量形式。除了对角线右上扫描之外,可根据变换块的尺寸和/或帧内预测模式使用水平地对二维块形式的系数进行扫描的水平扫描或垂直地对二维块形式的系数进行扫描的垂直扫描。扫描的量化的等级系数可被熵编码以插入比特流中。
解码器对比特流进行熵解码以获得量化的等级系数。可通过反向扫描以二维块形式排列量化的等级系数。对于反向扫描,可使用对角线右上扫描、垂直扫描和水平扫描中的至少一个。
然后,可对量化的等级系数进行反量化,随后根据需要进行次级逆变换,并且最后根据需要进行初级逆变换,以产生重建的残差信号。
可在环内滤波之前针对通过帧内预测或帧间预测重建的亮度分量执行动态范围中的逆映射。动态范围可被划分为16个相等的片段,并且针对每一个片段的映射函数可用信号被传送。可在条带级或并行块组级用信号传送映射函数。可基于映射函数推导用于执行逆映射的逆映射函数。在逆映射区域中执行环内滤波、参考画面存储和运动补偿,并且经由使用映射函数的映射将通过帧间预测产生的预测块转换为映射区域,然后将其用于产生重建块。然而,由于在映射区域中执行帧内预测,因此经由帧内预测产生的预测块可被用于产生重建块而无需映射/逆映射。
在当前块是色度分量的残差块时,可通过对映射区域的色度分量执行缩放来将残差块转换为逆映射区域。可在条带级或并行块组级用信号传送缩放的可用性。只有当针对亮度分量的映射可用并且亮度分量的划分和色度分量的划分遵循相同的树结构时,才可应用缩放。可基于与色差块相应的亮度预测块的样点值的平均值来执行缩放。在此情况下,在当前块使用帧间预测时,亮度预测块可表示映射的亮度预测块。可通过使用亮度预测块的样点值的平均值所属的片段的索引参照查找表来推导缩放所必需的值。最后,通过使用推导的值对残差块进行缩放,可将残差块转换到逆映射区域。然后,可在逆映射区域中执行色度分量块恢复、帧内预测、帧间预测、环内滤波和参考画面存储。
可通过序列参数集用信号传送指示亮度分量和色度分量的映射/逆映射是否可用的信息。
可基于指示当前画面中的当前块与参考块之间的位移的块矢量来产生当前块的预测块。以这种方式,用于参考当前画面产生预测块的预测模式被称为帧内块复制(IBC)模式。IBC模式可被应用于M×N(M<=64,N<=64)编码单元。IBC模式可包括跳过模式、合并模式、AMVP模式等等。在跳过模式或合并模式的情况下,构建合并候选列表,并且用信号传送合并索引,使得一个合并候选可被指定。指定的合并候选的块矢量可被用作当前块的块矢量。合并候选列表可包括空间候选、基于历史的候选、基于两个候选的平均值的候选和零合并候选中的至少一个。在AMVP模式的状况下,可用信号传送差块矢量。另外,可从当前块的左侧邻近块和上方邻近块推导预测块矢量。可用信号传送关于将使用的邻近块的索引。IBC模式下的预测块被包括在当前CTU或左侧CTU中并且限于已重建的区域中的块。例如,块矢量的值可被限制,使得当前块的预测块位于按编码/解码顺序在当前块所属的64×64块之前的三个64×64块的区域中。通过以此方式限制块矢量的值,可减少根据IBC模式实施方案的存储器消耗和装置复杂度。
在下文中,将详细描述根据本公开的若干实施例的几何帧间预测编码/解码方法。
在以下描述中,几何帧间预测模式、几何分区(GEO)和几何分区模式(GPM)都可被用作相同的含义。
图8是示出根据本公开的实施例的图像解码方法的示图。
参照图8,根据本公开实施例的图像解码方法可包括:对当前块的帧间预测信息进行解码(S810),确定当前块的帧间预测模式(S820),推导当前块的帧间预测候选(S830)并且/或者确定/获取当前块的运动信息(S840)。
图9是示出根据本公开的实施例的图像编码方法的示图。
参照图9,根据本公开实施例的图像编码方法可包括:确定当前块的帧间预测模式(S910),推导当前块的帧间预测候选(S920),确定/获取当前块的运动信息(S930),并且/或者对当前块的帧间预测信息进行编码(S940)。
图10是示出根据本公开的另一实施例的图像解码方法的示图。
参照图10,根据本公开的另一实施例的图像解码方法可包括:产生当前块的第一预测块(S1010),产生当前块的第二预测块(S1020),并且/或者使用第一预测块与第二预测块的样点单位加权和来产生当前块的最终预测样点(S1030)。
此时,可基于当前亮度样点的位置和用于对当前块进行分区的GPM边界线来确定用于样点单位加权和的权重。
图11是示出根据本公开的另一实施例的图像编码方法的示图。
参照图11,根据本公开的另一实施例的图像编码方法可包括:产生当前块的第一预测块(S1110),产生当前块的第二预测块(S1120),使用第一预测块与第二预测块的样点单位加权和来产生当前块的最终预测样点(S1130),并且/或者对用于样点单位加权和的权重相关信息进行编码(S1140)。
此时,可基于当前亮度样点的位置和用于对当前块进行的GPM边界线来确定权重相关信息。
在下文中,将详细描述图8和图9的步骤。
首先,将详细描述确定当前块的帧间预测模式的步骤S820和S910。
根据本公开的若干实施例,当前块的预测模式可被确定为跳过模式、合并模式或AMVP模式中的至少一个。
例如,可将当前块的帧间预测模式确定为合并模式。在此情况下,可使用邻近块的运动信息推导当前块的预测块。例如,可使用邻近块的运动信息执行当前块的帧间预测,并且可推导其残差块。此时,用于预测的邻近块可被确定为对预测信息和残差块进行编码/解码消耗最小代价的邻近块。
作为另一示例,可将当前块的帧间预测模式确定为跳过模式。在此情况下,可使用邻近块的运动信息推导当前块的预测块。如果应用跳过模式,则可以不产生残差块。
作为另一示例,可将当前块的帧间预测模式确定为AMVP模式。在此情况下,可使用邻近块的运动信息推导当前块的预测块。如果应用AMVP模式,则可通过邻近块推导当前块的预测运动信息,并且可基于预测运动信息通过另外的搜索/操作推导当前块的预测块。
另外,当前块的预测模式可被确定为基于子块的合并模式、基于子块的跳过模式、基于子块的AMVP模式、MMVD、CIIP模式和三角形分区模式中的至少一个预测模式,或者可被确定为合并模式、跳过模式或AMVP模式中的至少一个与上述预测模式中的至少一个预测模式的组合。此时,可使用诸如用信号传送的标志、索引等的信息来确定当前块的预测模式。作为另一示例,可在没有基于编码参数的信号传送的情况下确定当前块的预测模式。
如果将当前块的预测模式确定为基于子块的预测模式,则当前块可被分区为M个子块,从而确定M条帧间预测信息。此时,子块的尺寸可以是4×4、4×8、8×4、4×16、16×4……2N×N或N×2N中的至少一个,并且可被预先设置为预定尺寸。
例如,可将当前块的帧间预测模式确定为基于子块的合并模式。可使用ATMVP模式或仿射模式中的至少一个执行当前块的基于子块的合并模式。也就是说,当前块的帧间预测模式是ATMVP或仿射模式,基于子块的合并模式是可应用的。
如果基于子块的合并模式被应用于当前块,则可通过合并索引和残差信号来配置并用信号传送预测信息。此时,消耗最小代价的邻近块的子块单元运动信息可被用于对当前块进行编码/解码。
作为另一示例,可将当前块的帧间预测模式确定为基于子块的跳过模式。如果基于子块的跳过模式被应用于当前块,则可通过合并索引和残差信号来配置并用信号传送预测信息。此时,消耗最小代价的邻近块的子块单元运动信息可被用于对当前块的编码/解码。如果基于子块的跳过模式被应用,则邻近块的子块单元运动信息可被用作当前块的子块单元运动信息,但可以不推导根据预测的残差块。
作为另一示例,可将当前块的帧间预测模式确定为基于子块的AMVP模式。在当前块的预测模式为仿射模式时,基于子块的AMVP模式是可应用的。如果当前块的子块单元AMVP模式被应用,则可基于AMVP索引、运动矢量差、参考画面索引、参考方向或残差信号中的至少一个来配置预测信息并用信号传送预测信息。此时,消耗最小代价的邻近块的子块单元运动信息可被用于对当前块的编码/解码。
作为另一示例,可将当前块的预测模式确定为MMVD模式。当合并模式、跳过模式、基于子块的合并模式或基于子块的跳过模式中的至少一个被应用于当前块时,MMVD模式是可应用的。如果MMVD模式被应用于当前块,则可将运动矢量校正值或运动矢量校正方向中的至少一个作为MMVD预测信息用信号传送。也就是说,可通过用信号传送邻近块的运动信息以及MMVD预测信息来执行对当前块的编码/解码。
接下来,将详细描述推导当前块的帧间预测候选的步骤S830和S920。
可使用空间邻近块的帧间预测信息、时间邻近块的帧间预测信息、基于历史的运动矢量预测因子(HMVP)、复合(composite)帧间预测信息、组合仿射帧间预测信息、继承的仿射帧间预测信息、ATMVP或STMVP中的至少一个来推导帧间预测候选。此时,帧间预测候选可包括关于运动矢量、参考方向、参考画面索引、残差信号或CPMV中的至少一个的信息。可推导出一个或更多个帧间预测候选列表。
此时,CPMV可以是用于在仿射模式下对当前块进行编码/解码的运动矢量。例如,CPMV可以是在仿射模式下编码的左上方位置、右上方位置或左下方位置的块的运动信息。
ATMVP可表示使用从基于预定顺序确定的空间邻近块推导出的运动信息而确定的子块单元运动信息。ATMVP可被称为基于子块的TMVP(SbTMVP)。
如果仿射模式被应用,则可使用包括在邻近块中的子块的运动矢量CPMV推导当前块的CPMV。可使用推导出的CPMV推导当前块的子块单元运动信息。
STMVP可以是通过子块单元的空间邻近块与子块单元的时间邻近块的帧间预测信息的组合推导出的运动信息。
图12是示出基于历史的运动矢量预测因子(HMVP)候选列表的方法的示图。
HMVP可表示被确定为在当前块之前被编码/解码的块的运动信息的运动信息。使用HMVP推导出的帧间预测候选可被定义为HMVP候选。
如在图12中所示出的,可使用预编码/预解码块的运动信息来推导候选列表。例如,可使用预编码/预解码块的运动信息推导HMVP候选列表。如果当前块的帧间预测候选列表被推导出,则HMVP候选列表的一条或更多条运动信息(或候选)可被使用。
例如,可使用HMVP候选列表的至少一个HMVP候选的运动信息推导合并候选列表。作为另一示例,可使用HMVP候选列表的至少一个HMVP候选的运动信息来推导AMVP候选列表。如果当前块或预测块的运动信息被最后编码/解码,则可将块的运动信息添加到HMVP候选列表。
图13是示出可在本发明的若干实施例中使用的空间邻近块的示图,图14是示出可在本发明的若干实施例中使用的时间邻近块的示图。
如果当前块的帧间预测模式被确定为合并模式,则可推导合并候选列表。
例如,合并候选列表可由N条帧间预测信息组成。可使用空间邻近块的帧间预测信息、时间邻近块的帧间预测信息、复合帧间预测信息、STMVP、ATMVP、HMVP或零运动信息中的至少一个推导合并候选列表。此时,N可以是正整数,诸如6。
空间邻近块的帧间预测信息可表示位于图13的A、B、…、J和K处的帧间预测信息。此时,邻近块的尺寸可为M×N。另外,M或N可以是2、4、8、16、32、64或128中的至少一个。
例如,如果邻近块的空间运动信息被推导出,则可按照J、B、K、A和F的顺序推导运动信息。通过空间邻近块推导出的运动信息可被定义为空间合并候选。
时间邻近块的帧间预测信息可表示位于预编码/预解码画面的与图14的位置a、位置b、位置c、位置d、位置e、位置f、位置g、位置h和位置e的块相应的块中的帧间预测信息。通过时间邻近块推导出的运动信息可被定义为时间合并候选。
复合帧间预测信息可表示通过存在于组合合并候选列表中的合并候选的运动信息中的至少一个而推导出的运动信息。例如,可通过存在于合并候选列表中的N个运动候选的运动矢量的组合来推导复合帧间预测信息的运动矢量。例如,N可以是2。可使用存在于合并候选列表中的N个运动候选的运动矢量的平均值来推导组合帧间预测信息的运动矢量。
可将HMVP候选顺序地添加到合并候选列表。如果已添加的合并候选的运动信息与将被添加的HMVP的运动信息相同,则可以不将运动信息添加到合并候选列表。
如果包括在合并候选列表中的候选的数量不满足合并候选列表中的候选的最大数量,则可将由零运动信息(零运动矢量)组成的零合并候选添加到合并候选列表,直到包括在合并候选列表中的候选的数量变为合并候选列表的候选的最大数量。
如果当前块的帧间预测模式被确定为AMVP模式,则可推导AMVP候选列表。
例如,AMVP候选列表可由N条帧间预测信息组成。AMVP候选可由包括运动矢量、参考方向和运动矢量差的运动信息组成。可使用空间邻近块的帧间预测信息、时间邻近块的帧间预测信息、HMVP或零运动信息中的至少一个来推导AMVP候选列表。例如,N可以是2。
空间邻近块的帧间预测信息可表示存在于图13的位置A、位置B、…、位置J和位置K处的块的帧间预测信息。可按照预定顺序从空间邻近块推导一个或更多个候选。使用空间邻近块推导出的运动信息可被定义为空间AMVP候选。
例如,左侧邻近块可以是块A、块B、块C、块D和块E中的一个,并且可按照预定顺序推导空间AMVP候选。例如,如果从左侧邻近块推导空间AMVP候选,则可按照块A和块B的顺序推导空间AMVP候选。
另外,顶部邻近块可以是块F、块G、块H、块I、块J和块K中的一个,并且可按照预定顺序推导空间AMVP候选。例如,如果从顶部邻近块推导空间AMVP候选,则可按照块K、块J和块F的顺序推导出空间AMVP候选。
在基于预定顺序推导空间AMVP候选的情况下,如果与当前顺序相应的邻近块的运动信息不可用,则可顺序地推导与下一顺序相应的块的运动信息。
时间邻近块的帧间预测信息可表示存在于在预编码/预解码画面中包括的时间邻近块中的帧间预测信息。此时,时间邻近块可表示在与当前块的位置相应的位置处的块。例如,时间邻近块的位置可与右下方、中心和预定位置中的至少一个相应。通过时间邻近块推导出的运动信息可被定义为时间AMVP候选。
例如,时间邻近块可与预编码/预解码画面的块a或块b中的至少一个相应。作为另一示例,时间邻近块可被确定为预编码/预解码画面的块c、块d和块e以及另一预编码/解码画面的块f、块g和块h中的至少一个。
可将HMVP候选顺序地添加到AMVP候选列表。如果已添加的AMVP候选的运动信息与将被添加的HMVP的运动信息相同,则可以不将运动信息添加到AMVP候选列表。
如果包括在AMVP候选列表中的候选的数量不满足AMVP候选列表中的候选的最大数量,则可将由零运动信息(零运动矢量)组成的零AMVP候选添加到AMVP候选列表,直到包括在AMVP候选列表中的候选的数量变为AMVP候选列表的候选的最大数量。
如果当前块的帧间预测模式被确定为基于子块的合并模式,则可以以子块为单位推导合并候选列表。例如,子块单元的合并候选列表可由N条帧间预测信息组成。
可使用ATMVP、继承的仿射帧间预测信息、组合仿射帧间预测信息或零仿射运动预测信息中的至少一个来配置子块单元合并候选列表。
图15是示出控制点运动矢量(CPMV)的示图。
继承的仿射帧间预测信息可以是从在仿射模式下编码/解码的空间邻近块的CPMV推导出的CPMV。空间邻近块的CPMV可以是在仿射模式下编码/解码的块的左上方位置、右上方位置和/或左下方位置处的子块单元运动矢量。另外,可通过将基于当前块和邻近块的宽度和高度的缩放应用于邻近块的CPMV来推导当前块的CPMV。可从图15的位置A、位置B、…、位置H和位置O处的空间邻近块推导CPMV,并且可按照预定顺序推导由至少两个CPMV组合组成的一个或更多个继承的仿射候选。
例如,两个CPMV组合可以是在当前块的左上方位置和右上方位置处推导出的子块单元运动矢量组合。推导出两个CPMV的仿射模式可被定义为4参数模式。
作为另一示例,三个CPMV组合可以是在当前块的左上方、右上方和左下方位置处推导出的子块单元运动矢量组合。推导出三个CPMV的仿射模式可被定义为6参数模式。
可通过与左上方(CP1)位置、右上方(CP2)位置、左下方(CP3)位置和右下方(CP4)位置相邻的邻近块的运动矢量的组合来推导出组合仿射帧间预测信息。此时,可推导出由至少两个CPMV组合组成的候选。另外,如果用于推导CPMV组合的邻近块的所有运动矢量具有相同的参考索引,则可将组合仿射候选添加到子块单元合并候选列表。
例如,可将图15的位置H、位置I和位置G的第一存在/可用运动矢量确定为作为左上方CPMV的CP1。
作为另一示例,可将图15的位置N和位置O的第一存在/可用运动矢量确定为作为右上方CPMV的CP2。
作为另一示例,可将图15的位置B和位置A的第一存在/可用运动矢量确定为作为左下方CPMV的CP3。
作为另一示例,可将存在于在图15的画面之前编码/解码的画面的参考块P的位置处的运动矢量确定为作为右下方CPMV的CP4。
此时,按照{CP1,CP2,CP3}、{CP1,CP2,CP4}、{CP1,CP3,CP4}、{CP2,CP3,CP4}、{CP1,CP2}和{CP1,CP3}的顺序组合四个CPMV(CP1、CP2,CP3、CP4)以推导组合仿射候选,并且任一候选的CP具有相同的参考索引,可将组合仿射候选添加到子块单元合并候选列表。
如果包括在子块单元合并候选列表中的候选的数量不满足子块单元合并候选列表的候选的最大数量,则可将由零运动信息(零CPMV)组成的零子块单元合并候选添加到子块单元合并候选列表,直到包括在子块单元合并候选列表中的候选的数量变为子块单元合并候选列表的候选的最大数量。
如果当前块的帧间预测模式被确定为子块单元跳过模式,则可以以子块为单位推导跳过合并候选列表。例如,子块单元跳过合并候选列表可由N条帧间预测信息组成。推导子块单元跳过合并候选列表的方法可相当于推导子块单元合并候选列表的方法。
如果当前块的帧间预测模式被确定为基于子块的AMVP模式,则可以以子块为单位推导AMVP候选列表。例如,子块单元的AMVP候选列表可由N条帧间预测信息组成。
可使用ATMVP、继承的仿射帧间预测信息、组合仿射帧间预测信息或零仿射运动预测信息中的至少一个来配置子块单元AMVP候选列表。
继承的仿射帧间预测信息可以是从在仿射模式下编码/解码的空间邻近块的CPMV推导出的CPMVP。空间邻近块的CPMV可以是在仿射模式下编码/解码的块的左上方位置、右上方位置或左下方位置处的子块单元运动矢量。另外,可通过将基于当前块和邻近块的宽度和高度的缩放应用于邻近块的CPMV来推导当前块的CPMVP。可从图15的位置A、位置B、…、位置H和位置O的空间邻近块推导CPMV,并且可推导由按照预定顺序推导出的至少两个CPMVP组合组成的一个或更多个继承的仿射候选。可通过CPMVP的另外的操作推导当前块的CPMV,并且可另外用信号传送CPMV与CPMVP之间的CPMVD(CPMV差)。
例如,两个CPMVP组合可以是在当前块的左上方位置和右上方位置处推导出的子块单元运动矢量组合。推导出两个CPMVP的仿射模式可被定义为4参数模式。
作为另一示例,三个CPMVP组合可以是在当前块的左上方位置、右上方位置和左下位置处推导出的子块单元运动矢量组合。推导出三个CPMVP的仿射模式可被定义为6参数模式。
此时,左侧邻近块可以是位置A、位置B、位置C、……、位置F和位置G处的块中的至少一个,并且可按照预定顺序推导至少一条帧间预测信息。例如,可按照图15的A和B的顺序推导一条或更多条帧间预测信息。
另外,顶部邻近块可以是位置H、位置I、位置J、……、位置N和位置O处的块中的至少一个,并且可按照预定顺序推导至少一条帧间预测信息。例如,可按照图15的O、N和H的顺序推导一条或更多条帧间预测信息。
可通过与左上方(CP1)位置、右上方(CP2)位置、左下方(CP3)位置、右下方(CP4)位置相邻的邻近块的运动矢量的组合推导组合仿射帧间预测信息。此时,可推导出由至少两个CPMVP组合组成的候选。另外,如果用于推导CPMVP组合的邻近块的所有运动矢量具有相同的参考索引,则可将组合仿射候选添加到子块单元AMVP候选列表。
例如,可将图15的位置H、位置I和位置G的第一存在/可用运动矢量确定为作为左上方CPMVP的CP1。
作为另一示例,可将图15的位置N和位置O的第一存在/可用运动矢量可确定为作为右上方CPMVP的CP2。
作为另一示例,可将图15的位置B和位置A的第一存在/可用运动矢量可确定为作为左下方CPMVP的CP3。
另外,例如,在4参数模式的情况下,左上方(CP1)和右上方(CP2)的运动矢量可被用作CPMVP组合。作为另一示例,在6参数模式的情况下,左上方(CP1)、右上方(CP2)和左下方(CP3)的运动矢量可被用作CPMVP组合。
如果包括在子块单元AMVP候选列表中的候选的数量不满足子块单元AMVP候选列表的候选的最大数量,则可将由零运动信息(零CPMVP)组成的零子块单元AMVP候选添加到子块单元AMVP候选列表,直到包括在子块单元AMVP候选列表中的候选的数量变为子块单元AMVP候选列表的候选的最大数量。
如果当前块的帧间预测模式被确定为MMVD模式,则可配置MMVD候选列表。例如,MMVD候选列表可由N条帧间预测信息组成。
可使用合并候选列表或AMVP候选列表来配置MMVD候选列表。例如,MMVD候选列表可由合并候选列表的两个顶部候选组成。作为另一示例,MMVD候选列表可由AMVP候选列表的两个顶部候选组成。
可通过组合MMVD候选、运动方向信息和运动尺寸信息来执行针对当前块的帧间预测。
例如,可针对候选的运动矢量用信号传送上方、下方、左侧和右侧的附加运动方向信息,并且可用信号传送指示[1/4,1/2,1,2,4,8,16,32]的至少一个尺寸的运动尺寸信息。
如果当前块的帧间预测模式被确定为CIIP模式,则可推导CIIP候选列表。例如,可将CIIP模式的帧间预测候选列表确定为合并候选列表。
CIIP模式可表示通过组合帧内预测和帧间预测而获得的预测模式。
例如,在推导CIIP模式的帧内预测模式时,可固定地使用特定帧内预测模式。作为另一示例,可使用最可能模式(MPM)推导CIIP模式的帧内预测模式。
可使用顶部邻近块和左侧邻近块的帧内预测模式来推导当前块的帧内预测模式。
例如,如果顶部邻近块的帧内预测模式与左侧邻近块的帧内预测模式相同,则可将该模式推导为当前块的帧内预测模式。作为另一示例,如果顶部邻近块的帧内预测模式与左侧邻近块的帧内预测模式不相同,则可将左侧邻近块的帧内预测模式推导为当前块的帧内预测模式。作为另一示例,如果顶部邻近块的帧内预测模式与左侧邻近块的帧内预测模式不相同,则可将顶部邻近块的帧内预测模式推导为当前块的帧内预测模式。
作为另一示例,如果顶部邻近块的帧内预测模式与左侧邻近块的帧内预测模式不相同并且顶部邻近块的帧内预测模式与左侧邻近块的帧内预测模式两者均为方向模式,则可将具有顶部邻近块的帧内预测模式值与左侧邻近块的帧内预测模式值的平均值的帧内预测模式推导为当前块的帧内预测模式。
作为另一示例,如果顶部邻近块的帧内预测模式与左侧邻近块的帧内预测模式不相同并且顶部邻近块的帧内预测模式和左侧邻近块的帧内预测模式中的至少一个为非方向模式,则可将该非方向帧内预测模式推导为当前块的帧内预测模式。
作为另一示例,如果顶部邻近块的帧内预测模式与左侧邻近块的帧内预测模式不相同并且顶部邻近块的帧内预测模式与左侧邻近块的帧内预测模式两者均为非方向模式,则可将平面(PLANAR)模式推导为当前块的帧内预测模式。
作为另一示例,如果针对顶部邻近块和左侧邻近块中的一个能够推导出帧内预测模式,则可将能够推导出帧内预测模式的块的帧内预测模式推导为当前块的帧内预测模式。
可通过根据帧内预测模式和帧间预测模式中的每一个预测模式的预测块的平均来推导出当前块的预测块。
在应用CIIP模式时,可根据位置B和位置J来确定所应用的权重。
例如,如果邻近块的帧内预测信息比例高,则可将大的权重分配给帧内预测模式。作为另一示例,如果邻近块的帧间预测信息比例高,则可将大的权重分配给帧间预测模式。作为另一示例,如果邻近块的预测模式比例相同,则可分配相同的权重。
图16是示出根据本公开的实施例的应用三角形预测模式(TPM)的方法的示图。
TPM可表示这样的预测模式:针对当前块产生多个预测块,并且通过将针对每一个预测位置的加权和应用于每一个预测块来产生当前块的最终预测块。作为TPM预测的结果,可通过以三角形形状对当前块进行分区来获取预测块。例如,TPM可应用于尺寸为8×8的块。
如果当前块的帧间预测模式被确定为TPM,则可推导针对TPM的候选列表(TPM候选列表)。针对TPM的候选列表可由N条帧间预测信息组成。此时,可按照与合并候选列表或AMVP候选列表相同的方式推导针对M的候选列表,或者可使用合并候选列表P候选列表推导针对TPM的候选列表。
例如,可使用合并候选列表来推导TPM候选列表。例如,包括在TPM候选列表中的候选的数量可以是6或更多。
可使用相应合并候选的L0参考画面列表的运动信息推导TPM候选列表的候选0、候选2和候选4。如果在参考画面列表中不存在运动信息,则可使用在相反方向(例如,L1)上的参考画面列表中存在的运动信息推导候选0、候选2和候选4。
可使用相应合并候选的L1参考画面列表的运动信息推导TPM候选列表的候选1、候选3和候选5。如果在参考画面列表中不存在运动信息,则可使用在相反方向(例如,L0)上的参考画面列表中存在的运动信息推导候选1、候选3和候选5。
作为另一示例,可使用AMVP候选列表推导TPM候选列表。
可使用相应AMVP候选的L0参考画面列表的运动信息推导TPM候选列表的候选0。如果在参考画面列表中不存在运动信息,则可使用在相反方向(例如,L1)上的参考画面列表中存在的运动信息推导候选0。
可使用相应AMVP候选的L1参考画面列表的运动信息推导TPM候选列表的候选1。如果在参考画面列表中不存在运动信息,则可使用在相反方向(例如,L0)上的参考画面列表中存在的运动信息推导候选0。
可使用配置的TPM候选列表的两条或更多条运动信息来推导两个或更多个预测块,并且可通过应用推导的预测块的加权和来推导当前块的最终预测块。
例如,作为TPM结果,如在图16中所示出的,可通过沿45度或135度的对角线方向对预测块进行分区来推导最终预测块。
图17是示出根据本公开的实施例的可应用于TPM的权重的示图。
图17示出可应用于TPM的权重的示例。例如,图17的权重可被应用于第一预测块CU1。
如果TPM被应用于当前块,则可使用第一运动信息推导当前块的第一预测块,并且可使用第二运动信息推导当前块的第二预测块。图17的权重可被应用于第一预测块。尽管在图17中未示出,但被应用于第二预测块的权重可与用于推导第一预测块的权重相对于块的分区边界线对称。例如,为了推导第一预测块,可根据样点位置使用权重{7/8,6/8,4/8,2/8,1/8},并且为了推导第二预测块,可使用权重{1/8,2/8,4/8,6/8,7/8}。
如果TPM被应用于尺寸为M×M的亮度块,则与亮度块相应的色度块的尺寸可以是M/2×M/2。此时,可将应用于色度块的权重确定为与亮度块的权重相应。例如,如果应用于8×8亮度块的权重为{7/8,6/8,4/8,2/8,1/8},则可将与其相应的应用于4×4色度块的权重确定为{7/8,4/8,1/8}。
如果推导出第一预测块和第二预测块,则可通过第一预测块与第二预测块的加权和推导当前块的最终预测块。
图18是示出根据本公开的另一实施例的应用几何预测模式(GPM)的方法的示图。
如同TPM,GPM可表示这样的预测模式:针对当前块产生多个预测块,并且通过将针对每一个预测位置的加权和应用于每一个预测块来产生当前块的最终预测块。作为TPM预测的结果,可获取以三角形形状分区的预测块,而作为GPM预测的结果,可获取通过沿着任意边界线对当前块进行分区而获得的预测块。
也就是说,如果GPM的分区边界线与以三角形形状对当前块进行分区的对角线相应,则GPM的操作可相当于TPM的操作。也就是说,TPM可以是GPM的示例。
例如,仅在基于子块的合并模式未被应用于当前块时可应用GPM。另外,可基于当前块的尺寸来确定是否应用GPM。例如,如果当前块的尺寸为8×8或更大,则GPM可应用于当前块。另外,如果当前块的宽度小于当前块的高度以及/或者如果当前块的高度小于当前块的宽度,则可应用GPM。另外,仅在CIIP模式未被应用于当前块时可应用GPM。
如果当前块的帧间预测模式被确定为GPM,则可推导针对GPM的候选列表(GPM候选列表)。针对GPM的候选列表可由N条帧间预测信息组成。此时,可按照与合并候选列表或AMVP候选列表相同的方式推导针对GPM的候选列表,或者可使用合并候选列表或AMVP候选列表推导针对GPM的候选列表。
例如,可使用合并候选列表推导GPM候选列表。例如,包括在GPM候选列表中的候选的数量可以是6或更多。
可使用相应合并候选的L0参考画面列表的运动信息推导GPM候选列表的候选0、候选2和候选4。如果在参考画面列表中不存在运动信息,则可使用在相反方向(例如,L1)上的参考画面列表中存在的运动信息推导候选0、候选2和候选4。
可使用相应合并候选的L1参考画面列表的运动信息推导GPM候选列表的候选1、候选3和候选5。如果在参考画面列表中不存在运动信息,则可使用在相反方向(例如,L0)上的参考画面列表中存在的运动信息推导候选1、候选3和候选5。
作为另一示例,可使用AMVP候选列表推导GPM候选列表。
可使用相应AMVP候选的L0参考画面列表的运动信息推导GPM候选列表的候选0。如果在参考画面列表中不存在运动信息,则可使用在相反方向(例如,L1)上的参考画面列表中存在的运动信息推导候选0。
可使用相应AMVP候选的L1参考画面列表的运动信息推导GPM候选列表的候选1。如果在参考画面列表中不存在运动信息,则可使用在相反方向(例如,L0)上的参考画面列表中存在的运动信息推导候选0。
可使用配置的GPM候选列表的两条或更多条运动信息来推导两个或更多个预测块,并且可通过应用推导的预测块的加权和来推导当前块的最终预测块。
例如,如果GPM的分区边界与45度或135度的对角线相应,则GPM操作可相当于TPM操作。
图18示出应用于GPM的分区边界线的示例。例如,GPM分区边界线可被表示为从当前块的块中心至边界线的距离和边界线的角度的组合。
图19是示出根据本公开的另一实施例的可应用于GPM的权重的示图。
图19示出可应用于GPM块的权重的示例,其中,图18的分区边界线被应用于该GPM块。例如,图19的权重可被应用于第一预测块CU1。
如果GPM被应用于当前块,则可使用第一运动信息推导当前块的第一预测块,并且可使用第二运动信息推导当前块的第二预测块。图19的权重可被应用于第一预测块。尽管在图19中未示出,但被应用于第二预测块的权重可与用于推导第一预测块的权重相对于块的分区边界线对称。例如,为了推导第一预测块,可根据样点位置使用权重{7/8,6/8,4/8,2/8,1/8},并且为了推导第二预测块,可使用权重{1/8,2/8,4/8,6/8,7/8}。
如果GPM被应用于尺寸为M×M的亮度块,则与亮度块相应的色度块的尺寸可以是M/2×M/2。此时,可将应用于色度块的权重确定为与亮度块的权重相应。例如,如果应用于8×8亮度块的权重为{7/8,6/8,4/8,2/8,1/8},则可将与其相应的应用于4×4色度块的权重确定为{7/8,4/8,1/8}。
如果推导出第一预测块和第二预测块,则可通过第一预测块与第二预测块的加权和推导当前块的最终预测块。
在下文中,将详细描述确定当前块的每一个样点位置的权重的方法。
可基于样点距边界线的距离和边界线的角度推导当前亮度块的每一个样点位置的权重。
例如,可根据下面的等式1推导样点位置(x,y)的权重。
等式1
distFromLine=((x<<1)+1)*Dis[displacementX]+((y<<1)+1))*Dis[displacementY]–rho
distScaled=min((abs(distFromLine)+8)>>4,14)
sampleWeight[x][y]=distFromLine<=0?GeoFilter[distScaled]:8-GeoFilter[distScaled]
在上面的等式1中,distFromLine可以是基于当前样点与边界线之间的距离而确定的值。另外,distScaled可以是将distFromLine值校正为被包括在特定范围内的变量。sampleWeight[x][y]可表示当前样点位置(x,y)的权重。位移X和位移Y可以是根据边界线确定的值。
作为另一示例,可基于下文等式2至等式5确定应用于当前亮度样点的权重。
等式2
shift1=Max(5,17-BitDepth)
offset1=1<<(shift1-1)
displacementX=angleIdx
displacementY=(angleIdx+8)%32
partFlip=(angleIdx>=13&&angleIdx<=27)?0:1
shiftHor=(angleIdx%16==8||(angleIdx%16!=0&&nH>=nW))?0:1
在等式2中,angleIdx可以是基于边界线的角度确定的变量。下面将描述用于确定当前块的GPM边界线的信息的信号传送方法。shifthor可以是指示当前块的边界线是水平边界线还是垂直边界线的变量。另外,partFlip可表示指示沿着GPM边界线分区的两个子块中的一个子块的变量。
可根据下面的等式3和等式4来确定偏移值offsetX和偏移值offsetY,其中,偏移值offsetX和偏移值offsetY被用于基于在等式2中确定的变量来确定当前样点的权重。在下文中,当shiftHor具有第一值时,可执行等式3的操作,并且当shiftHor具有第二值时,可以行等式4的操作。
等式3
offsetX=(-nW)>>1
offsetY=((-nH)>>1)+(angleIdx<16?(distanceIdx*nH)>>3:-((distanceIdx*nH)>>3))
等式4
offsetX=((-nW)>>1)+(angleIdx<16?(distanceIdx*nW)>>3:-((distanceIdx*nW)>>3))
offsetY=(-nH)>>1
可根据下面的等式5确定基于由等式3和等式4确定的偏移值的当前亮度样点位置(xL,yL)的权重。
等式5
weightIdx=(((xL+offsetX)<<1)+1)*disLut[displacementX]+(((yL+offsetY)<<1)+1))*disLut[displacementY]
weightIdxL=partFlip?32+weightIdx:32-weightIdx
wValue=Clip3(0,8,(weightIdxL+4)>>3)
在等式5中,weightIdx可表示用于推导出权重的索引值,并且disLut[]可由displacementX和displacementY来确定,并且disLut[]可基于下面的表1被确定。wValue可以是最终推导出的权重。
表1
| idx | 0 | 2 | 3 | 4 | 5 | 6 | 8 | 10 | 11 | 12 | 13 | 14 |
| disLut[idx] | 8 | 8 | 8 | 4 | 4 | 2 | 0 | -2 | -4 | -4 | -8 | -8 |
| idx | 16 | 18 | 19 | 20 | 21 | 22 | 24 | 26 | 27 | 28 | 29 | 30 |
| disLut[idx] | -8 | -8 | -8 | -4 | -4 | -2 | 0 | 2 | 4 | 4 | 8 | 8 |
当基于当前样点的位置和分区边界线确定的wValue被推导出时,可根据下面的等式6推导当前块的最终预测块。
等式6
pbSamples[x][y]=Clip3(0,(1<<BitDepth)-1,(predSamplesLA[x][y]*wValue+predSamplesLB[x][y]*(8-wValue)+offset1)>>shift1)
在等式6中,pbSamples[x][y]可表示当前块的最终预测样点,并且predSamplesLA和predSamplesLB可分别表示第一预测块的样点值和第二预测块的样点值。
如果预测块为亮度块,则可按照与(x,y)相同的方式确定(xL,yL)。反之,如果预测块是色度块,则可将(xL,yL)确定为通过根据色度格式对(x,y)的值进行缩放而获得的值。
也就是说,可考虑色度格式以及根据色度格式的色度块与亮度块之间的相应关系来推导色度分量的权重。
图20至图24是示出可应用于色度块的权重的示图,其中,根据本公开的若干实施例的GPM被应用于该色度块。
如果推导色度块的权重,则可使用相同位置或相应位置处的亮度分量的权重推导色度样点的权重。
在格式4:2:0的情况下,色度分量的块尺寸在宽度和高度方面可以是亮度分量的块尺寸的1/2。
例如,如在图20中所示出的,可将每一个色度分量样点的权重确定为相应位置处的亮度分量样点的权重之中的左上方位置的权重。
作为另一示例,如在图21中所示出的,可将每一个色度分量样点的权重确定为相应位置处的亮度分量样点的权重之中的左上方位置和右下方位置的权重的平均值。
作为另一示例,如在图22中所示出的,可将每一个色度分量样点的权重确定为相应位置处的所有亮度分量样点的权重的平均值。
在格式4:2:2的情况下,色度分量的块尺寸在宽度方面可以是亮度分量的块尺寸的1/2。
例如,如在图23中所示出的,可将每一个色度分量样点的权重确定为相应位置处的亮度分量样点的权重之中的左侧位置的权重。
作为另一示例,如在图21中所示出的,可将每一个色度分量样点的权重确定为相应位置处的亮度分量样点的权重之中的左侧位置和右侧位置的权重的平均值。
接下来,将详细描述获取/确定当前块的运动信息的步骤S840和S930。
在以下描述中,确定/获取运动信息的处理可被用作与使用运动候选存储运动信息的处理相同的含义。
图像编码/解码设备可被用于存储运动信息并推导将被编码/解码的画面或块的运动信息。
运动信息可包括运动矢量、参考画面列表或参考画面索引中的至少一个。
如果合并模式被应用于当前块,则可存储由合并索引指示的运动信息。例如,可存储由合并索引指示的运动矢量、参考画面列表和合并候选的参考画面索引。
如果AMVP模式被应用于当前块,则可存储由AMVP索引指示的运动信息。例如,可存储通过基于由AMVP索引指示的MVP执行另外的操作而推导出的运动矢量。此处,另外的操作可表示通过MVP与MVD的总和推导最终运动矢量的步骤。另外,可存储由AMVP索引指示的参考画面列表和参考画面索引。
如果MMVD模式被应用于当前块,则可存储MMVD索引、运动方向信息和运动尺寸信息。例如,可存储被确定为上方、下方、左侧和右侧中的至少一个的运动方向信息以及指示被确定为[1/4,1/2,1,2,4,8,16,32]中的至少一个的尺寸的运动尺寸信息。另外,可存储由MMVD索引指示的参考画面列表和参考画面索引。
如果当前块的帧间预测模式被确定为基于子块的帧间模式,则可使用子分区帧间预测模式存储方法。
如果基于子块的合并模式被应用于当前块,则可存储由基于子块的合并索引指示的运动信息。另外,可存储从CPMV推导出的针对每一个子块的运动矢量。作为另一示例,可存储从CPMVP推导出的针对每一个子块的运动矢量。
如果当前块的帧间预测模式被确定为CIIP模式、TPM或GPM中的至少一个,则可使用组合帧间预测模式存储方法。
如果CIIP模式被应用于当前块,则可存储由合并索引或AMVP索引指示的运动信息。例如,可存储由合并索引或AMVP索引指示的运动矢量、参考画面列表和参考画面索引。
如果TPM或GPM被应用于当前块,则可存储由不同的TPM索引或GPM索引指示的运动信息的组合。例如,可存储由不同的TPM索引或GPM索引指示的运动矢量、参考画面列表和参考画面索引。
图25至图27是示出对块的运动信息进行编码/解码的方法的示图,其中,根据本公开的若干实施例的对TPM或GPM被应用于该块。
例如,如果TPM或GPM被应用,如在图25中所示出的,则可针对位于边界表面上的块存储双向运动信息,并且可针对不位于边界表面上的块仅存储单向运动信息。
作为另一示例,如果TPM或GPM被应用,如在图26或图27中所示出的,则可针对每一个子块仅存储单向运动信息。可针对位于边界表面上的块存储L0运动信息和L1运动信息中的一个。
图28至图30是示出对块的运动信息进行编码/解码的方法的其他示图,其中,根据本公开的若干实施例的GPM被应用于该块。
如果GPM被应用于当前块,则可确定使用权重存储的运动信息。
图28至图30示出存储4×4块的GPM运动信息的方法。
例如,如在图28中所示出的,可使用将被存储的块的左上方位置、右上方位置、左下方位置或右下方位置的至少一个样点位置的权重的总和。
作为另一示例,如在图29和图30中所示出的,可使用将被存储的块的边界线上的样点中的至少一个的权重的总和。
此时,可确定通过将权重的总和与特定阈值进行比较而存储的运动信息的类型。
例如,可根据下面的等式7定义阈值Th_1和阈值Th_2。
等式7
Th_1=max(((8*使用的加权样点的数量)>>thScaler),1*使用的加权样点的数量)
Th_2=(8*使用的加权样点的数量)-Th_1
thScaler=((log_2h+log_2w)>>1)–1
例如,如果权重的总和小于或等于Th_1,则可存储第一候选的运动信息。
作为另一示例,如果权重的总和大于或等于Th_2,则可存储第二候选的运动信息。
作为另一示例,如果权重的总和小于Th_2并且大于Th_1,则可双向地存储第一候选的运动信息和第二候选的运动信息。
作为另一示例,如果由不同的GPM索引指示的参考画面列表不同,则可双向地存储第一候选的运动信息和第二候选的运动信息。
作为另一示例,如果由不同的GPM索引指示的参考画面列表相同,则可双向地存储第二候选的运动信息。
作为另一示例,如果用于推导GPM索引的合并索引是双向的,则可双向地存储运动信息。
作为另一示例,如果用于推导GPM索引的合并索引是单向的,则可单向地存储运动信息。
作为另一示例,如果用于推导GPM索引的合并索引是单向的,则可双向地存储运动信息。此时,可通过在未使用的方向上将单向运动信息分配为运动信息来双向地存储运动信息。
作为另一示例,如果由不同的GPM索引指示的参考画面列表相同,则可双向存储通过缩放第一候选而获取的运动信息和第一候选的运动信息。
接下来,将详细描述对当前块的帧间预测信息进行编码/解码的步骤S810和S940。
在对指示帧间预测模式的信息进行熵编码/熵解码时,可基于至少一个单帧间预测模式信息、多帧间预测模式信息或组合帧间预测模式信息对指示帧间预测模式的信息进行熵编码和解码。
此时,帧间预测模式可表示合并模式、AMVP模式、基于子块的合并模式、基于子块的AMVP模式、MMVD、CIIP、TPM或GPM中的至少一个。
单帧间预测模式信息可指示是否应用一个帧间预测模式。
例如,可对指示是否应用合并模式的合并标志merge_flag进行以编码/解码。
作为另一示例,可对指示是否应用MMVD模式的MMVD标志mmvd_flag编码/解码。
作为另一示例,可对指示是否应用TPM的TPM标志triangle_flag进行编码/解码。
作为另一示例,可对指示是否应用CIIP的CIIP标志ciip_flag进行编码/解码。
作为另一示例,可对指示是否应用GPM的GPM标志geo_flag/gpm_flag进行编码/解码。
多帧间预测模式信息可指示包括多个帧间预测模式的帧间预测模式组合。此时,可对指示组合中的特定帧间预测模式的单帧间预测模式信息进行另外的编码/解码。另外,单帧间预测模式信息可被表示为索引(而不是特定指示符)。此时,可根据预测模式确定的顺序对单帧间预测模式信息进行熵编码/熵解码。
例如,如果多帧间预测模式指示符指示合并模式,则多帧间预测模式指示符可指示使用合并模式、MMVD模式、基于子块的模式、TPM、CIIP模式或GPM中的至少一个对当前块进行编码/解码。
图31至图35是示出根据本公开的若干实施例的对帧内预测模式信息进行编码/解码的方法的示图。
例如,如在图31至图33中所示出的,如果多帧间预测模式指示符具有第一值,则可使用合并模式、MMVD模式、基于子块的模式、TPM、CIIP模式或GPM来对当前块进行编码/解码。
作为另一示例,图32和图33的组合帧间预测信息指示符可指示使用TPM、CIIP模式或GPM中的至少一个对当前块进行编码/解码。
如上所述,如果TPM是GPM的示例,则可根据图34和图35对帧间预测信息指示符进行编码/解码。
在下文中,将详细描述当GPM被应用于当前块时对GPM相关信息进行编码/解码的方法。
首先,可用信号传送指示GPM是否可应用于当前块的语法元素sps_gpm_enabled_flag。可在序列级用信号传送指示GPM是否可应用的语法元素。
可在没有用信号传送指示是否执行单独的GPM的标志的情况下确定是否将GPM应用于当前块。例如,如果GPM可应用于当前块并且当前块被包括在B条带中,则可确定不将基于子块的合并模式应用于当前块,以及如果当前块的尺寸为8×8或更大并且不将CIIP模式应用于当前块,则可确定将GPM应用于当前块。
如果正常合并模式或MMVD模式不被应用于当前块并且CIIP模式不被应用于当前块,则可对GPM分区索引进行编码/解码。例如,GPM分区索引可被定义为语法元素merge_gpm_partition_idx。
语法元素merge_gpm_partition_idx可被用于确定块的GPM分区边界线或分区形式。具体地,GPM分区索引可指示从当前块的中心至GPM分区边界线的距离或者GPM分区边界线的角度中的至少一个。
例如,GPM分区索引可根据下表2确定GPM分区边界线的形式。
表2
| merge_gpm_partition_idx | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 |
| angleIdx | 0 | 0 | 2 | 2 | 2 | 2 | 3 | 3 | 3 | 3 | 4 | 4 | 4 | 4 | 5 | 5 |
| distanceIdx | 1 | 3 | 0 | 1 | 2 | 3 | 0 | 1 | 2 | 3 | 0 | 1 | 2 | 3 | 0 | 1 |
| merge_gpm_partition_idx | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 |
| angleIdx | 5 | 5 | 8 | 8 | 11 | 11 | 11 | 11 | 12 | 12 | 12 | 12 | 13 | 13 | 13 | 13 |
| distanceIdx | 2 | 3 | 1 | 3 | 0 | 1 | 2 | 3 | 0 | 1 | 2 | 3 | 0 | 1 | 2 | 3 |
| merge_gpm_partition_idx | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 |
| angleIdx | 14 | 14 | 14 | 14 | 16 | 16 | 18 | 18 | 18 | 19 | 19 | 19 | 20 | 20 | 20 | 21 |
| distanceIdx | 0 | 1 | 2 | 3 | 1 | 3 | 1 | 2 | 3 | 1 | 2 | 3 | 1 | 2 | 3 | 1 |
| merge_gpm_partition_idx | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 | 61 | 62 | 63 |
| angleIdx | 21 | 21 | 24 | 24 | 27 | 27 | 27 | 28 | 28 | 28 | 29 | 29 | 29 | 30 | 30 | 30 |
| distanceIdx | 2 | 3 | 1 | 3 | 1 | 2 | 3 | 1 | 2 | 3 | 1 | 2 | 3 | 1 | 2 | 3 |
表2的angleIdx和distanceIdx可以是指示GPM分区边界线的角度和从当前块的中心至GPM分区边界线的距离的语法元素。angleIdx和distanceIdx可分别被定义为角度索引和距离索引。
图36和图37是示出对GPM信息进行熵编码/熵解码的方法的示图。
作为另一示例,GPM分区索引可基于图36确定块的GPM分区边界线或分区形式。
另外,可使用截断一元码(truncated Unary code)、第k阶指数哥伦布码(k-thorder exponential Golomb code)或固定长度码中的至少一种方法来执行GPM分区索引的二值化。另外,如果固定长度码不被应用,则可将较少的二进制位分配给根据出现概率而频繁出现的索引,从而提高编码效率。
另外,可使用截断一元码、第k阶指数哥伦布码或固定长度码中的至少一种方法来执行角度索引和距离索引的二值化。例如,可基于图37的二进制表将二进制值分配给角度索引和距离索引。角度索引可表示为固定长度,并且距离索引可表示为截断一元码。另外,如果固定长度码不被应用,则可将较少的二进制位分配给根据出现概率而频繁出现的索引,从而提高编码效率。
在下文中,将详细描述根据本公开的若干实施例的双向帧间预测编码/解码方法。
图38是示出根据本公开的另一实施例的图像解码方法的示图。
参照图38,根据本公开实施例的图像解码方法可包括:对当前块的双向帧间预测信息进行解码(S3810),对当前块执行双向帧间预测(S3820)、针对当前块执行双向权重预测(S3830),并且/或者改进/校正双向运动信息(S3840)。
图39是示出根据本公开的另一实施例的图像编码方法的示图。
参照图39,根据本公开实施例的图像解码方法可包括:针对当前块执行双向帧间预测(S3910),针对当前块执行双向权重预测(S3920),改进/校正双向运动信息(S3930),并且对双向帧间预测信息进行编码(S3940)。
在下文中,将详细描述图38和图39的步骤。
首先,将详细描述针对当前块执行双向帧间预测的步骤S3820和步骤S3910。
为了针对当前块执行双向帧间预测,可配置参考画面列表。图像编码/解码设备可以以画面、条带、并行块、分块、CTU、CU或PU中的至少一个为单位配置N个参考画面列表,并且每一个参考画面列表可由M个参考画面组成。此时,N和M可以是正整数。此时,参考画面可表示预编码/预解码的画面。
为了针对当前块执行双向帧间预测,可推导多条运动信息。例如,在针对当前块执行双向帧间预测时,可使用两条运动信息。
此时,运动信息可包含运动矢量(Vx,Vy)、参考画面列表索引和参考画面索引。
例如,单个运动信息可包括单个参考画面列表索引。
作为另一示例,多条运动信息可包括一个参考画面列表索引。
作为另一示例,单个运动信息可指单个参考画面。
作为另一示例,多条运动信息可指一个参考画面。
图像编码设备可确定用于执行最佳双向帧间预测的运动信息或预测块。此时,可使用RD代价、SAD、SATD、MR-SAD或MR-SATD中的至少一种方法来推导出最佳代价。
可基于合并模式、MMVD、AMVP模式、对称MVD(SMVD)、仿射合并模式、仿射AMVP模式、SbTMVP(ATMVP)模式、TPM、GPM或CIIP模式中的至少一个执行当前块的双向帧间预测。
在以下描述中,通过双向帧间预测而预测的多条运动信息可被表示为第一运动信息至第N运动信息。
接下来,将详细描述针对当前块执行双向权重预测的步骤S3830和步骤S3920。
在针对当前块执行双向权重预测时,可执行双向权重预测和运动补偿。
双向权重预测可表示通过使用在双向帧间预测步骤中搜索的多条运动信息产生的多个预测块的加权和来执行推导的预测方法。
此时,当加权和被应用于多个预测块时,可通过在双向预测时有效地应用画面之间的亮度改变来提高编码效率。
在针对当前块执行双向权重预测时,可根据下面的等式8推导当前块的最终预测块。
等式8
P_bi=w_0×P_0+w_1×P_1
在等式8中,P_0可表示由第一运动信息产生的第一预测块,并且P_1可表示由第二运动信息产生的第二预测块。P_bi可表示通过多个预测块的权重的总和所产生的预测块或运动补偿块。此时,w_0和w_1的总和可以是1。
例如,在针对当前块执行双向权重预测时,如下面的等式9中所示出的,可使用单个权重。
等式9
P_bi=((K–w)×P_0+w×P_1+K/2)>>log_2K
其中,K可以是值2N,并且N可以是正整数。
在针对当前块执行双向权重预测时,可定义由多个权重组成的单个权重集合,并且可使用所定义的权重中的至少一个来执行双向权重预测。
例如,可定义权重集合{3,4,5}或{4,5,3},并且可使用所定义的权重中的至少一个来执行权重预测。
作为另一示例,可定义权重集合{-2,3,4,5,10}或{4,5,3,10,-2},并且可使用所定义的权重中的至少一个来执行权重预测。
另外,在针对当前块执行双向权重预测时,可根据当前块的编码参数自适应地确定多个不同的权重集合。
例如,如果当前块是低延迟块,则可使用权重集合{-2,3,4,5,10}或{4,5,3,10,-2},以及如果当前块不是低延迟块,则可使用权重集合{3,4,5}或{4,5,3}。
另外,在针对当前块执行双向权重预测时,可使用根据当前块的编码参数而自适应地推导出的权重。
例如,如果当前块的预测模式是能够从邻近块推导出一个权重的模式,则可将推导出的权重确定为当前块的权重。
作为另一示例,如果当前块的预测模式是能够从邻近块推导出一个权重的模式,则可将等权重(equi-weight)确定为当前块的权重。例如,等权重可以是4。
作为另一示例,如果当前块的预测模式是能够从邻近块推导出多个权重的模式,则可将推导出的权重之中具有最大频率的权重确定为当前块的权重。
作为另一示例,如果当前块的预测模式是能够从邻近块推导出多个权重的模式,则可将等权重确定为当前块的权重。例如,等权重可以是4。
此处,能够从邻近块推导出一个权重的模式可以是合并模式、MMVD、SbTMVP模式、TPM、GPM或CIIP模式中的至少一个。另外,能够从邻近块推导多个权重的模式可以是仿射合并模式。
另外,当前块的编码参数可包括预测模式(合并模式、MMVD、SbTMVP模式、TPM、GPM、CIIP模式、仿射合并模式、仿射AMVP模式、SbTMVP)、低延迟、块尺寸(宽度、高度、宽度*高度)或cbf中的至少一个。
这里,低延迟可表示当前块的编码模式是低延迟编码模式。另外,低延迟可表示参考画面列表中的所有参考画面以画面、子画面、条带、并行块组、并行块、CTU或CU为单位按照显示顺序均在当前画面之前。另外,低延迟可表示由当前块的运动信息所参照的所有参考画面按照显示顺序均在当前画面之前。
在执行当前块的双向权重预测时,可定义语法元素NoBackwardPredFlag。例如,NoBackwardPredFlag可以是指示低延迟的语法元素。
例如,如果当前块具有低延迟,则可将NoBackwardPredFlag确定为第一值,而如果当前块不具有低延迟,则可将NoBackwardPredFlag确定为第二值。在以下描述中,第一值可以是1,第二值可以是0,但不限于此。
作为另一示例,如果在条带头NAL单元中发送的slice_type语法指示B条带,则可将NoBackwardPredFlag确定为第一值,否则可将slice_type语法确定为第二值。
作为另一示例,如果当前画面的所有参考画面的列表中的所有参考画面的POC均于当前画面的POC,则可将NoBackwardPredFlag确定为第一值,否则可将NoBackwardPredFlag确定为第二值。
作为另一示例,如果由当前块的运动信息指示的所有参考画面的POC均于当前画面的POC,则可将NoBackwardPredFlag确定为第一值,否则可将NoBackwardPredFlag确定为第二值。
作为另一示例,可由上述示例的组合来定义NoBackwardPredFlag。例如,如果在条带头NAL单元中发送的slice_type语法指示B条带并且当前画面的所有参考画面的列表中的所有参考画面的POC均小于当前画面的POC,则可将NoBackwardPredFlag确定为第一值,否则可将NoBackwardPredFlag确定为第二值。
另外,“1”可表示真(on),“0”可表示假(off)。相反,“0”可表示真并且“1”可表示假。
另外,可在SPS、PPS、条带头或条带数据中的至少一个的NAL单元中发送NoBackwardPredFlag,并且NoBackwardPredFlag可被定义为发送的二进制信息。
另外,在执行双向权重预测时,可以不定义NoBackwardPredFlag。
在执行当前块的双向权重预测时,可根据NoBackwardPredFlag自适应地执行双向权重的确定和预测。
例如,如果NoBackwardPredFlag具有第一值,则可使用权重{4,5,3}中的至少一个来执行双向权重预测。
作为另一示例,如果NoBackwardPredFlag具有第一值,则可使用权重{4,5,3,10,-2}中的至少一个来执行双向权重预测。
作为另一示例,如果NoBackwardPredFlag具有第一值,则可使用权重{4,10,-2}中的至少一个来执行双向权重预测。
作为另一示例,如果NoBackwardPredFlag具有第二值,则可使用权重{4,5,3}中的至少一个来执行双向权重预测。
作为另一示例,如果NoBackwardPredFlag具有第二值,则可使用权重{4,5,3,10,-2}中的至少一个来执行双向权重预测。
作为另一示例,如果NoBackwardPredFlag具有第二值,则可使用权重{4,10,-2}中的至少一个来执行双向权重预测。
作为另一示例,如果NoBackwardPredFlag具有第一值,则可使用权重{4,5,3,10,-2}中的至少一个来执行双向权重预测,以及如果NoBackwardPredFlag具有第二值,则可使用权重{4,5,3}中的至少一个来执行双向权重预测。
在执行双向权重预测时,无论NoBackwardPredFlag如何,都可执行双向权重的确定和预测,。
例如,无论NoBackwardPredFlag如何,都可使用权重{4,5,3}中的至少一个来执行双向权重预测。
作为另一示例,无论NoBackwardPredFlag如何,都可使用权重{4,5,3,10,-2}中的至少一个来执行双向权重预测。
作为另一示例,无论NoBackwardPredFlag如何,都可使用权重{4,10,-2}中的至少一个来执行双向权重预测。
接下来,将详细描述改进/校正双向运动信息的步骤S3840和S3930。
如果针对当前块执行双向帧间预测,则可改进或校正双向运动信息。在以下描述中,运动信息的改进和校正可被用作相同的含义。
在针对当前编码块执行双向运动改进时,应用了运动改进的运动信息可以是从双向帧间预测推导出的运动信息或者在双向帧间预测信息熵解码步骤中解析出的运动信息。
在针对当前编码块执行双向运动改进时,可自适应地执行双向运动改进。
例如,可在特定帧间预测模式下执行双向运动改进。
例如,如果合并模式被应用于当前块,则可执行双向运动改进。另外,例如,如果仿射合并模式被应用于当前块,则可执行双向运动改进。另外,例如,如果MMVD被应用于当前块,则可执行双向运动改进。另外,例如,如果对称MVD模式被应用,则可执行双向运动改进。
作为另一示例,如果多条运动信息参照不同参考画面列表,则可执行双向运动改进。
例如,如果两条运动信息中的一个参照第一参考画面列表L0并且另一运动信息参照第二参考画面列表L1,则可执行双向运动改进。
作为另一示例,可根据运动信息的参考画面来执行双向运动改进。
例如,当两个参考画面中的一个是按照显示顺序在当前参考画面之前的参考画面并且另一个是在当前画面之后的参考画面时,可执行双向运动改进。另外,例如,当多个参考画面与当前画面之间的距离(POC差)相同时,可执行双向运动改进。
作为另一示例,可以根据当前块的尺寸来执行双向运动改进。
例如,如果当前块的样点数量为N或更多,则可执行双向运动改进。此时,N可以是16、32、64、128、256或512中的一个。另外,例如,在当前块的高度或宽度为N或更大时,可执行双向运动改进。此时,N可以是4、8、16、32或64中的至少一个。
作为另一示例,可根据在双向运动补偿中确定的权重来执行双向运动改进。
例如,当用于预测的多个权重相同时,可执行双向运动改进。另外,例如,当用于预测的多个权重彼此不同时,可执行双向运动改进。另外,例如,当不存在用于预测的权重时,可执行双向运动改进。
作为另一示例,当满足上述条件中的一个或更多个时,可执行双向运动改进。
例如,在当前块满足所有上述条件时,可执行双向运动改进。
在针对当前编码块执行双向运动改进时,当执行运动补偿时,可使用DCT8抽头滤波器、DCT 4抽头滤波器、三次滤波器(Cubic filter)或双线性滤波器(Bi-linear filter)中的至少一个来执行当前块的插值。
在针对当前编码块执行双向运动改进时,可设置运动改进范围。此时,运动改进范围可表示以起始点为中心的特定范围。起始点可以是由(在校正之前)将被改进的运动信息指示的参考像素。
图42是示出根据本公开的实施例的运动改进范围的示图。
这里,改进范围可被定义为垂直轴范围(-N至N)或水平轴范围(-M至M)。N和M可以是正整数。例如,N和M可以是1、2、3、4、5……中的一个。
例如,如在图42中所示出的,可将改进范围确定为垂直轴(-2至2)范围或水平轴(-2至2)范围。
定义的运动改进范围可表示运动偏移的最小值和最大值,并且运动偏移可以是起始点与改进的运动矢量之间的差。改进的运动矢量可被定义为下面的等式10或等式11中的一个。
等式10
MV_refined=MV_original+MV_offset
等式11
MV_refined=MV_original-MV_offset
其中,起始点可以是由MV_Original指示的像素。此时,如果运动偏移超过运动改进范围,则偏移值可被裁剪至运动改进范围内。
在针对当前编码块执行双向运动改进时,可执行整数像素单位运动改进。如果执行整数像素单位运动改进,则可将运动偏移确定为整数,或者可以以整数为单位确定改进的运动矢量。
可在定义的运动改进范围内执行整数像素单位运动改进。
如果执行整数像素单位运动改进,则可将从改进的运动信息推导出的预测块之间具有最低代价的偏移确定为用于当前块的运动改进的运动偏移。此时,可使用RD代价、SAD、SATD、MR-SAD或MR-SATD中的至少一个来计算预测块之间的代价。
这里,代价可表示两个预测块的误差或权重误差。
图43和图44是示出根据本公开的若干实施例的运动改进偏移的示图。
如果执行整数像素单位运动改进,则可确定多个偏移。
例如,在针对两条运动信息执行双向运动改进时,可确定运动信息的运动偏移。
图43示出在执行当前块的运动改进时确定多个偏移的情况。
如果执行整数像素单位运动改进,则可确定单个偏移。
例如,在针对两条运动信息执行双向运动改进时,针对每一个运动信息的运动偏移可相同。例如,可针对一条运动信息执行正(+)偏移,并且可针对另一运动信息确定负(-)偏移。此时,正偏移和负偏移的绝对值可相同。
另外,两个参考画面可以是基于当前画面的过去画面和将来画面。可选地,如果两个参考画面可以是基于当前画面的过去画面和将来画面,则运动改进的编码效率可增加。
图44示出在执行当前块的运动改进时确定单个偏移的情况。
另外,在执行整数像素单位运动改进时,可执行所有可能的偏移的顺序搜索(完全搜索)。
在针对当前块执行双向运动改进时,可执行子像素单位运动改进。这里,子像素单位运动改进可表示运动偏移以子像素为单位的运动改进。
在执行子像素单位运动改进时,可执行基于操作的子像素单位改进。
此时,可根据下面的等式12执行水平轴上的子像素单位改进。
等式12
另外,可根据下面的等式13执行垂直轴上的子像素单位改进。
等式13
在等式12和等式13中,E可以是在上述整数像素单位改进中获得的代价。
图45是示出根据本公开的实施例的运动改进方法的示图。
图45示出当整数像素单位偏移为(1,-1)时的根据子像素单位改进所需的位置的代价。
仅当存在子像素单位改进所需的整数像素单位偏移的相邻位置处的所有代价时,才可执行子像素单位改进。
例如,在水平轴上执行子像素单位改进时,如果不存在E(-1,0)或E(1,0)中的至少一个的代价,则可以不执行水平轴上的子像素单位改进。
作为另一示例,在垂直轴上执行子像素单位改进时,如果不存在E(0,-1)或E(0,1)中的至少一个的代价,则可以不执行垂直轴上的子像素单位改进。
作为另一示例,在执行子像素单位改进时,如果不存在E(-1,0)、E(1,0)、E(0,-1)或E(0,1)中的至少一个的代价,则可以不执行子像素单位改进。
图46是示出根据本公开的实施例的运动改进方法的另一示图。
图46示出能够在纵轴(-2至2)和横轴(-2至2)的运动改进范围中进行子像素单位改进的整数像素单位偏移的示例。
在执行基于操作的子像素单位改进时,如果不存在子像素单位改进所需的代价,则可使用附近可用的代价来推导替代代价。
例如,如果不存在E(-1,0),则可根据下面的等式14推导E(-1,0)。
等式14
E(-1,0)=w_0*E(0,-1)+w_1*E(0,0)+w_2*E(0,1)
作为另一示例,如果不存在E(1,0),则可根据下面的等式15推导E(1,0)。
等式15
E(1,0)=w_0*E(0,-1)+w_1*E(0,0)+w_2*E(0,1)
作为另一示例,如果不存在E(0,-1),则可根据下面的等式16推导E(0,-1)。
等式16
E(0,-1)=w_0*E(-1,0)+w_1*E(0,0)+w_2*E(1,0)
作为另一示例,如果不存在E(0,1),则可根据下面的等式17推导E(0,1)。
等式17
E(0,1)=w_0*E(-1,0)+w_1*E(0,0)+w_2*E(1,0)
在等式14至等式17中,w0、w1和w2的总和可以是1,并且w0、w1和w2中的每一个可以是正实数或负实数。
例如,w0、w1、w2可以是{0.25,0.5,0.25}、{0,0.75,0.25}和{0.25,0.75,0}中的一个。
在执行子像素单位运动改进时,可执行搜索单元子像素单位改进。
此时,子像素单位偏移可应用于整数单位运动改进偏移。
此时,多个特定子像素单位偏移是可应用的,并且子像素单位偏移可以是{±1/16,±2/16,±3/16,±4/16,±5/16,±6/16,±7/16,±8/16}中的一个。
如果执行子像素单位运动改进,则可将从改进的运动信息推导出的具有预测块之间最低代价的偏移确定为用于当前块的运动改进的运动偏移。此时,可通过RD-COST、SAD、SATD、MR-SAD或MR-SATD中的至少一个来计算预测块之间的代价。
这里,代价可表示两个预测块的误差或权重误差。
接下来,将详细描述对当前块的双向帧间预测信息进行编码/解码的步骤S3940和步骤S3810。
在当前块的双向帧间预测时,可对双向帧间预测信息进行熵编码/熵解码。
在对双向帧间预测信息进行编码/解码时,可对双向权重预测信息进行熵编码/熵解码。
当对双向权重预测信息进行编码/解码时,可定义双向权重预测信息执行标志。例如,双向权重预测信息执行标志可被定义为语法元素bcw_enable_flag或sps_bcw_enabled_flag。双向权重预测信息执行标志可以是指示是否应用当前块的双向权重预测的标志信息。
例如,可以以SPS、PPS或条带头中的至少一个为单位来执行双向权重预测信息执行标志的信号传送和熵编码/熵解码。
另外,如果双向权重预测信息执行标志具有第一值,则可执行双向权重预测,并且如果双向权重预测信息执行标志具有第二值,则等权重可应用于双向预测。
当执行双向权重预测信息的编码/解码时,可定义双向权重索引。例如,双向权重索引可被定义为语法元素bcw_idx。双向权重索引可以是指示应用于当前块的权重的索引信息。
例如,可以以画面、子画面、条带、并行块组、并行块、分块、CTU、CU、PU或TU中的至少一个为单位来执行双向权重索引的信号传送和熵编码/熵解码。
另外,可使用截断一元码、第k阶指数哥伦布码、固定长度码中的至少一个的方法来执行双向权重索引的二值化。
例如,可基于下面的表3的二进制表来用信号传送和熵编码/熵解码权重{3,4,5}的权重索引。
表3
| 权重索引 | 权重 | 二进制位 |
| 0 | 4 | 0(1) |
| 1 | 5(3) | 10(01) |
| 2 | 3(5) | 11(00) |
作为另一示例,可基于下面的表4和表5的二进制表来用信号传送和熵编码/熵解码权重{-2,3,4,5,10}的权重索引。
表4
| 权重索引 | 权重 | 二进制位 |
| 0 | 4 | 0(1) |
| 1 | 5(3) | 10(01) |
| 2 | 3(5) | 110(001) |
| 3 | 10(-2) | 1110(0001) |
| 4 | -2(10) | 1111(0000) |
表5
| 权重索引 | 权重 | 二进制位 |
| 0 | 4 | 0(1) |
| 1 | 5(3) | 100(000) |
| 2 | 3(5) | 101(001) |
| 3 | 10(-2) | 110(010) |
| 4 | -2(10) | 111(011) |
当执行双向权重预测信息的编码/解码时,可定义双向等权重标志和/或双向非对称正负号权重标志。例如,双向等权重标志可被定义为语法元素bcw_equiweight_flag,并且双向非对称正负号标志可被定义为语法元素bcw_asymmetric_sign_flag。
例如,可以以画面、子画面、条带、并行块组、并行块、分块、CTU、CU、PU或TU中的至少一个为单位来执行双向等权重标志和/或双向非对称正负号权重标志的信号传送和熵编码/熵解码。
另外,可使用截断一元码、第k阶指数哥伦布码或固定长度码中的至少一个的方法来执行双向等权重标志和/或双向非对称正负号权重标志的二值化。
双向等权重标志可以是指示预测块的权重是否相同的标志信息,并且双向非对称正负号权重标志可以是指示预测块的权重的正负号彼此不同的标志信息。
例如,可基于表6的值分配来用信号传送和熵编码/熵解码权重{-2,3,4,5,10}的双向等权重标志、双向非对称正负号权重标志和双向权重索引。
表6
在针对当前块执行双向权重预测信息的熵编码/熵解码时,可执行语法元素NoBackwardPredFlag。
此时,可在SPS、PPS、条带头或条带数据中的至少一个的NAL单元中执行双向权重预测信息的熵编码/熵解码。
例如,如果当前块具有低延迟,则可将NoBackwardPredFlag确定为第一值,否则可将NoBackwardPredFlag确定为第二值。在以下描述中,第一值可以是1,并且第二值可以是0。
作为另一示例,如果在条带头NAL单元中发送的slice_type语法指示B条带,则可将NoBackwardPredFlag确定为第一值,否则可将NoBackwardPredFlag确定为第二值。
作为另一示例,如果当前画面的所有参考画面的列表中的所有参考画面的POC均小于当前画面的POC,则可将NoBackwardPredFlag确定为第一值,否则可将NoBackwardPredFlag确定为第二值。
作为另一示例,如果由当前块的运动信息指示的所有参考画面的POC均小于当前画面的POC,则可将NoBackwardPredFlag确定为第一值,否则可将NoBackwardPredFlag确定为第二值。
此时,NoBackwardPredFlag可被定义为上述示例的组合。例如,如果在条带头NAL单元中发送的slice_type语法指示B条带并且当前画面的所有参考画面的列表中的所有参考画面的POC均小于当前画面的POC,则可将NoBackwardPredFlag确定为第一值,否则可将NoBackwardPredFlag确定为第二值。
另外,“1”可表示真,“0”可表示假。相反,“0”可表示真,并且“1”可表示假。
另外,可在SPS、PPS、条带头或条带数据中的至少一个的NAL单元中发送NoBackwardPredFlag,并且NoBackwardPredFlag可被定义为发送的二进制信息。
另外,在执行双向权重预测时,可以不定义NoBackwardPredFlag。例如,如果未定义NoBackwardPredFlag,则可以不使用上方NAL单元信息。
如果对当前块的双向权重预测信息进行熵编码/熵解码,则可根据NoBackwardPredFlag自适应地执行双向权重预测信息的熵编码/熵解码。
例如,如果NoBackwardPredFlag具有第一值,则可针对bcw_idx执行具有特定Cmax值的截断一元码的二值化。此时,Cmax可具有{1,2,3,4,5}中的至少一个的值。
作为另一示例,如果NoBackwardPredFlag具有第二值,则可针对bcw_idx执行具有特定Cmax值的截断一元码的二值化。这里,Cmax可具有{1,2,3,4,5}中的至少一个的值。
作为另一示例,如果NoBackwardPredFlag具有第一值,则可用Cmax值为4的截断一元码对bcw_idx进行二值化。相反,如果NoBackwardPredFlag具有第二值,则可用Cmax值为2的TU码对bcw_idx进行二值化。
如果对当前块的双向权重预测信息进行熵编码/熵解码,则可执行双向权重搜索和预测,而不管NoBackwardPredFlag如何。
此时,可以不在SPS、PPS、条带头或条带数据中的至少一个的NAL单元中用信号传送NoBackwardPredFlag。如果不用信号传送NoBackwardPredFlag,则可移除NAL单元之间的解析依赖性。
例如,不管NoBackwardPredFlag如何,可用Cmax值为2的截断一元码对可指示权重{4,5,3}或{4,3,5}的bcw_idx进行二值化。
作为另一示例,不管NoBackwardPredFlag如何,可用Cmax值为4的截断一元码对可指示权重{4,5,3,10,-2}或{4,3,5,-2,10}的bcw_idx进行二值化。
作为另一示例,不管NoBackwardPredFlag如何,可用Cmax值为2的截断一元码对可指示权重{4,10,-2}或{4,-2,10}的bcw_idx进行二值化。
作为另一示例,不管NoBackwardPredFlag如何,可用Cmax值为4的截断一元码对可指示权重{4,10,-2,5,3}或{4,-2,10,3,5}的bcw_idx进行二值化。
另外,可根据权重的定义或设置来改变权重,权重实际表示的比例值可以与上述示例相同。另外,可根据权重的定义或设置来改变权重,但根据权重的尺寸的顺序可以是相同的。
如果对当前块的双向权重预测信息进行熵编码/熵解码,则可将正常模式熵编码或旁路模式熵编码中的至少一个应用于每一个二进制位。
正常模式熵编码可表示CABAC编码,并且旁路模式熵编码可表示旁路编码。
例如,可针对双向等权重标志执行正常模式熵编码。
作为另一示例,可针对双向非对称正负号权重标志执行正常模式熵编码。
作为另一示例,可针对双向权重索引执行旁路模式熵编码。
作为另一示例,可相针对双向权重索引的第一二进制位执行正常模式熵编码,并且可针对另一二进制位执行旁路模式熵编码。例如,可根据下面的表7或表8执行bcw_idx的熵编码/熵解码。
表7
表8
作为另一示例,可针对双向权重索引的第一二进制位和第二二进制位执行正常模式熵编码,并且可针对另一二进制位执行旁路模式熵编码。例如,可根据下面的表9执行bcw_idx的熵编码/熵解码。
表9
作为另一示例,可根据NoBackwardPredFlag自适应地确定bcw_idx的熵编码/熵解码方法。例如,可根据下面的表10执行bcw_idx的熵编码/熵解码。
表10
作为另一示例,如果正常代码熵编码被应用于bcw_idx,则可根据NoBackwardPredFlag自适应地选择上下文模型。例如,可根据下面的表11执行bcw_idx的熵编码/熵解码。
表11
此时,表7至表11中所示出的的数字可指示针对当前块执行正常模式熵编码和用于正常模式熵编码的上下文模型。
可在编码器和解码器中以相同的方法执行上述实施例。
上述实施例中的至少一个或组合可用于对视频进行编码/解码。
应用于上述实施例的顺序在编码器和解码器之间可以不同,或者应用于上述实施例的顺序在编码器和解码器中可以相同。
可对每一个亮度信号和色度信号执行上述实施例,或者可对亮度信号和色度信号相同地执行上述实施例。
应用本发明的上述实施例的块形式可具有正方形形状或非正方形形状。
在编码器中熵编码和在解码器中熵解码的语法元素(标志、索引等)中的至少一个可使用以下二值化、去二值化、熵编码/熵解码方法中的至少一个。
–带正负号的0阶Exp_Golomb的二值化/去二值化的方法(se(v))
–带正负号的k阶Exp_Golomb的二值化/去二值化的方法(sek(v))
–无正负号的正整数的0阶Exp_Golomb的二值化/去二值化的方法(ue(v))
–无正负号的正整数的k阶Exp_Golomb的二值化/去二值化的方法(uek(v))
–固定长度二值化/去二值化方法(f(n))
–截断莱斯二值化/去二值化方法或截断一元二值化/去二值化方法(tu(v))
–截断二进制二值化/去二值化方法(tb(v))
–上下文自适应算术编码/解码方法(ae(v))
–字节单位比特串(b(8))
–带正负号的整数的二值化/去二值化方法(i(n))
–无正负号的正整数的二值化/去二值化方法(u(n))
–一元二值化/去二值化方法
可根据编码块、预测块、变换块、块、当前块、编码单元、预测单元、变换单元、单元和当前单元中的至少一个的尺寸来应用本发明的上述实施例。这里,尺寸可被定义为最小尺寸或最大尺寸或最小尺寸和最大尺寸两者,使得上述实施例被应用,或者可被定义为上述实施例被应用于的固定尺寸。另外,在上述实施例中,第一实施例可被应用于第一尺寸,并且第二实施例可被应用于第二尺寸。换句话说,可根据尺寸组合应用上述实施例。另外,当尺寸等于或大于最小尺寸并且等于或小于最大尺寸时,可应用上述实施例。换句话说,当块尺寸包括在特定范围内时,可应用上述实施例。
例如,在当前块的尺寸为8×8或更大时,可应用上述实施例。例如,在当前块的尺寸仅为4×4时,可应用上述实施例。例如,在当前块的尺寸为16×16或更小时,可应用上述实施例。例如,在当前块的尺寸等于或大于16×16并且等于或小于64×64时,可应用上述实施例。
可根据时间层来应用本发明的上述实施例。为了识别可应用上述实施例的时间层,可用信号传送相应标识符,并且可将上述实施例应用于由相应标识符识别的指定时间层。这里,标识符可被定义为可应用上述实施例的最低层或最高层或最低层和最高层两者,或者可被定义为指示应用该实施例的特定层。另外,可定义应用该实施例的固定时间层。
例如,在当前图像的时间层是最低层时,可应用上述实施例。例如,在当前图像的时间层标识符是1时,可应用上述实施例。例如,在当前图像的时间层是最高层时,可应用上述实施例。
可定义应用本发明的上述实施例的条带类型或并行块组类型,并且可根据相应的条带类型或并行块组类型来应用上述实施例。
在上述实施例中,基于具有一系列步骤或单元的流程图描述了方法,但是本发明不限于步骤的顺序,而是可与其他步骤同时执行一些步骤或以不同的顺序执行一些步骤。另外,本领域普通技术人员应当理解的是,流程图中的步骤不彼此排除,并且可将其他步骤添加到流程图中,或者可从流程图中删除一些步骤,而不影响本发明的范围。
实施例包括示例的各个方面。可以不描述各个方面的所有可能的组合,但是本领域技术人员将能够认识到不同的组合。因此,本发明可包括在权利要求的范围内的所有替换、修改和改变。
本发明的实施例可以以程序指令的形式实现,其中,程序指令可由各种计算机组件执行并且被记录在计算机可读记录介质中。计算机可读记录介质可包括独立的程序指令、数据文件、数据结构等或程序指令、数据文件、数据结构等的组合。记录在计算机可读记录介质中的程序指令可以是针对本发明专门设计和构建的,或者是计算机软件技术领域的普通技术人员所公知的。计算机可读记录介质的示例包括磁记录介质,诸如硬盘、软盘和磁带;光学数据存储介质,诸如CD-ROM或DVD-ROM;磁最佳介质,例如软磁盘;以及硬件装置,诸如只读存储器(ROM)、随机存取存储器(RAM)、闪存等,其被具体构建为存储和实现程序指令。程序指令的示例不仅包括由编译器格式化的机械语言代码,还包括可由计算机使用解释器实现的高级语言代码。硬件装置可被配置为由一个或更多个软件模块操作以进行根据本公开的处理,反之亦然。
尽管已经根据诸如详细元件的特定项目以及有限的实施例和附图描述了本公开,但提供它们仅是为了帮助更一般地理解本发明,并且本公开不限于上述实施例。本发明所属领域的技术人员将理解的是,可从上述描述进行各种修改和改变。
因此,本发明的精神不应限于上述实施例,并且所附权利要求及其等同物的整个范围将落入本发明的范围和精神内。
工业适用性
本发明可被用于对图像进行编码或解码。
Claims (14)
1.一种图像解码方法,包括:
产生当前块的第一预测块;
产生所述当前块的第二预测块;并且
使用所述第一预测块与所述第二预测块的样点单位加权和产生所述当前块的最终预测样点,
其中,用于所述样点单位加权和的权重基于当前亮度样点的位置和用于对所述当前块进行分区的几何预测模式(GPM)边界线被确定。
2.根据权利要求1所述的图像解码方法,还包括:
获取所述当前块的GPM分区索引;并且
基于所述GPM分区索引指定所述GPM边界线。
3.根据权利要求2所述的图像解码方法,其中,所述GPM分区索引指示从所述当前块的中心至所述GPM边界线的距离或者所述GPM边界线的角度中的至少一个。
4.根据权利要求3所述的图像解码方法,其中,所述GPM边界线基于从所述当前块的中心至所述GPM边界线的所述距离或者所述GPM边界线的所述角度中的至少一个被指定。
5.根据权利要求2所述的图像解码方法,其中,基于当前样点与所述GPM边界线之间的距离来确定应用于所述当前亮度样点的权重。
6.根据权利要求1所述的图像解码方法,其中,使用与当前色度样点相应的亮度样点的权重来确定应用于所述当前色度样点的权重。
7.根据权利要求1所述的图像解码方法,其中,将应用于所述当前亮度样点的权重确定为{7/8,6/8,4/8,2/8,1/8}中的一个。
8.根据权利要求1所述的图像解码方法,还包括:
推导所述当前块的合并候选列表;并且
使用所述合并候选列表推导所述当前块的GPM候选列表。
9.根据权利要求8所述的图像解码方法,其中,所述GPM候选列表的GPM候选0、GPM候选2或GPM候选4中的至少一个GPM候选使用与所述GPM候选相应的合并候选的L0运动信息被推导。
10.根据权利要求8所述的图像解码方法,其中,所述GPM候选列表的GPM候选1、GPM候选3或GPM候选5中的至少一个GPM候选使用与所述GPM候选相应的合并候选的L1运动信息被推导。
11.根据权利要求8所述的图像解码方法,还包括:
获取第一GPM索引和第二GPM索引;
基于所述第一GPM索引和所述GPM候选列表获取第一运动信息;并且
基于所述第二GPM索引和所述GPM候选列表获取第二运动信息,
其中,所述第一预测块基于所述第一运动信息被产生,以及所述第二预测块基于所述第二运动信息被产生。
12.一种图像编码方法,包括:
产生当前块的第一预测块;
产生所述当前块的第二预测块;
使用所述第一预测块与所述第二预测块的样点单位加权和产生所述当前块的最终预测样点;并且
对用于所述样点单位加权和的权重相关信息进行编码,
其中,所述权重相关信息基于当前亮度样点的位置和用于对所述当前块进行分区的几何预测模式(GPM)边界线被确定。
13.根据权利要求12所述的图像编码方法,其中,所述权重相关信息指示从所述当前块的中心至所述GPM边界线的距离或者所述GPM边界线的角度中的至少一个。
14.一种计算机可读记录介质,用于存储由图像解码设备接收并用于重建包括在当前画面中的当前块的比特流,其中,所述比特流通过图像编码方法被产生,所述图像编码方法包括:
产生当前块的第一预测块;
产生所述当前块的第二预测块;
使用所述第一预测块与所述第二预测块的样点单位加权和产生所述当前块的最终预测样点;并且
对用于所述样点单位加权和的权重相关信息进行编码,
其中,所述权重相关信息基于当前亮度样点的位置和用于对所述当前块进行分区的几何预测模式(GPM)边界线被确定。
Applications Claiming Priority (7)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR10-2019-0116394 | 2019-09-20 | ||
| KR20190116394 | 2019-09-20 | ||
| KR10-2019-0117040 | 2019-09-23 | ||
| KR20190117040 | 2019-09-23 | ||
| KR10-2019-0117027 | 2019-09-23 | ||
| KR20190117027 | 2019-09-23 | ||
| PCT/KR2020/012717 WO2021054805A1 (ko) | 2019-09-20 | 2020-09-21 | 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN114731409A true CN114731409A (zh) | 2022-07-08 |
Family
ID=74883643
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202080080951.8A Pending CN114731409A (zh) | 2019-09-20 | 2020-09-21 | 图像编码/解码方法和装置、以及存储比特流的记录介质 |
Country Status (4)
| Country | Link |
|---|---|
| US (2) | US12075028B2 (zh) |
| KR (1) | KR20210034534A (zh) |
| CN (1) | CN114731409A (zh) |
| WO (1) | WO2021054805A1 (zh) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2024055155A1 (zh) * | 2022-09-13 | 2024-03-21 | Oppo广东移动通信有限公司 | 一种编解码方法、装置、编码器、解码器及存储介质 |
| WO2025152999A1 (en) * | 2024-01-17 | 2025-07-24 | Mediatek Inc. | Geometric partitioning mode extensions |
| WO2025213886A1 (zh) * | 2024-04-09 | 2025-10-16 | 中兴通讯股份有限公司 | 帧内预测方法、视频图像编码和解码方法、图像处理装置、介质和程序产品 |
Families Citing this family (13)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2021247906A1 (en) * | 2020-06-03 | 2021-12-09 | Beijing Dajia Internet Information Technology Co., Ltd. | Geometric partition mode with motion vector refinement |
| US20240380884A1 (en) * | 2021-04-08 | 2024-11-14 | Lg Electronics Inc. | Image encoding/decoding method and device for performing prediction of image on basis of multiple intra predictions, and method for transmitting bitstream |
| WO2023280282A1 (en) * | 2021-07-09 | 2023-01-12 | Beijing Bytedance Network Technology Co., Ltd. | Method, apparatus, and medium for video processing |
| WO2023284819A1 (en) * | 2021-07-14 | 2023-01-19 | Beijing Bytedance Network Technology Co., Ltd. | Method, apparatus, and medium for video processing |
| WO2023055193A1 (ko) * | 2021-10-01 | 2023-04-06 | 현대자동차주식회사 | 결합된 인트라/인터 예측 모드 또는 기하학적 분할 모드에 움직임 벡터 차분을 사용한 머지 모드를 적용하는 비디오 부호화/복호화 방법 및 장치 |
| CN118476224A (zh) * | 2021-12-31 | 2024-08-09 | Oppo广东移动通信有限公司 | 预测方法、装置、设备、系统、及存储介质 |
| WO2023132614A1 (ko) * | 2022-01-04 | 2023-07-13 | 현대자동차주식회사 | 머지 모드를 개선하는 비디오 부호화/복호화 방법 및 장치 |
| KR20240164524A (ko) * | 2022-03-21 | 2024-11-19 | 주식회사 윌러스표준기술연구소 | 템플릿 매칭에 기초한 비디오 신호 처리 방법 및 이를 위한 장치 |
| EP4544774A1 (en) * | 2022-06-21 | 2025-04-30 | Beijing Dajia Internet Information Technology Co., Ltd. | Methods and devices for motion storage in geometric partitioning mode |
| US12549742B2 (en) * | 2023-04-07 | 2026-02-10 | Nokia Technologies Oy | Region-based filtering |
| WO2024219792A1 (ko) * | 2023-04-20 | 2024-10-24 | 현대자동차주식회사 | 인트라 예측에 기반한 기하학적 분할모드를 이용하는 비디오 부호화/복호화 방법 및 장치 |
| WO2024262870A1 (ko) * | 2023-06-19 | 2024-12-26 | 현대자동차주식회사 | 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체 |
| US20250113053A1 (en) * | 2023-10-03 | 2025-04-03 | Alibaba (China) Co., Ltd. | Template matching-based motion refinement in video coding |
Family Cites Families (53)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6957350B1 (en) * | 1996-01-30 | 2005-10-18 | Dolby Laboratories Licensing Corporation | Encrypted and watermarked temporal and resolution layering in advanced television |
| US5790839A (en) * | 1996-12-20 | 1998-08-04 | International Business Machines Corporation | System integration of DRAM macros and logic cores in a single chip architecture |
| US5901304A (en) * | 1997-03-13 | 1999-05-04 | International Business Machines Corporation | Emulating quasi-synchronous DRAM with asynchronous DRAM |
| KR100244769B1 (ko) * | 1997-06-26 | 2000-02-15 | 전주범 | 스케일러빌리티를 갖는 간 윤곽선 부호화 방법 및 장치 |
| KR100240770B1 (ko) * | 1997-07-11 | 2000-01-15 | 이형도 | 에너지보상/역보상기능을개선한스케러블부호화기및그방법 |
| US6765962B1 (en) * | 1999-12-02 | 2004-07-20 | Sarnoff Corporation | Adaptive selection of quantization scales for video encoding |
| US6826232B2 (en) * | 1999-12-20 | 2004-11-30 | Koninklijke Philips Electronics N.V. | Fine granular scalable video with embedded DCT coding of the enhancement layer |
| KR20020070362A (ko) * | 1999-12-22 | 2002-09-06 | 제너럴 인스트루먼트 코포레이션 | 공간 스케일성 및 시뮬캐스트 코딩을 이용한 멀티캐스트환경의 비디오 압축 |
| US7477688B1 (en) * | 2000-01-26 | 2009-01-13 | Cisco Technology, Inc. | Methods for efficient bandwidth scaling of compressed video data |
| US7095782B1 (en) * | 2000-03-01 | 2006-08-22 | Koninklijke Philips Electronics N.V. | Method and apparatus for streaming scalable video |
| US6771703B1 (en) * | 2000-06-30 | 2004-08-03 | Emc Corporation | Efficient scaling of nonscalable MPEG-2 Video |
| US7016412B1 (en) * | 2000-08-29 | 2006-03-21 | Koninklijke Philips Electronics N.V. | System and method for dynamic adaptive decoding of scalable video to balance CPU load |
| AU2002213713A1 (en) * | 2000-10-24 | 2002-05-06 | Eyeball Networks Inc. | Dct-based scalable video compression |
| US7263124B2 (en) * | 2001-09-26 | 2007-08-28 | Intel Corporation | Scalable coding scheme for low latency applications |
| US7729421B2 (en) * | 2002-02-20 | 2010-06-01 | International Business Machines Corporation | Low latency video decoder with high-quality, variable scaling and minimal frame buffer memory |
| US7391807B2 (en) * | 2002-04-24 | 2008-06-24 | Mitsubishi Electric Research Laboratories, Inc. | Video transcoding of scalable multi-layer videos to single layer video |
| KR20060105408A (ko) * | 2005-04-01 | 2006-10-11 | 엘지전자 주식회사 | 영상 신호의 스케일러블 인코딩 및 디코딩 방법 |
| US7369610B2 (en) * | 2003-12-01 | 2008-05-06 | Microsoft Corporation | Enhancement layer switching for scalable video coding |
| US7697608B2 (en) * | 2004-02-03 | 2010-04-13 | Sony Corporation | Scalable MPEG video/macro block rate control |
| KR100677142B1 (ko) * | 2004-08-13 | 2007-02-02 | 경희대학교 산학협력단 | 파노라마 영상의 움직임 추정 및 보상 |
| US8345762B2 (en) * | 2005-02-18 | 2013-01-01 | Thomson Licensing | Method for deriving coding information for high resolution pictures from low resolution pictures and coding and decoding devices implementing said method |
| KR100732961B1 (ko) * | 2005-04-01 | 2007-06-27 | 경희대학교 산학협력단 | 다시점 영상의 스케일러블 부호화, 복호화 방법 및 장치 |
| US8189659B2 (en) * | 2005-08-30 | 2012-05-29 | Thomson Licensing | Cross-layer optimization for scalable video multicast over IEEE 802.11 wireless local area networks |
| JP2007081720A (ja) * | 2005-09-13 | 2007-03-29 | Sanyo Electric Co Ltd | 符号化方法 |
| EP1972152A4 (en) * | 2006-01-09 | 2014-12-17 | Lg Electronics Inc | METHOD FOR PREDICTING INTER-LAYER OF VIDEO SIGNAL |
| WO2009051668A2 (en) | 2007-10-12 | 2009-04-23 | Thomson Licensing | Methods and apparatus for video encoding and decoding geometrically partitioned bi-predictive mode partitions |
| US8879632B2 (en) | 2010-02-18 | 2014-11-04 | Qualcomm Incorporated | Fixed point implementation for geometric motion partitioning |
| TWI416961B (zh) * | 2010-04-02 | 2013-11-21 | Univ Nat Chiao Tung | 用於可調式視訊編碼系統之選擇性移動向量預測方法、移動估測方法及其裝置 |
| US20110268175A1 (en) * | 2010-04-30 | 2011-11-03 | Wai-Tian Tan | Differential protection of a live scalable media |
| US20130028324A1 (en) * | 2011-07-29 | 2013-01-31 | National Chiao Tung University | Method and device for decoding a scalable video signal utilizing an inter-layer prediction |
| US9124899B2 (en) * | 2012-09-28 | 2015-09-01 | Sharp Laboratories Of America, Inc. | Motion derivation and coding for scaling video |
| US9918082B2 (en) * | 2014-10-20 | 2018-03-13 | Google Llc | Continuous prediction domain |
| US10666940B2 (en) | 2014-11-06 | 2020-05-26 | Samsung Electronics Co., Ltd. | Video encoding method and apparatus, and video decoding method and apparatus |
| EP3354029B1 (en) * | 2015-09-23 | 2025-01-15 | Nokia Technologies Oy | A method, an apparatus and a computer program product for coding a 360-degree panoramic video |
| US20170214937A1 (en) * | 2016-01-22 | 2017-07-27 | Mediatek Inc. | Apparatus of Inter Prediction for Spherical Images and Cubic Images |
| ES2737874B2 (es) * | 2016-07-05 | 2020-10-16 | Kt Corp | Metodo y aparato para procesar senal de video |
| US11190770B2 (en) * | 2016-07-05 | 2021-11-30 | Kt Corporation | Method and apparatus for processing video signal |
| US11381829B2 (en) * | 2016-08-19 | 2022-07-05 | Lg Electronics Inc. | Image processing method and apparatus therefor |
| US10805631B2 (en) * | 2016-09-23 | 2020-10-13 | Lg Electronics Inc. | Method and apparatus for performing prediction using template-based weight |
| US20190364284A1 (en) | 2017-01-16 | 2019-11-28 | Industry Academy Cooperation Foundation Of Sejong University | Image encoding/decoding method and device |
| KR20180084659A (ko) | 2017-01-16 | 2018-07-25 | 세종대학교산학협력단 | 영상의 부호화/복호화 방법 및 장치 |
| EP3422724B1 (en) * | 2017-06-26 | 2024-05-01 | Nokia Technologies Oy | An apparatus, a method and a computer program for omnidirectional video |
| WO2019039323A1 (en) * | 2017-08-22 | 2019-02-28 | Panasonic Intellectual Property Corporation Of America | IMAGE ENCODER, IMAGE DECODER, IMAGE ENCODING METHOD, AND IMAGE DECODING METHOD |
| BR112020001991A2 (pt) * | 2017-08-22 | 2020-08-18 | Panasonic Intellectual Property Corporation Of America | codificador de imagem, decodificador de imagem, método de codificação de imagem e método de decodificação de imagem |
| JP7248664B2 (ja) * | 2017-10-05 | 2023-03-29 | インターデジタル ヴイシー ホールディングス, インコーポレイテッド | ビデオ符号化および復号における適応的照度補償のための方法および装置 |
| EP3518536A1 (en) * | 2018-01-26 | 2019-07-31 | Thomson Licensing | Method and apparatus for adaptive illumination compensation in video encoding and decoding |
| US10735721B2 (en) * | 2018-04-17 | 2020-08-04 | Panasonic Intellectual Property Corporation Of America | Encoder, decoder, encoding method, and decoding method using local illumination compensation |
| CN118200532A (zh) * | 2018-05-10 | 2024-06-14 | 三星电子株式会社 | 视频解码方法、视频编码设备以及存储比特流的方法 |
| SG11202104643QA (en) * | 2018-11-08 | 2021-06-29 | Guangdong Oppo Mobile Telecommunications Corp Ltd | Method for encoding/decoding image signal and device therefor |
| US11252434B2 (en) * | 2018-12-31 | 2022-02-15 | Tencent America LLC | Method for wrap-around padding for omnidirectional media coding |
| KR20250154521A (ko) * | 2019-01-15 | 2025-10-28 | 로즈데일 다이나믹스 엘엘씨 | 변환 스킵 플래그를 이용한 영상 코딩 방법 및 장치 |
| US11206396B2 (en) * | 2019-01-16 | 2021-12-21 | Qualcomm Incorporated | Local illumination compensation in video coding |
| US11095916B2 (en) * | 2019-07-23 | 2021-08-17 | Qualcomm Incorporated | Wraparound motion compensation in video coding |
-
2020
- 2020-09-21 KR KR1020200121774A patent/KR20210034534A/ko active Pending
- 2020-09-21 CN CN202080080951.8A patent/CN114731409A/zh active Pending
- 2020-09-21 WO PCT/KR2020/012717 patent/WO2021054805A1/ko not_active Ceased
- 2020-09-21 US US17/761,908 patent/US12075028B2/en active Active
-
2024
- 2024-07-17 US US18/775,718 patent/US20240406376A1/en active Pending
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2024055155A1 (zh) * | 2022-09-13 | 2024-03-21 | Oppo广东移动通信有限公司 | 一种编解码方法、装置、编码器、解码器及存储介质 |
| WO2025152999A1 (en) * | 2024-01-17 | 2025-07-24 | Mediatek Inc. | Geometric partitioning mode extensions |
| WO2025213886A1 (zh) * | 2024-04-09 | 2025-10-16 | 中兴通讯股份有限公司 | 帧内预测方法、视频图像编码和解码方法、图像处理装置、介质和程序产品 |
Also Published As
| Publication number | Publication date |
|---|---|
| US20240406376A1 (en) | 2024-12-05 |
| WO2021054805A1 (ko) | 2021-03-25 |
| US12075028B2 (en) | 2024-08-27 |
| KR20210034534A (ko) | 2021-03-30 |
| US20220385888A1 (en) | 2022-12-01 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN111279695B (zh) | 用于基于非对称子块的图像编码/解码的方法及装置 | |
| CN113273213B (zh) | 图像编码/解码方法和设备以及存储比特流的记录介质 | |
| CN114731409A (zh) | 图像编码/解码方法和装置、以及存储比特流的记录介质 | |
| CN112740686B (zh) | 用于帧内预测模式编码/解码的方法和设备以及用于存储比特流的记录介质 | |
| CN114788286B (zh) | 图像编码/解码方法和用于发送压缩视频数据的设备 | |
| CN112740697A (zh) | 图像编码/解码方法和装置及存储比特流的记录介质 | |
| CN110024402B (zh) | 图像编码/解码方法和装置以及存储有比特流的记录介质 | |
| CN113950831B (zh) | 基于帧内块复制的编/解码方法、装置和比特流存储介质 | |
| CN118984380A (zh) | 用于推导帧内预测模式的方法和设备 | |
| CN113841404B (zh) | 视频编码/解码方法和设备以及存储比特流的记录介质 | |
| CN113875235B (zh) | 图像编码/解码方法和装置及存储比特流的记录介质 | |
| CN113196758B (zh) | 图像编码/解码方法和设备以及存储比特流的记录介质 | |
| CN113228645B (zh) | 图像编码/解码方法和装置以及存储有比特流的记录介质 | |
| CN113228681B (zh) | 图像编码/解码方法和装置以及存储比特流的记录介质 | |
| CN112740694A (zh) | 用于对图像进行编码/解码的方法和设备以及用于存储比特流的记录介质 | |
| CN112740671A (zh) | 图像编码/解码方法和装置以及存储比特流的记录介质 | |
| CN113906740A (zh) | 帧间预测信息编码/解码方法和装置 | |
| CN113287305B (zh) | 视频编码/解码方法、装置以及在其中存储比特流的记录介质 | |
| CN113228639A (zh) | 图像编码/解码方法和装置以及存储有比特流的记录介质 | |
| CN113545052A (zh) | 图像编码/解码方法和装置以及存储比特流的记录介质 | |
| CN113228643A (zh) | 图像编码/解码方法和设备以及用于存储比特流的记录介质 | |
| CN113875237A (zh) | 用于在帧内预测中用信号传送预测模式相关信号的方法和装置 | |
| CN112740669A (zh) | 用于图像编码/解码的方法和设备、以及存储比特流的记录介质 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination |