HK1191162B - 用於样本自适应偏移的偏移类型及系数信令方法 - Google Patents
用於样本自适应偏移的偏移类型及系数信令方法 Download PDFInfo
- Publication number
- HK1191162B HK1191162B HK14104048.8A HK14104048A HK1191162B HK 1191162 B HK1191162 B HK 1191162B HK 14104048 A HK14104048 A HK 14104048A HK 1191162 B HK1191162 B HK 1191162B
- Authority
- HK
- Hong Kong
- Prior art keywords
- sample adaptive
- offset information
- adaptive offset
- partition
- offset
- Prior art date
Links
Description
本申请案主张2011年5月10日申请的第61/484,624号美国临时申请案及2011年6月30日申请的第61/503,454号美国临时申请案的权利,所述两个申请案在此以引用的方式全部并入。
技术领域
本发明涉及视频编码,且更明确来说,涉及用于在视频编码过程中执行样本自适应偏移信令及编码的技术。
背景技术
数字视频能力可并入到广泛范围的装置内,广泛范围的装置包括数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、视频电话会议装置及其类似者。数字视频装置实施视频压缩技术(例如,在由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4(第10部分,高级视频编码(AVC))、目前待开发的高效率视频编码(HEVC)标准定义的标准及此些标准的扩展中所描述的视频压缩技术),以更有效率地发射、接收及存储数字视频信息。
视频压缩技术包括空间预测及/或时间预测以减少或移除视频序列中固有的冗余。对于基于块的视频编码,可将视频帧或片段分割成块。可进一步分割每一块。使用关于相同帧或片段中的相邻块中的参考样本的空间预测来编码经帧内编码(I)帧或片段中的块。经帧间编码(P或B)帧或片段中的块可使用关于相同帧或片段中的相邻块中的参考样本的空间预测,或关于其它参考帧中的参考样本的时间预测。空间预测或时间预测导致编码用于块的预测性块。残余数据表示待编码的原始块与预测性块之间的像素差。
根据指向形成预测性块的参考样本块的运动向量及指示经编码块与预测性块之间的差异的残余数据来编码经帧间编码的块。根据帧内编码模式及残余数据编码经帧内编码的块。为了进一步压缩,可将残余数据从像素域变换到变换域,从而导致接着可量化的残余变换系数。可以特定次序扫描一开始以二维阵列排列的经量化的变换系数,以产生用于熵编码的变换系数的一维向量。
发明内容
一般来说,本发明描述用于编码视频数据的技术。本发明描述用于在视频编码过程中执行样本自适应偏移信令及编码的技术。本发明的技术包括针对样本自适应偏移信息(即,偏移值及偏移类型)的基于合并的信令过程及基于预测的信令过程两者。
在本发明的一实例中,提议一种在视频编码过程中编码样本自适应偏移值的方法。所述方法包括:确定用于当前分割区的偏移信息;比较所述当前分割区的所述偏移信息与一个或一个以上相邻分割区的偏移信息;在所述一个或一个以上相邻分割区中的一者的所述偏移信息与所述当前分割区的所述偏移信息相同的状况下,编码合并指令;及在所述一个或一个以上相邻分割区的所述偏移信息与所述当前分割区的所述偏移信息不相同的状况下,编码多个预测指令中的一者。
在本发明的另一实例中,提议一种经配置以在视频编码过程中编码样本自适应偏移值的设备。所述设备包括视频编码器,所述视频编码器经配置以比较当前分割区的偏移信息与一个或一个以上相邻分割区的偏移信息;在所述一个或一个以上相邻分割区中的一者的所述偏移信息与所述当前分割区的所述偏移信息相同的状况下,编码合并指令;及在所述一个或一个以上相邻分割区的所述偏移信息与所述当前分割区的所述偏移信息不相同的状况下,编码多个预测指令中的一者。
在本发明的另一实例中,提议一种在视频解码过程中解码样本自适应偏移值的方法。所述方法包括:针对当前分割区,接收合并指令或多个预测指令中的一者;在接收到所述合并指令的状况下,将偏移信息从相邻分割区复制到所述当前分割区;及在接收到所述多个预测指令中的一者的状况下,针对所述当前分割区执行偏移预测过程。
在本发明的另一实例中,提议一种经配置以在视频解码过程中解码样本自适应偏移值的设备。所述设备包括视频解码器,所述视频解码器经配置以针对当前分割区,接收合并指令或多个预测指令中的一者;在接收到所述合并指令的状况下,将偏移信息从相邻分割区复制到所述当前分割区;及在接收到所述多个预测指令中的一者的状况下,针对所述当前分割区执行偏移预测过程。
在随附图式及以下描述中阐述一个或一个以上实例的细节。其它特征、目标及优点将从所述描述及这些图式及从权利要求书显而易见。
附图说明
图1为描绘视频编码过程中用于编码单元的四叉树结构的概念图。
图2为展示四种可能的边缘偏移类型的概念图。
图3为展示实例频带偏移类型的概念图。
图4为说明实例视频编码及解码系统的框图。
图5为说明实例视频编码器的框图。
图6为描绘在用信号发送偏移信息中使用的潜在相邻分割区的概念图。
图7A为在合并模式下的自适应偏移语法编码的实例的概念图。
图7B为在第一预测模式下的自适应偏移语法编码的实例的概念图。
图7C为在第二预测模式下的自适应偏移语法编码的实例的概念图。
图7D为在第三预测模式下的自适应偏移语法编码的实例的概念图。
图8为说明实例视频解码器的框图。
图9为说明使用样本自适应偏移编码视频的实例方法的流程图。
图10为说明使用样本自适应偏移解码视频的实例方法的流程图。
具体实施方式
一般来说,本发明描述用于编码视频数据的技术。本发明描述用于在视频编码过程中编码样本自适应偏移值的技术。
数字视频装置实施视频压缩技术以更有效率地编码及解码数字视频信息。视频压缩可应用空间(帧内)预测及/或时间(帧间)预测技术以减少或移除视频序列中固有的冗余。
作为一实例,对于根据当前处于由联合视频编码合作小组(JCT-VC)进行的开发中的高效率视频编码(HEVC)标准的视频编码,可将视频帧分割成编码单元。编码单元(CU)大体指用作为了视频压缩而将各种编码工具应用到的基本单元的图像区域。CU通常具有表示为Y的亮度分量,及表示为U及V的两个色度分量。取决于视频取样格式,U及V分量的大小可依据样本的数目而与Y分量的大小相同或不同。CU通常为方形的,且可被视为类似于所谓的宏块,例如,在例如ITU-T H.264的其它视频编码标准下。为了说明的目的,将在本申请案中描述根据开发中的HEVC标准的目前提议的方面中的一些方面的编码。然而,本发明中所描述的技术可用于其它视频编码过程,例如,根据H.264定义的视频编码过程或其它标准或专属视频编码过程。
HEVC标准化努力是基于被称作HEVC测试模型(HM)的视频编码装置模型。HM假定优于根据(例如)ITU-T H.264/AVC的装置的视频编码装置的若干能力。举例来说,尽管H.264提供九种帧内预测编码模式,但HM提供多达三十四种帧内预测编码模式。
根据HM,CU可包括一个或一个以上预测单元(PU)及/或一个或一个以上变换单元(TU)。位流内的语法数据可定义最大编码单元(LCU),最大编码单元(LCU)是就像素的数目来说的最大CU。一般来说,除了CU不具有大小差别外,CU具有类似于H.264的宏块的目的。因此,可将CU分裂成子CU。一般来说,本发明中对CU的参考可指LCU的图片或子CU的最大编码单元。可将LCU分裂成子CU,且可进一步将每一子CU分裂成子CU。用于位流的语法数据可定义可分裂LCU的最大次数,所述最大次数被称作CU深度。因此,位流也可定义最小编码单元(SCU)。本发明也使用术语“块”或“部分”来指CU、PU或TU中的任一者。一般来说,“部分”可指视频帧的任一子集。
LCU可与四叉树数据结构相关联。图1为四叉树分裂的概念图。一般来说,四叉树数据结构包括每一CU一节点,其中根节点对应于LCU。如果将CU分裂成四个子CU,则对应于CU的节点包括四个叶节点,所述四个叶节点中的每一者对应于这些子CU中的一者。四叉树数据结构的每一节点可提供用于对应的CU的语法数据。举例来说,四叉树中的节点可包括一分裂旗标,从而指示对应于节点的CU是否分裂成子CU。可递归地定义用于CU的语法元素,且用于CU的语法元素可取决于CU是否分裂成子CU。如果CU未进一步分裂,则所述CU被称作叶CU。在本发明中,尽管不存在原始叶CU的显式分裂,但叶CU的四个子CU也被称作叶CU。举例来说,如果处于16×16大小的CU未进一步分裂,则尽管16×16CU从未分裂,但四个8×8子CU也将被称作叶CU。
此外,叶CU的TU也可与相应四叉树数据结构相关联。即,叶CU可包括指示如何将叶CU分割成TU的四叉树。本发明将指示如何分割LCU的四叉树称作CU四叉树,且将指示如何将叶CU分割成TU的四叉树称作TU四叉树。TU四叉树的根节点大体上对应于叶CU,而CU四叉树的根节点大体上对应于LCU。未分裂的TU四叉树的TU被称作叶TU。
叶CU可包括一个或一个以上预测单元(PU)。一般来说,PU表示对应的CU的全部或一部分,且可包括用于捕获用于PU的参考样本的数据。举例来说,当PU经帧间模式编码时,PU可包括定义用于PU的运动向量的数据。定义运动向量的数据可描述(例如)运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如,四分之一像素精确度或八分之一像素精确度)、运动向量指向的参考帧,及/或运动向量的参考列表(例如,列表0或列表1)。用于定义PU的叶CU的数据也可描述(例如)CU到一个或一个以上PU的分割。分割模式可视CU未经编码、经帧内预测模式编码或经帧间预测模式编码而不同。对于帧内编码,可与下文所描述的叶变换单元相同地对待PU。
当前考虑将样本自适应偏移(SAO)编码用于采纳到HEVC标准内。一般来说,对视频帧(例如,用于帧间预测或帧内预测的预测性帧)中的像素添加偏移值可改善在视频序列的帧之间的照明改变期间(例如,在闪光、变暗天空或帧之间的其它类型的照明改变期间)的编码。举例来说,可将偏移值应用于所预测视频块的像素,以便对预测性视频块的值加偏置以便补偿照明改变。先前视频编码标准(例如,H.264)跨整个像素块或像素帧均匀地应用偏移类型及偏移值。SAO技术允许取决于像素(或块)分类量度而将不同偏移值应用于不同像素(或块)。可能的分类量度包括例如边缘量度及频带量度的活动量度。偏移分类的描述可见于C.-M.Fu、C.-Y.Chen、C.-Y.Tsai、Y.-W.Huang、S.Lei的“CE13:借助不依赖于LCD的解码的样本自适应偏移(CE13:Sample Adaptive Offset with LCU-Independent Decoding)”(JCT-VC Contribution,E049,日内瓦,2011年2月)中。
在当前SAO实施方案中,在HEVC标准的工作草案中,每一分割区(其由一组LCU组成)可具有三种偏移类型(也被称为像素分类)中的一者:无偏移、基于频带分类的偏移类型0/1,及基于边缘分类的类型0/1/2/3。每一频带分类偏移类型具有16个可能的偏移值,而每一基于边缘分类的类型具有4个可能的偏移值。如果选择此些偏移类型中的一者用于分割区,则将指示对应偏移类型及偏移值的信息发送到解码器。
边缘偏移类型基于边缘信息而对每一像素分类。图2为展示当前提议用于HEVC的四个可能的边缘偏移分类(也被称为偏移类型)的概念图。当前像素C的边缘是相对于两个相邻像素(1及2)而确定。边缘偏移类型0(SAO_EO_0)为水平边缘。边缘偏移类型1(SAO_EO_1)为垂直边缘。边缘偏移类型2(SAO_EO_2)及3(SAO_EO_3)为对角线边缘。对于每一边缘偏移类型值,确定四个偏移值且在经编码视频位流中用信号发送四个偏移值以供解码器使用。
对于频带偏移,基于强度而将像素分类成不同频带。图3为展示基于强度值的实例频带的概念图。对于频带偏移分类,将像素归类成32个频带。将中心的16个频带分类成一群组(频带偏移类型0)且将剩余频带分类成第二群组(频带偏移类型1)。对于每一频带群组,确定16个偏移值且在经编码视频位流中用信号发送16个偏移值以供视频解码器使用。
本发明提议用以更有效率地发送每一分割区的偏移类型及偏移值的方法及技术。在此上下文中,分割区可包括多个编码单元(CU)(类似于H.264标准中的所谓的宏块)或甚至多个最大编码单元(LCU)。
在本发明的一实例中,提议在一视频编码过程中编码样本自适应偏移值的技术。所提议技术包括:确定用于一当前分割区的偏移信息;比较所述当前分割区的所述偏移信息与一个或一个以上相邻分割区的偏移信息;在所述一个或一个以上相邻分割区中的一者的所述偏移信息与所述当前分割区的所述偏移信息相同的状况下,编码一合并指令;及在所述一个或一个以上相邻分割区的所述偏移信息与所述当前分割区的所述偏移信息不相同的状况下,编码多个预测指令中的一者。
在本发明的另一实例中,提议用于在一视频解码过程中解码样本自适应偏移值的技术。所提议技术包括:针对一当前分割区,接收一合并指令或多个预测指令中的一者;在接收到所述合并指令的状况下,将偏移信息从一相邻分割区复制到所述当前分割区;及在接收到所述多个预测指令中的一者的状况下,针对所述当前分割区执行一偏移预测过程。
图4为说明根据本发明的实例的一实例视频编码及解码系统10的框图,实例视频编码及解码系统10可经配置以利用执行样本自适应偏移信令及编码的技术。如图4中所展示,系统10包括一源装置12,源装置12经由通信信道16将经编码视频发射到目的地装置14。经编码视频数据也可存储于存储媒体34或文件服务器36上且可按需要由目的地装置14存取。当存储到存储媒体或文件服务器时,视频编码器20可将经编码视频数据提供到另一装置(例如网络接口、压缩光盘(CD)、Blu-ray或数字视频光盘(DVD)烧录机或压印设施装置,或其它装置),以用于将经编码视频数据存储到存储媒体。同样地,与视频解码器30分离的装置(例如,网络接口、CD或DVD读取器,或类似者)可从存储媒体捕获经编码视频数据且将所捕获数据提供到视频解码器30。
源装置12及目的地装置14可包含广泛的多种装置中的任一者,广泛的多种装置包括桌上型计算机、笔记型计算机(即,膝上型计算机)、平板计算机、机顶盒、电话手机(例如,所谓的智能电话)、电视、相机、显示装置、数字媒体播放器、视频游戏控制台,或其类似者。在许多状况下,可装备此些装置以用于无线通信。因此,通信信道16可包含适合于发射经编码视频数据的无线信道、有线信道或无线信道与有线信道的组合。类似地,可由目的地装置14经由任何标准数据连接(包括因特网连接)存取文件服务器36。此连接可包括适合于存取存储于文件服务器上的经编码视频数据的无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、有线电视调制解调器等)或两者的组合。
可将根据本发明的实例的用于执行样本自适应偏移信令及编码的技术应用于支持多种多媒体应用中的任一者的视频编码,多种多媒体应用例如为空中电视广播、有线电视发射、卫星电视发射、串流视频发射(例如,经由因特网)、编码数字视频以用于存储于数据存储媒体上、解码存储于数据存储媒体上的数字视频或其它应用。在一些实例中,系统10可经配置以支持单向或双向视频发射,以支持例如视频串流、视频播放、视频广播及/或视频电话等应用。
在图4的实例中,源装置12包括视频源18、视频编码器20、调制器/解调器22及发射器24。在源装置12中,视频源18可包括例如视频捕获装置等源,例如:摄像机、含有先前所捕获视频的视频存档、用以从视频内容提供者接收视频的视频馈入接口及/或用于产生计算机图形数据作为源视频的计算机图形系统,或此些源的组合。作为一实例,如果视频源18为摄像机,则源装置12及目的地装置14可形成所谓的摄像机电话或视频电话。然而,本发明中所描述的技术可大体上适用于视频编码,且可被应用于无线及/或有线应用,或其中经编码视频数据存储于本地磁盘上的应用。
可由视频编码器20来编码所捕获的、预先捕获的或计算机产生的视频。可由调制解调器22根据例如无线通信协议等通信标准来调制经编码视频信息,且经由发射器24将经编码视频信息发射到目的地装置14。调制解调器22可包括各种混频器、滤波器、放大器或经设计用于信号调制的其它组件。发射器24可包括经设计以用于发射数据的电路,包括放大器、滤波器及一个或一个以上天线。
也可将由视频编码器20编码的所捕获的、预先捕获的或计算机产生的视频存储到存储媒体34或文件服务器36上以供稍后使用。存储媒体34可包括蓝光光盘、DVD、CD-ROM、快闪存储器或用于存储经编码视频的任何其它合适的数字存储媒体。可接着由目的地装置14存取存储于存储媒体34上的经编码视频以供解码及播放。
文件服务器36可为能够存储经编码视频且将所述经编码视频发射到目的地装置14的任一类型的服务器。实例文件服务器包括网站服务器(例如,用于网站)、FTP服务器、网络附接式存储器(NAS)装置、本地磁盘机或能够存储经编码视频数据且将经编码视频数据发射到目的地装置的任一其它类型的装置。从文件服务器36的经编码视频数据的发射可为串流发射、下载发射或两者的组合。可由目的地装置14经由任何标准数据连接(包括因特网连接)存取文件服务器36。此连接可包括适合于存取存储于文件服务器上的经编码视频数据的无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、有线电视调制解调器、以太网络、USB等)或两者的组合。
在图4的实例中,目的地装置14包括接收器26、调制解调器28、视频解码器30及显示装置32。目的地装置14的接收器26经由信道16接收信息,且调制解调器28解调所述信息以产生用于视频解码器30的经解调的位流。经由信道16传递的信息可包括由视频编码器20产生以供视频解码器30在解码视频数据中使用的多种语法信息。此语法也可与存储于存储媒体34或文件服务器36上的经编码视频数据包括在一起。视频编码器20及视频解码器30中的每一者可形成能够编码或解码视频数据的相应编解码器(CODEC)的部分。在本发明中,术语“译码器(coder)”指编码器、解码器或CODEC,且术语译码器或编码器、解码器及CODEC均指与本发明一致的经设计用于译码(编码及/或解码)视频数据的特定机器。
显示装置32可与目的地装置14集成,或在目的地装置14外部。在一些实例中,目的地装置14可包括集成式显示装置且也经配置以与外部显示装置介接。在其它实例中,目的地装置14可为显示装置。一般来说,显示装置32向用户显示经解码视频数据,且可包含多种显示装置中的任一者,这些显示装置例如液晶显示器(LCD)、等离子体显示器、有机发光二极管(OLED)显示器,或另一类型的显示装置。
在图4的实例中,通信信道16可包含任一无线或有线通信媒体,例如,射频(RF)频谱或一个或一个以上物理传输线,或无线媒体与有线媒体的任何组合。通信信道16可形成基于包的网络(例如,局域网络、广域网络或例如因特网的全球网络)的部分。通信信道16通常表示用于将视频数据从源装置12发射到目的地装置14的任一合适通信媒体,或不同通信媒体的集合,包括有线媒体或无线媒体的任何合适组合。通信信道16可包括路由器、开关、基站或可适用于促进从源装置12到目的地装置14的通信的任何其它设备。
视频编码器20及视频解码器30可根据视频压缩标准操作,视频压缩标准例如目前在开发中的高效率视频编码(HEVC)标准,且可遵照HEVC测试模型(HM)。或者,视频编码器20及视频解码器30可根据其它专属或行业标准或此些标准的扩展操作,其它专属或行业标准例如ITU-T H.264标准(或者被称作MPEG-4,第10部分,高级视频编码(AVC))。然而,本发明的技术不限于任何特定编码标准。其它实例包括MPEG-2及ITU-TH.263。
尽管图4中未展示,但在一些方面中,视频编码器20及视频解码器30可各自与一音频编码器及解码器集成,且可包括适当MUX-DEMUX单元,或其它硬件及软件,以处置共同数据串流或分开数据串流中的音频与视频两者的编码。如果可适用,则在一些实例中,MUX-DEMUX单元可遵照ITU H.223多路复用器协议,或例如用户数据报协议(UDP)的其它协议。
视频编码器20及视频解码器30各自可实施为多种合适编码器电路中的任一者,多种合适编码器电路例如,一个或一个以上微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。当部分地以软件实施技术时,装置可将用于软件的指令存储于合适的非暂时性计算机可读媒体中,且使用一个或一个以上处理器在硬件中执行指令以执行本发明的技术。视频编码器20及视频解码器30中的每一者可包括于一个或一个以上编码器或解码器中,编码器或解码器中的任一者可作为组合式编码器/解码器(CODEC)的部分集成于相应装置中。
视频编码器20可实施本发明的任何技术或全部技术以用于在视频编码过程中执行样本自适应偏移信令及编码。同样地,视频解码器30可实施此些技术中的任何技术或全部技术以用于在视频编码过程中执行样本自适应偏移编码。如本发明中所描述,视频译码器可指视频编码器或视频解码器。类似地,视频译码单元可指视频编码器或视频解码器。同样地,视频译码可指视频编码或视频解码。
在本发明的一实例中,源装置12的视频编码器20可经配置以比较一当前分割区的偏移信息与一个或一个以上相邻分割区的偏移信息;在所述一个或一个以上相邻分割区中的一者的所述偏移信息与所述当前分割区的所述偏移信息相同的状况下,编码一合并指令;及在所述一个或一个以上相邻分割区的所述偏移信息与所述当前分割区的所述偏移信息不相同的状况下,编码多个预测指令中的一者。
在本发明的另一实例中,目的地装置14的视频解码器30可经配置以针对一当前分割区,接收一合并指令或多个预测指令中的一者;在接收到所述合并指令的状况下,将偏移信息从一相邻分割区复制到所述当前分割区;及在接收到所述多个预测指令中的一者的状况下,针对所述当前分割区执行偏移预测过程。
图5为说明视频编码器20的一实例的框图,视频编码器20可使用如本发明中所描述的编码及信令样本自适应偏移值的技术。为了说明的目的,将在HEVC编码的情况下描述视频编码器20,但无关于可能需要扫描变换系数的其它编码标准或方法的本发明的限制。视频编码器20可执行视频帧内的CU的帧内及帧间编码。帧内编码依赖于空间预测减少或移除给定视频帧内的视频数据的空间冗余。帧间编码依赖于时间预测减少或移除一视频序列的当前帧与先前经编码帧之间的时间冗余。帧内模式(I模式)可指若干基于空间的视频压缩模式中的任一者。例如单向预测(P模式)或双向预测(B模式)的帧间模式可指若干基于时间的视频压缩模式中的任一者。
如图5中所展示,视频编码器20接收待编码的视频帧内的当前视频块。在图5的实例中,视频编码器20包括运动补偿单元44、运动估计单元42、帧内预测单元46、参考帧缓冲器64、求和器50、变换单元52、量化单元54及熵编码单元56。图5中所说明的变换单元52为将实际变换或变换组合应用于残余数据块的单元,且不应与变换系数块混淆,变换系数块也可被称作CU的变换单元(TU)。为了视频块重建构,视频编码器20还包括反量化单元58、反变换单元60、求和器62及SAO单元43。也可包括解块滤波器以对块边界进行滤波以从经重建构的视频移除方块效应假象。在需要时,解块滤波器通常将对求和器62的输出进行滤波。
在编码过程期间,视频编码器20接收待编码的视频帧或片段。可将帧或片段划分成多个视频块,例如,最大编码单元(LCU)。运动估计单元42及运动补偿单元44相对于一个或一个以上参考帧中的一个或一个以上块执行所接收的视频块的帧间预测编码以提供时间压缩。帧内预测单元46可相对于与待编码的块相同的帧或片段中的一个或一个以上相邻块执行所接收的视频块的帧内预测编码以提供空间压缩。
模式选择单元40可(例如)基于每一模式的速率失真结果而选择编码模式(帧内或帧间)中的一者,且将所得的经帧内预测或帧间预测的块(例如,预测单元(PU))提供到求和器50以产生残余块数据,且将所得的经帧内预测或帧间预测的块(例如,预测单元(PU))提供到求和器62以重建构经编码块以用于在参考帧中使用。求和器62组合经预测的块与针对所述块的来自反变换单元60的经反量化、经反变换的数据,以重建构经编码块,如下文更详细描述。可将一些视频帧指定为I帧,其中I帧中的全部块是在帧内预测模式下编码。在一些状况下,例如,当由运动估计单元42执行的运动搜索并不导致块的充分预测时,帧内预测单元46可执行P帧或B帧中的块的帧内预测编码。
运动估计单元42及运动补偿单元44可高度集成,但为了概念性目的而分开来说明。运动估计(或运动搜索)为产生运动向量的过程,这些运动向量估计针对视频块的运动。运动向量(例如)可指示当前帧中的预测单元相对于参考帧的参考样本的移位。运动估计单元42通过比较经帧间编码帧的预测单元与存储于参考帧缓冲器64中的参考帧的参考样本来计算针对所述预测单元的运动向量。参考样本可为发现紧密匹配CU的部分(包括依据像素差编码的PU)的块,像素差可通过绝对差总和(SAD)、平方差总和(SSD)或其它差量度来确定。参考样本可出现于参考帧或参考片段内的任何处,且未必出现于参考帧或片段的块(例如,编码单元)边界处。在一些实例中,参考样本可出现于分数像素位置处。
运动估计单元42将所计算运动向量发送到熵编码单元56及运动补偿单元44。由运动向量识别的参考帧的部分可被称作参考样本。运动补偿单元44可(例如)通过捕获由针对PU的运动向量识别的参考样本来计算用于当前CU的预测单元的预测值。
作为对由运动估计单元42及运动补偿单元44执行的帧间预测的替代方案,帧内预测单元46可对所接收的块进行帧内预测。帧内预测单元46可相对于相邻的先前经编码块(例如,当前块上方、右上方、左上方或左方的块)预测所接收的块,假定用于块的由左到右、由顶到底的编码次序。帧内预测单元46可经配置而具有多种不同的帧内预测模式。举例来说,帧内预测单元46可经配置以基于正经编码的CU的大小而具有特定数目个方向预测模式,例如,三十五个方向预测模式。
帧内预测单元46可通过(例如)计算针对各种帧内预测模式的误差值且选择产生最低误差值的模式来选择帧内预测模式。方向预测模式可包括以下功能:组合空间上相邻像素的值,及将所组合值应用于PU中的一个或一个以上像素位置。一旦已计算了PU中的全部像素位置的值,帧内预测单元46便可基于PU与待编码的所接收的块之间的像素差而计算针对预测模式的误差值。帧内预测单元46可继续测试帧内预测模式,直到发现产生可接受的误差值的帧内预测模式。帧内预测单元46可接着将PU发送到求和器50。
视频编码器20通过从正经编码的原始视频块减去由运动补偿单元44或帧内预测单元46计算的预测数据而形成残余块。求和器50表示执行此减法运算的一个或一个以上组件。残余块可对应于二维像素差值矩阵,其中残余块中的值的数目与对应于残余块的PU中的像素的数目相同。残余块中的值可对应于PU中及待编码的原始块中的共同定位的像素的值之间的差(即,误差)。视经编码的块的类型而定,差可为色度差或明度差。
变换单元52可从残余块形成一个或一个以上变换单元(TU)。变换单元52从多个变换当中选择一变换。可基于一个或一个以上编码特性(例如,块大小、编码模式或类似者)选择变换。变换单元52接着将选定变换应用于TU,从而产生包含二维变换系数阵列的视频块。变换单元52可根据本发明的上文所描述的技术选择变换分割区。另外,变换单元52可在经编码视频位流中用信号发送选定变换分割区。
变换单元52可将所得变换系数发送到量化单元54。量化单元54可接着量化变换系数。熵编码单元56可接着根据扫描模式执行矩阵中的经量化的变换系数的扫描。本发明将熵编码单元56描述为执行扫描。然而,应理解,在其它实例中,例如量化单元54的其它处理单元可执行扫描。
一旦将变换系数扫描到一维阵列中,熵编码单元56便可将例如CAVLC、CABAC、基于语法的上下文自适应二进制算术编码(SBAC)或另一熵编码方法的熵编码应用于这些系数。
为了执行CAVLC,熵编码单元56可选择用于待发射的符号的可变长度码。VLC中的码字可经建构以使得相对较短的码对应于更可能的符号,而较长码对应于不太可能的符号。以此方式,使用VLC可实现位节省(与(例如)针对待发射的每一符号使用等长度码字相比较)。
为了执行CABAC,熵编码单元56可选择一上下文模型以应用某一上下文以编码待发射的符号。上下文可涉及(例如)相邻值是否非零。熵编码单元56也可熵编码语法元素,例如,表示选定变换的信号。根据本发明的技术,熵编码单元56可基于(例如)以下各者而选择用以编码此些语法元素的上下文模型:在用于上下文模型选择的各因素中有用于帧内预测模式的帧内预测方向、对应于语法元素的系数的扫描位置、块类型及/或变换类型。
在由熵编码单元56进行熵编码之后,可将所得经编码视频发射到另一装置(例如,视频解码器30),或将所得经编码视频归档以供稍后发射或检索。
在一些状况下,除熵编码外,熵编码单元56或视频编码器20的另一单元也可经配置以执行其它编码功能。举例来说,熵编码单元56可经配置以确定用于CU及PU的经编码块模式(CBP)值。又,在一些状况下,熵编码单元56可执行系数的延行长度编码。
反量化单元58及反变换单元60分别应用反量化及反变换,以在像素域中重建构残余块,(例如)以供稍后用作参考块。运动补偿单元44可通过将残余块加到参考帧缓冲器64的帧中的一者的预测性块来计算参考块。运动补偿单元44也可将一个或一个以上内插滤波器应用于经重建构的残余块,以计算用于在运动估计中使用的子整数像素值。求和器62将经重建构的残余块加到由运动补偿单元44产生的经运动补偿的预测块,以产生经重建构的视频块。
SAO单元43确定用于当前分割区的偏移类型及偏移值,且将偏移值加到经重建构的视频块的像素(即,当前分割区),并在经编码视频位流中用信号发送自适应偏移语法以供解码器使用。接着将具有偏移值的经重建构的视频块存储于参考帧缓冲器64中。经重建构的视频块可由运动估计单元42及运动补偿单元44用作参考块以对后续视频帧中的块进行帧间编码。
在一些状况下,通过将偏移信息(即,偏移类型及偏移值)按原样(即,无预测或对其它分割区的参考)发送而在经编码视频位流中将其用信号发送。然而,此技术未能使用不同分割区之间的可能的相关性,可在编码偏移类型及偏移值以实现增加的效率中采用这些相关性。本发明提议以下技术利用潜在相关性来编码偏移类型及偏移值。
一开始,确定在片段层面或是在分割区层面应用偏移类型及偏移值。即,编码器可选择是否整个片段具有一偏移类型及偏移值(基于片段)或是否每一分割区具有其自身的偏移类型及偏移值(基于分割区)。如果选择基于片段的偏移,则无预测地将偏移类型及偏移值发送到解码器,在所述状况下,可以片段层面语法(例如,片段标头)发送偏移值且将偏移值用于所述片段内的CU。否则,如果选择基于分割区的偏移,则编码器可使用偏移信息的基于合并或基于预测的信令。
SAO单元43可在经编码视频位流中用信号发送合并指令,所述合并指令指导解码器仅从相邻分割区复制偏移类型及偏移值以用于当前分割区。或者,SAO单元43可在经编码视频位流中用信号发送预测指令,所述预测指令指导解码器应用预测技术以确定用于当前分割区的偏移类型及偏移值(无合并)。
用于当前分割区的偏移信息的基于合并的信令及基于预测的信令两者可依赖于相邻分割区相对于当前分割区的偏移信息。图6为描绘在用信号发送偏移信息中使用的潜在相邻分割区的概念图。相邻分割区通常按因果性方式得出(即,已经由解码器解码的相邻分割区)。相邻分割区的位置的实例包括相对于当前分割区来说的上部(U)、左方(L)、左上方(UL)及右上方(UR)分割区。相邻分割区可直接邻近当前分割区。在另一实例中,相邻分割区可进一步远离当前分割区,但在同一编码单元中(例如,在同一LCU内)。
作为潜在合并候选者的相邻分割区为具有相同偏移类型的可用(即,因果性)相邻分割区。举例来说,如果当前分割区的偏移类型为边缘偏移类型0(EO0),则将具有偏移类型EO0的因果性相邻分割区视为合并候选者。
当使用基于四叉树的分割时确定可用相邻分割区时,不同状况可适用。图6展示状况1,其中相同大小的直接(即,邻近)相邻分割区具有相同偏移类型。在状况2中,相邻者的上层具有相同偏移类型(即,大小比当前分割区大的分割区)。在状况3中,相同大小的直接相邻分割区并不具有相同偏移类型,而直接相邻分割区的相邻分割区确实具有相同偏移类型。此三种状况中的任一者展示可用于样本自适应偏移合并模式的相邻分割区的实例。
在确定用于当前分割区的偏移类型及偏移值后,SAO单元43比较当前分割区与相邻分割区的偏移类型及偏移值。当相邻分割区中的一者具有与当前分割区相同的偏移类型及偏移值时,使用合并模式。
图7A为在合并模式下的自适应偏移语法编码的一实例的概念图。在经编码视频位流中用信号发送“合并”旗标1(例如,1表示合并且0表示无合并,或0表示合并且1表示无合并),以指示解码器是否应复制相邻分割区的偏移类型及偏移值以用于当前分割区(即,执行合并程序)。注意,当不存在具有启用的偏移的可用相邻者时,可推断合并旗标为0(即,无合并)。
如果使用合并(即,合并旗标设定为1),则除合并旗标1外,SAO单元43还将相邻分割区索引3用信号发送到解码器,相邻分割区索引3指示在视频解码期间偏移信息(即,偏移类型及偏移值)将复制到当前分割区的相邻分割区的索引。相邻分割区索引的信令取决于不同的可用相邻分割区(也被称为合并候选者)的数目。当仅存在一合并候选者时,可不发送相邻分割区索引。在所述情形下,解码器可推断仅有的合并候选者的索引。
如果SAO单元43比较当前分割区与所有相邻分割区的偏移信息且并未找到精确匹配,则不使用合并。如果不使用合并(即,合并旗标设定为0),则将预测类型发送到解码器(例如,使用pred_type旗标)。本发明提议三种可能的预测类型。
图7B为在第一预测模式下的自适应偏移语法编码的一实例的概念图。可发送第一预测指令(即,pred_type0)为以下状况:SAO单元43确定相邻分割区的偏移值与当前分割区的偏移值不相同,但足够相近,使得可通过发送残余偏移值实现位率效率。可通过比较通过发送残余偏移值实现的位率与来自按原样发送当前分割区的偏移值的位率来确定pred_type0的使用。
对于第一预测指令,将pred_type旗标5设定为0。相邻分割区索引7为预测性相邻分割区的索引。如同合并模式,pred_type0使用具有当前分割区的相同偏移类型的相邻分割区。解码器可在解码过程期间仅从相邻分割区复制用于当前分割区的偏移类型。还在经编码视频位流中用信号发送残余偏移值9。通过从选定的相邻分割区的偏移值中减去针对当前分割区所确定的偏移值来产生残余偏移值。解码器可接着仅将所接收的残余偏移值加到由相邻分割区索引7指示的相邻分割区的偏移值,以重建构当前分割区的偏移值。可以与上文参看图6所描述的合并模式相同的方式得出可用作预测候选者的相邻分割区。如果仅存在一可用相邻分割区,则可能并不用信号发送相邻分割区索引,而替代地可由解码器推断。
在无相邻分割区具有足够接近于当前分割区的偏移值的偏移值以通过发送残余实现编码效率的情形下,可在经编码视频位流中用信号发送第二预测指令(pred_type1)。图7C为在第二预测模式下的自适应偏移语法编码的一实例的概念图。在pred_type1中,在经编码位流中按原样用信号发送用于当前分割区的偏移类型11与偏移值13两者。本质上,解码器在此模式下无需参考任一相邻分割区,而可仅接收用于当前分割区的偏移类型及偏移值。
可在以下情形下发送第三预测指令(pred_type2):SAO单元43确定当前分割区的偏移值与相邻分割区的偏移值相同,但偏移类型不同。图7D为在第三预测模式下的自适应偏移语法编码的一实例的概念图。在此状况下,相邻分割区索引7指示复制用于当前分割区的偏移值所来自的相邻分割区。另外,还在经编码视频位流中用信号发送用于当前分割区的偏移类型11。注意,此情形稍微不同于合并旗标,这是因为仅从相邻分割区复制偏移值,而不复制偏移类型。用于预测类型2的预测候选者的得出稍微不同于用于预测类型0及合并模式的预测候选者的得出。替代考虑具有相同偏移类型的因果性相邻者,预测类型2考虑具有不同偏移类型的相邻分割区。举例来说,如果当前分割区的偏移类型为边缘偏移类型0(EO0),则将具有EO1/2/3的相邻者视为预测候选者。
图8为说明视频解码器30的一实例的框图,视频解码器30解码经编码视频序列。在图8的实例中,视频解码器30包括熵解码单元70、运动补偿单元72、帧内预测单元74、反量化单元76、反变换单元78、参考帧缓冲器82、SAO单元79及求和器80。在一些实例中,视频解码器30可执行通常与关于视频编码器20(见图5)所描述的编码遍次互逆的解码遍次。
熵解码单元70对经编码位流执行熵解码过程,以检索一维变换系数阵列。所使用的熵解码过程取决于由视频编码器20使用的熵编码(例如,CABAC、CAVLC等)。可在经编码位流中用信号发送由编码器使用的熵编码过程或熵编码过程可为预定过程。
在一些实例中,熵解码单元70(或反量化单元76)可使用镜射由视频编码器20的熵编码单元56(或量化单元54)使用的扫描模式的扫描来扫描所接收的值。尽管可在反量化单元76中执行系数的扫描,但为了说明的目的,将扫描描述为由熵解码单元70执行。另外,尽管为易于说明而展示为分开的功能单元,但熵解码单元70、反量化单元76及视频解码器30的其它单元的结构及功能性可相互高度集成。
反量化单元76使提供于位流中且由熵解码单元70解码的经量化的变换系数反量化(即,去量化)。反量化过程可包括常规过程,例如,类似于针对HEVC提议或由H.264解码标准定义的过程。反量化过程可包括使用由视频编码器20针对CU计算的量化参数QP,以确定量化程度,且同样地,确定应应用的反量化的程度。反量化单元76可在将系数从一维阵列转换到二维阵列之前或之后使变换系数反量化。
反变换单元78对经反量化的变换系数应用反变换。在一些实例中,反变换单元78可基于来自视频编码器20的信令或通过从例如块大小、编码模式或类似者的一个或一个以上编码特性推断变换来确定反变换。在一些实例中,反变换单元78可基于在用于包括当前块的LCU的四叉树的根节点处的信令的变换来确定应用于当前块的变换。或者,可在LCU四叉树中的叶节点CU的TU四叉树的根部处信令变换。在一些实例中,反变换单元78可应用级联反变换,其中反变换单元78对正经解码的当前块的变换系数应用两个或两个以上反变换。
帧内预测单元74可基于信令的帧内预测模式及来自当前帧的先前解码的块的数据产生用于当前帧的当前块的预测数据。
基于所检索的运动预测方向、参考帧索引及计算的当前运动向量,运动补偿单元产生针对当前部分的经运动补偿的块。此些经运动补偿的块本质上重新产生用以产生残余数据的预测性块。
运动补偿单元72可产生经运动补偿的块,从而有可能基于内插滤波器执行内插。待用于按子像素精度的运动估计的内插滤波器的识别符可包括于语法元素中。运动补偿单元72可在编码视频块期间使用如由视频编码器20使用的内插滤波器计算用于参考块的子整数像素的内插值。运动补偿单元72可根据所接收的语法信息确定由视频编码器20使用的内插滤波器,且使用内插滤波器产生预测性块。
另外,在HEVC实例中,运动补偿单元72及帧内预测单元74可使用语法信息(例如,由四叉树提供)中的一些语法信息来确定用以编码经编码视频序列的帧的LCU的大小。运动补偿单元72及帧内预测单元74也可使用语法信息确定分裂信息,所述分裂信息描述如何分裂经编码视频序列的一帧的每一CU(且同样地,如何分裂子CU)。语法信息也可包括指示如何编码每一分裂的模式(例如,帧内预测或帧间预测,且对于帧内预测,为帧内预测编码模式)、用于每一经帧间编码的PU的一个或一个以上参考帧(及/或含有参考帧的识别符的参考列表)及用以解码经编码视频序列的其它信息。
求和器80组合残余块与由运动补偿单元72或帧内预测单元74产生的对应预测块,以形成经解码块。SAO单元79接着移除由编码器引入的偏移。SAO单元79根据所接收语法执行此程序,所接收语法指示用于分割区的偏移信息,例如,上文参看图7A到7D所描述的语法。
如果接收到合并指令,则SAO单元79将偏移信息从由相邻分割区索引3指示的相邻分割区(见图7A)复制到当前分割区。
如果接收到第一预测指令(pred_type0),则SAO单元79将偏移类型从由相邻分割区索引7指示的相邻分割区(参见图7B)复制到当前分割区。另外,SAO单元79将所接收的残余偏移值9加到由相邻分割区索引7指示的相邻分割区索引的偏移值,以重建构用于当前分割区的偏移值(参见图7B)。
如果接收到第二预测指令(pred_type1),则SAO单元79使用所接收的偏移类型11及偏移值13作为用于当前分割区的偏移信息(参见图7C)。
如果接收到第三预测指令(pred_type2),则SAO单元79将偏移值从由相邻分割区索引7指示的相邻分割区(参见图7D)复制到当前分割区。另外,SAO单元79使用所接收的偏移类型11作为用于当前分割区的偏移类型。
如果需要,也可应用解块滤波器来对经解码块进行滤波以移除方块效应假象。也可在回路中或回路后应用额外滤波。接着将经解码视频块存储于参考帧缓冲器82中,参考帧缓冲器82提供用于后续运动补偿的参考块且也产生经解码视频,用于呈现于显示装置(例如,图4的显示装置32)上。如果应用回路内滤波,则经存储用于后续运动补偿的经解码视频块为经滤波的块,但如果应用回路后滤波,则经存储用于后续运动补偿的经解码视频块为未滤波的块。
图9为说明使用样本自适应偏移编码视频的一实例方法的流程图。从图5中所展示的视频编码器20的角度描述图9的方法,但其它装置可执行图9的技术。如图9中所展示,视频编码器20可经配置以在视频编码过程中编码样本自适应偏移值。视频编码器20可确定用于当前分割区的偏移信息(120)且比较当前分割区的偏移信息与一个或一个以上相邻分割区的偏移信息(122)。偏移信息可包括偏移类型及偏移值。在所述一个或一个以上相邻分割区中的一者的偏移信息与当前分割区的偏移信息相同的状况下,视频编码器20编码合并指令(124)。在所述一个或一个以上相邻分割区中的所述相邻分割区的偏移信息与当前分割区的偏移信息不相同的状况下,视频编码器20编码多个预测指令中的一者(124)。
合并指令指导解码器复制所述一个或一个以上相邻分割区中的一者的偏移信息以用于当前分割区。合并指令可包括合并旗标,及所述一个或一个以上相邻分割区中具有与当前分割区相同的偏移信息的所述一者的索引。
在一实例中,编码多个预测指令中的一者可包括编码第一预测指令,第一预测指令指导解码器从所述一个或一个以上相邻分割区中的一者的偏移信息得出用于当前分割区的偏移信息。第一预测指令可包括所述一个或一个以上相邻分割区中的一者的索引及偏移残余值,且其中偏移残余值是通过从所述一个或一个以上相邻分割区中的一者的偏移值中减去当前分割区的偏移值而产生。在可通过发送偏移残余值实现位率效率的状况下,视频编码器20可编码第一预测。
在另一实例中,编码多个预测指令中的一者包括编码第二预测指令,第二预测指令包括用于当前分割区的偏移信息。在不可通过发送偏移残余值实现位率效率的状况下,视频编码器20可编码第二预测指令。
在另一实例中,编码多个预测指令中的一者包括编码第三预测指令,第三预测指令包括复制偏移值所来自的所述一个或一个以上相邻分割区中的一者的索引,且也包括用于当前分割区的偏移类型。
图10为说明使用样本自适应偏移解码视频的一实例方法的流程图。从图8中所展示的视频解码器30的角度描述图10的方法,但其它装置可执行图10的技术。如图10中所展示,视频解码器30可经配置以在视频解码过程中解码样本自适应偏移值。视频解码器可经配置以针对当前分割区接收合并指令或多个预测指令中的一者(130)。视频解码器经配置以在接收到合并指令的状况下,将偏移信息从相邻分割区复制到当前分割区(132)。合并指令包括合并旗标及相邻分割区的索引。偏移信息可包括偏移类型及偏移值。
视频解码器也经配置以在接收到所述多个预测指令中的一者的状况下,针对当前分割区执行偏移预测过程(134)。
所述多个预测指令可包括第一预测指令、第二预测指令及第三预测指令。在接收到第一预测指令的状况下,偏移预测过程从所述一个或一个以上相邻分割区中的一者的偏移信息得出用于当前分割区的偏移信息。第一预测指令可包括所述一个或一个以上相邻分割区中的一者的索引及偏移残余值。视频解码器20通过将所述一相邻分割区的偏移值加到偏移残余值来得出用于当前分割区的偏移值。
在接收到第二预测指令的状况下,视频解码器20也接收偏移信息。所接收的偏移信息用于当前分割区。
在接收到第三预测指令的状况下,视频解码器20也接收复制偏移值所来自的所述一个或一个以上相邻分割区中的一者的索引,且也接收偏移类型。视频解码器20通过以下操作执行偏移预测过程:通过从所述一相邻分割区复制偏移值用于当前分割区且通过将所接收的偏移类型指派给当前分割区得出用于当前分割区的偏移信息。
在一个或一个以上实例中,可以硬件、软件、固件或其任何组合来实施所描述功能。如果以软件来实施,则这些功能可作为一个或一个以上指令或代码存储于计算机可读媒体上或经由计算机可读媒体发射且由基于硬件的处理单元执行。计算机可读媒体可包括计算机可读存储媒体(其对应于例如数据存储媒体的有形媒体)或通信媒体,通信媒体包括促进计算机程序(例如)根据通信协议从一处转移到另一处的任何媒体。以此方式,计算机可读媒体通常可对应于(1)非暂时性有形计算机可读存储媒体,或(2)例如信号或载波的通信媒体。数据存储媒体可为可由一个或一个以上计算机或一个或一个以上处理器存取以检索用于实施本发明中所描述的技术的指令、代码及/或数据结构的任何可用媒体。计算机程序产品可包括计算机可读媒体。
以实例说明,且并非限制,此些计算机可读存储媒体可包含RAM、ROM、EEPROM、CD-ROM或其它光盘存储器、磁盘存储器,或其它磁性存储装置、快闪存储器,或可用以存储呈指令或数据结构的形式的所要代码且可由计算机存取的任何其它媒体。又,将任何连接适当地称为计算机可读媒体。举例来说,如果使用同轴缆线、光缆、双绞线、数字订户线(DSL)或无线技术(例如,红外线、无线电及微波)而从网站、服务器或其它远程源传输指令,则同轴缆线、光缆、双绞线、DSL或无线技术(例如,红外线、无线电及微波)包括于媒体的定义中。然而,应理解,计算机可读存储媒体及数据存储媒体并不包括连接、载波、信号或其它短暂性媒体,而是针对非短暂性有形存储媒体。如本文中所使用,磁盘及光盘包括压缩光盘(CD)、激光光盘、光盘、数字多功能光盘(DVD)、软性磁盘及Blu-ray光盘,其中磁盘通常以磁性方式再生数据,而光盘通过激光以光学方式再生数据。以上各者的组合也应包括于计算机可读媒体的范围内。
可由例如一个或一个以上数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路的一个或一个以上处理器执行指令。因此,如本文中所使用的术语“处理器”可指适合于实施本文中所描述的技术的前述结构中的任一者或任一其它结构。另外,在一些方面中,本文中所描述的功能性可提供于经配置以用于编码及解码的专用硬件及/或软件模块中,或并入于组合式编解码器中。又,这些技术可完全实施于一个或一个以上电路或逻辑元件中。
本发明的技术可以广泛的多种装置或设备来实施,这些装置或设备包括无线手机、集成电路(IC)或IC集合(例如,芯片组)。在本发明中描述各种组件、模块或单元以强调经配置以执行所揭示技术的装置的功能方面,但未必需要通过不同硬件单元来实现。相反地,如上所述,可将各种单元组合于编解码器硬件单元中,或通过互操作性硬件单元(包括如上所述的一个或一个以上处理器)的集合结合合适软件及/或固件来提供这些单元。
已描述了各种实例。此些及其它实例在所附权利要求书的范围内。
Claims (40)
1.一种在由视频编码装置执行的视频编码过程中编码样本自适应偏移信息的方法,所述方法包含:
确定用于视频数据的当前分割区的样本自适应偏移信息;
比较所述当前分割区的所述样本自适应偏移信息与所述视频数据的一个或多个相邻分割区的样本自适应偏移信息;及
编码合并语法元素,该合并语法元素指示视频解码器要从所述一个或多个相邻分割区的一者的样本自适应偏移信息复制用于所述当前分割区的所述样本自适应偏移信息,其中所述合并语法元素指示要从其复制用于所述当前分割区的所述样本自适应偏移信息的所述一个或多个邻近分割区中的所述一者。
2.根据权利要求1所述的方法,其中所述样本自适应偏移信息包括偏移类型及偏移值。
3.根据权利要求1所述的方法,其中所述合并语法元素包括合并旗标,该合并旗标指导所述视频解码器复制所述一个或多个相邻分割区中的一者的所述样本自适应偏移信息以用于所述当前分割区。
4.根据权利要求1所述的方法,其中所述合并语法元素包括多个语法元素,所述多个语法元素包括合并旗标和索引,该索引指示要从其复制用于所述当前分割区的所述样本自适应偏移信息的所述一个或多个邻近分割区中的一者。
5.根据权利要求2所述的方法,进一步包括:
在所述一个或多个邻近分割区中的一者的所述样本自适应偏移信息不同于所述当前分割区的所述样本自适应偏移信息的情况下,编码多个预测语法元素中的一者,其中编码多个预测指令中的一者包括:编码第一预测指令,该第一预测指令指导所述视频解码器从所述一个或多个邻近分割区中的一者的样本自适应偏移信息得出用于所述当前分割区的所述样本自适应偏移信息。
6.根据权利要求5所述的方法,其中所述第一预测指令包括所述一个或多个相邻分割区中的一者的索引及偏移残余值,且其中所述偏移残余值是通过从所述一个或多个相邻分割区中的一者的偏移值中减去所述当前分割区的所述偏移值而形成。
7.根据权利要求6所述的方法,其中在可通过发送偏移残余值实现位率效率的状况下,编码所述第一预测指令。
8.根据权利要求2所述的方法,其中编码多个预测指令中的一者包括:
编码第二预测指令,所述第二预测指令包括用于所述当前分割区的样本自适应偏移信息。
9.根据权利要求8所述的方法,其中在不可通过发送偏移残余值实现位率效率的状况下,编码所述第二预测指令。
10.根据权利要求2所述的方法,其中编码多个预测指令中的一者包括:
编码第三预测指令,所述第三预测指令包括从其复制偏移值的所述一个或多个相邻分割区中的一者的索引,且也包括用于所述当前分割区的偏移类型。
11.一种经配置以在视频编码过程中编码样本自适应偏移信息的设备,所述视频编码设备包含:
存储器,其经配置以存储视频数据;
视频编码器,其经配置以进行以下操作:
确定用于所述视频数据的当前分割区的样本自适应偏移信息;
比较所述当前分割区的所述样本自适应偏移信息与所述视频数据的一个或多个相邻分割区的样本自适应偏移信息;
编码合并语法元素,该合并语法元素指示视频解码器要从所述一个或多个相邻分割区的一者的所述样本自适应偏移信息复制用于所述当前分割区的所述样本自适应偏移信息,其中所述合并语法元素指示要从其复制用于所述当前分割区的所述样本自适应偏移信息的所述一个或多个邻近分割区中的所述一者。
12.根据权利要求11所述的设备,其中所述样本自适应偏移信息包括偏移类型及偏移值。
13.根据权利要求11所述的设备,其中所述合并语法元素包括合并旗标,该合并旗标指导所述视频解码器复制所述一个或多个相邻分割区中的一者的所述样本自适应偏移信息以用于所述当前分割区。
14.根据权利要求11所述的设备,其中所述合并语法元素包括多个语法元素,该多个语法元素包括合并旗标及所述一个或多个相邻分割区中的一者的索引。
15.根据权利要求12所述的设备,其中所述视频编码器经进一步配置以:
在所述一个或多个邻近分割区中的一者的所述样本自适应偏移信息不同于所述当前分割区的所述样本自适应偏移信息的情况下,编码多个预测语法元素中的一者,其中编码多个预测指令中的一者包括:编码第一预测指令,该第一预测指令指导所述视频解码器从所述一个或多个邻近分割区中的一者的样本自适应偏移信息得出用于所述当前分割区的所述样本自适应偏移信息,其中所述第一预测指令指示要从其复制用于所述当前分割区的所述样本自适应偏移信息的所述一个或多个邻近分割区中的所述一者。
16.根据权利要求15所述的设备,其中所述第一预测指令包括所述一个或多个相邻分割区中的一者的索引及偏移残余值,且其中偏移残余值是通过从所述一个或多个相邻分割区中的一者的偏移值中减去所述当前分割区的所述偏移值而形成。
17.根据权利要求16所述的设备,其中所述视频编码器经配置以在可通过发送偏移残余值实现位率效率的状况下,编码所述第一预测指令。
18.根据权利要求12所述的设备,其中所述视频编码器经进一步配置以编码第二预测指令,所述第二预测指令包括用于所述当前分割区的样本自适应偏移信息。
19.根据权利要求18所述的设备,其中所述视频编码器经配置以在不可通过发送偏移残余值实现位率效率的状况下,编码所述第二预测指令。
20.根据权利要求12所述的设备,其中所述视频编码器经进一步配置以编码第三预测指令,所述第三预测指令包括从其复制偏移值的所述一个或多个相邻分割区中的一者的索引且也包括用于所述当前分割区的偏移类型。
21.一种用于在视频编码过程中编码样本自适应偏移信息的设备,所述设备包含:
用于确定用于视频数据的当前分割区的样本自适应偏移信息的装置;
用于比较当前分割区的样本自适应偏移信息与一个或多个相邻分割区的样本自适应偏移信息的装置,其中所述样本自适应偏移信息包括所述视频数据的偏移类型及偏移值;;及
用于编码合并语法元素的装置,该合并语法元素指示视频解码器要从所述一个或多个相邻分割区的一者的样本自适应偏移信息复制用于所述当前分割区的所述样本自适应偏移信息,其中所述合并语法元素指示要从其复制用于所述当前分割区的所述样本自适应偏移信息的所述一个或多个邻近分割区中的所述一者。
22.根据权利要求21所述的设备,其中所述合并语法元素包括合并旗标,该合并旗标指导所述视频解码器复制所述一个或多个相邻分割区中的一者的所述样本自适应偏移信息以用于所述当前分割区。
23.根据权利要求21所述的设备,其进一步包含:
用于在所述一个或多个邻近分割区中的一者的所述样本自适应偏移信息不同于所述当前分割区的所述样本自适应偏移信息的情况下,编码多个预测语法元素中的一者的装置,其中所述用于编码多个预测指令中的一者的装置包括:用于编码第一预测指令的装置,该第一预测指令指导所述视频解码器从所述一个或多个邻近分割区中的一者的样本自适应偏移信息得出用于所述当前分割区的所述样本自适应偏移信息,其中所述第一预测指令包括所述一个或多个相邻分割区中的一者的索引及偏移残余值,且其中所述偏移残余值指示所述当前分割区的所述偏移值与所述一个或多个相邻分割区的一者的偏移值之间的差。
24.根据权利要求21所述的设备,其进一步包含:
用于编码第二预测指令的装置,所述第二预测指令包括用于所述当前分割区的样本自适应偏移信息,其中在不可通过发送偏移残余值实现位率效率的状况下编码所述第二预测指令。
25.根据权利要求21所述的设备,其进一步包含:
用于编码第三预测指令的装置,所述第三预测指令包括从其复制偏移值的所述一个或多个相邻分割区中的一者的索引,且也包括用于所述当前分割区的偏移类型。
26.一种用于在由视频解码器执行的视频解码过程中解码样本自适应偏移信息的方法,所述方法包含:
针对视频数据的当前分割区,接收合并语法元素,该合并语法元素指示要从相邻分割区复制用于所述当前分割区的样本自适应偏移信息,其中所述语法元素指示要从其复制用于所述当前分割区的所述样本自适应偏移信息的所述一个或多个相邻分割区中的一者;
在接收到所述合并语法元素的状况下,从所指示的相邻分割区复制用于所述当前分割区的样本自适应偏移信息;及
使用所复制的样本自适应偏移信息,针对所述当前分割区执行样本自适应偏移过程。
27.根据权利要求26所述的方法,其中所述样本自适应偏移信息包括偏移类型及偏移值。
28.根据权利要求26所述的方法,其中所述合并语法元素包括多个语法元素,所述多个语法元素包括合并旗标和所述相邻分割区的索引,该索引指示所述相邻分割区。
29.根据权利要求27所述的方法,进一步包括接收用于第二分割区的预测指令,且响应于所述预测指令从一个或多个相邻分割区中的一者的样本自适应偏移信息得出用于所述第二分割区的样本自适应偏移信息。
30.根据权利要求29所述的方法,其中所述样本自适应偏移信息包括偏移类型和偏移值,且其中所述预测指令包括一个或多个相邻分割区中的一者的索引及偏移残余值,所述方法进一步包括通过将所述一个或多个相邻分割区的偏移值加到所述偏移残余值而得出用于所述第二分割区的所述样本自适应偏移信息的偏移值。
31.根据权利要求27所述的方法,进一步包括接收用于第二分割区的预测指令,其中所述预测指令包括用于所述第二分割区的样本自适应偏移信息。
32.根据权利要求27所述的方法,其中所述样本自适应偏移信息包括偏移类型和偏移值,所述方法进一步包括:接收用于第二分割区的预测指令,所述预测指令包括从其复制偏移值的所述一个或多个相邻分割区中的一者的索引且也包括用于所述第二分割区的偏移类型,以及,通过从所述一个或多个相邻分割区中的所述一者复制偏移值以用于所述第二分割区且通过将所述所接收的偏移类型指派给所述第二分割区来得出用于所述第二分割区的样本自适应偏移信息。
33.一种经配置以在视频解码过程中解码样本自适应偏移信息的设备,所述设备包含:
存储器,其经配置以存储视频数据;
视频解码器,其经配置以进行以下操作:
针对所述视频数据的当前分割区,接收合并语法元素,该合并语法元素指示要从相邻分割区复制用于所述当前分割区的样本自适应偏移信息,其中所述语法元素指示要从其复制用于所述当前分割区的所述样本自适应偏移信息的所述一个或多个相邻分割区中的一者;
在接收到所述合并语法元素的状况下,从所指示的相邻分割区复制用于所述当前分割区的样本自适应偏移信息;及
使用所复制的样本自适应偏移信息,针对所述当前分割区执行样本自适应偏移过程。
34.根据权利要求33所述的设备,其中所述样本自适应偏移信息包括偏移类型及偏移值。
35.根据权利要求33所述的设备,其中所述合并语法元素包括多个合并语法元素,所述多个合并语法元素包括合并旗标和所指示的相邻分割区的索引。
36.根据权利要求34所述的设备,其中所述视频解码器经配置以接收用于第二分割区的第一预测指令,且响应于所述预测指令所从所述一个或多个相邻分割区中的一者的样本自适应偏移信息得出用于所述第二分割区的样本自适应偏移信息。
37.根据权利要求36所述的设备,其中所述样本自适应偏移信息包括偏移类型和偏移值,且其中所述第一预测指令包括一个或多个相邻分割区中的一者的索引及偏移残余值,所述视频解码器经配置以通过将所述一个或多个相邻分割区的偏移值加到所述偏移残余值而得出用于所述第二分割区的所述样本自适应偏移信息的偏移值。
38.根据权利要求34所述的设备,其中所述视频解码器经配置以接收用于第二分割区的预测指令,所述预测指令包括用于所述第二分割区的样本自适应偏移信息。
39.根据权利要求34所述的设备,其中所述样本自适应偏移信息包括偏移类型和偏移值,所述视频解码器进一步经配置以:接收用于第二分割区的预测指令,所述预测指令包括从其复制偏移值的所述一个或多个相邻分割区中的一者的索引且也包括用于所述第二分割区的偏移类型,及,通过从所述一个或多个相邻分割区中的所述一者复制偏移值以用于所述第二分割区且通过将所述所接收的偏移类型指派给所述第二分割区来得出用于所述第二分割区的样本自适应偏移信息。
40.一种经配置以在视频解码过程中解码样本自适应偏移信息的设备,所述设备包含:
用于针对视频数据的当前分割区接收合并语法元素的装置,该合并语法元素指示要从相邻分割区复制用于所述当前分割区的样本自适应偏移信息,其中所述语法元素指示要从其复制用于所述当前分割区的所述样本自适应偏移信息的所述一个或多个相邻分割区中的一者;
用于在接收到所述合并语法元素的状况下从所参考的相邻分割区复制用于所述当前分割区的样本自适应偏移信的装置;及
用于使用所复制的样本自适应偏移信息针对所述当前分割区执行样本自适应偏移过程的装置。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US61/484,624 | 2011-05-10 | ||
| US61/503,454 | 2011-06-30 | ||
| US13/295,776 | 2011-11-14 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| HK1191162A HK1191162A (zh) | 2014-07-18 |
| HK1191162B true HK1191162B (zh) | 2018-01-12 |
Family
ID=
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US8964832B2 (en) | Offset type and coefficients signaling method for sample adaptive offset | |
| CA2839687C (en) | Parallelization friendly merge candidates for video coding | |
| US9357235B2 (en) | Sample adaptive offset merged with adaptive loop filter in video coding | |
| US9532066B2 (en) | Motion vector prediction | |
| AU2012273398B2 (en) | Unified merge mode and adaptive motion vector prediction mode candidates selection | |
| US9386305B2 (en) | Largest coding unit (LCU) or partition-based syntax for adaptive loop filter and sample adaptive offset in video coding | |
| US20130083844A1 (en) | Coefficient coding for sample adaptive offset and adaptive loop filter | |
| HK1191162B (zh) | 用於样本自适应偏移的偏移类型及系数信令方法 | |
| HK1191162A (zh) | 用於样本自适应偏移的偏移类型及系数信令方法 | |
| HK1201110A1 (zh) | 视讯译码中的量化参数(qp)译码 | |
| HK1201110B (zh) | 视讯译码中的量化参数(qp)译码 | |
| HK1190255B (zh) | 用於视频译码的并行化友好合并候选者 |