[go: up one dir, main page]

JP2013141094A - 画像復号装置、画像符号化装置、画像フィルタ装置、および符号化データのデータ構造 - Google Patents

画像復号装置、画像符号化装置、画像フィルタ装置、および符号化データのデータ構造 Download PDF

Info

Publication number
JP2013141094A
JP2013141094A JP2011289937A JP2011289937A JP2013141094A JP 2013141094 A JP2013141094 A JP 2013141094A JP 2011289937 A JP2011289937 A JP 2011289937A JP 2011289937 A JP2011289937 A JP 2011289937A JP 2013141094 A JP2013141094 A JP 2013141094A
Authority
JP
Japan
Prior art keywords
filter
unit
image
parameter
slice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2011289937A
Other languages
English (en)
Inventor
Masanobu Yasugi
将伸 八杉
Tomohiro Igai
知宏 猪飼
Tomoyuki Yamamoto
智幸 山本
Kenji Tsukuba
健史 筑波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2011289937A priority Critical patent/JP2013141094A/ja
Publication of JP2013141094A publication Critical patent/JP2013141094A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】スライス単位で、適応フィルタ、適応オフセットフィルタを適用可能にする。
【解決手段】共通のフィルタパラメータを用いる単位領域群から成るフィルタ適用領域に含まれる画素に対し、当該フィルタパラメータを用いてフィルタ処理を施す適応フィルタ50、適応オフセットフィルタ60を備え、1つのパラメータセットには、複数のフィルタ適用領域それぞれで用いられるフィルタパラメータが格納されている。
【選択図】図1

Description

本発明は、符号化データを復号する画像復号装置、符号化データを生成する画像符号化装置、および該画像符号化装置によって生成され、上記画像復号装置によって復号される符号化データのデータ構造に関するものである。
動画像を効率的に伝送または記録するために、動画像を符号化することによって符号化データを生成する動画像符号化装置(画像符号化装置)、および、当該符号化データを復号することによって復号画像を生成する動画像復号装置(画像復号装置)が用いられている。具体的な動画像符号化方式としては、例えば、H.264/MPEG−4.AVC、VCEG(Video Coding Expert Group)における共同開発用コーデックであるKTAソフトウェアに採用されている方式、TMuC(Test Model under Consideration)ソフトウェアに採用されている方式、およびその後継コーデックであるWorking Draft 4 of High-Efficiency Video Coding(非特許文献1、以下、HEVC WD4とも呼ぶ)に採用されている方式などが挙げられる。
このような符号化方式において、動画像を構成する画像(ピクチャ)は、所定の大きさの符号化単位(マクロブロック、コーディングユニット(Coding Unit:CU)、またはツリーブロック(tree block:TB)と呼ばれることもある)から構成されるスライス、上記符号化単位、上記符号化単位を四分木分割することより得られるブロックおよびパーティションからなる階層構造により管理され、普通、ブロックごとに符号化される。
また、このような符号化方式においては、通常、入力画像を符号化/復号することによって得られる局所復号画像に基づいて予測画像が生成され、当該予測画像を入力画像(原画像)から減算して得られる予測残差(「差分画像」または「残差画像」と呼ぶこともある)が符号化される。より詳細には、予測残差をDCT(Discrete Cosine Transform)変換し、得られた変換係数を量子化したものを符号化する。
また、予測画像の生成方法としては、画面間予測(インター予測)、および、画面内予測(イントラ予測)が挙げられる。
また、非特許文献2には、復号画像に対し符号化単位毎にフィルタ処理を行う適応的ループフィルタ(ALF: Adaptive Loop Filter)(以下、単に「適応フィルタ」とも呼ぶ)が開示されている。この適応フィルタは、復号画像上のスライス毎に、フィルタ済復号画像と原画像との誤差が最小となるフィルタ係数を定め、当該スライスに含まれる各符号化単位に対して、当該フィルタ係数に基づいたフィルタリングを施すものである。このような適応フィルタを備えた符号化装置および復号装置は、フィルタリングにより符号化/復号画像の画質が向上することで、フィルタ済画像を参照して生成される予測画像の精度を上げることができるため、符号化効率の向上を図ることができる。
また、非特許文献3には、復号画像のブロック歪みを低減させるデブロッキングフィルタの後段であって、適応的に決定されたフィルタ係数を用いたフィルタ処理を行う適応的ループフィルタ(「適応フィルタ」とも呼ぶ)の前段に導入された適応的オフセットフィルタ(「適応オフセットフィルタ」とも呼ぶ)が開示されている。この適応オフセットフィルタは、デブロッキングフィルタから出力される画像の各画素値に対して、適応的に設定されたオフセットを加算するというものである。このような適応オフセットフィルタを備えることによって、ブロック歪みをより効果的に抑制することができる。
そして、符号化データは、ピクチャ、スライス、ツリーブロックというようなレイヤ的に構成されており、同一レイヤで共通に用いられ、再利用可能なパラメータはパラメータセット(PS)に格納される。例えば、ピクチャで共通に用いられるパラメータはピクチャパラメータセット(PPS)に格納される。非特許文献4には、上記フィルタ係数をPPSに格納することが記載されている。また、H.264/MPEG−4.AVCでは、上記の変換係数の量子化に用いる量子化マトリクスをシーケンスパラメータセット(SPS)、およびPPSに格納している。
また、PPSに格納されていたパラメータのうち、更新頻度の高いパラメータ、例えば上記適応フィルタのパラメータや適応オフセットフィルタのパラメータを分離してAPS(Adaptation Parameter Set)として格納する構成が非特許文献5、6に記載されている。
「JCTVC-F803」,Joint Collaborative Team on Video Coding (JCT-VC)of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 6th Meeting: Torino, IT, 14-22 July, 2011 「Test Model under Consideration JCTVC-B205 draft007」,Joint Collaborative Team on Video Coding(JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11,2nd Meeting:Geneva,CH,07/2010 「JCTVC-G831」, Joint Collaborative Team on Video Coding (JCT-VC)of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 7th Meeting: Geneva, CH, 21-30 November, 2011 「JCTVC-E045」,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 5th Meeting: Geneva, CH, 16-23 March, 2011 「JCTVC-F747」,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 6th Meeting: Torino, IT, 14-22 July, 2011 「JCTVC-G1016」, Joint Collaborative Team on Video Coding (JCT-VC)of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 7th Meeting: Geneva, CH, 21-30 November, 2011
上記従来の構成では、適応フィルタおよび適応オフセットフィルタのパラメータは、ピクチャを領域に分割し、領域単位で符号化している。例えば、適応オフセットフィルタでは、図31に示すように、ピクチャをルートとした四分木分割により領域を分割し、領域単位でパラメータを符号化している。
図31の(a)はリーフでないQAOUに関するQAOU情報の構成を示す図であり、(b)はリーフのQAOUに関するQAOU情報の構成を示す図である。また、(c)はピクチャが四分木分割される例を示す図である。なお、QAOU(Quad Adaptive Offset Unit)とは、ピクチャから四分木分割によって分割されたオフセット処理の処理単位である。
そして、図31(c)に示すように、ピクチャ(太い実線)を四分木分割(細い実線および破線)することにより、QAOUが決定される。よって、適応オフセットフィルタでは、ピクチャ単位のパラメータ構成となっている。
また、適応フィルタでは、ピクチャを4×4に16分割することにより領域を分割し、領域単位でパラメータを符号化している。よって、適応フィルタもピクチャ単位のパラメータ構成となっている。
このように、適応フィルタ、適応オフセットフィルタでは、ピクチャに対してそれぞれ1つのパラメータでよいため、APSには、それぞれ1つのパラメータが格納されている構成となっている。
しかしながら、上記の構成によれば、ピクチャ単位でしか、適応フィルタ、適応オフセットフィルタのパラメータを適用することしかできず、ピクチャよりも小さい単位、例えばスライス単位ごとに適応フィルタ、適応オフセットフィルタのパラメータを適用する場合に対応することができない。
本発明は、上記の問題点に鑑みてなされたものであり、その目的は、スライス単位で、適応フィルタ、適応オフセットフィルタを適用可能な画像復号装置等を実現することにある。
上記課題を解決するために、本発明に係る画像復号装置は、復号した復号画像の単位領域ごとに、フィルタパラメータを用いてフィルタ処理を施すとともに、複数の上記単位領域で共通して用いられるフィルタパラメータをパラメータセットとして、該パラメータセットに含まれるフィルタパラメータを用いてフィルタ処理が施される上記単位領域よりも先に復号する画像復号装置であって、共通のフィルタパラメータを用いる上記単位領域群から成るフィルタ適用領域に含まれる画素に対し、当該フィルタパラメータを用いてフィルタ処理を施すフィルタ手段を備え、1つの上記パラメータセットには、複数の上記フィルタ適用領域それぞれで用いられるフィルタパラメータが格納されていることを特徴としている。
上記の構成によれば、複数のフィルタ適用領域それぞれで用いられるフィルタパラメータが1つのパラメータセットに格納されているので、1つのパラメータセットで複数のフィルタ適用領域に対応することができる。よって、フィルタ適用領域がスライス単位の場合に、スライス単位でフィルタ(適応フィルタ、適応オフセットフィルタ)を適用することに対応できる。
また、フィルタ適用領域それぞれで用いられるフィルタパラメータについて、逐一パラメータセットを生成する必要がなくなる。
本発明に係る画像復号装置では、上記パラメータセットには、上記フィルタ適用領域が復号される順に、それぞれのフィルタ適用領域で用いられるフィルタパラメータが格納されているものであってもよい。
上記の構成によれば、フィルタ適用領域が復号される順に、それぞれのフィルタ適用領域で用いられるフィルタパラメータが格納されているので、用いられるフィルタパラメータとフィルタ適用領域とを明確に対応付けることができる。
本発明に係る画像復号装置では、上記フィルタ手段は、上記フィルタ適用領域に含まれる画素に対して用いるフィルタパラメータを特定する特定情報を用いて上記パラメータセットに格納されているフィルタパラメータを特定し、フィルタ処理を行うものであってもよい。
上記の構成によれば、フィルタ適用領域に含まれる画素に対して用いるフィルタパラメータを特定する特定情報を用いてパラメータセットに格納されているフィルタパラメータを特定してフィルタ処理を行うので、フィルタ適用領域とフィルタパラメータとの対応付けたを明確にすることができる。
本発明に係る画像復号装置では、復号した復号画像の単位領域ごとに、フィルタパラメータを用いてフィルタ処理を施すとともに、複数の上記単位領域で共通して用いられるフィルタパラメータをパラメータセットとして、該パラメータセットに含まれるフィルタパラメータを用いてフィルタ処理が施される上記単位領域よりも先に復号する画像復号装置であって、共通のフィルタパラメータを用いる上記単位領域群から成るフィルタ適用領域に含まれる画素に対し、当該フィルタパラメータを用いてフィルタ処理を施すフィルタ手段を備え、上記パラメータセットには、上記フィルタ適用領域の位置または大きさを示す情報が格納されているものであってもよい。
上記の構成によれば、パラメータセットにフィルタ適用領域の位置または大きさを示す情報が格納される。これにより、フィルタ適用領域を全て復号する前に、フィルタ適用領域の位置または大きさを復号することができるので、フィルタ適用領域の位置または大きさが必要な処理を行う場合に、速やかに当該処理を行うことができる。
本発明に係る画像復号装置では、上記パラメータセットには、上記フィルタ適用領域の位置を示す情報として、上記復号画像における上記フィルタ適用領域の開始位置が格納されているものであってもよい。
上記の構成によれば、パラメータセットに復号画像におけるフィルタ適用領域の開始位置が格納される。これにより、フィルタ適用領域を復号する前に、フィルタ適用領域の開始位置を復号することができるので、フィルタ適用領域の開始位置が必要な処理を行う場合に、速やかに当該処理を行うことができる。
本発明に係る画像復号装置では、上記パラメータセットには、上記フィルタ適用領域の大きさを示す情報として、上記フィルタ適用領域に含まれる上記単位領域の数が格納されているものであってもよい。
上記の構成によれば、パラメータセットにフィルタ適用領域のサイズが格納される。これにより、フィルタ適用領域を全て復号する前に、フィルタ適用領域のサイズを復号することができるので、フィルタ適用領域のサイズが必要な処理を行う場合に、速やかに当該処理を行うことができる。
本発明に係る画像復号装置では、上記パラメータセットには、上記フィルタ適用領域の大きさを示す情報として、上記単位領域それぞれについて、自単位領域を含むフィルタ適用領域における最後の単位領域であるか否かを示す終端情報が格納されているものであってもよい。
上記の構成によれば、パラメータセットにフィルタ適用領域の最後の単位領域であるか否かを示す終端情報が格納される。これにより、フィルタ適用領域を全て復号する前に、フィルタ適用領域の最後の単位領域を認識することができるので、フィルタ適用領域の終端が必要な処理を行う場合に、速やかに当該処理を行うことができる。
本発明に係る画像復号装置では、復号した復号画像の単位領域ごとに、フィルタパラメータを用いてフィルタ処理を施すとともに、複数の上記単位領域で共通して用いられるフィルタパラメータをパラメータセットとして、該パラメータセットに含まれるフィルタパラメータを用いてフィルタ処理が施される上記単位領域よりも先に復号する画像復号装置であって、共通のフィルタパラメータを用いる上記単位領域群から成るフィルタ適用領域に含まれる画素に対し、該フィルタパラメータを用いてフィルタ処理を施すフィルタ手段を備え、上記フィルタ適用領域の境界が含まれる上記単位領域である境界単位領域が存在する場合、上記パラメータセットには、上記境界単位領域に対し、フィルタ処理を施すか否かを示すフィルタ処理情報が格納されているものであってもよい。
上記の構成によれば、フィルタ適用領域の境界となる単位領域について、フィルタの適用をしないこととすることができる。これにより、フィルタ適用領域の境界となる単位領域に対する煩雑な処理を回避することができ、処理量を削減することができる。
本発明に係る画像復号装置では、復号した復号画像の単位領域ごとに、フィルタパラメータを用いてフィルタ処理を施すとともに、複数の上記単位領域で共通して用いられるフィルタパラメータをパラメータセットとして、該パラメータセットに含まれるフィルタパラメータを用いてフィルタ処理が施される上記単位領域よりも先に復号する画像復号装置であって、共通のフィルタパラメータを用いる上記単位領域群から成るフィルタ適用領域に含まれる画素に対し、該フィルタパラメータを用いてフィルタ処理を施すフィルタ手段を備え、上記フィルタ適用領域の境界が含まれる上記単位領域である境界単位領域が存在する場合、上記パラメータセットには、境界単位領域を含むフィルタ適用領域の大きさを、該境界単位領域を含まないように変更するフィルタ適用領域サイズ変更情報が格納されているものであってもよい。
上記の構成によれば、フィルタ適用領域の境界となる単位領域について、フィルタの適用をしないこととすることができる。これにより、フィルタ適用領域の境界となる単位領域に対する煩雑な処理を回避することができ、処理量を削減することができる。
上記パラメータセットは、APS(Adaptation Parameter Set)であっても、上述した効果を奏することができる。
上記課題を解決するために本発明に係る画像フィルタ装置では、復号した復号画像の単位領域ごとに、フィルタパラメータを用いてフィルタ処理を施す画像フィルタ装置であって、上記単位領域に対しフィルタ処理を施すために用いるフィルタパラメータを、該単位領域を復号した直後に復号する復号手段と、上記復号手段が復号したフィルタパラメータを用いて上記単位領域に対するフィルタ処理を施すフィルタ手段と、を備えていることを特徴としている。
上記の構成によれば、単位領域を復号した直後に、該単位領域に対しフィルタ処理を施すために用いるフィルタパラメータを復号するので、フィルタパラメータを一時的に記憶しておくためのメモリを削減することができる。
上記の単位領域は、復号画像が復号される前に符号化されたときの単位である最大符号化単位LCU(Largest coding unit)であっても上述した効果を奏することができる。
上記課題を解決するために、本発明に係る画像符号化装置は、生成した予測画像と原画像との差分である予測残差を符号化することによって符号化データを生成する画像符号化装置であって、原画像を符号化し、復号した復号画像における、共通のフィルタパラメータを用いる単位領域群から成るフィルタ適用領域に含まれる画素に対し、当該フィルタパラメータを用いてフィルタ処理を施すフィルタ手段と、複数の上記単位領域で共通して用いられるフィルタパラメータをパラメータセットとして、用いられる単位領域よりも先行して出力する符号化データ出力手段と、を備え、1つの上記パラメータセットには、複数の上記フィルタ適用領域それぞれで用いられるフィルタパラメータが格納されていることを特徴としている。
上記の構成によれば、パラメータセットに、複数のフィルタ適用領域それぞれで用いられるフィルタパラメータが格納されるので、1つのパラメータセットで複数のフィルタ適用領域に対応することができる。
また、フィルタ適用領域それぞれで用いられるフィルタパラメータについて、逐一パラメータセットを生成する必要がなくなる。
本発明に係る符号化データのデータ構造は、画像復号装置において、復号された復号画像に対し施されるフィルタのフィルタパラメータが格納された符号化データのデータ構造であって、上記画像復号装置は、復号した復号画像の単位領域ごとに、共通のフィルタパラメータを用いる上記単位領域群から成るフィルタ適用領域に含まれる画素に対し、当該フィルタパラメータを用いてフィルタ処理を施すものであり、上記符号化データには、複数の上記単位領域で共通して用いられるフィルタパラメータがパラメータセットとして含まれているとともに、1つの上記パラメータセットには、複数の上記フィルタ適用領域それぞれで用いられるフィルタパラメータが格納されていることを特徴としている。
上記の構成によれば、パラメータセットに、複数のフィルタ適用領域それぞれで用いられるフィルタパラメータが格納されるので、1つのパラメータセットで複数のフィルタ適用領域に対応することができる。
また、フィルタ適用領域それぞれで用いられるフィルタパラメータについて、逐一パラメータセットを生成する必要がなくなる。
なお、上記の画像復号装置、画像フィルタ装置、および画像符号化装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記各手段として動作させることにより上記の画像復号装置、画像フィルタ装置、および画像符号化装置をコンピュータにて実現させる画像復号装置、画像フィルタ装置、および画像符号化装置の制御プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。
以上のように、本発明に係る画像復号装置は、共通のフィルタパラメータを用いる上記単位領域群から成るフィルタ適用領域に含まれる画素に対し、当該フィルタパラメータを用いてフィルタ処理を施すフィルタ手段を備え、1つの上記パラメータセットには、複数の上記フィルタ適用領域それぞれで用いられるフィルタパラメータが格納されている構成である。
これにより1つのパラメータセットで複数のフィルタ適用領域に対応することができるという効果を奏する。また、フィルタ適用領域それぞれで用いられるフィルタパラメータについて、逐一パラメータセットを生成する必要がなくなるという効果を奏する。
また、本発明に係る画像符号化装置は、生成した予測画像と原画像との差分である予測残差を符号化することによって符号化データを生成する画像符号化装置であって、原画像を符号化し、復号した復号画像における、共通のフィルタパラメータを用いる単位領域群から成るフィルタ適用領域に含まれる画素に対し、当該フィルタパラメータを用いてフィルタ処理を施すフィルタ手段と、複数の上記単位領域で共通して用いられるフィルタパラメータをパラメータセットとして、用いられる単位領域よりも先行して出力する符号化データ出力手段と、を備え、1つの上記パラメータセットには、複数の上記フィルタ適用領域それぞれで用いられるフィルタパラメータが格納されている構成である。
これにより1つのパラメータセットで複数のフィルタ適用領域に対応することができるという効果を奏する。また、フィルタ適用領域それぞれで用いられるフィルタパラメータについて、逐一パラメータセットを生成する必要がなくなるという効果を奏する。
また、本発明に係る符号化データのデータ構造は、画像復号装置において、復号された復号画像に対し施されるフィルタのフィルタパラメータが格納された符号化データのデータ構造であって、上記画像復号装置は、復号した復号画像の単位領域ごとに、共通のフィルタパラメータを用いる上記単位領域群から成るフィルタ適用領域に含まれる画素に対し、当該フィルタパラメータを用いてフィルタ処理を施すものであり、上記符号化データには、複数の上記単位領域で共通して用いられるフィルタパラメータがパラメータセットとして含まれているとともに、1つの上記パラメータセットには、複数の上記フィルタ適用領域それぞれで用いられるフィルタパラメータが格納されている構成である。
これにより1つのパラメータセットで複数のフィルタ適用領域に対応することができるという効果を奏する。また、フィルタ適用領域それぞれで用いられるフィルタパラメータについて、逐一パラメータセットを生成する必要がなくなるという効果を奏する。
本発明の実施の形態を示すものであり、動画像復号装置の要部構成を示すブロック図である。 動画像符号化装置によって生成され、上記動画像復号装置によって参照される符号化データのデータ構造を示すものであって、(a)はシーケンスレイヤの構造を示す図であり、(b)はシーケンスレイヤに含まれるスライスレイヤの構成を示す図であり、(c)はスライスレイヤに含まれるTBレイヤの構成を示す図であり、(d)はTBレイヤに含まれるCUの構成を示す図である。 APSを含むパラメータセットPSと符号化データのレイヤ構造との関係を示す図である。 LCUにスライス境界が含まれる場合の復号処理を説明するための図であり、(a)はLCUとTBとの関係を示す図であり、(b)はLCUとスライス境界との関係を示す図である。 APSのシンタクス例を示す図である。 APSのデータ構造を説明するための図であり、(a)は従来技術を示す図であり、(b)はAPSに複数のパラメータが含まれている構造を示す図であり、(c)はスライスがAPSを参照する様子を示す図である。 APSのデータ構造を説明するための図であり、スライスがAPSを参照する様子を示す図である。 従来技術におけるAPSとスライスとの関係を示す図である。 従来技術におけるAPSのシンタクス例を示す図であり、(a)はAPSのシンタクスを示す図であり、(b)は(a)のシンタクスにより呼び出されるシンタクスを示す図である。 従来技術におけるAPSのシンタクス例を示す図であり、(a)(b)は図9(a)のシンタクスにより呼び出されるシンタクスを示す図である。 スライスヘッダにパラメータが格納されている例を示す図である。 LCU単位でパラメータを符号化する例を説明するための図であり、(a)は各LCU直後にフィルタパラメータを符号化する場合のデータ構造の例を示す図であり、(b)はシンタクス例を示す図である。 スライス分割と適応オフセットフィルタのパラメータの適用範囲とを示す図であり、(a)はスライス分割を示す図であり、(b)は適応オフセットフィルタのパラメータの適用範囲を示す図である。 パラメータが符号化される位置と必要な情報との対応関係を示す図である。 適応オフセットフィルタにおいて、ユニット数、終端フラグをAPSで符号化する場合のデータ構造について説明するための図であり、(a)はユニット数を符号化する場合のデータ構造を示す図であり、(b)はピクチャにおける概要を示す図であり、(c)は終端フラグを符号化する場合のデータ構造を示す図である。 適応オフセットフィルタにおける適用範囲のユニット数を符号化する場合のシンタクスを示す図であり、(a)はユニット数を符号化するシンタクスを示す図であり、(b)は(a)に示すシンタクスにより呼び出されるシンタクスを示す図である。 ユニット数に加え、ユニットサイズを符号化する場合のシンタクスを示す図である。 適応フィルタにおける適用範囲のユニット数を符号化する場合のシンタクスを示す図である。 従来技術におけるパラメータの符号化のシンタクスを示す図である。 従来技術におけるパラメータの符号化のシンタクスを示す図である。 スライス開始位置を明示的に符号化する場合のシンタクスを示す図であり、(a)はスライス開始位置を示すシンタクスを示す図であり、(b)は(a)に示すシンタクスにより呼び出されるシンタクスを示す図である。 ユニットサイズがLCUよりも大きい場合を示す図である。 各ユニットの先頭部分に終端フラグを設ける場合のシンタクス例を示す図であり、(a)は終端フラグを示すシンタクスを呼び出すためのシンタクスを示す図であり、(b)は終端フラグを示すシンタクスを示す図である。 LCUよりも細かいTBによりスライスが形成されている場合を示す図である。 フィルタ適用領域の大きさを変更する場合を説明するための図であり、(a)は変更前のフィルタ適用領域を示す図であり、(b)は始点を変更した場合のフィルタ領域を示す図であり、(c)は変更前のフィルタ適用領域を示す図であり、(d)は終点を変更した場合のフィルタ適用領域を示す図である。 マージを用いる場合を説明するための図であり、(a)はマージを用いる場合のシンタクスを示す図であり、(b)はデータ構造を示す図である。 予測を用いる場合のシンタクスを示す図である。 本実施の形態に係る動画像符号化装置の要部構成を示すブロック図である。 動画像復号装置および動画像符号化装置が、動画像の送受信に利用できることを説明するための図であり、(a)は、動画像符号化装置を搭載した送信装置の構成を示したブロック図であり、(b)は、動画像復号装置を搭載した受信装置の構成を示したブロック図である。 動画像復号装置および動画像符号化装置が、動画像の記録および再生に利用できることを説明するための図であり、(a)は、動画像符号化装置2を搭載した記録装置の構成を示したブロック図であり、(b)は、動画像復号装置を搭載した再生装置の構成を示したブロックである。 従来技術における適応オフセットフィルタについて説明するための図であり、(a)、(b)は適応オフセットフィルタパラメータのデータ構造を示す図であり、(c)は適用範囲の設定方法を説明するための図である。 適応オフセットフィルタのパラメータのシンタクスを示す図であり、(a)はスライスの開始位置、スライスの横幅を明示的に示す場合のシンタクスを示す図であり、(b)は(a)に示すシンタクスによって呼び出されるシンタクスを示す図である。 図32(a)に示すシンタクスによって呼び出されるシンタクスを示す図である。
本発明に係る実施の形態1について、図1〜28を参照して説明する。まず、本実施の形態に係る動画像復号装置(画像復号装置)1の説明に先立ち、本実施の形態に係る動画像符号化装置(画像符号化装置)2によって生成され、動画像復号装置1によって復号される符号化データ#1の構成について説明する。
なお、本実施の形態において、単に「フィルタ処理」と言う場合、適応オフセットフィルタおよび適応フィルタの少なくとも何れかの処理を言う。また、適応オフセットフィルタ処理および適応フィルタ処理の何れか一方を例として説明した場合であっても、当該例は、他方のフィルタ処理においても適用可能である。
(符号化データ#1の構成)
符号化データ#1の構成について図2を参照して説明する。図2は、符号化データ#1のデータ構造を示す図である。符号化データ#1は、シーケンス、およびシーケンスを構成する複数のピクチャ、ピクチャを構成する複数のスライスを含むものであり、図2は、符号化データ#1におけるシーケンスレイヤ以下の階層の構造を示している。
図2(a)は、シーケンスSequenceを規定するシーケンスレイヤの構造を示す図である。図2(b)は、スライスSを規定するスライスレイヤの構造を示す図である。図2(c)は、ツリーブロック(Tree block)TBを規定するツリーブロックレイヤの構造を示す図である。図2(d)は、ツリーブロックTBに含まれる符号化単位(CU:Coding Unit)を規定するCUレイヤの構造を示す図である。
(シーケンスレイヤ)
シーケンスレイヤでは、処理対象のシーケンスを復号するために、動画像復号装置1が参照するデータの集合が規定されている。シーケンスSequenceは、図2(a)に示すように、シーケンスパラメータセットSPS(以下、単にSPSとも言う)、ピクチャパラメータセットPPS(以下、単にPPSとも言う)、アダプテーションパラメータセットAPS(以下、単にAPSとも言う)、スライスSを含んでいる。
PPSおよびAPSには、ピクチャレイヤまたはスライスレイヤで共通し、再利用可能なパラメータが格納されている。例えば、PPSには、対象ピクチャの復号方法を決定するために動画像復号装置1が参照する符号化パラメータ群が含まれている。例えば、動画像符号化装置2が符号化の際に用いた可変長符号化のモードを示す符号化モード情報や量子化マトリクス等が格納されている。
また、APSには、適応ループフィルタ(ALF)のフィルタ係数、サンプル適応オフセット(SAO:Sample Adaptive Offset)のオフセット値等が格納されている。なお、適応ループフィルタ(ALF)のフィルタ係数、サンプル適応オフセット(SAO:Sample Adaptive Offset)のオフセット値等、APSに格納されている情報をそれぞれのパラメータとも呼ぶ。
また、PPSおよびAPSの符号化データにおける位置は限定されず、当該PPSおよびAPSを参照するスライスデータよりも前に存在さえすればよい。
(スライスレイヤ)
スライスレイヤでは、処理対象のスライスS(対象スライスとも称する)を復号するために動画像復号装置1が参照するデータの集合が規定されている。スライスSは、図2(b)に示すように、スライスヘッダSH、および、ツリーブロックTB〜TBNC(NCはスライスSに含まれるツリーブロックの総数)のシーケンスを含んでいる。
スライスヘッダSHには、対象スライスの復号方法を決定するために動画像復号装置1が参照する符号化パラメータ群が含まれる。スライスタイプを指定するスライスタイプ指定情報は、スライスヘッダSHに含まれる符号化パラメータの一例である。
スライスタイプ指定情報により指定可能なスライスタイプとしては、(1)符号化の際にイントラ予測のみを用いるIスライス、(2)符号化の際に単方向予測、または、イントラ予測を用いるPスライス、(3)符号化の際に単方向予測、双方向予測、または、イントラ予測を用いるBスライスなどが挙げられる。
(ツリーブロックレイヤ)
ツリーブロックレイヤでは、処理対象のツリーブロックTB(以下、対象ツリーブロックとも称する)を復号するために動画像復号装置1が参照するデータの集合が規定されている。
ツリーブロックTBは、ツリーブロックヘッダTBHと、符号化単位情報CU〜CUNL(NLはツリーブロックTBに含まれる符号化単位情報の総数)とを含む。まず、ツリーブロックTBと、符号化単位情報CUとの関係について説明すると次のとおりである。
ツリーブロックTBは、イントラ予測またはインター予測、および、変換の各処理のためのブロックサイズを特定するためのユニットに分割される。
ツリーブロックTBの上記ユニットは、再帰的な四分木分割により分割されている。この再帰的な四分木分割により得られる木構造のことを以下、符号化ツリー(coding tree)と称する。
以下、符号化ツリーの末端のノードであるリーフ(leaf)に対応するユニットを、符号化ノード(coding node)と呼ぶ。また、符号化ノードは、符号化処理の基本的な単位となるため、以下、符号化ノードのことを、符号化単位(CU)とも称する。
つまり、符号化単位情報(以下、CU情報と称する)CU〜CUNLは、ツリーブロックTBを再帰的に四分木分割して得られる各ツリーブロックTBである、符号化ノード(符号化単位)に対応する情報である。
また、符号化ツリーのルート(root)は、最上位のツリーブロックTBに対応付けられる。換言すれば、最上位のツリーブロックTBは、複数の符号化ノードを再帰的に含む四分木分割の木構造の最上位ノードに対応付けられる。符号化単位として使用可能な最大の最上位のツリーブロックTBを、最大符号化単位(最大コーディングユニット、Largest Coding Unit、LCUと呼ばれることもある)と呼ぶ。LCUにおける階層深度は、ツリーブロックTBの最上位であることから、0である。上述したスライスSの復号処理は、LCUを単位として行われる。
なお、各符号化ノードに対応する画像領域のサイズは、当該符号化ノードが直接に属する符号化ノード(すなわち、当該符号化ノードの1階層上位のノードのユニット)のサイズの縦横とも半分である。
また、各符号化ノードのとり得るサイズは、符号化データ#1のシーケンスパラメータセットSPSに含まれる、符号化ノードのサイズ指定情報および最大階層深度(maximum hierarchical depth)に依存する。例えば、ツリーブロックTBのサイズが64×64画素であって、最大階層深度が3である場合には、当該ツリーブロックTB以下の階層における符号化ノードは、4種類のサイズ、すなわち、64×64画素、32×32画素、16×16画素、および8×8画素の何れかをとり得る。
また、復号処理の単位であるLCUとは別に、スライスSがLCU未満のツリーブロックTBを単位として構成されている場合、スライス境界を含むLCUにおいては、当該LCUの全ての領域を復号処理するのではなく、処理対象スライスに含まれる領域の復号処理を行い、次に、当該LCUを含む他方のスライスについて、当該LCUに含まれる領域のうち、当該他方のスライスに含まれる領域から復号処理を行う。
図4を参照して説明する。図4は、LCUにスライス境界が含まれる場合の復号処理を説明するための図である。図4(a)に示すように、LCU451には、4個のツリーブロックTB452が含まれているとする。そして、一方のスライスに、LCU451に含まれるツリーブロックTBのうち、左上、右上、左下のTBが含まれ、他方のスライスに右下のTBが含まれるとする。この場合、左上、右上、左下のTBは、当該TBが含まれるスライスに対する復号処理が行われるときに復号処理が行われ、右下のTBは、次のスライスに対する復号処理が行われるときに、当該TBから復号処理が行われる。
なお、図4(b)に示すend_of_slice_flagは、当該TBがスライスの終わりであるか否かを示すシンタクスである。
(ツリーブロックヘッダ)
ツリーブロックヘッダTBHには、対象ツリーブロックの復号方法を決定するために動画像復号装置1が参照する符号化パラメータが含まれる。具体的には、図2(c)に示すように、対象ツリーブロックの各CUへの分割パターンを指定するツリーブロック分割情報SP_TB、および、量子化ステップの大きさを指定する量子化パラメータ差分Δqp(qp_delta)が含まれる。
ツリーブロック分割情報SP_TBは、ツリーブロックを分割するための符号化ツリーを表す情報であり、具体的には、対象ツリーブロックに含まれる各CUの形状、サイズ、および、対象ツリーブロック内での位置を指定する情報である。
なお、ツリーブロック分割情報SP_TBは、CUの形状やサイズを明示的に含んでいなくてもよい。例えばツリーブロック分割情報SP_TBは、対象ツリーブロック全体またはツリーブロックの部分領域を四分割するか否かを示すフラグの集合であってもよい。この場合、ツリーブロックの形状やサイズを併用することで各CUの形状やサイズを特定できる。
また、量子化パラメータ差分Δqpは、対象ツリーブロックにおける量子化パラメータqpと、当該対象ツリーブロックの直前に符号化されたツリーブロックにおける量子化パラメータqp’との差分qp−qp’である。
(CUレイヤ)
CUレイヤでは、処理対象のCU(以下、対象CUとも称する)を復号するために動画像復号装置1が参照するデータの集合が規定されている。
ここで、CU情報CUに含まれるデータの具体的な内容の説明をする前に、CUに含まれるデータの木構造について説明する。符号化ノードは、予測ツリーPTおよび変換ツリーTTのルートとなる。予測ツリーおよび変換ツリーについて説明すると次のとおりである。
予測ツリーにおいては、符号化ノードが1または複数の予測ブロックに分割され、各予測ブロックの位置とサイズとが規定される。別の表現でいえば、予測ブロックは、符号化ノードを構成する1または複数の重複しない領域である。また、予測ツリーは、上述の分割により得られた1または複数の予測ブロックを含む。
予測処理は、この予測ブロックごとに行われる。以下、予測の単位である予測ブロックのことを、予測単位(PU:prediction unit)とも称する。
また、変換ツリーにおいては、符号化ノードが1または複数の変換ブロックに分割され、各変換ブロックの位置とサイズとが規定される。別の表現でいえば、変換ブロックは、符号化ノードを構成する1または複数の重複しない領域のことである。また、変換ツリーは、上述の分割より得られた1または複数の変換ブロックを含む。
変換処理は、この変換ブロックごとに行われる。以下、変換の単位である変換ブロックのことを、変換単位(TU:transform unit)とも称する。
(CU情報CUのデータ構造)
続いて、CU情報CUに含まれるデータの具体的な内容について、図2(d)を参照して説明する。図2(d)に示すように、CU情報CUは、スキップフラグSKIP、対象CUの各予測単位への分割パターンを指定するPU分割情報SP_PU、予測タイプ情報PType、PT情報PTI、および、TT情報TTIを含んでいる。
スキップフラグSKIPは、対象のCUについて、スキップモードが適用されているか否かを示すフラグであり、スキップフラグSKIPの値が1の場合、すなわち、対象CUにスキップモードが適用されている場合、スキップの対象となる各種情報は省略され、復号される際には、既定値または推定値が用いられる。また、スキップフラグSKIPは、Iスライスでは省略される。
PU分割情報SP_PUは、対象CUに含まれる各PUの形状、サイズ、および、対象CU内での位置を決定するための情報である。例えば、PU分割情報SP_PUは、対象CUから、イントラ分割を指定するイントラ分割フラグ、および、対象CUから、インター分割を指定するインター分割フラグの少なくとも何れか一方から実現することができる。
イントラ分割フラグは、対象CUに含まれる各イントラPU(イントラ予測が用いられるPU)の形状、サイズ、および、対象CU内での位置を指定する情報である。
インター分割フラグは、対象CUに含まれる各インターPU(インター予測が用いられるPU)の形状、サイズ、および、対象CU内での位置を指定する情報である。
予測タイプ情報PTypeは、対象PUについての予測画像生成方法として、イントラ予測を用いるのか、または、インター予測を用いるのかを指定する情報である。
PT情報PTIは、対象CUに含まれるPTに関する情報である。言い換えれば、PT情報PTIは、PTに含まれる1または複数のPUそれぞれに関する情報の集合であり、動画像復号装置1により予測画像を生成する際に参照される。PT情報PTIは、予測タイプ情報PTypeが何れの予測方法を指定するのかに応じて、インター予測情報、または、イントラ予測情報より構成される。以下では、イントラ予測が適用されるPUをイントラPUとも呼称し、インター予測が適用されるPUをインターPUとも呼称する。
TT情報TTIは、対象CUに含まれるTTに関する情報である。言い換えれば、TT情報TTIは、TTに含まれる1または複数のTUそれぞれに関する情報の集合であり、動画像復号装置1により残差データを復号する際に参照される。
(TT情報TTI)
TT情報TTIは、変換サイズ、変換タイプ、変換係数、空間領域の変換係数の存在の有無、周波数領域の変換係数の存在の有無、量子化予測残差を、対象CUに含まれるTUの総数分含んでいる。
TUは、対象CUを階層的に四分木分割することにより形成されており、対象CUまたは対象CUの部分領域の分割を行うのか否かを示すTU分割情報により、サイズが決定する。TU分割情報は基本的には四分木の各ノードに対して符号化されるが、変換サイズに関する制約(最大変換サイズ、最小変換サイズ、四分木の最大階層深度)に応じて省略されて推定される場合もある。
量子化予測残差QDは、動画像符号化装置2が以下の処理1〜3を、処理対象のブロックである対象ブロックに施すことによって生成した符号化データである。
処理1:符号化対象画像から予測画像を減算した予測残差を周波数領域に直交変換(DCT変換(Discrete Cosine Transform)またはDST変換(Discrete sine Transform))する;
処理2:処理1にて得られた変換係数を量子化する;
処理3:処理2にて量子化された変換係数を可変長符号化する;
なお、上述した量子化パラメータqpは、動画像符号化装置2が変換係数を量子化する際に用いた量子化ステップQPの大きさを表す(QP=2qp/6)。
(パラメータセット)
次に、図3を参照して、パラメータセットと符号化データのレイヤ構造との関係を説明する。上述したように、符号化データはシーケンスレイヤ、スライスレイヤというように階層的な構造となっており、シーケンスレイヤで共通するパラメータについては、SPS401、402に格納され、ピクチャレイヤで共通するパラメータについては、PPS403、404に格納されている。
また、スライスレイヤで共通するパラメータについては、APS2901、2902に格納されている。そして、各スライス406、408、410のスライスヘッダSH405、407、409が、idにより指定されたPPSを参照する。図3では、idにより参照するPPS、APS、およびSPSを破線で示している。すなわち、スライスヘッダSH405は、PPS403、APS2901を参照し、スライスヘッダ407はPPS403、APS2902を参照している。
なお、詳細は後述するが、スライスヘッダSHそれぞれは、必ずしも異なるAPSを参照する必要はない。異なるスライスヘッダSHが同じAPSを参照する構成であってもよい。
(動画像復号装置1)
次に、本実施形態に係る動画像復号装置1について、図1を参照して説明する。動画像復号装置1は、その一部に、H.264/MPEG−4.AVCに採用されている方式、VCEG(Video Coding Expert Group)における共同開発用コーデックであるKTAソフトウェアに採用されている方式、その後継コーデックであるTMuC(Test Model under Consideration)ソフトウェアに採用されている方式、および、HM(HEVC TestModel)ソフトウェアに採用されている技術を含んでいる。
図1は、動画像復号装置1の構成を示すブロック図である。図1に示すように、動画像復号装置1は、可変長符号復号部13、動きベクトル復元部14、バッファメモリ15、インター予測画像生成部16、イントラ予測画像生成部17、予測方式決定部18、逆量子化・逆変換部19、加算器20、デブロッキングフィルタ41、適応フィルタ50、および適応オフセットフィルタ60を含む構成である。動画像復号装置1は、符号化データ#1を復号することによって動画像#4を生成するための装置である。
可変長符号復号部13は、PS情報復号部51を含む構成であり、各パーティションに関する予測パラメータPPを、符号化データ#1から復号する。すなわち、インター予測パーティションに関しては、参照画像インデックスRI、推定動きベクトルインデックスPMVI、および、動きベクトル残差MVDを符号化データ#1から復号し、これらを動きベクトル復元部14に供給する。
また、イントラ予測パーティションに関しては、(1)パーティションのサイズを指定するサイズ指定情報、および、(2)予測インデックスを指定する予測インデックス指定情報を符号化データ#1から復号し、これをイントラ予測画像生成部17に供給する。
また、可変長符号復号部13は、CU情報を符号化データから復号し、これを予測方式決定部18に供給する(不図示)。更に、可変長符号復号部13は、各ブロックに関する量子化予測残差QD、および、そのブロックを含むツリーブロックに関する量子化パラメータ差分Δqpを符号化データ#1から復号し、これらを逆量子化・逆変換部19に供給する。
PS情報復号部51は、符号化データ#1に含まれているSPS、PPS、APSといったパラメータセットPS情報を復号し、パラメータを用いて処理を行う各ブロックに供給する。例えば、APSに含まれている適応オフセットフィルタのオフセット値を含むパラメータであるSAOPを適応オフセットフィルタ60に供給する。また、APSに含まれている適応フィルタのFP(フィルタパラメータ)を抽出し、抽出したFPを適応フィルタ50に供給する。
動きベクトル復元部14は、各インター予測パーティションに関する動きベクトルmvを、そのパーティションに関する動きベクトル残差MVDと、他のパーティションに関する復元済みの動きベクトルmv’とから復元する。具体的には、(1)推定動きベクトルインデックスPMVIにより指定される推定方法に従って、復元済みの動きベクトルmv’から推定動きベクトルpmvを導出し、(2)導出した推定動きベクトルpmvと動きベクトル残差MVDとを加算することによって動きベクトルmvを得る。なお、他のパーティションに関する復元済みの動きベクトルmv’は、バッファメモリ15から読み出すことができる。動きベクトル復元部14は、復元した動きベクトルmvを、対応する参照画像インデックスRIと共に、インター予測画像生成部16に供給する。なお、双方向予測(重み付き予測)を行うインター予測パーティションについては、復元した2つの動きベクトルmv1およびmv2を、対応する参照画像インデックスRI1およびRI2と共に、インター予測画像生成部16に供給する。
インター予測画像生成部16は、各インター予測パーティションに関する動き補償画像mcを生成する。具体的には、動きベクトル復元部14から供給された動きベクトルmvを用いて、同じく動きベクトル復元部14から供給された参照画像インデックスRIによって指定されるフィルタ済復号画像P_FL’から動き補償画像mcを生成する。ここで、フィルタ済復号画像P_FL’は、局所復号画像Pに対して、デブロッキングフィルタ41によるデブロック処理、適応オフセットフィルタ60によるオフセットフィルタ処理、および適応フィルタ50による適応的フィルタ処理を施すことによって得られる画像であり、インター予測画像生成部16は、フィルタ済復号画像P_FL’を構成する各画素の画素値をバッファメモリ15から読み出すことができる。インター予測画像生成部16によって生成された動き補償画像mcは、インター予測画像Pred_Interとして予測方式決定部18に供給される。なお、双方向予測(重み付き予測)を行うインター予測パーティションについては、(1)動きベクトルmv1を用いて、参照画像インデックスRI1によって指定されたフィルタ済復号画像P_FL1’から動き補償画像mc1を生成し、(2)動きベクトルmv2を用いて、参照画像インデックスRI2によって指定されたフィルタ済復号画像P_FL2’から動き補償画像mc2を生成し、(3)動き補償画像mc1と動き補償画像mc2との加重平均にオフセット値を加えることによってインター予測画像Pred_Interを生成する。
イントラ予測画像生成部17は、各イントラ予測パーティションに関する予測画像Pred_Intraを生成する。具体的には、まず、符号化データ#1から復号された予測インデックス指定情報およびサイズ指定情報を参照して予測モードを導出し、該予測モードを対象パーティションに対して、例えば、ラスタスキャン順に割り付ける。続いて、当該予測モードの示す予測方法に従って、バッファメモリから読み出した(不図示)局所復号画像Pから予測画像Pred_Intraを生成する。イントラ予測画像生成部17によって生成されたイントラ予測画像Pred_Intraは、予測方式決定部18に供給される。
また、イントラ予測画像生成部17は、対象パーティションのサイズ、および、対象パーティションに割り付けられた予測モードを示す情報であるイントラ符号化モード情報IEMを適応フィルタ50に供給する(不図示)。
予測方式決定部18は、CU情報に基づいて、各パーティションがインター予測を行うべきインター予測パーティションであるのか、イントラ予測を行うべきイントラ予測パーティションであるのかを決定する。そして、前者の場合には、インター予測画像生成部16にて生成されたインター予測画像Pred_Interを予測画像Predとして加算器20に供給し、後者の場合には、イントラ予測画像生成部17にて生成されたイントラ予測画像Pred_Intraを予測画像Predとして加算器20に供給する。
逆量子化・逆変換部19は、(1)量子化予測残差QDを逆量子化し、(2)逆量子化によって得られたDCT(Discrete Cosine Transform)係数またはDST(Discrete Sine Transform)係数を逆DCT変換または逆DST変換し、(3)逆DCT変換または逆DST変換によって得られた予測残差Dを加算器20に供給する。なお、量子化予測残差QDを逆量子化する際に、逆量子化・逆変換部19は、可変長符号復号部13から供給された量子化パラメータ差分Δqpから量子化ステップQPを導出する。量子化パラメータqpは、直前に逆量子化/逆DCT(またはDST)変換したツリーブロックに関する量子化パラメータqp’に量子化パラメータ差分Δqpを加算することによって導出でき、量子化ステップQPは、量子化ステップqpからQP=2pq/6によって導出できる。また、逆量子化・逆変換部19による予測残差Dの生成は、ブロック(変換単位)を単位として行われる。
加算器20は、予測方式決定部18から供給された予測画像Predと、逆量子化・逆変換部19から供給された予測残差Dとを加算することによって局所復号画像P(復号画像)を生成する。
デブロッキングフィルタ41は、局所復号画像Pにおけるブロック境界、またはCU境界を介して互いに隣接する画素の画素値の差が予め定められた範囲内である場合にはブロック歪みが存在すると判定し、局所復号画像Pにおける当該ブロック境界、または当該CU境界に対してデブロッキング処理を施すことによって、当該ブロック境界、または当該CU境界付近の画像の平滑化を行う。デブロッキングフィルタ41によりデブロッキング処理が施された画像は、デブロック済復号画像P_DBとして、適応オフセットフィルタ60に出力される。
適応オフセットフィルタ60は、デブロッキングフィルタ41から供給されるデブロック済復号画像P_DBに対して、符号化データ#1から復号されたオフセットを用いたオフセットフィルタ処理を施すことによってオフセットフィルタ済復号画像P_OFを生成する。生成されたオフセットフィルタ済復号画像P_OFは、適応オフセットフィルタ60に供給される。
適応フィルタ50は、適応オフセットフィルタ60から供給されるオフセットフィルタ済復号画像P_OFに対して、符号化データ#1から復号されたフィルタパラメータFP(フィルタセット番号、フィルタ係数群、領域指定情報、並びにオンオフ情報)を用いたフィルタ処理を施すことによって、フィルタ済復号画像P_FLを生成する。フィルタ済復号画像P_FLは、動画像#4として外部に出力されると共に、可変長符号復号部13によって符号化データから復号されたPOC指定情報と関連付けてバッファメモリ15に格納される。
本実施の形態では、上述した構成において、さらに下記に示す構成例とすることにより、スライス単位での適応オフセットフィルタ、適応フィルタの適用を可能とするものである。
(構成例1:APSの構成)
まず、APSの構成を工夫することにより、スライス単位(フィルタ適用領域)での適応オフセットフィルタ、適応フィルタの適用を可能とする例について、図5〜7を参照して説明する。まず、本実施の形態に係るAPSの構成を説明する前に、従来技術におけるAPSの構成について図8〜10を参照して説明する。
図8は、従来技術におけるAPSとスライスSとの関係を示す図である。また、図9、10は、APSのシンタクスを示す図である。
図9のシンタクス901に示すように、従来技術では、APSのそれぞれのパラメータが1つずつ含まれている。そして、例えば、適応オフセットフィルタのパラメータであれば、図9のシンタクス902、図10のシンタクス1001、1002を呼び出すことによりパラメータを復号している。
よって、従来技術では、図8に示すように、APSには1つのパラメータしか格納できないため、1つのスライスデータのスライスヘッダSHが1つのAPSを参照している。したがって、スライス単位で適応オフセットフィルタや適応フィルタのパラメータを符号化する場合、スライスデータの数だけ、APSが必要ということになる。例えば、スライスデータが10個あれば、APSも10個必要ということになる。APSには、適応オフセットフィルタや適応フィルタ以外のパラメータも含まれており、スライスデータごとにAPSを作成することになると、管理が非常に煩雑になってしまう。
そこで、本実施の形態では、APSに複数のパラメータを格納可能にしている。まず、図5に本実施の形態に係るAPSのシンタクス501を示す。シンタクス501に示すように、シンタクス“aps_num_パラメータ”により、各パラメータの前に個数を符号化し、
個数分だけループしている。また、各パラメータのシンタクスの引数iは、i組目のパラメータであることを示し、パラメータのIDとしても用いられる。なお、パラメータの個数が必要な場合には、その個数は必ず1個以上となるため、個数から1を引いた値を符号化すれば符号量を削減できる。この場合、シンタクス上は“_minus1”を伴う名前にするなどして識別可能にすることが好ましい。
次に、APSに複数のパラメータが格納される場合のデータ構造例について図6、7を参照して説明する。図6(a)に示すように、従来はAPSに1つのパラメータ(図6に示す例ではSAOparam)が格納されていた。本実施の形態では、図6(b)に示すように1つのAPSに複数のパラメータ(SAOparam)が格納されている。
なお、1つのAPSに複数のパラメータが格納されている場合、パラメータとスライスデータとの対応関係が不明確になる。そこで、例えば、図6(c)に示すように、APSそのものはaps_idで参照し、個々のパラメータとスライスデータとの対応付けは、符号化データでの格納順とすることが考えられる。
また、図7に示すように、スライスヘッダにaps_idに加え、当該APSに含まれているパラメータの何れかを特定するためのsaoparam_id(特定情報)を格納し、対応関係を明示的に示してもよい。なお、saoparam_idは、SAOparamの格納順に付与すればよい。
上記の構成よれば、1つのAPSに複数のパラメータを格納することができるので、スライス単位で適応オフセットフィルタや適応フィルタを適用する場合であっても、スライスの数と同じ数のAPSを作成する必要がない。これにより、容易に、スライス単位で適応フィルタ、適応オフセットフィルタを適用可能な画像復号装置を実現することができる。
なお、APSに格納されるパラメータは、適応オフセットフィルタ、適応フィルタに限られるものではなく量子化パラメータも含まれてもよい。この場合、scaling_list_paramを複数格納することになる。
(構成例2:スライスヘッダSHの構成)
次に、スライスヘッダSHの構成を工夫することにより、スライス単位での適応オフセットフィルタ、適応フィルタの適用を可能とする例について、図11を参照して説明する。
図11は、スライスヘッダSHに適応オフセットフィルタのパラメータであるSAOparamが格納されている例を示す。スライスヘッダSHにSAOparamを格納することにより、スライス単位で、適応オフセットフィルタ、適応フィルタの適用を可能とすることができる。
(構成例3:LCU単位でのパラメータの符号化)
次に、LCU単位(単位領域)でパラメータを符号化することにより、スライス単位での適応オフセットフィルタ、適応フィルタの適用を可能とする例について、図12を参照して説明する。図12(a)は、各LCUの符号化データの直後に適応オフセットフィルタおよび適応フィルタのパラメータを符号化する場合のデータ構造の例を示す図であり、(b)はシンタクス例を示す図である。
図12(a)、(b)に示すように、APSには、パラメータがAPSと各LCUの符号化データの直後の何れに存在しているかを示すaps_sao_param_in_slice_data_flagが含まれている。そして、各LCUの符号化データの直後にパラメータを格納する場合、aps_sao_param_in_slice_data_flagをtrueとする。
各LCUの符号化データの直後にパラメータを格納することにより、LCUを復号した時点で、次に使われる適応オフセットフィルタおよび適応フィルタのパラメータの復号を行うことになるため、適応オフセットフィルタおよび適応フィルタのパラメータを保持するメモリ量を削減することができる。
なお、本実施形態の復号装置に対応する符号化装置では、適応オフセットフィルタおよび適応フィルタのパラメータを生成した時点で、他の符号化データと同時に書き出すことができるため、適応オフセットフィルタおよび適応フィルタのパラメータを1ピクチャ分(あるいは1スライス分)保持する必要がなく、一時メモリを削減することができる。また、適応オフセットフィルタおよび適応フィルタのパラメータのデータ量が大きくなった場合にも、APSのサイズが大きくなってしまうことを防止することができる。
また、切り換えフラグを設け、適応オフセットフィルタおよび適応フィルタを符号化する場合と、LCU単位で符号化する場合とをピクチャ単位で切り換える構成であってもよい。
(符号化の処理単位)
上述したように、スライス単位で適応オフセットフィルタおよび適応フィルタを適用する場合、フィルタ処理を所定サイズの単位領域(ユニット)毎に処理し、ユニット単位でオフセットおよびフィルタ係数等のパラメータを符号化することが考えられる。この場合、ユニットの個数分、符号化を行う必要がある。なお、ユニットのサイズがLCUの整数倍になるようにすれば、LCU単位の符号化処理との親和性が高くなり好ましい。
スライス単位で、適応オフセットフィルタおよび適応フィルタを適用する場合の概要について、図13を参照して説明する。図13はスライス分割と適応オフセットフィルタのパラメータの適用範囲とを示す図であり、(a)はスライス分割を示す図であり、(b)は適応オフセットフィルタのパラメータの適用範囲を示す図である。
図13(a)に示すように、ピクチャがスライス0〜2(領域1301〜1303)に分割されている場合、適応オフセットフィルタのパラメータの適用範囲もスライス分割に準じて領域1311〜1313となる。ここでは適応オフセットフィルタのパラメータの適用範囲を例に説明しているが、適応フィルタのパラメータの適用範囲についても同様である。
そして、適応オフセットフィルタおよび適応フィルタの適用範囲を、スライス単位とする場合、ユニット数は、スライスのサイズ(スライスに含まれるLCUの個数)に依存する。しかしながら、従来技術では、スライスのサイズは、スライスの復号を終了する時点でしかわからない。
従来技術について、図19、20を参照して説明する。図19、20は、従来技術におけるパラメータの符号化のシンタクスを示す図である。従来技術では、パラメータをLCU単位で符号化しても、符号化する個数をAPSにおいて符号化していない。図19に示すシンタクス1901では、スライス上における開始位置(first_tb_in_slice)、スライスの左端位置(left_most_tb_in_pic)、およびスライスの上端位置(top_tb_in_pic)を参照しているが明示的に符号化しておらず、スライスを復号しなければ参照できない。
また、図20に示すシンタクス2001では、ユニットサイズ(alf_unit_width_minus1、alf_unit_height_minus1)を符号化しているのみであり、ユニット数は符号化されていない。
そして、従来技術のようにAPSにおいて、ユニット数を明示的に符号化しない場合、スライスの復号終了時点まで、APS中の適応オフセットフィルタおよび適応フィルタのパラメータを復号することができない。
また、適応オフセットフィルタおよび適応フィルタのパラメータの符号化に、スライスの開始位置を用いる場合であれば、スライスの復号開始時点まで、APS中の適応オフセットフィルタおよび適応フィルタのパラメータを復号することができない。
そこで、本実施の形態では、APSにおいて、フィルタ適用領域の開始位置となるスライスの開始位置を明示的に符号化するとともに、APSにおいて、適応オフセットフィルタおよび適応フィルタのユニット数、または、各ユニットの最後において終端フラグを符号化する。
まず、パラメータが符号化される位置と必要な情報との関係について、図14を参照して説明する。図14は、パラメータが符号化される位置と必要な情報との対応関係を示す表である。図14に示すように、APSにおいてパラメータを符号化する場合、ユニット数を符号化する必要がある。具体的には、後述する図16のシンタクスのようにユニット数としてsao_num_unit_minus1を符号化する。また、後述する図21のシンタクスのようにユニットとLCUサイズとが一致していない場合に明示的に対応する場合には、スライスの開始位置(X座標もしくはX軸上のずれ量)を符号化する必要がある。また、後述する図32、図33のシンタクスのようにスライス内のユニット位置に応じて、ユニットのパラメータの予測を行う場合には、スライスの開始位置(X座標)、スライスの横幅をさらに符号化する必要がある。APSにおいてパラメータを符号化する場合、APSを復号する時点では、スライスヘッダSHの情報はなく、スライスの横幅とピクチャの横幅とは必ずしも一致しないため、スライスの横幅も符号化する必要がある。ただし、後述するように、タイル符号化の場合にのみ、スライスの横幅を符号化し、それ以外ではスライスの横幅を符号化しないシンタクス構成も可能である。
また、スライスヘッダSHにおいてパラメータを符号化する場合、ユニット数も符号化する必要がある。スライスヘッダSHを復号した時点では、スライスの開始位置およびスライスの横幅は分かるが、スライスがどこまで続いているかは不明なためである。
また、各LCUの直後にパラメータを符号化する場合であれば、LCUごとにパラメータが対応付けられており、ユニット数、スライス開始位置、およびスライスの横幅を符号化する必要はない。なお、スライスの開始位置とフィルタの開始位置が一致していない場合には、スライスヘッダSHにおいて、スライスの開始位置(X座標)とフィルタ開始位置のずれを示すオフセットを符号化しても構わない。また、スライスの開始位置がユニットサイズの整数倍の場合にはスライスの開始位置をフィルタ適用領域の開始位置とし、スライスの開始位置がユニットサイズの整数倍にない場合には、フィルタ適用領域の開始位置をユニットサイズの整数倍となるように切り上げた座標としてもよい。
次に、適応オフセットフィルタにおいて、ユニット数、終端フラグをAPSで符号化する場合のデータ構造について、図15を参照して説明する。図15(a)は、ユニット数を符号化する場合のデータ構造を示す図であり、(b)はピクチャにおける概要を示す図であり、(c)は終端フラグを符号化する場合のデータ構造を示す図である。
図15(a)に示すように、ユニット数を符号化する場合、適応オフセットフィルタのパラメータ(SAOparam)の先頭部分に、スライスの開始位置(sao_unit_pos)とユニット数(sao_num_unit)とを符号化する。なお、図15(a)SAOUはSAO unit、すなわち適応オフセットフィルタの処理単位(ユニット)を示している。
また、図15(a)に示すSAOparamが適用される範囲が図15(b)に示す領域1501とすると、スライスの開始位置(sao_unit_pos)はユニット1502を示し、ユニット数(sao_num_unit)は領域1501に含まれるユニット(ここではLCU)の数を示す。なお、図15(b)における矢印は、SAOparam内でのSAOUの格納順を示している。
また、図15(c)に示すように、終端フラグを符号化する場合、各ユニットの先頭部分に終端フラグ(sao_last_flag)を設ける。
(ユニット数を符号化する場合)
適応オフセットフィルタにおける適用範囲のユニット数を符号化する場合のシンタクスを図16に示す。図16(a)に示すシンタクス1601では、従来技術(図9のシンタクス902)において適応オフセットフィルタの適用範囲の分割の方法を示していたsao_split_param()が含まれていない。そして、sao_num_unit_miuns1でユニット数を符号化するとともに、sao_offset_param()の引数が従来技術とは異なっている。なお、図16(b)に示すシンタクス1602は、シンタクス1601によって呼び出される、パラメータ(オフセット)を復号するためのシンタクスである。
次に、ユニット数に加え、ユニットサイズを符号化する場合のシンタクスを図17に示す。図17に示すシンタクス1701では、sao_unit_width_miuns1およびsao_unit_height_minus1でユニットのサイズを符号化している。
次に、適応フィルタの場合のシンタクスを図18に示す。図18のシンタクス1801に示すように、適応フィルタの場合であれば、alf_num_unit_minus1においてユニット数を符号化している。
(スライスの開始位置を符号化する場合)
スライスの開始位置が必要となるのは、ユニットとLCUサイズとが一致していない場合やパラメータを上のユニットから予測する場合である。スライスの開始位置を明示的に符号化する場合、スライスの開始位置をsao_unit_posで符号化する。この場合のシンタクス例を図21に示す。図21(a)のシンタクス2101は、スライスの開始位置を明示的に示す場合の、適応オフセットフィルタのパラメータのシンタクスであり、(b)のシンタクス2102は、シンタクス2101によって呼び出される、パラメータのシンタクスである。
(ユニットとLCUサイズとが一致していない場合)
ユニットとLCUサイズとが一致していない場合、スライスの先頭からフィルタ処理を行うよりも、LCUのX,Y座標が、ユニットサイズの定数倍になった時点でフィルタ処理を行う方が、処理量を削減することができ適当である。この場合、スライス開始位置、または、スライス開始位置と適応オフセットフィルタまたは適応フィルタの適用範囲の開始位置とのずれを符号化すればよい。また、スライスの開始位置を明示的に符号化せず、復号装置において、スライスの開始位置をLCUの整数倍となるように切り上げることによって導出しても構わない。具体的には、スライスの開始アドレスをslice_addr、スライスの横幅をslice_width、LCUの幅をLCU_widthとする場合には、まず、スライスの開始X座標slice_addr_xを、スライス開始アドレスとスライスの横幅の剰余により、
slice_addr_x = slice_addr % slice_width
から求める。次に、フィルタ開始位置のX座標filter_addr_xを、スライスX座標slice_addr_xにLCUの幅−1を加え、LCUの幅で割ることによって、すなわち
filter_addr_x = (slice_addr_x + LCU_width- 1) / LCU_width
で算出する。
(ユニットサイズがLCUよりも大きい場合)
図22に、ユニットサイズがLCUよりも大きい場合を示す。図22では、実線の細線でLCUを、実線の太線でスライスの境界を、破線でユニットを示している。このような場合、スライスの先頭のLCU(スライス境界をまたぐユニット2205に含まれるLCU2204)からフィルタ処理を行わず、LCUのX,Y座標がユニットサイズの定数倍になったユニットの先頭のLCU(ここでは、ユニット2206に含まれるLCU2207)を始点としてフィルタ処理を行うとよい。すなわち、ユニット2206をフィルタ対象領域の開始位置とし、スライス境界をまたぐユニット2205にはフィルタ処理を行わない。より具体的には、ユニットサイズの横幅をUNIT_widthとすると、フィルタ開始位置のX座標filter_addr_xを、スライスX座標slice_addr_xにユニットサイズ−1を加え、ユニットサイズで割ることによって、すなわち
filter_addr_x = (slice_addr_x + UNIT_width- 1) / UNIT_width
で算出する。また、ユニットサイズの縦幅をUNIT_heightとすると、フィルタ開始位置のY座標 filter_addr_yを、スライスY座標slice_addr_yにユニットサイズ−1を加え、ユニットサイズで割ることによって算出する。すなわち
filter_addr_y = (slice_addr_y + UNIT_height- 1) / UNIT_heightで算出する。
なお、スライスY座標slice_addr_yは、スライス開始アドレスとスライスの横幅の除算により、
slice_addr_y = slice_addr / slice_width
から求めることができる。
これにより、スライス境界にまたがるユニットの処理を回避することができ、処理量を低減することができる。
(スライス領域とフィルタ適用領域とが1対1に対応しない場合)
スライス領域とフィルタ適用領域とが1対1に対応しない場合、フィルタ適用領域の始点をスライス開始位置やスライスのサイズから導出できない場合がある。例えば、APSに、スライス途中から開始するフィルタ適用領域に対するパラメータを1組だけ入れる場合が考えられる。フィルタ適用領域の始点位置を符号化することで、スライス途中の任意の位置から開始するフィルタ適用領域を設定することができる。
これにより、スライス領域とフィルタ適用領域とが1対1に対応しない場合にも対応可能となる。
(パラメータを上のユニットから予測する場合)
フィルタパラメータやオフセットを上のユニットや左のユニットから予測する場合、ユニットのX座標やスライスの横幅が必要になる。なお、スライスの横幅は、必ずしもピクチャの横幅と同一ではない。例えば、タイル符号化と呼ばれる符号化手法を用いてピクチャを矩形(タイル)に分割した上で各タイルにスライス分割を適用した場合には、スライスの横幅は各タイルの横幅に依存する。
例えば、スライスの開始位置(X座標)を符号化することにより、左からの予測ができるかどうかを判定することができる。画面左端のユニットか否かが判定できるためである。
また、スライスの横幅を符号化することにより、上からの予測ができるかどうかを判定することができる。フィルタ適用領域の上端のユニットか否かが判定できるためである。なお、上からの予測であれば、X座標は関係なく、横幅分の数のユニットが復号済みで上にあるか否かが分かればよい。
この場合のシンタクス例を図32、図33に示す。図32(a)のシンタクス3201は、スライスの開始位置、スライスの横幅、を明示的に示す場合の、適応オフセットフィルタのパラメータのシンタクスであり、(b)のシンタクス3202は、シンタクス3201によって呼び出される、パラメータのシンタクスである。図33に示すシンタクス3203は、シンタクス3201によって呼び出される。
以下、本シンタクス例の特徴を説明する。パラメータの符号化位置がAPSである場合にはスライスの開始位置(sao_unit_pos)とスライスの横幅(sao_slice_width_in_unit_minus1)をパラメータの符号化データに含める。APSでない場合にはパラメータの符号化データに含めない。復号装置では、パラメータの符号化位置がAPSであるか否かの判定を行う。パラメータの符号化位置がAPSである場合には、スライスの開始位置とスライスの横幅を復号する。パラメータの符号化位置がAPSでない場合には、スライスの開始位置とスライスの横幅は、スライスヘッダを復号して得られる値を用いる(SYN321)。なお、タイル符号化がなされている場合には、符号化データはスライスの横幅を含み、復号装置は、スライスの横幅を復号する(SYN321A)。タイル符号化がなされていない場合(!in_tile)には、スライスの横幅は符号化データに含めず、スライスの横幅としてピクチャの幅を用いる。
スライスの開始位置を用いてスライス内のユニットアドレスCurrTbAddrを初期化する(SYN322)。以下、SYN329のループにより、ユニット数の分だけ、スライス内のユニットのパラメータが符号化データに含まれるため、復号装置ではこれらを復号する。ユニットアドレスCurrTbAddrと、スライスの横幅からユニットのスライス内のX座標xCUを算出する。xCUはスライスの横幅を用いてユニットアドレスの剰余を計算することで得られる(SYN323)。同様に、ユニットアドレスをスライスの横幅で除算することにより、スライス内のユニットのスライス内のY座標yCUを計算する(SYN324)。ユニットのX座標が0であるか否かによって分岐する(SYN325)。これは、ユニットのがスライス左端に位置する場合には、水平方向のユニット間のパラメータのコピーを示すラン(sao_run_num)の初期化を行う必要があるためである。さらにユニットのY座標が0であるか否かによって分岐する(SYN326)。これはユニットの上下方向のリピートを示す(sao_repeat_row_flag)を復号するか否かを制御するために用いられる。さらに、ユニットのY座標が0であるか否かによって分岐する(SYN327)。ユニットのY座標が0でない場合には、上方向にパラメータのコピーや予測に用いることができる参照ユニットが存在するため、上とのマージを行うか否かのフラグ(上の参照ユニットからパラメータのコピーを行うか否かのフラグ)sao_merge_above_flag(SYN328)をさらに復号する。このように、上からパラメータを予測する場合において、予測されるパラメータを復号するためには、ユニットのY座標が復号時点で算出可能である必要がある。sao_run_num_diffは、ラン(sao_run_num)の値の、上の列のユニットにおける値からの差分である。
ループ末尾においては、ユニットアドレスを1つ進め、ユニット数を1だけ減算する。減算後のユニット数が0より大きい場合には、まだ未復号ユニットがあることから、ループ先頭に戻り、各ユニットのパラメータの復号を繰り返す(SYN329)。このように、各ユニットのパラメータを復号するためには、復号時点で、ユニット数が得られている必要がある。図33は、各ユニットにおけるパラメータを示すシンタクスである。必ずしも全てのユニットに対して図33のシンタクスで示されるパラメータが符号化データに含まれるわけではない。リピートやマージによってユニットが既に復号されたユニットにマージされる場合には、該当するユニットのパラメータは符号化データに含まれない。逆に、マージされない場合には、該当するユニットのパラメータが復号化データに含まれる。復号装置では、各ユニットの座標およびリピートフラグやマージフラグに応じて、パラメータが含まれるか否かの判定を行い、パラメータが含まれる場合に復号を行う。
上記説明のように、APSで符号化されているか否かに応じて、スライスの開始位置とスライスの横幅を符号化データに含めるか否かを変更する場合には、APS以外で符号化される場合においてスライスの開始位置とスライスの横幅の符号化を省略し符号量を低減することができる。但し、符号化位置に応じて符号化データの構成を変更することなく、常にスライスの横幅を符号化するようにしてもよい。
上記説明のように、タイル符号化であるか否かに応じて、スライスの横幅を符号化データに含めるか否かを変更する場合には、タイル符号化以外の場合においてスライスの横幅の符号化を省略し符号量を低減することができる。ただし、タイル符号化に応じて符号化データの構成を変更することなく、常にスライスの横幅を符号化するようにしてもよい。
以上のように、パラメータの符号化位置によって、ユニット数、スライス開始X座標、スライスの横幅を符号化することにより、スライスの符号化データを最後まで復号あるいは先読みしなくても必要なパラメータを復号することができる。
なお、図14に示すようにパラメータの符号化位置、例えばAPS、スライスヘッダ、LCUによって必要な情報(ユニット数、スライス開始X座標、スライスの横幅)のみを符号化するように切り換える構成であってもよい。
また、ユニット数、スライスの開始位置、スライスの横幅は符号量が大きくなる可能性がある。例えば、1920×1080の画像のLCU(64×64画素とする)数は、30×17=510個となる。そして、スライスの構成単位であるTBが32×32であれば、スライス開始位置を表すスライスアドレスslice_addressの範囲は、510×4=2040であることから、0〜2039となる。さらに、スライスの横幅は0に近くなる可能性はほとんどなく、可変長符号のメリットは小さい。そこで、ゴロム符号などの値が小さいほど短い符号を割り当てる可変長符号化では符号量が増大するため、固定長符号化を用いることが好ましい。
そして、固定長符号の好ましいビット数は、以下のとおりである。
まず、ユニット数に対しては、ユニットサイズがLCUサイズの場合には、であれば、画面内のLCU数(NumLCUsInPicture)の2を底とする対数をとることによって、該LCU数を表現するために必要なビット数である最大ビット長を導出する。これは、スライスアドレスslice_addressの必要ビット数の計算と同様である。
log2_max_num_units = (Ceil(Log2(NumLCUsInPicture))
ここで、Ceilとは、引数以上で最小の整数を返す関数を意味する。なお、ピクチャサイズはAPS復号時点でも参照可能である。また、ユニットサイズとLCUサイズとが異なる場合には、下記のように必要ビット長を計算する。まず、画面内のユニット数NumUnitsInPictureを、画面幅picture_widthと、画面高さpicture_heightとから下記の式で導出する。
((picture_width+ UNIT_width - 1) / UNIT_width) *((picture_height + UNIT_height- 1) / UNIT_height)
続いて、次の式により必要ビット数を計算する。
log2_max_num_units = (Ceil(Log2(NumUnitsInPicture))
このように、ユニットとLCUのサイズが異なる場合でも、サイズの比率を用いれば同様に計算可能である。なお、ユニットサイズが得られない場合には可能なユニットサイズの最小値、例えばLCUサイズをユニットサイズとして必要ビット数を得る。なお、図17のシンタクスで示すように、ユニットサイズ(図17ではsao_unit_width_minus1)とユニット数(図17ではsao_num_unit_minus1)を符号化する場合には、ユニットサイズを先に符号化する。ユニットサイズを先に符号化することによって必要ビット数をより正確に計算することができる。これにより、最小ユニットサイズを元に必要ビット数を計算する場合に比べ少ないビット量でピクチャサイズを符号化することができる。
以上より、ユニット数については、log2_max_num_unitsビットの固定長符号化をすればよい。
同様に、フィルタ適用領域の横幅の固定長符号化に好ましいビット数は、スライスの横幅の固定長符号化に好ましいビット数から導出できる。スライスの横幅の固定長符号化に好ましいビット数はピクチャあるいはタイルの横幅からLog2をとって導出すればよい。また、スライスの開始位置の固定長符号化に好ましいビット数は、座標で表現されている場合は、ピクチャあるいはタイルの縦横サイズのLog2をとって導出し、ブロックアドレスにより表現されている場合は、ピクチャあるいはタイルが含みうる最大ユニット数のLog2をとって導出すればよい。
(終端フラグを符号化する場合)
各ユニットの先頭部分に終端フラグを設ける場合のシンタクス例を図23に示す。図23は、適応オフセットフィルタのパラメータの場合を示している。図23のシンタクス2302に示すように、終端フラグ(終端情報)を符号化する場合、ブロック数の指定によるforループではなく、ループ中で都度sao_last_flagを評価することにより、フィルタ適用領域の終端を検出して終了する。
(LCU未満のスライス境界への対応)
LCUとフィルタ処理のユニットが同サイズであり、フィルタ適用領域とスライスが1対1に対応している場合を例に考える。LCUよりも細かいTBによりスライスが形成されている場合(FGS:Fine Granularity Slice)、図24に示すように、LCUの内部にスライス境界が生じる場合がある。この場合、スライス境界を含むLCUは、フィルタ適用領域を2つ含むことになる。すなわち、当該LCUは、フィルタ適用領域の最後のブロック、かつ最初のブロックということになる。以下、当該LCUに対応するフィルタ処理のユニットを、境界単位領域と呼称する。
このような境界単位領域に対し、以下の2つの方法で対応することが考えられる。
(フィルタの適用の有無を示すフラグの符号化)
まず、境界単位領域に対しフィルタを適用するか否かを示すフラグをAPSで符号化することが考えられる。例えば、aps_sao_skip_boundary_LCU_flagを符号化し、フラグが真なら境界単位領域に対し、フィルタ処理を行わず、偽の場合にフィルタ処理を行うようにする。そして、フィルタ処理を行う場合は、境界単位領域のオフセット情報(適応オフセットフィルタの場合)を送信する。
境界単位領域に対し、フィルタ処理を行う方法としては、画素や小ブロック毎にフィルタ適用領域内かどうかを判定したうえで、領域内であればフィルタ処理を行い、領域外であればフィルタ処理を行わないとすればよい。
(フィルタの適用領域の大きさを変更する)
次に、フィルタの適用領域の大きさを変更して、境界単位領域に対する処理を決定することが考えられる。例えば、次の3つが考えられる。(1)フィルタ適用領域の始点(sao_unit_pos)に該当するユニットが境界単位領域である場合、当該ユニットがフィルタ適用領域に入らないように始点をずらす。(2)フィルタ適用領域の終端となるユニットが境界単位領域の場合、フィルタ適用領域のサイズ(sao_num_unit)におけるユニットの個数を1個少なくする。(3)フィルタ適用領域の終端となるユニットが境界単位領域の場合、終端フラグ(sao_last_flag)を、1ユニット早く真にする。
このような構成とすることにより、境界単位領域をフィルタ適用領域から外すことができる。境界単位領域をフィルタ適用領域から外す場合は、当該ユニットのオフセット情報(適応オフセットフィルタの場合)は符号化しない。
(フィルタ適用領域の大きさを変更する具体例)
次に、フィルタ適用領域の大きさを変更する場合の具体例について、図25を参照して説明する。図25(a)は変更前のフィルタ適用領域を示す図であり、(b)は始点を変更した場合のフィルタ領域を示す図であり、(c)は変更前のフィルタ適用領域を示す図であり、(d)は終点を変更した場合のフィルタ適用領域を示す図である。
図25(a)に示すように、フィルタ適用領域2501(sao_num_unit=Len_n)の始点のユニット2502(sao_unit_pos_=Pos_n)が境界単位領域の場合、図25(b)に示すように、フィルタ適用領域を、始点となるユニットをユニット2502から1つ右にずらしてユニット2504(sao_unit_pos=Pos_n+1)としたフィルタ適用領域2503(sao_num_unit=Len_n-1)とする。
また、図25(c)に示すように、フィルタ適用領域2505(sao_num_unit=Len_n)の終点のユニット2506が境界単位領域の場合、図25(d)に示すように、フィルタ適用領域を、終点となるユニットをユニット2506から1つ左にずらしてユニット2508としたフィルタ適用領域2507(sao_num_unit=Len_n-1)とする。
(ユニット単位でパラメータを符号化する場合)
ユニット単位でフィルタパラメータを符号化する場合、全てのオフセット情報を逐一符号化すると、符号化効率が低くなる。そこで、複数のユニットでオフセット情報を共用できるように、マージ指定子sao_merge_idx を用いてオフセット情報を省略することが好ましい。sao_merge_idxは、例えば、オフセット情報OIの前に符号化することが考えられる(図26(b))。
sao_merge_idxの値の例としては、例えば、
0:マージなし。新たなオフセット情報が符号化/復号される。
1: 左隣接ユニットとマージ(オフセット情報を共用)する。
2: 上隣接ユニットとマージする。
ということが考えられる。なお、3以上の値を設けて、左隣接ユニットおよび上隣接ユニット以外のブロックとマージする構成であってもよい。また、オフセット情報は、一意なIDで区別および参照できるように格納している。図26(a)のシンタクス2601では、変数blkで参照している。
例えば、左隣接ユニットとマージする場合、処理対象LCUのオフセット情報には、左隣接ユニットのオフセット情報のIDを用いる。
また、マージではなくオフセット値の予測(予測元指定子sao_pred_idx)を用いる構成であってもよい。予測を用いる場合、sao_pred_idx!=0では、オフセット値そのものではなくオフセット値の差分が符号化される。
図26に、マージを用いる場合のシンタクス例を、図27に予測を用いる場合のシンタクス例を示す。図26(a)のシンタクス2601では、各LCUについて、sao_merge_idx !=0の場合に、左/上隣接ユニットからオフセット情報をコピー(マージ)する。なお、sao_merge_idxは、左/上隣接が無いことが明らかな場合は省略するようにすることが望ましい。例えば、ユニットの位置を、sao_unit_posと同様にラスタスキャン順のアドレスuposで表せば、適用領域の最初のユニット(upos==sao_unit_pos)の場合や、適用領域の最上段のユニット(upos/SAORegionWidth==sao_unit_pos/SAORegionWidth)の場合は、sao_merge_idxは省略することが好ましい。
また、シンタクス2601において、SAORegionWidthは、SAOU数で表したフィルタ適用領域の横幅を表す数である。すなわち、upos-SAORegionWidthは、上隣接ユニットのインデクスを表している。
SAORegionWidthの値の具体的な値は、前述のように、タイル符号化を用いないスライスの場合であれば、ピクチャの横幅をSAOUの数で表した値であり、タイル符号化を使用している場合であれば、処理対象タイルの横幅をSAOUの数で表した値である。
(付記事項)
また、適応オフセットフィルタの処理単位(ユニット、SAOU)の大きさを変える構成であってもよい。高解像度の画像では、ユニットをLCU単位とすると、SAOUの数が多くなりすぎる。そこで、LCUよりも大きな単位をユニットとする。例えば、LCU2×2個(W×H)分や、4×1個分を、ユニットとする。
また、輝度と色差とでユニットの大きさを変える構成であってもよい。輝度と色差とは、解像度が異なることが多く、同じLCU単位でも、輝度と比較して色差の画素数が少ない場合がある。そこで、たとえば、輝度についてはLCU1個をユニットとし、色差については、LCU2×1個をユニットとしてもよい。
適応オフセットフィルタの処理単位のサイズの符号化方法としては、APSの冒頭で符号化する、個別のパラメータに含めるということが考えられる。
APSの冒頭で符号化する場合は、適応オフセットフィルタおよび適応フィルタの共通設定とすることができる。また、シンタクス上では、例えばaps_idの後付近に位置することになる。
個別のパラメータに含める場合は、適応オフセットフィルタおよび適応フィルタそれぞれの個別での設定とすることができる。シンタクス上では、aps_rbsp()内の各パラメータのif文内か、各パラメータの冒頭(例えばsao_param()冒頭のsample_adaptive_offset_flag直後)に位置することになる。
ユニットのサイズの符号化データは、サイズそのもの(W×H)を指定するものであってもよいし、規定のサイズから選択するものであってもよい。例えば、サイズそのものを指定する場合であれば、縦横のサイズをそれぞれsao_unit_size_widthとsao_unit_size_heightとして符号化し、規定のサイズから選択する場合であれば、sao_unit_size_idx(規定サイズからの選択指示子)を符号化すればよい。
以上のように、本実施の形態に係る動画像復号装置1は、復号した復号画像の単位領域(LCU)ごとに、フィルタパラメータ(オフセット、フィルタ係数)を用いてフィルタ処理(適応オフセットフィルタ、適応フィルタ)を施すとともに、複数の上記単位領域で共通して用いられるフィルタパラメータをパラメータセット(APS)として、該パラメータセットに含まれるフィルタパラメータを用いてフィルタ処理が施される上記単位領域よりも先に復号する動画像復号装置1であって、共通のフィルタパラメータを用いる上記単位領域群から成るフィルタ適用領域(スライス)に含まれる画素に対し、当該フィルタパラメータを用いてフィルタ処理を施すフィルタ手段(適応フィルタ50、適応オフセットフィルタ60)を備え、1つの上記パラメータセットには、複数の上記フィルタ適用領域それぞれで用いられるフィルタパラメータが格納されていることを特徴としている。
また、別の言い方をすれば、本実施の形態に係る動画像復号装置1は、復号した復号画像の単位領域ごとに、フィルタパラメータを用いてフィルタ処理を施すとともに、複数の上記単位領域で共通して用いられるフィルタパラメータをパラメータセットとして、該パラメータセットに含まれるフィルタパラメータを用いてフィルタ処理が施される上記単位領域よりも先に復号する動画像復号装置1であって、共通のフィルタパラメータを用いる上記単位領域群から成るフィルタ適用領域に含まれる画素に対し、当該フィルタパラメータを用いてフィルタ処理を施すフィルタ手段と、1つの上記パラメータセットから、複数の上記フィルタ適用領域それぞれで用いられるフィルタパラメータを復号する復号手段(PS情報復号部51)を備え、上記フィルタ手段は、上記復号手段が復号したフィルタパラメータを用いてフィルタ処理を施すことを特徴としている。
(動画像符号化装置2)
次に、符号化対象画像を符号化することによって符号化データ#1を生成する動画像符号化装置2について、図28を参照して説明する。動画像符号化装置2は、その一部に、H.264/MPEG−4.AVCに採用されている方式、VCEG(Video Coding Expert Group)における共同開発用コーデックであるKTAソフトウェアに採用されている方式、その後継コーデックであるTMuC(Test Model under Consideration)ソフトウェアに採用されている方式、および、HM(HEVC TestModel)ソフトウェアに採用されている技術を含んでいる。
図28は、本実施形態に係る動画像符号化装置2の構成を示すブロック図である。図28に示すように、動画像符号化装置2は、変換・量子化部21、可変長符号符号化部22、逆量子化・逆変換部23、バッファメモリ24、イントラ予測画像生成部25、インター予測画像生成部26、動きベクトル検出部27、予測方式制御部28、動きベクトル冗長性削除部29、加算器31、減算器32、デブロッキングフィルタ33、適応フィルタ70、および適応オフセットフィルタ80を含む構成である。動画像符号化装置2は、動画像#10(符号化対象画像)を符号化することによって、符号化データ#1を生成する装置である。
変換・量子化部21は、(1)符号化対象画像から予測画像Predを減算した予測残差Dをブロック毎にDCT変換(Discrete Cosine Transform)またはDST変換(Discrete Sine Transform)し、(2)DCT変換により得られたDCT係数またはDST変換により得られたDST係数を量子化し、(3)量子化により得られた量子化予測残差QDを可変長符号符号化部22および逆量子化・逆変換部23に供給する。なお、変換・量子化部21は、(1)量子化の際に用いる量子化ステップQPを、ツリーブロック毎に選択し、(2)選択した量子化ステップQPの大きさを示す量子化パラメータ差分Δqpを可変長符号符号化部22に供給し、(3)選択した量子化ステップQPを逆量子化・逆変換部23に供給する。ここで、量子化パラメータ差分Δqpとは、DCT(またはDST)変換/量子化するツリーブロックに関する量子化パラメータqp(QP=2pq/6)の値から、直前にDCT(またはDST)変換/量子化したツリーブロックに関する量子化パラメータqp’の値を減算して得られる差分値のことを指す。
可変長符号符号化部22は、PS情報符号化部55を含む構成であり、変換・量子化部21から供給された量子化予測残差QD並びにΔqp、後述する予測方式制御部28から供給された予測パラメータPP、およびPS情報符号化部55によって符号化されたパラメータセットPS情報を、可変長符号化することによって、符号化データ#1を生成する。
また、PS情報符号化部55は、後述する適応フィルタ70から供給されたフィルタパラメータFP(フィルタセット番号、フィルタ係数群、領域指定情報、並びにオンオフ情報)、適応オフセットフィルタ80から供給されるSAOPから、SPS、PPS、APSといったパラメータセットPS情報を生成し符号化する。
逆量子化・逆変換部23は、(1)量子化予測残差QDを逆量子化し、(2)逆量子化によって得られたDCT係数あるいはDST係数を逆DCT(Discrete Cosine Transform)変換あるいは逆DST(Discrete Sine Transform)変換し、(3)逆DCT変換あるいは逆DST変換によって得られた予測残差Dを加算器31に供給する。量子化予測残差QDを逆量子化する際には、変換・量子化部21から供給された量子化ステップQPを利用する。なお、逆量子化・逆変換部23から出力される予測残差Dは、変換・量子化部21に入力される予測残差Dに量子化誤差が加わったものであるが、ここでは簡単のために共通の呼称を用いる。
イントラ予測画像生成部25は、各パーティションに関する予測画像Pred_Intraを生成する。具体的には、(1)各パーティションついてイントラ予測に用いる予測モードを選択し、(2)選択した予測モードを用いて、局所復号画像Pから予測画像Pred_Intraを生成する。イントラ予測画像生成部25は、生成したイントラ予測画像Pred_Intraを、予測方式制御部28に供給する。
また、イントラ予測画像生成部25は、各パーティションについて選択された予測モードと、各パーティションのサイズから各パーティションについての予測インデックスPIを特定し、当該予測インデックスPIを予測方式制御部28に供給する。
また、イントラ予測画像生成部25は、対象パーティションのサイズ、および、対象パーティションに割り付けられた予測モードを示す情報であるイントラ符号化モード情報IEMを適応フィルタ70に供給する(不図示)。
動きベクトル検出部27は、各パーティションに関する動きベクトルmvを検出する。具体的には、(1)参照画像として利用するフィルタ済復号画像P_FL’を選択し、(2)選択したフィルタ済復号画像P_FL’において対象パーティションを最良近似する領域を探索することによって、対象パーティションに関する動きベクトルmvを検出する。ここで、フィルタ済復号画像P_FL’は、復号済みの復号画像に対して、デブロッキングフィルタ33によるデブロック処理、適応オフセットフィルタ80による適応的オフセット処理、および、適応フィルタ70による適応的フィルタ処理を施すことによって得られる画像であり、動きベクトル検出部27は、フィルタ済復号画像P_FL’を構成する各画素の画素値をバッファメモリ24から読み出すことができる。動きベクトル検出部27は、検出した動きベクトルmvを、参照画像として利用したフィルタ済復号画像P_FL’を指定する参照画像インデックスRIと共に、インター予測画像生成部26および動きベクトル冗長性削除部29に供給する。なお、双方向予測(重み付き予測)を行うパーティションについては、参照画像として2枚のフィルタ済復号画像P_FL1’およびP_FL2’を選択し、2枚のフィルタ済復号画像P_FL1’およびP_FL2’の各々に対応する動きベクトルmv1およびmv2、並びに、参照画像インデックスRI1およびRI2をインター予測画像生成部26および動きベクトル冗長性削除部29に供給する。
インター予測画像生成部26は、各インター予測パーティションに関する動き補償画像mcを生成する。具体的には、動きベクトル検出部27から供給された動きベクトルmvを用いて、動きベクトル検出部27から供給された参照画像インデックスRIによって指定されるフィルタ済復号画像P_FL’から動き補償画像mcを生成する。動きベクトル検出部27と同様、インター予測画像生成部26は、フィルタ済復号画像P_FL’を構成する各画素の画素値をバッファメモリ24から読み出すことができる。インター予測画像生成部26は、生成した動き補償画像mc(インター予測画像Pred_Inter)を、動きベクトル検出部27から供給された参照画像インデックスRIと共に、予測方式制御部28に供給する。なお、双方向予測(重み付き予測)をパーティションについては、(1)動きベクトルmv1を用いて、参照画像インデックスRI1によって指定されたフィルタ済復号画像P_FL1’から動き補償画像mc1を生成し、(2)動きベクトルmv2を用いて、参照画像インデックスRI2によって指定されたフィルタ済参照画像P_FL2’から動き補償画像mc2を生成し、(3)動き補償画像mc1と動き補償画像mc2との加重平均にオフセット値を加えることによってインター予測画像Pred_Interを生成する。
予測方式制御部28は、イントラ予測画像Pred_Intraおよびインター予測画像Pred_Interを符号化対象画像と比較し、イントラ予測を行うかインター予測を行うかを選択する。イントラ予測を選択した場合、予測方式制御部28は、イントラ予測画像Pred_Intraを予測画像Predとして加算器31および減算器32に供給すると共に、イントラ予測画像生成部25から供給された予測インデックスPIを予測パラメータPPとして可変長符号符号化部22に供給する。一方、インター予測を選択した場合、予測方式制御部28は、インター予測画像Pred_Interを予測画像Predとして加算器31および減算器32に供給すると共に、インター予測画像生成部26から供給された参照画像インデックスRI、並びに、動きベクトル冗長性削除部29(後述)から供給された推定動きベクトルインデックスPMVIおよび動きベクトル残差MVDを予測パラメータPPとして可変長符号符号化部22に供給する。
予測方式制御部28にて選択された予測画像Predを、符号化対象画像から減算することによって、減算器32にて予測残差Dが生成される。減算器32にて生成された予測残差Dは、上述したとおり、変換・量子化部21によってDCT(またはDST)変換/量子化される。一方、予測方式制御部28にて選択された予測画像Predを、逆量子化・逆変換部23にて生成された予測残差Dに加算することによって、加算器31にて局所復号画像Pが生成される。加算器31にて生成された局所復号画像Pは、デブロッキングフィルタ33、適応オフセットフィルタ80および適応フィルタ70を経由したのち、フィルタ済復号画像P_FLとしてバッファメモリ24に格納され、インター予測における参照画像として利用される。
なお、動きベクトル冗長性削除部29は、動きベクトル検出部27によって検出された動きベクトルmvにおける冗長性を削除する。具体的には、(1)動きベクトルmvの推定に用いる推定方法を選択し、(2)選択した推定方法に従って推定動きベクトルpmvを導出し、(3)動きベクトルmvから推定動きベクトルpmvを減算することにより動きベクトル残差MVDを生成する。動きベクトル冗長性削除部29は、生成した動きベクトル残差MVDを、選択した推定方法を示す推定動きベクトルインデックスPMVIと共に、予測方式制御部28に供給する。
デブロッキングフィルタ33は、局所復号画像Pにおけるブロック境界、またはCU境界を介して互いに隣接する画素の画素値の差が予め定められた閾値よりも小さい場合に、局所復号画像Pにおける当該ブロック境界、または当該CU境界に対してデブロッキング処理を施すことによって、当該ブロック境界、または当該CU境界付近の画像の平滑化を行う。デブロッキングフィルタ33によりデブロッキング処理が施された画像は、デブロック済復号画像P_DBとして、適応オフセットフィルタ80に出力される。
適応オフセットフィルタ80は、デブロッキングフィルタ33から供給されるデブロック済復号画像P_DBに対して、適応的オフセットフィルタ処理を施すことによってオフセットフィルタ済復号画像P_OFを生成する。生成されたオフセットフィルタ済復号画像P_OFは、適応フィルタ70に供給される。
適応フィルタ70は、適応オフセットフィルタ80から供給されるオフセットフィルタ済復号画像P_OFに対して、適応的なフィルタ処理を施すことによって、フィルタ済復号画像P_FLを生成する。適応フィルタ70によりフィルタ処理が施されたフィルタ済復号画像P_FLは、バッファメモリ24に格納される。適応フィルタ70によって用いられるフィルタ係数は、フィルタ済復号画像P_FLと符号化対象画像#10との誤差がより小さくなるように定められたものであり、このようにして定められたフィルタ係数がフィルタパラメータFPとして符号化され、動画像復号装置1に伝送される。
〔応用例〕
上述した動画像復号装置1および動画像符号化装置2は、動画像の送信、受信、記録、再生を行う各種装置に搭載して利用することができる。なお、動画像は、カメラ等により撮像された自然動画像であってもよいし、コンピュータ等により生成された人工動画像(CGおよびGUIを含む)であってもよい)。
まず、上述した動画像復号装置1および動画像符号化装置2を、動画像の送信及び受信に利用できることを、図29を参照して説明する。
図29(a)は、動画像符号化装置2を搭載した送信装置Aの構成を示したブロック図である。図29(a)に示すように、送信装置Aは、動画像を符号化することによって符号化データを得る符号化部A1と、符号化部A1が得た符号化データで搬送波を変調することによって変調信号を得る変調部A2と、変調部A2が得た変調信号を送信する送信部A3と、を備えている。上述した動画像符号化装置2は、この符号化部A1として利用される。
送信装置Aは、符号化部A1に入力する動画像の供給源として、動画像を撮像するカメラA4、動画像を記録した記録媒体A5、動画像を外部から入力するための入力端子A6、および画像を生成または加工する画像処理装置A7を更に備えていてもよい。図29(a)においては、これら全てを送信装置Aが備えた構成を例示しているが、一部を省略しても構わない。
なお、記録媒体A5は、符号化されていない動画像を記録したものであってもよいし、伝送用の符号化方式とは異なる記録用の符号化方式で符号化された動画像を記録したものであってもよい。後者の場合、記録媒体A5と符号化部A1との間に、記録媒体A5から読み出した符号化データを記録用の符号化方式に従って復号する復号部(不図示)を介在させるとよい。
図29(b)は、動画像復号装置1を搭載した受信装置Bの構成を示したブロック図である。図29(b)に示すように、受信装置Bは、変調信号を受信する受信部B1と、受信部B1が受信した変調信号を復調することによって符号化データを得る復調部B2と、復調部B2が得た符号化データを復号することによって動画像を得る復号部B3と、を備えている。上述した動画像復号装置1は、この復号部B3として利用される。
受信装置Bは、復号部B3が出力する動画像の供給先として、動画像を表示するディスプレイB4、動画像を記録するための記録媒体B5、及び、動画像を外部に出力するための出力端子B6を更に備えていてもよい。図29(b)においては、これら全てを受信装置Bが備えた構成を例示しているが、一部を省略しても構わない。
なお、記録媒体B5は、符号化されていない動画像を記録するためのものであってもよいし、伝送用の符号化方式とは異なる記録用の符号化方式で符号化されたものであってもよい。後者の場合、復号部B3と記録媒体B5との間に、復号部B3から取得した動画像を記録用の符号化方式に従って符号化する符号化部(不図示)を介在させるとよい。
なお、変調信号を伝送する伝送媒体は、無線であってもよいし、有線であってもよい。また、変調信号を伝送する伝送態様は、放送(ここでは、送信先が予め特定されていない送信態様を指す)であってもよいし、通信(ここでは、送信先が予め特定されている送信態様を指す)であってもよい。すなわち、変調信号の伝送は、無線放送、有線放送、無線通信、及び有線通信の何れによって実現してもよい。
例えば、地上デジタル放送の放送局(放送設備など)/受信局(テレビジョン受像機など)は、変調信号を無線放送で送受信する送信装置A/受信装置Bの一例である。また、ケーブルテレビ放送の放送局(放送設備など)/受信局(テレビジョン受像機など)は、変調信号を有線放送で送受信する送信装置A/受信装置Bの一例である。
また、インターネットを用いたVOD(Video On Demand)サービスや動画共有サービスなどのサーバ(ワークステーションなど)/クライアント(テレビジョン受像機、パーソナルコンピュータ、スマートフォンなど)は、変調信号を通信で送受信する送信装置A/受信装置Bの一例である(通常、LANにおいては伝送媒体として無線又は有線の何れかが用いられ、WANにおいては伝送媒体として有線が用いられる)。ここで、パーソナルコンピュータには、デスクトップ型PC、ラップトップ型PC、及びタブレット型PCが含まれる。また、スマートフォンには、多機能携帯電話端末も含まれる。
なお、動画共有サービスのクライアントは、サーバからダウンロードした符号化データを復号してディスプレイに表示する機能に加え、カメラで撮像した動画像を符号化してサーバにアップロードする機能を有している。すなわち、動画共有サービスのクライアントは、送信装置A及び受信装置Bの双方として機能する。
次に、上述した動画像復号装置1および動画像符号化装置2を、動画像の記録及び再生に利用できることを、図30を参照して説明する。
図30(a)は、上述した動画像復号装置1を搭載した記録装置Cの構成を示したブロック図である。図30(a)に示すように、記録装置Cは、動画像を符号化することによって符号化データを得る符号化部C1と、符号化部C1が得た符号化データを記録媒体Mに書き込む書込部C2と、を備えている。上述した動画像符号化装置2は、この符号化部C1として利用される。
なお、記録媒体Mは、(1)HDD(Hard Disk Drive)やSSD(Solid State Drive)などのように、記録装置Cに内蔵されるタイプのものであってもよいし、(2)SDメモリカードやUSB(Universal Serial Bus)フラッシュメモリなどのように、記録装置Cに接続されるタイプのものであってもよいし、(3)DVD(Digital Versatile Disc)やBD(Blu-ray Disc:登録商標)などのように、記録装置Cに内蔵されたドライブ装置(不図示)に装填されるものであってもよい。
また、記録装置Cは、符号化部C1に入力する動画像の供給源として、動画像を撮像するカメラC3、動画像を外部から入力するための入力端子C4、動画像を受信するための受信部C5、および、画像を生成または加工する画像処理装置C6を更に備えていてもよい。図30(a)においては、これら全てを記録装置Cが備えた構成を例示しているが、一部を省略しても構わない。
なお、受信部C5は、符号化されていない動画像を受信するものであってもよいし、記録用の符号化方式とは異なる伝送用の符号化方式で符号化された符号化データを受信するものであってもよい。後者の場合、受信部C5と符号化部C1との間に、伝送用の符号化方式で符号化された符号化データを復号する伝送用復号部(不図示)を介在させるとよい。
このような記録装置Cとしては、例えば、DVDレコーダ、BDレコーダ、HD(Hard Disk)レコーダなどが挙げられる(この場合、入力端子C4又は受信部C5が動画像の主な供給源となる)。また、カムコーダ(この場合、カメラC3が動画像の主な供給源となる)、パーソナルコンピュータ(この場合、受信部C5または画像処理装置C6が動画像の主な供給源となる)、スマートフォン(この場合、カメラC3又は受信部C5が動画像の主な供給源となる)なども、このような記録装置Cの一例である。
図30(b)は、上述した動画像復号装置1を搭載した再生装置Dの構成を示したブロックである。図30(b)に示すように、再生装置Dは、記録媒体Mに書き込まれた符号化データを読み出す読出部D1と、読出部D1が読み出した符号化データを復号することによって動画像を得る復号部D2と、を備えている。上述した動画像復号装置1は、この復号部D2として利用される。
なお、記録媒体Mは、(1)HDDやSSDなどのように、再生装置Dに内蔵されるタイプのものであってもよいし、(2)SDメモリカードやUSBフラッシュメモリなどのように、再生装置Dに接続されるタイプのものであってもよいし、(3)DVDやBDなどのように、再生装置Dに内蔵されたドライブ装置(不図示)に装填されるものであってもよい。
また、再生装置Dは、復号部D2が出力する動画像の供給先として、動画像を表示するディスプレイD3、動画像を外部に出力するための出力端子D4、及び、動画像を送信する送信部D5を更に備えていてもよい。図30(b)においては、これら全てを再生装置Dが備えた構成を例示しているが、一部を省略しても構わない。
なお、送信部D5は、符号化されていない動画像を送信するものであってもよいし、記録用の符号化方式とは異なる伝送用の符号化方式で符号化された符号化データを送信するものであってもよい。後者の場合、復号部D2と送信部D5との間に、動画像を伝送用の符号化方式で符号化する符号化部(不図示)を介在させるとよい。
このような再生装置Dとしては、例えば、DVDプレイヤ、BDプレイヤ、HDDプレイヤなどが挙げられる(この場合、テレビジョン受像機等が接続される出力端子D4が動画像の主な供給先となる)。また、テレビジョン受像機(この場合、ディスプレイD3が動画像の主な供給先となる)、デスクトップ型PC(この場合、出力端子D4又は送信部D5が動画像の主な供給先となる)、ラップトップ型又はタブレット型PC(この場合、ディスプレイD3又は送信部D5が動画像の主な供給先となる)、スマートフォン(この場合、ディスプレイD3又は送信部D5が動画像の主な供給先となる)、デジタルサイネージ(電子看板や電子掲示板等とも称され、ディスプレイD3又は送信部D5が動画像の主な供給先となる)なども、このような再生装置Dの一例である。
(ソフトウェアによる構成)
最後に、動画像復号装置1および動画像符号化装置2の各ブロック、特に可変長符号復号部13(PS情報復号部51)、動きベクトル復元部14、インター予測画像生成部16、イントラ予測画像生成部17、予測方式決定部18、逆量子化・逆変換部19、デブロッキングフィルタ41、適応フィルタ50、適応オフセットフィルタ60、変換・量子化部21、可変長符号符号化部22(PS情報符号化部55)、逆量子化・逆変換部23、イントラ予測画像生成部25、インター予測画像生成部26、動きベクトル検出部27、予測方式制御部28、動きベクトル冗長性削除部29、デブロッキングフィルタ33、適応フィルタ70、適応オフセットフィルタ80は、集積回路(ICチップ)上に形成された論理回路によってハードウェア的に実現していてもよいし、CPU(central processing unit)を用いてソフトウェア的に実現してもよい。
後者の場合、動画像復号装置1および動画像符号化装置2は、各機能を実現する制御プログラムの命令を実行するCPU、上記プログラムを格納したROM(read only memory)、上記プログラムを展開するRAM(random access memory)、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアである動画像復号装置1および動画像符号化装置2の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、上記の動画像復号装置1および動画像符号化装置2に供給し、そのコンピュータ(またはCPUやMPU(micro processing unit))が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。
上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ類、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM(compact disc read-only memory)/MOディスク(magneto-optical disc)/MD(Mini Disc)/DVD(digital versatile disc)/CD−R(CD Recordable)等の光ディスクを含むディスク類、ICカード(メモリカードを含む)/光カード等のカード類、マスクROM/EPROM(erasable programmable read-only memory)/EEPROM(electrically erasable and programmable read-only memory)/フラッシュROM等の半導体メモリ類、あるいはPLD(Programmable logic device)やFPGA(Field Programmable Gate Array)等の論理回路類などを用いることができる。
また、動画像復号装置1および動画像符号化装置2を通信ネットワークと接続可能に構成し、上記プログラムコードを通信ネットワークを介して供給してもよい。この通信ネットワークは、プログラムコードを伝送可能であればよく、特に限定されない。例えば、インターネット、イントラネット、エキストラネット、LAN(local area network)、ISDN(integrated services digital network)、VAN(value-added network)、CATV(community antenna television/cable television)通信網、仮想専用網(virtual private network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、この通信ネットワークを構成する伝送媒体も、プログラムコードを伝送可能な媒体であればよく、特定の構成または種類のものに限定されない。例えば、IEEE(institute of electrical and electronic engineers)1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL(asymmetric digital subscriber loop)回線等の有線でも、IrDA(infrared data association)やリモコンのような赤外線、Bluetooth(登録商標)、IEEE802.11無線、HDR(high data rate)、NFC(Near Field Communication)、DLNA(Digital Living Network Alliance)、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
本発明は上述した各実施の形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
本発明は、符号化データを復号する画像復号装置、および、符号化データを生成する画像符号化装置に好適に適用することができる。また、画像符号化装置によって生成され、画像復号装置によって参照される符号化データのデータ構造に好適に適用することができる。
1 動画像復号装置(画像復号装置、画像フィルタ装置)
2 動画像符号化装置(画像符号化装置、画像フィルタ装置)
22 可変長符号符号化部(符号化データ出力手段)
50 適応フィルタ(フィルタ手段)
51 PS情報復号部(復号手段)
55 PS情報符号化部(符号化データ出力手段)
60 適応オフセットフィルタ(フィルタ手段)
70 適応フィルタ(フィルタ手段)
80 適応オフセットフィルタ(フィルタ手段)

Claims (14)

  1. 復号した復号画像の単位領域ごとに、フィルタパラメータを用いてフィルタ処理を施すとともに、複数の上記単位領域で共通して用いられるフィルタパラメータをパラメータセットとして、該パラメータセットに含まれるフィルタパラメータを用いてフィルタ処理が施される上記単位領域よりも先に復号する画像復号装置であって、
    共通のフィルタパラメータを用いる上記単位領域群から成るフィルタ適用領域に含まれる画素に対し、当該フィルタパラメータを用いてフィルタ処理を施すフィルタ手段を備え、
    1つの上記パラメータセットには、複数の上記フィルタ適用領域それぞれで用いられるフィルタパラメータが格納されていることを特徴とする画像復号装置。
  2. 上記パラメータセットには、上記フィルタ適用領域が復号される順に、それぞれのフィルタ適用領域で用いられるフィルタパラメータが格納されていることを特徴とする請求項1に記載の画像復号装置。
  3. 上記フィルタ手段は、上記フィルタ適用領域に含まれる画素に対して用いるフィルタパラメータを特定する特定情報を用いて上記パラメータセットに格納されているフィルタパラメータを特定し、フィルタ処理を行うこと特徴とする請求項1に記載の画像復号装置。
  4. 復号した復号画像の単位領域ごとに、フィルタパラメータを用いてフィルタ処理を施すとともに、複数の上記単位領域で共通して用いられるフィルタパラメータをパラメータセットとして、該パラメータセットに含まれるフィルタパラメータを用いてフィルタ処理が施される上記単位領域よりも先に復号する画像復号装置であって、
    共通のフィルタパラメータを用いる上記単位領域群から成るフィルタ適用領域に含まれる画素に対し、当該フィルタパラメータを用いてフィルタ処理を施すフィルタ手段を備え、
    上記パラメータセットには、上記フィルタ適用領域の位置または大きさを示す情報が格納されていることを特徴とする画像復号装置。
  5. 上記パラメータセットには、上記フィルタ適用領域の位置を示す情報として、上記復号画像における上記フィルタ適用領域の開始位置が格納されていることを特徴とする請求項4に記載の画像復号装置。
  6. 上記パラメータセットには、上記フィルタ適用領域の大きさを示す情報として、上記フィルタ適用領域に含まれる上記単位領域の数が格納されていることを特徴とする請求項4または5に記載の画像復号装置。
  7. 上記パラメータセットには、上記フィルタ適用領域の大きさを示す情報として、上記単位領域それぞれについて、自単位領域を含むフィルタ適用領域における最後の単位領域であるか否かを示す終端情報が格納されていることを特徴とする請求項4または5に記載の画像復号装置。
  8. 復号した復号画像の単位領域ごとに、フィルタパラメータを用いてフィルタ処理を施すとともに、複数の上記単位領域で共通して用いられるフィルタパラメータをパラメータセットとして、該パラメータセットに含まれるフィルタパラメータを用いてフィルタ処理が施される上記単位領域よりも先に復号する画像復号装置であって、
    共通のフィルタパラメータを用いる上記単位領域群から成るフィルタ適用領域に含まれる画素に対し、該フィルタパラメータを用いてフィルタ処理を施すフィルタ手段を備え、
    上記フィルタ適用領域の境界が含まれる上記単位領域である境界単位領域が存在する場合、上記パラメータセットには、上記境界単位領域に対し、フィルタ処理を施すか否かを示すフィルタ処理情報が格納されていることを特徴とする画像復号装置。
  9. 復号した復号画像の単位領域ごとに、フィルタパラメータを用いてフィルタ処理を施すとともに、複数の上記単位領域で共通して用いられるフィルタパラメータをパラメータセットとして、該パラメータセットに含まれるフィルタパラメータを用いてフィルタ処理が施される上記単位領域よりも先に復号する画像復号装置であって、
    共通のフィルタパラメータを用いる上記単位領域群から成るフィルタ適用領域に含まれる画素に対し、該フィルタパラメータを用いてフィルタ処理を施すフィルタ手段を備え、
    上記フィルタ適用領域の境界が含まれる上記単位領域である境界単位領域が存在する場合、上記パラメータセットには、境界単位領域を含むフィルタ適用領域の大きさを、該境界単位領域を含まないように変更するフィルタ適用領域サイズ変更情報が格納されていることを特徴とする画像復号装置。
  10. 上記パラメータセットは、APS(Adaptation Parameter Set)であることを特徴とする請求項1〜9のいずれか1項に記載の画像復号装置。
  11. 復号した復号画像の単位領域ごとに、フィルタパラメータを用いてフィルタ処理を施す画像フィルタ装置であって、
    上記単位領域に対しフィルタ処理を施すために用いるフィルタパラメータを、該単位領域を復号した直後に復号する復号手段と、
    上記復号手段が復号したフィルタパラメータを用いて上記単位領域に対するフィルタ処理を施すフィルタ手段と、を備えていることを特徴とする画像フィルタ装置。
  12. 上記単位領域は、上記復号画像が復号される前に符号化されたときの単位である最大符号化単位LCU(Largest coding unit)であることを特徴とする請求項11に記載の画像フィルタ装置。
  13. 生成した予測画像と原画像との差分である予測残差を符号化することによって符号化データを生成する画像符号化装置であって、
    原画像を符号化し、復号した復号画像における、共通のフィルタパラメータを用いる単位領域群から成るフィルタ適用領域に含まれる画素に対し、当該フィルタパラメータを用いてフィルタ処理を施すフィルタ手段と、
    複数の上記単位領域で共通して用いられるフィルタパラメータをパラメータセットとして、用いられる単位領域よりも先行して出力する符号化データ出力手段と、を備え、
    1つの上記パラメータセットには、複数の上記フィルタ適用領域それぞれで用いられるフィルタパラメータが格納されていることを特徴とする画像符号化装置。
  14. 画像復号装置において、復号された復号画像に対し施されるフィルタのフィルタパラメータが格納された符号化データのデータ構造であって、
    上記画像復号装置は、復号した復号画像の単位領域ごとに、共通のフィルタパラメータを用いる上記単位領域群から成るフィルタ適用領域に含まれる画素に対し、当該フィルタパラメータを用いてフィルタ処理を施すものであり、
    上記符号化データには、複数の上記単位領域で共通して用いられるフィルタパラメータがパラメータセットとして含まれているとともに、1つの上記パラメータセットには、複数の上記フィルタ適用領域それぞれで用いられるフィルタパラメータが格納されていることを特徴とする符号化データのデータ構造。
JP2011289937A 2011-12-28 2011-12-28 画像復号装置、画像符号化装置、画像フィルタ装置、および符号化データのデータ構造 Pending JP2013141094A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011289937A JP2013141094A (ja) 2011-12-28 2011-12-28 画像復号装置、画像符号化装置、画像フィルタ装置、および符号化データのデータ構造

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011289937A JP2013141094A (ja) 2011-12-28 2011-12-28 画像復号装置、画像符号化装置、画像フィルタ装置、および符号化データのデータ構造

Publications (1)

Publication Number Publication Date
JP2013141094A true JP2013141094A (ja) 2013-07-18

Family

ID=49038181

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011289937A Pending JP2013141094A (ja) 2011-12-28 2011-12-28 画像復号装置、画像符号化装置、画像フィルタ装置、および符号化データのデータ構造

Country Status (1)

Country Link
JP (1) JP2013141094A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015098231A1 (ja) * 2013-12-27 2015-07-02 ソニー株式会社 画像処理装置及び画像処理方法
WO2015151791A1 (ja) * 2014-03-31 2015-10-08 ソニー株式会社 画像復号装置および方法
JP2018110313A (ja) * 2016-12-28 2018-07-12 富士通株式会社 動画像符号化装置、動画像符号化方法、動画像符号化用コンピュータプログラム、動画像復号装置及び動画像復号方法ならびに動画像復号用コンピュータプログラム
CN113170237A (zh) * 2018-09-28 2021-07-23 中兴通讯股份有限公司 视频编码与解码方法和设备
JP2021532622A (ja) * 2018-07-11 2021-11-25 インターデジタル ヴイシー ホールディングス, インコーポレイテッド 複数の領域を有するループ内フィルタ
CN114846789A (zh) * 2020-02-28 2022-08-02 华为技术有限公司 用于指示条带的图像分割信息的解码器及对应方法
JP2024527082A (ja) * 2021-07-27 2024-07-19 ベイジン ダージャー インターネット インフォメーション テクノロジー カンパニー リミテッド クロスコンポーネントサンプル適応オフセットにおける符号化復号化強化

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015098231A1 (ja) * 2013-12-27 2015-07-02 ソニー株式会社 画像処理装置及び画像処理方法
WO2015151791A1 (ja) * 2014-03-31 2015-10-08 ソニー株式会社 画像復号装置および方法
US10440397B2 (en) 2014-03-31 2019-10-08 Sony Corporation Image decoding device and method
US10779009B2 (en) 2014-03-31 2020-09-15 Sony Corporation Image decoding device and method
JP2018110313A (ja) * 2016-12-28 2018-07-12 富士通株式会社 動画像符号化装置、動画像符号化方法、動画像符号化用コンピュータプログラム、動画像復号装置及び動画像復号方法ならびに動画像復号用コンピュータプログラム
JP2021532622A (ja) * 2018-07-11 2021-11-25 インターデジタル ヴイシー ホールディングス, インコーポレイテッド 複数の領域を有するループ内フィルタ
JP7702786B2 (ja) 2018-07-11 2025-07-04 インターデジタル ヴイシー ホールディングス, インコーポレイテッド 複数の領域を有するループ内フィルタ
CN113170237A (zh) * 2018-09-28 2021-07-23 中兴通讯股份有限公司 视频编码与解码方法和设备
US11589047B2 (en) 2018-09-28 2023-02-21 Zte Corporation Video encoding and decoding methods and apparatus
CN113170237B (zh) * 2018-09-28 2023-02-28 中兴通讯股份有限公司 视频编码与解码方法和设备
CN114846789A (zh) * 2020-02-28 2022-08-02 华为技术有限公司 用于指示条带的图像分割信息的解码器及对应方法
CN114846789B (zh) * 2020-02-28 2023-06-27 华为技术有限公司 用于指示条带的图像分割信息的解码器及对应方法
US12088820B2 (en) 2020-02-28 2024-09-10 Huawei Technologies Co., Ltd. Decoder and corresponding methods to signal picture partitioning information for slices
US12316858B2 (en) 2020-02-28 2025-05-27 Huawei Technologies Co., Ltd. Decoder and corresponding methods to signal picture partitioning information for slices
JP2024527082A (ja) * 2021-07-27 2024-07-19 ベイジン ダージャー インターネット インフォメーション テクノロジー カンパニー リミテッド クロスコンポーネントサンプル適応オフセットにおける符号化復号化強化

Similar Documents

Publication Publication Date Title
US12149735B2 (en) Image decoding device, image encoding device, and image decoding method
US11223842B2 (en) Image decoding device, image decoding method, and image encoding device
US10547861B2 (en) Image decoding device
JP2019126077A (ja) 画像フィルタ装置、フィルタ方法および動画像復号装置
JP2013236358A (ja) 画像フィルタ装置、画像復号装置、画像符号化装置、およびデータ構造
WO2017195532A1 (ja) 画像復号装置及び画像符号化装置
JP2013141094A (ja) 画像復号装置、画像符号化装置、画像フィルタ装置、および符号化データのデータ構造
JP2013192118A (ja) 算術復号装置、画像復号装置、算術符号化装置、および画像符号化装置
WO2012077719A1 (ja) 画像復号装置、および画像符号化装置
WO2013046990A1 (ja) オフセット復号装置、オフセット符号化装置、画像フィルタ装置、および、データ構造
JP2013223050A (ja) フィルタ装置、復号装置、および符号化装置
WO2012121352A1 (ja) 動画像復号装置、動画像符号化装置、および、データ構造
JP2014176039A (ja) 画像復号装置、および画像符号化装置
WO2013018737A1 (ja) 画像フィルタ装置、復号装置、符号化装置、および、データ構造
JP2013251827A (ja) 画像フィルタ装置、画像復号装置、画像符号化装置、およびデータ構造
WO2012081706A1 (ja) 画像フィルタ装置、フィルタ装置、復号装置、符号化装置、および、データ構造
WO2012147947A1 (ja) 画像復号装置、および画像符号化装置
WO2012043676A1 (ja) 復号装置、符号化装置、および、データ構造
HK1200255B (zh) 图像解码装置、图像编码装置