WO2014007131A1

WO2014007131A1 - 画像復号装置、および画像符号化装置

Info

Publication number: WO2014007131A1
Application number: PCT/JP2013/067618
Authority: WO
Inventors: 将伸八杉; 山本　智幸
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 2012-07-03
Filing date: 2013-06-27
Publication date: 2014-01-09
Anticipated expiration: 2015-01-03
Also published as: JP2015167267A

Description

画像復号装置、および画像符号化装置

　本発明は、画像が階層的に符号化された階層符号化データを復号する画像復号装置、および画像を階層的に符号化することによって階層符号化データを生成する画像符号化装置に関する。

　通信システムで伝送される情報、あるいは蓄積装置に記録される情報の１つに画像あるいは動画像がある。従来、これらの画像（以降、動画像を含む）の伝送・蓄積のため、画像を符号化する技術が知られている。

　動画像符号化方式としては、Ｈ．２６４／ＭＰＥＧ－４．ＡＶＣや、その後継コーデックであるＨＥＶＣ（High-Efficiency Video Coding）が知られている（非特許文献１）。

　これらの動画像符号化方式では、通常、入力画像を符号化／復号することによって得られる局所復号画像に基づいて予測画像が生成され、当該予測画像を入力画像（原画像）から減算して得られる予測残差（「差分画像」または「残差画像」と呼ぶこともある）が符号化される。また、予測画像の生成方法としては、画面間予測（インター予測）、および、画面内予測（イントラ予測）が挙げられる。

　イントラ予測においては、同一フレーム内の局所復号画像に基づいて、当該フレームにおける予測画像が順次生成される。

　インター予測については、フレーム間の動き補償により予測画像が生成される。動き補償に関する情報（動き補償パラメータ）は、たいていの場合、符号量の削減のため直接符号化されない。そこで、インター予測では、対象ブロック周辺の復号状況等に基づく動き補償パラメータの推定が行われる。

　また、近年、必要なデータレートに従って、画像を階層的に符号化する階層符号化技術が提案されている。

　階層符号化の方式としては、ＩＳＯ／ＩＥＣとＩＴＵ－Ｔの標準としてＨ．２６４／ＡＶＣ　Ａｎｎｅｘ　Ｇ　Ｓｃａｌａｂｌｅ　Ｖｉｄｅｏ　Ｃｏｄｉｎｇ（ＳＶＣ）が挙げられる。

　ＳＶＣでは空間スケーラビリティ、時間スケーラビリティ、ＳＮＲスケーラビリティをサポートする。例えば空間スケーラビリティの場合、原画像から所望の解像度にダウンサンプリングした画像を下位レイヤとしてＨ．２６４／ＡＶＣで符号化する。次に上位レイヤではレイヤ間の冗長性を除去するためにレイヤ間予測を行う。

　レイヤ間予測としては、動き予測に関する情報を同時刻の下位レイヤの情報から予測する動き情報予測、あるいは同時刻の下位レイヤの復号画像をアップサンプリングした画像から予測するテクスチャ予測がある（非特許文献２）。上記動き情報予測では、参照レイヤの動き情報を推定値として動き情報が符号化される。

　図３０は、レイヤ間予測のために参照されるシンタックスを示す図であって、（ａ）は、スライスヘッダに含まれるシンタックスを示しており、（ｂ）は、マクロブロックレイヤ含まれるシンタックスを示している。

　図３０（ａ）に示すシンタックスadaptive_base_mode_flagは、ベースモードフラグ（base_mode_flag）をマクロブロック毎に符号化するか否かを指定するフラグであり、default_base_mode_flagは、ベースモードフラグの初期値を指定するためのフラグである。

　図３０（ｂ）に示すベースモードフラグbase_mode_flagは、レイヤ間予測を行うか否かをマクロブロック毎に指定するフラグである。

「High efficiency video coding (HEVC) text specification draft 7（JCTVC-I1003_d1）」, Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 9th Meeting: Geneva, CH, 27 April - 7 May 2012（２０１２年４月公開） ITU-T H.264 「Advanced video coding for generic audiovisual services」（２００７年１１月公開）

　図３０（ｂ）に示すような、レイヤ間予測を行うか否かを指定するフラグを用いた場合、このフラグに起因して符号量が増大する場合があり、期待されるほど符号化効率が向上しないという問題があった。

　本発明は、上記問題に鑑みてされたものであり、その目的は、階層符号化方式において、より効果的に符号化効率の向上を図ることのできる画像復号装置および画像符号化装置を実現することにある。

　上記課題を解決するために、本発明に係る画像復号装置は、階層符号化された符号化データに含まれる上位レイヤの符号化データを復号し、下位レイヤからの復号画像を参照して生成した上位レイヤの予測画像を用いて上位レイヤの復号画像を復元する画像復号装置であって、符号化データを参照し、予め定められた複数のイントラ予測モードの少なくとも一部を含む予測モード群から、一の予測モードを選択する選択手段と、上記選択手段によって選択された予測モードに基づいて、上位レイヤにおける対象予測単位の予測画像を生成する予測画像生成手段とを備え、上記予測モード群には、上位レイヤにおける対象予測単位の予測画像を、下位レイヤにおける、時間的に該対象予測単位と同時刻に位置する予測単位であって、空間的に該対象予測単位に対応する位置に配置された予測単位である参照予測単位の復号画像に基づいて生成するイントラレイヤ間予測モードが含まれており、上記選択手段は、符号化データに含まれるシンタックスであって、上記イントラレイヤ間予測モードと上記複数のイントラ予測モードとに関する共通のシンタックスを参照することによって、一の予測モードを選択することを特徴としている。

　上記のように構成された画像復号装置によれば、予測モード群には、上位レイヤにおける対象予測単位の予測画像を、下位レイヤにおける、時間的に該対象予測単位と同時刻に位置する予測単位であって、空間的に該対象予測単位に対応する位置に配置された予測単位である参照予測単位の復号画像に基づいて生成するイントラレイヤ間予測モードが含まれており、上記選択手段は、当該予測モード群から一の予測モードを選択する。

　したがって、上記画像復号装置によれば、下位レイヤにおける復号画像に基づいて、上位レイヤにおける予測画像を生成することができるので、高い符号化効率を実現できる。

　さらに、上記画像復号装置において、上記選択手段は、符号化データに含まれるシンタックスであって、上記イントラレイヤ間予測モードと上記複数のイントラ予測モードとに関する共通のシンタックスを参照することによって、一の予測モードを選択する。換言すれば、上記選択手段は、上記イントラレイヤ間予測モードを用いるか否かを指定する択一的なフラグを参照することなく、イントラレイヤ間予測モードを選択することができる。

　このため、上記画像復号装置によれば、符号化データに含まれる符号量の増大を抑制することができるので、符号化効率の向上を図ることができる。

　なお、上記予測単位とは、例えば、階層的ツリーブロック構造において、ＰＵ（Prediction Unit）と称される単位のことを指すが、これに限定されるものではなく、ＣＵ（Coding Unit）と呼ばれる単位であってもよいし、ＴＵ（Transform Unit）と呼ばれる単位であってもよい。

　上記画像復号装置において、上記予測モード群には、上記予め定められた複数のイントラ予測モードの何れか１つの予測モードに代えて、上記イントラレイヤ間予測モードが含まれている、ことが好ましい。

　上記の構成によれば、上記予測モード群には、上記予め定められた複数のイントラ予測モードの何れか１つの予測モードに代えて、上記イントラレイヤ間予測モードが含まれているので、予測モードの総数を増大させることなく、イントラレイヤ間予測モードを選択可能な構成が実現できる。

　したがって、上記の構成によれば、符号量の増大を抑制しつつ、イントラレイヤ間予測モードを選択可能な構成が実現できる。

　また、上記画像復号装置において、上記予測モード群には、上記予め定められた複数のイントラ予測モードに加えて、上記イントラレイヤ間予測モードが含まれていることが好ましい。

　上記の構成よれば、上記予測モード群には、上記予め定められた複数のイントラ予測モードに加えて、上記イントラレイヤ間予測モードが含まれているので、符号化効率の向上を図ることができる。

　また、上記画像復号装置において、上記予測モード群には、上記イントラレイヤ間予測モードが複数種類含まれており、上記選択手段は、上記複数種類のイントラレイヤ間予測モードの何れかを、符号化データに含まれるフラグを参照することによって選択する、ことが好ましい。

　上記の構成によれば、上記予測モード群には、上記イントラレイヤ間予測モードが複数種類含まれており、上記選択手段は、上記複数種類のイントラレイヤ間予測モードの何れかを、符号化データに含まれるフラグを参照することによって選択するので、予測精度の更なる向上を図ることができる。

　また、上記画像復号装置において、上記予測モード群には、上記イントラレイヤ間予測モードが複数種類含まれており、上記選択手段は、符号化データに含まれるシンタックスであって、上記複数種類のイントラレイヤ間予測モードと上記複数のイントラ予測モードとに関する共通のシンタックスを参照することによって、一の予測モードを選択する、ことが好ましい。

　上記の構成によれば、上記予測モード群には、上記イントラレイヤ間予測モードが複数種類含まれており、上記選択手段は、符号化データに含まれるシンタックスであって、上記複数種類のイントラレイヤ間予測モードと上記複数のイントラ予測モードとに関する共通のシンタックスを参照することによって、一の予測モードを選択するので、予測精度の更なる向上を図ることができる。

　また、発明に係る画像復号装置は、階層符号化された符号化データに含まれる上位レイヤの符号化データを復号し、下位レイヤからの復号画像を参照して生成した上位レイヤの予測画像を用いて上位レイヤの復号画像を復元する画像復号装置であって、符号化データを参照し、予め定められた複数のイントラ予測モードの少なくとも一部を含む予測モード群から、一の予測モードを選択する選択手段と、上記選択手段によって選択された予測モードに基づいて、上位レイヤにおける対象予測単位の予測画像を生成する予測画像生成手段とを備え、上記予測モード群には、上位レイヤにおける対象予測単位の予測画像を、下位レイヤにおける、時間的に該対象予測単位と同時刻に位置する予測単位であって、空間的に該対象予測単位に対応する位置に配置された予測単位である参照予測単位の復号画像に基づいて生成するイントラレイヤ間予測モードが含まれており、上記選択手段は、符号化データに含まれるシンタックスであって、上記イントラレイヤ間予測モードを選択するか否かを示すフラグを参照することによって、一の予測モードを選択することを特徴としている。

　上記画像復号装置において、上記予測モード群に含まれる予測モードは、輝度に関する予測モードであり、上記選択手段は、輝度に関する予測モードとして上記イントラレイヤ間予測モードを選択した場合、色差に関する予測モードとして、上位レイヤにおける対象予測単位の予測画像を、下位レイヤにおける、時間的に該対象予測単位と同時刻に位置する予測単位であって、空間的に該対象予測単位に対応する位置に配置された予測単位である参照予測単位の復号画像に基づいて生成するイントラレイヤ間予測モードを選択することが好ましい。

　上記の構成によれば、上記予測モード群に含まれる予測モードは、輝度に関する予測モードであり、上記選択手段は、輝度に関する予測モードとして上記イントラレイヤ間予測モードを選択した場合、色差に関する予測モードとしても、イントラレイヤ間予測モードを選択するので、色差に関する予測画像の予測精度を向上させることができる。

　また、上記画像復号装置において、上記予測モード群に含まれる予測モードは、輝度に関する予測モードであり、色差に関する予測モード群には、輝度に関して選択された予測モードと同一の予測モードを用いるモードであるＤＭモードが含まれており、上記選択手段は、上記ＤＭモードを仮選択した場合、符号化データに含まれるフラグの値を参照し、色差に関する予測モードとして、上記ＤＭモードを実際に選択するのか、それとも、上位レイヤにおける対象予測単位の予測画像を、下位レイヤにおける、時間的に該対象予測単位と同時刻に位置する予測単位であって、空間的に該対象予測単位に対応する位置に配置された予測単位である参照予測単位の復号画像に基づいて生成するイントラレイヤ間予測モードを選択するのかを決定することが好ましい。

　上記の構成によれば、上記予測モード群に含まれる予測モードは、輝度に関する予測モードであり、色差に関する予測モード群には、輝度に関して選択された予測モードと同一の予測モードを用いるモードであるＤＭモードが含まれており、上記選択手段は、上記ＤＭモードを仮選択した場合、符号化データに含まれるフラグの値を参照し、色差に関する予測モードとして、上記ＤＭモードを実際に選択するのか、それとも、上位レイヤにおける対象予測単位の予測画像を、下位レイヤにおける、時間的に該対象予測単位と同時刻に位置する予測単位であって、空間的に該対象予測単位に対応する位置に配置された予測単位である参照予測単位の復号画像に基づいて生成するイントラレイヤ間予測モードを選択するのかを決定するので、色差に関する予測画像の予測精度を向上させることができる。

　また、上記画像復号装置において、上記予測モード群に含まれる予測モードは、輝度に関する予測モードであり、色差に関する予測モード群には、輝度に関して選択された予測モードと同一の予測モードを用いるモードであるＤＭモードが含まれており、上記選択手段は、上記ＤＭモードを仮選択した場合、色差に関する予測モードとして、上位レイヤにおける対象予測単位の予測画像を、下位レイヤにおける、時間的に該対象予測単位と同時刻に位置する予測単位であって、空間的に該対象予測単位に対応する位置に配置された予測単位である参照予測単位の復号画像に基づいて生成するイントラレイヤ間予測モードを選択することが好ましい。

　上記の構成によれば、上記予測モード群に含まれる予測モードは、輝度に関する予測モードであり、色差に関する予測モード群には、輝度に関して選択された予測モードと同一の予測モードを用いるモードであるＤＭモードが含まれており、上記選択手段は、上記ＤＭモードを仮選択した場合、色差に関する予測モードとして、上位レイヤにおける対象予測単位の予測画像を、下位レイヤにおける、時間的に該対象予測単位と同時刻に位置する予測単位であって、空間的に該対象予測単位に対応する位置に配置された予測単位である参照予測単位の復号画像に基づいて生成するイントラレイヤ間予測モードを選択するので、色差に関する予測画像の予測精度を向上させることができる。

　本発明に係る画像復号装置は、階層符号化された符号化データに含まれる上位レイヤの符号化データを復号し、下位レイヤからの復号画像を参照して生成した上位レイヤの予測画像を用いて上位レイヤの復号画像を復元する画像復号装置であって、予め定められた複数のイントラ予測モードを含む予測モード群から一の予測モードを選択する選択手段と、上記選択手段によって選択された予測モードに基づいて、上位レイヤの対象予測単位における予測画像を生成する予測画像生成手段とを備え、上記予測モード群には、上位レイヤにおける対象予測単位と同時刻に位置する下位レイヤの予測単位であって、空間的に該対象予測単位に対応する位置に配置された予測単位である参照予測単位に対して選択されたイントラ予測モードが含まれている、ことを特徴としている。

　発明者の知見によれば、上記レイヤにおける対象予測単位と、下位レイヤにおける参照予測単位とでは、解像度が異なったとしても、同様の予測方向を有している可能性が高い。

　上記のように構成された画像復号装置によれば、予測モード群には、上位レイヤにおける対象予測単位と同時刻に位置する下位レイヤの予測単位であって、空間的に該対象予測単位に対応する位置に配置された予測単位である参照予測単位に対して選択されたイントラ予測モードが含まれており、上記選択手段は、当該予測モード群から一の予測モードを選択するので、符号化効率の向上を図ることができる。

　また、本発明に係る画像復号装置において、上記選択手段は、上記予め定められた複数のイントラ予測モードの一部を含むように設定された推定予測モード群であって、上記対象予測単位の周辺の予測単位に割り付けられた予測モードに応じて定まる推定予測モード群から、一の予測モードを選択するものであり、上記推定予測モード群は、上記参照予測単位に対して選択されたイントラ予測モードを含むように設定されている、ことが好ましい。

　上記の構成によれば、上記推定予測モード群は、上記参照予測単位に対して選択されたイントラ予測モードを含むように設定されているので、上記参照予測単位に対して選択されたイントラ予測モードを好適に活用して、上位レイヤにおける予測画像を生成することができる。したがって、上記構成によれば、符号化効率の向上を図ることができる。

　また、本発明に係る画像復号装置において、上記推定予測モード群に含まれる推定予測モードは、インデックスによって互いに識別されるものであり、上記推定予測モード群に含まれる上記参照予測単位に対して選択されたイントラ予測モードには、予め定められたインデックスが付されている、ことが好ましい。

　上記の構成によれば、上記推定予測モード群に含まれる推定予測モードは、インデックスによって互いに識別されるものであり、上記推定予測モード群に含まれる上記参照予測単位に対して選択されたイントラ予測モードには、固定的なインデックスが付されているので、上記参照予測単位に対して選択されたイントラ予測モードが選択される頻度が向上し、符号化効率の向上を図ることができる。

　また、本発明に係る画像復号装置において、上記対象予測単位が、符号化単位において処理順で特定の位置を有する予測単位である場合に限って、上記予測モード群には、上記参照予測単位に対して選択されたイントラ予測モードが含まれている、ことが好ましい。

　上記の構成によれば、上記対象予測単位が、符号化単位において処理順で特定の位置を有する予測単位である場合に限って、上記予測モード群には、上記参照予測単位に対して選択されたイントラ予測モードが含まれているので、上記参照予測単位に対して選択されたイントラ予測モードを保持するためのメモリを削減することができる。

　本発明に係る画像符号化装置は、原画像から下位レイヤからの復号画像を参照して生成した上位レイヤの予測画像を減算して得られる残差を階層符号化して上位レイヤの符号化データを生成する画像符号化装置であって、予め定められた複数のイントラ予測モードの少なくとも一部を含む予測モード群から、一の予測モードを選択する選択手段と、上記選択手段によって選択された予測モードに基づいて、上位レイヤにおける対象予測単位の予測画像を生成する予測画像生成手段とを備え、上記予測モード群には、上位レイヤにおける対象予測単位の予測画像を、下位レイヤにおける、時間的に該対象予測単位と同時刻に位置する予測単位であって、空間的に該対象予測単位に対応する位置に配置された予測単位である参照予測単位の復号画像に基づいて生成するイントラレイヤ間予測モードが含まれており、上記イントラレイヤ間予測モードと、上記複数のイントラ予測モードとは、共通のシンタックスを用いて指定されている、ことを特徴とする。

　上記のように構成された画像符号化装置によれば、予測モード群には、上位レイヤにおける対象予測単位の予測画像を、下位レイヤにおける、時間的に該対象予測単位と同時刻に位置する予測単位であって、空間的に該対象予測単位に対応する位置に配置された予測単位である参照予測単位の復号画像に基づいて生成するイントラレイヤ間予測モードが含まれており、上記選択手段は、当該予測モード群から一の予測モードを選択する。

　したがって、上記画像符号化装置によれば、下位レイヤにおける復号画像に基づいて、上位レイヤにおける予測画像を生成することができるので、高い符号化効率を実現できる。

　さらに、上記画像符号化装置において、上記選択手段は、符号化データに含まれるシンタックスであって、上記イントラレイヤ間予測モードと上記複数のイントラ予測モードとに関する共通のシンタックスを参照することによって、一の予測モードを選択する。換言すれば、上記選択手段は、上記イントラレイヤ間予測モードを用いるか否かを指定する択一的なフラグを参照することなく、イントラレイヤ間予測モードを選択することができる。

　このため、上記画像符号化装置によれば、符号化データに含まれる符号量の増大を抑制することができるので、符号化効率の向上を図ることができる。

　以上のように、本発明に係る画像復号装置は、階層符号化された符号化データに含まれる上位レイヤの符号化データを復号し、下位レイヤからの復号画像を参照して生成した上位レイヤの予測画像を用いて上位レイヤの復号画像を復元する画像復号装置であって、符号化データを参照し、予め定められた複数のイントラ予測モードの少なくとも一部を含む予測モード群から、一の予測モードを選択する選択手段と、上記選択手段によって選択された予測モードに基づいて、上位レイヤにおける対象予測単位の予測画像を生成する予測画像生成手段とを備え、上記予測モード群には、上位レイヤにおける対象予測単位の予測画像を、下位レイヤにおける、時間的に該対象予測単位と同時刻に位置する予測単位であって、空間的に該対象予測単位に対応する位置に配置された予測単位である参照予測単位の復号画像に基づいて生成するイントラレイヤ間予測モードが含まれており、上記選択手段は、符号化データに含まれるシンタックスであって、上記イントラレイヤ間予測モードと上記複数のイントラ予測モードとに関する共通のシンタックスを参照することによって、一の予測モードを選択する。

　上記画像復号装置によれば、符号化効率の向上を図ることができる。

本発明の一実施形態に係る階層動画像復号装置に含まれる予測パラメータ復元部の構成について例示する機能ブロック図である。本発明の実施形態に係る階層符号化データのレイヤ構造を説明するための図であって、（ａ）は、階層動画像符号化装置側について示しており、（ｂ）は、階層動画像復号装置側について示している。本発明の実施形態に係る階層符号化データの構成を説明するための図であって、（ａ）は、シーケンスＳＥＱを規定するシーケンスレイヤを示しており、（ｂ）は、ピクチャＰＩＣＴを規定するピクチャレイヤを示しており、（ｃ）は、スライスＳを規定するスライスレイヤを示しており、（ｄ）は、ツリーブロック（Tree block）ＴＢＬＫを規定するツリーブロックレイヤを示しており、（ｅ）は、ツリーブロックＴＢＬＫに含まれる符号化単位（Coding Unit；ＣＵ）を規定するＣＵレイヤを示している。ＰＵ分割タイプのパターンを示す図であり、（ａ）～（ｈ）は、それぞれ、ＰＵ分割タイプが、２Ｎ×Ｎ、２Ｎ×ｎＵ、２Ｎ×ｎＤ、２Ｎ×Ｎ、２Ｎ×ｎＵ、および、２Ｎ×ｎＤの場合のパーティション形状について示している。上記階層動画像復号装置の概略的構成を示す機能ブロック図である。上記階層動画像復号装置が備えるイントラ予測モード復元部の構成を示す機能ブロック図である。上記階層動画像復号装置におけるＭＰＭ導出処理を説明するための図であって、対象ＰＵ（ＲＴ）、左隣接ＰＵ（ＮＡ）、及び上隣接ＰＵ（ＮＢ）を示す図である。上記階層動画像復号装置がイントラ予測モードを復号するために参照するシンタックスの例を示す図である。上記階層動画像復号装置において利用可能なイントラ予測の方向について示す図である。イントラ予測モードと、当該イントラ予測モードに対応付けられている名前とを示す図である。色差予測モードを導出するために参照されるテーブルの一例を示す図であり、（ａ）は、色差予測モードにＬＭモードが含まれている場合のテーブルを示しており、（ｂ）は、色差予測モードにＬＭモードが含まれていない場合のテーブルを示している。上記階層動画像復号装置が備えるテクスチャ復元部の概略的構成を示す機能ブロック図である。上記階層動画像復号装置が備えるベース復号部の概略的構成を示す機能ブロック図である。上記階層動画像復号装置によるイントラレイヤ間予測を模式的に示す図である。イントラレイヤ間予測の第１の例に係るイントラ予測パラメータに含まれるシンタックスを示す図である。イントラレイヤ間予測の第２の例に係るイントラ予測モード（Intra prediction mode）を示す図である。イントラレイヤ間予測の第３の例に係るイントラ予測モード（Intra prediction mode）を示す図である。イントラレイヤ間予測の第４の例に係るイントラ予測パラメータに含まれるシンタックスを示す図である。イントラレイヤ間予測の第４の例に係るイントラ予測モード（Intra prediction mode）を示す図である。イントラレイヤ間予測の第５の例に係るイントラ予測パラメータに含まれるシンタックスの一例を示す図である。イントラレイヤ間予測の第５の例に係るイントラ予測パラメータに含まれるシンタックスの他の例を示す図である。イントラレイヤ間予測の第６の例に係るイントラ予測パラメータに含まれるシンタックスの一例を示す図である。イントラレイヤ間予測の第６の例に係るイントラ予測パラメータに含まれるシンタックスの他の例を示す図である。イントラレイヤ間予測の第７の例に係る色差予測モードを導出するために参照されるテーブルを示す図であり、（ａ）は、色差予測モードにＬＭモードが含まれている場合のテーブルを示しており、（ｂ）は、色差予測モードにＬＭモードが含まれていない場合のテーブルを示している。本発明の一実施形態に係る階層動画像符号化装置の概略的構成を示す機能ブロック図である。上記階層動画像符号化装置が備える予測パラメータ復元部の概略的構成を示す機能ブロック図である。上記階層動画像符号化装置において利用可能なイントラ予測の方向について示す図である。上記階層動画像符号化装置を搭載した送信装置、および、上記階層動画像復号装置を搭載した受信装置の構成について示した図である。（ａ）は、階層動画像符号化装置を搭載した送信装置を示しており、（ｂ）は、階層動画像復号装置を搭載した受信装置を示している。上記階層動画像符号化装置を搭載した記録装置、および、上記階層動画像復号装置を搭載した再生装置の構成について示した図である。（ａ）は、階層動画像符号化装置を搭載した記録装置を示しており、（ｂ）は、階層動画像復号装置を搭載した再生装置を示している。従来例に係るレイヤ間予測において参照されるシンタックスを示す図であって、（ａ）は、スライスヘッダに含まれるシンタックスを示しており、（ｂ）は、マクロブロックレイヤ含まれるシンタックスを示している。

　図１～図３０に基づいて、本発明の一実施形態に係る階層動画像復号装置１および階層動画像符号化装置２について説明すれば以下のとおりである。
〔概要〕
　本実施の形態に係る階層動画像復号装置（画像復号装置）１は、階層動画像符号化装置（画像符号化装置）２によってスケーラブル映像符号化（ＳＶＣ；Scalable Video Coding）された符号化データを復号する。スケーラブル映像符号化とは、動画像を低品質のものから高品質のものにかけて階層的に符号化する符号化方式のことである。スケーラブル映像符号化は、例えば、Ｈ．２６４／ＡＶＣ　ＡｎｎｅｘＧ　ＳＶＣにおいて標準化されている。なお、ここでいう動画像の品質とは、主観的および客観的な動画像の見栄えに影響する要素のことを広く意味する。動画像の品質には、例えば、“解像度”、“フレームレート”、“画質”、および、“画素の表現精度”が含まれる。よって、以下、動画像の品質が異なるといえば、例示的には、“解像度”等が異なることを指すが、これに限られない。例えば、異なる量子化ステップで量子化された動画像の場合（すなわち、異なる符号化雑音により符号化された動画像の場合）も互いに動画像の品質が異なるといえる。

　また、ＳＶＣは、階層化される情報の種類の観点から、（１）空間スケーラビリティ、（２）時間スケーラビリティ、および（３）ＳＮＲ（Signal to Noise Ratio）スケーラビリティに分類されることもある。空間スケーラビリティとは、解像度や画像のサイズにおいて階層化する技術である。時間スケーラビリティとは、フレーム・レート（単位時間のフレーム数）において階層化する技術である。また、ＳＮＲスケーラビリティは、符号化雑音において階層化する技術である。

　本実施形態に係る階層動画像符号化装置２及び階層動画像復号装置１の詳細な説明に先立って、まず（１）階層動画像符号化装置２によって生成され、階層動画像復号装置１によって復号される階層符号化データのレイヤ構造について説明し、次いで（２）各レイヤで採用できるデータ構造の具体例について説明を行う。

　〔階層符号化データのレイヤ構造〕
　ここで、図２を用いて、階層符号化データの符号化および復号について説明すると次のとおりである。図２は、動画像を、下位階層Ｌ３、中位階層Ｌ２、および上位階層Ｌ１の３階層により階層的に符号化／復号する場合について模式的に表す図である。つまり、図２（ａ）および（ｂ）に示す例では、３階層のうち、上位階層Ｌ１が最上位層となり、下位階層Ｌ３が最下位層となる。

　以下において、階層符号化データから復号され得る特定の品質に対応する復号画像は、特定の階層の復号画像（または、特定の階層に対応する復号画像）と称される（例えば、上位階層Ｌ１の復号画像ＰＯＵＴ＃Ａ）。

　図２（ａ）は、入力画像ＰＩＮ＃Ａ～ＰＩＮ＃Ｃをそれぞれ階層的に符号化して符号化データＤＡＴＡ＃Ａ～ＤＡＴＡ＃Ｃを生成する階層動画像符号化装置２＃Ａ～２＃Ｃを示している。図２（ｂ）は、階層的に符号化された符号化データＤＡＴＡ＃Ａ～ＤＡＴＡ＃Ｃをそれぞれ復号して復号画像ＰＯＵＴ＃Ａ～ＰＯＵＴ＃Ｃを生成する階層動画像復号装置１＃Ａ～１＃Ｃを示している。

　まず、図２（ａ）を用いて、符号化装置側について説明する。符号化装置側の入力となる入力画像ＰＩＮ＃Ａ、ＰＩＮ＃Ｂ、およびＰＩＮ＃Ｃは、原画は同じだが、画像の品質（解像度、フレームレート、および画質等）が異なる。画像の品質は、入力画像ＰＩＮ＃Ａ、ＰＩＮ＃Ｂ、およびＰＩＮ＃Ｃの順に低くなる。

　下位階層Ｌ３の階層動画像符号化装置２＃Ｃは、下位階層Ｌ３の入力画像ＰＩＮ＃Ｃを符号化して下位階層Ｌ３の符号化データＤＡＴＡ＃Ｃを生成する。下位階層Ｌ３の復号画像ＰＯＵＴ＃Ｃを復号するのに必要な基本情報が含まれる（図２において“Ｃ”にて示している）。下位階層Ｌ３は、最下層の階層であるため、下位階層Ｌ３の符号化データＤＡＴＡ＃Ｃは、基本符号化データとも称される。

　また、中位階層Ｌ２の階層動画像符号化装置２＃Ｂは、中位階層Ｌ２の入力画像ＰＩＮ＃Ｂを、下位階層の符号化データＤＡＴＡ＃Ｃを参照しながら符号化して中位階層Ｌ２の符号化データＤＡＴＡ＃Ｂを生成する。中位階層Ｌ２の符号化データＤＡＴＡ＃Ｂには、符号化データＤＡＴＡ＃Ｃに含まれる基本情報“Ｃ”に加えて、中位階層の復号画像ＰＯＵＴ＃Ｂを復号するのに必要な付加的情報（図２において“Ｂ”にて示している）が含まれる。

　また、上位階層Ｌ１の階層動画像符号化装置２＃Ａは、上位階層Ｌ１の入力画像ＰＩＮ＃Ａを、中位階層Ｌ２の符号化データＤＡＴＡ＃Ｂを参照しながら符号化して上位階層Ｌ１の符号化データＤＡＴＡ＃Ａを生成する。上位階層Ｌ１の符号化データＤＡＴＡ＃Ａには、下位階層Ｌ３の復号画像ＰＯＵＴ＃Ｃを復号するのに必要な基本情報“Ｃ”および中位階層Ｌ２の復号画像ＰＯＵＴ＃Ｂを復号するのに必要な付加的情報“Ｂ”に加えて、上位階層の復号画像ＰＯＵＴ＃Ａを復号するのに必要な付加的情報（図２において“Ａ”にて示している）が含まれる。

　このように上位階層Ｌ１の符号化データＤＡＴＡ＃Ａは、異なる複数の品質の復号画像に関する情報を含む。

　次に、図２（ｂ）を参照しながら復号装置側について説明する。復号装置側では、上位階層Ｌ１、中位階層Ｌ２、および下位階層Ｌ３それぞれの階層に応じた復号装置１＃Ａ、１＃Ｂ、および１＃Ｃが、符号化データＤＡＴＡ＃Ａ、ＤＡＴＡ＃Ｂ、およびＤＡＴＡ＃Ｃを復号して復号画像ＰＯＵＴ＃Ａ、ＰＯＵＴ＃Ｂ、およびＰＯＵＴ＃Ｃを出力する。

　なお、上位の階層符号化データの一部の情報を抽出して、より下位の特定の復号装置において、当該抽出した情報を復号することで特定の品質の動画像を再生することもできる。

　例えば、中位階層Ｌ２の階層復号装置１＃Ｂは、上位階層Ｌ１の階層符号化データＤＡＴＡ＃Ａから、復号画像ＰＯＵＴ＃Ｂを復号するのに必要な情報（すなわち、階層符号化データＤＡＴＡ＃Ａに含まれる“Ｂ”および“Ｃ”）を抽出して、復号画像ＰＯＵＴ＃Ｂを復号してもよい。言い換えれば、復号装置側では、上位階層Ｌ１の階層符号化データＤＡＴＡ＃Ａに含まれる情報に基づいて、復号画像ＰＯＵＴ＃Ａ、ＰＯＵＴ＃Ｂ、およびＰＯＵＴ＃Ｃを復号することができる。

　なお、以上の３階層の階層符号化データに限られず、階層符号化データは、２階層で階層符号化されていてもよいし、３階層よりも多い階層数にて階層符号化されていてもよい。

　また、特定の階層の復号画像に関する符号化データの一部または全部を他の階層とは独立して符号化し、特定の階層の復号の際に、他の階層の情報を参照しなくても済むように階層符号化データを構成してもよい。例えば、図２（ａ）および（ｂ）を用いて上述した例では、復号画像ＰＯＵＴ＃Ｂの復号に“Ｃ”および“Ｂ”を参照すると説明したが、これに限られない。復号画像ＰＯＵＴ＃Ｂが“Ｂ”だけを用いて復号できるように階層符号化データを構成することも可能である。

　なお、ＳＮＲスケーラビリティを実現する場合、入力画像ＰＩＮ＃Ａ、ＰＩＮ＃Ｂ、およびＰＩＮ＃Ｃとして同一の原画を用いた上で、復号画像ＰＯＵＴ＃Ａ、ＰＯＵＴ＃Ｂ、およびＰＯＵＴ＃Ｃが異なる画質となるよう階層符号化データを生成することもできる。その場合、下位階層の階層動画像符号化装置が、上位階層の階層動画像符号化装置に較べて、より大きい量子化幅を用いて予測残差を量子化することで階層符号化データを生成する。

　本書では、説明の便宜上、次のとおり用語を定義する。以下の用語は、特に断りがなければ、下記の技術的事項のことを表わすのに用いる。

　上位レイヤ　：　ある階層よりも上位に位置する階層のことを、上位レイヤと称する。例えば、図２において、下位階層Ｌ３の上位レイヤは、中位階層Ｌ２および上位階層Ｌ１である。また、上位レイヤの復号画像とは、より品質の高い（例えば、解像度が高い、フレームレートが高い、画質が高い等）復号画像のことをいう。

　下位レイヤ　：　ある階層よりも下位に位置する階層のことを、下位レイヤと称する。例えば、図２において、上位階層Ｌ１の下位レイヤは、中位階層Ｌ２および下位階層Ｌ３である。また、下位レイヤの復号画像とは、より品質の低い復号画像のことをいう。

　対象レイヤ　：　復号または符号化の対象となっている階層のことをいう。

　参照レイヤ（reference layer）　：　対象レイヤに対応する復号画像を復号するのに参照される特定の下位レイヤのことを参照レイヤと称する。

　図２（ａ）および（ｂ）に示した例では、上位階層Ｌ１の参照レイヤは、中位階層Ｌ２および下位階層Ｌ３である。しかしながら、これに限られず、特定の上記レイヤの復号において、下位レイヤのすべてを参照しなくてもよいように階層符号化データを構成することもできる。例えば、上位階層Ｌ１の参照レイヤが、中位階層Ｌ２および下位階層Ｌ３のいずれか一方となるように階層符号化データを構成することも可能である。

　基本レイヤ（base layer）　：　最下層に位置する階層のことを基本レイヤと称する。基本レイヤの復号画像は、符号化データから復号され得るもっとも低い品質の復号画像であり、基本復号画像と呼称される。別の言い方をすれば、基本復号画像は、最下層の階層に対応する復号画像のことである。基本復号画像の復号に必要な階層符号化データの部分符号化データは基本符号化データと呼称される。例えば、上位階層Ｌ１の階層符号化データＤＡＴＡ＃Ａに含まれる基本情報“Ｃ”が基本符号化データである。

　拡張レイヤ　：　基本レイヤの上位レイヤは、拡張レイヤと称される。

　レイヤ識別子　：　レイヤ識別子は、階層を識別するためのものであり、階層と１対１に対応する。階層符号化データには特定の階層の復号画像の復号に必要な部分符号化データを選択するために用いられる階層識別子が含まれる。特定のレイヤに対応するレイヤ識別子に関連付けられた階層符号化データの部分集合は、レイヤ表現とも呼称される。

　一般に、特定の階層の復号画像の復号には、当該階層のレイヤ表現、および／または、当該階層の下位レイヤに対応するレイヤ表現が用いられる。すなわち、対象レイヤの復号画像の復号においては、対象レイヤのレイヤ表現、および／または、対象レイヤの下位レイヤに含まれる１つ以上階層のレイヤ表現が用いられる。

　レイヤ間予測　：　レイヤ間予測とは、対象レイヤのレイヤ表現と異なる階層（参照レイヤ）のレイヤ表現に含まれるシンタックス要素値、シンタックス要素値より導出される値、および復号画像に基づいて、対象レイヤのシンタックス要素値や対象レイヤの復号に用いられる符号化パラメータ等を予測することである。動き予測に関する情報を（同時刻の）参照レイヤの情報から予測するレイヤ間予測のことを動き情報予測と称することもある。また、（同時刻の）下位レイヤの復号画像をアップサンプリングした画像から予測するレイヤ間予測のことをテクスチャ予測（あるいはレイヤ間イントラ予測）と称することもある。なお、レイヤ間予測に用いられる階層は、例示的には、対象レイヤの下位レイヤである。また、参照レイヤを用いず対象レイヤ内で予測を行うことをレイヤ内予測と称することもある。

　なお、以上の用語は、飽くまで説明の便宜上のものであり、上記の技術的事項を別の用語にて表現してもかまわない。

　〔階層符号化データのデータ構造について〕
　以下、各階層の符号化データを生成する符号化方式として、ＨＥＶＣおよびその拡張方式を用いる場合について例示する。しかしながら、これに限られず、各階層の符号化データを、ＭＰＥＧ－２や、Ｈ．２６４／ＡＶＣなどの符号化方式により生成してもよい。

　また、下位レイヤと上位レイヤとが異なる符号化方式によって符号化されていてもよい。また、各階層の符号化データは、互いに異なる伝送路を介して階層動画像復号装置１に供給されるものであってもよいし、同一の伝送路を介して階層動画像復号装置１に供給されるものであってもよい。

　例えば、超高精細映像（動画像、４Ｋ映像データ）を基本レイヤおよび１つの拡張レイヤによりスケーラブル符号化して伝送する場合、基本レイヤは、４Ｋ映像データをダウンスケーリングし、インタレース化した映像データをＭＰＥＧ－２またはＨ．２６４／ＡＶＣにより符号化してテレビ放送網で伝送し、拡張レイヤは、４Ｋ映像（プログレッシブ）をＨＥＶＣにより符号化して、インターネットで伝送してもよい。

　（基本レイヤ）
　図３は、基本レイヤにおいて採用することができる符号化データ（図２の例でいえば、階層符号化データＤＡＴＡ＃Ｃ）のデータ構造について例示する図である。階層符号化データＤＡＴＡ＃Ｃは、例示的に、シーケンス、およびシーケンスを構成する複数のピクチャを含む。

　階層符号化データＤＡＴＡ＃Ｃにおけるデータの階層構造を図３に示す。図３の（ａ）～（ｅ）は、それぞれ、シーケンスＳＥＱを規定するシーケンスレイヤ、ピクチャＰＩＣＴを規定するピクチャレイヤ、スライスＳを規定するスライスレイヤ、ツリーブロック（Tree block）ＴＢＬＫを規定するツリーブロックレイヤ、ツリーブロックＴＢＬＫに含まれる符号化単位（Coding Unit；ＣＵ）を規定するＣＵレイヤを示す図である。

　　（シーケンスレイヤ）
　シーケンスレイヤでは、処理対象のシーケンスＳＥＱ（以下、対象シーケンスとも称する）を復号するために階層動画像復号装置１が参照するデータの集合が規定されている。シーケンスＳＥＱは、図３の（ａ）に示すように、シーケンスパラメータセットＳＰＳ（Sequence Parameter Set）、ピクチャパラメータセットＰＰＳ（Picture Parameter Set）、適応パラメータセットＡＰＳ（Adaptation Parameter Set）、ピクチャＰＩＣＴ_１～ＰＩＣＴ_NP（ＮＰはシーケンスＳＥＱに含まれるピクチャの総数）、及び、付加拡張情報ＳＥＩ（Supplemental Enhancement Information）を含んでいる。

　シーケンスパラメータセットＳＰＳでは、対象シーケンスを復号するために階層動画像復号装置１が参照する符号化パラメータの集合が規定されている。

　ピクチャパラメータセットＰＰＳでは、対象シーケンス内の各ピクチャを復号するために階層動画像復号装置１が参照する符号化パラメータの集合が規定されている。なお、ＰＰＳは複数存在してもよい。その場合、対象シーケンス内の各ピクチャから複数のＰＰＳの何れかを選択する。

　適応パラメータセットＡＰＳは、対象シーケンス内の各スライスを復号するために階層動画像復号装置１が参照する符号化パラメータの集合が規定されている。ＡＰＳは複数存在してもよい。その場合、対象シーケンス内の各スライスから複数のＡＰＳの何れかを選択する。

　　（ピクチャレイヤ）
　ピクチャレイヤでは、処理対象のピクチャＰＩＣＴ（以下、対象ピクチャとも称する）を復号するために階層動画像復号装置１が参照するデータの集合が規定されている。ピクチャＰＩＣＴは、図３の（ｂ）に示すように、ピクチャヘッダＰＨ、及び、スライスＳ₁～Ｓ_NSを含んでいる（ＮＳはピクチャＰＩＣＴに含まれるスライスの総数）。

　なお、以下、スライスＳ₁～Ｓ_NSのそれぞれを区別する必要が無い場合、符号の添え字を省略して記述することがある。また、以下に説明する階層符号化データＤＡＴＡ＃Ｃに含まれるデータであって、添え字を付している他のデータについても同様である。

　ピクチャヘッダＰＨには、対象ピクチャの復号方法を決定するために階層動画像復号装置１が参照する符号化パラメータ群が含まれている。なお、符号化パラメータ群は、必ずしもピクチャヘッダＰＨ内に直接含んでいる必要はなく、例えばピクチャパラメータセットＰＰＳへの参照を含むことで、間接的に含めても良い。

　　（スライスレイヤ）
　スライスレイヤでは、処理対象のスライスＳ（対象スライスとも称する）を復号するために階層動画像復号装置１が参照するデータの集合が規定されている。スライスＳは、図３の（ｃ）に示すように、スライスヘッダＳＨ、及び、ツリーブロックＴＢＬＫ₁～ＴＢＬＫ_NC（ＮＣはスライスＳに含まれるツリーブロックの総数）のシーケンスを含んでいる。

　スライスヘッダＳＨには、対象スライスの復号方法を決定するために階層動画像復号装置１が参照する符号化パラメータ群が含まれる。スライスタイプを指定するスライスタイプ指定情報（slice_type）は、スライスヘッダＳＨに含まれる符号化パラメータの一例である。

　スライスタイプ指定情報により指定可能なスライスタイプとしては、（１）符号化の際にイントラ予測のみを用いるＩスライス、（２）符号化の際に単方向予測、又は、イントラ予測を用いるＰスライス、（３）符号化の際に単方向予測、双方向予測、又は、イントラ予測を用いるＢスライスなどが挙げられる。

　なお、スライスヘッダＳＨには、上記シーケンスレイヤに含まれる、ピクチャパラメータセットＰＰＳへの参照（pic_parameter_set_id）、適応パラメータセットＡＰＳへの参照（aps_id）を含んでいても良い。

　また、スライスヘッダＳＨには、階層動画像復号装置１の備える適応フィルタによって参照されるフィルタパラメータＦＰが含まれている。フィルタパラメータＦＰは、フィルタ係数群を含んでいる。フィルタ係数群には、（１）フィルタのタップ数を指定するタップ数指定情報、（２）フィルタ係数a₀～a_NT-1（NTは、フィルタ係数群に含まれるフィルタ係数の総数）、および、（３）オフセットが含まれる。

　　（ツリーブロックレイヤ）
　ツリーブロックレイヤでは、処理対象のツリーブロックＴＢＬＫ（以下、対象ツリーブロックとも称する）を復号するために階層動画像復号装置１が参照するデータの集合が規定されている。なお、ツリーブロックのことを符号化ツリーブロック（CTB:Coding Tree block）、または、最大符号化単位（LCU:Largest Cording Unit）と呼ぶこともある。

　ツリーブロックＴＢＬＫは、ツリーブロックヘッダＴＢＬＫＨと、符号化単位情報ＣＵ_１～ＣＵ_ＮＬ（ＮＬはツリーブロックＴＢＬＫに含まれる符号化単位情報の総数）とを含む。ここで、まず、ツリーブロックＴＢＬＫと、符号化単位情報ＣＵとの関係について説明すると次のとおりである。

　ツリーブロックＴＢＬＫは、イントラ予測またはインター予測、および、変換の各処理ためのブロックサイズを特定するためのパーティションに分割される。

　ツリーブロックＴＢＬＫの上記パーティションは、再帰的な４分木分割により分割されている。この再帰的な４分木分割により得られる木構造のことを以下、符号化ツリー（coding tree）と称する。

　以下、符号化ツリーの末端のノードであるリーフ（leaf）に対応するパーティションを、符号化ノード（coding node）として参照する。また、符号化ノードは、符号化処理の基本的な単位となるため、以下、符号化ノードのことを、符号化単位（ＣＵ）とも称する。なお、符号化ノードは、符号化ブロック（CB: Coding Block）と呼ぶこともある。

　つまり、符号化単位情報（以下、ＣＵ情報と称する）ＣＵ_１～ＣＵ_ＮＬは、ツリーブロックＴＢＬＫを再帰的に４分木分割して得られる各符号化ノード（符号化単位）に対応する情報である。

　また、符号化ツリーのルート（root）は、ツリーブロックＴＢＬＫに対応付けられる。換言すれば、ツリーブロックＴＢＬＫは、複数の符号化ノードを再帰的に含む４分木分割の木構造の最上位ノードに対応付けられる。

　なお、各符号化ノードのサイズは、当該符号化ノードが直接に属する符号化ノード（すなわち、当該符号化ノードの１階層上位のノードのパーティション）のサイズの縦横とも半分である。

　また、ツリーブロックＴＢＬＫのサイズ、および、各符号化ノードのとり得るサイズは、階層符号化データＤＡＴＡ＃ＣのシーケンスパラメータセットＳＰＳに含まれる、最小符号化ノードのサイズ指定情報、および最大符号化ノードと最小符号化ノードの階層深度の差分に依存する。例えば、最小符号化ノードのサイズが８×８画素であって、最大符号化ノードと最小符号化ノードの階層深度の差分が３である場合、ツリーブロックＴＢＬＫのサイズが６４×６４画素であって、符号化ノードのサイズは、４種類のサイズ、すなわち、６４×６４画素、３２×３２画素、１６×１６画素、および、８×８画素の何れかをとり得る。

　　（ツリーブロックヘッダ）
　ツリーブロックヘッダＴＢＬＫＨには、対象ツリーブロックの復号方法を決定するために階層動画像復号装置１が参照する符号化パラメータが含まれる。具体的には、図３の（ｄ）に示すように、対象ツリーブロックの各ＣＵへの分割パターンを指定するツリーブロック分割情報ＳＰ＿ＴＢＬＫ、および、量子化ステップの大きさを指定する量子化パラメータ差分Δｑｐ（qp_delta）が含まれる。

　ツリーブロック分割情報ＳＰ＿ＴＢＬＫは、ツリーブロックを分割するための符号化ツリーを表す情報であり、具体的には、対象ツリーブロックに含まれる各ＣＵの形状、サイズ、および、対象ツリーブロック内での位置を指定する情報である。

　なお、ツリーブロック分割情報ＳＰ＿ＴＢＬＫは、ＣＵの形状やサイズを明示的に含んでいなくてもよい。例えばツリーブロック分割情報ＳＰ＿ＴＢＬＫは、対象ツリーブロック全体またはツリーブロックの部分領域を四分割するか否かを示すフラグの集合であってもよい。その場合、ツリーブロックの形状やサイズを併用することで各ＣＵの形状やサイズを特定できる。

　また、量子化パラメータ差分Δｑｐは、対象ツリーブロックにおける量子化パラメータｑｐと、当該対象ツリーブロックの直前に符号化されたツリーブロックにおける量子化パラメータｑｐ’との差分ｑｐ－ｑｐ’である。

　　（ＣＵレイヤ）
　ＣＵレイヤでは、処理対象のＣＵ（以下、対象ＣＵとも称する）を復号するために階層動画像復号装置１が参照するデータの集合が規定されている。

　ここで、ＣＵ情報ＣＵに含まれるデータの具体的な内容の説明をする前に、ＣＵに含まれるデータの木構造について説明する。符号化ノードは、予測ツリー（prediction tree；ＰＴ）および変換ツリー（transform tree；ＴＴ）のルートのノードとなる。予測ツリーおよび変換ツリーについて説明すると次のとおりである。

　予測ツリーにおいては、符号化ノードが１または複数の予測ブロックに分割され、各予測ブロックの位置とサイズとが規定される。別の表現でいえば、予測ブロックは、符号化ノードを構成する１または複数の重複しない領域である。また、予測ツリーは、上述の分割により得られた１または複数の予測ブロックを含む。

　予測処理は、この予測ブロックごとに行われる。以下、予測の単位である予測ブロックのことを、予測単位（prediction unit；ＰＵ）とも称する。

　予測ツリーにおける分割（以下、ＰＵ分割と略称する）の種類は、大まかにいえば、イントラ予測の場合と、インター予測の場合との２つがある。

　イントラ予測の場合、分割方法は、２Ｎ×２Ｎ（符号化ノードと同一サイズ）と、Ｎ×Ｎとがある。

　また、インター予測の場合、分割方法は、２Ｎ×２Ｎ（符号化ノードと同一サイズ）、２Ｎ×Ｎ、２Ｎ×ｎＵ、２Ｎ×ｎＤ、Ｎ×２Ｎ、ｎＬ×２Ｎ、ｎＲ×２Ｎ、および、Ｎ×Ｎなどがある。ＰＵ分割の種類については、後に図面を用いて説明する。

　また、変換ツリーにおいては、符号化ノードが１または複数の変換ブロックに分割され、各変換ブロックの位置とサイズとが規定される。別の表現でいえば、変換ブロックは、符号化ノードを構成する１または複数の重複しない領域のことである。また、変換ツリーは、上述の分割より得られた１または複数の変換ブロックを含む。

　変換ツリーにおける分割には、符号化ノードと同一のサイズの領域を変換ブロックとして割り付けるものと、上述したツリーブロックの分割と同様、再帰的な４分木分割によるものがある。

　変換処理は、この変換ブロックごとに行われる。以下、変換の単位である変換ブロックのことを、変換単位（transform unit；ＴＵ）とも称する。

　　（ＣＵ情報のデータ構造）
　続いて、図３（ｅ）を参照しながらＣＵ情報ＣＵに含まれるデータの具体的な内容について説明する。図３（ｅ）に示すように、ＣＵ情報ＣＵは、具体的には、スキップフラグＳＫＩＰ、予測ツリー情報（以下、ＰＴ情報と略称する）ＰＴＩ、および、変換ツリー情報（以下、ＴＴ情報と略称する）ＴＴＩを含む。

　スキップフラグＳＫＩＰは、対象のＰＵについて、スキップモードが適用されているか否かを示すフラグであり、スキップフラグＳＫＩＰの値が１の場合、すなわち、対象ＣＵにスキップモードが適用されている場合、そのＣＵ情報ＣＵにおけるＰＴ情報ＰＴＩの一部、および、ＴＴ情報ＴＴＩは省略される。なお、スキップフラグＳＫＩＰは、Ｉスライスでは省略される。

　　［ＰＴ情報］
　ＰＴ情報ＰＴＩは、ＣＵに含まれる予測ツリー（以下、ＰＴと略称する）に関する情報である。言い換えれば、ＰＴ情報ＰＴＩは、ＰＴに含まれる１または複数のＰＵそれぞれに関する情報の集合であり、階層動画像復号装置１により予測画像を生成する際に参照される。ＰＴ情報ＰＴＩは、図３（ｅ）に示すように、予測タイプ情報ＰＴｙｐｅ、および、予測情報ＰＩｎｆｏを含んでいる。

　予測タイプ情報ＰＴｙｐｅは、対象ＰＵについての予測画像生成方法として、イントラ予測を用いるのか、または、インター予測を用いるのかを指定する情報である。

　予測情報ＰＩｎｆｏは、予測タイプ情報ＰＴｙｐｅが何れの予測方法を指定するのかに応じて、イントラ予測情報ＰＰ＿Ｉｎｔｒａ、または、インター予測情報ＰＰ＿Ｉｎｔｅｒを含む。以下では、イントラ予測が適用されるＰＵをイントラＰＵとも呼称し、インター予測が適用されるＰＵをインターＰＵとも呼称する。

　インター予測情報ＰＰ＿Ｉｎｔｅｒは、階層動画像復号装置１が、インター予測によってインター予測画像を生成する際に参照される符号化パラメータを含む。より具体的には、インター予測情報ＰＰ＿Ｉｎｔｅｒは、対象ＣＵの各インターＰＵへの分割パターンを指定するインターＰＵ分割情報、および、各インターＰＵについてのインター予測パラメータを含む。

　イントラ予測情報ＰＰ＿Ｉｎｔｒａは、階層動画像復号装置１が、イントラ予測によってイントラ予測画像を生成する際に参照される符号化パラメータを含む。より具体的には、イントラ予測情報ＰＰ＿Ｉｎｔｒａには、対象ＣＵの各イントラＰＵへの分割パターンを指定するイントラＰＵ分割情報、および、各イントラＰＵについてのイントラ予測パラメータが含まれる。イントラ予測パラメータは、各イントラＰＵについてのイントラ予測方法（予測モード）を指定するためのパラメータである。

　ここで、イントラ予測パラメータは、各イントラＰＵについてのイントラ予測（予測モード）を復元するためのパラメータである。予測モードを復元するためのパラメータには、ＭＰＭ（Most Probable Mode、以下同様）に関するフラグであるｍｐｍ＿ｆｌａｇ、ＭＰＭを選択するためのインデックスであるｍｐｍ＿ｉｄｘ、および、ＭＰＭ以外の予測モードを指定するためのインデックスであるｒｅｍ＿ｉｄｘが含まれる。ここで、ＭＰＭとは、対象パーティションで選択される可能性が高い推定予測モードである。例えば、対象パーティションの周辺のパーティションに割り付けられた予測モードに基づいて推定された推定予測モードや、一般的に発生確率の高いＤＣモードやＰｌａｎａｒモードがＭＰＭに含まれ得る。

　また、イントラ予測パラメータは、イントラレイヤ間予測モードを用いるのか否かを指定するフラグintra_layer_pred_flagを更に含む構成とすることもできる。

　また、イントラ予測パラメータは、複数種類のイントラレイヤ間予測モードの何れかを指定するためのフラグintra_layer_pred_modeを更に含む構成とすることもできる。

　また、イントラ予測パラメータは、ＤＭモードが仮選択された場合に、色差に関する予測モードとして、当該ＤＭモード及びイントラレイヤ間予測モードの何れかを指定するためのフラグchroma_intra_layer_pred_flagを含む構成とすることもできる。

　また、以下において、単に“予測モード”と表記する場合、特にことわりのない限り、輝度予測モードのことを指すものとする。色差予測モードについては、“色差予測モード”と表記し、輝度予測モードと区別する。また、予測モードを復元するパラメータには、色差予測モードを指定するためのパラメータであるｃｈｒｏｍａ＿ｍｏｄｅが含まれる。

　なお、ｍｐｍ＿ｆｌａｇ、ｍｐｍ＿ｉｄｘ、ｒｅｍ＿ｉｄｘ、およびｃｈｒｏｍａ＿ｍｏｄｅのパラメータの詳細については、後述する。また、ｍｐｍ＿ｆｌａｇおよびｒｅｍ＿ｉｄｘは、それぞれ、例えば、非特許文献１における“prev_intra_luma_pred_flag”および“rem_intra_luma_pred_mode”に対応している。また、ｃｈｒｏｍａ＿ｍｏｄｅは、“intra_chroma_pred_mode”に対応している。

　また、ＰＵ分割情報には、対象ＰＵの形状、サイズ、および、位置を指定する情報が含まれていてもよい。ＰＵ分割情報の詳細については後述する。

　　［ＴＴ情報］
　ＴＴ情報ＴＴＩは、ＣＵに含まれる変換ツリー（以下、ＴＴと略称する）に関する情報である。言い換えれば、ＴＴ情報ＴＴＩは、ＴＴに含まれる１または複数のＴＵそれぞれに関する情報の集合であり、階層動画像復号装置１により残差データを復号する際に参照される。なお、以下、ＴＵのことをブロックと称することもある。

　ＴＴ情報ＴＴＩは、図３（ｅ）に示すように、対象ＣＵの各変換ブロックへの分割パターンを指定するＴＴ分割情報ＳＰ＿ＴＴ、および、量子化予測残差ＱＤ₁～ＱＤ_NT（ＮＴは、対象ＣＵに含まれるブロックの総数）を含んでいる。

　ＴＴ分割情報ＳＰ＿ＴＴは、具体的には、対象ＣＵに含まれる各ＴＵの形状、サイズ、および、対象ＣＵ内での位置を決定するための情報である。例えば、ＴＴ分割情報ＳＰ＿ＴＴは、対象となるノードの分割を行うのか否かを示す情報（split_transform_unit_flag）と、その分割の深度を示す情報（trafoDepth）とから実現することができる。

　また、例えば、ＣＵのサイズが、６４×６４の場合、分割により得られる各ＴＵは、３２×３２画素から４×４画素までのサイズをとり得る。

　各量子化予測残差ＱＤは、階層動画像符号化装置２が以下の処理１～３を、処理対象のブロックである対象ブロックに施すことによって生成した符号化データである。

　処理１：符号化対象画像から予測画像を減算した予測残差を周波数変換（例えば、ＤＣＴ変換（Discrete Cosine Transform）およびＤＳＴ変換（Discrete Sine Transform）等）する；
　処理２：処理１にて得られた変換係数を量子化する；
　処理３：処理２にて量子化された変換係数を可変長符号化する；
　なお、上述した量子化パラメータｑｐは、階層動画像符号化装置２が変換係数を量子化する際に用いた量子化ステップＱＰの大きさを表す（ＱＰ＝２^qp/6）。

　　（予測パラメータ）
　インター予測およびイントラ予測における予測パラメータの詳細について説明する。上述のとおり、予測情報ＰＩｎｆｏには、インター予測パラメータまたはイントラ予測パラメータが含まれる。

　インター予測パラメータとしては、例えば、マージフラグ（ｍｅｒｇｅ＿ｆｌａｇ）、マージインデックス（ｍｅｒｇｅ＿ｉｄｘ）、推定動きベクトルインデックス（ｍｖｐ＿ｉｄｘ）、参照画像インデックス（ｒｅｆ＿ｉｄｘ）、インター予測フラグ（ｉｎｔｅｒ＿ｐｒｅｄ＿ｆｌａｇ）、および動きベクトル残差（ｍｖｄ）が挙げられる。

　一方、イントラ予測パラメータとしては、例えば、推定予測モードフラグ、推定予測モードインデックス、および、残余予測モードインデックスが挙げられる。

　　（ＰＵ分割情報）
　ＰＵ分割情報によって指定されるＰＵ分割タイプには、対象ＣＵのサイズを２Ｎ×２Ｎ画素とすると、次の合計８種類のパターンがある。すなわち、２Ｎ×２Ｎ画素、２Ｎ×Ｎ画素、Ｎ×２Ｎ画素、およびＮ×Ｎ画素の４つの対称的分割（symmetric splittings）、並びに、２Ｎ×ｎＵ画素、２Ｎ×ｎＤ画素、ｎＬ×２Ｎ画素、およびｎＲ×２Ｎ画素の４つの非対称的分割（asymmetric splittings）である。なお、Ｎ＝２^ｍ（ｍは１以上の任意の整数）を意味している。以下、対象ＣＵを分割して得られる領域のことをパーティションとも称する。

　図４（ａ）～（ｈ）に、それぞれの分割タイプについて、ＣＵにおけるＰＵ分割の境界の位置を具体的に図示している。

　図４（ａ）は、ＣＵの分割を行わない２Ｎ×２ＮのＰＵ分割タイプを示している。また、図４（ｂ）、（ｃ）、および（ｄ）は、それぞれ、ＰＵ分割タイプが、２Ｎ×Ｎ、２Ｎ×ｎＵ、および、２Ｎ×ｎＤである場合のパーティションの形状について示している。また、図４（ｅ）、（ｆ）、および（ｇ）は、それぞれ、ＰＵ分割タイプが、Ｎ×２Ｎ、ｎＬ×２Ｎ、および、ｎＲ×２Ｎである場合のパーティションの形状について示している。また、図４（ｈ）は、ＰＵ分割タイプが、Ｎ×Ｎである場合のパーティションの形状を示している。

　図４（ａ）および（ｈ）のＰＵ分割タイプのことを、そのパーティションの形状に基づいて、正方形分割とも称する。また、図４（ｂ）～（ｇ）のＰＵ分割タイプのことは、非正方形分割とも称する。

　また、図４（ａ）～（ｈ）において、各領域に付した番号は、領域の識別番号を示しており、この識別番号順に、領域に対して処理が行われる。すなわち、当該識別番号は、領域のスキャン順を表している。

　　［インター予測の場合の分割タイプ］
　インターＰＵでは、上記８種類の分割タイプのうち、Ｎ×Ｎ（図４（ｈ））以外の７種類が定義されている。なお、上記６つの非対称的分割は、ＡＭＰ（Asymmetric Motion Partition）と呼ばれることもある。

　また、Ｎの具体的な値は、当該ＰＵが属するＣＵのサイズによって規定され、ｎＵ、ｎＤ、ｎＬ、および、ｎＲの具体的な値は、Ｎの値に応じて定められる。例えば、１２８×１２８画素のインターＣＵは、１２８×１２８画素、１２８×６４画素、６４×１２８画素、６４×６４画素、１２８×３２画素、１２８×９６画素、３２×１２８画素、および、９６×１２８画素のインターＰＵへ分割することが可能である。

　　［イントラ予測の場合の分割タイプ］
　イントラＰＵでは、次の２種類の分割パターンが定義されている。対象ＣＵを分割しない、すなわち対象ＣＵ自身が１つのＰＵとして取り扱われる分割パターン２Ｎ×２Ｎと、対象ＣＵを、４つのＰＵへと対称的に分割するパターンＮ×Ｎと、である。

　したがって、イントラＰＵでは、図４に示した例でいえば、（ａ）および（ｈ）の分割パターンを取ることができる。

　例えば、１２８×１２８画素のイントラＣＵは、１２８×１２８画素、および、６４×６４画素のイントラＰＵへ分割することが可能である。

　（拡張レイヤ）
　拡張レイヤの符号化データについても、例えば、図３に示すデータ構造とほぼ同様のデータ構造を採用することができる。ただし、拡張レイヤの符号化データでは、以下のとおり、付加的な情報を追加したり、パラメータを省略したりすることができる。

　ＳＰＳには階層符号化を示す情報が符号化されていてもよい。

　また、スライスレイヤでは、空間スケーラビリティ、時間スケーラビリティ、および、ＳＮＲスケーラビリティの階層の識別情報（それぞれ、dependency_id、temporal_id、および、quality_id）が符号化されていてもよい。フィルタ情報やフィルタのオン／オフ情報（後述）はＰＰＳ、スライスヘッダ、マクロブロックヘッダ等で符号化することが可能である。

　また、ＣＵ情報ＣＵでは、スキップフラグ（skip_flag）、ベースモードフラグ（base_mode_flag）および予測モードフラグ（pred_mode_flag）が符号化されていてもよい。

　また、これらのフラグにより対象ＣＵのＣＵタイプが、イントラＣＵ、インターＣＵ、スキップＣＵおよびベーススキップＣＵのいずれであるかが指定されていてもよい。

　イントラＣＵおよびスキップＣＵは、上述のＨＥＶＣ方式の場合と同様に定義できる。例えば、スキップＣＵでは、スキップフラグに“１”が設定される。スキップＣＵでない場合、スキップフラグに“０”が設定される。また、イントラＣＵでは、予測モードフラグに“０”が設定される。

　また、インターＣＵは、非スキップかつ動き補償（ＭＣ；Motion Compensation）を適用するＣＵと定義されていてもよい。インターＣＵでは、例えば、スキップフラグに“０”が設定され、予測モードフラグに“１”が設定される。

　ベーススキップＣＵは、ＣＵまたはＰＵの情報を参照レイヤから推定するＣＵタイプである。また、ベーススキップＣＵでは、例えば、スキップフラグに“１”が設定され、ベースモードフラグに“１”が設定される。

　また、ＰＴ情報ＰＴＩでは、対象ＰＵのＰＵタイプが、イントラＰＵ、インターＰＵ、マージＰＵ、およびベースマージＰＵのいずれであるかが指定されていてもよい。イントラＰＵ、インターＰＵ、マージＰＵは、上述のＨＥＶＣ方式の場合と同様に定義できる。

　ベースマージＰＵは、ＰＵの情報を参照レイヤから推定するＰＵタイプである。また、例えば、ＰＴ情報ＰＴＩにおいて、マージフラグおよびベースモードフラグを符号化しておき、これらのフラグを用いて、対象ＰＵがベースマージを行うＰＵであるか否かを判定してもよい。すなわち、ベースマージＰＵでは、マージフラグに“１”が設定され、ベースモードフラグに“１”が設定される。

　なお、拡張レイヤに含まれる動きベクトル情報のうち、下位レイヤに含まれる動きベクトル情報から導出可能な動きベクトル情報については、拡張レイヤから省略する構成とすることができる。このような構成とすることによって、拡張レイヤの符号量を削減することができるので、符号化効率が向上する。

　また、上述のとおり拡張レイヤの符号化データを、下位レイヤの符号化方式と異なる符号化方式により生成しても構わない。すなわち、拡張レイヤの符号化・復号処理は、下位レイヤのコーデックの種類に依存しない。

　下位レイヤが、例えば、ＭＰＥＧ－２や、Ｈ．２６４／ＡＶＣ方式によって符号化されていてもよい。

　対象レイヤと参照レイヤとが異なる符号化方式によって符号化されている場合、参照レイヤのパラメータを、対象レイヤの対応するパラメータ、または、類似のパラメータに変換することでレイヤ間における相応の互換性を保つことができる。例えば、ＭＰＥＧ－２や、Ｈ．２６４／ＡＶＣ方式におけるマクロブロックは、ＨＥＶＣにおけるＣＴＢに読み替えて解釈することが可能である。

　なお、以上に説明したパラメータは、単独で符号化されていてもよいし、複数のパラメータが複合的に符号化されていてもよい。複数のパラメータが複合的に符号化される場合は、そのパラメータの値の組み合わせに対してインデックスが割り当てられ、割り当てられた当該インデックスが符号化される。また、パラメータが、別のパラメータや、復号済みの情報から導出可能であれば、当該パラメータの符号化を省略することができる。

　〔階層動画像復号装置〕
　以下では、本実施形態に係る階層動画像復号装置１の構成について、図５～図２４を参照して説明する。

　（階層動画像復号装置の構成）
　図５を用いて、階層動画像復号装置１の概略的構成について説明すると次のとおりである。図５は、階層動画像復号装置１の概略的構成について示した機能ブロック図である。階層動画像復号装置１は、階層動画像符号化装置２から供給される階層符号化データＤＡＴＡを、ＨＥＶＣ方式により復号して、対象レイヤの復号画像ＰＯＵＴ＃Ｔを生成する。

　図５に示すように階層動画像復号装置１は、ＮＡＬ逆多重化部１１、可変長復号部１２、予測パラメータ復元部１４、テクスチャ復元部１５、およびベース復号部１６を備える。

　ＮＡＬ逆多重化部１１は、ＮＡＬ（Network Abstraction Layer）におけるＮＡＬユニット単位で伝送される階層符号化データＤＡＴＡを逆多重化する。

　ＮＡＬは、ＶＣＬ（Video Coding Layer）と、符号化データを伝送・蓄積する下位システムとの間における通信を抽象化するために設けられる層である。

　ＶＣＬは、動画像符号化処理を行う層のことであり、ＶＣＬにおいて符号化が行われる。一方、ここでいう、下位システムは、Ｈ．２６４／ＡＶＣおよびＨＥＶＣのファイルフォーマットや、ＭＰＥＧ－２システムに対応する。以下に示す例では、下位システムは、対象レイヤおよび参照レイヤにおける復号処理に対応する。

　なお、ＮＡＬでは、ＶＣＬで生成されたビットストリームが、ＮＡＬユニットという単位で区切られて、宛先となる下位システムへ伝送される。ＮＡＬユニットには、ＶＣＬで符号化された符号化データ、および、当該符号化データが宛先の下位システムに適切に届けられるためのヘッダが含まれる。また、各階層における符号化データは、ＮＡＬユニット格納されることでＮＡＬ多重化されて階層動画像復号装置１に伝送される。

　ＮＡＬ逆多重化部１１は、階層符号化データＤＡＴＡを逆多重化して、対象レイヤ符号化データＤＡＴＡ＃Ｔおよび参照レイヤ符号化データＤＡＴＡ＃Ｒを取り出す。また、ＮＡＬ逆多重化部１１は、対象レイヤ符号化データＤＡＴＡ＃Ｔを可変長復号部１２に供給するとともに、参照レイヤ符号化データＤＡＴＡ＃Ｒをベース復号部１６に供給する。

　可変長復号部１２は、対象レイヤ符号化データＤＡＴＡ＃Ｔに含まれるバイナリから各種のシンタックス値を復号するための情報の復号処理を行う。

　具体的には、可変長復号部１２は、以下のように、予測情報、符号化情報および変換係数情報を符号化データＤＡＴＡ＃Ｔから復号する。

　すなわち、可変長復号部１２は、各ＣＵまたはＰＵに関する予測情報を、符号化データＤＡＴＡ＃Ｔから復号する。予測情報には、例えば、ＣＵタイプまたはＰＵタイプの指定が含まれる。

　ＣＵがインターＣＵである場合、可変長復号部１２はＰＵ分割情報を符号化ＤＡＴＡ＃Ｔから復号する。加えて、各ＰＵにおいて、可変長復号部１２は、さらに、予測情報として、参照画像インデックスＲＩ、推定動きベクトルインデックスＰＭＶＩ、及び、動きベクトル残差ＭＶＤ等の動き情報、モード情報を符号化データＤＡＴＡ＃Ｔから復号する。

　一方、ＣＵがイントラＣＵである場合、可変長復号部１２は、さらに、予測情報として、（１）予測単位のサイズを指定するサイズ指定情報、および、（２）予測インデックスを指定する予測インデックス指定情報を含むイントラ予測情報を符号化データＤＡＴＡ＃Ｔから復号する。

　また、可変長復号部１２は、符号化情報を符号化データＤＡＴＡ＃Ｔから復号する。符号化情報には、ＣＵの形状、サイズ、位置を特定するための情報が含まれる。より具体的には、符号化情報には、対象ツリーブロックの各ＣＵへの分割パターンを指定するツリーブロック分割情報、すなわち、対象ツリーブロックに含まれる各ＣＵの形状、サイズ、および、対象ツリーブロック内での位置を指定する情報が含まれる。

　可変長復号部１２は、復号した予測情報および符号化情報を予測パラメータ復元部１４に供給する。

　また、可変長復号部１２は、各ブロックに関する量子化予測残差ＱＤ、及び、そのブロックを含むツリーブロックに関する量子化パラメータ差分Δｑｐを符号化データＤＡＴＡ＃Ｔから復号する。可変長復号部１２は、復号した量子化予測残差ＱＤおよび量子化パラメータ差分Δｑｐを変換係数情報としてテクスチャ復元部１５に供給する。

　ベース復号部１６は、参照レイヤ符号化データＤＡＴＡ＃Ｒから、対象レイヤに対応する復号画像を復号する際に参照される参照レイヤに関する情報であるベース復号情報を復号する。ベース復号情報には、ベース予測パラメータ、ベース変換係数、およびベース復号画像が含まれる。ベース復号部１６は、復号したベース復号情報を予測パラメータ復元部１４およびテクスチャ復元部１５に供給する。

　予測パラメータ復元部１４は、予測情報およびベース復号情報を用いて、予測パラメータを復元する。予測パラメータ復元部１４は、復元した予測パラメータを、テクスチャ復元部１５に供給する。なお、予測パラメータ復元部１４は、予測パラメータを復元する際に、テクスチャ復元部１５が備えるフレームメモリ１５５（後述）に格納された動き情報を参照することができる。

　テクスチャ復元部１５は、変換係数情報、ベース復号情報および予測パラメータを用いて、復号画像ＰＯＵＴ＃Ｔを生成し、外部に出力する。なお、テクスチャ復元部１５では、復元された復号画像に関する情報が、内部に備えるフレームメモリ１５５（後述）に格納される。

　以下において、ベース復号部１６、予測パラメータ復元部１４、およびテクスチャ復元部１５それぞれの詳細について説明する。

　（予測パラメータ復元部）
　図１を用いて、予測パラメータ復元部１４の詳細構成について説明する。図１は、予測パラメータ復元部１４の構成について例示した機能ブロック図である。

　図１に示すように、予測パラメータ復元部１４は、予測タイプ選択部１４１、スイッチ１４２、イントラ予測モード復元部１４３、動きベクトル候補導出部１４４、動き情報復元部１４５、マージ候補導出部１４６、およびマージ情報復元部１４７を備える。

　予測タイプ選択部１４１は、ＣＵタイプまたはＰＵタイプに応じてスイッチ１４２に切り替え指示を送り予測パラメータの導出処理を制御する。具体的には以下のとおりである。

　イントラＣＵまたはイントラＰＵが指定されている場合、予測タイプ選択部１４１はイントラ予測モード復元部１４３を用いて予測パラメータを導出できるようスイッチ１４２を制御する。

　インターＣＵ（マージなし）およびインターＰＵ（マージなし）のいずれかが指定されている場合、予測タイプ選択部１４１は動き情報復元部１４５を用いて予測パラメータを導出できるようスイッチ１４２を制御する。

　ベーススキップＣＵ、ベースマージＰＵ、スキップＣＵおよびマージＰＵのいずれかが指定されている場合、予測タイプ選択部１４１はマージ情報復元部１４７を用いて予測パラメータを導出できるようスイッチ１４２を制御する。

　スイッチ１４２は、予測タイプ選択部１４１の指示に応じて、予測情報を、イントラ予測モード復元部１４３、動き情報復元部１４５、およびマージ情報復元部１４７のいずれかに供給する。予測情報の供給先において予測パラメータが導出される。

　イントラ予測モード復元部１４３は、予測情報から予測モードIntraPredMode[xB][yB]を導出する。すなわち、イントラ予測モード復元部１４３が予測パラメータとして復元するのは予測モードである。さらに、イントラ予測モード復元部１４３は、色差予測モードIntraPredModeC[xB][yB]を導出するための構成をも備えている。

　図６に基づいて、イントラ予測モード復元部１４３の構成をさらに詳しく説明する。図６は、イントラ予測モード復元部１４３の構成例を示すブロック図である。なお、図６では、イントラ予測モード復元部１４３の構成のうち、予測モードを復号する構成のみを詳細に示している。

　図６に示すように、イントラ予測モード復元部１４３は、ＭＰＭ導出部１２２、ＭＰＭ判定部１２３、予測モード復元部１２４、色差予測モード復元部１２６、およびコンテキスト記憶部１２７を備える。

　ＭＰＭ導出部１２２は、対象パーティションの周辺のパーティションに割り付けられた予測モードに基づいてＭＰＭを導出する。ここで、ＭＰＭ導出部１２２は、例えば、３つのＭＰＭを導出する。ＭＰＭ導出部１２２は、例えば、第１のＭＰＭ候補candModeList[0]、第２のＭＰＭ候補candModeList[1]、及び第３のＭＰＭ候補candModeList[2]を、それぞれ次のように導出する。

　まず、図７に示すように、candIntraPredModeAに対象ＰＵ（図７においてＲＴと表記）の左に隣接する左隣接ＰＵ（図７においてＮＡと表記）の予測モード、ｐｍＢに対象ＰＵの上に隣接する上隣接ＰＵ（図７においてＮＢと表記）の予測モードを設定する。図７に示す「ｐｍＡ」及び「ｐｍＢ」は、それぞれ、上記candIntraPredModeA、及びcandIntraPredModeBのことを指している。

　また、ＭＰＭ導出部１２２は、左隣接ＰＵまたは上隣接ＰＵの予測モードが利用不可の場合、既定の予測モード、例えば“Intra_Planar”を設定する。隣接ＰＵが利用不可の場合には、隣接ＰＵの予測モードが未復号の場合、隣接ＰＵが上隣接ＰＵであって異なるＬＣＵ（ツリーブロック）に属する場合が含まれる。

　ＭＰＭ導出部１２２は、
　candIntraPredModeA==candIntraPredModeB
が満たされており、かつ、
　candIntraPredModeA<2（Intra_PlanarかIntra_DC）
である場合、candModeList[0]～candModeList[2]を
　candModeList[0] = Intra_Planar
　candModeList[1] = Intra_DC
　candModeList[2] = Intra_Angular(26)
に設定する。

　また、ＭＰＭ導出部１２２は、
　candIntraPredModeA==candIntraPredModeB
が満たされており、かつ、
　candIntraPredModeA<2
でない場合、candModeList[0]～candModeList[2]を
　candModeList[0] = candIntraPredModeA
　candModeList[1] = 2+((candIntraPredModeA-2-1)%32
　candModeList[2] = 2+((candIntraPredModeA-2+1)%32
に設定する。

　また、ＭＰＭ導出部１２２は、
　candIntraPredModeA != candIntraPredModeB
が満たされている場合、
　candModeList[0] = candIntraPredModeA
　candModeList[1] = candIntraPredModeB
と設定したうえで、candModeList[2]を、次のように決定する。すなわち、candModeList[0]も[1]もIntra_Planarでない場合には、
candModeList[2] = Intra_Planar
に設定し、
　candModeList[0]及び[1]の少なくとも何れかがIntra_Planarである場合であって、candModeList[0]も[1]もIntra_DCでない場合には、
　candModeList[2] = Intra_DC
に設定し、
　candModeList[0]及び[1]が、それぞれIntra_Planar及びIntra_DCであるか、Intra_DC及びIntra_Planarである場合、
　candModeList[2] = Intra_Angular(26)
に設定する。

　なお、以下では、candModeList[0]～candModeList[2]を、それぞれ、ＭＰＭ０～ＭＰＭ２と表記することもある。

　ＭＰＭ判定部１２３は、符号化データに含まれるｍｐｍ＿ｆｌａｇ（prev_intra_luma_pred_flag）に基づいて、対象ＰＵの予測モードが、推定予測モードＭＰＭと一致しているか否かを判定する。図８は、イントラ予測モードを復号するために参照されるシンタックスの例を示している。

　ｍｐｍ＿ｆｌａｇは、対象ＰＵの予測モードが推定予測モードＭＰＭと一致している場合、“１”であり、対象ＰＵの予測モードが推定予測モードＭＰＭと一致していない場合、“０”である。ＭＰＭ判定部１２３は、判定結果を、予測モード復元部１２４に通知する。

　なお、ＭＰＭ判定部１２３は、コンテキスト記憶部１２７に記憶されているコンテキストに応じて、符号化データからｍｐｍ＿ｆｌａｇを復号する。

　予測モード復元部１２４は、対象ＰＵについての予測モードを復元する。予測モード復元部１２４は、ＭＰＭ判定部１２３から通知される判定結果に応じて、予測モードを復元する。

　対象ＰＵの予測モードが推定予測モードＭＰＭと一致している場合、予測モード復元部１２４は、符号化データからｍｐｍ＿ｉｄｘを復号し、その値に基づいて予測モードを復元する。ｍｐｍ＿ｉｄｘは、対象ＰＵの予測モードが、candModeList[0]と一致する場合、“０”であり、対象ＰＵの予測モードが、candModeList[1]と一致する場合、“１”であり、対象ＰＵの予測モードが、candModeList[2]と一致する場合、“２”である。

　なお、予測モード復元部１２４はｍｐｍ＿ｉｄｘの復号時にコンテキスト記憶部１２７に記憶されているコンテキストを利用してもよいし、利用しなくてもよい。

　対象ＰＵの予測モードが推定予測モードＭＰＭと一致していない場合、予測モード復元部１２４は、符号化データに含まれるｒｅｍ＿ｉｄｘに基づいて予測モードを復元する。具体的には、まず、candModeList[0]～candModeList[2]を、小さい順にソートする。すなわち、
　（candModeList[0]のモード番号）＜（candModeList[1]のモード番号）＜（candModeList[2]のモード番号）
となるようにソートする。

　続いて、予測モード復元部１２４は、
　mode = rem_intra_luma_pred_mode
としてパラメータ「mode」を初期化する。ここで、rem_intra_luma_pred_modeは、ＭＰＭを除く予測モードのインデクスである。

　続いて、予測モード復元部１２４は、
　mode >= candModeList[0] であれば、mode = mode+1
　mode >= candModeList[1] であれば、mode = mode+1
　mode >= candModeList[2] であれば、mode = mode+1
と設定する。

　予測モード復元部１２４は、このようにして得られたmodeに対応する予測モードを復元する。

　色差予測モード復元部１２６は、対象ＰＵについての色差予測モードを復元する。より詳細には、色差予測モード復元部１２６は、以下のように色差予測モードを復元する。

　まず、色差予測モード復元部１２６は、符号化データ＃１に含まれるイントラ色差予測モード指定情報ｃｈｒｏｍａ＿ｍｏｄｅ（intra_chroma_pred_mode）を復号する。

　そして、色差予測モード復元部１２６は、復元したイントラ色差予測モード指定情報ｃｈｒｏｍａ＿ｍｏｄｅと、輝度の予測モード（IntraPredMode[xB][yB]）とに基づいて、色差予測モードを復元する。

　続いて、図９に基づいて、予測モードの定義の一例を説明する。図９は、予測モードの定義の一例を示す。同図に示す例においては、３６種類の予測モードが定義されており、それぞれの予測モードは、「０」～「３５」の番号（IntraPredModeまたはIntraPredModeCの各値であり、イントラ予測モードインデックスとも呼称することがある）により特定される。また、図１０に示すように、各予測モードには次の名称が割り当てられている。すなわち、「０」は、“Intra Planar（プラナー予測モード、平面予測モード）”であり、「１」は、“Intra DC（イントラＤＣ予測モード）”であり、「２」～「３４」は、“Intra Angular（方向予測）”であり、「３５」は、“Intra From Luma”である。

　「３５」は、色差予測モード固有のものであり、輝度の予測に基づいて色差の予測を行うモードである。言い換えれば、色差予測モード「３５」は、輝度画素値と色差画素値との相関を利用した予測モードである。色差予測モード「３５」はＬＭモードとも称する。予測モード数（intraPredModeNum）は、対象ブロックのサイズによらず「３６」である。

　なお、図９及び図１０に示した予測モード０～予測モード３５よりなるセットを、基本セットと呼称することもある。

　図１１は、色差予測モードを導出するために、色差予測モード復元部１２６によって参照されるテーブルの一例を示す図である。より具体的には、図１１は、イントラ色差予測モード指定情報chroma_modeおよび輝度の予測モード（IntraPredMode[xB][yB]）と、色差予測モード（IntraPredModeC）との対応付けを定義したテーブルを示す図である。

　図１１（ａ）は、色差予測モードにＬＭモードが含まれている場合のテーブルであり、図１１（ｂ）は、色差予測モードにＬＭモードが含まれていない場合のテーブルである。テーブル中、“ＬＭ”は上記ＬＭモードを用いることを意味する。また、“Ｘ”は、輝度の予測モード（IntraPredMode[xB][yB]）の値をそのまま用いることを示している。

　ＬＭモードを含むテーブルを用いるのか、または、ＬＭモードを含まないテーブルを用いるのかは、例えば、chroma_pred_from_luma_enabled_flagの値によって指定される。

　続いて、図１に戻り各部の説明を続ける。

　動きベクトル候補導出部１４４は、ベース復号情報を用いて、レイヤ内動き推定処理、または、レイヤ間動き推定処理により推定動きベクトルの候補を導出する。動きベクトル候補導出部１４４は、導出した動きベクトルの候補を動き情報復元部１４５に供給する。

　動き情報復元部１４５は、マージを行わない各インターＰＵに関する動き情報を復元する。すなわち、動き情報復元部１４５が予測パラメータとして復元するのは動き情報である。

　動き情報復元部１４５は、対象ＰＵがインターＣＵおよびインターＰＵである場合、予測情報から、動き情報を復元する。より具体的には、動き情報復元部１４５は、動きベクトル残差（mvd）、推定動きベクトルインデックス（mvp_idx）、インター予測フラグ（inter_pred_flag）および、参照画像インデックス（refIdx）を取得する。そして、インター予測フラグの値に基づいて、参照画像リストＬ０と参照画像リストＬ１各々について参照画像リスト利用フラグを決定する。続いて、対応する参照画像リスト利用フラグが、当該参照画像を利用することを示している場合、動き情報復元部１４５は、推定動きベクトルインデックスの値に基づいて、推定動きベクトルを導出するとともに、動きベクトル残差と推定動きベクトルとに基づいて動きベクトルを導出する。動き情報復元部１４５は、導出した動きベクトルと、参照画像リスト利用フラグ、および、参照画像インデックスと合わせて動き情報（動き補償パラメータ）として出力する。

　マージ候補導出部１４６は、後述するフレームメモリ１５５から供給される復号済みの動き情報および／またはベース復号部１６から供給されるベース復号情報等を用いて、各種のマージ候補を導出する。マージ候補導出部１４６は、導出したマージ候補をマージ情報復元部１４７に供給する。

　マージ情報復元部１４７は、レイヤ内またはレイヤ間でマージを行う各ＰＵに関する動き情報を復元する。すなわち、動き情報復元部１４５が予測パラメータとして復元するのは動き情報である。

　具体的には、マージ情報復元部１４７は、対象ＣＵ（ＰＵ）がレイヤ内でマージを行うスキップＣＵ（マージＰＵ）である場合、マージ候補導出部１４６がレイヤ内マージにより導出したマージ候補リストから、予測情報に含まれるマージインデックス（merge_idx）に対応する動き補償パラメータを導出することにより、動き情報を復元する。

　また、マージ情報復元部１４７は、レイヤ間でマージを行うベーススキップＣＵである場合、マージ候補導出部１４６がレイヤ間マージにより導出したマージ候補リストから、予測情報に含まれるマージインデックス（merge_idx）に対応する動き補償パラメータを導出することにより、動き情報を復元する。

　なお、マージ候補導出部１４６の詳細については後述する。

　（テクスチャ復元部）
　図１２を用いて、テクスチャ復元部１５の詳細構成について説明する。図１２は、テクスチャ復元部１５の構成について例示した機能ブロック図である。

　図１２に示すように、テクスチャ復元部１５は、逆直交変換・逆量子化部１５１、テクスチャ予測部１５２、加算器１５３、ループフィルタ部１５４、およびフレームメモリ１５５を備える。

　逆直交変換・逆量子化部１５１は、（１）可変長復号部１２から供給される変換係数情報に含まれる量子化予測残差ＱＤを逆量子化し、（２）逆量子化によって得られたＤＣＴ係数を逆直交変換（例えば、ＤＣＴ（Discrete Cosine Transform）変換）し、（３）逆直交変換によって得られた予測残差Ｄを加算器１５３に供給する。なお、量子化予測残差ＱＤを逆量子化する際に、逆直交変換・逆量子化部１５１は、変換係数情報に含まれる量子化パラメータ差分Δｑｐから量子化ステップＱＰを導出する。量子化パラメータｑｐは、直前に逆量子化／逆直交変換したツリーブロックに関する量子化パラメータｑｐ’に量子化パラメータ差分Δｑｐを加算することによって導出でき、量子化ステップＱＰは、量子化パラメータｑｐからＱＰ＝２^ｑｐ／６によって導出できる。また、逆直交変換・逆量子化部１５１による予測残差Ｄの生成は、ブロック（変換単位）を単位として行われる。

　テクスチャ予測部１５２は、予測パラメータに応じて、ベース復号情報に含まれるベース復号画像またはフレームメモリに格納されている復号済みの復号画像を参照し、予測画像を生成する。

　テクスチャ予測部１５２は、より詳細には、インター予測部１５２Ａ、レイヤ内イントラ予測部１５２Ｂ、およびレイヤ間イントラ予測部１５２Ｃを備える。

　インター予測部１５２Ａは、各インター予測パーティションに関する予測画像をインター予測により生成する。具体的には、インター予測部１５２Ａは、動き情報復元部１４５またはマージ情報復元部１４７から予測パラメータとして供給される動き情報を用いて、参照画像から予測画像を生成する。

　レイヤ内イントラ予測部１５２Ｂは、各イントラ予測パーティションに関する予測画像をレイヤ内イントラ予測により生成する。具体的には、レイヤ内イントラ予測部１５２Ｂは、イントラ予測モード復元部１４３から予測パラメータとして供給される予測モードを用いて、対象パーティションにおいて復号済みの復号画像から予測画像を生成する。

　レイヤ間イントラ予測部１５２Ｃは、各イントラ予測パーティションに関する予測画像をレイヤ間イントラ予測により生成する。具体的には、レイヤ間イントラ予測部１５２Ｃは、イントラ予測モード復元部１４３から予測パラメータとして供給される予測モードを用いて、ベース復号情報に含まれるベース復号画像に基づいて予測画像を生成する。ベース復号画像は、対象レイヤの解像度に合わせて適宜アップサンプリングされてもよい。レイヤ間イントラ予測部１５２Ｃによるイントラレイヤ間予測の詳細については後述する。

　テクスチャ予測部１５２は、インター予測部１５２Ａ、レイヤ内イントラ予測部１５２Ｂまたはレイヤ間イントラ予測部１５２Ｃが生成した予測画像を加算器１５３に供給する。

　加算器１５３は、テクスチャ予測部１５３予測画像と、逆直交変換・逆量子化部１５１から供給された予測残差Ｄとを加算することによって復号画像を生成する。

　ループフィルタ部１５４は、加算器１５３から供給される復号画像に対し、デブロッキング処理や、適応フィルタパラメータによるフィルタ処理を施すものである。

　フレームメモリ１５５は、ループフィルタ部１５４によるフィルタ済み復号画像を格納する。

　（ベース復号部）
　図１３を用いて、ベース復号部１６の詳細構成について説明する。図１３は、ベース復号部１６の構成について例示した機能ブロック図である。

　図１３に示すように、ベース復号部１６は、可変長復号部１６１、ベース予測パラメータ復元部１６２、ベース変換係数復元部１６３、およびベーステクスチャ復元部１６４を備える。

　可変長復号部１６１は、参照レイヤ符号化データＤＡＴＡ＃Ｒに含まれるバイナリから各種のシンタックス値を復号するための情報の復号処理を行う。

　具体的には、可変長復号部１６１は、予測情報および変換係数情報を符号化データＤＡＴＡ＃Ｒから復号する。可変長復号部１６１が復号する予測情報および変換係数のシンタックスは、可変長復号部１２と同様であるのでここではその詳細な説明を省略する。

　可変長復号部１６１は、復号した予測情報をベース予測パラメータ復元部１６２に供給するとともに、復号した変換係数情報をベース変換係数復元部１６３に供給する。

　ベース予測パラメータ復元部１６２は、可変長復号部１６１から供給される予測情報に基づいて、ベース予測パラメータを復元する。ベース予測パラメータ復元部１６２が、ベース予測パラメータを復元する方法については、予測パラメータ復元部１４と同様であるので、ここではその詳細な説明を省略する。ベース予測パラメータ復元部１６２は、復元したベース予測パラメータを、ベーステクスチャ復元部１６４に供給するとともに、外部に出力する。

　ベース変換係数復元部１６３は、可変長復号部１６１から供給される変換係数情報に基づいて、変換係数を復元する。ベース変換係数復元部１６３が変換係数を復元する方法については、逆直交変換・逆量子化部１５１と同様であるので、ここではその詳細な説明を省略する。ベース変換係数復元部１６３は、復元したベース変換係数を、ベーステクスチャ復元部１６４に供給するとともに、外部に出力する。

　ベーステクスチャ復元部１６４は、ベース予測パラメータ復元部１６２から供給されるベース予測パラメータと、ベース変換係数復元部１６３から供給されるベース変換係数とを用いて、復号画像を生成する。具体的には、ベーステクスチャ復元部１６４は、ベース予測パラメータに基づき、テクスチャ予測部１５２と同様のテクスチャ予測を行って、予測画像を生成する。また、ベーステクスチャ復元部１６４は、ベース変換係数に基づいて予測残差を生成し、生成した予測残差と、テクスチャ予測により生成した予測画像とを加算することでベース復号画像を生成する。

　なお、ベーステクスチャ復元部１６４は、ベース復号画像に対して、ループフィルタ部１５４と同様のフィルタ処理を施してもよい。また、ベーステクスチャ復元部１６４は、復号済みのベース復号画像を格納するためのフレームメモリを備えていてもよく、テクスチャ予測においてフレームメモリに格納されている復号済みのベース復号画像を参照してもよい。

　＜＜イントラレイヤ間予測＞＞
　図１４を参照して、ベースレイヤの復号画像を用いたイントラレイヤ間予測について説明する。図１４は、ベースレイヤの復号画像を用いたイントラレイヤ間予測を概略的に示す模式図である。

　図１４に示すように、イントラレイヤ間予測においては、拡張レイヤの対象ブロック（対象となる予測ブロックのことを指す（以下同様））のイントラ予測画像が、ベースレイヤにおいて、時間的に該対象ブロックと同時刻に位置するブロックであって、空間的に該対象ブロックに対応する位置に配置されたブロックである参照ブロック（参照される予測ブロックのことを指す（以下同様））の復号画像に基づいて生成される。

　ここで、イントラレイヤ間予測において参照されるのは、同時刻のベースレイヤ画像であるため動き補償は不要である。また、対象ブロックに隣接する領域の画素値ではなく、上記参照ブロックの画素値を用いて予測画像を生成するため、予測精度の向上を図ることができる。

　なお、対象ブロックと、参照ブロックとで、画素数が異なる場合はアップサンプルを行う構成とすればよい。また、必要に応じて、参照ブロックの復号画像に対してフィルタリング（ＳＡＯ、ＡＬＦ、エッジ強調、ノイズ除去、インタレース解除など）を行ったものを参照してイントラ予測画像を生成する構成としてもよい。

　以下では、本実施形態に係るイントラレイヤ間予測及びそれに関連するシンタックスの復号方法について、具体例を挙げつつ順に説明する。

　＜イントラレイヤ間予測の第１の例＞
　まず、図１５を参照して、イントラレイヤ間予測の第１の例について説明する。

　図１５は、本例に係るイントラ予測パラメータに含まれるシンタックスを示す図である。図１５に示すように、本例に係るイントラ予測パラメータは、図８に示した各シンタックスに加えて、intra_layer_pred_flag[x0][y0]を含んでいる。

　ここで、intra_layer_pred_flag[x0][y0]は、イントラレイヤ間予測を用いるか否かを示すフラグであり、上述したイントラ予測モード復元部１４３によって復号される。

　intra_layer_pred_flag[x0][y0]の値がfalseを示す場合、レイヤ間イントラ予測部１５２Ｃによるイントラレイヤ間予測は行われない。この場合、イントラ予測としては、レイヤ内イントラ予測部１５２Ｂによる予測のみが選択可能となる。

　一方で、intra_layer_pred_flag[x0][y0]の値がtrueを示す場合、レイヤ間イントラ予測部１５２Ｃによって上述のイントラレイヤ間予測が行われる。この場合、図１５に示すintra_layer_pred_flag[x0][y0]以外のシンタックスprev_intra_luma_pred_flag[x0][y0]、mpm_idx[x0][y0]、rem_intra_luma_pred_mode[x0][y0]、及びintra_chroma_pred_mode[x0][y0]は符号化データに含めない構成としておくことができる。このような構成においては、intra_layer_pred_flagを符号化すれば足りるため、イントラレイヤ間予測モードが選択される率が高いほど符号化効率も向上する。

　なお、本例において、intra_layer_pred_flagの算術符号化及び復号には、他のシンタックスに関連付けられたコンテキストから独立したコンテキストを用いることが好ましい。

　＜イントラレイヤ間予測の第２の例＞
　続いて、図１６を参照して、イントラレイヤ間予測の第２の例について説明する。

　本例においては、予め定められた複数のイントラ予測モードの少なくとも一部を含む予測モード群において、予め定められた複数のイントラ予測モード（図１０に示した予測モード０～３５）の何れか１つの予測モードに代えて、イントラレイヤ間予測モードが含まれている。

　より具体的には、例えば、図１６に示すように、本例に係る予測モード群には、イントラＤＣ予測モード（Intra_DC）に代えて、イントラレイヤ間予測モード（図１６にてIntra_Baseと表記）が含まれている。

　したがって、本例においては、予測モード復元部１２４によってイントラ予測モードインデックス＝１が復号された場合に、レイヤ間イントラ予測部１５２Ｃによって上述のイントラレイヤ間予測が行われる。

　本例のようにイントラレイヤ間予測モードを行う場合には、＜イントラレイヤ間予測の第１の例＞に示したような、イントラレイヤ間予測を用いるか否かを示すフラグ（intra_layer_pred_flag[x0][y0]）が不要になる。

　換言すれば、基本セット（より正確には、基本セットからイントラレイヤ間予測モードに差し替えた予測モードを除いたもの）に含まれる予測モード及びイントラレイヤ間予測モードよりなる予測モード群から、一の予測モードを選択するために、図８に示した共通のシンタックスを参照すれば足りる。

　このように、予測モード群において、予め定められた複数のイントラ予測モード（図１０に示した予測モード０～３５）の何れか１つの予測モードに代えて、イントラレイヤ間予測モードを含めておくことによって、イントラ予測モードを指定するための符号量を増大させることなく、好適にイントラレイヤ間予測を行うことができる。

　また、本例に係る予測モード群には、イントラＤＣ予測モードに代えて、イントラレイヤ間予測モードが含まれている。対象ブロックの各画素値を全て同じ値として予測するイントラＤＣ予測モードに比べて、イントラレイヤ間予測モードの方が予測精度が高いため、符号化効率が向上する。

　＜イントラレイヤ間予測の第３の例＞
　続いて、図１７を参照して、イントラレイヤ間予測の第３の例について説明する。

　本例においては、予め定められた複数のイントラ予測モードの少なくとも一部を含む予測モード群において、予め定められた複数のイントラ予測モード（図１０に示した予測モード０～３５）に加えて、イントラレイヤ間予測モードが含まれている。

　より具体的には、例えば、図１７に示すように、本例に係る予測モード群には、イントラレイヤ間予測モード（図１７にてIntra_Baseと表記）が、イントラ予測モードインデックス＝０として追加されており、その他の予測モードのインデックスが１ずつ繰り上がっている。

　換言すれば、基本セットに含まれる予測モード及びイントラレイヤ間予測モードよりなる予測モード群から、一の予測モードを選択するために、図８に示した共通のシンタックスを参照すれば足りる。

　また、本例においては、３個のＭＰＭ以外の予測モードの総数が、３３個となり、ｒｅｍ＿ｉｄｘに関して最大で６ビットが必要になる。このため、本例においては、ｒｅｍ＿ｉｄｘの符号化及び復号において、適宜可変長符号化を用いることが好ましい。

　また、本例において、ＭＰＭを選択する際には、イントラレイヤ間予測モード（Intra_Base）を優先的に用いる構成とすることが好ましい。

　本例におけるＭＰＭ(candModeList[x]、x=0..2)の導出方法は、以下のとおりである。

　すなわち、本例に係るイントラ予測モード復元部１４３の備えるＭＰＭ導出部１２２は、対象ブロックの左隣接ブロックの予測モードをcandIntraPredModeA、対象ブロックの上隣接ブロックの予測モードをcandIntraPredModeB とする。

　そして、本例に係るＭＰＭ導出部１２２は、
　candIntraPredModeA==candIntraPredModeB
である場合であって、
　candIntraPredModeA<3 (Intra_PlanarかIntra_DCかIntra_Base)
である場合に、candModeListを
　candModeList[0] = Intra_Base
　candModeList[1] = Intra_Planar
　candModeList[2] = Intra_DC
に設定する。

　また、本例に係るＭＰＭ導出部１２２は、
　candIntraPredModeA==candIntraPredModeB
である場合であって、
　candIntraPredModeA<2
でない場合に、candModeListを
　candModeList[0] = candIntraPredModeA
　candModeList[1] = 3+((candIntraPredModeA-3-1)%32
　candModeList[2] = 3+((candIntraPredModeA-3+1)%32
に設定する。

　一方で、
　candIntraPredModeA != candIntraPredModeB
である場合、本例に係るＭＰＭ導出部１２２は、
　candModeList[0] = Intra_Base
　candModeList[1] = candIntraPredModeA
　candModeList[2] = candIntraPredModeB
に設定する。

　このように、本例においては、ＭＰＭを選択する際には、イントラレイヤ間予測モード（Intra_Base）を優先的に用いるので、符号量の増大を抑えつつ、予測精度の向上を図ることができる。

　＜イントラレイヤ間予測の第４の例＞
　続いて、図１８及び図１９を参照して、イントラレイヤ間予測の第４の例について説明する。

　本例においては、イントラレイヤ間予測モードが複数存在する場合を取り扱う。一例として、イントラレイヤ間予測モードを行う際に、ベースレイヤの復号画像に対して、互いに特性の異なる複数種類のフィルタを作用させる場合などが該当する。

　より具体的には、
　イントラレイヤ間予測モード１：ベースレイヤの復号画像に対して、ノイズ除去効果の高いアップサンプルフィルタを使用したうえで、拡張レイヤの予測画像として用いるモード
　イントラレイヤ間予測モード２：ベースレイヤの復号画像に対して、エッジ強調効果のあるアップサンプルフィルタを使用したうえで、拡張レイヤの予測画像として用いるモード
などが挙げられる。

　また、別の具体例としては、
　イントラレイヤ間予測モード１：ベースレイヤの復号画像に対して、ある位相のアップサンプルフィルタを使用したうえで、拡張レイヤの予測画像として用いるモード
　イントラレイヤ間予測モード２：ベースレイヤの復号画像に対して、イントラレイヤ間予測モード１とは異なる位相のアップサンプルフィルタを使用したうえで、拡張レイヤの予測画像として用いるモード
などが挙げられる。

　このようにイントラレイヤ間予測モードが複数存在する場合、イントラ予測モード復元部１４３は、例えば、図１８に示すように、intra_layer_pred_flag[x0][y0]を復号したうえで、intra_layer_pred_mode[x0][y0]（値域は０～イントラレイヤ間予測モード数－１）を復号することによって、複数のイントラレイヤ間予測モードの一つを選択する構成とすることができる。ここで、intra_layer_pred_mode[x0][y0]は、複数のイントラレイヤ間予測モードの何れかを指定するためのシンタックスである。

　また、図１９に示すように、イントラレイヤ間予測モード１（Intra_Base1）及びイントラレイヤ間予測モード２（Intra_Base2）に対して、それぞれ、予測モードインデックスを付与する構成としてもよい。図１９に示す構成の場合、intra_layer_pred_flag[x0][y0]を復号する必要はなく、図８に示した共通のシンタックスを参照すれば足りる。

　＜イントラレイヤ間予測の第５の例＞
　続いて、図２０及び図２１を参照して、イントラレイヤ間予測の第５の例について説明する。

　本例においては、輝度に関する予測モードは、＜イントラレイヤ間予測の第１の例＞～＜イントラレイヤ間予測の第４の例＞の何れかの処理によって導出される。

　また、本例においては、輝度に関する予測モードがイントラレイヤ間予測モードである場合、色差予測モード復元部１２６は、色差に関する予測モードIntraPredModeCをイントラレイヤ間予測モードに設定する。

　一方で、輝度に関する予測モードがイントラレイヤ間予測モードでない場合、色差予測モード復元部１２６は、色差に関する予測モードIntraPredModeCを、例えば、図１１（ａ）または図１１（ｂ）に示したテーブルを参照して導出する。

　図２０は、輝度に関する予測モードとしてイントラレイヤ間予測モードを切り替える構成（＜イントラレイヤ間予測の第１の例＞に対応＞を採用した場合の本例に係るシンタックスを示す図である。

　図２０に示すように、intra_layer_pred_flag[x0][y0]が真でない場合にのみ、すなわち、イントラレイヤ間予測モードでない場合にのみ、intra_chroma_pred_mode[x0][y0]が符号化及び復号される。

　図２１は、イントラレイヤ間予測モードに予測モードインデックスを割り当てる構成（＜イントラレイヤ間予測の第２の例＞～＜イントラレイヤ間予測の第４の例＞に対応）を採用した場合の本例に係るシンタックスを示す図である。

　図２１に示すように、輝度に関する予測モード（図２１において、IntraLumaPredModeと表記）がイントラレイヤ間予測（図２１においてIntra_Baseと表記）でない場合にのみ、intra_chroma_pred_mode[x0][y0]が符号化及び復号される。

　本例の処理を行うことによって、色差に関する予測モードに対しても、適切にイントラレイヤ間予測モードを適用することができるので、符号化効率が向上する。

　＜イントラレイヤ間予測の第６の例＞
　続いて、図２２及び図２３を参照して、イントラレイヤ間予測の第６の例について説明する。

　本例においては、色差予測モードとして、ＤＭモードが仮選択された場合に、色差予測モード復元部１２６は、当該ＤＭモードを実際に用いるのかまたはイントラレイヤ間予測モードを用いるのかを示すフラグを復号し、当該フラグの値に応じて、当該ＤＭモードを実際に用いるのかまたはイントラレイヤ間予測モードを用いるのかを選択する。

　図２２は、輝度に関する予測モードとしてイントラレイヤ間予測モードを切り替える構成（＜イントラレイヤ間予測の第１の例＞に対応＞を採用した場合の本例に係るシンタックスを示す図である。

　図２２に示すように、ＤＭモードが仮選択された場合、すなわち、
　chroma_pred_from_luma_enabled_flag == 1
及び
　intra_chroma_pred_mode == 5
が共に満たされる場合か、または、
　chroma_pred_from_luma_enabled_flag == 0
及び
　intra_chroma_pred_mode == 4
が共に満たさせる場合には、色差予測モード復元部１２６は、ＤＭモードを実際に用いるのかまたはイントラレイヤ間予測モードを用いるのかを示すフラグchroma_intra_layer_pred_flagを復号する。

　そして、色差予測モード復元部１２６は、当該フラグの値に応じて、ＤＭモードを実際に用いるのかまたはイントラレイヤ間予測モードを用いるのかを選択する。

　図２３は、イントラレイヤ間予測モードに予測モードインデックスを割り当てる構成（＜イントラレイヤ間予測の第２の例＞～＜イントラレイヤ間予測の第４の例＞に対応）を採用した場合の本例に係るシンタックスを示す図である。

　図２３においても同様に、ＤＭモードが選択された場合、色差予測モード復元部１２６は、ＤＭモードを実際に用いるのかまたはイントラレイヤ間予測モードを用いるのかを示すフラグchroma_intra_layer_pred_flagを復号する。

　＜イントラレイヤ間予測の第７の例＞
　続いて、図２４を参照して、イントラレイヤ間予測の第７の例について説明する。

　本例においては、輝度に関する予測モードがイントラレイヤ間予測モードである場合に、色差予測モードとしてＤＭモードが仮選択されたとき、色差予測モード復元部１２６は、当該ＤＭモードを色差に関するイントラレイヤ間予測モードであると解釈する。

　より具体的には、輝度に関する予測モードがイントラレイヤ間予測モードである場合に、色差予測モードとしてＤＭモードが仮選択されたとき（LMモード使用時にintra_chroma_pred_mode=5であるとき、または、LMモード不使用時にintra_chroma_pred_mode=4であるとき）、色差予測モード復元部１２６は、色差に関する予測モードをイントラレイヤ間予測モードに設定する。

　図２４（ａ）は、ＬＭモードを含むテーブルにおいて、ＤＭモードが、イントラレイヤ間予測モード（図２４（ａ）においてBaseと表記）として解釈されることを示している。

　図２４（ｂ）は、ＬＭモードを含まないテーブルにおいて、ＤＭモードが、イントラレイヤ間予測モードとして解釈されることを示している。

　なお、本例において、輝度に関する予測モードがイントラレイヤ間予測モードでない場合に、ＤＭモードが選択されたときには、当該ＤＭモードが実際に適用される。

　本例の処理を行うことによって、色差に関する予測モードに対しても、適切にイントラレイヤ間予測モードを適用することができる。また、符号量を増大させることなく、予測精度を向上させることができるので、符号化効率が向上する。

　＜＜推定予測モードにベースレイヤの予測モードを含める構成＞＞
　本実施形態では、上記イントラレイヤ間予測を行う構成に代えて、推定予測モードにベースレイヤの予測モードを含める構成を採用してもよい。

　より具体的には、拡張レイヤの対象ブロックの予測モードを導出する際に、時間的に拡張レイヤにおける当該対象ブロックと同時刻に位置するベースレイヤのブロックであって、空間的に該対象ブロックに対応する位置に配置されたブロックである参照ブロックに対して選択されたイントラ予測モードを、推定予測モードに含めておく構成としてもよい。

　拡張レイヤにおける対象ブロックと、ベースレイヤにおける参照ブロックとでは、解像度が異なったとしても、同様の予測方向を有している可能性が高い。

　このため、ベースレイヤの参照ブロックにおける予測モードを、拡張レイヤの対象ブロックの推定予測モードに加えておくことによって、符号化効率の向上を図ることができる。

　以下では、このような構成の具体例について説明する。

　＜推定予測モードにベースレイヤの予測モードを含める構成の第１の例＞
　本例においては、イントラ予測モード復元部１４３の備えるＭＰＭ導出部１２２は、ベースレイヤの参照ブロックの予測モードを、３つのＭＰＭのうち何れかのＭＰＭに設定する。

　本例に係るＭＰＭ導出部１２２によるＭＰＭ(candModeList[x]、x=0..2)の導出方法は、例えば以下のとおりである。

　まず、ＭＰＭ導出部１２２は、対象ブロックの左隣接ブロックの予測モードをcandIntraPredModeA、対象ブロックの上隣接ブロックの予測モードをcandIntraPredModeB、ベースレイヤの参照ブロックの予測モードをcandIntraPredModeBLとする。

　そして、本例に係るＭＰＭ導出部１２２は、
　candIntraPredModeA==candIntraPredModeBL
である場合であって、
　candIntraPredModeA<2 (Intra_PlanarかIntra_DC)
である場合に、candModeListを、
candModeList[0] = Intra_DC
candModeList[1] = Intra_Planar
に設定する。

　また、本例に係るＭＰＭ導出部１２２は、
　candIntraPredModeA==candIntraPredModeBL
である場合であって、
　candIntraPredModeA<2 (Intra_PlanarかIntra_DC)
でない場合に、candModeListを、
　candModeList[0] = candIntraPredModeBL
　candModeList[1] = Intra_Planar
に設定する。

　また、本例に係るＭＰＭ導出部１２２は、さらに、
　candIntraPredModeA==candIntraPredModeBL
である場合であって、
　candIntraPredModeA == candIntraPredModeB
である場合（すなわち、candIntraPredModeA == candIntraPredModeB == candIntraPredModeBLである場合）、
　candModeList[2] = Intra_angular(26)
に設定する。

　また、本例に係るＭＰＭ導出部１２２は、
　candIntraPredModeA==candIntraPredModeBL
である場合であって、
　candIntraPredModeA == candIntraPredModeB
でない場合、
　candModeList[2] = candIntraPredModeB
に設定する。

　また、本例に係るＭＰＭ導出部１２２は、
　candIntraPredModeA==candIntraPredModeBL
でない場合であって、
　candIntraPredModeB==candIntraPredModeBL
であり、
　candIntraPredModeB<2 (Intra_PlanarかIntra_DC)
である場合、candModeListを
　candModeList[0] = Intra_DC
　candModeList[1] = Intra_Planar
に設定する。

　また、本例に係るＭＰＭ導出部１２２は、
　candIntraPredModeA==candIntraPredModeBL
でない場合であって、
　candIntraPredModeB==candIntraPredModeBL
であり、
　candIntraPredModeB<2 (Intra_PlanarかIntra_DC)
でない場合、candModeListを
　candModeList[0] = candIntraPredModeBL
　candModeList[1] = Intra_Planar
　candModeList[2] = candIntraPredModeA
に設定する。

　以上のように、本例においては、３つのＭＰＭの何れかが、参照ブロックにおいて選択された予測モードに設定される。このため、対象ブロックにて選択される予測モードがＭＰＭに一致する可能性が高まるため、符号化効率が向上する。

　＜推定予測モードにベースレイヤの予測モードを含める構成の第２の例＞
　本例においては、ＭＰＭの個数を４個とし、そのうちの１つのＭＰＭを参照ブロックの予測モードに定める。

　このため、本例において、mpm_idxの値は0..3 となる。

　本例に係るイントラ予測モード復元部１４３の備えるＭＰＭ導出部１２２によるＭＰＭ(candModeList[x]、x=0..3)の導出方法は、例えば以下のとおりである。

　そして、本例に係るＭＰＭ導出部１２２は、
　candModeList[0] = candIntraPredModeBL
に設定する。

　また、ＭＰＭ導出部１２２は、
　candIntraPredModeA==candIntraPredModeB
が満たされており、かつ、
　candIntraPredModeA<2（Intra_PlanarかIntra_DC）
である場合、candModeList[1]～candModeList[3]を
　candModeList[1] = Intra_Planar
　candModeList[2] = Intra_DC
　candModeList[3] = Intra_Angular(26)
に設定する。ただし、このように設定したcandModeList[1]～[3]の何れかがcandIntraPredModeBLに一致する場合には、当該candIntraPredModeBLに一致するcandModeListを、Intra_Angular(10)に置き換える。

　また、ＭＰＭ導出部１２２は、
　candIntraPredModeA==candIntraPredModeB
が満たされており、かつ、
　candIntraPredModeA<2
でない場合、candModeList[1]～candModeList[3]を
　candModeList[1] = candIntraPredModeA
　candModeList[2] = 2+((candIntraPredModeA-2-1)%32
　candModeList[3] = 2+((candIntraPredModeA-2+1)%32
に設定する。ただし、このように設定したcandModeList[1]～[3]の何れかがcandIntraPredModeBLに一致する場合には、当該candIntraPredModeBLに一致するcandModeListを、Intra_Planarに置き換える。

　また、ＭＰＭ導出部１２２は、
　candIntraPredModeA != candIntraPredModeB
が満たされている場合、
　candModeList[1] = candIntraPredModeA
　candModeList[2] = candIntraPredModeB
と設定したうえで、candModeList[3]を、次のように決定する。すなわち、candModeList[1]も[2]もIntra_Planarでない場合には、
candModeList[3] = Intra_Planar
に設定し、
　candModeList[1]及び[2]の少なくとも何れかがIntra_Planarである場合であって、candModeList[1]も[2]もIntra_DCでない場合には、
　candModeList[3] = Intra_DC
に設定し、
　candModeList[1]及び[2]が、それぞれIntra_Planar及びIntra_DCであるか、Intra_DC及びIntra_Planarである場合、
　candModeList[3] = Intra_Angular(26)
に設定する。ただし、このように設定したcandModeList[1]～[3]の何れかがcandIntraPredModeBLに一致する場合には、当該candIntraPredModeBLに一致するcandModeListを、Intra_Angular(10)に置き換える。

　なお、本例においては、推定予測モードに設定するIntra_Angular予測モードの値(方向)として10(水平)および26(垂直)を用いたが、他の値を用いることもできる。

　また、本例においては、ＭＰＭの個数が４個であるため、対象ブロックの予測モードがＭＰＭと一致していない場合、以下の処理を行う。

　すなわち、対象ブロックの予測モードが推定予測モードＭＰＭと一致していない場合、予測モード復元部１２４は、符号化データに含まれるｒｅｍ＿ｉｄｘに基づいて予測モードを復元する。具体的には、まず、candModeList[0]～candModeList[3]を、小さい順にソートする。すなわち、
　（candModeList[0]のモード番号）＜（candModeList[1]のモード番号）＜（candModeList[2]のモード番号）＜（candModeList[3]のモード番号）
となるようにソートする。

　続いて、予測モード復元部１２４は、
　mode >= candModeList[0] であれば、mode = mode+1
　mode >= candModeList[1] であれば、mode = mode+1
　mode >= candModeList[2] であれば、mode = mode+1
　mode >= candModeList[3] であれば、mode = mode+1
と設定する。

　本例に係る予測モード復元部１２４は、このようにして得られたmodeに対応する予測モードを復元する。本例のようにベースレイヤの参照ブロックの予測モードを常に推定予測モードの固定的な位置に格納しておくことにより、当該位置を示すインデクスが頻繁に用いられることになり、符号化効率の向上が可能となる。なお、「固定的な位置に格納する」とは、「固定的なインデックスを付して格納する」と表現することもできる。

　＜推定予測モードにベースレイヤの予測モードを含める構成の第３の例＞
　上記＜推定予測モードにベースレイヤの予測モードを含める構成の第１の例＞及び上記＜推定予測モードにベースレイヤの予測モードを含める構成の第２の例＞において説明した処理を、特定のブロックについてのみ実行する構成としてもよい。

　例えば、ツリーブロックの先頭ブロックのみに対して、上述の処理を適用する構成としてもよい。

　このような構成とすることによって、特定のブロックについてのみ、ベースレイヤの参照ブロックの予測モードをメモリに保持しておけば足りるため、使用するメモリを削減することができる。

　なお、いずれの構成においても、ＭＰＭに予測モードが重複して選択されることがないように、予測モードの一致を判定し、一致がある場合には、未選択の予測モードから適宜選択することが望ましい。
〔階層動画像符号化装置〕
　以下では、本実施形態に係る階層動画像符号化装置２の構成について、図２５～図２７を参照して説明する。

　（階層動画像符号化装置の構成）
　図２５を用いて、階層動画像符号化装置２の概略的構成について説明すると次のとおりである。図２５は、階層動画像符号化装置２の概略的構成について示した機能ブロック図である。階層動画像符号化装置２は、対象レイヤの入力画像ＰＩＮ＃Ｔを、参照レイヤ符号化データＤＡＴＡ＃Ｒを参照しながら符号化して、対象レイヤの階層符号化データＤＡＴＡを生成する。なお、参照レイヤ符号化データＤＡＴＡ＃Ｒは、参照レイヤに対応する階層動画像符号化装置において符号化済みであるとする。

　図２５に示すように階層動画像符号化装置２は、予測パラメータ決定部２１、予測情報生成部２２、ベース復号部２３、テクスチャ情報生成部２４、可変長符号化部２５、およびＮＡＬ多重化部２６を備える。

　予測パラメータ決定部２１は、入力画像ＰＩＮ＃Ｔに基づいて、予測画像の予測に用いられる予測パラメータおよびその他の符号化の設定を決定する。

　予測パラメータ決定部２１は、予測パラメータをはじめとする符号化の設定を、以下のとおり行う。

　まず、予測パラメータ決定部２１は、入力画像ＰＩＮ＃Ｔを、スライス単位、ツリーブロック単位、ＣＵ単位に順次分割することにより、対象ＣＵについてのＣＵ画像を生成する。

　また、予測パラメータ決定部２１は、分割処理の結果に基づいて、符号化情報（ヘッダ情報とも称されることがある）を生成する。符号化情報は、（１）対象スライスに属するツリーブロックのサイズ、形状および対象スライス内での位置についての情報であるツリーブロック情報と、（２）各ツリーブロックに属するＣＵのサイズ、形状および対象ツリーブロック内での位置についての情報であるＣＵ情報とを含んでいる。

　さらに、予測パラメータ決定部２１は、ＣＵ画像、ツリーブロック情報、およびＣＵ情報を参照して、対象ＣＵの予測タイプ、対象ＣＵのＰＵへの分割情報、および、予測パラメータ（対象ＣＵが、イントラＣＵであればイントラ予測モード、インターＣＵである場合には各ＰＵにおける動き補償パラメータ）を導出する。

　予測パラメータ決定部２１は、（１）対象ＣＵの予測タイプ、（２）対象ＣＵの各ＰＵへの可能な分割パターン、および、（３）各ＰＵに割り付ける可能な予測モード（イントラＣＵであればイントラ予測モード、インターＣＵであれば動き補償パラメータ）、の全ての組み合わせについて、コストを算出し、最低コストの予測タイプ、分割パターン、および、予測モードを決定する。

　予測パラメータ決定部２１は、符号化情報および予測パラメータを予測情報生成部２２およびテクスチャ情報生成部２４に供給する。なお、説明の簡便のため図示しないが、予測パラメータ決定部２１において決定された上記の符号化の設定は、階層動画像符号化装置２の各部において参照可能とする。

　予測情報生成部２２は、予測パラメータ決定部２１から供給される予測パラメータと、参照レイヤ符号化データＤＡＴＡ＃Ｒとに基づいて予測パラメータに関するシンタックス値を含む予測情報を生成する。予測情報生成部２２は、生成した予測情報を可変長符号化部２５に供給する。なお、予測情報生成部２２は、予測パラメータを復元する際に、テクスチャ情報生成２４が備えるフレームメモリ２４４（後述）に格納された動き情報を参照することができる。

　ベース復号部２３は、階層動画像復号装置１のベース復号部１６と同様であるので、ここではその説明を省略する。

　テクスチャ情報生成部２４は、入力画像ＰＩＮ＃Ｔから予測画像を減算して得られる予測残差を、直交変換・量子化した変換係数を含む変換係数情報を生成する。テクスチャ情報生成部２４は、生成した変換係数情報を可変長符号化部２５に供給する。なお、テクスチャ情報生成２４では、復元された復号画像に関する情報が、内部に備えるフレームメモリ２４４（後述）に格納される。

　可変長符号化部２５は、予測情報生成部２２から供給される予測情報およびテクスチャ情報生成部２４から供給される変換係数情報を可変長符号化して対象レイヤ符号化データＤＡＴＡ＃Ｔを生成する。可変長符号化部２５は、生成した対象レイヤ符号化データＤＡＴＡ＃ＴをＮＡＬ多重化部２６に供給する。

　ＮＡＬ多重化部２６は、可変長符号化部２５から供給される対象レイヤ符号化データＤＡＴＡ＃Ｔと、参照レイヤ符号化データＤＡＴＡ＃ＲとをＮＡＬユニットに格納することでＮＡＬ多重化した階層動画像符号化データＤＡＴＡを生成し、外部に出力する。

　以下において、予測情報生成部２２、およびテクスチャ情報生成部２４それぞれの詳細について説明する。

　（予測情報生成部）
　図２６を用いて、予測情報生成部２２の詳細構成について説明する。図２６は、予測情報生成部２２の構成について例示した機能ブロック図である。

　図２６に示すように、予測情報生成部２２は、予測タイプ選択部２２１、スイッチ２２２、イントラ予測モード導出部２２３、動きベクトル候補導出部２２４、動き情報生成部２２５、マージ候補導出部（層間候補導出手段）２２６、およびマージ情報生成部２２７を備える。

　予測タイプ選択部２２１は、ＣＵタイプまたはＰＵタイプに応じてスイッチ２２２に切り替え指示を送り予測パラメータの導出処理を制御する。具体的には以下のとおりである。

　イントラＣＵまたはイントラＰＵが指定されている場合、予測タイプ選択部２２１はイントラ予測モード導出部２２３を用いて予測情報を導出できるようスイッチ２２２を制御する。

　インターＣＵ（マージなし）およびインターＰＵ（マージなし）のいずれかが指定されている場合、予測タイプ選択部２２１は動き情報生成部２２５を用いて予測パラメータを導出できるようスイッチ２２２を制御する。

　ベーススキップＣＵ、ベースマージＰＵ、スキップＣＵおよびマージＰＵのいずれかが指定されている場合、予測タイプ選択部２２１はマージ情報生成部２２７を用いて予測パラメータを導出できるようスイッチ２２２を制御する。

　スイッチ２２２は、予測タイプ選択部２２１の指示に応じて、予測パラメータを、イントラ予測モード導出部２２３、動き情報生成部２２５、およびマージ情報生成部２２７のいずれかに供給する。予測情報の供給先において予測パラメータが導出される。

　イントラ予測モード導出部２２３は、予測モードに関するシンタックス値を導出する。すなわち、イントラ予測モード復元部１４３が予測情報として生成するのは、予測モードに関するシンタックス値である。

　イントラ予測モード導出部２２３による具体的処理には、イントラ予測モード復元部１４３に関して説明した処理に対応する処理、特に、＜イントラレイヤ間予測の第１の例＞～＜イントラレイヤ間予測の第７の例＞、及び＜予測モード群にベースレイヤの予測モードを追加する構成の第１の例＞～＜予測モード群にベースレイヤの予測モードを追加する構成の第３の例＞に記載した処理に対応する処理が含まれる。ただし、これらの説明における「イントラ予測モード復元部１４３」は、「イントラ予測モード導出部２２３」と読み替えるものとし、「ＭＰＭ導出部１２２」は、「イントラ予測モード導出部２２３の備えるＭＰＭ導出部」と読み替えるものとする。

　動きベクトル候補導出部２２４は、ベース復号情報を用いて、レイヤ内動き推定処理、または、レイヤ間動き推定処理により推定動きベクトルの候補を導出する。動きベクトル候補導出部２２４は、導出した動きベクトルの候補を動き情報生成部２２５に供給する。

　動き情報生成部２２５は、マージを行わない各インター予測パーティションにおける動き情報に関するシンタックス値を生成する。すなわち、動き情報復元部１４５が予測情報として生成するのは動き情報に関するシンタックス値である。具体的には、動き情報生成部２２５は、各ＰＵにおける動き補償パラメータから、対応するシンタックス要素値であるinter_pred_flag、mvd、mvp_idx、および、refIdxを導出する。

　具体的には、動き情報生成部２２５は、対象ＰＵがベースマージＰＵである場合、動きベクトル候補導出部２２４から供給される動きベクトルの候補に基づいて、上記シンタックス値を導出する。

　一方、動き情報復元部１４５は、対象ＣＵ（ＰＵ）がマージを行わないインターＣＵ（インターＰＵ）である場合、予測パラメータに含まれる動き情報に基づいて、上記シンタックス値を導出する。

　マージ候補導出部２２６は、後述するフレームメモリ１５５から供給される復号済みの動き情報および／またはベース復号部２３から供給されるベース復号情報等を用いて、各ＰＵにおける動き補償パラメータと類似の動き補償パラメータを有するマージ候補を導出する。マージ候補導出部２２６は、導出したマージ候補をマージ情報生成部２２７に供給する。マージ候補導出部２２６の構成は、階層動画像復号装置１に含まれるマージ候補導出部１４６の構成と同様であるので、その説明を省略する。

　マージ情報生成部２２７は、マージを行う各インター予測パーティションに関する動き情報に関するシンタックス値を生成する。すなわち、マージ情報生成部２２７が予測情報として生成するのは動き情報に関するシンタックス値である。具体的には、マージ情報生成部２２７は、各ＰＵにおける動き補償パラメータと類似の動き補償パラメータを有するマージ候補を指定するシンタックス要素値merge_idxを出力する。

　（テクスチャ情報生成部）
　図２７を用いて、テクスチャ情報生成部２４の詳細構成について説明する。図２７は、テクスチャ情報生成部２４の構成について例示した機能ブロック図である。

　図２７に示すように、テクスチャ情報生成部２４は、テクスチャ予測部２４１、減算器２４２、直交変換・量子化部２４３、逆直交変換・逆量子化部２４４、加算器２４５、ループフィルタ部２４６、およびフレームメモリ２４７を備える。

　減算器２４２は、入力画像ＰＩＮ＃Ｔからテクスチャ予測部２４１から供給される予測画像を減算することによって、予測残差Ｄを生成する。減算器２４２は、生成した予測残差Ｄを、変換・量子化部２４３に供給する。

　直交変換・量子化部２４３は、予測残差Ｄに対して、直交変換および量子化を行うことで量子化予測残差を生成する。なお、ここで直交変換とは、画素領域から周波数領域への直交変換のことをさす。また、直交変換の例としては、ＤＣＴ変換（Discrete Cosine Transform）、およびＤＳＴ変換（Discrete Sine Transform）等が挙げられる。また、具体的な量子化過程については、すでに説明した通りであるので、ここではその説明を省略する。直交変換・量子化部２４３は、生成した量子化予測残差を含む変換係数情報を逆変換・逆量子化部２４４および可変長符号化部２５に供給する。

　テクスチャ予測部２４１、逆直交変換・逆量子化部２４４、加算器２４５、ループフィルタ部２４６、およびフレームメモリ２４７は、それぞれ、階層動画像復号装置１に含まれるテクスチャ予測部１５２、逆直交変換・逆量子化部１５１、加算器１５３、ループフィルタ部１５４、およびフレームメモリ１５５と同様であるので、ここではその説明は省略する。ただし、テクスチャ予測部２４１は、加算器２４５だけでなく減算器２４２にも予測画像を供給する。

　（他の階層動画像符号化／復号システムへの適用例）
　上述した階層動画像符号化装置２及び階層動画像復号装置１は、動画像の送信、受信、記録、再生を行う各種装置に搭載して利用することができる。なお、動画像は、カメラ等により撮像された自然動画像であってもよいし、コンピュータ等により生成された人工動画像（ＣＧおよびＧＵＩを含む）であってもよい。

　図２８に基づいて、上述した階層動画像符号化装置２および階層動画像復号装置１を、動画像の送信および受信に利用できることを説明する。図２８の（ａ）は、階層動画像符号化装置２を搭載した送信装置ＰＲＯＤ＿Ａの構成を示したブロック図である。

　図２８の（ａ）に示すように、送信装置ＰＲＯＤ＿Ａは、動画像を符号化することによって符号化データを得る符号化部ＰＲＯＤ＿Ａ１と、符号化部ＰＲＯＤ＿Ａ１が得た符号化データで搬送波を変調することによって変調信号を得る変調部ＰＲＯＤ＿Ａ２と、変調部ＰＲＯＤ＿Ａ２が得た変調信号を送信する送信部ＰＲＯＤ＿Ａ３とを備えている。上述した階層動画像符号化装置２は、この符号化部ＰＲＯＤ＿Ａ１として利用される。

　送信装置ＰＲＯＤ＿Ａは、符号化部ＰＲＯＤ＿Ａ１に入力する動画像の供給源として、動画像を撮像するカメラＰＲＯＤ＿Ａ４、動画像を記録した記録媒体ＰＲＯＤ＿Ａ５、動画像を外部から入力するための入力端子ＰＲＯＤ＿Ａ６、及び、画像を生成または加工する画像処理部Ａ７を更に備えていてもよい。図２８の（ａ）においては、これら全てを送信装置ＰＲＯＤ＿Ａが備えた構成を例示しているが、一部を省略しても構わない。

　なお、記録媒体ＰＲＯＤ＿Ａ５は、符号化されていない動画像を記録したものであってもよいし、伝送用の符号化方式とは異なる記録用の符号化方式で符号化された動画像を記録したものであってもよい。後者の場合、記録媒体ＰＲＯＤ＿Ａ５と符号化部ＰＲＯＤ＿Ａ１との間に、記録媒体ＰＲＯＤ＿Ａ５から読み出した符号化データを記録用の符号化方式に従って復号する復号部（不図示）を介在させるとよい。

　図２８の（ｂ）は、階層動画像復号装置１を搭載した受信装置ＰＲＯＤ＿Ｂの構成を示したブロック図である。図２８の（ｂ）に示すように、受信装置ＰＲＯＤ＿Ｂは、変調信号を受信する受信部ＰＲＯＤ＿Ｂ１と、受信部ＰＲＯＤ＿Ｂ１が受信した変調信号を復調することによって符号化データを得る復調部ＰＲＯＤ＿Ｂ２と、復調部ＰＲＯＤ＿Ｂ２が得た符号化データを復号することによって動画像を得る復号部ＰＲＯＤ＿Ｂ３とを備えている。上述した階層動画像復号装置１は、この復号部ＰＲＯＤ＿Ｂ３として利用される。

　受信装置ＰＲＯＤ＿Ｂは、復号部ＰＲＯＤ＿Ｂ３が出力する動画像の供給先として、動画像を表示するディスプレイＰＲＯＤ＿Ｂ４、動画像を記録するための記録媒体ＰＲＯＤ＿Ｂ５、及び、動画像を外部に出力するための出力端子ＰＲＯＤ＿Ｂ６を更に備えていてもよい。図２８の（ｂ）においては、これら全てを受信装置ＰＲＯＤ＿Ｂが備えた構成を例示しているが、一部を省略しても構わない。

　なお、記録媒体ＰＲＯＤ＿Ｂ５は、符号化されていない動画像を記録するためのものであってもよいし、伝送用の符号化方式とは異なる記録用の符号化方式で符号化されたものであってもよい。後者の場合、復号部ＰＲＯＤ＿Ｂ３と記録媒体ＰＲＯＤ＿Ｂ５との間に、復号部ＰＲＯＤ＿Ｂ３から取得した動画像を記録用の符号化方式に従って符号化する符号化部（不図示）を介在させるとよい。

　なお、変調信号を伝送する伝送媒体は、無線であってもよいし、有線であってもよい。また、変調信号を伝送する伝送態様は、放送（ここでは、送信先が予め特定されていない送信態様を指す）であってもよいし、通信（ここでは、送信先が予め特定されている送信態様を指す）であってもよい。すなわち、変調信号の伝送は、無線放送、有線放送、無線通信、及び有線通信の何れによって実現してもよい。

　例えば、地上デジタル放送の放送局（放送設備など）／受信局（テレビジョン受像機など）は、変調信号を無線放送で送受信する送信装置ＰＲＯＤ＿Ａ／受信装置ＰＲＯＤ＿Ｂの一例である。また、ケーブルテレビ放送の放送局（放送設備など）／受信局（テレビジョン受像機など）は、変調信号を有線放送で送受信する送信装置ＰＲＯＤ＿Ａ／受信装置ＰＲＯＤ＿Ｂの一例である。

　また、インターネットを用いたＶＯＤ（Video On Demand）サービスや動画共有サービスなどのサーバ（ワークステーションなど）／クライアント（テレビジョン受像機、パーソナルコンピュータ、スマートフォンなど）は、変調信号を通信で送受信する送信装置ＰＲＯＤ＿Ａ／受信装置ＰＲＯＤ＿Ｂの一例である（通常、ＬＡＮにおいては伝送媒体として無線又は有線の何れかが用いられ、ＷＡＮにおいては伝送媒体として有線が用いられる）。ここで、パーソナルコンピュータには、デスクトップ型ＰＣ、ラップトップ型ＰＣ、及びタブレット型ＰＣが含まれる。また、スマートフォンには、多機能携帯電話端末も含まれる。

　なお、動画共有サービスのクライアントは、サーバからダウンロードした符号化データを復号してディスプレイに表示する機能に加え、カメラで撮像した動画像を符号化してサーバにアップロードする機能を有している。すなわち、動画共有サービスのクライアントは、送信装置ＰＲＯＤ＿Ａ及び受信装置ＰＲＯＤ＿Ｂの双方として機能する。

　図２９に基づいて、上述した階層動画像符号化装置２および階層動画像復号装置１を、動画像の記録および再生に利用できることを説明する。図２９の（ａ）は、上述した階層動画像符号化装置２を搭載した記録装置ＰＲＯＤ＿Ｃの構成を示したブロック図である。

　図２９の（ａ）に示すように、記録装置ＰＲＯＤ＿Ｃは、動画像を符号化することによって符号化データを得る符号化部ＰＲＯＤ＿Ｃ１と、符号化部ＰＲＯＤ＿Ｃ１が得た符号化データを記録媒体ＰＲＯＤ＿Ｍに書き込む書込部ＰＲＯＤ＿Ｃ２と、を備えている。上述した階層動画像符号化装置２は、この符号化部ＰＲＯＤ＿Ｃ１として利用される。

　なお、記録媒体ＰＲＯＤ＿Ｍは、（１）ＨＤＤ（Hard Disk Drive）やＳＳＤ(Solid State Drive)等のように、記録装置ＰＲＯＤ＿Ｃに内蔵されるタイプのものであってもよいし、（２）ＳＤメモリカードやＵＳＢ（Universal Serial Bus）フラッシュメモリ等のように、記録装置ＰＲＯＤ＿Ｃに接続されるタイプのものであってもよいし、（３）ＤＶＤ（Digital Versatile Disc）やＢＤ（Blu-ray Disc:登録商標）等のように、記録装置ＰＲＯＤ＿Ｃに内蔵されたドライブ装置（不図示）に装填されるものであってもよい。

　また、記録装置ＰＲＯＤ＿Ｃは、符号化部ＰＲＯＤ＿Ｃ１に入力する動画像の供給源として、動画像を撮像するカメラＰＲＯＤ＿Ｃ３、動画像を外部から入力するための入力端子ＰＲＯＤ＿Ｃ４、動画像を受信するための受信部ＰＲＯＤ＿Ｃ５、及び、画像を生成または加工する画像処理部Ｃ６を更に備えていてもよい。図２９の（ａ）においては、これら全てを記録装置ＰＲＯＤ＿Ｃが備えた構成を例示しているが、一部を省略しても構わない。

　なお、受信部ＰＲＯＤ＿Ｃ５は、符号化されていない動画像を受信するものであってもよいし、記録用の符号化方式とは異なる伝送用の符号化方式で符号化された符号化データを受信するものであってもよい。後者の場合、受信部ＰＲＯＤ＿Ｃ５と符号化部ＰＲＯＤ＿Ｃ１との間に、伝送用の符号化方式で符号化された符号化データを復号する伝送用復号部（不図示）を介在させるとよい。

　このような記録装置ＰＲＯＤ＿Ｃとしては、例えば、ＤＶＤレコーダ、ＢＤレコーダ、ＨＤＤ（Hard Disk Drive）レコーダなどが挙げられる（この場合、入力端子ＰＲＯＤ＿Ｃ４又は受信部ＰＲＯＤ＿Ｃ５が動画像の主な供給源となる）。また、カムコーダ（この場合、カメラＰＲＯＤ＿Ｃ３が動画像の主な供給源となる）、パーソナルコンピュータ（この場合、受信部ＰＲＯＤ＿Ｃ５又は画像処理部Ｃ６が動画像の主な供給源となる）、スマートフォン（この場合、カメラＰＲＯＤ＿Ｃ３又は受信部ＰＲＯＤ＿Ｃ５が動画像の主な供給源となる）なども、このような記録装置ＰＲＯＤ＿Ｃの一例である。

　図２９の（ｂ）は、上述した階層動画像復号装置１を搭載した再生装置ＰＲＯＤ＿Ｄの構成を示したブロックである。図２９の（ｂ）に示すように、再生装置ＰＲＯＤ＿Ｄは、記録媒体ＰＲＯＤ＿Ｍに書き込まれた符号化データを読み出す読出部ＰＲＯＤ＿Ｄ１と、読出部ＰＲＯＤ＿Ｄ１が読み出した符号化データを復号することによって動画像を得る復号部ＰＲＯＤ＿Ｄ２と、を備えている。上述した階層動画像復号装置１は、この復号部ＰＲＯＤ＿Ｄ２として利用される。

　なお、記録媒体ＰＲＯＤ＿Ｍは、（１）ＨＤＤやＳＳＤなどのように、再生装置ＰＲＯＤ＿Ｄに内蔵されるタイプのものであってもよいし、（２）ＳＤメモリカードやＵＳＢフラッシュメモリなどのように、再生装置ＰＲＯＤ＿Ｄに接続されるタイプのものであってもよいし、（３）ＤＶＤやＢＤなどのように、再生装置ＰＲＯＤ＿Ｄに内蔵されたドライブ装置（不図示）に装填されるものであってもよい。

　また、再生装置ＰＲＯＤ＿Ｄは、復号部ＰＲＯＤ＿Ｄ２が出力する動画像の供給先として、動画像を表示するディスプレイＰＲＯＤ＿Ｄ３、動画像を外部に出力するための出力端子ＰＲＯＤ＿Ｄ４、及び、動画像を送信する送信部ＰＲＯＤ＿Ｄ５を更に備えていてもよい。図２９の（ｂ）においては、これら全てを再生装置ＰＲＯＤ＿Ｄが備えた構成を例示しているが、一部を省略しても構わない。

　なお、送信部ＰＲＯＤ＿Ｄ５は、符号化されていない動画像を送信するものであってもよいし、記録用の符号化方式とは異なる伝送用の符号化方式で符号化された符号化データを送信するものであってもよい。後者の場合、復号部ＰＲＯＤ＿Ｄ２と送信部ＰＲＯＤ＿Ｄ５との間に、動画像を伝送用の符号化方式で符号化する符号化部（不図示）を介在させるとよい。

　このような再生装置ＰＲＯＤ＿Ｄとしては、例えば、ＤＶＤプレイヤ、ＢＤプレイヤ、ＨＤＤプレイヤなどが挙げられる（この場合、テレビジョン受像機等が接続される出力端子ＰＲＯＤ＿Ｄ４が動画像の主な供給先となる）。また、テレビジョン受像機（この場合、ディスプレイＰＲＯＤ＿Ｄ３が動画像の主な供給先となる）、デジタルサイネージ（電子看板や電子掲示板等とも称され、ディスプレイＰＲＯＤ＿Ｄ３又は送信部ＰＲＯＤ＿Ｄ５が動画像の主な供給先となる）、デスクトップ型ＰＣ（この場合、出力端子ＰＲＯＤ＿Ｄ４又は送信部ＰＲＯＤ＿Ｄ５が動画像の主な供給先となる）、ラップトップ型又はタブレット型ＰＣ（この場合、ディスプレイＰＲＯＤ＿Ｄ３又は送信部ＰＲＯＤ＿Ｄ５が動画像の主な供給先となる）、スマートフォン（この場合、ディスプレイＰＲＯＤ＿Ｄ３又は送信部ＰＲＯＤ＿Ｄ５が動画像の主な供給先となる）なども、このような再生装置ＰＲＯＤ＿Ｄの一例である。

　（ハードウェア的実現およびソフトウェア的実現について）
　最後に、階層動画像復号装置１、階層動画像符号化装置２の各ブロックは、集積回路（ＩＣチップ）上に形成された論理回路によってハードウェア的に実現してもよいし、ＣＰＵ（Central Processing Unit）を用いてソフトウェア的に実現してもよい。

　後者の場合、上記各装置は、各機能を実現する制御プログラムの命令を実行するＣＰＵ、上記プログラムを格納したＲＯＭ（Read Only Memory）、上記プログラムを展開するＲＡＭ（Random Access Memory）、上記プログラムおよび各種データを格納するメモリ等の記憶装置（記録媒体）などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアである上記各装置の制御プログラムのプログラムコード（実行形式プログラム、中間コードプログラム、ソースプログラム）をコンピュータで読み取り可能に記録した記録媒体を、上記各装置に供給し、そのコンピュータ（またはＣＰＵやＭＰＵ（Micro Processing Unit））が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。

　上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ類、フロッピー（登録商標）ディスク／ハードディスク等の磁気ディスクやＣＤ－ＲＯＭ（Compact Disc Read-Only Memory）／ＭＯ（Magneto-Optical）／ＭＤ（Mini Disc）／ＤＶＤ（Digital Versatile Disk）／ＣＤ－Ｒ（CD Recordable）等の光ディスクを含むディスク類、ＩＣカード（メモリカードを含む）／光カード等のカード類、マスクＲＯＭ／ＥＰＲＯＭ（Erasable Programmable Read-only Memory）／ＥＥＰＲＯＭ（登録商標）（Electrically Erasable and Programmable Read-only Memory）／フラッシュＲＯＭ等の半導体メモリ類、あるいはＰＬＤ（Programmable Logic Device）やＦＰＧＡ（Field Programmable Gate Array）等の論理回路類などを用いることができる。

　また、上記各装置を通信ネットワークと接続可能に構成し、上記プログラムコードを通信ネットワークを介して供給してもよい。この通信ネットワークは、プログラムコードを伝送可能であればよく、特に限定されない。例えば、インターネット、イントラネット、エキストラネット、ＬＡＮ（Local Area Network）、ＩＳＤＮ（Integrated Services Digital Network）、ＶＡＮ（Value-Added Network）、ＣＡＴＶ（Community Antenna Television）通信網、仮想専用網（Virtual Private Network）、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、この通信ネットワークを構成する伝送媒体も、プログラムコードを伝送可能な媒体であればよく、特定の構成または種類のものに限定されない。例えば、ＩＥＥＥ（Institute of Electrical and Electronic Engineers）１３９４、ＵＳＢ、電力線搬送、ケーブルＴＶ回線、電話線、ＡＤＳＬ（Asymmetric Digital Subscriber Line）回線等の有線でも、ＩｒＤＡ（Infrared Data Association）やリモコンのような赤外線、Ｂｌｕｅｔｏｏｔｈ（登録商標）、ＩＥＥＥ８０２．１１無線、ＨＤＲ（High Data Rate）、ＮＦＣ（Near Field Communication）、ＤＬＮＡ（Digital Living Network Alliance）、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。

　本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。

　本発明は、画像データが階層的に符号化された符号化データを復号する階層画像復号装置、および、画像データが階層的に符号化された符号化データを生成する階層画像符号化装置に好適に適用することができる。また、階層画像符号化装置によって生成され、階層画像復号装置によって参照される階層符号化データのデータ構造に好適に適用することができる。

　１　　　　　階層動画像復号装置（画像復号装置）
　１１　　　　ＮＡＬ逆多重化部
　１２　　　　可変長復号部
　１３　　　　ベース復号部
　１４　　　　予測パラメータ復元部
　１５　　　　テクスチャ復元部
　１５２　　　テクスチャ予測部
　１５２Ｃ　　レイヤ間イントラ予測部（予測画像生成手段）
　１４３　　　イントラ予測モード復元部（選択手段）
　１２２　　　ＭＰＭ導出部
　１２３　　　ＭＰＭ判定部
　１２４　　　予測モード復元部
　１２６　　　色差予測モード復元部
　１２７　　　コンテキスト記憶部
　２　　　　　階層動画像符号化装置（画像符号化装置）
　２１　　　　予測パラメータ決定部
　２２　　　　予測情報生成部
　２２３　　　イントラ予測モード導出部（選択手段）
　２３　　　　ベース復号部
　２４　　　　テクスチャ情報生成部
　２４１　　　テクスチャ予測部
　２４１Ｃ　　レイヤ間イントラ予測部（予測画像生成手段）
　２５　　　　可変長符号化部
　２６　　　　ＮＡＬ多重化部

Claims

　階層符号化された符号化データに含まれる上位レイヤの符号化データを復号し、下位レイヤからの復号画像を参照して生成した上位レイヤの予測画像を用いて上位レイヤの復号画像を復元する画像復号装置であって、
　符号化データを参照し、予め定められた複数のイントラ予測モードの少なくとも一部を含む予測モード群から、一の予測モードを選択する選択手段と、
　上記選択手段によって選択された予測モードに基づいて、上位レイヤにおける対象予測単位の予測画像を生成する予測画像生成手段と
を備え、
　上記予測モード群には、上位レイヤにおける対象予測単位の予測画像を、下位レイヤにおける、時間的に該対象予測単位と同時刻に位置する予測単位であって、空間的に該対象予測単位に対応する位置に配置された予測単位である参照予測単位の復号画像に基づいて生成するイントラレイヤ間予測モードが含まれており、
　上記選択手段は、符号化データに含まれるシンタックスであって、上記イントラレイヤ間予測モードと上記複数のイントラ予測モードとに関する共通のシンタックスを参照することによって、一の予測モードを選択する
ことを特徴とする画像復号装置。
　上記予測モード群には、上記予め定められた複数のイントラ予測モードの何れか１つの予測モードに代えて、上記イントラレイヤ間予測モードが含まれている、
ことを特徴とする請求項１に記載の画像復号装置。
　上記予測モード群には、上記予め定められた複数のイントラ予測モードに加えて、上記イントラレイヤ間予測モードが含まれている、
ことを特徴とする請求項１に記載の画像復号装置。
　上記予測モード群には、上記イントラレイヤ間予測モードが複数種類含まれており、
　上記選択手段は、上記複数種類のイントラレイヤ間予測モードの何れかを、符号化データに含まれるフラグを参照することによって選択する、
ことを特徴とする請求項１に記載の画像復号装置。
　上記予測モード群には、上記イントラレイヤ間予測モードが複数種類含まれており、
　上記選択手段は、符号化データに含まれるシンタックスであって、上記複数種類のイントラレイヤ間予測モードと上記複数のイントラ予測モードとに関する共通のシンタックスを参照することによって、一の予測モードを選択する、
ことを特徴とする請求項１に記載の画像復号装置。
　階層符号化された符号化データに含まれる上位レイヤの符号化データを復号し、下位レイヤからの復号画像を参照して生成した上位レイヤの予測画像を用いて上位レイヤの復号画像を復元する画像復号装置であって、
　符号化データを参照し、予め定められた複数のイントラ予測モードの少なくとも一部を含む予測モード群から、一の予測モードを選択する選択手段と、
　上記選択手段によって選択された予測モードに基づいて、上位レイヤにおける対象予測単位の予測画像を生成する予測画像生成手段と
を備え、
　上記予測モード群には、上位レイヤにおける対象予測単位の予測画像を、下位レイヤにおける、時間的に該対象予測単位と同時刻に位置する予測単位であって、空間的に該対象予測単位に対応する位置に配置された予測単位である参照予測単位の復号画像に基づいて生成するイントラレイヤ間予測モードが含まれており、
　上記選択手段は、符号化データに含まれるシンタックスであって、上記イントラレイヤ間予測モードを選択するか否かを示すフラグを参照することによって、一の予測モードを選択する
ことを特徴とする画像復号装置。
　上記予測モード群に含まれる予測モードは、輝度に関する予測モードであり、
　上記選択手段は、輝度に関する予測モードとして上記イントラレイヤ間予測モードを選択した場合、色差に関する予測モードとして、上位レイヤにおける対象予測単位の予測画像を、下位レイヤにおける、時間的に該対象予測単位と同時刻に位置する予測単位であって、空間的に該対象予測単位に対応する位置に配置された予測単位である参照予測単位の復号画像に基づいて生成するイントラレイヤ間予測モードを選択する
ことを特徴とする請求項１から６の何れか１項に記載の画像復号装置。
　上記予測モード群に含まれる予測モードは、輝度に関する予測モードであり、
　色差に関する予測モード群には、輝度に関して選択された予測モードと同一の予測モードを用いるモードであるＤＭモードが含まれており、
　上記選択手段は、上記ＤＭモードを仮選択した場合、符号化データに含まれるフラグの値を参照し、色差に関する予測モードとして、上記ＤＭモードを実際に選択するのか、それとも、上位レイヤにおける対象予測単位の予測画像を、下位レイヤにおける、時間的に該対象予測単位と同時刻に位置する予測単位であって、空間的に該対象予測単位に対応する位置に配置された予測単位である参照予測単位の復号画像に基づいて生成するイントラレイヤ間予測モードを選択するのかを決定する
ことを特徴とする請求項１から６の何れか１項に記載の画像復号装置。
　上記予測モード群に含まれる予測モードは、輝度に関する予測モードであり、
　色差に関する予測モード群には、輝度に関して選択された予測モードと同一の予測モードを用いるモードであるＤＭモードが含まれており、
　上記選択手段は、上記ＤＭモードを仮選択した場合、色差に関する予測モードとして、上位レイヤにおける対象予測単位の予測画像を、下位レイヤにおける、時間的に該対象予測単位と同時刻に位置する予測単位であって、空間的に該対象予測単位に対応する位置に配置された予測単位である参照予測単位の復号画像に基づいて生成するイントラレイヤ間予測モードを選択する
ことを特徴とする請求項１から６の何れか１項に記載の画像復号装置。
　階層符号化された符号化データに含まれる上位レイヤの符号化データを復号し、下位レイヤからの復号画像を参照して生成した上位レイヤの予測画像を用いて上位レイヤの復号画像を復元する画像復号装置であって、
　予め定められた複数のイントラ予測モードを含む予測モード群から一の予測モードを選択する選択手段と、
　上記選択手段によって選択された予測モードに基づいて、上位レイヤの対象予測単位における予測画像を生成する予測画像生成手段と
を備え、
　上記予測モード群には、上位レイヤにおける対象予測単位と同時刻に位置する下位レイヤの予測単位であって、空間的に該対象予測単位に対応する位置に配置された予測単位である参照予測単位に対して選択されたイントラ予測モードが含まれている、
ことを特徴とする画像復号装置。
　上記選択手段は、上記予め定められた複数のイントラ予測モードの一部を含むように設定された推定予測モード群であって、上記対象予測単位の周辺の予測単位に割り付けられた予測モードに応じて定まる推定予測モード群から、一の予測モードを選択するものであり、
　上記推定予測モード群は、上記参照予測単位に対して選択されたイントラ予測モードを含むように設定されている、
ことを特徴とする請求項１０に記載の画像復号装置。
　上記推定予測モード群に含まれる推定予測モードは、インデックスによって互いに識別されるものであり、
　上記推定予測モード群に含まれる上記参照予測単位に対して選択されたイントラ予測モードには、固定的なインデックスが付されている、
ことを特徴とする請求項１１に記載の画像復号装置。
　上記対象予測単位が、符号化単位において処理順で特定の位置を有する予測単位である場合に限って、上記予測モード群には、上記参照予測単位に対して選択されたイントラ予測モードが含まれている、
ことを特徴とする請求項１０に記載の画像復号装置。
　原画像から下位レイヤからの復号画像を参照して生成した上位レイヤの予測画像を減算して得られる残差を階層符号化して上位レイヤの符号化データを生成する画像符号化装置であって、
　予め定められた複数のイントラ予測モードの少なくとも一部を含む予測モード群から、一の予測モードを選択する選択手段と、
　上記選択手段によって選択された予測モードに基づいて、上位レイヤにおける対象予測単位の予測画像を生成する予測画像生成手段と
を備え、
　上記予測モード群には、上位レイヤにおける対象予測単位の予測画像を、下位レイヤにおける、時間的に該対象予測単位と同時刻に位置する予測単位であって、空間的に該対象予測単位に対応する位置に配置された予測単位である参照予測単位の復号画像に基づいて生成するイントラレイヤ間予測モードが含まれており、
　上記イントラレイヤ間予測モードと、上記複数のイントラ予測モードとは、共通のシンタックスを用いて指定されている、
ことを特徴とする画像符号化装置。