JP2024060093A

JP2024060093A - 変換に基づく画像コーディング方法及びその装置

Info

Publication number: JP2024060093A
Application number: JP2024042337A
Authority: JP
Inventors: ムンモク; Moonmo Koo; スンファンキム; Sunfan Kim; チェヒョンイム; Jaehyun Lim
Original assignee: LG Electronics Inc
Current assignee: LG Electronics Inc
Priority date: 2020-01-10
Filing date: 2024-03-18
Publication date: 2024-05-01
Anticipated expiration: 2041-01-11
Also published as: JP2023510338A; CN115066904A; KR20220097519A; ZA202207720B; WO2021141472A1; CN115066904B; JP7458489B2; US20250254316A1; EP4090031A1; US12316848B2; JP7777619B2; CN121000870A; CN120956898A; EP4090031A4; JP2026012562A; US20230036126A1; CN120956899A

Abstract

【課題】変換に基づき画像符号化効率を高める画像コーディング方法を提供する。
【解決手段】本文書による画像デコーディング方法は、変換係数にＬＦＮＳＴを適用して修正された変換係数を導出するステップ、前記修正された変換係数に対する逆１次変換に基づいて前記対象ブロックに対する残差サンプルを導出するステップを含むが、前記変換係数を導出するステップは、ＬＦＮＳＴの適用有無及び前記現在のブロックのツリータイプに基づいて前記現在のブロックにスケーリングリストが適用されるか否かを判断するステップ、判断結果に基づいて残差情報から前記現在のブロックに対する変換係数を導出するステップを含み、前記現在のブロックのツリータイプがシングルツリーで、クロマ要素であれば、前記スケーリングリストを適用することができる。
【選択図】図１５

Description

本文書は、画像コーディング技術に関し、より詳細には、画像コーディングシステムにおいて変換（ｔｒａｎｓｆｏｒｍ）に基づく画像コーディング方法及びその装置に関する。

近年、４Ｋまたは８Ｋ以上のＵＨＤ（ＵｌｔｒａＨｉｇｈＤｅｆｉｎｉｔｉｏｎ）画像／ビデオのような高解像度、高品質の画像／ビデオに対する需要が様々な分野で増加している。画像／ビデオデータが高解像度、高品質になるほど、既存の画像／ビデオデータに比べて相対的に送信される情報量またはビット量が増加するので、既存の有無線広帯域回線のような媒体を利用して画像データを送信するか、既存の格納媒体を利用して画像／ビデオデータを格納する場合、送信費用と格納費用が増加する。

また、近年、ＶＲ（ＶｉｒｔｕａｌＲｅａｌｉｔｙ）、ＡＲ（ＡｒｔｉｆｉｃｉａｌＲｅａｌｔｉｙ）コンテンツやホログラムなどの実感メディア（ＩｍｍｅｒｓｉｖｅＭｅｄｉａ）に対する関心及び需要が増加しており、ゲーム画像のように、現実画像と異なる画像特性を有する画像／ビデオに対する放送が増加している。

これにより、前記のような様々な特性を有する高解像度高品質の画像／ビデオの情報を効果的に圧縮して送信するか格納し、再生するために高効率の画像／ビデオ圧縮技術が求められる。

本文書の技術的課題は画像符号化効率を高める方法及び装置を提供することである。

本文書の別の技術的課題は量子化効率を高める方法及び装置を提供することである。

本文書のもう１つの技術的課題はシングルツリータイプ時のクロマ要素に対する量子化効率を高める方法及び装置を提供することである。

本文書の一実施例によれば、デコーディング装置によって実行される画像デコーディング方法を提供する。前記方法は変換係数にＬＦＮＳＴを適用して修正された変換係数を導出するステップ、前記修正された変換係数に対する逆１次変換に基づいて前記対象ブロックに対する残差サンプルを導出するステップを含むが、前記変換係数を導出するステップは、ＬＦＮＳＴが適用されるか否か及び前記現在のブロックのツリータイプに基づいて前記現在のブロックにスケーリングリストが適用されるか否かを判断するステップと、判断結果に基づいて残差情報から前記現在のブロックに対する変換係数を導出するステップを含み、前記現在のブロックのツリータイプがシングルツリーであり、クロマ要素であれば、前記スケーリングリストを適用することができる。

前記現在のブロックの前記クロマ要素には前記ＬＦＮＳＴが適用されない場合がある。

前記現在のブロックのツリータイプがシングルツリーであり、前記現在のブロックにＬＦＮＳＴが実行されれば、前記現在のブロックのルマ要素に前記スケーリングリストが適用されない場合がある。

前記ＬＦＮＳＴが実行されるとき、前記スケーリングリストの可用性を指示するフラグ情報をさらに受信することができる。

前記フラグ情報が前記スケーリングリストが可用ではないことを示し、前記ＬＦＮＳＴインデクスが０より大きい場合、前記ルマ要素に前記スケーリングリストが適用されない場合がある。

前記フラグ情報が前記スケーリングリストが可用ではないことを示し、前記ＬＦＮＳＴインデクスが０より大きい場合、前記現在のブロックのツリータイプがデュアルツリークロマであれば、前記クロマ要素に前記スケーリングリストが適用されない場合がある。

前記フラグ情報が前記スケーリングリストが可用ではないことを示し、前記ＬＦＮＳＴインデクスが０より大きい場合、前記現在のブロックのツリータイプがデュアルツリールマであれば、前記ルマ要素に前記スケーリングリストが適用されない場合がある。

本文書の一実施例によれば、エンコーディング装置によって実行される画像エンコーディング方法を提供する。前記方法は変換過程に基づいて現在のブロックに対する残差サンプルから前記現在のブロックに対する変換係数を導出するステップ、前記変換過程においてＬＦＮＳＴが実行されるか否か及び前記現在のブロックのツリータイプに基づいて前記現在のブロックに前記スケーリングリストが適用されるか否かを決定するステップと、前記決定に基づいて前記変換係数を量子化するステップを含むが、前記現在のブロックのツリータイプがシングルツリーであり、クロマ要素であれば、前記スケーリングリストを適用することができる。

本文書のもう１つの一実施例によれば、エンコーディング装置によって実行された画像エンコーディング方法によって生成されたエンコーディングされた画像情報及びビットストリームが含まれた画像データが格納されたデジタル記憶媒体が提供される。

本文書のもう１つの一実施例によれば、デコーディング装置によって前記画像デコーディング方法を実行するためのエンコーディングされた画像情報及びビットストリームが含まれた画像データが格納されたデジタル記憶媒体が提供される。

本文書によれば、全体的な画像／ビデオ圧縮効率を高めることができる。

本文書によれば、量子化効率を高めることができる。

本文書によれば、変換シングルツリータイプ時のクロマ要素に対する量子化効率を高めることができる。

本明細書の具体的な一例を介して得られる効果は、以上で羅列された効果に制限されない。例えば、関連する技術分野における通常の知識を有する者（ａｐｅｒｓｏｎｈａｖｉｎｇｏｒｄｉｎａｒｙｓｋｉｌｌｉｎｔｈｅｒｅｌａｔｅｄａｒｔ）が、本明細書から理解または誘導できる様々な技術的効果が存在し得る。これによって、本明細書の具体的な効果は、本明細書に明示的に記載されているものに制限されず、本明細書の技術的特徴から理解または誘導できる様々な効果を含み得る。

本文書が適用され得るビデオ／画像エンコード装置の構成を概略的に説明する図である。本文書が適用され得るビデオ／画像デコード装置の構成を概略的に説明する図である。本文書の一実施形態に係る多重変換技法を概略的に示す。６５個予測方向のイントラ方向性モードを例示的に示す。本文書の一実施形態に係るＲＳＴを説明するための図である。一例によって順方向１次変換の出力データを１次元ベクトルで配列する順序を示した図である。一例によって順方向２次変換の出力データを２次元ブロックで配列する順序を示した図である。ＬＦＮＳＴが適用されるブロック形状を示した図である。一例によって順方向ＬＦＮＳＴの出力データの配置を示した図である。一例によって４ｘ４のＬＦＮＳＴが適用されるブロックにおけるゼロアウトを示す図である。一例によって８ｘ８のＬＦＮＳＴが適用されるブロックにおけるゼロアウトを示す図である。一例による画像のデコーディング方法を説明するための図である。一例による画像のエンコーディング方法を説明するための図である。本文書が適用され得るビデオ／画像コーディングシステムの例を概略的に示す。一例に係る画像のデコーディング方法を説明するための図面である。一例に係る画像のエンコーディング方法を説明するための図面である。本文書が適用されるコンテンツストリーミングシステム構造図を例として示す。

本文書は、多様な変更を加えることができ、様々な実施形態を有することができ、特定実施形態を図面に例示して詳細に説明しようとする。しかし、これは本文書を特定実施形態に限定しようとするものではない。本明細書で使用する用語は、単に特定の実施形態を説明するために使われたものであって、本文書の技術的思想を限定しようとする意図で使われるものではない。単数の表現は、コンテキスト上明白に異なる意味ではない限り、複数の表現を含む。本明細書において、「含む」または「有する」などの用語は、明細書上に記載された特徴、数字、ステップ、動作、構成要素、部品、またはこれらを組み合わせたものが存在することを指定するものであり、一つまたはそれ以上の他の特徴や数字、ステップ、動作、構成要素、部品、またはこれらを組み合わせたもの等の存在または付加可能性をあらかじめ排除しないと理解されなければならない。

一方、本文書で説明される図面上の各構成は、互いに異なる特徴的な機能に関する説明の便宜のために独立的に図示されたものであって、各構成が互いに別個のハードウェアや別個のソフトウェアで具現されるということを意味するものではない。例えば、各構成のうち、二つ以上の構成が結合されて一つの構成をなすこともでき、一つの構成が複数の構成に分けられることもできる。各構成が統合及び／または分離された実施形態も、本文書の本質から逸脱しない限り、本文書の権利範囲に含まれる。

以下、添付図面を参照して、本文書の好ましい実施形態をより詳細に説明する。以下、図面上の同じ構成要素に対しては同じ参照符号を使用し、同じ構成要素に対して重複した説明は省略する。

この文書は、ビデオ／画像コーディングに関する。例えば、この文書に開示された方法／実施形態は、ＶＶＣ（ＶｅｒｓａｔｉｌｅＶｉｄｅｏＣｏｄｉｎｇ）標準（ＩＴＵ－ＴＲｅｃ．Ｈ．２６６）、ＶＶＣ以後の次世代ビデオ／イメージコーディング標準、またはその以外のビデオコーディング関連標準（例えば、ＨＥＶＣ（ＨｉｇｈＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ）標準（ＩＴＵ－ＴＲｅｃ．Ｈ．２６５）、ＥＶＣ（ｅｓｓｅｎｔｉａｌｖｉｄｅｏｃｏｄｉｎｇ）標準、ＡＶＳ２標準等）と関連付けられている。

この文書ではビデオ／画像コーディングに関する多様な実施形態を提示し、他の言及がない限り、前記実施形態は互いに組み合わせられて実行されることもできる。

この文書において、ビデオ（ｖｉｄｅｏ）は、時間の流れによる一連の画像（ｉｍａｇｅ）の集合を意味することができる。ピクチャ（ｐｉｃｔｕｒｅ）は、一般的に特定時間帯の一つの画像を示す単位を意味し、スライス（ｓｌｉｃｅ）／タイル（ｔｉｌｅ）は、コーディングにおいてピクチャの一部を構成する単位である。スライス／タイルは、一つ以上のＣＴＵ（ｃｏｄｉｎｇｔｒｅｅｕｎｉｔ）を含むことができる。一つのピクチャは、一つ以上のスライス／タイルで構成されることができる。一つのピクチャは、一つ以上のタイルグループで構成されることができる。一つのタイルグループは、一つ以上のタイルを含むことができる。

ピクセル（ｐｉｘｅｌ）またはペル（ｐｅｌ）は、一つのピクチャ（または、画像）を構成する最小の単位を意味することができる。また、ピクセルに対応する用語として「サンプル（ｓａｍｐｌｅ）」が使われることができる。サンプルは、一般的にピクセルまたはピクセルの値を示すことができ、ルマ（ｌｕｍａ）成分のピクセル／ピクセル値のみを示すこともでき、クロマ（ｃｈｒｏｍａ）成分のピクセル／ピクセル値のみを示すこともできる。または、サンプルは、空間ドメインでのピクセル値を意味することもでき、このようなピクセル値が周波数ドメインに変換されると、周波数ドメインでの変換係数を意味することもできる。

ユニット（ｕｎｉｔ）は、画像処理の基本単位を示すことができる。ユニットは、ピクチャの特定領域及び該当領域に関連した情報のうち少なくとも一つを含むことができる。一つのユニットは、一つのルマブロック及び二つのクロマ（例えば、ｃｂ、ｃｒ）ブロックを含むことができる。ユニットは、場合によって、ブロック（ｂｌｏｃｋ）または領域（ａｒｅａ）などの用語と混用して使われることができる。一般的な場合、Ｍ×Ｎブロックは、Ｍ個の列とＮ個の行からなるサンプル（または、サンプルアレイ）または変換係数（ｔｒａｎｓｆｏｒｍｃｏｅｆｆｉｃｉｅｎｔ）の集合（または、アレイ）を含むことができる。

この文書において、「／」と「、」は、「及び／または」と解釈される。例えば、「Ａ／Ｂ」は、「Ａ及び／またはＢ」と解釈され、「Ａ、Ｂ」は、「Ａ及び／またはＢ」と解釈される。追加的に、「Ａ／Ｂ／Ｃ」は、「Ａ、Ｂ及び／またはＣのうち少なくとも一つ」を意味する。また、「Ａ、Ｂ、Ｃ」も「Ａ、Ｂ及び／またはＣのうち少なくとも一つ」を意味する。（Ｉｎｔｈｉｓｄｏｃｕｍｅｎｔ，ｔｈｅｔｅｒｍ「／」ａｎｄ「、」ｓｈｏｕｌｄｂｅｉｎｔｅｒｐｒｅｔｅｄｔｏｉｎｄｉｃａｔｅ「ａｎｄ／ｏｒ．」Ｆｏｒｉｎｓｔａｎｃｅ，ｔｈｅｅｘｐｒｅｓｓｉｏｎ「Ａ／Ｂ」ｍａｙｍｅａｎ「Ａａｎｄ／ｏｒＢ．」Ｆｕｒｔｈｅｒ，「Ａ，Ｂ」ｍａｙｍｅａｎ「Ａａｎｄ／ｏｒＢ．」Ｆｕｒｔｈｅｒ，「Ａ／Ｂ／Ｃ」ｍａｙｍｅａｎ「ａｔｌｅａｓｔｏｎｅｏｆＡ，Ｂ，ａｎｄ／ｏｒＣ．」Ａｌｓｏ，「Ａ／Ｂ／Ｃ」ｍａｙｍｅａｎ「ａｔｌｅａｓｔｏｎｅｏｆＡ，Ｂ，ａｎｄ／ｏｒＣ．”）

追加的に、本文書において、「または」は、「及び／または」と解釈される。例えば、「ＡまたはＢ」は、１）「Ａ」のみを意味し、または２）「Ｂ」のみを意味し、または３）「Ａ及びＢ」を意味することができる。他の表現としては、本文書の「または」は、「追加的にまたは代替的に（ａｄｄｉｔｉｏｎａｌｌｙｏｒａｌｔｅｒｎａｔｉｖｅｌｙ）」を意味することができる。（Ｆｕｒｔｈｅｒ，ｉｎｔｈｅｄｏｃｕｍｅｎｔ，ｔｈｅｔｅｒｍ「ｏｒ」ｓｈｏｕｌｄｂｅｉｎｔｅｒｐｒｅｔｅｄｔｏｉｎｄｉｃａｔｅ「ａｎｄ／ｏｒ．」Ｆｏｒｉｎｓｔａｎｃｅ，ｔｈｅｅｘｐｒｅｓｓｉｏｎ「ＡｏｒＢ」ｍａｙｃｏｍｐｒｉｓｅ１）ｏｎｌｙＡ，２）ｏｎｌｙＢ，ａｎｄ／ｏｒ３）ｂｏｔｈＡａｎｄＢ．Ｉｎｏｔｈｅｒｗｏｒｄｓ，ｔｈｅｔｅｒｍ「ｏｒ」ｉｎｔｈｉｓｄｏｃｕｍｅｎｔｓｈｏｕｌｄｂｅｉｎｔｅｒｐｒｅｔｅｄｔｏｉｎｄｉｃａｔｅ「ａｄｄｉｔｉｏｎａｌｌｙｏｒａｌｔｅｒｎａｔｉｖｅｌｙ．」）

本明細書において、「少なくとも一つのＡ及びＢ（ａｔｌｅａｓｔｏｎｅｏｆＡａｎｄＢ）」は、「ただＡ」、「ただＢ」または「ＡとＢの両方とも」を意味することができる。また、本明細書において、「少なくとも一つのＡまたはＢ（ａｔｌｅａｓｔｏｎｅｏｆＡｏｒＢ）」や「少なくとも一つのＡ及び／またはＢ（ａｔｌｅａｓｔｏｎｅｏｆＡａｎｄ／ｏｒＢ）」という表現は、「少なくとも一つのＡ及びＢ（ａｔｌｅａｓｔｏｎｅｏｆＡａｎｄＢ）」と同じく解釈されることができる。

また、本明細書において、「少なくとも一つのＡ、Ｂ及びＣ（ａｔｌｅａｓｔｏｎｅｏｆＡ，ＢａｎｄＣ）」は、「ただＡ」、「ただＢ」、「ただＣ」、または「Ａ、Ｂ及びＣの任意の全ての組み合わせ（ａｎｙｃｏｍｂｉｎａｔｉｏｎｏｆＡ，ＢａｎｄＣ）」を意味することができる。また、「少なくとも一つのＡ、ＢまたはＣ（ａｔｌｅａｓｔｏｎｅｏｆＡ，ＢｏｒＣ）」や「少なくとも一つのＡ、Ｂ及び／またはＣ（ａｔｌｅａｓｔｏｎｅｏｆＡ，Ｂａｎｄ／ｏｒＣ）」は、「少なくとも一つのＡ、Ｂ及びＣ（ａｔｌｅａｓｔｏｎｅｏｆＡ，ＢａｎｄＣ）」を意味することができる。

また、本明細書で使われる括弧は、「例えば（ｆｏｒｅｘａｍｐｌｅ）」を意味することができる。具体的に、「予測（イントラ予測）」で表示された場合、「予測」の一例として「イントラ予測」が提案されたものである。他の表現としては、本明細書の「予測」は、「イントラ予測」に制限（ｌｉｍｉｔ）されるものではなく、「イントラ予測」が「予測」の一例として提案されたものである。また、「予測（即ち、イントラ予測）」で表示された場合にも、「予測」の一例として「イントラ予測」が提案されたものである。

本明細書において、一つの図面内で個別的に説明される技術的特徴は、個別的に具現されることもでき、同時に具現されることもできる。

図１は、本文書が適用されることができるビデオ／画像コーディングシステムの例を概略的に示す。

図１を参照すると、ビデオ／画像コーディングシステムは、ソースデバイス及び受信デバイスを含むことができる。ソースデバイスは、エンコーディングされたビデオ（ｖｉｄｅｏ）／画像（ｉｍａｇｅ）情報またはデータをファイルまたはストリーミング形態でデジタル格納媒体またはネットワークを介して受信デバイスに伝達できる。

前記ソースデバイスは、ビデオソース、エンコーディング装置、送信部を含むことができる。前記受信デバイスは、受信部、デコーディング装置、及びレンダラを含むことができる。前記エンコーディング装置は、ビデオ／画像エンコーディング装置と呼ばれることができ、前記デコーディング装置は、ビデオ／画像デコーディング装置と呼ばれることができる。送信機は、エンコーディング装置に含まれることができる。受信機は、デコーディング装置に含まれることができる。レンダラは、ディスプレイ部を含むこともでき、ディスプレイ部は、別個のデバイスまたは外部コンポーネントで構成されることもできる。

ビデオソースは、ビデオ／画像のキャプチャ、合成または生成過程などを介してビデオ／画像を取得することができる。ビデオソースは、ビデオ／画像キャプチャデバイス及び／またはビデオ／画像生成デバイスを含むことができる。ビデオ／画像キャプチャデバイスは、例えば、一つ以上のカメラ、以前にキャプチャされたビデオ／画像を含むビデオ／画像アーカイブなどを含むことができる。ビデオ／画像生成デバイスは、例えば、コンピュータ、タブレット、及びスマートフォンなどを含むことができ、（電子的に）ビデオ／画像を生成することができる。例えば、コンピュータなどを介して仮想のビデオ／画像が生成されることができ、この場合、関連データが生成される過程にビデオ／画像キャプチャ過程が代替されることができる。

エンコーディング装置は、入力ビデオ／画像をエンコーディングすることができる。エンコーディング装置は、圧縮及びコーディング効率のために、予測、変換、量子化など、一連の手順を実行することができる。エンコーディングされたデータ（エンコーディングされたビデオ／画像情報）は、ビットストリーム（ｂｉｔｓｔｒｅａｍ）形態で出力されることができる。

送信部は、ビットストリーム形態で出力されたエンコーディングされたビデオ／画像情報またはデータをファイルまたはストリーミング形態でデジタル格納媒体またはネットワークを介して受信デバイスの受信部に伝達できる。デジタル格納媒体は、ＵＳＢ、ＳＤ、ＣＤ、ＤＶＤ、ブルーレイ、ＨＤＤ、ＳＳＤなど、多様な格納媒体を含むことができる。送信部は、あらかじめ決められたファイルフォーマットを介してメディアファイルを生成するためのエレメントを含むことができ、放送／通信ネットワークを介した送信のためのエレメントを含むことができる。受信部は、前記ビットストリームを受信／抽出してデコーディング装置に伝達できる。

デコーディング装置は、エンコーディング装置の動作に対応する逆量子化、逆変換、予測など、一連の手順を実行してビデオ／画像をデコーディングすることができる。

レンダラは、デコーディングされたビデオ／画像をレンダリングすることができる。レンダリングされたビデオ／画像は、ディスプレイ部を介してディスプレイされることができる。

図２は、本文書が適用されることができるビデオ／画像エンコーディング装置の構成を概略的に説明する図である。以下、ビデオエンコーディング装置とは、画像エンコーディング装置を含むことができる。

図２を参照すると、エンコーディング装置２００は、画像分割部（ｉｍａｇｅｐａｒｔｉｔｉｏｎｅｒ）２１０、予測部（ｐｒｅｄｉｃｔｏｒ）２２０、レジデュアル処理部（ｒｅｓｉｄｕａｌｐｒｏｃｅｓｓｏｒ）２３０、エントロピーエンコーディング部（ｅｎｔｒｏｐｙｅｎｃｏｄｅｒ）２４０、加算部（ａｄｄｅｒ）２５０、フィルタリング部（ｆｉｌｔｅｒ）２６０、及びメモリ（ｍｅｍｏｒｙ）２７０を含んで構成されることができる。予測部２２０は、インター予測部２２１及びイントラ予測部２２２を含むことができる。レジデュアル処理部２３０は、変換部（ｔｒａｎｓｆｏｒｍｅｒ）２３２、量子化部（ｑｕａｎｔｉｚｅｒ）２３３、逆量子化部（ｄｅｑｕａｎｔｉｚｅｒ）２３４、逆変換部（ｉｎｖｅｒｓｅｔｒａｎｓｆｏｒｍｅｒ）２３５を含むことができる。レジデュアル処理部２３０は、減算部（ｓｕｂｔｒａｃｔｏｒ）２３１をさらに含むことができる。加算部２５０は、復元部（ｒｅｃｏｎｓｔｒｕｃｔｏｒ）または復元ブロック生成部（ｒｅｃｏｎｔｒｕｃｔｇｅｄｂｌｏｃｋｇｅｎｅｒａｔｏｒ）と呼ばれることができる。前述した画像分割部２１０、予測部２２０、レジデュアル処理部２３０、エントロピーエンコーディング部２４０、加算部２５０、及びフィルタリング部２６０は、実施形態によって一つ以上のハードウェアコンポーネント（例えば、エンコーディングチップセットまたはプロセッサ）により構成されることができる。また、メモリ２７０は、ＤＰＢ（ｄｅｃｏｄｅｄｐｉｃｔｕｒｅｂｕｆｆｅｒ）を含むことができ、デジタル格納媒体により構成されることもできる。前記ハードウェアコンポーネントは、メモリ２７０を内／外部コンポーネントとしてさらに含むこともできる。

画像分割部２１０は、エンコーディング装置２００に入力された入力画像（または、ピクチャ、フレーム）を一つ以上の処理ユニット（ｐｒｏｃｅｓｓｉｎｇｕｎｉｔ）に分割できる。一例として、前記処理ユニットは、コーディングユニット（ｃｏｄｉｎｇｕｎｉｔ、ＣＵ）と呼ばれることができる。この場合、コーディングユニットは、コーディングツリーユニット（ｃｏｄｉｎｇｔｒｅｅｕｎｉｔ、ＣＴＵ）または最大コーディングユニット（ｌａｒｇｅｓｔｃｏｄｉｎｇｕｎｉｔ、ＬＣＵ）からＱＴＢＴＴＴ（Ｑｕａｄ－ｔｒｅｅｂｉｎａｒｙ－ｔｒｅｅｔｅｒｎａｒｙ－ｔｒｅｅ）構造によって再帰的に（ｒｅｃｕｒｓｉｖｅｌｙ）分割されることができる。例えば、一つのコーディングユニットは、クアッドツリー構造、バイナリツリー構造、及び／またはターナリ構造に基づいて下位（ｄｅｅｐｅｒ）デプスの複数のコーディングユニットに分割されることができる。この場合、例えば、クアッドツリー構造が先に適用され、バイナリツリー構造及び／またはターナリ構造がその後に適用されることができる。または、バイナリツリー構造が先に適用されることもできる。それ以上分割されない最終コーディングユニットに基づいて本文書によるコーディング手順が実行されることができる。この場合、画像特性によるコーディング効率などに基づいて、最大コーディングユニットが最終コーディングユニットとして使われることができ、または、必要によって、コーディングユニットは、再帰的に（ｒｅｃｕｒｓｉｖｅｌｙ）もっと下位デプスのコーディングユニットに分割されて最適のサイズのコーディングユニットが最終コーディングユニットとして使われることができる。ここで、コーディング手順とは、後述する予測、変換、及び復元などの手順を含むことができる。他の例として、前記処理ユニットは、予測ユニット（ＰＵ：ＰｒｅｄｉｃｔｉｏｎＵｎｉｔ）または変換ユニット（ＴＵ：ＴｒａｎｓｆｏｒｍＵｎｉｔ）をさらに含むことができる。この場合、前記予測ユニット及び前記変換ユニットは、各々、前述した最終コーディングユニットから分割またはパーティショニングされることができる。前記予測ユニットは、サンプル予測の単位であり、前記変換ユニットは、変換係数を誘導する単位及び／または変換係数からレジデュアル信号（ｒｅｓｉｄｕａｌｓｉｇｎａｌ）を誘導する単位である。

ユニットは、場合によって、ブロック（ｂｌｏｃｋ）または領域（ａｒｅａ）などの用語と混用して使われることができる。一般的な場合、Ｍ×Ｎブロックは、Ｍ個の列とＮ個の行からなるサンプルまたは変換係数（ｔｒａｎｓｆｏｒｍｃｏｅｆｆｉｃｉｅｎｔ）の集合を示すことができる。サンプルは、一般的にピクセルまたはピクセルの値を示すことができ、輝度（ｌｕｍａ）成分のピクセル／ピクセル値のみを示すこともでき、彩度（ｃｈｒｏｍａ）成分のピクセル／ピクセル値のみを示すこともできる。サンプルは、一つのピクチャ（または、画像）をピクセル（ｐｉｘｅｌ）またはペル（ｐｅｌ）に対応する用語として使われることができる。

減算部２３１は、入力画像信号（原本ブロック、原本サンプルまたは原本サンプルアレイ）から、予測部２２０から出力された予測信号（予測されたブロック、予測サンプルまたは予測サンプルアレイ）を減算してレジデュアル信号（レジデュアルブロック、レジデュアルサンプルまたはレジデュアルサンプルアレイ）を生成することができ、生成されたレジデュアル信号は、変換部２３２に送信される。予測部２２０は、処理対象ブロック（以下、現在ブロックという）に対する予測を実行し、前記現在ブロックに対する予測サンプルを含む予測されたブロック（ｐｒｅｄｉｃｔｅｄｂｌｏｃｋ）を生成することができる。予測部２２０は、現在ブロックまたはＣＵ単位でイントラ予測が適用されるか、または、インター予測が適用されるかを決定することができる。予測部は、各予測モードに対する説明で後述するように、予測モード情報など、予測に関する多様な情報を生成してエントロピーエンコーディング部２４０に伝達できる。予測に関する情報は、エントロピーエンコーディング部２４０でエンコーディングされてビットストリーム形態で出力されることができる。

イントラ予測部２２２は、現在ピクチャ内のサンプルを参照して現在ブロックを予測することができる。前記参照されるサンプルは、予測モードによって、前記現在ブロックの隣接（ｎｅｉｇｈｂｏｒ）に位置することもでき、または離れて位置することもできる。イントラ予測で、予測モードは、複数の非方向性モードと複数の方向性モードを含むことができる。非方向性モードは、例えば、ＤＣモード及びプラナーモード（Ｐｌａｎａｒモード）を含むことができる。方向性モードは、予測方向の細かい程度によって、例えば、３３個の方向性予測モードまたは６５個の方向性予測モードを含むことができる。ただし、これは例示に過ぎず、設定によってそれ以上またはその以下の個数の方向性予測モードが使われることができる。イントラ予測部２２２は、隣接ブロックに適用された予測モードを利用して、現在ブロックに適用される予測モードを決定することもできる。

インター予測部２２１は、参照ピクチャ上で動きベクトルにより特定される参照ブロック（参照サンプルアレイ）に基づいて、現在ブロックに対する予測されたブロックを誘導することができる。このとき、インター予測モードで送信される動き情報の量を減らすために、隣接ブロックと現在ブロックとの間の動き情報の相関性に基づいて、動き情報をブロック、サブブロックまたはサンプル単位で予測できる。前記動き情報は、動きベクトル及び参照ピクチャインデックスを含むことができる。前記動き情報は、インター予測方向（Ｌ０予測、Ｌ１予測、Ｂｉ予測等）情報をさらに含むことができる。インター予測の場合、隣接ブロックは、現在ピクチャ内に存在する空間的隣接ブロック（ｓｐａｔｉａｌｎｅｉｇｈｂｏｒｉｎｇｂｌｏｃｋ）と、参照ピクチャに存在する時間的隣接ブロック（ｔｅｍｐｏｒａｌｎｅｉｇｈｂｏｒｉｎｇｂｌｏｃｋ）と、を含むことができる。前記参照ブロックを含む参照ピクチャと前記時間的隣接ブロックを含む参照ピクチャは、同じこともあり、異なることもある。前記時間的隣接ブロックは、同一位置参照ブロック（ｃｏｌｌｏｃａｔｅｄｒｅｆｅｒｅｎｃｅｂｌｏｃｋ）、同一位置ＣＵ（ｃｏｌＣＵ）などの名称で呼ばれることができ、前記時間的隣接ブロックを含む参照ピクチャは、同一位置ピクチャ（ｃｏｌｌｏｃａｔｅｄｐｉｃｔｕｒｅ、ｃｏｌＰｉｃ）と呼ばれることもできる。例えば、インター予測部２２１は、隣接ブロックに基づいて動き情報候補リストを構成し、前記現在ブロックの動きベクトル及び／または参照ピクチャインデックスを導出するために、どの候補が使われるかを指示する情報を生成することができる。多様な予測モードに基づいてインター予測が実行されることができ、例えば、スキップモードとマージモードの場合、インター予測部２２１は、隣接ブロックの動き情報を現在ブロックの動き情報として利用できる。スキップモードの場合、マージモードとは違って、レジデュアル信号が送信されない。動き情報予測（ｍｏｔｉｏｎｖｅｃｔｏｒｐｒｅｄｉｃｔｉｏｎ、ＭＶＰ）モードの場合、隣接ブロックの動きベクトルを動きベクトル予測子（ｍｏｔｉｏｎｖｅｃｔｏｒｐｒｅｄｉｃｔｏｒ）として利用し、動きベクトル差分（ｍｏｔｉｏｎｖｅｃｔｏｒｄｉｆｆｅｒｅｎｃｅ）をシグナリングすることで、現在ブロックの動きベクトルを指示することができる。

予測部２２０は、後述する多様な予測方法に基づいて予測信号を生成することができる。例えば、予測部は、一つのブロックに対する予測のために、イントラ予測またはインター予測を適用することができるだけでなく、イントラ予測とインター予測を同時に適用できる。これはｃｏｍｂｉｎｅｄｉｎｔｅｒａｎｄｉｎｔｒａｐｒｅｄｉｃｔｉｏｎ（ＣＩＩＰ）と呼ばれることができる。また、予測部は、ブロックに対する予測のために、イントラブロックコピー（ｉｎｔｒａｂｌｏｃｋｃｏｐｙ、ＩＢＣ）を実行することもできる。前記イントラブロックコピーは、例えば、ＳＣＣ（ｓｃｒｅｅｎｃｏｎｔｅｎｔｃｏｄｉｎｇ）などのように、ゲームなどのコンテンツ画像／動画像コーディングのために使われることができる。ＩＢＣは、基本的に現在ピクチャ内で予測を実行するが、現在ピクチャ内で参照ブロックを導出する点でインター予測と類似するように実行されることができる。即ち、ＩＢＣは、本文書で説明されるインター予測技法のうち少なくとも一つを利用することができる。

インター予測部２２１及び／またはイントラ予測部２２２を介して生成された予測信号は、復元信号を生成するために利用され、またはレジデュアル信号を生成するために利用されることができる。変換部２３２は、レジデュアル信号に変換技法を適用して変換係数（ｔｒａｎｓｆｏｒｍｃｏｅｆｆｉｃｉｅｎｔｓ）を生成することができる。例えば、変換技法は、ＤＣＴ（ＤｉｓｃｒｅｔｅＣｏｓｉｎｅＴｒａｎｓｆｏｒｍ）、ＤＳＴ（ＤｉｓｃｒｅｔｅＳｉｎｅＴｒａｎｓｆｏｒｍ）、ＧＢＴ（Ｇｒａｐｈ－ＢａｓｅｄＴｒａｎｓｆｏｒｍ）、またはＣＮＴ（ＣｏｎｄｉｔｉｏｎａｌｌｙＮｏｎ－ｌｉｎｅａｒＴｒａｎｓｆｏｒｍ）などを含むことができる。ここで、ＧＢＴは、ピクセル間の関係情報をグラフで表現するとする時、このグラフから得られた変換を意味する。ＣＮＴは、以前に復元された全てのピクセル（ａｌｌｐｒｅｖｉｏｕｓｌｙｒｅｃｏｎｓｔｒｕｃｔｅｄｐｉｘｅｌ）を利用して予測信号を生成し、それに基づいて取得される変換を意味する。また、変換過程は、正方形の同じ大きさを有するピクセルブロックに適用されることもでき、正方形でない可変大きさのブロックに適用されることもできる。

量子化部２３３は、変換係数を量子化してエントロピーエンコーディング部２４０に送信し、エントロピーエンコーディング部２４０は、量子化された信号（量子化された変換係数に関する情報）をエンコーディングしてビットストリームで出力できる。前記量子化された変換係数に関する情報は、レジデュアル情報と呼ばれることができる。量子化部２３３は、係数スキャン順序（ｓｃａｎｏｒｄｅｒ）に基づいて、ブロック形態の量子化された変換係数を１次元ベクトル形態で再整列でき、前記１次元ベクトル形態の量子化された変換係数に基づいて、前記量子化された変換係数に関する情報を生成することもできる。エントロピーエンコーディング部２４０は、例えば、指数ゴロム（ｅｘｐｏｎｅｎｔｉａｌＧｏｌｏｍｂ）、ＣＡＶＬＣ（ｃｏｎｔｅｘｔ－ａｄａｐｔｉｖｅｖａｒｉａｂｌｅｌｅｎｇｔｈｃｏｄｉｎｇ）、ＣＡＢＡＣ（ｃｏｎｔｅｘｔ－ａｄａｐｔｉｖｅｂｉｎａｒｙａｒｉｔｈｍｅｔｉｃｃｏｄｉｎｇ）などのような多様なエンコーディング方法を実行することができる。エントロピーエンコーディング部２４０は、量子化された変換係数外にビデオ／イメージ復元に必要な情報（例えば、シンタックス要素（ｓｙｎｔａｘｅｌｅｍｅｎｔｓ）の値等）を共にまたは別途にエンコーディングすることもできる。エンコーディングされた情報（例えば、エンコーディングされたビデオ／画像情報）は、ビットストリーム形態でＮＡＬ（ｎｅｔｗｏｒｋａｂｓｔｒａｃｔｉｏｎｌａｙｅｒ）ユニット単位で送信または格納されることができる。前記ビデオ／画像情報は、アダプテーションパラメータセット（ＡＰＳ）、ピクチャパラメータセット（ＰＰＳ）、シーケンスパラメータセット（ＳＰＳ）またはビデオパラメータセット（ＶＰＳ）等、多様なパラメータセットに関する情報をさらに含むことができる。また、前記ビデオ／画像情報は、一般制限情報（ｇｅｎｅｒａｌｃｏｎｓｔｒａｉｎｔｉｎｆｏｒｍａｔｉｏｎ）をさらに含むことができる。本文書で後述されるシグナリング／送信される情報及び／またはシンタックス要素は、前述したエンコーディング手順を介してエンコーディングされて前記ビットストリームに含まれることができる。前記ビットストリームは、ネットワークを介して送信されることができ、またはデジタル格納媒体に格納されることができる。ここで、ネットワークは、放送網及び／または通信網などを含むことができ、デジタル格納媒体は、ＵＳＢ、ＳＤ、ＣＤ、ＤＶＤ、ブルーレイ、ＨＤＤ、ＳＳＤなど、多様な格納媒体を含むことができる。エントロピーエンコーディング部２４０から出力された信号は、送信する送信部（図示せず）及び／または格納する格納部（図示せず）がエンコーディング装置２００の内／外部エレメントとして構成されることができ、または、送信部は、エントロピーエンコーディング部２４０に含まれることもできる。

量子化部２３３から出力された量子化された変換係数は、予測信号を生成するために利用されることができる。例えば、量子化された変換係数に逆量子化部２３４及び逆変換部２３５を介して逆量子化及び逆変換を適用することによって、レジデュアル信号（レジデュアルブロックまたはレジデュアルサンプル）を復元することができる。加算部２５０は、復元されたレジデュアル信号を予測部２２０から出力された予測信号に加えることによって復元（ｒｅｃｏｎｓｔｒｕｃｔｅｄ）信号（復元ピクチャ、復元ブロック、復元サンプルまたは復元サンプルアレイ）が生成されることができる。スキップモードが適用された場合のように処理対象ブロックに対するレジデュアルがない場合、予測されたブロックが復元ブロックとして使われることができる。生成された復元信号は、現在ピクチャ内の次の処理対象ブロックのイントラ予測のために使われることができ、後述するようにフィルタリングを経て次のピクチャのインター予測のために使われることもできる。

一方、ピクチャエンコーディング及び／または復元過程でＬＭＣＳ（ｌｕｍａｍａｐｐｉｎｇｗｉｔｈｃｈｒｏｍａｓｃａｌｉｎｇ）が適用されることもできる。

フィルタリング部２６０は、復元信号にフィルタリングを適用して主観的／客観的画質を向上させることができる。例えば、フィルタリング部２６０は、復元ピクチャに多様なフィルタリング方法を適用して修正された（ｍｏｄｉｆｉｅｄ）復元ピクチャを生成することができ、前記修正された復元ピクチャをメモリ２７０、具体的に、メモリ２７０のＤＰＢに格納することができる。前記多様なフィルタリング方法は、例えば、デブロッキングフィルタリング、サンプル適応的オフセット（ｓａｍｐｌｅａｄａｐｔｉｖｅｏｆｆｓｅｔ、ＳＡＯ）、適応的ループフィルタ（ａｄａｐｔｉｖｅｌｏｏｐｆｉｌｔｅｒ）、両方向フィルタ（ｂｉｌａｔｅｒａｌｆｉｌｔｅｒ）などを含むことができる。フィルタリング部２６０は、各フィルタリング方法に対する説明で後述するように、フィルタリングに関する多様な情報を生成してエントロピーエンコーディング部２４０に伝達できる。フィルタリング関する情報は、エントロピーエンコーディング部２４０でエンコーディングされてビットストリーム形態で出力されることができる。

メモリ２７０に送信された修正された復元ピクチャは、インター予測部２２１で参照ピクチャとして使われることができる。エンコーディング装置は、これを介してインター予測が適用される場合、エンコーディング装置２００とデコーディング装置での予測ミスマッチを避けることができ、符号化効率も向上させることができる。

メモリ２７０のＤＰＢは、修正された復元ピクチャをインター予測部２２１での参照ピクチャとして使用するために格納することができる。メモリ２７０は、現在ピクチャ内の動き情報が導出された（または、エンコーディングされた）ブロックの動き情報及び／または既に復元されたピクチャ内のブロックの動き情報を格納することができる。前記格納された動き情報は、空間的隣接ブロックの動き情報または時間的隣接ブロックの動き情報として活用するためにインター予測部２２１に伝達できる。メモリ２７０は、現在ピクチャ内の復元されたブロックの復元サンプルを格納することができ、イントラ予測部２２２に伝達できる。

図３は、本文書が適用されることができるビデオ／画像デコーディング装置の構成を概略的に説明する図である。

図３を参照すると、デコーディング装置３００は、エントロピーデコーディング部（ｅｎｔｒｏｐｙｄｅｃｏｄｅｒ）３１０、レジデュアル処理部（ｒｅｓｉｄｕａｌｐｒｏｃｅｓｓｏｒ）３２０、予測部（ｐｒｅｄｉｃｔｏｒ）３３０、加算部（ａｄｄｅｒ）３４０、フィルタリング部（ｆｉｌｔｅｒ）３５０、及びメモリ（ｍｅｍｏｅｒｙ）３６０を含んで構成されることができる。予測部３３０は、インター予測部３３２及びイントラ予測部３３１を含むことができる。レジデュアル処理部３２０は、逆量子化部（ｄｅｑｕａｎｔｉｚｅｒ）３２１及び逆変換部（ｉｎｖｅｒｓｅｔｒａｎｓｆｏｒｍｅｒ）３２２を含むことができる。前述したエントロピーデコーディング部３１０、レジデュアル処理部３２０、予測部３３０、加算部３４０、及びフィルタリング部３５０は、実施形態によって一つのハードウェアコンポーネント（例えば、デコーディングチップセットまたはプロセッサ）により構成されることができる。また、メモリ３６０は、ＤＰＢ（ｄｅｃｏｄｅｄｐｉｃｔｕｒｅｂｕｆｆｅｒ）を含むことができ、デジタル格納媒体により構成されることもできる。前記ハードウェアコンポーネントは、メモリ３６０を内／外部コンポーネントとしてさらに含むこともできる。

ビデオ／画像情報を含むビットストリームが入力される場合、デコーディング装置３００は、図２のエンコーディング装置でビデオ／画像情報が処理されたプロセスに対応して画像を復元することができる。例えば、デコーディング装置３００は、前記ビットストリームから取得したブロック分割関連情報に基づいてユニット／ブロックを導出することができる。デコーディング装置３００は、エンコーディング装置で適用された処理ユニットを利用してデコーディングを実行することができる。したがって、デコーディングの処理ユニットは、例えば、コーディングユニットであり、コーディングユニットは、コーディングツリーユニットまたは最大コーディングユニットから、クアッドツリー構造、バイナリツリー構造及び／またはターナリツリー構造によって分割されることができる。コーディングユニットから一つ以上の変換ユニットが導出されることができる。そして、デコーディング装置３００を介してデコーディング及び出力された復元画像信号は、再生装置を介して再生されることができる。

デコーディング装置３００は、図２のエンコーディング装置から出力された信号をビットストリーム形態で受信することができ、受信された信号は、エントロピーデコーディング部３１０を介してデコーディングされることができる。例えば、エントロピーデコーディング部３１０は、前記ビットストリームをパーシングして画像復元（または、ピクチャ復元）に必要な情報（例えば、ビデオ／画像情報）を導出することができる。前記ビデオ／画像情報は、アダプテーションパラメータセット（ＡＰＳ）、ピクチャパラメータセット（ＰＰＳ）、シーケンスパラメータセット（ＳＰＳ）、またはビデオパラメータセット（ＶＰＳ）等、多様なパラメータセットに関する情報をさらに含むことができる。また、前記ビデオ／画像情報は、一般制限情報（ｇｅｎｅｒａｌｃｏｎｓｔｒａｉｎｔｉｎｆｏｒｍａｔｉｏｎ）をさらに含むことができる。デコーディング装置は、前記パラメータセットに関する情報及び／または前記一般制限情報にさらに基づいてピクチャをデコーディングすることができる。本文書で後述されるシグナリング／受信される情報及び／またはシンタックス要素は、前記デコーディング手順を介してデコーディングされて前記ビットストリームから取得されることができる。例えば、エントロピーデコーディング部３１０は、指数ゴロム符号化、ＣＡＶＬＣまたはＣＡＢＡＣなどのコーディング方法に基づいてビットストリーム内の情報をデコーディングし、画像復元に必要なシンタックスエレメントの値、レジデュアルに関する変換係数の量子化された値を出力することができる。より詳しくは、ＣＡＢＡＣエントロピーデコーディング方法は、ビットストリームで各構文要素に該当するｂｉｎを受信し、デコーディング対象構文要素情報と隣接及びデコーディング対象ブロックのデコーディング情報または以前ステップでデコーディングされたシンボル／ｂｉｎの情報を利用してコンテキスト（ｃｏｎｔｅｘｔ）モデルを決定し、決定されたコンテキストモデルによってｂｉｎの発生確率を予測してｂｉｎの算術デコーディング（ａｒｉｔｈｍｅｔｉｃｄｅｃｏｄｉｎｇ）を実行することで各構文要素の値に該当するシンボルを生成することができる。このとき、ＣＡＢＡＣエントロピーデコーディング方法は、コンテキストモデル決定後、次のシンボル／ｂｉｎのコンテキストモデルのためにデコーディングされたシンボル／ｂｉｎの情報を利用してコンテキストモデルをアップデートすることができる。エントロピーデコーディング部３１０でデコーディングされた情報のうち、予測に関する情報は、予測部３３０に提供され、エントロピーデコーディング部３１０でエントロピーデコーディングが実行されたレジデュアルに対する情報、即ち、量子化された変換係数及び関連パラメータ情報は、逆量子化部３２１に入力されることができる。また、エントロピーデコーディング部３１０でデコーディングされた情報のうち、フィルタリングに関する情報は、フィルタリング部３５０に提供されることができる。一方、エンコーディング装置から出力された信号を受信する受信部（図示せず）がデコーディング装置３００の内／外部エレメントとしてさらに構成されてもよく、または、受信部は、エントロピーデコーディング部３１０の構成要素であってもよい。一方、本文書によるデコーディング装置は、ビデオ／画像／ピクチャデコーディング装置と呼ばれることができ、前記デコーディング装置は、情報デコーディング（ビデオ／画像／ピクチャ情報デコーディング）及びサンプルデコーディング（ビデオ／画像／ピクチャサンプルデコーディング）に区分することもできる。前記情報デコーディングは、前記エントロピーデコーディング部３１０を含むことができ、前記サンプルデコーディングは、前記逆量子化部３２１、逆変換部３２２、予測部３３０、加算部３４０、フィルタリング部３５０、及びメモリ３６０のうち少なくとも一つを含むことができる。

逆量子化部３２１では量子化された変換係数を逆量子化して変換係数を出力することができる。逆量子化部３２１は、量子化された変換係数を２次元のブロック形態で再整列できる。この場合、前記再整列は、エンコーディング装置で実行された係数スキャン順序に基づいて再整列を実行することができる。逆量子化部３２１は、量子化パラメータ（例えば、量子化ステップサイズ情報）を利用して量子化された変換係数に対する逆量子化を実行し、変換係数（ｔｒａｎｓｆｏｒｍｃｏｅｆｆｉｃｉｅｎｔ）を取得することができる。

逆変換部３２２では変換係数を逆変換してレジデュアル信号（レジデュアルブロック、レジデュアルサンプルアレイ）を取得するようになる。

予測部は、現在ブロックに対する予測を実行し、前記現在ブロックに対する予測サンプルを含む予測されたブロック（ｐｒｅｄｉｃｔｅｄｂｌｏｃｋ）を生成することができる。予測部は、エントロピーデコーディング部３１０から出力された前記予測に関する情報に基づいて、前記現在ブロックにイントラ予測が適用されるか、または、インター予測が適用されるかを決定することができ、具体的なイントラ／インター予測モードを決定することができる。

予測部は、後述する多様な予測方法に基づいて予測信号を生成することができる。例えば、予測部は、一つのブロックに対する予測のためにイントラ予測またはインター予測を適用することができるだけでなく、イントラ予測とインター予測を同時に適用することもできる。これはｃｏｍｂｉｎｅｄｉｎｔｅｒａｎｄｉｎｔｒａｐｒｅｄｉｃｔｉｏｎ（ＣＩＩＰ）と呼ばれることができる。また、予測部は、ブロックに対する予測のためにイントラブロックコピー（ｉｎｔｒａｂｌｏｃｋｃｏｐｙ、ＩＢＣ）を実行することもできる。前記イントラブロックコピーは、例えば、ＳＣＣ（ｓｃｒｅｅｎｃｏｎｔｅｎｔｃｏｄｉｎｇ）などのように、ゲームなどのコンテンツ画像／動画像コーディングのために使われることができる。ＩＢＣは、基本的に現在ピクチャ内で予測を実行するが、現在ピクチャ内で参照ブロックを導出する点でインター予測と類似するように実行されることができる。即ち、ＩＢＣは、本文書で説明されるインター予測技法のうち少なくとも一つを利用することができる。

イントラ予測部３３１は、現在ピクチャ内のサンプルを参照して現在ブロックを予測することができる。前記参照されるサンプルは、予測モードによって、前記現在ブロックの隣接（ｎｅｉｇｈｂｏｒ）に位置することもでき、または離れて位置することもできる。イントラ予測で、予測モードは、複数の非方向性モードと複数の方向性モードを含むことができる。イントラ予測部３３１は、隣接ブロックに適用された予測モードを利用し、現在ブロックに適用される予測モードを決定することもできる。

インター予測部３３２は、参照ピクチャ上で動きベクトルにより特定される参照ブロック（参照サンプルアレイ）に基づいて、現在ブロックに対する予測されたブロックを誘導することができる。このとき、インター予測モードで送信される動き情報の量を減らすために、隣接ブロックと現在ブロックとの間の動き情報の相関性に基づいて動き情報をブロック、サブブロック、またはサンプル単位で予測できる。前記動き情報は、動きベクトル及び参照ピクチャインデックスを含むことができる。前記動き情報は、インター予測方向（Ｌ０予測、Ｌ１予測、Ｂｉ予測等）情報をさらに含むことができる。インター予測の場合、隣接ブロックは、現在ピクチャ内に存在する空間的隣接ブロック（ｓｐａｔｉａｌｎｅｉｇｈｂｏｒｉｎｇｂｌｏｃｋ）と、参照ピクチャに存在する時間的隣接ブロック（ｔｅｍｐｏｒａｌｎｅｉｇｈｂｏｒｉｎｇｂｌｏｃｋ）と、を含むことができる。例えば、インター予測部３３２は、隣接ブロックに基づいて動き情報候補リストを構成し、受信した候補選択情報に基づいて、前記現在ブロックの動きベクトル及び／または参照ピクチャインデックスを導出することができる。多様な予測モードに基づいてインター予測が実行されることができ、前記予測に関する情報は、前記現在ブロックに対するインター予測のモードを指示する情報を含むことができる。

加算部３４０は、取得されたレジデュアル信号を、予測部３３０から出力された予測信号（予測されたブロック、予測サンプルアレイ）に加えることによって復元信号（復元ピクチャ、復元ブロック、復元サンプルアレイ）を生成することができる。スキップモードが適用された場合のように処理対象ブロックに対するレジデュアルがない場合、予測されたブロックが復元ブロックとして使われることができる。

加算部３４０は、復元部または復元ブロック生成部と呼ばれることができる。生成された復元信号は、現在ピクチャ内の次の処理対象ブロックのイントラ予測のために使われることができ、後述するように、フィルタリングを経て出力されることもでき、または、次のピクチャのインター予測のために使われることもできる。

一方、ピクチャデコーディング過程でＬＭＣＳ（ｌｕｍａｍａｐｐｉｎｇｗｉｔｈｃｈｒｏｍａｓｃａｌｉｎｇ）が適用されることもできる。

フィルタリング部３５０は、復元信号にフィルタリングを適用して主観的／客観的画質を向上させることができる。例えば、フィルタリング部３５０は、復元ピクチャに多様なフィルタリング方法を適用することで、修正された（ｍｏｄｉｆｉｅｄ）復元ピクチャを生成することができ、前記修正された復元ピクチャをメモリ３６０、具体的に、メモリ３６０のＤＰＢに送信できる。前記多様なフィルタリング方法は、例えば、デブロッキングフィルタリング、サンプル適応的オフセット（ｓａｍｐｌｅａｄａｐｔｉｖｅｏｆｆｓｅｔ）、適応的ループフィルタ（ａｄａｐｔｉｖｅｌｏｏｐｆｉｌｔｅｒ）、両方向フィルタ（ｂｉｌａｔｅｒａｌｆｉｌｔｅｒ）などを含むことができる。

メモリ３６０のＤＰＢに格納された（修正された）復元ピクチャは、インター予測部３３２で参照ピクチャとして使われることができる。メモリ３６０は、現在ピクチャ内の動き情報が導出された（または、デコーディングされた）ブロックの動き情報及び／または既に復元されたピクチャ内のブロックの動き情報を格納することができる。前記格納された動き情報は、空間的隣接ブロックの動き情報または時間的隣接ブロックの動き情報として活用するために、インター予測部３３２に伝達できる。メモリ３６０は、現在ピクチャ内の復元されたブロックの復元サンプルを格納することができ、イントラ予測部３３１に伝達できる。

本明細書において、デコーディング装置３００の予測部３３０、逆量子化部３２１、逆変換部３２２、及びフィルタリング部３５０などで説明された実施形態は、各々、エンコーディング装置２００の予測部２２０、逆量子化部２３４、逆変換部２３５、及びフィルタリング部２６０などにも同一または対応されるように適用されることができる。

前述したように、ビデオコーディングを実行するにあたって、圧縮効率を上げるために予測を実行する。これを介してコーディング対象ブロックである現在ブロックに対する予測サンプルを含む予測されたブロックを生成することができる。ここで、前記予測されたブロックは、空間ドメイン（または、ピクセルドメイン）での予測サンプルを含む。前記予測されたブロックは、エンコーディング装置及びデコーディング装置で同じく導出され、前記エンコーディング装置は、原本ブロックの原本サンプル値自体でない前記原本ブロックと前記予測されたブロックとの間のレジデュアルに対する情報（レジデュアル情報）をデコーディング装置にシグナリングすることで画像コーディング効率を上げることができる。デコーディング装置は、前記レジデュアル情報に基づいてレジデュアルサンプルを含むレジデュアルブロックを導出し、前記レジデュアルブロックと前記予測されたブロックとを合わせて復元サンプルを含む復元ブロックを生成することができ、復元ブロックを含む復元ピクチャを生成することができる。

前記レジデュアル情報は、変換及び量子化手順を介して生成されることができる。例えば、エンコーディング装置は、前記原本ブロックと前記予測されたブロックとの間のレジデュアルブロックを導出し、前記レジデュアルブロックに含まれているレジデュアルサンプル（レジデュアルサンプルアレイ）に変換手順を実行して変換係数を導出し、前記変換係数に量子化手順を実行して量子化された変換係数を導出して関連したレジデュアル情報を（ビットストリームを介して）デコーディング装置にシグナリングできる。ここで、前記レジデュアル情報は、前記量子化された変換係数の値情報、位置情報、変換技法、変換カーネル、量子化パラメータなどの情報を含むことができる。デコーディング装置は、前記レジデュアル情報に基づいて逆量子化／逆変換手順を実行してレジデュアルサンプル（または、レジデュアルブロック）を導出することができる。デコーディング装置は、予測されたブロックと前記レジデュアルブロックとに基づいて復元ピクチャを生成することができる。また、エンコーディング装置は、以後ピクチャのインター予測のための参照のために量子化された変換係数を逆量子化／逆変換してレジデュアルブロックを導出し、これに基づいて復元ピクチャを生成することができる。

図４は、本文書にかかる多重変換技法を概略的に示す。

図４を参照すると、変換部は、前述した図２のエンコーディング装置内の変換部に対応し得、逆変換部は、前述した図２のエンコーディング装置内の逆変換部又は図３のデコーディング装置内の逆変換部に対応し得る。

変換部は、レジデュアルブロック内のレジデュアルサンプル（レジデュアルサンプルアレイ）に基づいて１次変換を行って、（１次）変換係数を導出することができる（Ｓ４１０）。このような１次変換（ｐｒｉｍａｒｙｔｒａｎｓｆｏｒｍ）は、核心変換（ｃｏｒｅｔｒａｎｓｆｏｒｍ）と指称され得る。ここで、前記１次変換は、多重変換選択（ＭｕｌｔｉｐｌｅＴｒａｎｓｆｏｒｍＳｅｌｅｃｔｉｏｎ、ＭＴＳ）に基づき得、１次変換として多重変換が適用される場合、多重核心変換と指称され得る。

多重核心変換は、ＤＣＴ（ＤｉｓｃｒｅｔｅＣｏｓｉｎｅＴｒａｎｓｆｏｒｍ）タイプ２、ＤＳＴ（ＤｉｓｃｒｅｔｅＳｉｎｅＴｒａｎｓｆｏｒｍ）タイプ７、ＤＣＴタイプ８、及び／又はＤＳＴタイプ１をさらに使用して変換する方式を示すことができる。すなわち、前記多重核心変換は、前記ＤＣＴタイプ２、前記ＤＳＴタイプ７、前記ＤＣＴタイプ８、及び前記ＤＳＴタイプ１のうち選択された複数の変換カーネルに基づいて、空間ドメインのレジデュアル信号（又はレジデュアルブロック）を周波数ドメインの変換係数（又は１次変換係数）に変換する変換方法を示すことができる。ここで、前記１次変換係数は、変換部の立場で仮の変換係数と呼ばれ得る。

言い換えると、既存の変換方法が適用される場合、ＤＣＴタイプ２に基づいて、レジデュアル信号（又はレジデュアルブロック）に対する空間ドメインから周波数ドメインへの変換が適用されて、変換係数が生成できた。これと異なり、前記多重核心変換が適用される場合、ＤＣＴタイプ２、ＤＳＴタイプ７、ＤＣＴタイプ８、及び／又はＤＳＴタイプ１等に基づいて、レジデュアル信号（又はレジデュアルブロック）に対する空間ドメインから周波数ドメインへの変換が適用されて、変換係数（又は１次変換係数）が生成できる。ここで、ＤＣＴタイプ２、ＤＳＴタイプ７、ＤＣＴタイプ８、及びＤＳＴタイプ１等は、変換タイプ、変換カーネル（ｋｅｒｎｅｌ）又は変換コア（ｃｏｒｅ）と呼ばれ得る。このようなＤＣＴ／ＤＳＴ変換タイプは、基底関数に基づいて定義されることができる。

前記多重核心変換が実行される場合、前記変換カーネルのうち、対象ブロックに対する垂直変換カーネル及び水平変換カーネルが選択でき、前記垂直変換カーネルに基づいて前記対象ブロックに対する垂直変換が実行され、前記水平変換カーネルに基づいて前記対象ブロックに対する水平変換が実行されることができる。ここで、前記水平変換は、前記対象ブロックの水平成分に対する変換を示すことができ、前記垂直変換は、前記対象ブロックの垂直成分に対する変換を示すことができる。前記垂直変換カーネル／水平変換カーネルは、レジデュアルブロックを含む対象ブロック（ＣＵ又はサブブロック）の予測モード及び／又は変換インデックスに基づいて、適応的に決定されることができる。

また、一例によると、ＭＴＳを適用して１次変換を実行する場合、特定の基底関数を所定の値に設定し、垂直変換又は水平変換であるとき、どの基底関数が適用されるか否かを組み合わせて、変換カーネルに対するマッピング関係を設定することができる。例えば、水平方向の変換カーネルをｔｒＴｙｐｅＨｏｒで示し、垂直方向の変換カーネルをｔｒＴｙｐｅＶｅｒで示す場合、ｔｒＴｙｐｅＨｏｒ又はｔｒＴｙｐｅＶｅｒの値０はＤＣＴ２に設定され、ｔｒＴｙｐｅＨｏｒ又はｔｒＴｙｐｅＶｅｒの値１はＤＳＴ７に設定され、ｔｒＴｙｐｅＨｏｒ又はｔｒＴｙｐｅＶｅｒの値２はＤＣＴ８に設定されることができる。

この場合、多数の変換カーネルセットのいずれかを指示するために、ＭＴＳインデックス情報がエンコーディングされ、デコーディング装置にシグナリングされることができる。例えば、ＭＴＳインデックスが０であると、ｔｒＴｙｐｅＨｏｒ及びｔｒＴｙｐｅＶｅｒの値がすべて０であることを指示し、ＭＴＳインデックスが１であると、ｔｒＴｙｐｅＨｏｒ及びｔｒＴｙｐｅＶｅｒの値がすべて１であることを指示し、ＭＴＳインデックスが２であると、ｔｒＴｙｐｅＨｏｒの値は２であり、ｔｒＴｙｐｅＶｅｒの値は１であることを指示し、ＭＴＳインデックスが３であると、ｔｒＴｙｐｅＨｏｒの値は１であり、ｔｒＴｙｐｅＶｅｒの値は２であることを指示し、ＭＴＳインデックスが４であると、ｔｒＴｙｐｅＨｏｒ及びｔｒＴｙｐｅＶｅｒの値がすべて２であることを指示することができる。

一例によって、ＭＴＳのインデックス情報による変換カーネルセットを表で示すと、次の通りである。

変換部は、前記（１次）変換係数に基づいて２次変換を行って修正された（２次）変換係数を導出する（Ｓ４２０）。前記１次変換は空間ドメインから周波数ドメインへの変換であり、前記２次変換は（１次）変換係数間に存在する相関関係（ｃｏｒｒｅｌａｔｉｏｎ）を利用してより圧縮的な表現に変換することを意味する。前記２次変換は非分離変換（ｎｏｎ－ｓｅｐａｒａｂｌｅｔｒａｎｓｆｏｒｍ）を含む。この場合、前記２次変換は非分離２次変換（ｎｏｎ－ｓｅｐａｒａｂｌｅｓｅｃｏｎｄａｒｙｔｒａｎｓｆｏｒｍ、ＮＳＳＴ）又はＭＤＮＳＳＴ（ｍｏｄｅ－ｄｅｐｅｎｄｅｎｔｎｏｎ－ｓｅｐａｒａｂｌｅｓｅｃｏｎｄａｒｙｔｒａｎｓｆｏｒｍ）と呼ばれてもよい。前記非分離２次変換は、前記１次変換により導出された（１次）変換係数を非分離変換マトリックス（ｎｏｎ－ｓｅｐａｒａｂｌｅｔｒａｎｓｆｏｒｍｍａｔｒｉｘ）に基づいて２次変換してレジデュアル信号に対する修正された変換係数（又は、２次変換係数）を生成する変換を示す。ここで、前記非分離変換マトリックスに基づいて前記（１次）変換係数に対して垂直変換及び水平変換を分離して（又は、水平垂直変換を独立的に）適用せずに一度に変換を適用することができる。言い換えると、前記非分離２次変換は、前記（１次）変換係数に対して垂直方向と水平方向に別に適用されずに、例えば、２次元信号（変換係数）を特定の決まった方向（例えば、行優先（ｒｏｗ－ｆｉｒｓｔ）方向又は列優先（ｃｏｌｕｍｎ－ｆｉｒｓｔ）方向）により１次元信号に再整列した後、前記非分離変換マトリックスに基づいて修正された変換係数（又は、２次変換係数）を生成する変換方法を示す。例えば、行優先順序はＭ×Ｎブロックに対して１番目の行、２番目の行、．．．、Ｎ番目の行の順に一列に配置することであり、列優先順序はＭ×Ｎブロックに対して１番目の列、２番目の列、．．．、Ｍ番目の列の順に一列に配置することである。前記非分離２次変換は、（１次）変換係数で構成されたブロック（以下、変換係数ブロックという）の左上側（ｔｏｐ－ｌｅｆｔ）領域に対して適用できる。例えば、前記変換係数ブロックの幅（Ｗ）及び高さ（Ｈ）が両方とも８以上である場合、８×８非分離２次変換が前記変換係数ブロックの左上側８×８の領域に対して適用できる。また、前記変換係数ブロックの幅（Ｗ）及び高さ（Ｈ）が両方とも４以上でありながら、前記変換係数ブロックの幅（Ｗ）又は高さ（Ｈ）が８より小さい場合、４×４非分離２次変換が前記変換係数ブロックの左上側ｍｉｎ（８，Ｗ）×ｍｉｎ（８，Ｈ）領域に対して適用できる。ただ、実施形態はこれに限定されず、例えば、前記変換係数ブロックの幅（Ｗ）又は高さ（Ｈ）が両方とも４以上である条件のみを満足しても、４×４非分離２次変換が前記変換係数ブロックの左上側ｍｉｎ（８，Ｗ）×ｍｉｎ（８，Ｈ）領域に対して適用されることもできる。

具体的に、例えば、４×４の入力ブロックが使用される場合、非分離２次変換は次のように実行されることができる。

前記４×４の入力ブロックＸは、次のように示されることができる。

前記Ｘをベクトルの形態で示す場合、ベクトル
は、次のように示されることができる。

数式２のように、ベクトル
は、行優先（ｒｏｗ－ｆｉｒｓｔ）の順序によって、数式１におけるＸの２次元ブロックを１次元ベクトルに再配列する。

この場合、前記２次非分離変換は、次のように計算されることができる。

ここで、
は、変換係数ベクトルを示し、Ｔは、１６×１６の（非分離）変換マトリックスを示す。

前記数式３を介して、１６×１の変換係数ベクトル
が導出でき、前記
は、スキャン順序（水平、垂直、対角（ｄｉａｇｏｎａｌ）等）を介して、４×４ブロックで再構成（ｒｅ－ｏｒｇａｎｉｚｅｄ）できる。但し、前述した計算は例示であって、非分離２次変換の計算複雑度を減らすために、ＨｙＧＴ（Ｈｙｐｅｒｃｕｂｅ－ＧｉｖｅｎｓＴｒａｎｓｆｏｒｍ）等が非分離２次変換の計算のために使用されることもできる。

一方、前記非分離２次変換は、モードベース（ｍｏｄｅｄｅｐｅｎｄｅｎｔ）として変換カーネル（又は変換コア、変換タイプ）が選択できる。ここで、モードは、イントラ予測モード及び／又はインター予測モードを含むことができる。

前述したように、前記非分離２次変換は、前記変換係数ブロックの幅（Ｗ）及び高さ（Ｈ）に基づいて決定された８×８変換又は４×４変換に基づいて実行されることができる。８ｘ８変換は、ＷとＨがすべて８よりも等しいか大きいとき、当該変換係数ブロックの内部に含まれた８ｘ８領域に適用されることができる変換を指し、当該８ｘ８領域は、当該変換係数ブロックの内部の左上側の８ｘ８領域であり得る。同様に、４ｘ４変換は、ＷとＨがすべて４よりも等しいか大きいとき、当該変換係数ブロックの内部に含まれた４ｘ４領域に適用されることができる変換を指し、当該４ｘ４領域は、当該変換係数ブロックの内部の左上側の４ｘ４領域であり得る。例えば、８ｘ８変換カーネルマトリックスは、６４ｘ６４／１６ｘ６４行列、４ｘ４変換カーネルマトリックスは、１６ｘ１６／８ｘ１６行列になり得る。

そのとき、モードベースの変換カーネルの選択のために、８×８変換及び４×４変換の両方に対して、非分離２次変換のための変換セット当たり２個ずつの非分離２次変換カーネルが構成され得、変換セットは４個であり得る。すなわち、８×８変換に対して４個の変換セットが構成され、４×４変換に対して４個の変換セットが構成され得る。この場合、８×８変換に対する４個の変換セットには、それぞれ２個ずつの８×８変換カーネルが含まれ得、この場合、４×４変換に対する４個の変換セットには、それぞれ２個ずつの４×４変換カーネルが含まれ得る。

但し、前記変換のサイズ、すなわち、変換が適用される領域のサイズは例示として８×８又は４×４以外のサイズが使用され得、前記セットの数はｎ個、各セット内の変換カーネルの数はｋ個であり得る。

前記変換セットは、ＮＳＳＴセット又はＬＦＮＳＴセットと呼ばれ得る。前記変換セットのうちの特定セットの選択は、例えば、現在ブロック（ＣＵ又はサブブロック）のイントラ予測モードに基づいて実行されることができる。ＬＦＮＳＴ（Ｌｏｗ－ＦｒｅｑｕｅｎｃｙＮｏｎ－ＳｅｐａｒａｂｌｅＴｒａｎｓｆｏｒｍ）は、後述される減少した非分離変換の一例であり得、低周波成分に対する非分離変換を示す。

参考までに、例えば、イントラ予測モードは、２個の非方向性（ｎｏｎ－ｄｉｒｅｃｔｉｎｏａｌ、又は非角度性（ｎｏｎ－ａｎｇｕｌａｒ））イントラ予測モードと６５個の方向性（ｄｉｒｅｃｔｉｏｎａｌ、又は角度性（ａｎｇｕｌａｒ））イントラ予測モードとを含むことができる。前記非方向性イントラ予測モードは、０番であるプラナー（ｐｌａｎａｒ）イントラ予測モード及び１番であるＤＣイントラ予測モードを含むことができ、前記方向性イントラ予測モードは、２番乃至６６番の６５個のイントラ予測モードを含むことができる。但し、これは例示であって、本文書は、イントラ予測モードの数が異なる場合にも適用できる。一方、場合に応じて、６７番のイントラ予測モードがさらに使用でき、前記６７番のイントラ予測モードは、ＬＭ（ｌｉｎｅａｒｍｏｄｅｌ）モードを示すことができる。

図５は、６５個の予測方向のイントラ方向性モードを例示的に示す。

図５を参照すると、右下側対角の予測方向を有する３４番のイントラ予測モードを中心に水平方向性（ｈｏｒｉｚｏｎｔａｌｄｉｒｅｃｔｉｏｎａｌｉｔｙ）を有するイントラ予測モードと、垂直方向性（ｖｅｒｔｉｃａｌｄｉｒｅｃｔｉｏｎａｌｉｔｙ）を有するイントラ予測モードとを区分することができる。図５のＨとＶは、それぞれ水平方向性と垂直方向性を意味し、－３２～３２の数字は、サンプルグリッドポジション（ｓａｍｐｌｅｇｒｉｄｐｏｓｉｔｉｏｎ）上で１／３２単位の変位を示す。これは、モードインデックス値に対するオフセットを示すことができる。２番乃至３３番のイントラ予測モードは水平方向性、３４番乃至６６番のイントラ予測モードは垂直方向性を有する。一方、３４番のイントラ予測モードは、厳密に言えば、水平方向性でも垂直方向性でもないと見ることができるが、２次変換の変換セットを決定する観点から、水平方向性に属すると分類できる。これは、３４番のイントラ予測モードを中心に対称である垂直方向モードに対しては、入力データをトランスポーズ（ｔｒａｎｓｐｏｓｅ）して使用し、３４番のイントラ予測モードに対しては、水平方向モードに対する入力データの整列方式を使用するためである。入力データをトランスポーズすることは、２次元ブロックのデータＭｘＮに対して、行が列となり、列が行となり、ＮｘＭのデータを構成することを意味する。１８番のイントラ予測モードと５０番のイントラ予測モードとは、それぞれ水平イントラ予測モード（ｈｏｒｉｚｏｎｔａｌｉｎｔｒａｐｒｅｄｉｃｔｉｏｎｍｏｄｅ）、垂直イントラ予測モード（ｖｅｒｔｉｃａｌｉｎｔｒａｐｒｅｄｉｃｔｉｏｎｍｏｄｅ）を示し、２番のイントラ予測モードは、左側の参照ピクセルをもって右上側方向と予測するので、右上側対角のイントラ予測モードと呼ばれ得、同じ脈絡で３４番のイントラ予測モードは、右下側対角のイントラ予測モード、６６番のイントラ予測モードは、左下側対角のイントラ予測モードと呼ばれ得る。

一例によって、イントラ予測モードによって、４個の変換セットのマッピング（ｍａｐｐｉｎｇ）は、例えば、次の表のように示され得る。

表２のように、イントラ予測モードによって４個の変換セットのいずれか、すなわち、ｌｆｎｓｔＴｒＳｅｔＩｄｘが０から３、すなわち、４個のいずれかにマッピングされることができる。

一方、非分離変換に特定セットが使用されるものと決定されると、非分離２次変換インデックスを介して、前記特定セット内のｋ個の変換カーネルのうち一つが選択できる。エンコーディング装置は、ＲＤ（ｒａｔｅ－ｄｉｓｔｏｒｔｉｏｎ）チェックに基づいて特定の変換カーネルを指す非分離２次変換インデックスを導出することができ、前記非分離２次変換インデックスをデコーディング装置にシグナリングできる。デコーディング装置は、前記非分離２次変換インデックスに基づいて、特定セット内のｋ個の変換カーネルのうち一つを選択することができる。例えば、ｌｆｎｓｔのインデックス値０は、１番目の非分離２次変換カーネルを指すことができ、ｌｆｎｓｔのインデックス値１は、２番目の非分離２次変換カーネルを指すことができ、ｌｆｎｓｔのインデックス値２は、３番目の非分離２次変換カーネルを指すことができる。或いは、ｌｆｎｓｔのインデックス値０は、対象ブロックに対して、１番目の非分離２次変換が適用されないことを指すことができ、ｌｆｎｓｔのインデックス値１乃至３は、前記３個の変換カーネルを指すことができる。

変換部は、選択された変換カーネルに基づいて前記非分離２次変換を実行し、修正された（２次）変換係数を獲得することができる。前記修正された変換係数は、前述したように量子化部を介して量子化された変換係数で導出されることができ、エンコーディングされて、デコーディング装置にシグナリング及びエンコーディング装置内の逆量子化／逆変換部に伝達されることができる。

一方、前述したように２次変換が省略される場合、前記１次（分離）変換の出力である（１次）変換係数が、前述したように量子化部を介して量子化された変換係数で導出されることができ、エンコーディングされて、デコーディング装置にシグナリング及びエンコーディング装置内の逆量子化／逆変換部に伝達されることができる。

逆変換部は、前述した変換部で実行された手順の逆順で一連の手順を実行することができる。逆変換部は、（逆量子化された）変換係数を受信し、２次（逆）変換を実行して（１次）変換係数を導出し（Ｓ４５０）、前記（１次）変換係数に対して１次（逆）変換を実行し、レジデュアルブロック（レジデュアルサンプル）を獲得することができる（Ｓ４６０）。ここで、前記１次変換係数は、逆変換部の立場で、修正された（ｍｏｄｉｆｉｅｄ）変換係数と呼ばれ得る。エンコーディング装置及びデコーディング装置は、前記レジデュアルブロックと予測されたブロックとに基づいて復元ブロックを生成し、これに基づいて復元ピクチャを生成できることは前述した通りである。

一方、デコーディング装置は、２次逆変換適用可否決定部（又は２次逆変換の適用可否を決定する要素）と、２次逆変換決定部（又は２次逆変換を決定する要素）をさらに含むことができる。２次逆変換適用可否決定部は、２次逆変換の適用可否を決定することができる。例えば、２次逆変換は、ＮＳＳＴ、ＲＳＴ又はＬＦＮＳＴであり得、２次逆変換適用可否決定部は、ビットストリームからパーシングした２次変換フラグに基づいて、２次逆変換の適用可否を決定することができる。別の一例として、２次逆変換適用可否決定部は、レジデュアルブロックの変換係数に基づいて、２次逆変換の適用可否を決定することもできる。

２次逆変換決定部は、２次逆変換を決定することができる。そのとき、２次逆変換決定部は、イントラ予測モードによって指定されたＬＦＮＳＴ（ＮＳＳＴ又はＲＳＴ）変換セットに基づいて、現在ブロックに適用される２次逆変換を決定することができる。また、一実施形態として、１次変換決定方法に依存的に（ｄｅｐｅｎｄｏｎ）２次変換決定方法が決定できる。イントラ予測モードによって１次変換と２次変換の多様な組み合わせが決定できる。また、一例として、２次逆変換決定部は、現在ブロックの大きさに基づいて、２次逆変換が適用される領域を決定することもできる。

一方、前述したように、２次（逆）変換が省略される場合、（逆量子化された）変換係数を受信し、前記１次（分離）逆変換を実行してレジデュアルブロック（レジデュアルサンプル）を獲得することができる。エンコーディング装置及びデコーディング装置は、前記レジデュアルブロックと予測されたブロックに基づいて復元ブロックを生成し、これに基づいて復元ピクチャを生成できることは前述した通りである。

一方、本文書においては、非分離２次変換に伴われる計算量とメモリ要求量の低減のために、ＮＳＳＴの概念で変換マトリックス（カーネル）の大きさが減少したＲＳＴ（ｒｅｄｕｃｅｄｓｅｃｏｎｄａｒｙｔｒａｎｓｆｏｒｍ）を適用することができる。

一方、本文書で説明された変換カーネル、変換マトリックス、変換カーネルマトリックスを構成する係数、すなわち、カーネル係数又はマトリックス係数は、８ビットで表現され得る。これは、デコーディング装置及びエンコーディング装置で具現するための一つの条件であり得、既存の９ビット又は１０ビットと比較し、合理的に受け入れられる性能低下を伴いながら、変換カーネルを格納するためのメモリ要求量を減らすことができる。また、カーネルマトリックスを８ビットで表現することによって、小さい掛け算器を使用でき、最適のソフトウェアの具現のために使用されるＳＩＭＤ（ＳｉｎｇｌｅＩｎｓｔｒｕｃｔｉｏｎＭｕｌｔｉｐｌｅＤａｔａ）命令により好適であり得る。

本明細書において、ＲＳＴは簡素化ファクター（ｆａｃｔｏｒ）によって大きさが減少した変換マトリックス（ｔｒａｎｓｆｏｒｍｍａｔｒｉｘ）に基づいて、対象ブロックに対するレジデュアルサンプルに対して実行される変換を意味することができる。簡素化変換を実行する場合、変換マトリックスの大きさの減少により、変換時に要求される演算量が減少し得る。すなわち、ＲＳＴは、大きさが大きいブロックの変換又は非分離変換時に発生する演算の複雑度（ｃｏｍｐｌｅｘｉｔｙ）のイシューを解消するために利用できる。

ＲＳＴは、減少した変換、減少変換、ｒｅｄｕｃｅｄｔｒａｎｓｆｏｒｍ、ｒｅｄｕｃｅｄｓｅｃｏｎｄａｒｙｔｒａｎｓｆｏｒｍ、ｒｅｄｕｃｔｉｏｎｔｒａｎｓｆｏｒｍ、ｓｉｍｐｌｉｆｉｅｄｔｒａｎｓｆｏｒｍ、ｓｉｍｐｌｅｔｒａｎｓｆｏｒｍ等の多様な用語で指称され得、ＲＳＴが指称され得る名称は、挙げられた例示に限定されない。或いは、ＲＳＴは、主に変換ブロックで０ではない係数を含む低周波領域で行われるので、ＬＦＮＳＴ（Ｌｏｗ－ＦｒｅｑｕｅｎｃｙＮｏｎ－ＳｅｐａｒａｂｌｅＴｒａｎｓｆｏｒｍ）と指称されることもある。前記変換インデックスは、ＬＦＮＳＴインデックスと名付けられ得る。

一方、２次逆変換がＲＳＴに基づいてなされる場合、エンコーディング装置２００の逆変換部２３５とデコーディング装置３００の逆変換部３２２とは、変換係数に対する逆ＲＳＴに基づいて修正された変換係数を導出する逆ＲＳＴ部と、修正された変換係数に対する逆１次変換に基づいて前記対象ブロックに対するレジデュアルサンプルを導出する逆１次変換部とを備えることができる。逆１次変換は、レジデュアルに適用されていた１次変換の逆変換を意味する。本文書において変換に基づいて変換係数を導出することは、当該変換を適用して変換係数を導出することを意味できる。

図６は、本文書の一実施形態に係るＲＳＴを説明するための図である。

本明細書において、「対象ブロック」は、コーディングが実行される現在ブロック又はレジデュアルブロック又は変換ブロックを意味することができる。

一実施形態に係るＲＳＴで、Ｎ次元ベクトル（Ｎｄｉｍｅｎｓｉｏｎａｌｖｅｃｔｏｒ）が異なる空間に位置したＲ次元ベクトル（Ｒｄｉｍｅｎｓｉｏｎａｌｖｅｃｔｏｒ）にマッピングされ、減少した変換マトリックスが決定でき、ここで、ＲはＮよりも小さい。Ｎは、変換が適用されるブロックの一辺の長さ（ｌｅｎｇｔｈ）の二乗、又は変換が適用されるブロックと対応する変換係数の総個数を意味することができ、簡素化ファクターは、Ｒ／Ｎ値を意味することができる。簡素化ファクターは、減少したファクター、減少ファクター、ｒｅｄｕｃｅｄｆａｃｔｏｒ、ｒｅｄｕｃｔｉｏｎｆａｃｔｏｒ、ｓｉｍｐｌｉｆｉｅｄｆａｃｔｏｒ、ｓｉｍｐｌｅｆａｃｔｏｒ等の多様な用語で指称され得る。一方、Ｒは、簡素化係数（ｒｅｄｕｃｅｄｃｏｅｆｆｉｃｉｅｎｔ）と指称され得るが、場合に応じては、簡素化ファクターがＲを意味することもある。また、場合に応じて、簡素化ファクターは、Ｎ／Ｒ値を意味することもある。

一実施形態において、簡素化ファクター又は簡素化係数は、ビットストリームを介してシグナリングできるが、実施形態がこれに限定されるわけではない。例えば、簡素化ファクター又は簡素化係数に対する既に定義された値が各エンコーディング装置２００及びデコーディング装置３００に格納されていることがあり、この場合、簡素化ファクター又は簡素化係数は、別にシグナリングされないことがある。

一実施形態にかかる簡素化変換マトリックスのサイズは、通常の変換マトリックスのサイズＮｘＮよりも小さいＲｘＮであり、下記の数式４のように定義されることができる。

図６の（ａ）に示すＲｅｄｕｃｅｄＴｒａｎｓｆｏｒｍブロック内のマトリックスＴは、数式４のマトリックスＴ_ＲｘＮを意味することができる。図６の（ａ）のように、対象ブロックに対するレジデュアルサンプルに対して簡素化変換マトリックスＴ_ＲｘＮが掛けられる場合、対象ブロックに対する変換係数が導出できる。

一実施形態において、変換が適用されるブロックのサイズが８ｘ８であり、Ｒ＝１６（すなわち、Ｒ／Ｎ＝１６／６４＝１／４である）である場合、図６の（ａ）によるＲＳＴは、下記の数式５のような行列演算で表現され得る。この場合、メモリと掛け算演算が簡素化ファクターにより略１／４と減少し得る。

本文書において行列演算とは、行列を列ベクトルの左側に置いて、行列と列ベクトルを掛けて列ベクトルを得る演算で理解できる。

数式５において、ｒ_１乃至ｒ_６４は、対象ブロックに対するレジデュアルサンプルを示すことができ、より具体的に、１次変換を適用して生成された変換係数であり得る。数式５の演算結果、対象ブロックに対する変換係数ｃ_ｉが導出でき、ｃ_ｉの導出過程は数式６の通りである。

数式６の演算結果、対象ブロックに対する変換係数ｃ_１乃至ｃ_Ｒが導出できる。すなわち、Ｒ＝１６である場合、対象ブロックに対する変換係数ｃ_１乃至ｃ_１６が導出できる。もし、ＲＳＴではなく、通常の（ｒｅｇｕｌａｒ）変換が適用されて、サイズが６４ｘ６４（ＮｘＮ）である変換マトリックスが、サイズが６４ｘ１（Ｎｘ１）であるレジデュアルサンプルに掛けられたら、対象ブロックに対する変換係数が６４個（Ｎ個）が導出されるかもしれないが、ＲＳＴが適用されたため、対象ブロックに対する変換係数が１６個（Ｒ個）のみ導出される。対象ブロックに対する変換係数の総個数がＮ個からＲ個に減少し、エンコーディング装置２００がデコーディング装置３００に送信するデータの量が減少するので、エンコーディング装置２００－デコーディング装置３００の間の送信効率が増加し得る。

変換マトリックスのサイズの観点から検討すると、通常の変換マトリックスのサイズは６４ｘ６４（ＮｘＮ）であるが、簡素化変換マトリックスのサイズは１６ｘ６４（ＲｘＮ）と減少するので、通常の変換を実行する時と比較すると、ＲＳＴを実行する時にメモリの使用をＲ／Ｎの割合で減少させることができる。また、通常の変換マトリックスを用いる際の掛け算演算の数ＮｘＮと比較すると、簡素化変換マトリックスを用いると、掛け算演算の数をＲ／Ｎの割合で減少（ＲｘＮ）させることができる。

一実施形態において、エンコーディング装置２００の変換部２３２は、対象ブロックに対するレジデュアルサンプルを１次変換及びＲＳＴベースの２次変換を実行することによって、対象ブロックに対する変換係数を導出することができる。このような変換係数は、デコーディング装置３００の逆変換部に伝達されることができ、デコーディング装置３００の逆変換部３２２は、変換係数に対する逆ＲＳＴ（ｒｅｄｕｃｅｄｓｅｃｏｎｄａｒｙｔｒａｎｓｆｏｒｍ）に基づいて修正された変換係数を導出し、修正された変換係数に対する逆１次変換に基づいて、対象ブロックに対するレジデュアルサンプルを導出することができる。

一実施形態にかかる逆ＲＳＴマトリックスＴ_ＮｘＲのサイズは、通常の逆変換マトリックスのサイズＮｘＮよりも小さいＮｘＲであり、数式４に示した簡素化変換マトリックスＴ_ＲｘＮとトランスポーズ（ｔｒａｎｓｐｏｓｅ）の関係にある。

図６の（ｂ）に示したＲｅｄｕｃｅｄＩｎｖ．Ｔｒａｎｓｆｏｒｍブロック内のマトリックスＴ^ｔは、逆ＲＳＴマトリックスＴ_ＲｘＮ ^Ｔを意味することができる（上付き文字Ｔはトランスポーズを意味する）。図６の（ｂ）のように、対象ブロックに対する変換係数に対して逆ＲＳＴマトリックスＴ_ＲｘＮ ^Ｔが掛けられる場合、対象ブロックに対する修正された変換係数又は対象ブロックに対するレジデュアルサンプルが導出できる。逆ＲＳＴマトリックスＴ_ＲｘＮ ^Ｔは、（Ｔ_ＲｘＮ）^Ｔ _ＮｘＲと表現することもある。

より具体的に、２次逆変換に逆ＲＳＴが適用される場合には、対象ブロックに対する変換係数に対して逆ＲＳＴマトリックスＴ_ＲｘＮ ^Ｔが掛けられると、対象ブロックに対する修正された変換係数が導出できる。一方、逆１次変換に逆ＲＳＴが適用でき、この場合、対象ブロックに対する変換係数に対して逆ＲＳＴマトリックスＴＲｘＮＴが掛けられると、対象ブロックに対するレジデュアルサンプルが導出できる。

一実施形態において、逆変換が適用されるブロックのサイズが８ｘ８であり、Ｒ＝１６（すなわち、Ｒ／Ｎ＝１６／６４＝１／４である場合）である場合、図６の（ｂ）によるＲＳＴは、下記の数式７のような行列演算で表現されることができる。

数式７において、ｃ_１乃至ｃ_１６は、対象ブロックに対する変換係数を示すことができる。数式７の演算結果、対象ブロックに対する修正された変換係数又は対象ブロックに対するレジデュアルサンプルを示すｒ_ｉが導出でき、ｒ_ｉの導出過程は、数式８の通りである。

数式８の演算結果、対象ブロックに対する修正された変換係数又は対象ブロックに対するレジデュアルサンプルを示すｒ_１乃至ｒ_Ｎが導出できる。逆変換マトリックスのサイズの観点から検討すると、通常の逆変換マトリックスのサイズは６４ｘ６４（ＮｘＮ）であるが、簡素化逆変換マトリックスのサイズは、６４ｘ１６（ＮｘＲ）と減少するので、通常の逆変換を実行する時と比較すると、逆ＲＳＴを実行する時にメモリの使用をＲ／Ｎの割合で減少させることができる。また、通常の逆変換マトリックスを用いる時の掛け算演算の数ＮｘＮと比較すると、簡素化逆変換マトリックスを用いると、掛け算演算の数をＲ／Ｎの割合で減少（ＮｘＲ）させることができる。

一方、８ｘ８のＲＳＴに対しても、表２のような変換セットの構成を適用することができる。すなわち、表２での変換セットによって当該８ｘ８のＲＳＴが適用できる。一つの変換セットは、画面内の予測モードによって２個又は３個の変換（カーネル）で構成されているので、２次変換を適用しない場合まで含めて、最大４個の変換のうち一つを選択するように構成されることができる。２次変換を適用しないときの変換は、恒等行列が適用されたものとみなされ得る。４個の変換に対してそれぞれ０、１、２、３のインデックスを付与するとしたとき（例えば、０番のインデックスを恒等行列、すなわち、２次変換を適用しない場合に割り当てることができる）、変換インデックス又はｌｆｎｓｔのインデックスというシンタックス要素（ｓｙｎｔａｘｅｌｅｍｅｎｔ）を変換係数のブロック毎にシグナリングし、適用される変換を指定することができる。すなわち、変換インデックスを介して８ｘ８左上側のブロックに対して、ＲＳＴの構成では８ｘ８のＲＳＴを指定することができ、又はＬＦＮＳＴが適用される場合、８ｘ８のｌｆｎｓｔを指定することができる。８ｘ８のｌｆｎｓｔ及び８ｘ８のＲＳＴは、変換の対象になる対象ブロックのＷとＨがすべて８よりも等しいか大きいとき、当該変換係数のブロック内部に含まれた８ｘ８領域に適用されることができる変換を指し、当該８ｘ８領域は、当該変換係数のブロック内部の左上側の８ｘ８領域であり得る。同様に、４ｘ４のｌｆｎｓｔ及び４ｘ４のＲＳＴは、対象ブロックのＷとＨがすべて４よりも等しいか大きいとき、当該変換係数のブロック内部に含まれた４ｘ４領域に適用されることができる変換を指し、当該４ｘ４領域は、当該変換係数のブロック内部の左上側の４ｘ４領域であり得る。

一方、本文書の一実施形態にかかり、エンコーディング過程の変換で、８ｘ８領域を構成する６４個のデータに対して、１６ｘ６４の変換カーネルマトリックスではなく、４８個のデータのみを選択し、最大１６ｘ４８の変換カーネルマトリックスを適用することができる。ここで、「最大」とは、ｍ個の係数を生成することができるｍｘ４８の変換カーネルマトリックスに対して、ｍの最大値が１６ということを意味する。すなわち、８ｘ８の領域にｍｘ４８の変換カーネルマトリックス（ｍ≦１６）を適用してＲＳＴを実行する場合、４８個のデータの入力を受けて、ｍ個の係数を生成できる。ｍが１６である場合、４８個のデータの入力を受けて、１６個の係数を生成する。すなわち、４８個のデータが４８ｘ１ベクトルをなすとしたとき、１６ｘ４８行列と４８ｘ１ベクトルを順序通りに掛けて、１６ｘ１ベクトルが生成できる。そのとき、８ｘ８領域をなす４８個のデータを適切に配列し、４８ｘ１ベクトルを構成することができる。そのとき、最大１６ｘ４８の変換カーネルマトリックスを適用して行列演算を行うと、１６個の修正された変換係数が生成されるが、１６個の修正された変換係数は、スキャニング順序に従って左上側の４ｘ４領域に配置されることができ、右上側の４ｘ４領域と左下側の４ｘ４領域は０で満たされ得る。

デコーディング過程の逆変換には、前記述べられた変換カーネルマトリックスのトランスポーズされたマトリックスが使用できる。すなわち、デコーディング装置で実行される逆変換過程で逆ＲＳＴ又はＬＦＮＳＴが実行される場合、逆ＲＳＴを適用する入力係数データは、所定の配列順序に従って１次元ベクトルで構成され、１次元ベクトルに当該逆ＲＳＴの行列を左側で掛けて得られた修正された係数ベクトルを所定の配列順序に従って２次元ブロックに配列されることができる。

整理すると、変換過程で、８ｘ８領域にＲＳＴ又はＬＦＮＳＴが適用される場合、８ｘ８領域の変換係数のうち、８ｘ８領域の右下側領域を除いた左上側、右上側、左下側領域の４８個の変換係数と、１６ｘ４８の変換カーネルマトリックスとの行列演算が実行される。行列演算のために、４８個の変換係数は１次元の配列に入力される。このような行列演算が行われると、１６個の修正された変換係数が導出され、修正された変換係数は、８ｘ８領域の左上側領域に配列されることができる。

逆に、逆変換過程で、８ｘ８領域に逆ＲＳＴ又はＬＦＮＳＴが適用される場合、８ｘ８領域の変換係数のうち、８ｘ８領域の左上側に対応する１６個の変換係数は、スキャニング順序に従って、１次元の配列形態で入力されて、４８ｘ１６の変換カーネルマトリックスと行列演算されることができる。すなわち、このような場合の行列演算は、（４８ｘ１６行列）＊（１６ｘ１変換係数ベクトル）＝（４８ｘ１修正された変換係数ベクトル）で示すことができる。ここで、ｎｘ１ベクトルは、ｎｘ１行列のような意味で解釈され得るので、ｎｘ１列ベクトルで表記されることもある。また、＊は、行列の掛け算演算を意味する。このような行列演算が行われると、４８個の修正された変換係数が導出でき、４８個の修正された変換係数は、８ｘ８領域の右下側領域を除いた左上側、右上側、左下側領域に配列されることができる。

前述された非分離変換、ＬＦＮＳＴについて具体的にみると、次の通りである。ＬＦＮＳＴは、エンコーディング装置による順方向（ｆｏｒｗａｒｄ）変換と、デコーディング装置による逆方向（ｉｎｖｅｒｓｅ）変換を含むことができる。

エンコーディング装置は、順方向１次変換（ｐｒｉｍａｒｙ（ｃｏｒｅ）ｔｒａｎｓｆｏｒｍ）を適用した後、導出された結果（又は結果の一部）を入力として、順方向２次変換（ｓｅｃｏｎｄａｒｙｔｒａｎｓｆｏｒｍ）を適用する。

前記数式９で、ｘとｙは、それぞれ２次変換の入力と出力であり、Ｇは、２次変換を示す行列であって、変換基底ベクトル（ｔｒａｎｓｆｏｒｍｂａｓｉｓｖｅｃｔｏｒ）は列ベクトルで構成される。逆方向ＬＦＮＳＴの場合、変換行列Ｇの次元（ｄｉｍｅｎｓｉｏｎ）を［ｒｏｗ数×ｃｏｌｕｍｎ数］で表記したとき、順方向ＬＦＮＳＴの場合、行列ＧのトランスポーズをとったことがＧ^Ｔの次元になる。

逆方向ＬＦＮＳＴの場合、行列Ｇの次元は、［４８ｘ１６］、［４８ｘ８］、［１６ｘ１６］、［１６ｘ８］となり、［４８ｘ８］行列と［１６ｘ８］行列は、それぞれ［４８ｘ１６］行列と［１６ｘ１６］行列の左側から８個の変換基底ベクトルをサンプリングした部分行列である。

反面、順方向ＬＦＮＳＴの場合、行列ＧＴの次元は、［１６ｘ４８］、［８ｘ４８］、［１６ｘ１６］、［８ｘ１６］となり、［８ｘ４８］行列と［８ｘ１６］行列は、それぞれ［１６ｘ４８］行列と［１６ｘ１６］行列の上方から８個の変換基底ベクトルをサンプリングした部分行列である。

従って、順方向ＬＦＮＳＴの場合、入力ｘとしては［４８ｘ１］ベクトル又は［１６ｘ１］ベクトルが可能であり、出力ｙとしては、［１６ｘ１］ベクトル又は［８ｘ１］ベクトルが可能である。ビデオコーディング及びデコーディングにおける順方向１次変換の出力は、２次元（２Ｄ）データであるので、入力ｘとして［４８ｘ１］ベクトル又は［１６ｘ１］ベクトルを構成するために、順方向変換の出力である２Ｄデータを適切に配列して１次元ベクトルを構成しなければならない。

図７は、一例によって、順方向１次変換の出力データを１次元ベクトルに配列する順序を示した図である。図７の（ａ）及び（ｂ）の左側図は、［４８ｘ１］ベクトルを作るための順序を示し、図７の（ａ）及び（ｂ）の右側図は、［１６ｘ１］ベクトルを作るための順序を示す。ＬＦＮＳＴの場合、図７の（ａ）及び（ｂ）のような順序で２Ｄデータを順次に配列し、１次元ベクトルｘが得られる。

このような順方向１次変換の出力データの配列方向は、現在ブロックのイントラ予測モードによって決定されることができる。例えば、現在ブロックのイントラ予測モードが対角線方向を基準に水平方向であると、順方向１次変換の出力データは、図７の（ａ）の順に配列されることができ、現在ブロックのイントラ予測モードが対角線方向を基準に垂直方向であると、順方向１次変換の出力データは、図７の（ｂ）の順に配列されることができる。

一例によって、図７の（ａ）及び（ｂ）の配列順序（ｏｒｄｅｒｉｎｇ）と異なる配列順序を適用することができ、図７の（ａ）及び（ｂ）の配列順序を適用したときと同じ結果（ｙベクトル）を導出するためには、行列Ｇの列ベクトルを当該配列順序に合わせて再配列すればよい。すなわち、ｘベクトルを構成する各要素に対して、常時同じ変換基底ベクトルと掛けられるようにＧの列ベクトルを再配置することができる。

数式９を介して導出される出力ｙは、１次元ベクトルであるので、もし順方向２次変換の結果を入力として処理する構成、例えば、量子化又はレジデュアルコーディングを実行する構成が、入力データとして２次元データが必要であれば、数式９の出力ｙベクトルは再度２Ｄデータに適切に配置されなければならない。

図８は、一例によって順方向２次変換の出力データを２次元ブロックで配列する順序を示した図である。

ＬＦＮＳＴの場合、決められたスキャン順序に従って２Ｄブロックに配置されることができる。図８の（ａ）は、出力ｙが［１６ｘ１］ベクトルである場合、２次元ブロックの１６個の位置に対角スキャン（ｄｉａｇｏｎａｌｓｃａｎ）順序に従って出力値が配置されることを示す。図８の（ｂ）は、出力ｙが［８ｘ１］ベクトルである場合、２次元ブロックの８個の位置に対角スキャン順序に従って出力値が配置され、残りの８個の位置には０で満たされることを示す。図８の（ｂ）のＸは、０と満たされることを示す。

別の例によって、量子化又はレジデュアルコーディング実行する構成により、出力ベクトルｙが処理される順序は、既設定された順序に従って実行されることができるため、図７のように、出力ベクトルｙが２Ｄブロックに配置されないことがある。但し、レジデュアルコーディングの場合、ＣＧ（ＣｏｅｆｆｉｃｉｅｎｔＧｒｏｕｐ）のような２Ｄブロック（例えば、４ｘ４）単位でデータコーディングが実行でき、この場合、図７の対角スキャン順序のように特定の順序に従ってデータが配列できる。

一方、デコーディング装置は、逆方向の変換のために逆量子化過程等を通じて出力された２次元データを既設定されたスキャン順序に従って羅列し、１次元入力ベクトルであるｙを構成することができる。入力ベクトルｙは、下記数式により入力ベクトルｘに出力されることができる。

逆方向ＬＦＮＳＴの場合、［１６ｘ１］ベクトル又は［８ｘ１］ベクトルである入力ベクトルｙにＧ行列を掛けることによって、出力ベクトルｘを導出することができる。逆方向ＬＦＮＳＴの場合、出力ベクトルｘは［４８ｘ１］ベクトル又は［１６ｘ１］ベクトルであり得る。

出力ベクトルｘは、図７に示した順序に従って、２次元ブロックに配置されて２次元データに配列され、このような２次元データは、逆方向１次変換の入力データ（又は入力データの一部）になる。

従って、逆方向２次変換は、全体的に順方向２次変換の過程と反対であり、逆変換の場合、順方向と異なり、逆方向２次変換を先に適用した後、逆方向１次変換を適用することになる。

逆方向ＬＦＮＳＴでは、変換行列Ｇとして［４８ｘ１６］行列８個と［１６ｘ１６］行列８個のうち１つが選択できる。［４８ｘ１６］行列と［１６ｘ１６］行列のうち、どの行列を適用するか否かは、ブロックの大きさと形状によって決定される。

また、８個の行列は、前述した表２のように４個の変換セットから導出されることができ、各変換セットは、２個の行列で構成されることができる。４個の変換セットのうち、どの変換セットを使用するかはイントラ予測モードによって決定され、より具体的に広角イントラ予測モード（ＷｉｄｅＡｎｇｌｅＩｎｔｒａＰｒｅｄｉｃｔｉｏｎ、ＷＡＩＰ）まで考慮して、拡張されたイントラ予測モード値に基づいて変換セットが決定される。選択された変換セットを構成する２個の行列のうち、どの行列を選択するかはインデックスシグナリング（ｉｎｄｅｘｓｉｇｎａｌｉｎｇ）を介して導出される。より具体的に、送信されるインデックス値としては、０、１、２が可能であり、０はＬＦＮＳＴを適用しないことを指示し、１と２はイントラ予測モード値に基づいて選択された変換セットを構成する２個の変換行列の何れかを指示することができる。

図９は、本文書の一実施形態に係る広角イントラ予測モードを示した図である。

一般的なイントラ予測モード値は、０～６６と８１～８３までの値を有し得、示したように、ＷＡＩＰにより拡張されたイントラ予測モード値は、－１４～８３までの値を有し得る。８１～８３までの値は、ＣＣＬＭ（ＣｒｏｓｓＣｏｍｐｏｏｎｅｎｔＬｉｎｅａｒＭｏｄｅｌ）モードを示し、－１４～－１までの値と６７～８０までの値は、ＷＡＩＰ適用により拡張されたイントラ予測モード値を示す。

予測の現在ブロックの幅が高さより大きい場合、だいたい上側の参照ピクセルが予測しようとするブロック内部の位置とさらに近い。従って、右上側（ｔｏｐ－ｒｉｇｈｔ）方向に予測することより左下側（ｂｏｔｔｏｍ－ｌｅｆｔ）方向に予測することがより正確である。逆に、ブロックの高さが幅より大きい場合は、左側の参照ピクセルが予測しようとするブロック内部の位置とだいたい近い。従って、左下側（ｂｏｔｔｏｍ－ｌｅｆｔ）方向に予測することより右上側（ｔｏｐ－ｒｉｇｈｔ）方向に予測することがより正確である。従って、広角イントラ予測モードのインデックスでリマッピング、すなわち、モードインデックス変換を適用することが有利である。

広角イントラ予測が適用される場合、既存のイントラ予測に対する情報がシグナリングされ、前記情報がパーシングされた後、前記情報が前記広角イントラ予測モードのインデックスでリマッピングされることができる。従って、特定のブロック（例えば、特定サイズの非正方形ブロック）に対する総イントラ予測モードの数は変更されなくてもよく、すなわち、総イントラ予測モードの数は６７個であり、前記特定のブロックに対するイントラ予測モードのコーディングは変更されなくてもよい。

下記の表３は、イントラ予測モードを広角イントラ予測モードでリマッピングして、修正されたイントラモードを導出する過程を示している。

表３において、最終的にｐｒｅｄＭｏｄｅＩｎｔｒａ変数に拡張されたイントラ予測モード値が格納され、ＩＳＰ＿ＮＯ＿ＳＰＬＩＴは、現在ＶＶＣ標準に採択されたＩｎｔｒａＳｕｂＰａｒｔｉｔｉｏｎｓ（ＩＳＰ）技術によりＣＵブロックがサブパーティションに分割されないことを示し、ｃＩｄｘ変数値が０、１、２であることは、各々ルマ、Ｃｂ、Ｃｒコンポーネントである場合を示す。表３で登場するＬｏｇ２関数は、ベース（ｂａｓｅ）が２であるログ値をリターンし、Ａｂｓ関数は絶対値をリターンする。

広角イントラ予測モードのマッピング過程（Ｗｉｄｅａｎｇｌｅｉｎｔｒａｐｒｅｄｉｃｔｉｏｎｍｏｄｅｍａｐｐｉｎｇｐｒｏｃｅｓｓ）の入力値でイントラ予測モードを指示する変数ｐｒｅｄＭｏｄｅＩｎｔｒａ、変換ブロックの高さ及び幅などが用いられ、出力値は修正されたイントラ予測モード（ｔｈｅｍｏｄｉｆｉｅｄｉｎｔｒａｐｒｅｄｉｃｔｉｏｎｍｏｄｅｐｒｅｄＭｏｄｅＩｎｔｒａ）になる。変換ブロック又はコーディングブロックの高さ及び幅がイントラ予測モードのリマッピングのための現在ブロックの高さ及び幅になることができる。そのとき、幅と高の比率を反映する変数ｗｈＲａｔｉｏはＡｂｓ（Ｌｏｇ２（ｎＷ／ｎＨ））に設定されることができる。

正方形ではないブロックに対して、イントラ予測モードは２つの場合に区分されて修正されることができる。

まず、（１）現在ブロックの幅が高さよりも大きく、（２）修正前のイントラ予測モードが２と等しいか大きく、（３）イントラ予測モードが、変数ｗｈＲａｔｉｏが１より大きいと（８＋２＊ｗｈＲａｔｉｏ）であって、変数ｗｈＲａｔｉｏが１より等しいか小さいと８で導出される値より小さい［ｐｒｅｄＭｏｄｅＩｎｔｒａｉｓｌｅｓｓｔｈａｎ（ｗｈＲａｔｉｏ＞１）？（８＋２＊ｗｈＲａｔｉｏ）：８］という全ての条件を満たすと、イントラ予測モードはイントラ予測モードより６５大きい値に設定される［ｐｒｅｄＭｏｄｅＩｎｔｒａｉｓｓｅｔｅｑｕａｌｔｏ（ｐｒｅｄＭｏｄｅＩｎｔｒａ＋６５）］。

前記と異なる場合、（１）現在ブロックの高さが幅より大きく、（２）修正前のイントラ予測モードが６６と等しいか小さく、（３）イントラ予測モードが、変数ｗｈＲａｔｉｏが１より大きいと（６０－２＊ｗｈＲａｔｉｏ）であって、変数ｗｈＲａｔｉｏが１より等しいか小さいと６０で導出される値より大きい［ｐｒｅｄＭｏｄｅＩｎｔｒａｉｓｇｒｅａｔｅｒｔｈａｎ（ｗｈＲａｔｉｏ＞１）？（６０－２＊ｗｈＲａｔｉｏ）：６０］という全ての条件を満たすと、イントラ予測モードはイントラ予測モードより６７小さい値に設定される［ｐｒｅｄＭｏｄｅＩｎｔｒａｉｓｓｅｔｅｑｕａｌｔｏ（ｐｒｅｄＭｏｄｅＩｎｔｒａ－６７）］。

前述した表２は、ＬＦＮＳＴでＷＡＩＰにより拡張されたイントラ予測モード値に基づいて、変換セットがどのように選択されるかを示している。図９のように、１４～３３までのモードと３５～８０までのモードは、モード３４を中心に予測方向の観点から互いに対称である。例えば、モード１４とモード５４は、モード３４に該当する方向を中心に対称である。従って、互いに対称となる方向に位置するモード同士は同じ変換セットを適用することになり、表２でもこのような対称性が反映されている。

但し、モード５４に対する順方向ＬＦＮＳＴ入力データは、モード１４に対する順方向ＬＦＮＳＴ入力データと対称をなすことを仮定する。例えば、モード１４とモード５４については、各々図７の（ａ）と図７の（ｂ）に示された配列順序に従って、２次元データを１次元データに再配列することになり、図７の（ａ）と図７の（ｂ）に示された順序のパターンは、モード３４の指す方向（対角線方向）を中心に対称であることが分かる。

一方、前述したように、［４８ｘ１６］行列と［１６ｘ１６］行列のうち、どの変換行列をＬＦＮＳＴに適用するか否かは、変換対象ブロックの大きさと形状により決定される。

図１０は、ＬＦＮＳＴが適用されるブロックの形状を示した図である。図１０の（ａ）は４ｘ４ブロックを、（ｂ）は４ｘ８及び８ｘ４ブロックを、（ｃ）はＮが１６以上である４ｘＮ又はＮｘ４ブロックを、（ｄ）は８ｘ８ブロックを、（ｅ）はＭ≧８、Ｎ≧８であり、Ｎ＞８又はＭ＞８であるＭｘＮブロックを示している。

図１０で、太い枠を有するブロックが、ＬＦＮＳＴが適用される領域を指す。図１０の（ａ）及び（ｂ）のブロックについては、左上側（ｔｏｐ－ｌｅｆｔ）の４ｘ４領域に対してＬＦＮＳＴが適用され、図１０の（ｃ）のブロックに対しては、連続して配置された２個の左上側の４ｘ４領域に対して、それぞれＬＦＮＳＴが適用される。図１０の（ａ）、（ｂ）、（ｃ）では、４ｘ４領域の単位でＬＦＮＳＴが適用されるので、このようなＬＦＮＳＴを以下「４ｘ４のＬＦＮＳＴ」と名づけることとし、当該変換行列としては、数式９及び数式１０のＧに対する行列次元を基準［１６ｘ１６］又は［１６ｘ８］行列が適用できる。

より具体的に、図１０の（ａ）の４ｘ４ブロック（４ｘ４ＴＵ又は４ｘ４ＣＵ）に対しては［１６ｘ８］行列が適用され、図１０の（ｂ）及び（ｃ）におけるブロックに対しては［１６ｘ１６］行列が適用される。これは、最悪の場合（ｗｏｒｓｔｃａｓｅ）に対する計算複雑度をサンプル当たり８掛け算（８ｍｕｌｔｉｐｌｉｃａｔｉｏｎｓｐｅｒｓａｍｐｌｅ）に合わせるためである。

図１０の（ｄ）及び（ｅ）については、左上側の８ｘ８領域に対してＬＦＮＳＴが適用され、このようなＬＦＮＳＴを以下「８ｘ８のＬＦＮＳＴ」と名付けることとする。当該変換行列としては、［４８ｘ１６］又は［４８ｘ８］行列が適用できる。順方向ＬＦＮＳＴの場合、入力データとして［４８ｘ１］ベクトル（数式９のｘベクトル）が入力されるので、左上側の８ｘ８領域の全てのサンプル値が順方向ＬＦＮＳＴの入力値として使用されない。すなわち、図７の（ａ）の左側順序又は図７の（ｂ）の左側順序で見るように、右下側（ｂｏｔｔｏｍ－ｒｉｇｈｔ）の４ｘ４ブロックはそのまま置いて、残りの３個の４ｘ４ブロックに属したサンプルに基づいて、［４８ｘ１］ベクトルを構成することができる。

図１０の（ｄ）における８ｘ８ブロック（８ｘ８ＴＵ又は８ｘ８ＣＵ）に［４８ｘ８］行列が適用され、図１０の（ｅ）における８ｘ８ブロックに［４８ｘ１６］行列が適用できる。これもやはり、最悪の場合（ｗｏｒｓｔｃａｓｅ）に対する計算複雑度をサンプル当たり８掛け算（８ｍｕｌｔｉｐｌｉｃａｔｉｏｎｓｐｅｒｓａｍｐｌｅ）に合わせるためである。

ブロックの形状に応じて、これに対応する順方向ＬＦＮＳＴ（４ｘ４ＬＦＮＳＴ又は８ｘ８ＬＦＮＳＴ）が適用されると、８個又は１６個の出力データ（数式９におけるｙベクトル、［８ｘ１］又は［１６ｘ１］ベクトル）が生成され、順方向ＬＦＮＳＴでは、行列ＧＴの特性上、出力データの数が入力データの数よりも等しいか少なくなる。

図１１は、一例によって順方向ＬＦＮＳＴの出力データの配置を示した図面であり、ブロック形状に沿って順方向ＬＦＮＳＴの出力データが配置されるブロックを示す。

図１１に示したブロックの左上側に陰影で処理された領域が順方向ＬＦＮＳＴの出力データが位置する領域に当該し、０で表記された位置は０値で満たされるサンプルを示し、残りの領域は、順方向ＬＦＮＳＴにより変更されない領域を示す。ＬＦＮＳＴにより変更されない領域には、順方向１次変換の出力データが変更されずにそのまま存在する。

前述したように、ブロックの形状に応じて適用される変換行列の次元が変わるので、出力データの数も変わる。図１１のように、順方向ＬＦＮＳＴの出力データが左上側４ｘ４ブロックを全て満たさないこともある。図１１の（ａ）及び（ｄ）の場合、太い線で表示されたブロック又はブロック内部の一部領域には、それぞれ［１６ｘ８］行列と［４８ｘ８］行列が適用されて、順方向ＬＦＮＳＴの出力で［８ｘ１］ベクトルが生成される。すなわち、図８の（ｂ）に示したスキャン順序に従って、８個の出力データのみ図１１の（ａ）及び（ｄ）のように満たされ、残りの８個の位置に対しては０が満たされることができる。図１０の（ｄ）のＬＦＮＳＴの適用ブロックの場合、図１１の（ｄ）のように左上側の４ｘ４ブロックに隣接した右上側及び左下側の２個の４ｘ４ブロックも０値で満たされる。

前記のように、基本的にＬＦＮＳＴインデックスをシグナリングし、ＬＦＮＳＴの適用可否、及び適用する変換行列を指定することになる。図１１に示したように、ＬＦＮＳＴが適用される場合、順方向ＬＦＮＳＴの出力データの数が入力データの数よりも等しいか少ないことがあるため、０値で満たされる領域が次のように発生する。

１）図１１の（ａ）のように、左上側の４ｘ４ブロック内にスキャン順序上８番目以降の位置、すなわち、９番目から１６番目までのサンプル

２）図１１の（ｄ）及び（ｅ）のように、［１６×４８］行列又は［８×４８］行列が適用されて左上側の４×４ブロックに隣接した２つの４×４ブロック又はスキャン順序上の２番目と３番目の４×４ブロック

従って、前記１）と２）の領域をチェックし、０ではない（ｎｏｎ－ｚｅｒｏ）データが存在することになると、ＬＦＮＳＴが適用されていないことが確実であるため、当該ＬＦＮＳＴインデックスのシグナリングを省略することができるようになる。

一方、採択されたＬＦＮＳＴについて、次のような単純化方法が適用できる。

（ｉ）一例によって、順方向ＬＦＮＳＴに対する出力データの数を最大１６個に限定することができる。

図１０の（ｃ）の場合、左上側に隣接した２個の４ｘ４領域に各々４ｘ４のＬＦＮＳＴが適用され、このとき、最大３２個のＬＦＮＳＴ出力データが生成できる。もし、順方向ＬＦＮＳＴに対する出力データの数を最大１６に限定すると、４ｘＮ／Ｎｘ４（Ｎ≧１６）ブロック（ＴＵ又はＣＵ）に対しても左上側に存在する１個の４ｘ４領域に対してのみ４ｘ４のＬＦＮＳＴを適用し、図１０の全てのブロックに対してＬＦＮＳＴを一度だけ適用できる。これを通じて、画像コーディングに対する実現が単純になる。

図１２は、一例によって順方向ＬＦＮＳＴに対する出力データの数を最大１６個に限定したことを示す。図１２のように、Ｎが１６以上である４ｘＮ又はＮｘ４ブロックで最左上側４ｘ４領域に対してＬＦＮＳＴが適用されると、順方向ＬＦＮＳＴの出力データは１６個になる。

（ｉｉ）一例によって、ＬＦＮＳＴが適用されない領域に対してさらにゼロアウト（ｚｅｒｏ－ｏｕｔ）を適用することができる。本文書において、ゼロアウトは特定の領域に属した全ての位置の値を０値で満たすことを意味し得る。すなわち、ＬＦＮＳＴにより変更されず、順方向１次変換の結果を維持している領域に対してもゼロアウトを適用することができる。前述したように、ＬＦＮＳＴは４ｘ４のＬＦＮＳＴと８ｘ８のＬＦＮＳＴとに区分されるので、次のように２種類（（ｉｉ）－（Ａ）及び（ｉｉ）－（Ｂ））にゼロアウトを区分することができる。

（ｉｉ）－（Ａ）４ｘ４のＬＦＮＳＴが適用されるとき、４ｘ４のＬＦＮＳＴが適用されない領域をゼロアウトすることができる。図１３は、一例によって、４ｘ４のＬＦＮＳＴが適用されるブロックにおけるゼロアウトを示す図である。

図１３のように、４ｘ４のＬＦＮＳＴが適用されるブロックに対して、すなわち、図１１の（ａ）、（ｂ）及び（ｃ）のブロックに対してＬＦＮＳＴが適用されない領域まですべて０で満たされ得る。

一方、図１３の（ｄ）は、図１２のように順方向ＬＦＮＳＴの出力データの数の最大値を１６に限定した場合、４ｘ４のＬＦＮＳＴが適用されない残りのブロックに対してゼロアウトを実行したことを示す。

（ｉｉ）－（Ｂ）８ｘ８のＬＦＮＳＴが適用されるとき、８ｘ８のＬＦＮＳＴが適用されない領域をゼロアウトすることができる。図１４は、一例によって、８ｘ８のＬＦＮＳＴが適用されるブロックにおけるゼロアウトを示す図である。

図１４のように、８ｘ８のＬＦＮＳＴが適用されるブロックに対して、すなわち、図１１の（ｄ）及び（ｅ）のブロックに対してＬＦＮＳＴが適用されない領域まですべて０で満たされ得る。

（ｉｉｉ）前記（ｉｉ）で提示したゼロアウトによりＬＦＮＳＴが適用されるとき、０で満たされる領域が変わり得る。従って、前記（ｉｉ）で提案されたゼロアウトによって、０ではないデータが存在するかどうかを図１１のＬＦＮＳＴの場合よりも広い領域に対してチェックすることができる。

例えば、（ｉｉ）－（Ｂ）を適用する場合、図１１の（ｄ）及び（ｅ）で０値で満たされる領域に追加し、図１４でさらに０で満たされた領域まで０ではないデータが存在するかどうかをチェックした後、０ではないデータが存在しない場合にのみＬＦＮＳＴインデックスに対するシグナリングを実行することができる。

もちろん、前記（ｉｉ）で提案されたゼロアウトを適用しても、既存のＬＦＮＳＴインデックスのシグナリングと同様に０ではないデータが存在するかどうかをチェックすることができる。すなわち、図１１に０で満たされたブロックに対して０ではないデータが存在するかどうかをチェックし、ＬＦＮＳＴインデックスのシグナリングを適用することができる。このような場合、エンコーディング装置にのみゼロアウトを実行し、デコーディング装置では当該ゼロアウトを仮定せず、すなわち、図１１で明示的に０で表記された領域に対してのみ０ではないデータが存在するかどうかのみチェックし、ＬＦＮＳＴインデックスのパーシングを実行することができる。

前記ＬＦＮＳＴに対する単純化方法（（ｉ）、（ｉｉ）－（Ａ）、（ｉｉ）－（Ｂ）、（ｉｉｉ））の組み合わせを適用した様々な実施形態を導出することができる。もちろん、前記単純化方法に対する組み合わせは、下記の実施形態に限定されず、任意の組み合わせをＬＦＮＳＴに適用できる。

実施形態

－順方向ＬＦＮＳＴに対する出力データの数を最大１６個に限定→（ｉ）

－４ｘ４のＬＦＮＳＴが適用されるとき、４ｘ４のＬＦＮＳＴが適用されない領域をすべてゼロアウト→（ｉｉ）－（Ａ）

－８ｘ８のＬＦＮＳＴが適用されるとき、８ｘ８のＬＦＮＳＴが適用されない領域をすべてゼロアウト→（ｉｉ）－（Ｂ）

－既存の０値で満たされる領域と追加的なゼロアウト（（ｉｉ）－（Ａ）、（ｉｉ）－（Ｂ））により０で満たされる領域に対しても０ではないデータが存在するかどうかをチェックした後、０ではないデータが存在しない場合にのみＬＦＮＳＴインデキシングのシグナリング→（ｉｉｉ）

前記実施形態の場合、ＬＦＮＳＴが適用されるとき、０ではない出力データが存在し得る領域が左上側４ｘ４領域の内部に制限される。より詳細には、図１３の（ａ）と図１４の（ａ）の場合、スキャン順序上、８番目の位置が０ではないデータが存在し得る最後の位置になり、図１３の（ｂ）及び（ｄ）と図１４の（ｂ）の場合、スキャン順序上、１６番目の位置（すなわち、左上側４ｘ４ブロックの右下側縁の位置）が０ではないデータが存在し得る最後の位置になる。

従って、ＬＦＮＳＴが適用されたとき、レジデュアルコーディング過程が許容されない位置（最も最後の位置を越えた位置で）で０ではないデータが存在するか否かをチェックした後、ＬＦＮＳＴインデックスのシグナリング可否が決定できる。

（ｉｉ）で提案されたゼロアウト方式の場合、１次変換とＬＦＮＳＴの両方ともを適用したときに最終的に発生するデータの数が減少するため、全体変換過程を行うときに要求される計算量を減らすことができる。すなわち、ＬＦＮＳＴが適用される場合、ＬＦＮＳＴが適用されない領域に存在する順方向１次変換出力データに対してもゼロアウトを適用するため、順方向１次変換を行うときからゼロアウトとなる領域に対するデータを生成する必要がない。従って、当該データ生成に要求される演算量を節約することができる。（ｉｉ）で提案されたゼロアウト方式の追加的な効果をまとめると、以下のようである。

第１に、前記のように全体変換過程の実行に必要な計算量が低減する。

特に、（ｉｉ）－（Ｂ）を適用する場合、最悪の場合に対する計算量が減少して変換の過程を軽量化することができる。敷衍すると、一般的に大きなサイズの１次変換実行に大量の演算が要求されるが、（ｉｉ）－（Ｂ）を適用すると、順方向ＬＦＮＳＴ実行結果として導出されるデータの数を１６個以下に減らすことができ、全体ブロック（ＴＵまたはＣＵ）サイズが大きくなるほど、変換演算量低減効果はさらに増加する。

第２に、変換過程全体に必要な演算量が減少して変換実行に必要な電力消費を削減することができる。

第３に、変換過程に伴う遅延時間（ｌａｔｅｎｃｙ）を減少させる。

ＬＦＮＳＴのような２次変換は既存の１次変換に計算量を追加することになるので、変換実行に伴う全体遅延時間を増加させる。特に、イントラ予測の場合、予測過程で隣接ブロックの復元データが使用されるので、エンコーディング時に２次変換による遅延時間の増加が復元（ｒｅｃｏｎｓｔｒｕｃｔｉｏｎ）までの遅延時間の増加につながり、イントラ予測エンコーディングの全体的な遅延時間の増加につながる可能性がある。

しかしながら、（ｉｉ）で提示したゼロアウトを適用すると、ＬＦＮＳＴ適用時に１次変換実行の遅延時間を大幅に減らすことができるため、変換実行全体に対する遅延時間はそのまま維持されるか低減することになり、エンコーディング装置をより簡単に実現することができる。

一方、従来のイントラ予測は、現在符号化しようとするブロックを１つの符号化単位とみなして分割なしに符号化を行っていた。しかしながら、ＩＳＰ（ＩｎｔｒａＳｕｂ－Ｐａｒｉｔｉｏｎｓ）コーディングは、現在符号化しようとするブロックを水平方向又は垂直方向に分割してイントラ予測符号化を行うことを意味する。このとき、分割されたブロック単位で符号化／復号化を行って復元されたブロックを生成し、復元されたブロックは次の分割されたブロックの参照ブロックとして使用される。一例によって、ＩＳＰコーディング時に１つのコーディングブロックが２つ又は４つのサブブロックに分割されてコーディングされてもよく、ＩＳＰにおいて１つのサブブロックは隣接する左側又は隣接する上側に位置するサブブロックの復元されたピクセル値を参照してイントラ予測が行われる。以下、使用される「コーディング」は、エンコーディング装置において行われるエンコーディングとデコーディング装置で行われるデコーディングを全て含む概念として使用される。

一方、以下ではＬＦＮＳＴインデックスとＭＴＳインデックスのシグナリングについて見てみる。

一例に係るＬＦＮＳＴインデクスとＭＴＳインデクスのシグナリングに関連する符号化装置シンタックステーブルは次の表の通りである。

前記表の主な変数の意味は次の通りである。

１．ｃｂＷｉｄｔｈ，ｃｂＨｅｉｇｈｔ：現在の符号化ブロック（ＣｏｄｉｎｇＢｌｏｃｋ）の幅と高さ

２．ｌｏｇ２ＴｂＷｉｄｔｈ，ｌｏｇ２ＴｂＨｅｉｇｈｔ：現在の変換ブロック（ＴｒａｎｓｆｏｒｍＢｌｏｃｋ）の幅と高さに対するベース－２のログ値、ゼロアウトが反映され０ではない係数（ｎｏｎ－ｚｅｒｏｃｏｅｆｆｉｃｉｅｎｔ）が存在できる左上セクションに縮小することができる。

３．ｓｐｓ＿ｌｆｎｓｔ＿ｅｎａｂｌｅｄ＿ｆｌａｇ：ＬＦＮＳＴの適用可否（ｅｎａｂｌｅ）を示すフラグとして、フラグ値が０であれば、ＬＦＮＳＴが適用不可能であることを示し、フラグ値が１であれば、ＬＦＮＳＴが適用可能であることを示す。シーケンスパラメータセット（ＳｅｑｕｅｎｃｅＰａｒａｍｅｔｅｒＳｅｔ；ＳＰＳ）に定義されている。

４．ＣｕＰｒｅｄＭｏｄｅ［ｃｈＴｙｐｅ］［ｘ０］［ｙ０］：変数ｃｈＴｙｐｅと（ｘ０，ｙ０）位置に対応する予測モード、ｃｈＴｙｐｅは０と１値を持ち、０はルマ要素を示し１はクロマ要素を示す。（ｘ０，ｙ０）位置はピクチャ上での位置を示しＣｕＰｒｅｄＭｏｄｅ［ｃｈＴｙｐｅ］［ｘ０］［ｙ０］値としてはＭＯＤＥ＿ＩＮＴＲＡ（イントラ予測）とＭＯＤＥ＿ＩＮＴＥＲ（インター予測）が可能である。

５．ＩｎｔｒａＳｕｂＰａｒｔｉｔｉｏｎｓＳｐｌｉｔＴｙｐｅ：現在の符号化装置に、あるＩＳＰ分割が適用されたかを示し、ＩＳＰ＿ＮＯ＿ＳＰＬＩＴは符号化装置がパーティションブロックに分割されなかったことを示す。

６．ｉｎｔｒａ＿ｍｉｐ＿ｆｌａｇ［ｘ０］［ｙ０］：（ｘ０，ｙ０）位置に対する内容は前記４番の通りである。ｉｎｔｒａ＿ｍｉｐ＿ｆｌａｇはＭＩＰ（Ｍａｔｒｉｘ－ｂａｓｅｄＩｎｔｒａＰｒｅｄｉｃｔｉｏｎ）予測モードが適用されたか否かを示すフラグである。フラグ値が０であれば、ＭＩＰが適用不可能であることを示し、フラグ値が１であれば、ＭＩＰが適用されることを示す。

７．ｃＩｄｘ：０値はルマを示し、１値と２値はそれぞれクロマ要素であるＣｂ、Ｃｒを示す。

８．ｔｒｅｅＴｙｐｅ：シングルツリー（ｓｉｎｇｌｅ－ｔｒｅｅ）とデュアルツリー（ｄｕａｌ－ｔｒｅｅ）などを指す（ＳＩＮＧＬＥ＿ＴＲＥＥ：シングルツリー、ＤＵＡＬ＿ＴＲＥＥ＿ＬＵＭＡ：ルマ要素に対するデュアルツリー、ＤＵＡＬ＿ＴＲＥＥ＿ＣＨＲＯＭＡ：クロマ要素に対するデュアルツリー）

９．ｌｆｎｓｔ＿ｉｄｘ［ｘ０］［ｙ０］：パーシングしたいＬＦＮＳＴインデクスシンタックス要素である。パーシングされない場合は、０値と推測できる。すなわち、デフォルト値が０に設定されＬＦＮＳＴを適用しないことを示す。

前記説明されたシンタックス要素に対する説明は以下の表に示したシンタックス要素に適用される。

表４において、ｔｒａｎｓｆｏｒｍ＿ｓｋｉｐ＿ｆｌａｇ［ｘ０］［ｙ０］［０］＝＝０であることはルマ要素に対して変換スキップの有無によってｌｆｎｓｔインデクスがシグナリングの有無を判断する１つの条件になる。

これに、一例にしたがって、ルマ要素に対する変換スキップフラグとクロマ要素に対するＬＦＮＳＴインデクスシグナリング間の依存性を除去し、ＬＦＮＳＴ適用に係る最悪の場合の遅延（ｔｈｅｗｏｒｓｔ－ｃａｓｅｄｅｌａｙ）を解消するために以下のような符号化装置シンタックステーブルを提案する。

表５のような実施例では、ルマ要素に対するＬＦＮＳＴインデクスのシグナリングはデュアルツリータイプとシングルツリー分割モード全てに対してルマ要素に対する変換スキップフラグにのみ依存する。デュアルツリーモードの場合、クロマ要素に対するＬＦＮＳＴインデクスはクロマ要素に対する変換スキップフラグにのみ依存してシグナリングされる。シングルツリー分割モードでは、最悪の場合に対する遅延を軽減させるためにクロマ要素に対してＬＦＮＳＴが適用されない。

表５に示した変数ＬｆｎｓｔＴｒａｎｓｆｏｒｍＮｏｔＳｋｉｐＦｌａｇは現在のブロックのツリータイプ及びカラー成分に対する変換スキップフラグ値によって設定され、その値が１である場合にのみ、ＬＦＮＳＴインデクスがシグナリングされる。

変数ＬｆｎｓｔＴｒａｎｓｆｏｒｍＮｏｔＳｋｉｐＦｌａｇはツリータイプがデュアルツリークロマではなければ（ｔｒｅｅＴｙｐｅ！＝ＤＵＡＬ＿ＴＲＥＥ＿ＣＨＲＯＭＡ）、つまりツリータイプがシングルツリーであるかデュアルツリールマであれば、ルマ要素に対する変換スキップフラグ値が０であるとき、１に設定され（ｔｒｅｅＴｙｐｅ！＝ＤＵＡＬ＿ＴＲＥＥ＿ＣＨＲＯＭＡ？ｔｒａｎｓｆｏｒｍ＿ｓｋｉｐ＿ｆｌａｇ［ｘ０］［ｙ０］［０］＝＝０：（ｔｒａｎｓｆｏｒｍ＿ｓｋｉｐ＿ｆｌａｇ［ｘ０］［ｙ０］［１］＝＝０｜｜ｔｒａｎｓｆｏｒｍ＿ｓｋｉｐ＿ｆｌａｇ［ｘ０］［ｙ０］［２］＝＝０））、ツリータイプがデュアルツリークロマであれば、クロマＣｂ要素に変換スキップフラグ値（ｔｒａｎｓｆｏｒｍ＿ｓｋｉｐ＿ｆｌａｇ［ｘ０］［ｙ０］［１］）が０であるかクロマＣｒ要素に変換スキップフラグ値（ｔｒａｎｓｆｏｒｍ＿ｓｋｉｐ＿ｆｌａｇ［ｘ０］［ｙ０］［１］）が０であるとき、（ｔｒｅｅＴｙｐｅ！＝ＤＵＡＬ＿ＴＲＥＥ＿ＣＨＲＯＭＡ？ｔｒａｎｓｆｏｒｍ＿ｓｋｉｐ＿ｆｌａｇ［ｘ０］［ｙ０］［０］＝＝０：（ｔｒａｎｓｆｏｒｍ＿ｓｋｉｐ＿ｆｌａｇ［ｘ０］［ｙ０］［１］＝＝０｜｜ｔｒａｎｓｆｏｒｍ＿ｓｋｉｐ＿ｆｌａｇ［ｘ０］［ｙ０］［２］＝＝０））、１に設定される。

本文書において、「ｘ？ｙ：ｚ」演算子はｘが真実（ＴＲＵＥ）であれば、ｘはｙになり、ｘがそれ以外（ｏｔｈｅｒｗｉｓｅ）であれば、ｘはｚになることを示す（ｉｆｘｉｓＴＲＵＥ、ｅｖａｌｕａｔｅｓｔｏｔｈｅｖａｌｕｅｏｆｙ；ｏｔｈｅｒｗｉｓｅ，ｅｖａｌｕａｔｅｓｔｏｔｈｅｖａｌｕｅｏｆｚ）。

表５を考慮した変換過程に対する仕様テキストは以下の通りである。

表４の変数ＬｆｎｓｔＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇはＬＦＮＳＴが適用されるとき、ゼロアウトになる位置に有効係数が存在すれば、０であり、そうでない場合は、１になる。変数ＬｆｎｓｔＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇは以後、表１１に示したいくつかの条件によって設定される。

変数ＬｆｎｓｔＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇは現在のブロックの左上第１セクションを除いた第２セクションに有効係数が存在するか否かを示したもので、この値は最初１に設定され、第２セクションに有効係数が存在すれば、その値は０に変更される。最初設定された変数ＬｆｎｓｔＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇ値が１に維持されてこそＬＦＮＳＴインデクスがパーシングできる。変数ＬｆｎｓｔＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇ値が１であるか否かを判断及び導出するとき、現在のブロックのルマ要素または、クロマ要素全てにＬＦＮＳＴが適用されるため、現在のブロックのカラーインデクスは判断されない。

一例によって、表４の変数ＬｆｎｓｔＤｃＯｎｌｙは該当するＣＢＦ（ＣｏｄｅｄＢｌｏｃｋＦｌａｇ、該当するブロック内に有効係数が１つでも存在すれば１、または、０）値が１である変換ブロックに対して最後の有効係数が全てＤＣ位置（左上位置）に位置すれば１になり、そうでない場合は０になる。より具体的にはデュアルツリールマである場合には最後の有効係数の位置をルマ変換ブロック１つに対してチェックし、デュアルツリークロマである場合にはＣｂに対する変換ブロックとＣｒに対する変換ブロック全てに対して最後の有効係数の位置をチェックする。シングルツリーの場合にはルマ、Ｃｂ、Ｃｒに対する変換ブロックに対して最後の有効係数位置をチェックすることができる。

その一方で、他の例に係るＬＦＮＳＴインデクスをシグナリングする符号化装置のシンタックステーブルは次の通りである。

表７において、ｔｒａｎｓｆｏｒｍ＿ｓｋｉｐ＿ｆｌａｇ［ｘ０］［ｙ０］［ｃＩｄｘ］変数はｃＩｄｘが指示する要素に対する符号化ブロック（ＣｏｄｉｎｇＢｌｏｃｋ）に変換スキップが適用されるか否かを示す。ｃＩｄｘは０、１、２の値を持ち、０はルマ要素を指し、１と２はそれぞれＣｂ要素とＣｒ要素を指す。ｔｒａｎｓｆｏｒｍ＿ｓｋｉｐ＿ｆｌａｇ［ｘ０］［ｙ０］［ｃＩｄｘ］値が１であれば、変換スキップを適用することを示し、０であれば、変換スキップを適用しないことを示す。

表７において、ＬｆｎｓｔＮｏｔＳｋｉｐＦｌａｇ変数は現在の符号化装置を構成する全ての要素に対して（全ての符号化ブロックに対して）変換スキップが適用されない場合にのみ、１に設定されそれ以外の場合は０に設定され、ＬｆｎｓｔＮｏｔＳｋｉｐＦｌａｇが１である場合にのみ、ＬＦＮＳＴインデクス（表７において、ｌｆｎｓｔ＿ｉｄｘ）をシグナリングすることができる。

現在の符号化装置がシングルツリー構造に符号化される場合（表７において、ｔｒｅｅＴｙｐｅがＳＩＮＧＬＥ＿ＴＲＥＥである場合）該当する全ての要素はＹ、Ｃｂ、Ｃｒに構成され、現在の符号化装置がルマに対する分離ツリー（ｓｅｐａｒａｔｅｔｒｅｅ）構造に符号化される場合（表７において、ｔｒｅｅＴｙｐｅがＤＵＡＬ＿ＴＲＥＥ＿ＬＵＭＡである場合）該当する全ての要素はＹのみで構成され、現在の符号化装置がＣｈｒｏｍａに対する分離ツリー構造に符号化される場合（表７において、ｔｒｅｅＴｙｐｅがＤＵＡＬ＿ＴＲＥＥ＿ＣＨＲＯＭＡである場合）該当する全ての要素はＣｂとＣｒで構成される。

つまり、現在の符号化装置を構成する要素のうち、１つでも変換スキップで符号化される場合にはＬＦＮＳＴインデクスをシグナリングせず、該当するＬＦＮＳＴインデクス値は０と推測できる。すなわち、ＬＦＮＳＴを適用しない。

表７の通り、構成要素（Ｙ、Ｃｂ、Ｃｒ）のうち、１つでも変換スキップで符号化される場合ＬＦＮＳＴが適用されないように制限する構造では、シングルツリーの通り、いくつかの要素（Ｙ、Ｃｂ、Ｃｒ）が連続して符号化されパーシング途中に、ある要素が変換スキップとして決定される場合（例えば、ＣｂとＣｒに対して変換スキップとして決定される場合）、ＬＦＮＳＴインデクス値がパーシングできるまで変換スキップで符号化される該当する要素に対して追加して該当する変換係数をバッファリング（ｂｕｆｆｅｒｉｎｇ）しないように構成することもできる。

例えば、ある要素が変換スキップで符号化されることが判明すれば、ＬＦＮＳＴが適用されないことが確実になるため、逆量子化（ｉｎｖｅｒｓｅｑｕａｎｔｉｚａｔｉｏｎ）、逆変換（ｉｎｖｅｒｓｅｔｒａｎｓｆｏｒｍ）などが直ちに実行される。

表７の代わりに表８のようなシンタックステーブルでより簡潔に記述することもできる。

もし、シングルツリーであるとき、ルマ要素に対する変換スキップ有無のみをチェックしてＬＦＮＳＴインデクスのシグナリング有無を決定する場合、以下のような符号化装置に対するシンタックステーブルを構成することができる。

表９でのＬｆｎｓｔＮｏｔＳｋｉｐＦｌａｇは分離ツリーである場合、表７または、表８と同じく決定され（すなわち、ルマ分離ツリーである場合、ルマ要素に対して変換スキップが適用されない場合、１に設定され、そうでない場合、０に設定され、クロマ分離ツリーである場合、Ｃｂ要素とＣｒ要素に対して全て変換スキップが適用されない場合、１に設定され、そうでない場合０で設定される）、シングルツリーの場合、ルマ要素に対してのみ変換スキップが適用されない場合、１に設定され、そうでない場合、０で設定される表９の代わりに表１０のようなシンタックステーブルを適用することもできる。

その一方で、シングルツリーの場合、ルマ要素に対してのみＬＦＮＳＴを適用するときＬＦＮＳＴインデクスシグナリング条件を決定する実施例は次の通りである。

表４、表５の符号化装置シンタックステーブルと表７、表８、表９、表１０において、ＬＦＮＳＴインデクスをシグナリングする条件にＬｆｎｓｔＤｃＯｎｌｙ変数とＬｆｎｓｔＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇ変数が用いられている。基本的に、表７の通り、ＬｆｎｓｔＤｃＯｎｌｙ変数とＬｆｎｓｔＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇ変数は全て１に初期化され、表１１のように残差符号化に対するシンタックステーブルにおいて、該当する２つの変数値が０に更新される。参考までに、ある要素が（Ｙまたは、Ｃｂまたは、Ｃｒになる。）変換スキップに符号化されれば、表１１の残差符号化が呼び出される代わり他のシンタックステーブル（ｔｒａｎｓｆｏｒｍ＿ｔｓ＿ｃｏｄｉｎｇ）が呼び出され、ＬｆｎｓｔＤｃＯｎｌｙ変数とＬｆｎｓｔＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇ変数は該当する要素に対するＬＦＮＳＴインデクスパーシングが実行されるときは、更新されない。

表１１において、ｌａｓｔＳｕｂＢｌｏｃｋは最後の有効係数（ｌａｓｔｎｏｎ－ｚｅｒｏｃｏｅｆｆｉｃｉｅｎｔ）が位置するサブブロック（ｓｕｂ－ｂｌｏｃｋ，ＣｏｅｆｆｉｃｉｅｎｔＧｒｏｕｐ（ＣＧ））のスキャン順序上の位置を示す。０はＤＣ要素が含まれたサブブロックを指し、０より大きい場合はＤＣ要素が含まれたサブブロックではない。

ｌａｓｔＳｃａｎＰｏｓは最後の有効係数が１つのサブブロック内部において、スキャン順序上どの位置にあるかを示す。１つのサブブロックが１６個の位置で構成されていれば、０から１５までの値が可能である。

ＬａｓｔＳｉｇｎｉｆｉｃａｎｔＣｏｅｆｆＸ、ＬａｓｔＳｉｇｎｉｆｉｃａｎｔＣｏｅｆｆＹは最後の有効係数が変換ブロック内に位置するｘ座標とｙ座標を示す。ｘ座標は０から始まり、左側において、右側に増加し、ｙ座標は０から始まり、上から下に増加する。２つの変数の値が両方０であれば、最後の有効係数がＤＣに位置することを意味する。

表５の実施例に対して基本的に表１１が適用されＬｆｎｓｔＤｃＯｎｌｙ変数値とＬｆｎｓｔＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇ変数値が決定され、表１１が適用されシングルツリーに符号化される場合、全ての要素に対して表１１において、提示する残差符号化が呼び出される。例えば、Ｙ、Ｃｂ、Ｃｒ要素全てが変換スキップに符号化されない場合、全ての要素ごとに残差符号化が実行される。

したがって、表１１が適用されシングルツリーに符号化される場合、１つの要素でもＤＣ位置（該当する変換ブロックの左上位置）以外の位置に最後の０ではない係数が位置すれば、ＬｆｎｓｔＤｃＯｎｌｙ変数が０値に更新され、１つの要素でも最後の０ではない係数の位置がＬＦＮＳＴが適用されたときの変換係数が位置できないセクションに位置すれば、（すなわち、現在ＶＶＣ標準において、４ｘ４変換ブロックまたは、８ｘ８変換ブロックである場合、順方向の変換係数スキャン順序によって１番目から８番目まで位置以外のセクションに位置するか、それ以外のＬＦＮＳＴが適用できる変換ブロックである場合、左上４ｘ４セクション以外のセクションに位置する場合）ＬｆｎｓｔＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇ変数値は０値に更新される。表５の符号化装置シンタックステーブルと表７、表８、表９、表１０において、提示した通り、ＬｆｎｓｔＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇ変数値が１である場合に対してのみ、ＬＦＮＳＴインデクスがシグナリングされ、ＩＳＰモードではなければ、ＬｆｎｓｔＤｃＯｎｌｙ変数値が０である場合に対してのみＬＦＮＳＴインデクスがシグナリングされる。

しかし、シングルツリーにおいて、ルマ要素に対してのみＬＦＮＳＴを適用する場合、ＬＦＮＳＴが適用されない要素（クロマ要素、Ｃｂまたは、Ｃｒ）に対する残差符号化を実行するときはＬｆｎｓｔＤｃＯｎｌｙ変数とＬｆｎｓｔＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇ変数を更新しないように制限することができる。ＬＦＮＳＴが適用されない要素に対する変換係数配置または、分布が、ＬＦＮＳＴインデクスのシグナリング有無を、すなわち、ＬＦＮＳＴが適用されるか否かを決定することは論理的に合わない場合があるためである。

表１２はシングルツリーの場合、ルマ要素に対してのみＬｆｎｓｔＤｃＯｎｌｙ変数とＬｆｎｓｔＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇ変数を更新するように制限する。シングルツリーではない場合には、表１１と同様に全ての要素に対してＬｆｎｓｔＤｃＯｎｌｙ変数とＬｆｎｓｔＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇ変数を更新することができる。

表１２に提示された残差符号化では、表１１に比べてｔｒｅｅＴｙｐｅがパラメータに追加されたため、変換装置に対するシンタックステーブルは表１３の通り修正される。

表５の内容を基本にして、一部の内容を表７から表１０の実施例に置き換えるか、表１１または、表１２の内容を適用することができる。表７から表１０と表１１または、表１２を基準に次のように可能な組み合わせを構成することができる。

１．表７（または、表８）＋表１１

２．表７（または、表８）＋表１２

３．表９（または、表１０）＋表１１

４．表９（または、表１０）＋表１２

以下では、シングルツリーの場合、ルマ要素に対してのみＬＦＮＳＴを適用するとき、クロマ要素に対するスケーリングリスト（ＳｃａｌｉｎｇＬｉｓｔ）の適用方法に対して見てみよう。

現在ＶＶＣＷＤでは、ｓｃａｌｉｎｇ＿ｍａｔｒｉｘ＿ｆｏｒ＿ｌｆｎｓｔ＿ｄｉｓａｂｌｅｄ＿ｆｌａｇというシンタックス要素が定義されているが、ｓｃａｌｉｎｇ＿ｍａｔｒｉｘ＿ｆｏｒ＿ｌｆｎｓｔ＿ｄｉｓａｂｌｅｄ＿ｆｌａｇが１であれば、ＬＦＮＳＴが適用されるとき、スケーリングリストを適用せず、０であれば、ＬＦＮＳＴが適用されるとき、スケーリングリストを適用することができる。

ここで、スケーリングリストは変換ブロックでの変換係数の位置ごとに特定加重値（ｗｅｉｇｈｔ値）を指定する行列として変換係数ごとに該当する加重値を掛けて、逆量子化、または、量子化を実行できるようにして、変換係数の重要度に応じて差分して逆量子化、または、量子化を適用できるようにする。

シングルツリーの場合、表５の実施例の通りルマ要素に対してのみＬＦＮＳＴが適用でき、シングルツリーに符号化されてｓｃａｌｉｎｇ＿ｍａｔｒｉｘ＿ｆｏｒ＿ｌｆｎｓｔ＿ｄｉｓａｂｌｅｄ＿ｆｌａｇ値が１でありＬＦＮＳＴが適用される場合ルマ要素に対してはスケーリングリストを適用しない。このとき、ＬＦＮＳＴが適用されないクロマ要素に対してはスケーリングリストを適用することができる。

表１４は前記のような場合を実装することができる逆量子と過程（ｓｃａｌｉｎｇｐｒｏｃｅｓｓ）の一例を示している。

表１４において、ｔｒｅｅＴｙｐｅは現在処理する変換ブロックが属した符号化装置がどのツリータイプを持っているか示し、ＳＩＮＧＬＥ＿ＴＲＥＥ、ＤＵＡＬ＿ＴＲＥＥ＿ＬＵＭＡ、ＤＵＡＬ＿ＴＲＥＥ＿ＣＨＲＯＭＡは各シングルツリー、ルマに対する分離ツリー、クロマに対する分離ツリー（デュアルツリークロマ）を示す。

本実施例では、シングルツリーであるとき、ルマ要素に対してのみＬＦＮＳＴが適用されるため、ｓｃａｌｉｎｇ＿ｍａｔｒｉｘ＿ｆｏｒ＿ｌｆｎｓｔ＿ｄｉｓａｂｌｅｄ＿ｆｌａｇ値が１でありＬＦＮＳＴが適用されるとき、（ｌｆｎｓｔ＿ｉｄｘ［ｘＴｂＹ］［ｙＴｂＹ］値が０より大きいとき）ルマ要素（ｃＩｄｘ値が０であるときに該当する）に対してはスケーリングリストを適用しない。

その一方で、クロマ要素（ｃＩｄｘ値が０より大きい場合）に対しては他の条件をさらにチェックして（例えば、ｔｒａｎｓｆｏｒｍ＿ｓｋｉｐ＿ｆｌａｇ［ｘＴｂＹ］［ｙＴｂＹ］［ｃＩｄｘ］をチェック）スケーリングリストが適用されるか否かを決定することができる。

分離ツリーである場合には、シングルツリーでのルマ要素の場合と同様に、ｓｃａｌｉｎｇ＿ｍａｔｒｉｘ＿ｆｏｒ＿ｌｆｎｓｔ＿ｄｉｓａｂｌｅｄ＿ｆｌａｇ値が１でありＬＦＮＳＴが適用されるとき、（ｌｆｎｓｔ＿ｉｄｘ［ｘＴｂＹ］［ｙＴｂＹ］値が０より大きいとき）ルマ及びクロマ要素に対してスケーリングリストを適用しない。

または、分離ツリーである場合にはシングルツリーでのクロマ要素の場合と同様に、他の条件をさらにチェックして（例えば、ｔｒａｎｓｆｏｒｍ＿ｓｋｉｐ＿ｆｌａｇ［ｘＴｂＹ］［ｙＴｂＹ］［ｃＩｄｘ］をチェック）スケーリングリストの適用有無を決定することができる。

したがって、ｓｃａｌｉｎｇ＿ｍａｔｒｉｘ＿ｆｏｒ＿ｌｆｎｓｔ＿ｄｉｓａｂｌｅｄ＿ｆｌａｇ値が１であり、シングルツリーにおいてルマ要素に対してのみＬＦＮＳＴが適用できる場合、ルマ要素にはスケーリングリストが適用されず、クロマ要素にはスケーリングリストが適用される。

一例によって、表１４と前記実施例の組み合わせ（表５の内容を基本にして、一部の内容を表７から表１０の実施例に置き換えるか、表１１または、表１２の内容を適用する組み合わせ）が適用される。

この場合、表６の「Ｔｒａｎｓｆｏｒｍｐｒｏｃｅｓｓｆｏｒｓｃａｌｅｄｔｒａｎｓｆｏｒｍｃｏｅｆｆｉｃｉｅｎｔｓ」に対する仕様テキストの通りシングルツリーの場合にはルマ要素に対してのみＬＦＮＳＴを適用するように構成することができる。

以下の図面は本明細書の具体的な一例を説明するために作成された。図面に記載された具体的な装置の名称や具体的な信号／メッセージ／フィールドの名称は例として提示されたことであるため、本明細書の技術的な特徴が以下の図面に用いられた具体的な名称に制限されない。

図１５は本文書の一実施例に係るビデオデコーディング装置の動作を示すフロー図である。

図１５に開示された各ステップは図４から図１４において、前述の内容のうち、一部に基づいたものである。したがって、図３から図１４において、前述の内容と重複する具体的な内容は説明を省略したり簡単にすることにする。

一実施例に係るデコーディング装置３００は、ビットストリームからＬＦＮＳＴが実行されるとき、スケーリングリストの可用性を指示するフラグ情報、現在のブロックに対するＬＦＮＳＴインデクス及び残差情報を受信することができる（Ｓ１５１０）。

より具体的に、デコーディング装置３００はビットストリームから現在のブロックに対する量子化された変換係数に関する情報をデコーディングすることができ、現在のブロックに対する量子化された変換係数に関する情報に基づいて対象ブロックに対する量子化された変換係数を導出することができる。対象ブロックに対する量子化された変換係数に関する情報はＳＰＳ（ＳｅｑｕｅｎｃｅＰａｒａｍｅｔｅｒＳｅｔ）または、スライスヘッダ（ｓｌｉｃｅｈｅａｄｅｒ）に含むことができ、簡略化変換（ＲＳＴ）が適用されるか否かに対する情報、簡略化要因に関する情報、簡略化変換を適用する最小変換サイズに対する情報、簡略化変換を適用する最大変換サイズに対する情報、簡略化逆変換サイズ、変換セットに含まれた変換カーネル行列のうち、いずれか１つを指示する変換インデクスに対する情報のうち、少なくとも１つを含むことができる。

また、デコーディング装置は現在のブロックに対するイントラ予測モードに対する情報及び現在のブロックにＩＳＰが適用されるか否かに対する情報をさらに受信することができる。デコーディング装置はＩＳＰ符号化または、ＩＳＰモードを適用するか否かを指示するフラグ情報を受信及びパーシングすることで現在のブロックが所定の数のサブパーティション変換ブロックに分割されるか否かを導出することができる。ここで、現在のブロックは符号化ブロックである。また、デコーディング装置は現在のブロックがどの方向で分割されるかを指示するフラグ情報を介して分割されるサブパーティションブロックのサイズ及び数を導出することができる。

ＬＦＮＳＴインデクスは逆２次非分離にＬＦＮＳＴが適用されるとき、ＬＦＮＳＴ行列を指定するための値として０から２の値を持つ。例えば、ＬＦＮＳＴインデクス値０は現在のブロックにＬＦＮＳＴが適用されないことを示し、ＬＦＮＳＴインデクス値１は１番目のＬＦＮＳＴ行列を、ＬＦＮＳＴインデクス値２は２番目のＬＦＮＳＴ行列を指示することができる。

ＩＳＰに関連する情報及びＬＦＮＳＴインデクスは符号化装置レベルにおいて、受信される。

デコーディング装置が受信するＬＦＮＳＴが実行されるとき、スケーリングリストの可用性を指示するフラグ情報はｓｃａｌｉｎｇ＿ｍａｔｒｉｘ＿ｆｏｒ＿ｌｆｎｓｔ＿ｄｉｓａｂｌｅｄ＿ｆｌａｇまたは、ｓｐｓ＿ｓｃａｌｉｎｇ＿ｍａｔｒｉｘ＿ｆｏｒ＿ｌｆｎｓｔ＿ｄｉｓａｂｌｅｄ＿ｆｌａｇで示すことができ、シーケンスパラメータセットにおいてシグナリングされる。このフラグ値が１であれば、ＬＦＮＳＴが適用されるとき、スケーリングリストを適用せず、０であれば、ＬＦＮＳＴが適用されるとき、スケーリングリストを適用できることを示す。スケーリングリストは変換ブロックでの変換係数の位置ごとに特定加重値（ｗｅｉｇｈｔ値）を指定する行列として変換係数ごとに該当する加重値を乗算して、逆量子化、または、量子化を実行できるようにして、変換係数の重要度によって差分して逆量子化、または、量子化を適用できるようにする。

デコーディング装置３００は、現在のブロックに対する変換係数に対して逆量子化を実行するためにＬＦＮＳＴが適用されるか否か及び現在のブロックのツリータイプに基づいて現在のブロックにスケーリングリストが適用されるか否かを判断することができる（Ｓ１５２０）。

スケーリングリストが適用されるか否かは前記フラグ情報及びＬＦＮＳＴインデクス値に基づいて判断される。

現在のブロックのツリータイプがシングルツリーであれば、現在のブロックのカラー成分はルマ要素、クロマＣｂを指示する第１クロマ要素、クロマＣｒを指示する第２クロマ要素を含むことができ、現在のブロックのツリータイプがデュアルツリールマであれば、現在のブロックはルマ要素を含むことができる。現在のブロックのツリータイプがデュアルツリークロマであれば、現在のブロックのカラー成分は第１クロマ要素及び第２クロマ要素を含むことができる。

ここで、現在のブロックは変換単位である変換ブロックであり、現在のブロックのツリータイプがシングルツリーであれば、ルマ要素に対する変換ブロック、第１クロマ要素に対する変換ブロック、第２クロマ要素に対する変換ブロックを含むことができる。また、現在のブロックのツリータイプがデュアルツリールマであれば、ルマ要素に対する変換ブロック、現在のブロックのツリータイプがデュアルツリークロマであれば、第１クロマ要素及び第２クロマ要素に対する変換ブロックを含むことができる。

一例によって、現在のブロックがシングルツリーの場合、ルマ要素に対してのみＬＦＮＳＴが適用でき、シングルツリーに符号化されてｓｃａｌｉｎｇ＿ｍａｔｒｉｘ＿ｆｏｒ＿ｌｆｎｓｔ＿ｄｉｓａｂｌｅｄ＿ｆｌａｇ値が１であり、ＬＦＮＳＴが適用される場合、ルマ要素に対してはスケーリングリストを適用しない。しかし、ＬＦＮＳＴが適用されないクロマ要素に対しては、スケーリングリストを適用することができる。

まとめると、スケーリングリストに対するフラグ情報がスケーリングリストが可用ではないことを示し、ＬＦＮＳＴインデクスが０より大きい場合（すなわち、ＬＦＮＳＴが適用される場合）、現在のブロックのツリータイプがシングルツリーであり、ルマ要素であれば、スケーリングリストを適用せず、現在のブロックのツリータイプがシングルツリーであり、クロマ要素であれば、スケーリングリストを適用することができる。

一例によって、フラグ情報がスケーリングリストが可用ではないことを示し、ＬＦＮＳＴインデクスが０より大きい場合、現在のブロックのツリータイプがデュアルツリークロマであれば、現在のブロックにＬＦＮＳＴが適用できるためクロマ要素にスケーリングリストが適用されない。

一例によって、フラグ情報がスケーリングリストが可用ではないことを示し、ＬＦＮＳＴインデクスが０より大きい場合、現在のブロックのツリータイプがデュアルツリールマであれば、現在のブロックにＬＦＮＳＴが適用できるため、ルマ要素にスケーリングリストが適用されない。

以後、デコーディング装置は判断結果に基づいて残差情報から現在のブロックに対する変換係数を導出する（Ｓ１５３０）。

導出された変換係数は４ｘ４ブロック単位に逆方向対角スキャン順序によって配列でき、４ｘ４ブロック内の変換係数も逆方向対角スキャン順序によって配列される。すなわち、逆量子化が実行された変換係数はＶＶＣやＨＥＶＣでのようなビデオコーデックにおいて、適用される逆方向スキャン順序にしたがって配置される。

デコーディング装置はＬＦＮＳＴインデクス及びＬＦＮＳＴのためのＬＦＮＳＴ行列に基づいて、つまり、ＬＦＮＳＴを適用して変換係数から修正された変換係数を導出することができる（Ｓ１５４０）。

ＬＦＮＳＴは変換対象になる係数を垂直または、水平方向に分離して変換する１次変換と異なって係数を特定方向に分離せずに変換を適用する非分離変換である。このような非分離変換はブロック全体セクションではない低周波セクションにのみ順方向変換を適用する低周波非分離変換である。

デコーディング装置はＬＦＮＳＴを適用するために様々な変数を導出することができ、現在のブロックのツリータイプ及びサイズなどに基づいてＬＦＮＳＴ適用されるか否かを判断することができる。

デコーディング装置は現在のブロックのＤＣ要素以外の位置に有効係数が存在するか否かを示す第１変数（変数ＬｆｎｓｔＤｃＯｎｌｙ）及び現在のブロックの左上の第１セクションを除いた第２セクションに前記変換係数が存在するか否かを示す第２変数（変数ＬｆｎｓｔＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇ）を導出することができる。

このような第１変数及び第２変数は最初１に設定され、現在のブロックのＤＣ要素以外の位置に有効係数が存在すれば、第１変数は０に更新され、第２セクションに変換係数が存在すれば、第２変数は０に更新される。

第１変数は０に更新され、第２変数は１に維持する場合、現在のブロックにＬＦＮＳＴが適用される。

その一方で、イントラサブパーティション（ＩＳＰ）モードが適用できるルマブロックの場合、変数ＬｆｎｓｔＤｃＯｎｌｙの導出なしにＬＦＮＳＴインデクスをパーシングすることができる。

具体的に見ると、ＩＳＰモードが適用され、ルマ要素に対する変換スキップフラグ、つまり、ｔｒａｎｓｆｏｒｍ＿ｓｋｉｐ＿ｆｌａｇ［ｘ０］［ｙ０］［０］値が０である場合、現在のブロックのツリータイプがシングルツリーまたは、ルマに対するデュアルツリーであるときは変数ＬｆｎｓｔＤｃＯｎｌｙ値に関係なく、ＬＦＮＳＴインデクスがシグナリングされる。

その一方で、ＩＳＰモードが適用されないクロマ要素の場合、クロマＣｂ要素に対する変換スキップフラグであるｔｒａｎｓｆｏｒｍ＿ｓｋｉｐ＿ｆｌａｇ［ｘ０］［ｙ０］［１］とクロマＣｒ要素に対する変換スキップフラグであるｔｒａｎｓｆｏｒｍ＿ｓｋｉｐ＿ｆｌａｇ［ｘ０］［ｙ０］［２］値によって変数ＬｆｎｓｔＤｃＯｎｌｙ値を０で設定することができる。つまり、ｔｒａｎｓｆｏｒｍ＿ｓｋｉｐ＿ｆｌａｇ［ｘ０］［ｙ０］［ｃＩｄｘ］において、ｃＩｄｘ値が１であるときはｔｒａｎｓｆｏｒｍ＿ｓｋｉｐ＿ｆｌａｇ［ｘ０］［ｙ０］［１］値が０であるときのみ変数ＬｆｎｓｔＤｃＯｎｌｙ値を０で設定することができ、ｃＩｄｘ値が２であるときはｔｒａｎｓｆｏｒｍ＿ｓｋｉｐ＿ｆｌａｇ［ｘ０］［ｙ０］［２］値が０であるときのみ変数ＬｆｎｓｔＤｃＯｎｌｙ値を０で設定することができる。変数ＬｆｎｓｔＤｃＯｎｌｙ値が０であれば、デコーディング装置はＬＦＮＳＴインデクスをパーシングすることができ、それ以外のＬＦＮＳＴインデクスはシグナリングされず、０値と推測することができる。

第２変数はＬＦＮＳＴ適用時、ゼロアウトが実行されたことを示す変数ＬｆｎｓｔＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇである。第２変数は最初１に設定され、第２セクションに有効係数が存在すれば、０に変更される。

変数ＬｆｎｓｔＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇは最後の０ではない係数が存在するサブブロックのインデクスが０より大きくて変換ブロックの幅及び高さが全て４と同じかまたは大きいか、０ではない最後の係数が存在するサブブロック内部での０ではない係数の最後の位置が７より大きくて、変換ブロックのサイズが４ｘ４または、８ｘ８である場合、０に導出される。サブブロックというのは残差符号化において符号化単位に用いられる４ｘ４ブロックを意味するもので、ＣＧ（ＣｏｅｆｆｉｃｉｅｎｔＧｒｏｕｐ）とも呼べる。サブブロックのインデクスが０だというのは左上４ｘ４サブブロックを指す。

すなわち、変換ブロックにおいて、ＬＦＮＳＴ変換係数が存在できる左上セクション以外のセクションにおいて、０ではない係数が導出されるか、４ｘ４ブロック及び８ｘ８ブロックに対してスキャン順序上８番目の位置から離れて０ではない係数が存在すれば、変数ＬｆｎｓｔＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇは０で設定される。

デコーディング装置はイントラ予測モード情報から導出されたイントラ予測モードに基づいてＬＦＮＳＴ行列を含むＬＦＮＳＴセットを決定し、ＬＦＮＳＴセット及びＬＦＮＳＴインデクスに基づいて複数のＬＦＮＳＴ行列のうち、いずれか１つを選択することができる。

このとき、現在のブロックにおいて分割されたサブパーティション変換ブロックには同じＬＦＮＳＴセット及び同じＬＦＮＳＴインデクスが適用される。すなわち、サブパーティション変換ブロックには同じイントラ予測モードが適用されるため、イントラ予測モードに基づいて決定されるＬＦＮＳＴセットも全てのサブパーティション変換ブロックと同様に適用される。また、ＬＦＮＳＴインデクスは符号化装置レベルにおいて、シグナリングされるため、現在のブロックにおいて分割されたサブパーティション変換ブロックには同じＬＦＮＳＴ行列が適用される。

その一方で、上述した通り、変換の対象になる変換ブロックのイントラ予測モードによって変換セットが決定され、逆ＬＦＮＳＴはＬＦＮＳＴインデクスによって指示される変換セットに含まれている変換カーネル行列、つまり、ＬＦＮＳＴ行列のうち、いずれか１つに基づいて実行される。逆ＬＦＮＳＴに適用される行列は逆ＬＦＮＳＴ行列または、ＬＦＮＳＴ行列に称し、このような行列は順方向ＬＦＮＳＴに用いられる行列とトランスフォース関係にあれば、名称はどの名称でも関係ない。

一例示において、逆ＬＦＮＳＴ行列は列の数が行の数より少ない非正方行列である。

デコーディング装置は修正された変換係数に対する１次逆変換に基づいて現在のブロックに対する残差サンプルを導出することができる（Ｓ１５５０）。

このとき、逆１次変換は通常の分離変換が使用され、上述したＭＴＳが使用される場合もある。

その後、デコーディング装置３００は、現在のブロックに対する残差サンプル及び現在のブロックに対する予測サンプルに基づいて復元サンプルを生成することができる。

以下の図面は本明細書の具体的な一例を説明するために作成された。図面に記載された具体的な装置の名称や具体的な信号／メッセージ／フィールドの名称は例として提示されたことであるため、本明細書の技術的な特徴が以下の図面に用いられた具体的な名称に限られない。

図１６は本文書の一実施例に係るビデオエンコーディング装置の動作を示すフロー図である。

図１６に開示された各ステップは図４から図１４において、前述の内容のうち、一部に基づいたものである。したがって、図２及び図４から図１４において、前述の内容と重複する具体的な内容は説明を省略したり簡単にすることにする。

一実施例に係るエンコーディング装置２００は、現在のブロックに適用されるイントラ予測モードに基づいて現在のブロックに対する予測サンプルを導出することができる。

エンコーディング装置は現在のブロックにＩＳＰが適用される場合、サブパーティション変換ブロック別に予測を実行することができる。

エンコーディング装置は現在のブロック、つまり、符号化ブロックにＩＳＰ符号化または、ＩＳＰモードを適用するか否かを判断することができ、判断結果によって現在のブロックがどの方向で分割されるかを決定し、分割されるサブブロックのサイズ及び数を導出することができる。

現在のブロックにおいて分割されたサブパーティション変換ブロックには同じイントラ予測モードが適用され、エンコーディング装置はサブパーティション変換ブロック別に予測サンプルを導出することができる。すなわち、エンコーディング装置はサブパーティション変換ブロックの分割形態によって、例えば、水平（Ｈｏｒｉｚｏｎｔａｌ）または、垂直（Ｖｅｒｔｉｃｉａｌ）、左から右へ、または、上から下へ順次イントラ予測を実行する。一番左または、一番上のサブブロックに対しては通常のイントラ予測方法のように既に符号化された符号化ブロックの復元ピクセルを参照するようになる。また、後続の内部のサブパーティション変換ブロックの各辺に対して以前サブパーティション変換ブロックと隣接しない場合は、該当する辺に隣接した参照ピクセルを導出するために、通常のイントラ予測方法のように既に符号化された隣接した符号化ブロックの復元ピクセルを参照する。

エンコーディング装置２００は、予測サンプルに基づいて現在のブロックに対する残差サンプルを導出することができる（Ｓ１６１０）。

エンコーディング装置２００は、残差サンプルにＬＦＮＳＴまたは、ＭＴＳのうち、少なくとも１つを適用して現在のブロックに対する変換係数を導出し、変換係数を所定のスキャン順序によって配列することができる。

エンコーディング装置は残差サンプルに対する１次変換及び／または、２次変換のような変換過程に基づいて現在のブロックに対する変換係数を導出することができ、現在のブロックのツリータイプがシングルツリーであり、ルマ要素であれば、ＬＦＮＳＴが適用可能で、現在のブロックのツリータイプがシングルツリーでありクロマ要素であれば、ＬＦＮＳＴを適用しない場合がある（Ｓ１６２０）。

１次変換はＭＴＳの通り、複数の変換カーネルを介して実行でき、この場合、イントラ予測モードに基づいて変換カーネルが選択される。

エンコーディング装置２００は現在のブロックに対する変換係数に対して２次変換、または、非分離変換、具体的にＬＦＮＳＴを実行するか否かを決定し、変換係数にＬＦＮＳＴを適用して修正された変換係数を導出することができる。

ＬＦＮＳＴは変換対象になる係数を垂直、または、水平方向に分離して変換する１次変換と異なって係数を特定方向に分離せずに変換を適用する非分離変換である。このような非分離変換は変換対象になる対象ブロック全体ではない低周波セクションにのみ変換を適用する低周波非分離変換である。

エンコーディング装置はＬＦＮＳＴを適用するために様々な変数を導出することができ、現在のブロックのツリータイプ及びサイズなどに基づいてＬＦＮＳＴ適用されるか否かを判断することができる。

エンコーディング装置は現在のブロックのＤＣ要素以外の位置に有効係数が存在するか否かを示す第１変数（変数ＬｆｎｓｔＤｃＯｎｌｙ）及び現在のブロックの左上の第１セクションを除いた第２セクションに前記変換係数が存在するか否かを示す第２変数（変数ＬｆｎｓｔＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇ）を導出することができる。

第１変数は０に更新され、第２変数は１に維持される場合現在のブロックにＬＦＮＳＴが適用される。

その一方で、イントラサブパーティション（ＩＳＰ）モードが適用できるルマブロックの場合、変数ＬｆｎｓｔＤｃＯｎｌｙの導出なしにＬＦＮＳＴを適用することができる。

具体的に見ると、ＩＳＰモードが適用され、ルマ要素に対する変換スキップフラグ、つまり、ｔｒａｎｓｆｏｒｍ＿ｓｋｉｐ＿ｆｌａｇ［ｘ０］［ｙ０］［０］値が０である場合、現在のブロックのツリータイプがシングルツリー、または、ルマに対するデュアルツリーであるときは変数ＬｆｎｓｔＤｃＯｎｌｙ値に関係なくＬＦＮＳＴが適用される。

その一方で、ＩＳＰモードが適用されないクロマ要素の場合、クロマＣｂ要素に対する変換スキップフラグであるｔｒａｎｓｆｏｒｍ＿ｓｋｉｐ＿ｆｌａｇ［ｘ０］［ｙ０］［１］とクロマＣｒ要素に対する変換スキップフラグであるｔｒａｎｓｆｏｒｍ＿ｓｋｉｐ＿ｆｌａｇ［ｘ０］［ｙ０］［２］値によって変数ＬｆｎｓｔＤｃＯｎｌｙ値を０で設定することができる。つまり、ｔｒａｎｓｆｏｒｍ＿ｓｋｉｐ＿ｆｌａｇ［ｘ０］［ｙ０］［ｃＩｄｘ］において、ｃＩｄｘ値が１であるときはｔｒａｎｓｆｏｒｍ＿ｓｋｉｐ＿ｆｌａｇ［ｘ０］［ｙ０］［１］値が０であるときのみ変数ＬｆｎｓｔＤｃＯｎｌｙ値を０で設定することができ、ｃＩｄｘ値が２であるときはｔｒａｎｓｆｏｒｍ＿ｓｋｉｐ＿ｆｌａｇ［ｘ０］［ｙ０］［２］値が０であるときのみ変数ＬｆｎｓｔＤｃＯｎｌｙ値を０で設定することができる。変数ＬｆｎｓｔＤｃＯｎｌｙ値が０であれば、エンコーディング装置はＬＦＮＳＴを適用することができ、それ以外のＬＦＮＳＴを適用しない場合がある。

変数ＬｆｎｓｔＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇは最後の０ではない係数が存在するサブブロックのインデクスが０より大きくて変換ブロックの幅及び高さが全て４と同じかまたは大きいか、０ではない最後の係数が存在するサブブロック内部での０ではない係数の最後の位置が７より大きくて、変換ブロックの位置が４ｘ４、または、８ｘ８である場合、０に導出される。サブブロックというのは残差符号化において符号化単位に用いられる４ｘ４ブロックを意味するもので、ＣＧ（ＣｏｅｆｆｉｃｉｅｎｔＧｒｏｕｐ）とも呼べる。サブブロックのインデクスが０だというのは左上４ｘ４サブブロックを指す。

すなわち、変換ブロックにおいて、ＬＦＮＳＴ変換係数が存在できる左上セクション以外のセクションにおいて、０ではない係数が導出されるか、４ｘ４ブロック及び８ｘ８ブロックに対してスキャン順序上８番目の位置から離れて０ではない係数が存在すれば、変数ＬｆｎｓｔＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇは０で設定される

エンコーディング装置はイントラ予測モード情報から導出されたイントラ予測モードに基づいてＬＦＮＳＴ行列を含むＬＦＮＳＴセットを決定し、複数のＬＦＮＳＴ行列のうち、いずれか１つを選択することができる。

その一方で、上述した通り、変換の対象になる変換ブロックのイントラ予測モードによって変換セットが決定され、ＬＦＮＳＴはＬＦＮＳＴ変換セットに含まれている変換カーネル行列、つまり、ＬＦＮＳＴ行列のうち、いずれか１つに基づいて実行される。ＬＦＮＳＴに適用される行列はＬＦＮＳＴ行列と称し、このような行列は逆方向ＬＦＮＳＴに用いられる行列とトランスフォース関係にあれば、名称はどの名称でも関係ない。

一例示において、ＬＦＮＳＴ行列は行の数が列の数より少ない非正方行列である。

エンコーディング装置は変換過程にＬＦＮＳＴが実行されるか否か及び現在のブロックのツリータイプに基づいて現在のブロックにスケーリングリストが適用されるか否かを決定することができる（Ｓ１６３０）。

スケーリングリストは変換ブロックでの変換係数の位置ごとに特定加重値（ｗｅｉｇｈｔ値）を指定する行列として変換係数ごとに該当する加重値を乗算して、逆量子化、または、量子化を実行できるようにして、変換係数の重要度によって差分して逆量子化、または、量子化を適用できるようにする。

一例によって、エンコーディング装置は現在のブロックのツリータイプがシングルツリーでありルマ要素であれば、スケーリングリスト適用せず、現在のブロックのツリータイプがシングルツリーであり、クロマ要素であれば、スケーリングリストを適用することができる。

一例によって、エンコーディング装置は現在のブロックがシングルツリーの場合、ルマ要素に対してのみＬＦＮＳＴを適用することができ、ＬＦＮＳＴが適用される場合、ルマ要素に対してはスケーリングリストを適用しない。しかし、ＬＦＮＳＴが適用されないクロマ要素に対してはスケーリングリストを適用することができる。

まとめると、エンコーディング装置はＬＦＮＳＴインデクスが０より大きい場合（すなわち、ＬＦＮＳＴが適用される場合）、現在のブロックのツリータイプがシングルツリーであり、ルマ要素であれば、スケーリングリストを適用せず、現在のブロックのツリータイプがシングルツリーであり、クロマ要素であれば、スケーリングリストを適用することができる。

一例によって、エンコーディング装置はＬＦＮＳＴインデクスが０より大きい場合、現在のブロックのツリータイプがデュアルツリークロマであれば、現在のブロックにＬＦＮＳＴが適用できるためクロマ要素にスケーリングリストを適用しない。

一例によって、エンコーディング装置はＬＦＮＳＴインデクスが０より大きい場合、現在のブロックのツリータイプがデュアルツリールマであれば、現在のブロックにＬＦＮＳＴが適用できるため、ルマ要素にスケーリングリストを適用しない。

エンコーディング装置は前記決定、つまり、現在のブロックにスケーリングリストが適用されるか否かに基づいて変換係数を量子化することができる（Ｓ１６４０）。

すなわち、エンコーディング装置はＬＦＮＳＴが適用されない変換ブロックに対してはスケーリングリストを用いて変換係数を量子化し、ＬＦＮＳＴが適用される変換ブロックに対してはスケーリングリストの使わず、変換係数を量子化することができる。

エンコーディング装置は残差情報及びＬＦＮＳＴが実行されるとき、スケーリングリストの可用性を指示するフラグ情報をエンコーディングして出力することができる（Ｓ１６５０）。

ＬＦＮＳＴが実行されるとき、スケーリングリストの可用性を指示する前記フラグ情報はｓｃａｌｉｎｇ＿ｍａｔｒｉｘ＿ｆｏｒ＿ｌｆｎｓｔ＿ｄｉｓａｂｌｅｄ＿ｆｌａｇまたは、ｓｐｓ＿ｓｃａｌｉｎｇ＿ｍａｔｒｉｘ＿ｆｏｒ＿ｌｆｎｓｔ＿ｄｉｓａｂｌｅｄ＿ｆｌａｇに示すことができ、シーケンスパラメータセットにおいてシグナリングされる。このフラグ値が１であれば、ＬＦＮＳＴが適用されるとき、スケーリングリストを適用せず、０であれば、ＬＦＮＳＴが適用されるとき、スケーリングリストを適用できることを示す。

エンコーディング装置はＬＦＮＳＴインデクスが０より大きくて、現在のブロックがシングルツリーであれば、ルマ要素に対してＬＦＮＳＴが適用されるため、フラグ値を１にエンコーディングすることができる。

ただし、エンコーディング装置はＬＦＮＳＴインデクスが０より大きくて、現在のブロックがシングルツリーであるとき、クロマ要素に対してはＬＦＮＳＴが適用されないため、スケーリングリストが適用されるように画像情報を構成することができる。

エンコーディング装置はＬＦＮＳＴインデクスが０より大きくて、現在のブロックのツリータイプがデュアルツリークロマであれば、現在のブロックにＬＦＮＳＴが適用できるためクロマ要素にスケーリングリストが適用されないようにフラグ値を１にエンコーディングすることができる。

一例によって、エンコーディング装置はＬＦＮＳＴインデクスが０より大きくて、現在のブロックのツリータイプがデュアルツリールマであれば、現在のブロックにＬＦＮＳＴが適用できるため、ルマ要素にスケーリングリストが適用されないようにフラグ値を１にエンコーディングすることができる。

エンコーディング装置は現在のブロックに対する修正された変換係数に基づいて量子化を実行して量子化された変換係数を導出し、ＬＦＮＳＴインデクスをエンコーディングすることができる。

エンコーディング装置は、量子化された変換係数に対する情報を含むレジデュアル情報を生成することができる。レジデュアル情報は、前述した変換関連情報／シンタックス要素を含むことができる。エンコーディング装置は、レジデュアル情報を含む画像／ビデオ情報をエンコーディングしてビットストリームの形態で出力することができる。

より具体的に、エンコーディング装置１００は、量子化された変換係数に関する情報を生成し、生成された量子化された変換係数に関する情報をエンコーディングすることができる。

本実施形態に係るＬＦＮＳＴインデックスのシンタックス要素は、（逆）ＬＦＮＳＴが適用されるかどうか、及びＬＦＮＳＴセットに含まれたＬＦＮＳＴマトリックスのいずれかを指示し得、ＬＦＮＳＴセットが２つの変換カーネルマトリックスを含む場合、ＬＦＮＳＴインデックスのシンタックス要素の値は３つであり得る。

一例によって、現在ブロックに対する分割ツリー構造がデュアルツリータイプであると、ルマブロック及びクロマブロックの各々に対してＬＦＮＳＴインデックスがエンコーディングできる。

一実施形態によって、変換インデックスに対するシンタックス要素値は、現在ブロックに（逆）ＬＦＮＳＴが適用されない場合を指示する０、ＬＦＮＳＴマトリックスのうち１番目のＬＦＮＳＴマトリックスを指示する１、ＬＦＮＳＴマトリックスのうち２番目のＬＦＮＳＴマトリックスを指示する２として導出されることができる。

本文書において、量子化／逆量子化及び／又は変換／逆変換の少なくとも１つは省略され得る。前記量子化／逆量子化が省略される場合、前記量子化された変換係数は、変換係数と呼ばれ得る。前記変換／逆変換が省略される場合、前記変換係数は、係数又はレジデュアル係数と呼ばれることもあり、又は表現の統一性のために変換係数と依然として呼ばれることもある。

また、本文書において、量子化された変換係数及び変換係数は、それぞれ変換係数及びスケーリングされた（ｓｃａｌｅｄ）変換係数と指称され得る。この場合、レジデュアル情報は、変換係数に関する情報を含むことができ、前記変換係数に関する情報は、レジデュアルコーディングシンタックスを介してシグナリングされることができる。前記レジデュアル情報（又は前記変換係数に関する情報）に基づいて変換係数が導出でき、前記変換係数に対する逆変換（スケーリング）を介してスケーリングされた変換係数が導出できる。前記スケーリングされた変換係数に対する逆変換（変換）に基づいて、レジデュアルサンプルが導出できる。これは、本文書の別の部分でも同様に適用／表現できる。

前述した実施例において、方法は、一連のステップ又はブロックとしてフローチャートに基づいて説明されているが、本文書は、ステップの順序に限定されるわけではなく、あるステップは、前述したところと異なるステップと異なる順序で、又は同時に発生し得る。また、当業者であれば、フローチャートに示されているステップが排他的ではなく、別のステップが含まれるか、フローチャートの一つ又はそれ以上のステップが本文書の範囲に影響を与えずに削除され得ることを理解することができる。

前述した本文書に係る方法は、ソフトウェアの形態で具現されることができ、本文書に係るエンコード装置及び／又はデコード装置は、例えば、ＴＶ、コンピュータ、スマートフォン、セットトップボックス、ディスプレイ装置等の画像処理を行う装置に含まれ得る。

本文書において、実施例がソフトウェアで具現されるとき、前述した方法は、前述した機能を行うモジュール（過程、機能等）で具現されることができる。モジュールはメモリに格納され、プロセッサにより実行されることができる。メモリは、プロセッサの内部又は外部にあってもよく、よく知られている様々な手段でプロセッサと連結されてもよい。プロセッサは、ＡＳＩＣ（ａｐｐｌｉｃａｔｉｏｎ－ｓｐｅｃｉｆｉｃｉｎｔｅｇｒａｔｅｄｃｉｒｃｕｉｔ）、他のチップセット、論理回路及び／又はデータ処理装置を含むことができる。メモリは、ＲＯＭ（ｒｅａｄ－ｏｎｌｙｍｅｍｏｒｙ）、ＲＡＭ（ｒａｎｄｏｍａｃｃｅｓｓｍｅｍｏｒｙ）、フラッシュメモリ、メモリカード、格納媒体及び／又は他の格納装置を含むことができる。即ち、本文書で説明した実施例は、プロセッサ、マイクロプロセッサ、コントローラ又はチップ上で具現されて実行されることができる。例えば、各図面で示している機能ユニットは、コンピュータ、プロセッサ、マイクロプロセッサ、コントローラ又はチップ上で具現されて実行されることができる。

また、本文書が適用されるデコード装置及びエンコード装置は、マルチメディア放送送受信装置、モバイル通信端末、ホームシネマビデオ装置、デジタルシネマビデオ装置、監視用カメラ、ビデオ対話装置、ビデオ通信のようなリアルタイム通信装置、モバイルストリーミング装置、格納媒体、カムコーダ、オーダーメイド型ビデオ（ＶｏＤ）サービス提供装置、ＯＴＴビデオ（Ｏｖｅｒｔｈｅｔｏｐｖｉｄｅｏ）装置、インターネットストリーミングサービス提供装置、３次元（３Ｄ）ビデオ装置、画像電話ビデオ装置、及び医療用ビデオ装置等に含まれ得、ビデオ信号又はデータ信号を処理するために使用され得る。例えば、ＯＴＴビデオ（Ｏｖｅｒｔｈｅｔｏｐｖｉｄｅｏ）装置としては、ゲームコンソール、ブルーレイプレーヤー、インターネットアクセスＴＶ、ホームシアターシステム、スマートフォン、タブレットＰＣ、ＤＶＲ（ＤｉｇｉｔａｌＶｉｄｅｏＲｅｃｏｄｅｒ）等を含み得る。

また、本文書が適用される処理方法は、コンピュータで実行されるプログラムの形態で生産されることができ、コンピュータが読み取ることができる記録媒体に格納されることができる。本文書に係るデータ構造を有するマルチメディアデータもまた、コンピュータが読み取ることができる記録媒体に格納されることができる。前記コンピュータが読み取ることができる記録媒体は、コンピュータで読み取ることができるデータが格納される全ての種類の格納装置及び分散格納装置を含む。前記コンピュータが読み取ることができる記録媒体は、例えば、ブルーレイディスク（ＢＤ）、汎用直列バス（ＵＳＢ）、ＲＯＭ、ＰＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭ、ＲＡＭ、ＣＤ－ＲＯＭ、磁気テープ、フロッピディスク、及び光学的データ格納装置を含み得る。また、前記コンピュータが読み取ることができる記録媒体は、搬送波（例えば、インターネットを介した送信）の形態で具現されたメディアを含む。また、エンコード方法で生成されたビットストリームが、コンピュータが読み取ることができる記録媒体に格納されるか、有無線通信ネットワークを介して送信されることができる。また、本文書の実施形態は、プログラムコードによるコンピュータプログラム製品で具現されることができ、前記プログラムコードは、本文書の実施形態によってコンピュータで実行されることができる。前記プログラムコードは、コンピュータによって読み取り可能なキャリア上に格納されることができる。

図１７は、本文書が適用されるコンテンツストリーミングシステムの構造図を例示的に示す。

また、本文書が適用されるコンテンツストリーミングシステムは、大きくエンコーディングサーバ、ストリーミングサーバ、ウェブサーバ、メディアストレージ、ユーザ装置、及びマルチメディア入力装置を含むことができる。

前記エンコーディングサーバは、スマートフォン、カメラ、カムコーダ等のようなマルチメディア入力装置から入力されたコンテンツをデジタルデータに圧縮してビットストリームを生成し、これを前記ストリーミングサーバに送信する役割をする。別の例として、スマートフォン、カメラ、カムコーダなどのようなマルチメディア入力装置がビットストリームを直接生成する場合、前記エンコーディングサーバは省略され得る。前記ビットストリームは、本文書が適用されるエンコーディング方法又はビットストリームの生成方法により生成されることができ、前記ストリーミングサーバは、前記ビットストリームを送信又は受信する過程で、一時的に前記ビットストリームを格納することができる。

前記ストリーミングサーバは、ウェブサーバを介したユーザの要請に基づいてマルチメディアデータをユーザ装置に送信し、前記ウェブサーバは、ユーザにどのようなサービスがあるかを知らせる媒介体の役割をする。ユーザが前記ウェブサーバに所望のサービスを要請すると、前記ウェブサーバは、これをストリーミングサーバに伝達し、前記ストリーミングサーバは、ユーザにマルチメディアデータを送信する。そのとき、前記コンテンツストリーミングシステムは、別の制御サーバを含むことができ、この場合、前記制御サーバは、前記コンテンツストリーミングシステム内の各装置間の命令／応答を制御する役割をする。

前記ストリーミングサーバは、メディアストレージ及び／又はエンコーディングサーバからコンテンツを受信することができる。例えば、前記エンコーディングサーバからコンテンツを受信することになる場合、前記コンテンツをリアルタイムで受信することができる。この場合、円滑なストリーミングサービスを提供するために、前記ストリーミングサーバは、前記ビットストリームを一定時間格納することができる。

前記ユーザ装置の例としては、携帯電話、スマートフォン（ｓｍａｒｔｐｈｏｎｅ）、ラップトップコンピュータ（ｌａｐｔｏｐｃｏｍｐｕｔｅｒ）、デジタル放送用端末機、ＰＤＡ（ｐｅｒｓｏｎａｌｄｉｇｉｔａｌａｓｓｉｓｔａｎｔｓ）、ＰＭＰ（ｐｏｒｔａｂｌｅｍｕｌｔｉｍｅｄｉａｐｌａｙｅｒ）、ナビゲーション、スレートＰＣ（ｓｌａｔｅＰＣ）、タブレットＰＣ（ｔａｂｌｅｔＰＣ）、ウルトラブック（ｕｌｔｒａｂｏｏｋ）、ウェアラブルデバイス（ｗｅａｒａｂｌｅｄｅｖｉｃｅ、例えば、ウォッチ型端末機（ｓｍａｒｔｗａｔｃｈ）、グラス型端末機（ｓｍａｒｔｇｌａｓｓ）、ＨＭＤ（ｈｅａｄｍｏｕｎｔｅｄｄｉｓｐｌａｙ））、デジタルＴＶ、デスクトップコンピュータ、デジタルサイニジなどがあり得る。前記コンテンツストリーミングシステム内の各サーバは、分散サーバとして運営されることができ、この場合、各サーバで受信するデータは、分散処理されることができる。

本明細書に記載された請求項は、多様な方式で組み合わせることができる。例えば、本明細書の方法請求項の技術的特徴が組み合わせられて装置として具現されることができ、本明細書の装置請求項の技術的特徴が組み合わせられて方法として具現されることができる。また、本明細書の方法請求項の技術的特徴と装置請求項の技術的特徴とが組み合わせられて装置として具現されることができ、本明細書の方法請求項の技術的特徴と装置請求項の技術的特徴とが組み合わせられて方法として具現されることができる。

Claims

デコーディング装置によって実行される画像デコーディング方法において、
ビットストリームから受信された残差情報に基づいて現在のブロックに対する変換係数を導出するステップと、
前記変換係数に対する逆変換に基づいて前記現在のブロックに対する残差サンプルを導出するステップと、を含み、
前記変換係数を導出するステップは、
低周波非分離変換（ＬＦＮＳＴ）が適用されるか否か及び前記現在のブロックのツリータイプに基づいて、前記現在のブロックにスケーリングリストが適用されるか否かを判断するステップと、
前記判断するステップに基づいて、前記残差情報から前記現在のブロックに対する前記変換係数を導出するステップと、を含み、
前記現在のブロックのツリータイプがシングルツリーであり、前記現在のブロックのカラー成分がクロマ要素であることに基づいて、前記現在のブロックの前記クロマ要素に前記スケーリングリストが適用され、
前記現在のブロックのツリータイプがデュアルツリークロマであり、前記現在のブロックの前記クロマ要素に前記ＬＦＮＳＴが適用されることに基づいて、前記現在のブロックの前記クロマ要素には前記スケーリングリストが適用されない、画像デコーディング方法。
前記現在のブロックのツリータイプが前記シングルツリーであり、前記現在のブロックのカラー成分が前記クロマ要素であることに基づいて、前記現在のブロックの前記クロマ要素には前記ＬＦＮＳＴが適用されない、請求項１に記載の画像デコーディング方法。
前記現在のブロックのツリータイプが前記シングルツリーであり、前記現在のブロックに前記ＬＦＮＳＴが適用されることに基づいて、前記現在のブロックのルマ要素には前記スケーリングリストが適用されない、請求項１に記載の画像デコーディング方法。
前記ＬＦＮＳＴが適用されるブロックに対して前記スケーリングリストが利用可能であるか否かを指示するフラグ情報を受信するステップを更に含む、請求項１に記載の画像デコーディング方法。
前記スケーリングリストが利用可能でないことを前記フラグ情報が示し、ＬＦＮＳＴインデクスが０より大きく、前記現在のブロックのツリータイプが前記シングルツリーであることに基づいて、前記現在のブロックのルマ要素には前記スケーリングリストが適用されない、請求項４に記載の画像デコーディング方法。
前記スケーリングリストが利用可能でないことを前記フラグ情報が示し、ＬＦＮＳＴインデクスが０より大きく、前記現在のブロックのツリータイプがデュアルツリークロマであることに基づいて、前記現在のブロックの前記クロマ要素には前記スケーリングリストが適用されない、請求項４に記載の画像デコーディング方法。
前記スケーリングリストが利用可能でないことを前記フラグ情報が示し、ＬＦＮＳＴインデクスが０より大きく、前記現在のブロックのツリータイプがデュアルツリールマであることに基づいて、前記現在のブロックのルマ要素には前記スケーリングリストが適用されない、請求項４に記載の画像デコーディング方法。
画像エンコーディング装置によって実行される画像エンコーディング方法において、
変換過程に基づいて現在のブロックに対する残差サンプルから前記現在のブロックに対する変換係数を導出するステップと、
前記変換過程に低周波非分離変換（ＬＦＮＳＴ）が実行されるか否か及び前記現在のブロックのツリータイプに基づいて、前記現在のブロックにスケーリングリストが適用されるか否かを決定するステップと、
前記決定するステップに基づいて前記変換係数を量子化するステップと、を含み、
前記現在のブロックのツリータイプがシングルツリーであり、前記現在のブロックのカラー成分がクロマ要素であることに基づいて、前記現在のブロックの前記クロマ要素に前記スケーリングリストが適用され、
前記現在のブロックのツリータイプがデュアルツリークロマであり、前記現在のブロックに前記ＬＦＮＳＴが実行されることに基づいて、前記現在のブロックの前記クロマ要素には前記スケーリングリストが適用されない、画像エンコーディング方法。
前記現在のブロックのツリータイプが前記シングルツリーであり、前記現在のブロックのカラー成分が前記クロマ要素であることに基づいて、前記現在のブロックの前記クロマ要素には前記ＬＦＮＳＴが実行されない、請求項８に記載の画像エンコーディング方法。
前記現在のブロックのツリータイプが前記シングルツリーであり、前記現在のブロックに前記ＬＦＮＳＴが実行されることに基づいて、前記現在のブロックのルマ要素には前記スケーリングリストが適用されない、請求項８に記載の画像エンコーディング方法。
前記現在のブロックのツリータイプがデュアルツリールマであり、前記現在のブロックに前記ＬＦＮＳＴが実行されることに基づいて、前記現在のブロックのルマ要素には前記スケーリングリストが適用されない、請求項８に記載の画像エンコーディング方法。
前記ＬＦＮＳＴが適用されるブロックに対して前記スケーリングリストが利用可能であるか否かを指示するフラグ情報をエンコーディングして出力するステップをさらに含む、請求項８に記載の画像エンコーディング方法。
前記現在のブロックは変換ブロックを含む、請求項８に記載の画像エンコーディング方法。
画像情報に対するデータを送信する方法において、
前記画像情報に対するビットストリームを生成するステップであって、前記ビットストリームは、変換過程に基づいて現在のブロックに対する残差サンプルから前記現在のブロックに対する変換係数を導出し、前記変換過程に低周波非分離変換（ＬＦＮＳＴ）が実行されるか否か及び前記現在のブロックのツリータイプに基づいて、前記現在のブロックにスケーリングリストが適用されるか否かを決定し、前記決定することに基づいて前記変換係数を量子化し、前記量子化された変換係数に関連する残差情報をエンコーディングすることに基づいて生成される、ステップと、
前記ビットストリームを含む前記データを送信するステップと、を含み、
前記現在のブロックのツリータイプがシングルツリーであり、前記現在のブロックのカラー成分がクロマ要素であることに基づいて、前記現在のブロックの前記クロマ要素に前記スケーリングリストが適用され、
前記現在のブロックのツリータイプがデュアルツリークロマであり、前記現在のブロックに前記ＬＦＮＳＴが実行されることに基づいて、前記現在のブロックの前記クロマ要素には前記スケーリングリストが適用されない、データ送信方法。