WO2021246284A1

WO2021246284A1 - 動画像復号装置及び動画像符号化装置

Info

Publication number: WO2021246284A1
Application number: PCT/JP2021/020218
Authority: WO
Inventors: 天洋周; 知宏猪飼; 瑛一佐々木; 知典橋本; 健中條; 友子青野
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 2020-06-02
Filing date: 2021-05-27
Publication date: 2021-12-09
Anticipated expiration: 2022-12-02
Also published as: US12160613B2; US20230239504A1; JPWO2021246284A1; JP7684960B2

Abstract

より好適に逆非分離変換を適用することができる画像復号装置及びその関連技術を提供する。動画像復号装置は、シーケンスパラメータセットSPSにて、高精度符号化モードを示すフラグを復号するヘッダ復号部と、変換ブロック毎に変換係数に対して逆量子化を行うスケーリング処理部と、逆変換を行う逆変換部とを備え、上記スケーリング処理部は、上記フラグと上記変換ブロックのサイズに基づいて、変換係数のレンジを示す変数をビットデプスに依存するか、ビットデプスに依存しないかを切り替えることを特徴とする。

Description

動画像復号装置及び動画像符号化装置

　本開示は、動画像復号装置及び動画像符号化装置に関する。本願は、２０２０年６月２日に日本で出願された特願２０２０－０９５９７４号、２０２０年６月１２日に日本で出願された特願２０２０－１０２３３３号、２０２０年８月６日に日本で出願された特願２０２０－１３３６９１号、及び、２０２０年１０月７日に日本で出願された特願２０２０－１６９５２２号に基づき優先権を主張し、その内容をここに援用する。

　画像を効率的に伝送又は記録するために、画像を符号化することによって符号化データを生成する画像符号化装置、及び、当該符号化データを復号することによって復号画像を生成する画像復号装置が用いられている。

　具体的な画像符号化方式としては、例えば、H.264/AVCやHEVC（High-Efficiency Video Coding）方式等が挙げられる。

　このような画像符号化方式においては、画像を構成する画像（ピクチャ）は、画像を分割することにより得られるスライス、スライスを分割することにより得られる符号化ツリーユニット（CTU：Coding Tree Unit）、符号化ツリーユニットを分割することで得られる符号化単位（符号化ユニット（Coding Unit：CU）と呼ばれることもある）、及び、符号化単位を分割することより得られる変換ユニット（TU：Transform Unit）からなる階層構造により管理され、CU毎に符号化／復号される。

　また、このような画像符号化方式においては、通常、入力画像を符号化／復号することによって得られる局所復号画像に基づいて予測画像が生成され、当該予測画像を入力画像（原画像）から減算して得られる予測誤差（「差分画像」又は「残差画像」と呼ぶこともある）が符号化される。予測画像の生成方法としては、画面間予測（インター予測）、及び、画面内予測（イントラ予測）が挙げられる。

　また、近年の画像符号化及び復号技術として非特許文献１（VVC）、非特許文献２(HEVC)が挙げられる。非特許文献１には、水平方向と垂直方向の変換を別々に行う分離変換（DCT変換）において、１回目と２回目の変換後のシフトの値と、１回目の変換後のクリッピングにより値域と演算結果の精度（accuracy）のバランスをとる技術が開示されている。非特許文献２には、さらに、extended_precision_processing_flagフラグに応じて、上記２つのシフト値とクリッピングのレンジを調整し、精度を向上させる技術が開示されている。

"Versatile Video Coding (Draft 10)", JVET-S2001-v17, Joint Video Exploration Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11, 2020-09-04 07:47:46 H.265 : High efficiency video coding, 2019-11-29

　非特許文献１では、変換係数のレンジが不十分であり、ハイビットデプス時に変換係数の精度が低下するという課題がある。非特許文献２では、非特許文献１に比べ高精度な計算が可能であるが、ビットデプスやシフト値が固定的ではなく、処理が複雑である。また、変換後の右シフト量が大きく精度が低下する場合がある。

　また、extended_precision_processing_flagフラグに応じて動作を変更する構成は、同じビットデプスであっても動作の異なる符号化データを復号、符号化する必要があり、動作が複雑になる、という課題がある。

　本発明の一態様は、ハイビットデプス時に変換係数の演算精度を向上させつつ、処理が容易な動画像復号装置および動画像符号化装置を提供することを目的とする。

　本発明の一態様に係る動画像復号装置は、シーケンスパラメータセットSPSにて、高精度符号化モードを示すフラグを復号するヘッダ復号部と、変換ブロック毎に変換係数に対して逆量子化を行うスケーリング処理部と、逆変換を行う逆変換部とを備え、上記スケーリング処理部は、上記フラグと上記変換ブロックのサイズに基づいて、変換係数のレンジを示す変数をビットデプスに依存するか、ビットデプスに依存しないかを切り替えることを特徴とする。

　以上の構成によれば、上記問題の何れかの解決を図ることができる。

本実施形態に係る画像伝送システムの構成を示す概略図である。本実施形態に係る動画像符号化装置を搭載した送信装置、及び、動画像復号装置を搭載した受信装置の構成について示した図である。PROD_Aは動画像符号化装置を搭載した送信装置を示しており、PROD_Bは動画像復号装置を搭載した受信装置を示している。本実施形態に係る動画像符号化装置を搭載した記録装置、及び、動画像復号装置を搭載した再生装置の構成について示した図である。PROD_Cは動画像符号化装置を搭載した記録装置を示しており、PROD_Dは動画像復号装置を搭載した再生装置を示している。符号化ストリームのデータの階層構造を示す図である。 CTUの分割例を示す図である。動画像復号装置の構成を示す概略図である。動画像復号装置の概略的動作を説明するフローチャートである。逆量子化・逆変換部の構成例について示す機能ブロック図である。逆量子化・逆変換部の構成例について示す機能ブロック図である。動画像符号化装置の構成を示すブロック図である。本発明の一実施形態の逆量子化・逆変換（量子化・変換）処理を示すフローチャートである。本発明の第１の実施形態のクリッピング値、シフト値の構成例を示す図である。本発明の第２の実施形態のクリッピング値、シフト値の構成例を示す図である。本発明の第３の実施形態のクリッピング値、シフト値の構成例を示す図である。

　　（実施形態１）
　以下、図面を参照しながら本発明の実施形態について説明する。

　図1は、本実施形態に係る画像伝送システム１の構成を示す概略図である。

　画像伝送システム１は、符号化対象画像を符号化した符号化ストリームを伝送し、伝送された符号化ストリームを復号し画像を表示するシステムである。画像伝送システム１は、動画像符号化装置（画像符号化装置）11、ネットワーク21、動画像復号装置（画像復号装置）31、及び画像表示装置（画像表示装置）41を含んで構成される。

　動画像符号化装置11には画像Tが入力される。

　ネットワーク21は、動画像符号化装置11が生成した符号化ストリームTeを動画像復号装置31に伝送する。ネットワーク21は、インターネット（Internet）、広域ネットワーク（WAN:Wide Area Network）、小規模ネットワーク（LAN:Local Area Network）又はこれらの組み合わせである。ネットワーク21は、必ずしも双方向の通信網に限らず、地上デジタル放送、衛星放送等の放送波を伝送する一方向の通信網であってもよい。また、ネットワーク21は、DVD（Digital Versatile Disc:登録商標）、BD（Blue-ray Disc:登録商標）等の符号化ストリームTeを記録した記憶媒体で代替されてもよい。

　動画像復号装置31は、ネットワーク21が伝送した符号化ストリームTeのそれぞれを復号し、復号した１又は複数の復号画像Tdを生成する。

　画像表示装置41は、動画像復号装置31が生成した１又は複数の復号画像Tdの全部又は一部を表示する。画像表示装置41は、例えば、液晶ディスプレイ、有機ＥＬ（Electro-luminescence）ディスプレイ等の表示デバイスを備える。ディスプレイの形態としては、据え置き、モバイル、HMD等が挙げられる。また、動画像復号装置31が高い処理能力を有する場合には、画質の高い画像を表示し、より低い処理能力しか有しない場合には、高い処理能力、表示能力を必要としない画像を表示する。

　＜演算子＞
　本明細書で用いる演算子を以下に記載する。

　>>は右ビットシフト、<<は左ビットシフト、&はビットワイズAND、|はビットワイズOR、|=はOR代入演算子であり、||は論理和を示す。

　x?y:zは、xが真（0以外）の場合にy、xが偽（0）の場合にzをとる３項演算子である。

　Clip3(a,b,c)は、cをa以上b以下の値にクリップする関数であり、c<aの場合にはaを返し、c>bの場合にはbを返し、その他の場合にはcを返す関数である（ただし、a<=b）。

　abs(a)はaの絶対値を返す関数である。

　Int(a)はaの整数値を返す関数である。

　floor(a)はa以下の最小の整数を返す関数である。

　ceil(a)はa以上の最大の整数を返す関数である。

　a/dはdによるaの除算（小数点以下切り捨て）を表す。

　＜符号化ストリームTeの構造＞
　本実施形態に係る動画像符号化装置11及び動画像復号装置31の詳細な説明に先立って、動画像符号化装置11によって生成され、動画像復号装置31によって復号される符号化ストリームTeのデータ構造について説明する。

　図4は、符号化ストリームTeにおけるデータの階層構造を示す図である。符号化ストリームTeは、例示的に、シーケンス、及びシーケンスを構成する複数のピクチャを含む。図4には、それぞれ、シーケンスSEQを既定する符号化ビデオシーケンス、ピクチャPICTを規定する符号化ピクチャ、スライスSを規定する符号化スライス、スライスデータを規定する符号化スライスデータ、符号化スライスデータに含まれる符号化ツリーユニット、符号化ツリーユニットに含まれる符号化ユニットを示す図が示されている。

　（符号化ビデオシーケンス）
　符号化ビデオシーケンスでは、処理対象のシーケンスSEQを復号するために動画像復号装置31が参照するデータの集合が規定されている。シーケンスSEQは、図4の符号化ビデオシーケンスに示すように、ビデオパラメータセット（Video Parameter Set）、シーケンスパラメータセットSPS（Sequence Parameter Set）、ピクチャパラメータセットPPS（Picture Parameter Set）、ピクチャPICT、及び、付加拡張情報SEI（Supplemental Enhancement Information）を含んでいる。

　ビデオパラメータセットVPSは、複数のレイヤから構成されている画像において、複数の画像に共通する符号化パラメータの集合及び画像に含まれる複数のレイヤ及び個々のレイヤに関連する符号化パラメータの集合が規定されている。

　シーケンスパラメータセットSPSでは、対象シーケンスを復号するために動画像復号装置31が参照する符号化パラメータの集合が規定されている。例えば、ピクチャの幅や高さが規定される。なお、SPSは複数存在してもよい。その場合、PPSから複数のSPSの何れかを選択する。

　ピクチャパラメータセットPPSでは、対象シーケンス内の各ピクチャを復号するために動画像復号装置31が参照する符号化パラメータの集合が規定されている。例えば、ピクチャの復号に用いられる量子化幅の基準値（pic_init_qp_minus26）や重み付き予測の適用を示すフラグ（weighted_pred_flag）及びスケーリングリスト（量子化マトリックス）が含まれる。なお、PPSは複数存在してもよい。その場合、対象シーケンス内の各ピクチャから複数のPPSの何れかを選択する。

　（符号化ピクチャ）
　符号化ピクチャでは、処理対象のピクチャPICTを復号するために動画像復号装置31が参照するデータの集合が規定されている。ピクチャPICTは、図4の符号化ピクチャに示すように、スライス0～スライスNS-1を含む（NSはピクチャPICTに含まれるスライスの総数）。

　なお、以下、スライス0～スライスNS-1のそれぞれを区別する必要が無い場合、符号の添え字を省略して記述することがある。また、以下に説明する符号化ストリームTeに含まれるデータであって、添え字を付している他のデータについても同様である。

　（符号化スライス）
　符号化スライスでは、処理対象のスライスSを復号するために動画像復号装置31が参照するデータの集合が規定されている。スライスは、図4の符号化スライスに示すように、スライスヘッダ、及び、スライスデータを含んでいる。

　スライスヘッダには、対象スライスの復号方法を決定するために動画像復号装置31が参照する符号化パラメータ群が含まれる。スライスタイプを指定するスライスタイプ指定情報（slice_type）は、スライスヘッダに含まれる符号化パラメータの一例である。

　スライスタイプ指定情報により指定可能なスライスタイプとしては、（１）符号化の際にイントラ予測のみを用いるＩスライス、（２）符号化の際に単方向予測、又は、イントラ予測を用いるＰスライス、（３）符号化の際に単方向予測、双方向予測、又は、イントラ予測を用いるＢスライス等が挙げられる。なお、インター予測は、単予測、双予測に限定されず、より多くの参照ピクチャを用いて予測画像を生成してもよい。以下、P、Bスライスと呼ぶ場合には、インター予測を用いることができるブロックを含むスライスを指す。

　なお、スライスヘッダは、ピクチャパラメータセットPPSへの参照（pic_parameter_set_id）を含んでいてもよい。

　（符号化スライスデータ）
　符号化スライスデータでは、処理対象のスライスデータを復号するために動画像復号装置31が参照するデータの集合が規定されている。スライスデータは、図4の符号化スライスヘッダに示すように、CTUを含んでいる。CTUは、スライスを構成する固定サイズ（例えば64x64）のブロックであり、最大符号化単位（LCU:Largest Coding Unit）と呼ぶこともある。

　（符号化ツリーユニット）
　図4の符号化ツリーユニットには、処理対象のCTUを復号するために動画像復号装置31が参照するデータの集合が規定されている。CTUは、再帰的な4分木分割（QT（Quad Tree）分割）、2分木分割（BT（Binary Tree）分割）あるいは3分木分割（TT（Ternary Tree）分割）により符号化処理の基本的な単位である符号化ユニットCUに分割される。BT分割とTT分割を合わせてマルチツリー分割（MT（Multi Tree）分割）と呼ぶ。再帰的な4分木分割により得られる木構造のノードのことを符号化ノード（Coding Node）と称する。4分木、2分木、及び3分木の中間ノードは、符号化ノードであり、CTU自身も最上位の符号化ノードとして規定される。

　CTは、CT情報として、QT分割を行うか否かを示すQT分割フラグ（cu_split_flag）、MT分割の有無を示すMT分割フラグ（split_mt_flag）、MT分割の分割方向を示すMT分割方向（split_mt_dir）、MT分割の分割タイプを示すMT分割タイプ（split_mt_type）を含む。cu_split_flag、split_mt_flag、split_mt_dir、split_mt_typeは符号化ノード毎に伝送される。

　cu_split_flagが1の場合、符号化ノードは4つの符号化ノードに分割される（図5のQT）。

　cu_split_flagが0の時、split_mt_flagが０の場合に符号化ノードは分割されず1つのCUをノードとして持つ（図5の分割なし）。CUは符号化ノードの末端ノードであり、これ以上分割されない。CUは、符号化処理の基本的な単位となる。

　split_mt_flagが１の場合に符号化ノードは以下のようにMT分割される。split_mt_typeが０の時、split_mt_dirが１の場合に符号化ノードは2つの符号化ノードに水平分割され（図5のBT(水平分割)）、split_mt_dirが０の場合に符号化ノードは2つの符号化ノードに垂直分割される（図5のBT(垂直分割)）。また、split_mt_typeが１の時、split_mt_dirが１の場合に符号化ノードは3つの符号化ノードに水平分割され（図5のTT(水平分割)）、split_mt_dirが０の場合に符号化ノードは3つの符号化ノードに垂直分割される（図5のTT(垂直分割)）。これらを図5のCT情報に示す。

　また、CTUのサイズが64x64画素の場合には、CUのサイズは、64x64画素、64x32画素、32x64画素、32x32画素、64x16画素、16x64画素、32x16画素、16x32画素、16x16画素、64x8画素、8x64画素、32x8画素、8x32画素、16x8画素、8x16画素、8x8画素、64x4画素、4x64画素、32x4画素、4x32画素、16x4画素、4x16画素、8x4画素、4x8画素、及び、4x4画素の何れかをとり得る。

　（符号化ユニット）
　図4の符号化ユニットに示すように、処理対象の符号化ユニットを復号するために動画像復号装置31が参照するデータの集合が規定されている。具体的には、CUは、CUヘッダCUH、予測パラメータ、変換パラメータ、量子化変換係数等から構成される。CUヘッダでは予測モード等が規定される。

　予測処理は、CU単位で行われる場合と、CUをさらに分割したサブCU単位で行われる場合がある。CUとサブCUのサイズが等しい場合には、CU中のサブCUは1つである。CUがサブCUのサイズよりも大きい場合、CUは、サブCUに分割される。例えばCUが8x8、サブCUが4x4の場合、CUは水平2分割、垂直2分割からなる、4つのサブCUに分割される。

　予測の種類（予測モードCuPredMode）は、イントラ予測(MODE_INTRA)と、インター予測(MODE_INTER)の2つを少なくとも備える。さらにイントラブロツクコピー予測(MODE_IBC)を備えても良い。イントラ予測、イントラブロツクコピー予測は、同一ピクチャ内の予測であり、インター予測は、互いに異なるピクチャ間（例えば、表示時刻間、レイヤ画像間）で行われる予測処理を指す。

　変換・量子化処理はCU単位で行われるが、量子化変換係数は4x4等のサブブロック単位でエントロピー符号化してもよい。

　（予測パラメータ）
　予測画像は、ブロックに付随する予測パラメータによって導出される。予測パラメータには、イントラ予測とインター予測の予測パラメータがある。

　（動画像復号装置の構成）
　本実施形態に係る動画像復号装置31（図6）の構成について説明する。

　動画像復号装置31は、エントロピー復号部301、パラメータ復号部（予測画像復号装置）302、ループフィルタ305、参照ピクチャメモリ306、予測パラメータメモリ307、予測画像生成部（予測画像生成装置）308、逆量子化・逆変換部311、及び加算部312を含んで構成される。なお、後述の動画像符号化装置11に合わせ、動画像復号装置31にループフィルタ305が含まれない構成もある。

　パラメータ復号部302は、さらに、ヘッダ復号部3020、CT情報復号部3021、及びCU復号部3022（予測モード復号部）を備えており、CU復号部3022はTU復号部3024を備えている。これらを総称して復号モジュールと呼んでもよい。ヘッダ復号部3020は、符号化データからVPS、SPS、PPS等のパラメータセット情報、スライスヘッダ（スライス情報）を復号する。CT情報復号部3021は、符号化データからCTを復号する。CU復号部3022は符号化データからCUを復号する。TU復号部3024は、TUに予測誤差が含まれている場合に、符号化データからQP更新情報（量子化補正値）と量子化予測誤差（residual_coding）を復号する。

　ヘッダ復号部3020は、SPSから非分離変換を利用するか否かを示すフラグsps_lfnst_enabled_flagを復号する。また、ヘッダ復号部3020は、sps_lfnst_enabled_flagが１である場合に、ピクチャヘッダ(PH)からph_lfnst_enabled_flagを復号する。ph_lfnst_enabled_flagが現れない場合には、ph_lfnst_enabled_flagを0と推定(infer)する。あるいは、ph_lfnst_enabled_flagが現れない場合には、ph_lfnst_enabled_flagの値としてsps_lfnst_enabled_flagの値を設定してもよい。

　TU復号部3024は、ph_lfnst_enabled_flagが１である場合に、符号化データから非分離変換の利用及び変換基底を示す値lfnst_idxを復号する。これによって、SPSもしくはPHにおいて、非分離変換をオンオフする効果がある。非分離変換は、高周波数が少ない絵や斜め線が多い絵では効果があるが、ノイズが多い画像や画像の細かい変化が多い場合には、lfnst_idxのオーバーヘッドが多いためロスが発生する。

　また、mtsIdxが0の場合にのみlfnst_idxを復号してもよい。またlfnst_idxは0もしくは1であってもよい。また、lfnst_idxをイントラ予測モードから導出してもよい。

　lfnst_idx = lfnst_idx != 0 ? (IntraPredModeY % 2) + 1: 0
　また、パラメータ復号部302は、図示しないインター予測パラメータ復号部303及びイントラ予測パラメータ復号部304を含んで構成される。予測画像生成部308は、インター予測画像生成部309及びイントラ予測画像生成部310を含んで構成される。

　また、以降では処理の単位としてCTU、CUを使用した例を記載するが、この例に限らず、サブCU単位で処理をしてもよい。あるいはCTU、CUをブロック、サブCUをサブブロックと読み替え、ブロックあるいはサブブロック単位の処理としてもよい。

　エントロピー復号部301は、外部から入力された符号化ストリームTeに対してエントロピー復号を行って、個々の符号（シンタックス要素）を分離し復号する。エントロピー符号化には、シンタックス要素の種類や周囲の状況に応じて適応的に選択したコンテキスト（確率モデル）を用いてシンタックス要素を可変長符号化する方式と、予め定められた表、あるいは計算式を用いてシンタックス要素を可変長符号化する方式がある。前者のCABAC（Context Adaptive Binary Arithmetic Coding）は、符号化あるいは復号したピクチャ（スライス）毎に更新した確率モデルをメモリに格納する。そして、Pピクチャ、あるいはBピクチャのコンテキストの初期状態として、メモリに格納された確率モデルの中から、同じスライスタイプ、同じスライスレベルの量子化パラメータを使用したピクチャの確率モデルを設定する。この初期状態を符号化、復号処理に使用する。分離された符号には、予測画像を生成するための予測情報及び、差分画像を生成するための予測誤差等がある。

　エントロピー復号部301は、分離した符号をパラメータ復号部302に出力する。分離した符号とは、例えば、予測モードCuPredModeである。どの符号を復号するかの制御は、パラメータ復号部302の指示に基づいて行われる。

　（基本フロー）
　図7は動画像復号装置31の概略的動作を説明するフローチャートである。

　（S1100：パラメータセット情報復号）ヘッダ復号部3020は、符号化データからVPS、SPS、PPS等のパラメータセット情報を復号する。

　（S1200：スライス情報復号）ヘッダ復号部3020は、符号化データからスライスヘッダ（スライス情報）を復号する。

　以下、動画像復号装置31は、対象ピクチャに含まれる各CTUについて、S1300からS5000の処理を繰り返すことにより各CTUの復号画像を導出する。

　（S1300：CTU情報復号）CT情報復号部3021は、符号化データからCTUを復号する。

　（S1400：CT情報復号）CT情報復号部3021は、符号化データからCTを復号する。

　（S1500：CU復号）CU復号部3022はS1510、S1520を実施して、符号化データからCUを復号する。

　（S1510：CU情報復号）CU復号部3022は、符号化データからCU情報、予測情報、TU分割フラグsplit_transform_flag、CU残差フラグcbf_cb、cbf_cr、cbf_luma等を復号する。

　（S1520：TU情報復号）TU復号部3024は、TUに予測誤差が含まれている場合に、符号化データからQP更新情報（量子化補正値）と量子化予測誤差（residual_coding）を復号する。なお、QP更新情報は、量子化パラメータQPの予測値である量子化パラメータ予測値qPpredからの差分値である。

　（S2000：予測画像生成）予測画像生成部308は、対象CUに含まれる各ブロックについて、予測情報に基づいて予測画像を生成する。

　（S3000：逆量子化・逆変換）逆量子化・逆変換部311は、対象CUに含まれる各TUについて、逆量子化・逆変換処理を実行する。

　（S4000：復号画像生成）加算部312は、予測画像生成部308より供給される予測画像と、逆量子化・逆変換部311より供給される予測誤差とを加算することによって、対象CUの復号画像を生成する。

　（S5000：ループフィルタ）ループフィルタ305は、復号画像にデブロッキングフィルタ、SAO、ALF等のループフィルタをかけ、復号画像を生成する。

　（スケーリング部31111）
　スケーリング部31111は、エントロピー復号部301から入力された量子化変換係数qd[ ][ ]に対して係数単位の重みを用いてスケーリングする。
＜逆量子化・逆変換部311の構成例＞
　図8は、本実施形態の逆量子化・逆変換部311の構成を示すブロック図である。逆量子化・逆変換部311は、スケーリング部31111、逆非分離変換部31121、逆コア変換部31123から構成される。

　図9は、本実施形態の逆量子化・逆変換部311の別の構成を示すブロック図である。逆量子化・逆変換部311は、スケーリング部31111、逆非分離変換部31121、逆コア変換部31123、ジョイント誤差導出部3113から構成される。図8に対して、ジョイント誤差導出部3113を追加した構成である。

　逆量子化・逆変換部311は、エントロピー復号部301から入力された量子化変換係数qd[ ][ ]をスケーリング部31111によりスケーリング（逆量子化）して変換係数d[ ][ ]を求める。この量子化変換係数qd[ ][ ]は、符号化処理において、予測誤差に対してDCT（Discrete Cosine Transform、離散コサイン変換）、DST（Discrete Sine Transform、離散サイン変換）等の変換を行い量子化して得られる係数、もしくは、変換後の係数をさらに非分離変換した係数である。逆量子化・逆変換部311は、lfnst_idx!=0の場合、逆非分離変換部31121により逆変換を行う。さらに変換係数について逆DCT、逆DST等の逆周波数変換を行い、予測誤差を算出する。また、lfnst_idx==0の場合、逆非分離変換部31121を行わず、スケーリング部31111によりスケーリングされた変換係数について逆DCT、逆DST等の逆変換を行い、予測誤差を算出する。逆量子化・逆変換部311は予測誤差を加算部312に出力する。

　なお、逆変換及び変換は、対になる処理であるため、変換と逆変換とを互いに置き換えて解釈してもよい。あるいは、逆変換を変換と呼ぶ場合には、変換を順変換と呼んでもよい。例えば、逆非分離変換を非分離変換と呼ぶ場合、非分離変換は順非分離変換と呼んでもよい。また、コア変換を単に変換と呼ぶ。

　（スケーリング部31111の詳細）
　本実施形態におけるスケーリング部31111で、逆非分離変換が適用される場合のスケーリングファクタについて詳細に説明する。

　スケーリング部31111は、スケーリングリスト復号部3026から入力される、逆非分離変換行列のサイズによって異なる第２のスケーリングファクタを利用し、スケーリングを行ってもよい。

　スケーリング部31111は、パラメータ復号部302において導出された量子化パラメータおよびスケーリングファクタを用いて、TU復号部が復号した変換係数に対して係数単位の重みを用いてスケーリングする。

　ここで量子化パラメータqPは、対象変換係数の色コンポーネントcIdxと、ジョイント色差残差符号化フラグtu_joint_cbcr_flagを用いて以下で導出する。

　qP = qPY (cIdx == 0)
　qP = qPCb (cIdx == 1 && tu_joint_cbcr_flag == 0)
　qP = qPCr (cIdx == 2 && tu_joint_cbcr_flag == 0)
　qP = qPCbCr (tu_joint_cbcr_flag != 0)
　スケーリング部31111は、対象TUのサイズ(nTbW,nTbH)からサイズあるいは形状に関わる値rectNonTsFlagを導出する。

　rectNonTsFlag = (((Log2(nTbW) + Log2(nTbH)) & 1) == 1 && transform_skip_flag[xTbY][yTbY] == 0)
(xTbY, yTbY)は変換ブロックの左上座標、transform_skip_flagは変換をスキップするか否かを示すフラグである。

　スケーリング部31111は、スケーリングリスト復号部3026（図示せず）において導出されたScalingFactor[][]を用いて次の処理を行う。

　スケーリング部31111は、スケーリングリストが有効でない場合（scaling_list_enabled_flag==0）、もしくは、変換スキップを用いる場合(transform_skip_flag==1)の場合に、m[x][y]=16を設定する。つまり、一様量子化を行う。scaling_list_enabled_flagはスケーリングリストが有効か否かを示すフラグである。

　それ以外の場合（つまり、scaling_list_enabled_flag==1かつtransform_skip_flag==0の場合）、スケーリング部31111はスケーリングリストを用いる。ここではm[][]を下記のようにセットする。

　m[x][y] = ScalingFactor[Log2(nTbW)][Log2(nTbH)][matrixId][x][y]
　ここで、matrixIdは、対象TUの予測モード(CuPredMode)、色コンポーネントインデックス(cIdx)、非分離変換の適用有無(lfnst_idx)により設定される。

　スケーリング部31111はスケーリングファクタls[x][y]をsh_dep_quant_used_flagが１の場合に以下の式で導出する。

　ls[x][y] = (m[x][y] * levelScale[rectNonTsFlag][(qP+1)%6]) << ((qP+1)/6)
それ以外の場合（sh_dep_quant_used_flag=0）、以下の式で導出してもよい。

　ls[x][y] = (m[x][y] * levelScale[rectNonTsFlag][qP%6]) << (qP/6)
ここでlevelScale[] = {{ 40, 45, 51, 57, 64, 72 }, { 57, 64, 72, 80, 90, 102 }｝である。sh_dep_quant_used_flagは、依存量子化を行う場合に１、行わない場合に０とするフラグである。

　スケーリング部31111は、スケーリングファクタls[][]と復号された変換係数TransCoeffLevelの積からdnc[][]を導出することにより、逆量子化を行う。

　dnc[x][y] = ( TransCoeffLevel[xTbY][yTbY][cIdx][x][y] * ls[x][y] + bdOffset1 ) >> bdShift1
　ここでbdOffset1 = 1<<(bdShift1 - 1)
　extended_precision_processing_flagは、高精度符号化モードか否かを示すフラグである。高精度符号化モードは、変換係数を高い精度で逆変換する復号モードであり、主に画素ビット深度が高い場合（例えば10bit以上）に利用される。

　以下では、スケーリングの精度を切り替えると同時に、スケーリングに用いるテーブルの値を変更する方法を説明する。本実施形態のスケーリング部31111は、パラメータセットから復号したextended_precision_processing_flagに基づいて上記bdShift1を以下の式で導出してもよい。

　log2TransformRange = extended_precision_processing_flag ? BitDepth + 5 : 15
また以下でもよい。

　log2TransformRange = extended_precision_processing_flag ? Max(15, BitDepth + 5) : 15
　bdShift1 = BitDepth + rectNonTsFlag +（((Log2(nTbW) + Log2(nTbH)) / 2) + 10 - log2TransformRange + sh_dep_quant_used_flag
　ここで、log2TransformRangeは変換係数の値のとりうる範囲、BitDepthは画素のビットデプスを表わす。extended_precision_processing_flag = 1の場合、つまり、log2TransformRange =BitDepth + 5の場合には、下式であり、5以上の値となる。

　bdShift1 = 5 + rectNonTsFlag +（((Log2(nTbW) + Log2(nTbH)) / 2) + sh_dep_quant_used_flag
　または、本実施形態のスケーリング部31111は、extended_precision_processing_flagを用いずに下記によりbdShift1を導出してもよい。

　log2TransformRange = Max(15, BitDepth + 5)
　bdShift1 = BitDepth + rectNonTsFlag +（((Log2(nTbW) + Log2(nTbH)) / 2) + 10 - log2TransformRange + sh_dep_quant_used_flag
　この場合、スケーリング部31111は、BitDepthに基づいて以下の値を用いる（またはlog2TransformRangeにより切り替えてもよい）。BitDepth > 10 (つまりlog2TransformRange > 15)の場合、以下のテーブルを用いる。以下のテーブルは偶数の値のみを含む（S1）。
levelScale [] = {{ 40, 46, 52, 58, 64, 72 }, {58, 64, 72, 80, 90, 102 }｝
上記以外、BitDepth <= 10 (つまりlog2TransformRange == 15)の場合、以下のテーブルを用いる。以下のテーブルは奇数と偶数の値を含む（S6）。
levelScale[] = {{ 40, 45, 51, 57, 64, 72 }, {57, 64, 72, 80, 90, 102 }｝
　ここでは、BitDepth > 10の場合に、quantScaleに含まれる値を全て偶数とすることが特徴である。

　最後に、スケーリング部31111は、逆量子化された変換係数をクリッピングしd[x][y]を導出する。

　d[x][y] = Clip3(CoeffMin, CoeffMax, dnc[x][y])　(式CLIP-1)
CoeffMin、CoeffMaxはクリッピングの最小値と最大値である。

　d[x][y]は、逆コア変換部31123もしくは逆非分離変換部31121に伝送される。逆非分離変換部31121は、逆量子化の後、コア変換の前に、変換係数d[ ][ ]に対して逆非分離変換を適用する。

　（逆非分離変換部31121）
　逆非分離変換部31121は、スケーリング部31111から受信した変換係数d[ ][ ]の一部もしくは全てに対して、変換行列を用いた変換を適用することにより、修正変換係数（非分離変換部による変換後の変換係数）d[ ][ ]を復元する。逆非分離変換部31121は、変換ユニットTU毎に変換係数d[ ][ ]に対して逆非分離変換を適用する。逆非分離変換部31121は、復元された修正変換係数d[ ][ ]を逆コア変換部31123に出力する。

　（逆コア変換部31123）
　逆コア変換部31123は、変換係数d[ ][ ]、又は、修正変換係数d[ ][ ]に対し、変換を行い予測誤差r[][]を導出する。そして、r[][]に対し、ビットデプス(BitDepth)に応じたシフトを行い、予測画像生成部308で導出される予測画像と同じ精度の誤差resSamples[][]を導出する。例えば、シフトは以下で表現される。

　resSamples[x][y] = (r[x][y] + (1 << (bdShift2 - 1))) >> bdShift2　(式BD-1)
　bdShift2 = Max(20 - BitDepth, 0)
この演算では、20bit精度のr[][]から、シフト演算により、BitDepth精度のresSamples[][]を得る。なお、精度を示す値は20に限定されず、8から24の間の他の値を用いてもよい（以下同様）。BitDepthに応じたシフトは、ビットデプスシフト部（図示せず）を設けて実施してもよい。導出された誤差は加算部312に出力される。

　（逆コア変換部31123）
　逆コア変換部31123は、逆非分離変換部31121の出力（修正変換係数）に対して逆コア変換を適用する。あるいは、逆コア変換部31123は、スケーリング部31111の出力（変換係数）に対して、逆コア変換を適用してもよい。逆コア変換部31123は、垂直方向、水平方向の１次元変換を行う手段であり、逆変換部と呼ばれる。

　逆コア変換部31123は、垂直方向１次元変換により、（修正）変換係数d[ ][ ]を第1の中間値e[ ][ ]に変換し、クリッピングして第2の中間値g[ ][ ]を出力する。逆コア変換部31123は、g[ ][ ]を予測残差r[ ][ ]に変換し、予測残差r[ ][ ]は加算部312に送られる。

　より具体的には、逆コア変換部31123は、以下の式で第1の中間値ｅ[x][y]を導出する。

　e[x][y] = Σ（transMatrix[y][j]×d[x][j]）　　(j = 0..nTbS - 1)
　ここで、transMatrix[ ][ ]（=transMatrixV[ ][ ]）は、trTypeVerを用いて導出したnTbS×nTbSの変換基底である。trTypeは変換の種類を示すパラメータであり、trTypeVerとtrTypeHorがある。nTbSはTUの高さnTbHである。

　変換係数の基底は6bitの整数量子化の結果であってもよい。6bit整数量子化後のDCTの変換行列の値はすべて(6+1)bitの符号付整数であり、-128から127の範囲である。このとき、DCT(DCT2)の直流成分（DC係数、第１成分）にかかる変換行列の値は6bit(64)固定であり、それ以外の係数、DCTの交流成分（AC係数、第２成分以降）もしくはDSTの変換行列の値は上記-127から128の範囲内である。

　DCT2（trType==0）の４×４変換（nTbS=4）の場合、例えばtransMatrix={{64, 64, 64, 64}, {83, 36, -36, -83}, {64, -64, -64, 64}, {36, -83, 83, -36}}を用いる。

　DCT7（trType==1）の４×４変換（nTbS=4）の場合、例えばtransMatrix={{29, 55, 74, 84}, {74, 74, 0, -74}, {84, -29, -74, 55}, {55, -84, 74, -29}}を用いる。
Σは、j = 0..nTbS-1について、transMatrix[y][j]とd[x][j]の積を加算する処理を意味する。

　逆コア変換部31123は、第1の中間値ｅ[x][y]をシフト、クリッピングし、第2の中間値g[x][y]を導出する。

　g[x][y] = Clip3(CoeffMin, CoeffMax, (e[x][y] + trOffset1) >> trShift1)
　trOffset1 = 1 << (trShift1 - 1)
　上式のtrShift1は変換基底のビット深度trDepthから決まる数値で、trShift = trDepthもしくはtrDepth+1としてもよい。

　ここでは変換基底trDepthを6bit、trShift1 = trDepth+1と仮定して以下の式を用いる。

　g[x][y] = Clip3(CoeffMin, CoeffMax, (e[x][y] + 64) >> 7)　(式CLIP-2)
またCoeffMin、CoeffMaxはクリッピングの最小値と最大値である。

　逆コア変換部31123は、trTypeHorを用いて変換基底transMatrix[ ][ ]（=transMatrixH[ ][ ]）を導出する。nTbSはTUの幅nTbWである。水平変換部152123は、水平方向１次元変換により、第2の中間値g[x][y]を予測残差r[x][y]に変換する。

　r[x][y] =ΣtransMatrix[x][j]×g[j][y]　　　(j = 0..nTbS-1)
　上記記号Σは、j = 0..nTbS-1について、transMatrix[x][j]とg[j][y]の積を加算する処理を意味する。

　また、以下のように、DCT2の場合には、変換サイズ2, 4, 8, 16, 32, ...において、共通の値を利用することが可能である。従って、変換サイズ依存のtransMatrixを定義するのではなく、最大サイズの変換transMatrixを定義して、サイズごとに必要な行（以下ではj）だけを利用してもよい。

　e[x][y] = Σ（transMatrix[y][j * 2^(6 - Log2(nTbS))]×d[x][j]）　　(j = 0..nTbS-1)
　本実施形態において、変換係数の精度trDepth、trShift1、bdShift2にはデフォルト動作の場合、以下の関係がある。

　trShift1 = trDepth + 1
　bdShift2 = trDepth - 1 + log2TransformRange - BitDepth
ここでlog2TransformRangeは、クリッピングの範囲を示す対数値である。
trDepth = 6、log2TransformRange = 15の場合、以下となり、extended_precision_processing_flag = 0の場合の動作と一致する。

　trShift1 = 6 + 1 = 7
　bdShift2 = 6 - 1 + 15 - BitDepth = 20 - BitDepth
extended_precision_processing_flagは、ハイビットデプス符号化モードか否かを示すフラグである。

　（本実施形態に関する係数のシフト演算及びクリッピング処理の説明）
　本発明の一態様の動画像復号装置31はシーケンスパラメータセットSPSにて、ハイビットデプス符号化モードを示すハイビットデプスフラグ（extended_precision_processing_flag）を復号するヘッダ復号部を備える。本発明の一態様の動画像符号化装置11のヘッダ符号化部1110は、extended_precision_processing_flagを符号化する。extended_precision_processing_flagは、12bit～16bitの画素ビット深度(BitDepth)を主にターゲットとし変換係数の逆量子化、および、クリッピング値とシフト値の調節により、高精度な復号を可能にする。

　図11は、逆量子化・逆変換の係数のシフト演算およびクリッピング処理を示すフローチャートである。

　スケーリング部31111は、スケーリングファクタls[][]と変換係数TransCoeffLevelの積からdnc[][]を導出する。ここでは第１シフト値bsShift1による一回目のシフト演算を行う（S1）。

　dnc[x][y] = (TransCoeffLevel[xTbY][yTbY][cIdx][x][y] * ls[x][y] + bdOffset1) >> bdShift1
　変換スキップの場合(transform_skip_flag==1)、bdShift1＝10（固定値）で、逆変換を行わずに、修正変換係数d[ ][ ]から予測誤差r[][]を導出する。

　r[x][y] = d[x][y]
　変換スキップ以外の場合(transform_skip_flag==0)、上記bdShift1を以下の式で導出する。

　log2TransformRange = extended_precision_processing_flag ? Max(15, BitDepth + 6) : 15　(式R-1)
　　bdShift1 = BitDepth + rectNonTsFlag +((Log2(nTbW) + Log2(nTbH)) / 2) + 10 - log2TransformRange + sh_dep_quant_used_flag
　bdOffset1 = (1 << bdShift1) >> 1
bdShift1はビット深度に依存するbdShift1aと、ブロックサイズおよび量子化パラメータに依存する部分から構成される。

　bdShift1 = bdShift1a + rectNonTsFlag +((Log2(nTbW) + Log2(nTbH)) / 2) + sh_dep_quant_used_flag
　　bdShift1a = BitDepth + 10 - log2TransformRange
　なお、extended_precision_processing_flag = 0の場合、式(R-1)からlog2TransformRange=15であるから、bdShift1a = BitDepth - 5となる。

　次に、逆量子化より得られた変換係数dncを以下の式でクリッピングしd[x][y]を導出する（S2）。

　d[x][y] = Clip3(CoeffMin, CoeffMax, dnc[x][y])　(式CLIP-1)
CoeffMin、CoeffMaxはクリッピングの最小値と最大値で以下の式により導出する。

　CoeffMin = -(1 << log2TransformRange)
　CoeffMax = (1 << log2TransformRange) - 1
　このとき、クリッピング後の値域は、log2TransformRange bitの符号付整数の範囲に制限される。以降の(式CLIP-2)でも同じクリッピング値を用いる。

　以下では、逆非分離変換を行わない場合（lfnst_idx=0）について説明する。

　まず、クリッピング処理した変換係数d[ ][ ]を逆コア変換する。逆コア変換部31123はd[ ][ ]に垂直変換（１回目DCT変換）を行い、第1の中間値e[ ][ ]を導出する（S3）。逆コア変換部31123はe[ ][ ]を中間クリッピングし、第2の中間値g[ ][ ]を導出する（S4）。

　g[x][y] = Clip3(CoeffMin, CoeffMax, (e[x][y] + 64) >> 7) 　(式CLIP-2)
上式の64、7は変換基底のビット深度（整数化量子化精度）から決まる数値で、上式では変換基底を6bitと仮定している。逆コア変換部31123はg[ ][ ]に水平変換（２回目DCT変換）を行い、r[ ][ ]を導出する（S5）。逆コア変換部31123はr[ ][ ]に第２シフト値bdShift2による２回目のシフト処理を行い、予測誤差res[][]を導出する（S6）。

　res[x][y] = (r[x][y] + (1 << (bdShift2 - 1))) >> bdShift2
ここで、bdShift2は以下の式で導出する。

　bdShift2 = Max(20 - BitDepth, extended_precision_processing_flag ? 11 : 0)
　図12(a)は、extended_precision_processing_flag = 0の場合の、変換係数レンジlog2TransformRange、第１シフト値bdShift1a、第２シフト値bdShift2の関係を示す図である。

　図12(b)は、extended_precision_processing_flag = 1の場合の、log2TransformRange、bdShift1a、bdShift2の関係を示す図である。

　図に示すように、extended_precision_processing_flag = 1の場合には、bdShift1aを小さく、bdShift2を大きく設定することにより、１回目のシフトで失われる情報を低減する。また、log2TransformRangeを大きくすることで、中間変換係数のクリッピングで生じる情報の消失も低減する効果がある。

　なお、第１の変換、第２の変換は、extended_precision_processing_flagの値に依存しないため、２回のシフト量の合計は、extended_precision_processing_flagによらず同じである。

　log2TransformRange = extended_precision_processing_flag ? Max(15, BitDepth + 5) : 15
　bdShift2 = Max(20 - BitDepth, extended_precision_processing_flag ? 10 : 0)

　（実施形態２）
　スケーリング部31111はスケーリングファクタls[][]と復号された変換係数TransCoeffLevelの積からdnc[][]を導出することにより、逆量子化を行う。図11を参照して説明する。

　dnc[x][y] = (TransCoeffLevel[xTbY][yTbY][cIdx][x][y] * ls[x][y] + bdOffset) >> bdShift1
変換スキップを用いる場合(transform_skip_flag==1)、bdShift1＝10で逆変換処理を行わずに、修正変換係数d[ ][ ]から予測誤差r[][]を導出する。

　r[x][y] = d[x][y]
　変換スキップを用いない場合(transform_skip_flag==0)、bdShift1を以下の式で導出する。

　log2TransformRange = extended_precision_processing_flag ? BitDepth + NC : 15　(式R-2)
　bdShift1 = BitDepth + rectNonTsFlag +((Log2(nTbW) + Log2(nTbH)) / 2) + 10 - log2TransformRange + sh_dep_quant_used_flag
ここでNCは、ビットレンジ調整用の所定の定数（たとえば、0から10）である。

　bdOffset1 = (1 << bdShift1) >> 1
　次に、逆量子化により得られた変換係数dncを以下の式でクリッピングしd[x][y]を導出する（S2）。

　CoeffMin = -(1 << log2TransformRange)
　CoeffMax = (1 << log2TransformRange) - 1
　このとき、クリッピング後の値域は符号付整数の範囲に制限され、値は(log2TransformRange+1)bitで表現される。以降の(式CLIP-2)でも同じクリッピング値を用いる。

　なお、extended_precision_processing_flag = 1の場合、log2TransformRange= BitDepth + NCであるから、クリッピングの範囲は、BitDepthに依存する。第１の実施形態との違いは、Max(BitDepth + NC, 15)のように、BitDepth + NCと15との最大値を計算しない点である。これにより、第２の実施形態では、BitDepth依存の値とlog2TransformRangeから計算される第１シフト値bdShift1は、BitDepth部分が相殺されて、BitDepth非依存の値となる効果がある。

　bdShift1 = BitDepth + rectNonTsFlag +((Log2(nTbW) + Log2(nTbH)) / 2) + 10 - log2TransformRange + sh_dep_quant_used_flag
　　　　　　= rectNonTsFlag +((Log2(nTbW) + Log2(nTbH)) / 2) + 10 - NC + sh_dep_quant_used_flag
　　bdShift1a = 10 - NC
　以下では、逆非分離変換を行わない場合（lfnst_idx=0）について説明する。

　まず、クリッピング処理した変換係数d[ ][ ]を逆コア変換する。逆コア変換部31123はd[ ][ ]に垂直変換（１回目DCT変換）を行い、第1の中間値e[ ][ ]を導出する（S3）。逆コア変換部31123はe[ ][ ]を中間クリッピングし、第2の中間値g[ ][ ]を導出する（S4）
　g[x][y] = Clip3(CoeffMin, CoeffMax, (e[x][y] + 64) >> 7)　(式CLIP-2)
　上式の64、7は変換基底のビット深度から決まる数値で、上式では変換基底を7bitと仮定している。

　逆コア変換部31123はg[ ][ ]に水平変換（２回目DCT変換）を行い、r[ ][ ]を導出する（S5）。逆コア変換部31123はr[ ][ ]に第２シフト値bdShift2による２回目のシフト処理を行い、予測誤差res[][]を導出する（S6）。

　bdShift2 = trDepth - 1 + log2TransformRange - BitDepth
　(式R-2)により、以下の式が導出される。

　bdShift2 = (extended_precision_processing_flag ? NC + (trDepth - 1): 20 - BitDepth)
なおtrDepth=6の場合には下記式となる。

　bdShift2 = ( extended_precision_processing_flag ? NC + 5: 20 - BitDepth)
　図13は、extended_precision_processing_flag = 1の場合の、変換係数レンジlog2TransformRange、第１シフト値bdShift1a、第２シフト値bdShift2の関係を示す図である。
なお、NC = 5の場合には、下記式となる。

　log2TransformRange = extended_precision_processing_flag ? BitDepth + 5 : 15
　bsShift1 = rectNonTsFlag +((Log2(nTbW) + Log2(nTbH)) / 2) + 5 + sh_dep_quant_used_flag
　bdShift2 = (extended_precision_processing_flag ? 10 : 20 - BitDepth)
　また以下の式であってもよい。

　bdShift2 = extended_precision_processing_flag ? 10 : Max(20 - BitDepth, 0)
　すでに説明したように(式CLIP-1)、(式CLIP-2)のクリッピング値は以下により導出される。以下同様。

　CoeffMin = -(1 << log2TransformRange)
　CoeffMax = (1 << log2TransformRange) - 1
　また、extended_precision_processing_flagが1であるかに応じて、log2TransformRangeがBitDepht+5であるか固定値の15であるかを切り替える以下の式から、bdShift1、bdshift2を導出してもよい。

　log2TransformRange = extended_precision_processing_flag ? BitDepth + 5 : 15
　bdShift1 = BitDepth + 10 - log2TransformRange + rectNonTsFlag + ( ( Log2(nTbW) + Log2(nTbH) ) / 2 ) + sh_dep_quant_used_flag
　bdShift2 = extended_precision_processing_flag ? 10 : Max(20 - bitDepth, 0)
　このように、BitDepth = 10の場合に、bsShift1とbsShift2は、extended_precision_processing_flagに依存しない値となる効果がある。
なお、NC = 6の場合には、以下で導出される。

　log2TransformRange = extended_precision_processing_flag ? BitDepth + 6 : 15
　bsShift1 = rectNonTsFlag +((Log2(nTbW) + Log2(nTbH)) / 2) + 4 + sh_dep_quant_used_flag
　bdShift2 = (extended_precision_processing_flag ? 11 : 20 - BitDepth)
　このように、bsShift1のブロックサイズ、量子化パラメータに依存しない項bdShift1aが0となり最も高い精度とする効果がある。

　第２の実施形態では、extended_precision_processing_flagが１の際に、log2TransformRangeをBitDepthに応じてリニアに増加させることで、bdShift1、bdShift2がBitDepthに依存しない値となる。

　＜まとめ＞
　extended_precision_processing_flag=1の場合、以下のように導出する。

　log2TransformRange = BitDepth + NC
　bdShift1 = rectNonTsFlag +((Log2(nTbW) + Log2(nTbH)) / 2) + 10 - NC + sh_dep_quant_used_flag
　trShift1 = trDepth + 1 = 7
　bdShift2 = NC + trDepth - 1 = NC + 5

　（extended_precision_processing_flagを用いてBitDepth=10の処理を変えない構成の別の例）
　また、逆量子化・逆変換部311（スケーリング部31111、逆コア変換部31123）は、15を下回らない範囲で、BitDepthに応じてlog2TransformRangeを導出し、extended_precision_processing_flagが1の場合に、log2TransformRangeに応じてbdShift1を導出し、それ以外の場合にはBitDepthに応じてbdShift1を導出する構成であってもよい。

　log2TransformRange = Max(BitDepth + 5, 15)
　bdShift1 = extended_precision_processing_flag ? BitDepth + 10 - log2TransformRange : BitDepth - 5 + rectNonTsFlag + ( ( Log2(nTbW) + Log2(nTbH) ) / 2 ) + sh_dep_quant_used_flag
　また、以下の構成であってもよい。

　log2TransformRange = (extended_precision_processing_flag && BitDepth > 10) ? BitDepth + 5 : 15
　bdShift1 = (extended_precision_processing_flag && BitDepth > 10) ? BitDepth + 10 - log2TransformRange : BitDepth - 5 + rectNonTsFlag +((Log2(nTbW) + Log2(nTbH)) / 2) + sh_dep_quant_used_flag
　bdShift2 = Max(20 - BitDepth, 10 )
　または、
　bdShift2 = (extended_precision_processing_flag && BitDepth > 10) ? 10 : 20 - BitDepth

　（変換ブロックのサイズに応じて変換係数の精度をかえる方法）
　以下では、変換ブロックのサイズに応じて、変換の精度をかえる方法を説明する。ここでは、変換ブロックが小さい場合に、スケーリングに用いるシフト値を小さく設定することにより、逆コア変換部31123に入力される変換係数の精度を向上させる。実施形態２と異なる処理について説明する。

　スケーリング部31111は、（S1）では、変換スキップ以外の場合(transform_skip_flag==0)、変換ブロックのサイズ(nTbW, nTbH)に応じて上記bdShift1を以下の式で導出する。つまり、extended_precision_processing_flagが１、かつ、変換ブロックのサイズが所定のサイズ（8x8）以下である場合に、ExtendedPrecisionFlagを１とし、log2TransformRangeとして15以上の値を設定する。ExtendedPrecisionFlagは変換係数の精度を上げるフラグである。

　ExtendedPrecisionFlag = extended_precision_processing_flag && (nTbW <= 8 &&nTbH <= 8)
　　log2TransformRange = ExtendedPrecisionFlag ? BitDepth + NC : 15
　　bdShift1 = BitDepth + rectNonTsFlag +（((Log2(nTbW) + Log2(nTbH)) / 2) + 10 - log2TransformRange + sh_dep_quant_used_flag
　bdOffset1 = (1 << bdShift1) >> 1
　NCは、固定の係数であり4から6の値のいずれかを用いるのが適当である。

　なお、閾値となる所定のサイズは8x8以下に限定されず、他のサイズでもよい。例えば、4x4の場合には、以下の判定式を用いてもよい。

　ExtendedPrecisionFlag = extended_precision_processing_flag && (nTbW <= 4 &&nTbH <= 4)
　また、4x4の変換ブロックに限定してもよい。

　ExtendedPrecisionFlag = extended_precision_processing_flag && (nTbW == 4 &&nTbH == 4)
　また、4x4と8x8の変換ブロックに限定してもよい。

　ExtendedPrecisionFlag = extended_precision_processing_flag && (nTbW == 4 &&nTbH == 4) || (nTbW == 8 &&nTbH == 8)
　また、変換ブロックの幅と高さの和によって判定してもよい。

　ExtendedPrecisionFlag = extended_precision_processing_flag && (nTbW + nTbW <= 16)
　また、パラメータセットのフラグextended_precision_processing_flagを参照せず、ビットデプスと変換のサイズに応じて変換の精度を向上させてもよい。

　ExtendedPrecisionFlag = bitDepth > 10 && (nTbW <= 8 && nTbH <= 8)
この場合もサイズの判定としてはすでに説明した他の方法を用いることができる。

　ExtendedPrecisionFlag = bitDepth > 10 && ( (nTbW <= 4 && nTbH <= 8) || (nTbW <= 4 && nTbH <= 8) )
　逆コア変換部31123は、S6において次式により２回目の変換の後のシフト値bdShift2を導出する。

　bdShift2 = ExtendedPrecisionFlag ? NC + 5 : Max(20 - BitDepth, 0)
　上記の構成によれば、変換ブロックのサイズが所定のサイズ以下の場合にのみ、変換係数の精度を向上させる。つまり、逆量子化におけるシフト値bdShift1を通常の値よりも小さくし、残差の精度bitDepthに戻す２回目の変換の後のシフト値bdShift2を大きくする。また、１回目の変換後に施すクリップの範囲CoeffMin, CoeffMaxを、変換ブロックのサイズが所定のサイズ以下の場合にのみ、大きくする。これによって、分離変換では、変換のサイズが小さい（例えば４から８）場合のみ精度をあげるため、変換にかかる演算の複雑度増加を低減させることができる。つまり、変換サイズ16、32に対する変換の精度や値の範囲を大きくしないことで、精度の向上に伴う複雑度の増加を減らすことができる。

　（変換の種類に応じて変換係数の精度をかえる方法）
　以下、変換の種類に応じて変換係数の精度をかえる方法を説明する。変換ブロックサイズによって変換の精度は変更されない。本実施形態は、（変換ブロックのサイズに応じて、変換の精度をかえる方法）とほぼ同じであるが、extended_precision_processing_flagが１、かつ、変換の種別がDCT2の場合に、ExtendedPrecisionFlagを１と設定し、log2TransformRangeとして15以上の値を設定する。

　ExtendedPrecisionFlag = extended_precision_processing_flag && (mts_idx == 0)
　また、ExtendedPrecisionFlagに応じて、１回目のシフト値bdShift1、２回目のシフト値bdShift2、精度の値log2TransformRange、クリップ値CoeffMin, CoeffMaxを設定する。

　なお、mts_idxの値は、分離変換における１回目の変換（trTypeVerによる変換）と２回目の変換（trTypeHorによる変換）の変換の種別を示す。mts_idx==0は両者ともにDCT2を用いることを示し、上記の判定では、mts_idxが0、つまり変換の種別がDCT2の場合にのみ、変換の精度および変換係数の閾値を向上させる。また、以下の式でもよい。

　ExtendedPrecisionFlag = extended_precision_processing_flag && (trTypeHor == 0) && (trTypeVer == 0)
　また、extended_precision_processing_flagを参照せず、ビットデプスと変換の種別に応じて変換の精度を向上させてもよい。

　ExtendedPrecisionFlag = bitDepth > 10 && (trTypeHor == 0) && (trTypeVer == 0)
　上記の構成によれば、変換精度を向上させる処理をDCT2の変換のみに限定するため、精度の向上に伴う複雑度の増加を減らすことができる。

　（変換ブロックのサイズと変換の種類に応じて変換の精度をかえる方法）
　以下、変換サイズが所定のサイズ以下、かつ、DCT2の場合に変換係数の精度をかえてもよい。

　例えば、以下の構成でもよい。

　ExtendedPrecisionFlag = extended_precision_processing_flag && (nTbW <= 8 &&nTbH <= 8) && (trTypeHor == 0) && (trTypeVer == 0)
　extended_precision_processing_flagによらず、ビットデプスが所定の値（例えば10）より大きく、変換ブロックのサイズが所定の値（例えば8）以上であり、かつ、変換の種別がDCT2の場合に、変換の精度を向上させてもよい。

　ExtendedPrecisionFlag = bitDepth > 10 && (nTbW <= 8 &&nTbH <= 8) && mts_idx == 0
　上記の構成によれば、変換精度を向上させる処理を変換サイズが所定のサイズ以下、かつ、DCT2の変換のみに限定するため、精度の向上に伴う複雑度の増加を減らすことができる。

　（実施形態3）
　上記実施形態では、extended_precision_processing_flagが１の際に、log2TransformRangeにBitDepth依存の値を設定していたが、BitDepth非依存の値を設定してもよい。例えば、extended_precision_processing_flagが１の際のbdShift2をNCとして、クリッピングのレンジの対数値log2TransformRangeをNCに所定の定数（例えば11）を加算した値としてもよい。

　log2TransformRange = extended_precision_processing_flag ? NC + 11 : 15　(式R-3)
　CoeffMin = -(1 << log2TransformRange)
　CoeffMax = (1 << log2TransformRange) - 1
　bdShift1 = rectNonTsFlag +（((Log2(nTbW) + Log2(nTbH)) / 2) + (extended_precision_processing_flag ? 15 - NC : BitDepth - 5） + sh_dep_quant_used_flag)
　bdShift2 = extended_precision_processing_flag ? NC : (20 - BitDepth)
　図14に、本実施形態のクリッピング値、シフト値bdShift1、bdShift2の構成例を示す。
一例としてNC=10にして、以下の設定としてもよい。

　log2TransformRange = extended_precision_processing_flag ? 21 : 15
　CoeffMin = -(1 << log2TransformRange)
　CoeffMax = (1 << log2TransformRange) - 1
　bdShift1 = rectNonTsFlag +((Log2(nTbW) + Log2(nTbH)) / 2) + (extended_precision_processing_flag ? 5: BitDepth - 5） + sh_dep_quant_used_flag
　bdShift2 = extended_precision_processing_flag ? 10 : (20 - BitDepth)

　（実施形態4）
　変換係数のレンジであるlog2TransformRangeに固定の値を設定する別の例を説明する。
例えば、逆量子化・逆変換部311（スケーリング部31111、逆コア変換部31123）は、フラグextended_precision_processing_flagに応じて範囲をある固定値NK (NK>15)と別の固定値（15）とを切り替えてもよい。具体的には、下式であってもよい。

　log2TransformRange = extended_precision_processing_flag ? NK : 15
　CoeffMin = -(1 << log2TransformRange)
　CoeffMax = (1 << log2TransformRange) - 1
　bdShift1 = BitDepth + 10 - log2TransformRange + rectNonTsFlag +((Log2(nTbW) + Log2(nTbH)) / 2) + sh_dep_quant_used_flag
　bdShift2 = 5 + log2TransformRange - BitDepth
　つまり、下式でもよい。

　bdShift1 = BitDepth - (extended_precision_processing_flag ? NK - 10 : 5) + rectNonTsFlag +((Log2(nTbW) + Log2(nTbH)) / 2) + sh_dep_quant_used_flag
　bdShift2 = (extended_precision_processing_flag ? NK + 5 : 20)- BitDepth
　ここで、NK = 18から22の値が好適と考えられる。

　特に、発明者の実験により、NK=20となる場合に、bitDepth=12, 14, 16の実験全てにおいて最も好適な性能が得られることが明らかになっている。したがって、以下の設定としてもよい。

　log2TransformRange = extended_precision_processing_flag ? 20 : 15
　CoeffMin = -(1 << log2TransformRange)
　CoeffMax = (1 << log2TransformRange) - 1
　bdShift1 = BitDepth - (extended_precision_processing_flag ? 10 : 5) + rectNonTsFlag +((Log2(nTbW) + Log2(nTbH)) / 2) + sh_dep_quant_used_flag
　bdShift2 = (extended_precision_processing_flag ? 25 : 20) - BitDepth
　また、固定値を切り替える方法は、extended_precision_processing_flagに限定されず、BitDepthを併用する方法でもよい。例えば12bit以上の場合に、好適な結果となったことから、下式であってもよい。
　log2TransformRange = (extended_precision_processing_flag && BitDepth>=12) ? NK : 15
　CoeffMin = -(1 << log2TransformRange)
　CoeffMax = (1 << log2TransformRange) - 1
　bdShift1 = BitDepth - ((extended_precision_processing_flag && BitDepth>=12) ? NK - 10 : 5) + rectNonTsFlag +((Log2(nTbW) + Log2(nTbH)) / 2) + sh_dep_quant_used_flag
　bdShift2 = ((extended_precision_processing_flag && BitDepth>=12) ? NK + 5 : 20)- BitDepth
また、上記においてNK=18から22、特にNK=20としてもよい。なおビット深度が大きい場合の切り替えはBitDepth>=12に限定されず、BitDepth>10、BitDepth>12を用いてもよい。

　上述の構成によれば、log2TransformRangeは固定値である。従って、(式CLIP-1)、１回目の逆DCTのクリッピング(式CLIP-2)のlog2TransformRangeから導出されるCoeffMin、CoeffMaxも常に固定値となるので、計算が簡略化される。また、10bitを超える場合にも、高い符号化効率を実現できる。

　（動画像符号化装置の構成）
　次に、本実施形態に係る動画像符号化装置11の構成について説明する。図10は、本実施形態に係る動画像符号化装置11の構成を示すブロック図である。動画像符号化装置11は、予測画像生成部101、減算部102、変換・量子化部103、逆量子化・逆変換部105、加算部106、ループフィルタ107、予測パラメータメモリ（予測パラメータ記憶部、フレームメモリ）108、参照ピクチャメモリ（参照画像記憶部、フレームメモリ）109、符号化パラメータ決定部110、パラメータ符号化部111、エントロピー符号化部104を含んで構成される。

　予測画像生成部101は画像Tの各ピクチャを分割した領域であるCU毎に予測画像を生成する。予測画像生成部101は既に説明した予測画像生成部308と同じ動作であり、説明を省略する。

　減算部102は、予測画像生成部101から入力されたブロックの予測画像の画素値を、画像Tの画素値から減算して予測誤差を生成する。減算部102は予測誤差を変換・量子化部103に出力する。

　変換・量子化部103は、減算部102から入力された予測誤差に対し、周波数変換によって変換係数を算出し、量子化によって量子化変換係数を導出する。変換・量子化部103は、量子化変換係数をエントロピー符号化部104及び逆量子化・逆変換部105に出力する。

　変換・量子化部103は、コア変換部（第1の変換部、不図示）と、非分離変換部（第2の変換部、不図示）と、スケーリング部を備えている。

　コア変換部は、transform_skip_flagが０の場合に、予測誤差に対して分離変換（DCT変換もしくはDST変換）を適用する。非分離変換部は、transform_skip_flagが0かつlfnst_idxが0以外の場合に直行変換後の変換係数に対して、１回の変換を適用する。スケーリング部は、分離変換後もしくは非分離変換部後、もしくは変換がスキップされ、変換係数に対して量子化を行う。

　変換・量子化部103は、動画像復号装置の変換・量子化部303に対応する処理を行う。ここでは実施形態１から実施形態３に対応するように以下の式で、log2TransformRangeを導出する。

　実施形態１の式R-1で導出してもよい。

　log2TransformRange = extended_precision_processing_flag ? Max(15, BitDepth + 6 ) : 15
　bdShift1 = BitDepth + rectNonTsFlag +((Log2(nTbW) + Log2(nTbH)) / 2) + 10 - log2TransformRange + sh_dep_quant_used_flag
　bdShift2 = Max(20 - BitDepth, extended_precision_processing_flag ? 11 : 0)
例えば、extended_precision_processing_flag = 0では下式で導出する。

　bdShift1 = BitDepth + rectNonTsFlag +((Log2(nTbW) + Log2(nTbH)) / 2) - 5 + sh_dep_quant_used_flag
　bdShift2 = 20 - BitDepth
extended_precision_processing_flag = 1では下式で導出する。

　bdShift1 = rectNonTsFlag +((Log2(nTbW) + Log2(nTbH)) / 2) + 4 + sh_dep_quant_used_flag
　bdShift2 = 20
　実施形態２の式R-2で導出してもよい。

　log2TransformRange = extended_precision_processing_flag ? BitDepth + TC : 15
　bdShift1 = BitDepth + rectNonTsFlag +((Log2(nTbW) + Log2(nTbH)) / 2) + 10 - log2TransformRange + sh_dep_quant_used_flag
　bdShift2 = (extended_precision_processing_flag ? NC + 5: 20 - BitDepth)
　実施形態３の式R-3で導出してもよい。

　log2TransformRange = extended_precision_processing_flag ? NC + 11 : 15
　log2TransformRange = bdShift2 + BitDepth - (trDepth - 1) = BitDepth + NC - 5
　bdShift1 = rectNonTsFlag +((Log2(nTbW) + Log2(nTbH)) / 2) + (extended_precision_processing_flag ? 15 - NC: BitDepth - 5) + sh_dep_quant_used_flag
　bdShift2 = extended_precision_processing_flag ? NC : (20 - BitDepth)
　上記のlog2TransformRangeを用いてCoeffMin、CoeffMaxを以下の式で導出する。

　CoeffMin = -(1 << log2TransformRange)
　CoeffMax = (1 << log2TransformRange) - 1

　（コア変換部10323）
　コア変換部10323は、水平方向、垂直方向の１次元変換を行う手段である。コア変換部10323は、変換に用いるシフト値とオフセットを以下の式で導出する。

　shiftT1 = Log2 (nTbW) + BitDepth + trDepth - log2TransformRange
　shiftT2 = Log2 (nTbH) + trDepth
　offsetT1 = 1 << (shiftT1 - 1)
　offsetT2 = 1 << (shiftT2 - 1)
　上式のtrDepth は変換基底の精度から決まる数値で、上式ではtrDepth = 6を用いてもよい。

　コア変換部10323は、差分画像d[]からtrTypeHorを用いて変換基底transMatrix[ ][ ]を導出し、transMatrixによる変換とシフト、クリッピング処理を行う。

　e[x][y] = Σ（transMatrix[y][j]×d[x][j]）　　(j = 0..nTbS-1)
　g[x][y] = Clip3(CoeffMin, CoeffMax, (e[x][y] + offsetT1) >> shiftT1)
　コア変換部31123は、trTypeVerを用いて変換基底transMatrix[ ][ ]を導出し、transMatrixによる変換とシフト、クリッピング処理を行う。

　d[x][y] =ΣtransMatrix[x][j]×e[j][y] 　　　(j = 0..nTbS-1)
　dnc[x][y] = Clip3(CoeffMin, CoeffMax, (d[x][y] + offsetT2) >> shiftT2)

　（非分離変換部10321）
　非分離変換部10321は、コア変換部10323による変換後の係数（変換係数）に対して非分離変換を適用する。

　（スケーリング部10311）
　スケーリング部10311は、コア変換もしくは非分離変換後の変換係数dncを変換する。

　スケーリング部10311は、対象TUのサイズ(nTbW,nTbH)から形状に関わる値rectNonTsFlagを導出する。sh_dep_quant_used_flagに応じてqPを調整する。

　rectNonTsFlag = (((Log2(nTbW) + Log2(nTbH)) & 1) == 1 && transform_skip_flag[xTbY][yTbY] == 0)
　qP = sh_dep_quant_used_flag ? qP + 1 : qP
　スケーリング部10311は、以下の処理によりbdShift1Encを導出する。

　transformShift = log2TransformRange - BitDepth -((Log2(nTbW) + Log2(nTbH)) / 2) - sh_dep_quant_used_flag
　bdShift1Enc = 14 + (qP/6) + transformShift
= log2TransformRange - BitDepth -((Log2(nTbW) + Log2(nTbH)) / 2) + (qP/6)- rectNonTsFlag
なお、bdShift1とbdShift1Encの間には以下の関係式を満たす。

　bdShift1Enc = 14 + (qP/6) - bdShift1
画像復号装置で導出したbdShift1に基づいてbdShift1Encを導出してもよい。

　スケーリング部10311は、スケーリングファクタls[][]と復号された変換係数TransCoeffLevelの積からdnc[][]を導出し、逆量子化を行う。

　ls[x][y] = (m[x][y] * quantScale[rectNonTsFlag][qP%6])
　TransCoeffLevel[x][y] = ( dnc [xTbY][yTbY][cIdx][x][y] * ls[x][y] + bdOffset1Enc ) >> bdShift1Enc
　ここでquantScale[] = {{ 26214, 23302, 20560, 18396, 16384, 14564 }, { 18396, 16384, 14564, 13107, 11651, 10280}｝である。

　最後に、スケーリング部10311は、量子化された変換係数をクリッピングしTransCoeffLevel[x][y]を導出する。

　TransCoeffLevel [x][y] = Clip3(CoeffMin, CoeffMax, TransCoeffLevel[x][y])
　逆量子化・逆変換部105は、TransCoeffLevelを逆量子化、逆変換を行い予測誤差を算出する。この動作は、動画像復号装置31における逆量子化・逆変換部311（図8、図9）と同じであり、説明を省略する。算出した予測誤差は加算部106に出力される。

　エントロピー符号化部104には、変換・量子化部103から量子化変換係数が入力され、パラメータ符号化部111から符号化パラメータが入力される。符号化パラメータは、例えば、predModeである。

　エントロピー符号化部104は、分割情報、予測パラメータ、量子化変換係数等をエントロピー符号化して符号化ストリームTeを生成し、出力する。

　パラメータ符号化部111は、図示しないヘッダ符号化部1110、CT情報符号化部1111、CU符号化部1112（予測モード符号化部）、及びインター予測パラメータ符号化部112とイントラ予測パラメータ符号化部113を備えている。CU符号化部1112はさらにTU符号化部1114を備えている。

　以下、各モジュールの概略動作を説明する。パラメータ符号化部111はヘッダ情報、分割情報、予測情報、量子化変換係数等のパラメータの符号化処理を行う。

　CT情報符号化部1111は、符号化データからQT、MT（BT、TT）分割情報等を符号化する。

　CU符号化部1112はCU情報、予測情報、TU分割フラグ、CU残差フラグ等を符号化する。

　TU符号化部1114は、TUに予測誤差が含まれている場合に、QP更新情報（量子化補正値）と量子化予測誤差（residual_coding）を符号化する。

　CT情報符号化部1111、CU符号化部1112は、インター予測パラメータ、イントラ予測パラメータ（intra_luma_mpm_flag、intra_luma_mpm_idx、intra_luma_mpm_remainder）、量子化変換係数等のシンタックス要素をエントロピー符号化部104に供給する。

　（イントラ予測パラメータ符号化部113の構成）
　イントラ予測パラメータ符号化部113は、符号化パラメータ決定部110から入力されたIntraPredModeから、符号化するための形式（例えばintra_luma_mpm_idx、intra_luma_mpm_remainder等）を導出する。イントラ予測パラメータ符号化部113は、イントラ予測パラメータ復号部304がイントラ予測パラメータを導出する構成と、一部同一の構成を含む。

　イントラ予測パラメータ符号化部113は、パラメータ符号化制御部1131、輝度イントラ予測パラメータ導出部1132、色差イントラ予測パラメータ導出部1133を含んで構成される。

　パラメータ符号化制御部1131には、符号化パラメータ決定部110からIntraPredModeY及びIntraPredModeCが入力される。パラメータ符号化制御部1131はMPM候補リスト導出部30421のmpmCandList[]を参照して、intra_luma_mpm_flagを決定する。そして、intra_luma_mpm_flagとIntraPredModeYを、輝度イントラ予測パラメータ導出部1132に出力する。また、IntraPredModeCを色差イントラ予測パラメータ導出部1133に出力する。

　輝度イントラ予測パラメータ導出部1132は、MPM候補リスト導出部30421（候補リスト導出部）と、MPMパラメータ導出部11322と、非MPMパラメータ導出部11323（符号化部、導出部）とを含んで構成される。

　MPM候補リスト導出部30421は、予測パラメータメモリ108に格納された隣接ブロックのイントラ予測モードを参照して、mpmCandList[]を導出する。MPMパラメータ導出部11322は、intra_luma_mpm_flagが1の場合に、IntraPredModeYとmpmCandList[]からintra_luma_mpm_idxを導出し、エントロピー符号化部104に出力する。非MPMパラメータ導出部11323は、intra_luma_mpm_flagが0の場合に、IntraPredModeYとmpmCandList[]からRemIntraPredModeを導出し、intra_luma_mpm_remainderをエントロピー符号化部104に出力する。

　色差イントラ予測パラメータ導出部1133は、IntraPredModeYとIntraPredModeCからintra_chroma_pred_modeを導出し、出力する。

　加算部106は、予測画像生成部101から入力されたブロックの予測画像の画素値と逆量子化・逆変換部105から入力された予測誤差を画素毎に加算して復号画像を生成する。加算部106は生成した復号画像を参照ピクチャメモリ109に記憶する。

　ループフィルタ107は加算部106が生成した復号画像に対し、デブロッキングフィルタ、SAO、ALFを施す。なお、ループフィルタ107は、必ずしも上記３種類のフィルタを含まなくてもよく、例えばデブロッキングフィルタのみの構成であってもよい。

　予測パラメータメモリ108は、符号化パラメータ決定部110が生成した予測パラメータを、対象ピクチャ及びCU毎に予め定めた位置に記憶する。

　参照ピクチャメモリ109は、ループフィルタ107が生成した復号画像を対象ピクチャ及びCU毎に予め定めた位置に記憶する。

　符号化パラメータ決定部110は、符号化パラメータの複数のセットのうち、1つのセットを選択する。符号化パラメータとは、上述したQT、BTあるいはTT分割情報、予測パラメータ、あるいはこれらに関連して生成される符号化の対象となるパラメータである。予測画像生成部101は、これらの符号化パラメータを用いて予測画像を生成する。

　符号化パラメータ決定部110は、複数のセットの各々について情報量の大きさと符号化誤差を示すRDコスト値を算出する。符号化パラメータ決定部110は、算出したコスト値が最小となる符号化パラメータのセットを選択する。これにより、エントロピー符号化部104は、選択した符号化パラメータのセットを符号化ストリームTeとして出力する。符号化パラメータ決定部110は決定した符号化パラメータを予測パラメータメモリ108に記憶する。

　なお、上述した実施形態における動画像符号化装置11、動画像復号装置31の一部、例えば、エントロピー復号部301、パラメータ復号部302、ループフィルタ305、予測画像生成部308、逆量子化・逆変換部311、加算部312、予測画像生成部101、減算部102、変換・量子化部103、エントロピー符号化部104、逆量子化・逆変換部105、ループフィルタ107、符号化パラメータ決定部110、パラメータ符号化部111をコンピュータで実現するようにしてもよい。その場合、この制御機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。なお、ここでいう「コンピュータシステム」とは、動画像符号化装置11、動画像復号装置31の何れかに内蔵されたコンピュータシステムであって、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムに既に記録されているプログラムとの組み合わせで実現できるものであってもよい。

　また、上述した実施形態における動画像符号化装置11、動画像復号装置31の一部、又は全部を、LSI（Large Scale Integration）等の集積回路として実現してもよい。動画像符号化装置11、動画像復号装置31の各機能ブロックは個別にプロセッサ化してもよいし、一部、又は全部を集積してプロセッサ化してもよい。また、集積回路化の手法はＬＳＩに限らず専用回路、又は汎用プロセッサで実現してもよい。また、半導体技術の進歩によりＬＳＩに代替する集積回路化の技術が出現した場合、当該技術による集積回路を用いてもよい。

　以上、図面を参照してこの発明の一実施形態について詳しく説明してきたが、具体的な構成は上述のものに限られることはなく、この発明の要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。

　〔応用例〕
　上述した動画像符号化装置11及び動画像復号装置31は、動画像の送信、受信、記録、再生を行う各種装置に搭載して利用することができる。なお、動画像は、カメラ等により撮像された自然動画像であってもよいし、コンピュータ等により生成された人工動画像（CG及びGUIを含む）であってもよい。

　まず、上述した動画像符号化装置11及び動画像復号装置31を、動画像の送信及び受信に利用できることを、図2を参照して説明する。

　図2には、動画像符号化装置11を搭載した送信装置PROD_Aの構成を示したブロック図が示されている。図に示すように、送信装置PROD_Aは、動画像を符号化することによって符号化データを得る符号化部PROD_A1と、符号化部PROD_A1が得た符号化データで搬送波を変調することによって変調信号を得る変調部PROD_A2と、変調部PROD_A2が得た変調信号を送信する送信部PROD_A3と、を備えている。上述した動画像符号化装置11は、この符号化部PROD_A1として利用される。

　送信装置PROD_Aは、符号化部PROD_A1に入力する動画像の供給源として、動画像を撮像するカメラPROD_A4、動画像を記録した記録媒体PROD_A5、動画像を外部から入力するための入力端子PROD_A6、及び、画像を生成又は加工する画像処理部A7を更に備えていてもよい。図においては、これら全てを送信装置PROD_Aが備えた構成を例示しているが、一部を省略しても構わない。

　なお、記録媒体PROD_A5は、符号化されていない動画像を記録したものであってもよいし、伝送用の符号化方式とは異なる記録用の符号化方式で符号化された動画像を記録したものであってもよい。後者の場合、記録媒体PROD_A5と符号化部PROD_A1との間に、記録媒体PROD_A5から読み出した符号化データを記録用の符号化方式に従って復号する復号部（不図示）を介在させるとよい。

　また、図2には、動画像復号装置31を搭載した受信装置PROD_Bの構成を示したブロック図が示されている。図に示すように、受信装置PROD_Bは、変調信号を受信する受信部PROD_B1と、受信部PROD_B1が受信した変調信号を復調することによって符号化データを得る復調部PROD_B2と、復調部PROD_B2が得た符号化データを復号することによって動画像を得る復号部PROD_B3と、を備えている。上述した動画像復号装置31は、この復号部PROD_B3として利用される。

　受信装置PROD_Bは、復号部PROD_B3が出力する動画像の供給先として、動画像を表示するディスプレイPROD_B4、動画像を記録するための記録媒体PROD_B5、及び、動画像を外部に出力するための出力端子PROD_B6を更に備えていてもよい。図においては、これら全てを受信装置PROD_Bが備えた構成を例示しているが、一部を省略しても構わない。

　なお、記録媒体PROD_B5は、符号化されていない動画像を記録するためのものであってもよいし、伝送用の符号化方式とは異なる記録用の符号化方式で符号化されたものであってもよい。後者の場合、復号部PROD_B3と記録媒体PROD_B5との間に、復号部PROD_B3から取得した動画像を記録用の符号化方式に従って符号化する符号化部（不図示）を介在させるとよい。

　なお、変調信号を伝送する伝送媒体は、無線であってもよいし、有線であってもよい。また、変調信号を伝送する伝送態様は、放送（ここでは、送信先が予め特定されていない送信態様を指す）であってもよいし、通信（ここでは、送信先が予め特定されている送信態様を指す）であってもよい。すなわち、変調信号の伝送は、無線放送、有線放送、無線通信、及び有線通信の何れによって実現してもよい。

　例えば、地上デジタル放送の放送局（放送設備等）／受信局（テレビジョン受像機等）は、変調信号を無線放送で送受信する送信装置PROD_A／受信装置PROD_Bの一例である。また、ケーブルテレビ放送の放送局（放送設備等）／受信局（テレビジョン受像機等）は、変調信号を有線放送で送受信する送信装置PROD_A／受信装置PROD_Bの一例である。

　また、インターネットを用いたVOD（Video On Demand）サービスや動画共有サービス等のサーバ（ワークステーション等）／クライアント（テレビジョン受像機、パーソナルコンピュータ、スマートフォン等）は、変調信号を通信で送受信する送信装置PROD_A／受信装置PROD_Bの一例である（通常、ＬＡＮにおいては伝送媒体として無線又は有線の何れかが用いられ、ＷＡＮにおいては伝送媒体として有線が用いられる）。ここで、パーソナルコンピュータには、デスクトップ型PC、ラップトップ型PC、及びタブレット型PCが含まれる。また、スマートフォンには、多機能携帯電話端末も含まれる。

　なお、動画共有サービスのクライアントは、サーバからダウンロードした符号化データを復号してディスプレイに表示する機能に加え、カメラで撮像した動画像を符号化してサーバにアップロードする機能を有している。すなわち、動画共有サービスのクライアントは、送信装置PROD_A及び受信装置PROD_Bの双方として機能する。

　次に、上述した動画像符号化装置11及び動画像復号装置31を、動画像の記録及び再生に利用できることを、図3を参照して説明する。

　図3には、上述した動画像符号化装置11を搭載した記録装置PROD_Cの構成を示したブロック図が示されている。図に示すように、記録装置PROD_Cは、動画像を符号化することによって符号化データを得る符号化部PROD_C1と、符号化部PROD_C1が得た符号化データを記録媒体PROD_Mに書き込む書込部PROD_C2と、を備えている。上述した動画像符号化装置11は、この符号化部PROD_C1として利用される。

　なお、記録媒体PROD_Mは、（１）HDD（Hard Disk Drive）やSSD(Solid State Drive)等のように、記録装置PROD_Cに内蔵されるタイプのものであってもよいし、（２）SDメモリカードやUSB（Universal Serial Bus）フラッシュメモリ等のように、記録装置PROD_Cに接続されるタイプのものであってもよいし、（３）DVD（Digital Versatile Disc:登録商標）やBD（Blu-ray Disc:登録商標）等のように、記録装置PROD_Cに内蔵されたドライブ装置（不図示）に装填されるものであってもよい。

　また、記録装置PROD_Cは、符号化部PROD_C1に入力する動画像の供給源として、動画像を撮像するカメラPROD_C3、動画像を外部から入力するための入力端子PROD_C4、動画像を受信するための受信部PROD_C5、及び、画像を生成又は加工する画像処理部PROD_C6を更に備えていてもよい。図においては、これら全てを記録装置PROD_Cが備えた構成を例示しているが、一部を省略しても構わない。

　なお、受信部PROD_C5は、符号化されていない動画像を受信するものであってもよいし、記録用の符号化方式とは異なる伝送用の符号化方式で符号化された符号化データを受信するものであってもよい。後者の場合、受信部PROD_C5と符号化部PROD_C1との間に、伝送用の符号化方式で符号化された符号化データを復号する伝送用復号部（不図示）を介在させるとよい。

　このような記録装置PROD_Cとしては、例えば、DVDレコーダ、BDレコーダ、HDD（Hard Disk Drive）レコーダ等が挙げられる（この場合、入力端子PROD_C4又は受信部PROD_C5が動画像の主な供給源となる）。また、カムコーダ（この場合、カメラPROD_C3が動画像の主な供給源となる）、パーソナルコンピュータ（この場合、受信部PROD_C5又は画像処理部C6が動画像の主な供給源となる）、スマートフォン（この場合、カメラPROD_C3又は受信部PROD_C5が動画像の主な供給源となる）等も、このような記録装置PROD_Cの一例である。

　また、図3には、上述した動画像復号装置31を搭載した再生装置PROD_Dの構成を示したブロック図が示されている。図に示すように、再生装置PROD_Dは、記録媒体PROD_Mに書き込まれた符号化データを読み出す読出部PROD_D1と、読出部PROD_D1が読み出した符号化データを復号することによって動画像を得る復号部PROD_D2と、を備えている。上述した動画像復号装置31は、この復号部PROD_D2として利用される。

　なお、記録媒体PROD_Mは、（１）HDDやSSD等のように、再生装置PROD_Dに内蔵されるタイプのものであってもよいし、（２）SDメモリカードやUSBフラッシュメモリ等のように、再生装置PROD_Dに接続されるタイプのものであってもよいし、（３）DVDやBD等のように、再生装置PROD_Dに内蔵されたドライブ装置（不図示）に装填されるものであってもよい。

　また、再生装置PROD_Dは、復号部PROD_D2が出力する動画像の供給先として、動画像を表示するディスプレイPROD_D3、動画像を外部に出力するための出力端子PROD_D4、及び、動画像を送信する送信部PROD_D5を更に備えていてもよい。図においては、これら全てを再生装置PROD_Dが備えた構成を例示しているが、一部を省略しても構わない。

　なお、送信部PROD_D5は、符号化されていない動画像を送信するものであってもよいし、記録用の符号化方式とは異なる伝送用の符号化方式で符号化された符号化データを送信するものであってもよい。後者の場合、復号部PROD_D2と送信部PROD_D5との間に、動画像を伝送用の符号化方式で符号化する符号化部（不図示）を介在させるとよい。

　このような再生装置PROD_Dとしては、例えば、DVDプレイヤ、BDプレイヤ、HDDプレイヤ等が挙げられる（この場合、テレビジョン受像機等が接続される出力端子PROD_D4が動画像の主な供給先となる）。また、テレビジョン受像機（この場合、ディスプレイPROD_D3が動画像の主な供給先となる）、デジタルサイネージ（電子看板や電子掲示板等とも称され、ディスプレイPROD_D3又は送信部PROD_D5が動画像の主な供給先となる）、デスクトップ型PC（この場合、出力端子PROD_D4又は送信部PROD_D5が動画像の主な供給先となる）、ラップトップ型又はタブレット型PC（この場合、ディスプレイPROD_D3又は送信部PROD_D5が動画像の主な供給先となる）、スマートフォン（この場合、ディスプレイPROD_D3又は送信部PROD_D5が動画像の主な供給先となる）等も、このような再生装置PROD_Dの一例である。

　（ハードウェア的実現及びソフトウェア的実現）
　また、上述した動画像復号装置31及び動画像符号化装置11の各ブロックは、集積回路（ICチップ）上に形成された論理回路によってハードウェア的に実現してもよいし、CPU（Central Processing Unit）を用いてソフトウェア的に実現してもよい。

　後者の場合、上記各装置は、各機能を実現するプログラムの命令を実行するCPU、上記プログラムを格納したROM（Read Only Memory）、上記プログラムを展開するRAM（Random Access Memory）、上記プログラム及び各種データを格納するメモリ等の記憶装置（記録媒体）等を備えている。そして、本発明の実施形態の目的は、上述した機能を実現するソフトウェアである上記各装置の制御プログラムのプログラムコード（実行形式プログラム、中間コードプログラム、ソースプログラム）をコンピュータで読み取り可能に記録した記録媒体を、上記各装置に供給し、そのコンピュータ（又はCPUやMPU）が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。

　上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ類、フロッピー（登録商標）ディスク／ハードディスク等の磁気ディスクやCD-ROM（Compact Disc Read-Only Memory）／MOディスク（Magneto-Optical disc）／MD（Mini Disc）／DVD（Digital Versatile Disc:登録商標）／CD-R（CD Recordable）／ブルーレイディスク（Blu-ray Disc：登録商標）等の光ディスクを含むディスク類、ICカード（メモリカードを含む）／光カード等のカード類、マスクROM／EPROM（Erasable Programmable Read-Only Memory）／EEPROM（Electrically Erasable and Programmable Read-Only Memory：登録商標）／フラッシュROM等の半導体メモリ類、あるいはPLD（Programmable logic device）やFPGA（Field Programmable Gate Array）等の論理回路類等を用いることができる。

　また、上記各装置を通信ネットワークと接続可能に構成し、上記プログラムコードを通信ネットワークを介して供給してもよい。この通信ネットワークは、プログラムコードを伝送可能であればよく、特に限定されない。例えば、インターネット、イントラネット、エキストラネット、LAN（Local Area Network）、ISDN（Integrated Services Digital Network）、VAN（Value-Added Network）、CATV（Community Antenna television/Cable Television）通信網、仮想専用網（Virtual Private Network）、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、この通信ネットワークを構成する伝送媒体も、プログラムコードを伝送可能な媒体であればよく、特定の構成又は種類のものに限定されない。例えば、IEEE（Institute of Electrical and Electronic Engineers）1394、USB、電力線搬送、ケーブルＴＶ回線、電話線、ADSL（Asymmetric Digital Subscriber Line）回線等の有線でも、IrDA（Infrared Data Association）やリモコンのような赤外線、BlueTooth（登録商標）、IEEE802.11無線、HDR（High Data Rate）、NFC（Near Field Communication）、DLNA（Digital Living Network Alliance：登録商標）、携帯電話網、衛星回線、地上デジタル放送網等の無線でも利用可能である。なお、本発明の実施形態は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。

　本発明の実施形態は上述した実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能である。すなわち、請求項に示した範囲で適宜変更した技術的手段を組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。

　本発明の一態様は、画像データが符号化された符号化データを復号する動画像復号装置、及び、画像データが符号化された符号化データを生成する動画像符号化装置に好適に適用することができる。また、動画像符号化装置によって生成され、動画像復号装置によって参照される符号化データのデータ構造に好適に適用することができる。

Claims

　シーケンスパラメータセットSPSにて、高精度符号化モードを示すフラグを復号するヘッダ復号部と、
　変換ブロック毎に変換係数に対して逆量子化を行うスケーリング処理部と、
　逆変換を行う逆変換部とを備える動画像復号装置であって、
　上記スケーリング処理部は、上記フラグと上記変換ブロックのサイズに基づいて、変換係数のレンジを示す変数をビットデプスに依存するか、ビットデプスに依存しないかを切り替えることを特徴とする動画像復号装置。
　上記スケーリング処理部は、上記変換係数のレンジを示す変数に基づいてスケーリングのシフト値bdShift1を切り替え、
　上記逆変換部は、上記変換ブロックのサイズに基づいて、変換後に用いるシフト値bdShift2を切り替えることを特徴とする請求項１に記載の動画像復号装置。
　シーケンスパラメータセットSPSにて、高精度符号化モードを示すフラグを符号化するヘッダ符号化部と、
　変換ブロック毎に変換係数に対して量子化を行うスケーリング処理部と、
　変換を行う変換部とを備える動画像符号化装置であって、
　上記スケーリング処理部は、上記フラグと上記変換ブロックのサイズに基づいて、変換係数のレンジを示す変数をビットデプスに依存するか、ビットデプスに依存しないかを切り替えることを特徴とする動画像符号化装置。