WO2025069744A1

WO2025069744A1 - 画像符号化装置、画像符号化方法、画像復号装置、画像復号方法、コンピュータプログラム

Info

Publication number: WO2025069744A1
Application number: PCT/JP2024/028745
Authority: WO
Inventors: 真悟志摩
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2023-09-28
Filing date: 2024-08-09
Publication date: 2025-04-03
Anticipated expiration: 2026-03-28
Also published as: JP2025058743A

Abstract

画像における符号化対象の所定のサイズの着目ブロックに対し、符号化済みの画素から予測画像を生成し、着目ブロックと予測画像との差分である予測誤差を導出し、予測誤差を周波数変換し、周波数変換によって得られた直交変換係数を量子化する。そして、量子化された直交変換係数をエントロピー符号化し、量子化された直交変換係数を逆量子化して再生直交変換係数を生成する。再生直交変換係数は補正される。

Description

画像符号化装置、画像符号化方法、画像復号装置、画像復号方法、コンピュータプログラム

　本発明は、画像符号化装置、画像符号化方法、画像復号装置、画像復号方法、コンピュータプログラムに関する。

　動画像の圧縮記録のための符号化方式として、ＶＶＣ（Ｖｅｒｓａｔｉｌｅ　Ｖｉｄｅｏ　Ｃｏｄｉｎｇ）符号化方式（以下、ＶＶＣと記す）が知られている。ＶＶＣでは符号化効率向上のため、最大１２８画素ｘ１２８画素のサイズの基本ブロックを、従来の正方形だけでなく長方形の形状のサブブロックに分割する。

　また、ＶＶＣにおいては、直交変換を施した後の係数（以下、直交変換係数と記す）を、量子化マトリクスを用いて、周波数成分に応じて重み付けをする処理が用いられている。人間の視覚には劣化が目立ちにくい高周波成分のデータをより削減することで、画質を維持しながら圧縮効率を高めることが可能となっている。特許文献１には、このような量子化マトリクスを符号化する技術が開示されている。

　近年、ＶＶＣを標準化したＪＶＥＴ（Ｊｏｉｎｔ　Ｖｉｄｅｏ　Ｅｘｐｅｒｔｓ　Ｔｅａｍ）では、ＶＶＣを上回る圧縮効率を実現するための技術検討が進められている。符号化効率向上のため、逆量子化処理により生成された直交変換係数（以下、再生直交変換係数と記す）に対し、補正値を加算する新たな逆量子化方法（以下、逆量子化補正と呼称する）が検討されている。

特開２０１３－３８７５８号公報

　この逆量子化補正は、再生直交変換係数に補正値を加算する処理であるが、量子化マトリクスの使用の有無に関わらず所定の補正値を加算する処理となっている。このため、量子化マトリクスを使用した逆量子化処理により生成された再生直交変換係数に対しては、適切な補正値の加算処理を行うことができず、圧縮効率を向上させることができないという問題がある。

　本発明は、量子化マトリクスを用いた逆量子化処理により生成された再生直交変換係数に対しても適切な補正値が加算できるような制御を可能とし、圧縮効率を向上させるための技術を提供する。

　本発明の一様態は、画像をブロック単位で符号化する画像符号化装置であって、画像における符号化対象の所定のサイズの着目ブロックに対し、符号化済みの画素から予測画像を生成し、前記着目ブロックと前記予測画像との差分である予測誤差を導出する予測手段と、前記予測手段で導出した前記予測誤差を周波数変換する変換手段と、前記変換手段による周波数変換によって得られた直交変換係数を量子化する量子化手段と、前記量子化手段により量子化された直交変換係数をエントロピー符号化する符号化手段と、前記量子化手段により量子化された直交変換係数を逆量子化して再生直交変換係数を生成する逆量子化手段とを有し、前記逆量子化手段は前記再生直交変換係数を補正することを特徴とする。

　本発明によれば、量子化マトリクスを用いた逆量子化処理により生成された再生直交変換係数に対しても適切な補正値が加算できるような制御を可能とし、圧縮効率を向上させるための技術を提供することができる。

　本発明のその他の特徴及び利点は、添付図面を参照とした以下の説明により明らかになるであろう。なお、添付図面においては、同じ若しくは同様の構成には、同じ参照番号を付す。

　添付図面は明細書に含まれ、その一部を構成し、本発明の実施の形態を示し、その記述と共に本発明の原理を説明するために用いられる。
画像符号化装置の機能構成例を示すブロック図。画像復号装置の機能構成例を示すブロック図。画像符号化装置が１フレーム分の入力画像を符号化するために行う処理のフローチャート。画像復号装置が１フレーム分のビットストリームを復号するために行う処理のフローチャート。画像符号化装置や画像復号装置に適用可能なコンピュータ装置のハードウェア構成例を示すブロック図。ビットストリームのデータ構造の一例を示す図。ビットストリームのデータ構造の一例を示す図。サブブロックの分割パターンの例を示す図。サブブロックの分割パターンの例を示す図。サブブロックの分割パターンの例を示す図。サブブロックの分割パターンの例を示す図。サブブロックの分割パターンの例を示す図。サブブロックの分割パターンの例を示す図。量子化マトリクス８００の構成例を示す図。量子化マトリクス８００の構成例を示す図。量子化マトリクス８００の構成例を示す図。走査方法を示す図。１次元の差分行列の構成例を示す図。１次元の差分行列の構成例を示す図。１次元の差分行列の構成例を示す図。符号化テーブルの構成例を示す図。符号化テーブルの構成例を示す図。イントラ・インター混在予測で用いられる領域分割の一例を示す図。イントラ・インター混在予測で用いられる領域分割の一例を示す図。

　以下、添付図面を参照して実施形態を詳しく説明する。なお、以下の実施形態は特許請求の範囲に係る発明を限定するものではない。実施形態には複数の特徴が記載されているが、これらの複数の特徴の全てが発明に必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一若しくは同様の構成に同一の参照番号を付し、重複した説明は省略する。

　［第１の実施形態］
　先ず、本実施形態に係る画像符号化装置の機能構成例について、図１のブロック図を用いて説明する。画像符号化装置には、ＰＣ（パーソナルコンピュータ）、スマートフォン、タブレット端末装置、撮像装置、画像処理専用回路などを適用することができる。

　画像符号化装置は入力部１０１を介して、符号化対象となる画像を入力画像として取得する。画像符号化装置が入力画像を取得するための方法については特定の方法に限らない。たとえば、画像符号化装置は、撮像装置から出力された画像（動画像における各フレームの画像、定期的もしくは不定期的に撮像された静止画像など）を入力画像として取得してもよい。なお、画像符号化装置と撮像装置とが一体化されている場合には、画像符号化装置は、自身が有する撮像装置により撮像された画像を入力画像として取得することになる。またたとえば、画像符号化装置はＬＡＮやインターネットなどのネットワークを介して、サーバ装置などの外部装置に保持されている画像を入力画像として取得するようにしてもよい。またたとえば、画像符号化装置は、自身が有する記憶装置に保持されている画像を入力画像として取得するようにしてもよい。

　ブロック分割部１０２は、入力画像を複数の基本ブロック（以下、適宜、単にブロックとも称する）に分割する。量子化マトリクス保持部１０３は、量子化処理に用いる複数の量子化マトリクスを取得して保持する。量子化マトリクス保持部１０３が量子化マトリクスを取得するための方法は特定の方法に限らない。たとえば、量子化マトリクス保持部１０３は、ユーザが不図示の操作部を操作して入力した量子化マトリクスを取得してもよいし、入力画像の特性から量子化マトリクスを算出してもよいし、初期値として予め指定された量子化マトリクスを取得するようにしてもよい。本実施形態では、量子化マトリクス保持部１０３は、図８Ａ～８Ｃに例示する３種類の「８画素ｘ８画素の直交変換（周波数変換）に対応した２次元の量子化マトリクス８００」を取得して保持する。

　逆量子化補正制御部１１４は、後段の逆量子化・逆変換部１０６において実行される逆量子化補正処理を制御するための情報である逆量子化補正制御情報を取得する。逆量子化補正制御部１１４が逆量子化補正制御情報を取得するための方法は特定の方法に限らない。たとえば、逆量子化補正制御部１１４は、ユーザが不図示の操作部を操作して入力した逆量子化補正制御情報を取得してもよいし、入力画像の特性に基づいて逆量子化補正制御情報を算出してもよい。またたとえば、逆量子化補正制御部１１４は、予め初期値として設定された逆量子化補正制御情報を画像符号化装置内のメモリもしくは画像符号化装置外のメモリから取得してもよい。

　予測部１０４は、ブロック分割部１０２によって分割されたそれぞれの基本ブロックについて、該基本ブロックを１以上のサブブロックに分割し、該サブブロックに対してフレーム内予測であるイントラ予測やフレーム間予測であるインター予測などの予測処理を行うことで該サブブロックに対応する予測画像を生成し、該サブブロックと該予測画像との差分（誤差）を予測誤差として導出する。また、予測部１０４は、予測に必要な情報（例えばサブブロック分割、予測モードや動きベクトル等の情報）を予測情報として出力する。

　変換・量子化部１０５は、サブブロックに対応する予測誤差を直交変換（周波数変換）することで該サブブロックに対応する直交変換係数を生成し、該直交変換係数を、量子化マトリクス保持部１０３が保持する量子化マトリクスを用いて量子化することで量子化係数を生成する。なお、一例として、直交変換を行う構成と、量子化を行う構成とを１つのブロックで表現している。しかし、直交変換を行う構成と、量子化を行う構成とは別にしてもよい。

　逆量子化・逆変換部１０６は、変換・量子化部１０５によって生成された量子化係数を、量子化マトリクス保持部１０３が保持する量子化マトリクスを用いて逆量子化することで再生直交変換係数を生成する。そして逆量子化・逆変換部１０６は、該生成した再生直交変換係数を、逆量子化補正制御部１１４が取得した逆量子化補正制御情報に基づいて補正し、該補正した再生直交変換係数を逆直交変換することで予測誤差を生成（再生）する。なお、一例として、逆量子化を行う構成と逆直交変換を行う構成とを１つのブロックで表現している。しかし、逆量子化を行う構成と、逆変換を行う構成とは別にしてもよい。

　画像再生部１０７は、予測部１０４から出力された予測情報に基づいてフレームメモリ１０８を適宜参照して予測画像を生成し、該予測画像と、逆量子化・逆変換部１０６によって生成（再生）された予測誤差と、から再生画像を生成し、該再生画像をフレームメモリ１０８に格納する。

　インループフィルタ部１０９は、フレームメモリ１０８に格納された再生画像に対して、デブロッキングフィルタやサンプルアダプティブオフセットなどのインループフィルタ処理を行う。

　符号化部１１０は、変換・量子化部１０５によって生成された量子化係数、予測部１０４から出力された予測情報、を符号化することで符号データを生成する。量子化マトリクス符号化部１１３は、量子化マトリクス保持部１０３が保持している量子化マトリクスを符号化することで符号データを生成する。

　統合符号化部１１１は、逆量子化補正制御部１１４が取得した逆量子化補正制御情報などの、画像データの符号化に必要なヘッダ情報と、量子化マトリクス符号化部１１３によって生成された符号データと、を用いてヘッダ符号データを生成する。さらに統合符号化部１１１は、該生成したヘッダ符号化データに、符号化部１１０によって生成された符号データを結合することでビットストリームを生成し、該生成したビットストリームを出力部１１２を介して外部に出力する。なお、ビットストリームの出力先は特定の出力先に限らない。たとえば、統合符号化部１１１はビットストリームを出力部１１２を介して外部の装置（たとえば、メモリ装置やサーバ装置）に対して出力（送信）してもよいし、該ビットストリームを画像符号化装置内のメモリに格納してもよい。制御部１５０は、上記の各機能部を含む、画像符号化装置全体の動作制御を行う。

　次に、図１に示した機能構成における画像符号化装置の動作について説明する。逆量子化補正制御部１１４は、逆量子化補正制御情報を取得する。逆量子化補正制御情報の値と、逆量子化補正処理と、の関係については後述する。

　量子化マトリクス保持部１０３は、複数の量子化マトリクスを取得して保持するのであるが、量子化マトリクスは、サブブロックのサイズや予測方法の種類に応じて生成される。本実施形態では量子化マトリクス保持部１０３は上記の如く、図８Ａ～８Ｃに示された８画素ｘ８画素のサイズのサブブロックに対応する、８画素ｘ８画素のサイズの量子化マトリクス８００を生成するものとする。

　図８Ａの量子化マトリクス８００は、イントラ予測に対応する量子化マトリクスの一例を示している。図８Ｂの量子化マトリクス８００は、インター予測に対応する量子化マトリクスの一例を示している。図８Ｃの量子化マトリクス８００は、イントラ・インター混在予測に対応する量子化マトリクスの一例を示している。図８に示す如く、量子化マトリクスは８個ｘ８個の要素（量子化ステップ値）で構成される。本実施形態では、図８Ａ～８Ｃに示された３種類の量子化マトリクスが二次元配列として量子化マトリクス保持部１０３に保持されているケースについて説明するが、量子化マトリクス内の各要素はこれに限定されない。また、サブブロックのサイズによって、あるいは符号化対象が輝度ブロックか色差ブロックかによって、同じ予測方法に対して複数の量子化マトリクスを保持することも可能である。一般的に、量子化マトリクスは人間の視覚特性に応じた量子化処理を実現するため、図８Ａ～８Ｃに示すように量子化マトリクスの左上隅部分に相当する直流成分用の要素は小さく、右下部分に相当する交流成分の要素は大きくなっている。

　ただし、生成される量子化マトリクスはこれに限定されず、たとえば、４画素ｘ８画素、８画素ｘ４画素、４画素ｘ４画素など、サブブロックの形状に対応した量子化マトリクスが生成されてもよい。量子化マトリクスにおける各要素の決定方法は特に限定しない。例えば、量子化マトリクスにおける各要素には所定の初期値を用いてもよいし、量子化マトリクスにおける各要素は個別に設定してもよいし、画像の特性に応じて生成されても構わない。

　量子化マトリクス符号化部１１３は、二次元配列として量子化マトリクス保持部１０３に保持されている量子化マトリクスを順に読み出し、該量子化マトリクスにおける各要素を走査して差分を計算し、一次元の行列（差分行列）に配置する。本実施形態では、図８Ａ～８Ｃに示された各量子化マトリクス８００における要素を図９に示す如く矢印で示す順序で走査する走査方法を用い、要素ごとに走査順に直前の要素との差分を計算する。例えば図８Ｃで示された８画素ｘ８画素の量子化マトリクス８００は図９で示された走査方法によって走査されるが、左上隅に位置する最初の要素「８」の次は、そのすぐ下に位置する要素「１１」が走査され、差分である「＋３」が計算される。また、量子化マトリクスの最初の要素（図８Ｃの例では「８」の符号化には所定の初期値（例えば「８」）との差分を計算するものとするが、もちろんこれに限定されず、任意の値との差分や、最初の要素の値そのものを用いてもよい。

　このようにして、本実施形態では、図８Ａ～８Ｃのそれぞれの量子化マトリクス８００は、図９の走査方法を用い、図１０Ａ～１０Ｃに示される１次元の差分行列１０００が生成される。量子化マトリクス符号化部１１３はさらに差分行列を符号化して量子化マトリクスの符号データを生成する。本実施形態では図１１Ａに示される符号化テーブルを用いて符号化するものとするが、符号化テーブルはこれに限定されず、例えば図１１Ｂに示される符号化テーブルを用いてもよい。

　図１に戻り、統合符号化部１１１は、逆量子化補正制御情報を含む、画像の符号化に必要なヘッダ情報に、量子化マトリクスの符号データを統合することで、ヘッダ符号データを生成する。続いて、画像の符号化について説明する。

　ブロック分割部１０２は、入力部１０１を介して入力された入力画像を複数の基本ブロックに分割する。本実施形態では、基本ブロックのサイズは８画素ｘ８画素である。予測部１０４では、それぞれの基本ブロックに対して予測処理を行う。より詳しくは、予測部１０４は先ず、基本ブロックをさらに細かいサブブロックに分割するための方法であるサブブロック分割法を決定し、さらにサブブロック単位でイントラ予測やインター予測、イントラ・インター混在予測などの予測モードを決定する。

　図７Ａ～７Ｆは、サブブロックの分割パターンの例を示している。図７において外側の太枠７００は基本ブロックを表しており、本実施形態では８画素ｘ８画素のサイズを有する。そして、太枠７００内の矩形がサブブロックを表している。図７Ａは基本ブロック＝サブブロックの例を示している。図７Ｂは従来の正方形サブブロック分割の一例を表しており、８画素ｘ８画素の基本ブロックは４つの４画素ｘ４画素のサブブロックに分割されている。図７Ｃ～７Ｆは長方形サブブロック分割の一例を表している。図７Ｃでは基本ブロックは２つの４画素ｘ８画素の縦長のサブブロックに分割されており、図７Ｄでは基本ブロックは２つの８画素ｘ４画素の横長の長方形のサブブロックに分割されている。また、図７Ｅ、７Ｆでは、基本ブロックは１：２：１の比で長方形サブブロックに分割されている。このように正方形だけではなく、長方形のサブブロックも用いて符号化処理を行っている。

　本実施形態では説明を簡単にするために、８画素ｘ８画素の基本ブロックをサブブロックには分割しない（図７Ａ）サブブロック分割法を採用する。しかし、図７Ｂのような四分木分割や、図７Ｅ、７Ｆのような三分木分割や、図７Ｃや図７Ｄのような二分木分割を用いても構わない。図７Ａ以外のサブブロック分割も用いられる場合には、量子化マトリクス保持部１０３にて、使用されるサブブロックに対応する量子化マトリクスが生成される。また、生成された量子化マトリクスは量子化マトリクス符号化部１１３にて符号化されることとなる。

　また、本実施形態で用いられる予測モード（予測方法）について、改めて説明する。本実施形態ではイントラ予測、インター予測、イントラ・インター混在予測の３種類の予測方法が用いられる。イントラ予測では、符号化対象ブロックの空間的に周辺に位置する符号化済画素を用いて符号化対象ブロックの予測画素を生成し、水平予測や垂直予測、ＤＣ予測などのイントラ予測方法を示すイントラ予測モードも生成する。インター予測では、符号化対象ブロックとは時間的に異なるフレームの符号化済画素を用いて符号化対象ブロックの予測画素を生成し、参照するフレームや動きベクトルなどを示す動き情報も生成する。

　イントラ・インター混在予測では、まず符号化対象ブロックを斜め方向の線分で分割し２つの領域を生成する。そして、一方の領域に前述のイントラ予測により生成された画素値を用い、もう一方の領域に前述のインター予測により生成された画素値を用い、符号化対象ブロックの予測画素を生成する。図１２Ａ，１２Ｂはこのイントラ・インター混在予測で用いられる領域分割の一例を示している。図１２Ａは、符号化対象ブロック１２００を左上の頂点から右下の頂点への対角線によって、２つの領域を生成する場合の例を示している。例えば右上の領域にはイントラ予測によって生成された画素値を用い、左下の領域にはインター予測によって生成された画素値を用いることができる。また、図１２Ｂは、符号化対象ブロック１２００を右上の頂点から左上の頂点と左下の頂点の中点への斜め方向の線分によって、２つの領域を生成する場合の例を示している。例えば左上の領域にはイントラ予測によって生成された画素値を配置し、右下の領域にはインター予測によって生成された画素値を配置することができる。こうしてイントラ・インター混在予測では、符号化対象ブロックの予測画素を生成し、予測画素の生成に用いられたイントラ予測モードや動き情報および領域分割に関する情報も生成する。

　予測部１０４は、決定した予測モードおよび符号化済の画素から、符号化対象のサブブロックの予測画像を生成する。そして、予測部１０４は、符号化対象のサブブロックと、該サブブロックの予測画像と、の差分（誤差）を演算して予測誤差を生成する。また、予測部１０４は、サブブロック分割法や予測モード（イントラ予測、インター予測、イントラ・インター混在予測のいずれであるかを示す情報）やベクトルデータなどの予測情報を出力する。

　変換・量子化部１０５は、予測誤差に対して直交変換および量子化を行うことで量子化係数を生成する。具体的には、変換・量子化部１０５は、予測誤差のサイズに対応した直交変換処理を施して直交変換係数を生成する。次に変換・量子化部１０５は、量子化マトリクス保持部１０３が保持している量子化マトリクスのうち予測モードに応じた量子化マトリクスを選択し、該選択した量子化マトリクスを用いて直交変換係数を量子化することで量子化係数を生成する。本実施形態では、イントラ予測で予測処理が行われたサブブロックの直交変換係数の量子化には図８Ａの量子化マトリクスが選択され、インター予測が行われたサブブロックの直交変換係数の量子化には図８Ｂの量子化マトリクスが選択される。また、本実施形態では、イントラ・インター混在予測が行われたサブブロックの直交変換係数の量子化には図８Ｃの量子化マトリクスが選択される。ただし、使用される量子化マトリクスはこれに限定されない。

　逆量子化・逆変換部１０６は、サブブロックの量子化係数を、量子化マトリクス保持部１０３に格納されている量子化マトリクスのうち、該サブブロックの直交変換係数の量子化に用いた量子化マトリクスを用いて逆量子化することで再生直交変換係数を生成する。そして逆量子化・逆変換部１０６は、逆量子化補正制御情報に基づき、該再生直交変換係数に対して逆量子化補正処理を行う。

　ここで、本実施形態における逆量子化補正処理について説明する。本実施形態における逆量子化処理および逆量子化補正処理は、例えば、以下の式（１）を用いて実施される。

　ｄｚ［ｘ］［ｙ］＝Ｌ［ｘ］［ｙ］×Ｑ［ｘ］［ｙ］＋Ｓｈｉｆｔ　…　（１）
　式（１）において、ｄｚ［ｘ］［ｙ］は、位置（ｘ、ｙ）に対応する補正後の再生直交変換係数であり、Ｌ［ｘ］［ｙ］は、位置（ｘ、ｙ）に対応する量子化係数である。また、Ｑ［ｘ］［ｙ］は、位置（ｘ、ｙ）に対応する「量子化マトリクスの要素を加味して算出された量子化スケール」である。また、Ｓｈｉｆｔは本実施形態の逆量子化補正処理に用いられる補正値であり、量子化係数Ｌおよび逆量子化補正制御情報に基づいて決定される。具体的には、逆量子化・逆変換部１０６は、逆量子化補正制御情報の値が０である場合には、式（１）のＳｈｉｆｔの値を０とする。この場合、逆量子化補正処理では、実質的には再生直交変換係数の補正は行われない。一方、逆量子化・逆変換部１０６は、逆量子化補正制御情報の値が１である場合には、式（１）のＳｈｉｆｔの値を、以下の式（２）を用いて導出する。

　Ｓｈｉｆｔ＝Ｔ×Ｌ［ｘ］［ｙ］　…　（２）
　式（２）において、Ｔは０以上１未満の値を取る実数である。本実施形態ではＴは固定値であるものとするが、これに限定されず、位置（ｘ，ｙ）によって可変の値をとっても構わないし、Ｔ自体を量子化係数Ｌ［ｘ］［ｙ］を用いて算出してもよい。例えば、Ｔの値を下記の表が示すように量子化係数Ｌ［ｘ］［ｙ］の絶対値（｜Ｌ［ｘ］［ｙ］｜）に応じて算出してもよい。

　この場合、量子化係数Ｌ［ｘ］［ｙ］が０の場合には、Ｔの値も０となり、実質的に補正を行わない。また、非ゼロの量子化係数Ｌ［ｘ］［ｙ］の絶対値（｜Ｌ［ｘ］［ｙ］｜）が大きくなるにつれ、Ｔの値は小さくなり、｜Ｌ［ｘ］［ｙ］｜が所定の値よりも大きくなった場合にもＴの値も０となり、その場合も実質的に補正を行わない。

　そして逆量子化・逆変換部１０６は、上記の式（１）を用いて生成された再生直交変換係数を逆直交変換することで予測誤差を生成（再生）する。逆量子化処理には、変換・量子化部１０５と同様、符号化対象ブロックの予測モードに対応した量子化マトリクスが用いられる。具体的には、変換・量子化部１０５で用いられた量子化マトリクスと同一のものが用いられる。

　画像再生部１０７は、予測部１０４から入力される予測情報に基づいて、フレームメモリ１０８を適宜参照して、予測画像を生成（再生）する。そして画像再生部１０７は、再生された予測画像と、逆量子化・逆変換部１０６によって生成（再生）された予測誤差と、を加算することで、対応するサブブロックの再生画像を生成（再生）し、該生成した再生画像をフレームメモリ１０８に格納する。

　インループフィルタ部１０９は、フレームメモリ１０８から再生画像を読み出し、該読み出した再生画像に対してデブロッキングフィルタなどのフィルタを用いたインループフィルタ処理を行う。そして、インループフィルタ部１０９は、インループフィルタ処理を適用した再生画像を再びフレームメモリ１０８に格納する。

　符号化部１１０は、サブブロックごとに、変換・量子化部１０５で生成された該サブブロックの量子化係数、予測部１０４から入力された該サブブロックの予測情報、をエントロピー符号化することで符号データを生成する。エントロピー符号化の方法は特定の方法に限らないが、ゴロム符号化、算術符号化、ハフマン符号化などを用いることができる。

　統合符号化部１１１は、それぞれの符号データを多重化してビットストリームを生成し、該生成したビットストリームを出力する。図６Ａは本実施形態で出力されるビットストリームのデータ構造の一例を示している。シーケンスヘッダには逆量子化補正制御情報や量子化マトリクスの符号データが含まれ、各要素の符号データで構成されている。ただし、符号化される位置はこれに限定されず、ピクチャヘッダやその他のヘッダに符号化される構成をとっても構わない。また、１つのシーケンスの中で逆量子化補正制御情報や量子化マトリクスの変更を行う場合、逆量子化補正制御情報や量子化マトリクスを新たに符号化することで更新することも可能である。

　次に、画像符号化装置が１フレーム分の入力画像を符号化するために行う処理について、図３のフローチャートに従って説明する。画像符号化装置が複数のフレームの入力画像を符号化する場合には、画像符号化装置は、ステップＳ３０５～Ｓ３１２の処理を各フレームの入力画像に対して行う。

　まず、画像の符号化に先立ち、ステップＳ３０１では、逆量子化補正制御部１１４は、逆量子化補正制御情報を取得する。ステップＳ３０２では、量子化マトリクス保持部１０３は、量子化処理に用いる複数の量子化マトリクスを取得して保持する。

　ステップＳ３０３では、量子化マトリクス符号化部１１３は、ステップＳ３０２で生成された量子化マトリクスを走査して各要素の差分を算出して１次元の差分行列を生成する。ステップＳ３０４では、統合符号化部１１１は、ステップＳ３０１で取得した逆量子化補正制御情報などの、画像データの符号化に必要なヘッダ情報と、ステップＳ３０３で生成された量子化マトリクスの符号データと、を用いてヘッダ符号データを生成する。

　ステップＳ３０５では、ブロック分割部１０２は、入力部１０１を介して入力された入力画像を複数の基本ブロックに分割する。ステップＳ３０６では、予測部１０４は、ステップＳ３０５で分割された基本ブロックのうち未選択の１つを選択基本ブロックとして選択する。そして予測部１０４は、該選択基本ブロックをサブブロックに分割し（選択基本ブロック＝サブブロックのケースも含む）、該サブブロックの予測誤差を導出すると共に、予測情報を出力する。

　なお、予測部１０４による具体例な処理例を示すと次の通りである。予測部１０４は、符号化しようとする着目サブブロック（着目ブロック）に対して、該着目サブブロックが属する入力画像と同じ入力画像における符号化済み領域を参照してイントラ予測処理を行い、イントラ予測画像を生成する。また、予測部１０４は、符号化しようとする着目サブブロックが属する入力画像とは異なる符号化済みの入力画像（例えば直前のフレームの入力画像）を参照してインター予測処理を行い、インター予測画像を生成する。そして予測部１０４は、先に示した図１２の例のように着目サブブロックを２つの領域に分割し、一方の領域にイントラ予測画像を、もう一方の領域にインター予測画像を配置することでイントラ・インター混在予測画像を生成する。そして予測部１０４は、これらの３つの予測画像それぞれと着目サブブロックとで位置的に対応する画素同士の画素値の差分の２乗和（絶対値和でもよい）を導出し、２乗和が最小となった予測画像の予測モードを着目サブブロックの予測モードとして決定する。そして予測部１０４は、予測モードに応じてサブブロックに対する予測処理を行うことで予測画像を生成し、該サブブロックと該予測画像との差分を予測誤差として導出する。

　ステップＳ３０７では、変換・量子化部１０５はサブブロックごとに、ステップＳ３０６で導出した予測誤差を直交変換して直交変換係数を生成する。そして変換・量子化部１０５はサブブロックごとに、予測情報に基づき、量子化マトリクス保持部１０３に保持されている量子化マトリクスから１つを選択し、該選択した量子化マトリクスを用いて直交変換係数を量子化して量子化係数を生成する。

　ステップＳ３０８では、逆量子化・逆変換部１０６はサブブロックごとに、ステップＳ３０７で生成された量子化係数に対して、ステップＳ３０７で選択した量子化マトリクスを用いて逆量子化を行うことで再生直交変換係数を生成し、該再生直交変換係数に対して逆量子化補正制御情報に基づく逆量子化補正処理を行ってから逆直交変換することで予測誤差を生成（再生）する。つまり、逆量子化・逆変換部１０６は、上記の式（１）に従って、再生直交変換係数に対して逆量子化処理および逆量子化補正処理を行う。

　ステップＳ３０９で画像再生部１０７はサブブロックごとに、ステップＳ３０６で出力された予測情報に基づいてフレームメモリ１０８を参照して予測画像を生成し、該予測画像と、ステップＳ３０８で生成された予測誤差と、を用いて再生画像を生成する。

　ステップＳ３１０では、符号化部１１０はサブブロックごとに、ステップＳ３０６で出力された予測情報、ステップＳ３０７で生成された量子化係数、を符号化することで、基本ブロックのサブブロック単位の符号データを生成する。そして統合符号化部１１１は、ステップＳ３０４で生成されたヘッダ符号データ、符号化部１１０によって生成された符号データ、などを多重化してビットストリームを生成する。

　ステップＳ３１１では、制御部１５０は、入力画像における全ての基本ブロックを選択基本ブロックとして選択したか否か（つまり全ての基本ブロックの符号化（ステップＳ３０６～Ｓ３１０の処理）が完了したか否か）を判断する。

　この判断の結果、入力画像における全ての基本ブロックを選択基本ブロックとして選択した場合、処理はステップＳ３１２に進み、入力画像において未だ選択基本ブロックとして選択していない基本ブロックが残っている場合、処理はステップＳ３０６に進む。

　ステップＳ３１２では、インループフィルタ部１０９は、フレームメモリ１０８から再生画像を読み出し、該再生画像に対してインループフィルタ処理を行い、インループフィルタ処理を適用した再生画像を再びフレームメモリ１０８に格納する。

　以上の構成と動作により、特にステップＳ３０８において、逆量子化補正制御情報に基づく再生直交変換係数の補正を行うことで、量子化マトリクスを用いた逆量子化処理によって生成された再生直交変換係数に対しても適切な補正を行うことができ、圧縮効率を向上させることができる。

　なお、本実施形態では、フレーム内の全てのサブブロックの逆量子化処理に量子化マトリクスを用いて再生直交変換係数を生成し、逆量子化補正制御情報に基づいた補正を行う構成としたが、これに限定されない。たとえば、フレーム内の一部のサブブロック（例えば８画素ｘ８画素のサイズのサブブロック）については量子化マトリクスを用いた逆量子化を行い、その他のサブブロック（例えば４画素ｘ４画素のサイズのサブブロック）については量子化マトリクスを用いない（すなわち全ての周波数成分で同一の量子化スケールを用いる）逆量子化を行う構成としてもよい。その場合、量子化マトリクスを用いて逆量子化を行ったサブブロックに対しては、逆量子化補正制御情報に応じて式（１）による補正を行い、量子化マトリクスを用いないで逆量子化を行ったサブブロックに対しては、逆量子化補正制御情報によらず常に式（１）による補正を行う構成とすることもできる。これにより、量子化マトリクスを用いて逆量子化を行ったサブブロックと量子化マトリクスを用いないで逆量子化を行ったサブブロックとが混在している場合においても、各サブブロックに適切な補正を行い、圧縮効率を向上させることができる。

　また本実施形態では、量子化補正制御情報を符号化してビットストリームに含ませる構成としたが、これに限定されない。例えば量子化補正制御情報を常に０と設定することで、図６Ｂに示されるようにビットストリームに含ませる量子化補正制御情報の符号を省略することもできる。この場合、量子化マトリクスを用いないで逆量子化を行うサブブロックには常に逆量子化補正処理が施され、量子化マトリクスを用いて逆量子化を行うサブブロックには常に逆量子化補正処理が施されない構成となる。これにより、量子化マトリクスの適用の有無と逆量子化補正処理の適用の有無との関係性を単純化して制御を容易にし、さらには逆量子化補正制御情報の符号分の符号量を削減することができる。

　また、本実施形態では、逆量子化補正制御情報は、逆量子化補正処理の適用の有無のみを示す構成としているが、逆量子化補正処理に用いられるパラメータの値に逆量子化補正制御情報の値を設定することもできる。例えば、前述の式（１）におけるＳｈｉｆｔや式（２）におけるＴの値に逆量子化補正制御情報の値を設定することも可能である。これにより画像の特性に応じて逆量子化補正の強度を制御することが可能となり、結果として圧縮効率を向上させることができる。

　また本実施形態では、イントラ予測、インター予測、イントラ・インター混在予測の３種類の予測方法が用いられているが、それぞれの予測およびその誤差の特性が異なるため、予測方法に応じて異なる逆量子化補正処理を行う構成とすることもできる。例えば、イントラ予測を用いたサブブロックに対応する逆量子化補正制御情報、インター予測を用いたサブブロックに対応する逆量子化補正制御情報、イントラ・インター混在予測を用いたサブブロックに対応する逆量子化補正制御情報、を個別に設定することで、それぞれの予測方法に適した逆量子化補正制御を適用することもできる。この場合、それぞれの逆量子化補正制御情報を符号化してビットストリームに含める構成としてもよいし、それぞれの逆量子化補正制御情報を固定値に設定して、それぞれの符号化を省略する構成としても構わない。

　なお、本実施形態では、フレーム単位の画像の符号化処理を行ってビットストリームを生成して出力する構成としたが、符号化処理の対象は画像に限定されない。例えば、物体認識などの機械学習に用いられる特徴量を２次元配列のデータとし、該データを符号化対象としてもよい。これにより、機械学習に用いられる特徴量を効率よく符号化することが可能となる。

　［第２の実施形態］
　本実施形態に係る画像復号装置は、第１の実施形態に係る画像符号化装置によって生成されたフレーム単位のビットストリームを復号する。本実施形態に係る画像復号装置の機能構成例について、図２のブロック図を用いて説明する。

　分離復号部２０２は、入力部２０１を介してビットストリームを取得する。分離復号部２０２がビットストリームを取得するための方法は特定の方法に限らない。たとえば、分離復号部２０２は、サーバ装置などの外部の装置に保持されているビットストリームをネットワークを介して取得してもよいし、撮像装置にて生成されたビットストリームを該撮像装置から取得するようにしてもよい。そして分離復号部２０２は、該ビットストリームから、ヘッダ符号データや、基本ブロックのサブブロック単位の符号データ、を分離する。要するに分離復号部２０２は、図１の統合符号化部１１１と逆の動作を行う。また、分離復号部２０２は、ヘッダ符号データから逆量子化補正制御情報を抽出する。

　量子化マトリクス復号部２０９は、分離復号部２０２によって分離されたヘッダ符号データを復号して量子化マトリクスを再生する。復号部２０３は、分離復号部２０２によって分離された基本ブロックのサブブロック単位の符号データを復号し、量子化係数および予測情報を再生する。

　逆量子化・逆変換部２０４は、量子化マトリクス復号部２０９によって再生された量子化マトリクスを用いて、復号部２０３によって再生された量子化係数を、逆量子化・逆変換部１０６と同様にして逆量子化することで再生直交変換係数を生成する。そして逆量子化・逆変換部２０４は逆量子化・逆変換部１０６と同様に、該再生直交変換係数に対して、分離復号部２０２により抽出された逆量子化補正制御情報に基づく逆量子化補正処理を行ってから逆直交変換することで予測誤差を生成（再生、導出）する。

　画像再生部２０５は、画像再生部１０７と同様に、復号部２０３によって再生された予測情報に基づいてフレームメモリ２０６を適宜参照して予測画像を生成する。そして、画像再生部２０５は、画像再生部１０７と同様に、該予測画像に、逆量子化・逆変換部２０４によって再生された予測誤差を加算することで再生画像を生成し、該再生画像をフレームメモリ２０６に格納する。

　インループフィルタ部２０７は、インループフィルタ部１０９と同様、フレームメモリ２０６から再生画像を読み出し、該再生画像に対してインループフィルタ処理を行い、インループフィルタ処理を適用した再生画像を再びフレームメモリ２０６に格納する。インループフィルタ部２０７によりインループフィルタ処理が適用された再生画像は制御部２５０による制御の元、出力部２０８を介して外部の装置に対して出力される。

　再生画像の出力先は特定の出力先に限らない。たとえば、制御部２５０は、再生画像をネットワークを介して外部の装置に対して送信してもよいし、画像復号装置に接続された表示装置に再生画像を出力して該再生画像を該表示装置に表示させてもよい。制御部２５０は、上記の各機能部を含む、画像復号装置全体の動作制御を行う。

　次に、図２に示した機能構成における画像復号装置の動作について説明する。入力部２０１を介して入力された１フレーム分のビットストリームは分離復号部２０２に入力される。本実施形態に係る分離復号部２０２は、図６Ａに示されるビットストリームのシーケンスヘッダから逆量子化補正制御情報を抽出すると共に、該シーケンスヘッダから図８Ａ～８Ｃの量子化マトリクスの符号データを抽出する。また、分離復号部２０２は、ピクチャデータの基本ブロックのサブブロック単位の符号データを再生する。

　量子化マトリクス復号部２０９は、量子化マトリクスの符号データを復号し、図１０Ａ～１０Ｃに示される一次元の差分行列を再生する。本実施形態では、第１の実施形態と同様、図１１Ａ（又は図１１Ｂ）に示される符号化テーブルを用いて復号するものとするが、符号化テーブルはこれに限定されず、第１の実施形態と同じものを用いる限りは他の符号化テーブルを用いてもよい。そして量子化マトリクス復号部２０９は、再生された一次元の差分行列を逆走査して二次元配列としての量子化マトリクスを再生する。つまり量子化マトリクス復号部２０９は量子化マトリクス符号化部１１３の動作と逆の動作を行う。すなわち、量子化マトリクス復号部２０９は、図１０Ａ～１０Ｃに示される差分行列を、図９に示される走査方法を用いて、それぞれ図８Ａ～８Ｃに示される３種の量子化マトリクスを再生する。

　復号部２０３は、基本ブロックのサブブロック単位の符号データを復号し、量子化係数および予測情報を再生する。逆量子化・逆変換部２０４は、量子化マトリクス復号部２０９で再生された量子化マトリクスのうち１つを選択し、復号部２０３によって再生された量子化係数を、該選択した量子化マトリクスを用いて逆量子化することで再生直交変換係数を生成する。そして逆量子化・逆変換部２０４は逆量子化・逆変換部１０６と同様に、該生成された再生直交変換係数に対して、分離復号部２０２によって抽出された逆量子化補正制御情報に基づく逆量子化補正処理を行ってから逆直交変換することで予測誤差を生成（再生）する。

　本実施形態の逆量子化・逆変換部２０４は、復号部２０３で再生された予測情報に従って定まる復号対象のサブブロックの予測モードに応じて、逆量子化処理で用いる量子化マトリクスを決定する。すなわち、イントラ予測が用いられているサブブロックには図８Ａの量子化マトリクス、インター予測が用いられているサブブロックには図８Ｂの量子化マトリクス、イントラ・インター混在予測が用いられているサブブロックには図８Ｃの量子化マトリクス、が選択される。ただし、使用される量子化マトリクスはこれに限定されず、第１の実施形態の変換・量子化部１０５および逆量子化・逆変換部１０６で用いられた量子化マトリクスと同一のものであればよい。

　画像再生部２０５は、画像再生部１０７と同様に、復号部２０３によって再生された予測情報に基づいてフレームメモリ２０６を適宜参照して予測画像を生成する。本実施形態では、予測部１０４と同様、イントラ予測、インター予測、イントラ・インター混在予測の３種類の予測方法が用いられる。そして、画像再生部２０５は、画像再生部１０７と同様に、該予測画像に、逆量子化・逆変換部２０４によって再生された予測誤差を加算することで再生画像を生成し、該再生画像をフレームメモリ２０６に格納する。格納された再生画像は他のサブブロックを復号する際の予測参照候補となる。

　インループフィルタ部２０７は、インループフィルタ部１０９と同様、フレームメモリ２０６に格納されている再生画像に対してインループフィルタ処理を行う。上記の如く、インループフィルタ部２０７によりインループフィルタ処理が適用された再生画像は出力部２０８を介して外部の装置に対して出力される。

　次に、画像復号装置が１フレーム分のビットストリームを復号するために行う処理について、図４のフローチャートに従って説明する。画像復号装置が複数のフレームのビットストリームを復号する場合には、画像復号装置は、図４のフローチャートに従った処理を各フレームのビットストリームに対して行う。

　ステップＳ４０１では、分離復号部２０２は、ビットストリームから逆量子化補正制御情報を抽出（復号）すると共に、該ビットストリームから量子化マトリクスの符号データ、基本ブロックのサブブロック単位の符号データ、を再生（分離）する。

　ステップＳ４０２では、量子化マトリクス復号部２０９は、ステップＳ４０１で再生した量子化マトリクスの符号データを復号することで一次元の差分行列を再生し、該再生された一次元の差分行列を逆走査して二次元配列としての量子化マトリクスを再生する。

　ステップＳ４０３では、復号部２０３は、ステップＳ４０１で再生された基本ブロックのサブブロック単位の符号データを復号し、量子化係数および予測情報を再生する。ステップＳ４０４では、逆量子化・逆変換部２０４は、ステップＳ４０２で再生された量子化マトリクスのうち１つを選択し、ステップＳ４０３で再生された量子化係数を、該選択した量子化マトリクスを用いて逆量子化することで再生直交変換係数を生成する。そして逆量子化・逆変換部２０４は、該再生直交変換係数に対して、ステップＳ４０１で抽出された逆量子化補正制御情報に基づく逆量子化補正処理を行ってから逆直交変換することで予測誤差を生成（再生）する。

　ステップＳ４０５では、画像再生部２０５は、ステップＳ４０３で再生された予測情報に基づいてフレームメモリ２０６を適宜参照して予測画像を生成する。そして、画像再生部２０５は、該予測画像に、ステップＳ４０４で再生された予測誤差を加算することで再生画像を生成し、該再生画像をフレームメモリ２０６に格納する。

　ステップＳ４０６では、制御部２５０は、全ての基本ブロックについてステップＳ４０３～Ｓ４０５の処理を行ったか否かを判断する。この判断の結果、全ての基本ブロックについてステップＳ４０３～Ｓ４０５の処理を行った場合には、処理はステップＳ４０７に進む。一方、ステップＳ４０３～Ｓ４０５の処理を行っていない基本ブロックが残っている場合には、該基本ブロックについてステップＳ４０３～Ｓ４０５の処理を行うべく、処理はステップＳ４０３に進む。ステップＳ４０７では、インループフィルタ部２０７は、フレームメモリ２０６に格納されている再生画像に対してインループフィルタ処理を行う。

　以上の構成と動作により、逆量子化補正制御情報に基づいて再生直交変換係数を補正することで、量子化マトリクスを用いた逆量子化処理によって生成された再生直交変換係数に対しても適切な補正を行い、圧縮効率を向上したビットストリームを復号することができる。

　なお、本実施形態でも、第１の実施形態と同様、フレーム内の全てのサブブロックの逆量子化処理に量子化マトリクスを用いて再生直交変換係数を生成し、逆量子化補正制御情報に基づいた補正を行う構成としたが、これに限定されない。たとえば、本実施形態においても第１の実施形態と同様、量子化マトリクスを用いて逆量子化を行ったサブブロックに対しては、逆量子化補正制御情報に応じて式（１）による補正を行い、量子化マトリクスを用いないで逆量子化を行ったサブブロックに対しては、逆量子化補正制御情報によらず常に式（１）による補正を行う構成とすることもできる。これにより、量子化マトリクスを用いて逆量子化を行ったサブブロックと量子化マトリクスを用いないで逆量子化を行ったサブブロックとが混在している場合においても、各サブブロックに適切な補正を行い、圧縮効率を向上させたビットストリームを復号することができる。

　また本実施形態では、量子化補正制御情報が符号化されたビットストリームを復号する構成としたが、これに限定されない。例えば量子化補正制御情報の値を常に０と設定することで、図６Ｂに示されるように量子化補正制御情報の符号が省略されたビットストリームを復号する構成をとることもできる。この場合、第１の実施形態と同様、量子化マトリクスを用いないで逆量子化を行うサブブロックには常に逆量子化補正処理が施され、量子化マトリクスを用いて逆量子化を行うサブブロックには常に逆量子化補正処理が施されない構成となる。これにより、量子化マトリクスの適用の有無と逆量子化補正処理の適用の有無との関係性を単純化して制御を容易にし、さらには逆量子化補正制御情報の符号分の符号量を削減したビットストリームを復号することができる。

　なお、本実施形態でも、第１の実施形態と同様、逆量子化補正処理に用いられるパラメータを逆量子化補正制御情報とすることもできる。これにより画像の特性に応じて逆量子化補正の強度を制御することが可能となり、結果として圧縮効率を向上させたビットストリームを復号することができる。

　また本実施形態でも、第１の実施形態と同様、予測方法に応じて異なる逆量子化補正処理を行う構成とすることもできる。この場合、第１の実施形態と同様、それぞれの逆量子化補正制御情報が符号化されたビットストリームを復号する構成としてもよいし、それぞれの逆量子化補正制御情報を固定値に設定して、それぞれの復号を省略する構成としても構わない。

　なお、本実施形態では、フレーム単位のビットストリームを復号する構成としたが、復号処理の対象は画像を符号化したビットストリームに限定されない。例えば、物体認識などの機械学習に用いられる特徴量を２次元配列のデータとし、該データを符号化して生成されたビットストリームを復号する構成としてもよい。これにより、機械学習に用いられる特徴量を効率よく符号化したビットストリームを復号することが可能となる。

　［第３の実施形態］
　第１の実施形態では図１に示した各機能部はいずれもハードウェアで実装されているものとして説明した。しかし、フレームメモリ１０８を除く各機能部はソフトウェア（コンピュータプログラム）で実装されてもよい。この場合、このソフトウェアを実行可能なコンピュータ装置は、画像符号化装置に適用可能である。

　また、第２の実施形態では図２に示した各機能部はいずれもハードウェアで実装されているものとして説明した。しかし、フレームメモリ２０６を除く各機能部はソフトウェア（コンピュータプログラム）で実装されてもよい。この場合、このソフトウェアを実行可能なコンピュータ装置は、画像復号装置に適用可能である。

　画像符号化装置や画像復号装置に適用可能なコンピュータ装置のハードウェア構成例について、図５のブロック図を用いて説明する。なお、図５に示した構成は画像符号化装置や画像復号装置に適用可能なコンピュータ装置のハードウェア構成の一例であり、適宜変更／変形が可能である。また、画像符号化装置と画像復号装置とで異なる構成のコンピュータ装置を適用してもよい。また、画像符号化装置と画像復号装置とは同一装置であってもよい。

　ＣＰＵ５０１は、ＲＡＭ５０２やＲＯＭ５０３に格納されているコンピュータプログラムやデータを用いて各種の処理を実行する。これによりＣＰＵ５０１は、コンピュータ装置全体の動作制御を行うと共に、画像符号化装置や画像復号装置が行う処理として説明した各種の処理を実行もしくは制御する。

　ＲＡＭ５０２は、ＲＯＭ５０３や記憶装置５０６からロードされたコンピュータプログラムやデータを格納するためのエリア、Ｉ／Ｆ５０７を介して外部から受信したコンピュータプログラムやデータを格納するためのエリア、を有する。さらにＲＡＭ５０２は、ＣＰＵ５０１が各種の処理を実行する際に用いるワークエリアを有する。このようにＲＡＭ５０２は各種のエリアを適宜提供することができる。

　ＲＯＭ５０３には、コンピュータ装置の設定データ、コンピュータ装置の起動に係るコンピュータプログラムやデータ、コンピュータ装置の基本動作に係るコンピュータプログラムやデータ、などが格納されている。

　操作部５０４は、キーボード、マウス、タッチパネル画面、などのユーザインターフェースであり、ユーザが操作することで各種の指示や情報をコンピュータ装置に対して入力することができる。

　表示部５０５は、液晶画面やタッチパネル画面を有し、ＣＰＵ５０１による処理結果を画像や文字などでもって表示することができる。また、表示部５０５は、画像や文字を投影するプロジェクタなどの投影装置であってもよい。

　記憶装置５０６は、ハードディスクドライブなどの不揮発性のメモリ装置である。記憶装置５０６には、ＯＳ（オペレーティングシステム）、画像符号化装置や画像復号装置が行う処理として説明した各種の処理をＣＰＵ５０１に実行もしくは制御させるためのコンピュータプログラムやデータ、などが保存されている。

　記憶装置５０６に保存されているコンピュータプログラムには、図１に示した各機能部（フレームメモリ１０８は除く）が行う処理として説明した各種の処理をＣＰＵ５０１に実行もしくは制御させるためのコンピュータプログラムが含まれている。また、記憶装置５０６に保存されているコンピュータプログラムには、図２に示した各機能部（フレームメモリ２０６は除く）が行う処理として説明した各種の処理をＣＰＵ５０１に実行もしくは制御させるためのコンピュータプログラムが含まれている。なお、フレームメモリ１０８やフレームメモリ２０６は、ＲＡＭ５０２や記憶装置５０６を用いて実装可能である。

　Ｉ／Ｆ５０７は、外部の装置との間のデータ通信を行うための通信インターフェースである。たとえば、コンピュータ装置は、撮像装置やサーバ装置との間のデータ通信をＩ／Ｆ５０７を介して行うことで、撮像装置やサーバ装置から入力画像やビットストリームを取得したり、サーバ装置に対してビットストリームを送信したりすることができる。

　ＣＰＵ５０１、ＲＡＭ５０２、ＲＯＭ５０３、操作部５０４、表示部５０５、記憶装置５０６、Ｉ／Ｆ５０７はいずれもシステムバス５０８に接続されている。このような構成において、コンピュータ装置の電源がＯＮになると、ＣＰＵ５０１はＲＯＭ５０３に格納されているブートプログラムを実行して、記憶装置５０６に格納されたＯＳをＲＡＭ５０２にロードして該ＯＳを起動する。この結果、コンピュータ装置が、Ｉ／Ｆ５０７を介した通信が可能となる。そして、ＯＳの制御下で、ＣＰＵ５０１は画像の符号化に係るアプリケーション（図３に相当する）を記憶装置５０６からＲＡＭ５０２にロードして実行することで、コンピュータ装置が画像符号化装置として機能することになる。一方、ＣＰＵ５０１は画像の復号に係るアプリケーション（図４に相当する）を記憶装置５０６からＲＡＭ５０２にロードして実行した場合、コンピュータ装置は画像復号装置として機能することになる。

　上記の各実施形態で使用した数値、処理タイミング、処理順、処理の主体、データ（情報）の構成／取得方法／送信先／送信元／格納場所などは、具体的な説明を行うために一例として挙げたもので、このような一例に限定することを意図したものではない。

　また、以上説明した各実施形態の一部若しくは全部を適宜組み合わせて使用しても構わない。また、以上説明した各実施形態の一部若しくは全部を選択的に使用しても構わない。
（その他の実施例）
　本発明は、上述の実施形態の１以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける１つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、１以上の機能を実現する回路（例えば、ＡＳＩＣ）によっても実現可能である。

　発明は上記実施形態に制限されるものではなく、発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、発明の範囲を公にするために請求項を添付する。

　本願は、２０２３年９月２８日提出の日本国特許出願特願２０２３－１６８８７３を基礎として優先権を主張するものであり、その記載内容の全てを、ここに援用する。

Claims

　画像をブロック単位で符号化する画像符号化装置であって、
　画像における符号化対象の所定のサイズの着目ブロックに対し、符号化済みの画素から予測画像を生成し、前記着目ブロックと前記予測画像との差分である予測誤差を導出する予測手段と、
　前記予測手段で導出した前記予測誤差を周波数変換する変換手段と、
　前記変換手段による周波数変換によって得られた直交変換係数を量子化する量子化手段と、
　前記量子化手段により量子化された直交変換係数をエントロピー符号化する符号化手段と、
　前記量子化手段により量子化された直交変換係数を逆量子化して再生直交変換係数を生成する逆量子化手段と
　を有し、
　前記逆量子化手段は前記再生直交変換係数を補正することを特徴とする画像符号化装置。
　前記逆量子化手段は、量子化マトリクスを用いないで逆量子化した場合、前記再生直交変換係数を補正し、量子化マトリクスを用いて逆量子化した場合、前記再生直交変換係数を補正しないよう制御する
　ことを特徴とする請求項１に記載の画像符号化装置。
　前記符号化手段は、前記逆量子化手段における補正処理を制御する逆量子化補正制御情報をさらに符号化することを特徴とする請求項１または２に記載の画像符号化装置。
　前記逆量子化手段は、前記予測手段における予測画像の生成方法に応じて、前記再生直交変換係数に対して異なる補正を行うことを特徴とする請求項１ないし３のいずれか１項に記載の画像符号化装置。
　画像をブロック単位で復号する画像復号装置であって、
　量子化された直交変換係数を復号する復号手段と、
　前記量子化された直交変換係数を逆量子化して再生直交変換係数を生成する逆量子化手段と、
　前記再生直交変換係数を逆変換して予測誤差を導出する逆変換手段と、
　予測画像を生成し、前記予測画像と前記予測誤差とを用いて着目ブロックを復号する予測手段と、を有し、
　前記逆量子化手段は前記再生直交変換係数を補正する
　ことを特徴とする画像復号装置。
　前記逆量子化手段は、量子化マトリクスを用いないで逆量子化した場合、前記再生直交変換係数を補正し、量子化マトリクスを用いて逆量子化した場合、前記再生直交変換係数を補正しないよう制御する
　ことを特徴とする請求項５に記載の画像復号装置。
　前記復号手段は、前記逆量子化手段における補正処理を制御する逆量子化補正制御情報をさらに復号することを特徴とする請求項５または６に記載の画像復号装置。
　前記逆量子化手段は、前記予測手段における予測画像の生成方法に応じて、前記再生直交変換係数に対して異なる補正を行うことを特徴とする請求項５ないし７のいずれか１項に記載の画像復号装置。
　画像をブロック単位で符号化する画像符号化装置が行う画像符号化方法であって、
　前記画像符号化装置の予測手段が、画像における符号化対象の所定のサイズの着目ブロックに対し、符号化済みの画素から予測画像を生成し、前記着目ブロックと前記予測画像との差分である予測誤差を導出する予測工程と、
　前記画像符号化装置の変換手段が、前記予測工程で導出した前記予測誤差を周波数変換する変換工程と、
　前記画像符号化装置の量子化手段が、前記変換工程による周波数変換によって得られた直交変換係数を量子化する量子化工程と、
　前記画像符号化装置の符号化手段が、前記量子化工程により量子化された直交変換係数をエントロピー符号化する符号化工程と、
　前記画像符号化装置の逆量子化手段が、前記量子化工程により量子化された直交変換係数を逆量子化して再生直交変換係数を生成する逆量子化工程と
　を有し、
　前記逆量子化工程では前記再生直交変換係数を補正することを特徴とする画像符号化方法。
　画像をブロック単位で復号する画像復号装置が行う画像復号方法であって、
　前記画像復号装置の復号手段が、量子化された直交変換係数を復号する復号工程と、
　前記画像復号装置の逆量子化手段が、前記量子化された直交変換係数を逆量子化して再生直交変換係数を生成する逆量子化工程と、
　前記画像復号装置の逆変換手段が、前記再生直交変換係数を逆変換して予測誤差を導出する逆変換工程と、
　前記画像復号装置の予測手段が、予測画像を生成し、前記予測画像と前記予測誤差とを用いて着目ブロックを復号する予測工程と、を有し、
　前記逆量子化工程では前記再生直交変換係数を補正する
　ことを特徴とする画像復号方法。
　画像をブロック単位で符号化する画像符号化装置のコンピュータを、請求項１ないし４のいずれか１項に記載の画像符号化装置の各手段として機能させるためのコンピュータプログラム。
　画像をブロック単位で復号する画像復号装置のコンピュータを、請求項５ないし８のいずれか１項に記載の画像復号装置の各手段として機能させるためのコンピュータプログラム。