[go: up one dir, main page]

JP4705921B2 - 量子化マトリクスおよび動画像の復号化方法、復号化装置、プログラムおよび記録媒体 - Google Patents

量子化マトリクスおよび動画像の復号化方法、復号化装置、プログラムおよび記録媒体 Download PDF

Info

Publication number
JP4705921B2
JP4705921B2 JP2006549708A JP2006549708A JP4705921B2 JP 4705921 B2 JP4705921 B2 JP 4705921B2 JP 2006549708 A JP2006549708 A JP 2006549708A JP 2006549708 A JP2006549708 A JP 2006549708A JP 4705921 B2 JP4705921 B2 JP 4705921B2
Authority
JP
Japan
Prior art keywords
sequence
decoding
quantization matrix
value
difference value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2006549708A
Other languages
English (en)
Other versions
JP2007520948A (ja
JP2007520948A5 (ja
Inventor
眞也 角野
吉一郎 柏木
ジュファイ・ル
スン・リム チョン
タオ・チェン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Publication of JP2007520948A publication Critical patent/JP2007520948A/ja
Publication of JP2007520948A5 publication Critical patent/JP2007520948A5/ja
Application granted granted Critical
Publication of JP4705921B2 publication Critical patent/JP4705921B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、動画像を効率良く圧縮する画像符号化方法とそれを正しく復号化する画像復号化方法、画像符号化装置、画像復号化装置、量子化マトリクスの符号化および復号化方法、その装置およびプログラムに関する。
近年、音声、画像、その他の画素値を統合的に扱うマルチメディア時代を迎え、従来からの情報メディア,つまり新聞,雑誌,テレビ,ラジオ,電話等の情報を人に伝達する手段がマルチメディアの対象として取り上げられるようになってきた。一般に、マルチメディアとは、文字だけでなく、図形、音声、特に画像等を同時に関連づけて表すことをいうが、上記従来の情報メディアをマルチメディアの対象とするには、その情報をディジタル形式にして表すことが必須条件となる。
ところが、上記各情報メディアの持つ情報量をディジタル情報量として見積もってみると、文字の場合1文字当たりの情報量は1〜2バイトであるのに対し、音声の場合1秒当たり64Kbits(電話品質)、さらに動画については1秒当たり100Mbits(現行テレビ受信品質)以上の情報量が必要となり、上記情報メディアでその膨大な情報をディジタル形式でそのまま扱うことは現実的では無い。例えば、テレビ電話は、64Kbit/s〜1.5Mbit/sの伝送速度を持つサービス総合ディジタル網(ISDN : Integrated Services Digital Network)によってすでに実用化されているが、テレビ・カメラの映像をそのままISDNで送ることは不可能である。
そこで、必要となってくるのが情報の圧縮技術であり、例えば、テレビ電話の場合、ITU-T(国際電気通信連合 電気通信標準化部門)で勧告されたH.261やH.263規格の動画圧縮技術が用いられている。また、MPEG-1規格の情報圧縮技術によると、通常の音楽用CD(コンパクト・ディスク)に音声情報とともに画像情報を入れることも可能となる。
ここで、MPEG(Moving Picture Experts Group)とは、ISO/IEC(国際標準化機構 国際電気標準会議)で標準化された動画像信号圧縮の国際規格であり、MPEG-1は、動画像信号を1.5Mbit/sまで、つまりテレビ信号の情報を約100分の1にまで圧縮する規格である。また、MPEG-1規格では対象とする品質を伝送速度が主として約1.5Mbit/sで実現できる程度の中程度の品質としたことから、さらなる高画質化の要求をみたすべく規格化されたMPEG-2では、動画像信号を2〜15Mbit/sでTV放送品質を実現する。さらに現状では、MPEG-1,MPEG-2と標準化を進めてきた作業グループ(ISO/IEC JTC1/SC29/WG11) によって、MPEG-1,MPEG-2を上回る圧縮率を達成し、更に物体単位で符号化・復号化・操作を可能とし、マルチメディア時代に必要な新しい機能を実現するMPEG-4が規格化された。MPEG-4では、当初、低ビットレートの符号化方法の標準化を目指して進められたが、現在はインタレース画像も含む高ビットレートも含む、より汎用的な符号化に拡張されている。更に、現在は、ISO/IECとITU-Tが共同でより高圧縮率の次世代画像符号化方式として、MPEG-4AVCおよびITU H.264 の標準化活動が進んでいる。2002年8月の時点で、次世代画像符号化方式はコミッティー・ドラフト(CD)と呼ばれるものが発行されている。
一般に動画像の符号化では、時間方向および空間方向の冗長性を削減することによって情報量の圧縮を行う。そこで時間的な冗長性の削減を目的とする画面間予測符号化では、前方または後方のピクチャを参照してブロック単位で動きの検出および予測画像の作成を行い、得られた予測画像と符号化対象ピクチャとの差分値に対して符号化を行う。ここで、ピクチャとは1枚の画面を表す用語であり、プログレッシブ画像ではフレームを意味し、インタレース画像ではフレームもしくはフィールドを意味する。ここで、インタレース画像とは、1つのフレームが時刻の異なる2つのフィールドから構成される画像である。インタレース画像の符号化や復号化処理においては、1つのフレームをフレームのまま処理したり、2つのフィールドとして処理したり、フレーム内のブロック毎にフレーム構造またはフィールド構造として処理したりすることができる。
参照画像を用いずに画面内予測符号化を行うピクチャをIピクチャと呼ぶ。また、1枚のピクチャのみを参照し画面間予測符号化を行うピクチャをPピクチャと呼ぶ。また、同時に2枚のピクチャを参照して画面間予測符号化を行うことのできるピクチャをBピクチャと呼ぶ。Bピクチャは表示時間が前方もしくは後方から任意の組み合わせとして2枚のピクチャを参照することが可能である。参照画像(参照ピクチャ)は符号化および復号化の基本単位であるブロックごとに指定することができるが、符号化を行ったビットストリーム中に先に記述される方の参照ピクチャを第1参照ピクチャ、後に記述される方を第2参照ピクチャとして区別する。ただし、これらのピクチャを符号化および復号化する場合の条件として、参照するピクチャが既に符号化および復号化されている必要がある。
PピクチャまたはBピクチャの符号化には、動き補償画面間予測符号化が用いられている。動き補償画面間予測符号化とは、画面間予測符号化に動き補償を適用した符号化方式である。動き補償とは、単純に参照フレームの画素値から予測するのではなく、ピクチャ内の各部の動き量(以下、これを動きベクトルと呼ぶ)を検出し、当該動き量を考慮した予測を行うことにより予測精度を向上すると共に、データ量を減らす方式である。例えば、符号化対象ピクチャの動きベクトルを検出し、その動きベクトルの分だけシフトした予測値と符号化対象ピクチャとの予測残差を符号化することによりデータ量を減している。この方式の場合には、復号化の際に動きベクトルの情報が必要になるため、動きベクトルも符号化されて記録又は伝送される。
動きベクトルはマクロブロック単位で検出されており、具体的には、符号化対象ピクチャ側のマクロブロックを固定しておき、参照ピクチャ側のマクロブロックを探索範囲内で移動させ、基準ブロックと最も似通った参照ブロックの位置を見つけることにより、動きベクトルが検出される。
図1はビットストリームのデータ構造の例を示した説明図である。図1に示すようにビットストリームは以下のような階層構造を有している。ビットストリーム(Stream)は複数のグループ・オブ・ピクチャ(Group Of Picture)から構成される。グループ・オブ・ピクチャを符号化処理の基本単位とすることで動画像の編集やランダムアクセスが可能になっている。グループ・オブ・ピクチャは、複数のピクチャから構成され、各ピクチャは、Iピクチャ、PピクチャまたはBピクチャがある。各ピクチャはさらに複数のスライスから構成されている。スライスは、各ピクチャ内の帯状の領域であり、複数のマクロブロックから構成されている。ストリーム、GOP、ピクチャおよびスライスはさらにそれぞれの単位の区切りを示す同期信号(sync)と当該単位に共通のデータであるヘッダ(header)から構成されている。
また、ストリームが連続したビットストリームでなく、細切れのデータの単位であるパケット等で伝送する場合はヘッダ部とヘッダ以外のデータ部を分離して別に伝送してもよい。その場合は、図1のようにヘッダ部とデータ部が1つのビットストリームとなることはない。しかしながら、パケットの場合は、ヘッダ部とデータ部の伝送する順序が連続しなくても、対応するデータ部に対応するヘッダ部が別のパケットで伝送されるだけであり、1つのビットストリームとなっていなくても、概念は図1で説明した符号化ビットストリームの場合と同じである。
一般に人間の視覚特性は画像中の低周波数成分に敏感であり、高周波数成分は低周波数成分ほど感度が高くないといわれている。更に、画像信号は低周波数成分のエネルギーが高周波数成分のエネルギーよりも大きいことから、画像符号化は低周波数成分から高周波数成分の順序で行われる。その結果、低周波数成分の符号化に必要なビット数よりも高周波数成分の符号化に必要なビット数の方が多くなる。
以上の観点から、従来の符号化方法では、直交変換により得られる周波数毎の変換係数の量子化において、低周波数成分よりも高周波数成分に対応する量子化ステップを粗くしている。これにより、主観画質の劣化はわずかでありながら大幅に圧縮率を向上する方法が従来採用されている。
さて、低周波数成分に対して高周波数成分の量子化ステップをどの程度粗くするかについては画像信号に依存するため、画像に応じて各周波数成分の量子化ステップの大きさを変更する手法が採用されている。各周波数成分の量子化ステップを導出するために量子化マトリクスが用いられる。量子化マトリクスの例を図2に示す。図2の量子化マトリクスの例において、左上がDC成分、右方が水平高周波数成分、下方が垂直高周波数成分に対応する。また、数値が大きいほど量子化ステップが粗くなることを示す。量子化マトリクスは、通常各ピクチャ単位で変更可能となっている。各周波数成分の量子化ステップの大きさを示す値が固定長で符号化される。なお、量子化マトリクスの各成分と量子化ステップの値はほぼ比例関係にあるのが一般的であるが、必ずしもこれにこだわる必要は無く、両者の対応が明確に規定されていれば良い。
しかしながら、量子化マトリクスの各周波数成分の値は一定の範囲に集中していることから単純に固定長符号化を行うと符号化効率がよくないという問題がある。
本発明の目的は、量子化マトリクスの符号化効率を向上させた画像符号化方法、画像復号化方法、画像符号化装置、画像復号化装置、量子化マトリクスの符号化および復号化方法、その装置およびプログラムを提供することを目的とする。
上記目的を達成するため本発明の画像符号化方法は、画像をブロック単位の直交変換および量子化によって符号化するとともに、直交変換係数の各周波数に応じた量子化ステップを導出するための量子化マトリクスを符号化する画像符号化方法であって、前記量子化マトリクスの周波数成分毎に、周波数成分とその周波数成分に応じた所定値との差分値を求め、前記差分値を可変長符号に符号化し、前記可変長符号は、前記差分値が小さいほど短いか同じ長さの符号長を有する。ここで、所定値は、例えば最も出現頻度の高い周波数成分の値でもよいし、周波数成分の平均的な値を示す定数でもよいし、周波数成分毎に予め定められた値でもよい。
この構成によれば、周波数成分と所定値との差分値をとるので差分値は周波数成分よりも小さい値になり、周波数成分そのものを符号化するのではなく、差分値を符号化するので、可変長符号の符号長を短くし符号化効率を向上させることができる。
ここで、前記所定値は、直前に求められた差分値に対応する周波数成分の値としてもよい。
この構成によれば、周波数成分と直前の周波数成分とは通常は相関関係があるので、各差分値をより小さい値にすることができ、さらに符号化効率を向上させることができる。
ここで、前記差分値は、前記量子化マトリクスに含まれる周波数成分の低周波数から高周波数の順に求めてもよい。
この構成によれば、低周波数から高周波数の順に周波数成分が符号化されるので、周波数成分と直前の周波数成分とは同じくらいの値をとる確率が高く、より確実に各差分値を小さい値にすることができ、より一層符号化効率を向上させることができる。
ここで、前記差分値は、2のk乗(kは定数)で除算した剰余として求めてもよい。
この構成によれば、例えば、2の8乗(k=8)で割った剰余として差分値が表現される場合には、差分値を実質的に8ビットで表現できる値に小さくすることができ、さらに可変長符号のビット数を減らすことができる。
ここで、前記画像符号化方法は、さらに、連続する差分値0が量子化マトリクスの末尾に存在するかどうかを判定し、連続する差分値0が存在すると判定された場合に、前記連続する差分値0を可変長符号化しないようにしてもよい。
ここで、前記符号化方法は、さらに、前記可変長符号化した最後に終了符号を付加し、それ以降が符号化されていない連続する差分値0であることを示すようにしてもよい。
この構成によれば、同じ値をもつ複数の周波数成分が量子化マトリクスの末尾に連続している場合に、同じビット列をもつ複数の可変長符号を生成するのではなく、複数の周波数成分に対して可変長符号が1つだけ生成されるので、符号化効率をさらに向上させることができる。また、この場合、終了符号を付加することにより、画像復号化装置の復号処理の効率を向上させることができる。
また、記目的を達成するため本発明の画像復号化方法は、符号化された画像をブロック単位に逆量子化および逆直交変換によって復号化するとともに、符号化された量子化マトリクスを復号化する画像復号化方法であって、可変長符号化された量子化マトリクスを、周波数成分毎の差分値に可変長復号し、前記差分値と、周波数成分に応じた所定値とを加算することにより、量子化マトリクスの周波数成分を求め、前記可変長符号は、前記差分値が小さいほど短いか同じ長さの符号長を有する。
ここで、前記所定値は、直前の加算により求められた周波数成分の値としてもよい。
ここで、前記加算の順序は、周波数成分の低周波数から高周波数の順としてもよい。
ここで、前記周波数成分は、2のk乗(kは定数)で除算した剰余として求めてもよい。
この構成によれば、上記符号化方法によって符号化効率を向上させた可変長符号列を容易に復号化することができる。
ここで、前記画像復号化方法において、可変長符号化された量子化マトリクスから終了符号が検出された場合に、それ以降に後続する各周波数成分の値として、終了符号の直前の周波数成分と同じ値を出力してもよい。
この構成によれば、同じ値をもつ複数の周波数成分が量子化マトリクスの末尾に連続している場合に、1つの可変長符号から複数の周波数成分を復号化することができる。また、同じ値をもつ複数の周波数成分が量子化マトリクスの末尾に連続していることを、終了符号によって容易に判別することができる。
また、本発明の画像符号化装置、画像復号化装置、プログラムについても上記と同様の構成および効果を有する。
以下、本発明の実施の形態1について、図3から図17を用いて説明する。
図3は実施の形態1における画像符号化装置の構成を示すブロック図である。
動画像符号化装置1は、入力される画像信号Vin を圧縮符号化して可変長符号等のビットストリームに変換した画像符号化信号Str を出力する装置であり、動き検出ユニットME、動き補償ユニットMC、減算ユニットSub、直交変換ユニットT、量子化ユニットQ、逆量子化ユニットIQ、逆直交変換ユニットIT、加算ユニットAdd、ピクチャメモリPicMem、スイッチSW、および可変長符号化ユニットVLCを備えている。
画像信号Vin は、減算ユニットSubおよび動き検出ユニットMEに入力される。減算ユニットSubは、入力された画像信号Vin と予測画像の差分値を計算し、直交変換ユニットTに出力する。直交変換ユニットTは、差分値を周波数係数に変換し、量子化ユニットQに出力する。
量子化ユニットQは、減算ユニットSub入力されたブロック単位の周波数係数を外部から入力された量子化マトリクスWMを参照して導出した量子化ステップで量子化し、量子化値Qcoefを可変長符号化ユニットに出力する。
逆量子化ユニットIQは、量子化マトリクスWMを参照して導出した量子化ステップで量子化値Qcoefを逆量子化して周波数係数に復元し、逆直交変換ユニットITに出力する。
逆直交変換ユニットITは、周波数係数から画素差分値に逆周波数変換し、加算ユニットAddに出力する。加算ユニットAddは、画素差分値と動き補償ユニットMCから出力される予測画像とを加算して復号化画像とする。スイッチSWは、当該復号化画像の保存が指示された場合にONになり、復号化画像はピクチャメモリPicMemに保存される。
一方、画像信号Vin がマクロブロック単位で入力された動き検出ユニットMEは、ピクチャメモリPicMemに格納されている復号化画像を探索対象とし、最も入力画像信号に近い画像領域を検出することによってその位置を指し示す動きベクトルMVを決定する。動きベクトル検出はマクロブロックをさらに分割したブロック単位で行われる。このとき、複数のピクチャを参照ピクチャとして使用することができるため、参照するピクチャを指定するための識別番号(参照インデックスIndex)がブロックごとに必要となる。参照インデックスIndexによって、ピクチャメモリPicMem中の各ピクチャが有するピクチャ番号との対応を取ることにより参照ピクチャを指定することが可能となる。
動き補償ユニットMCでは、上記処理によって検出された動きベクトルおよび参照インデックスIndexを用いて、ピクチャメモリPicMemに格納されている復号化画像から予測画像に最適な画像領域を取り出す。
可変長符号化ユニットVLCは、量子化マトリクスWM、量子化値Qcoef、参照インデックスIndexおよび動きベクトルMVを可変長符号化して符号化ストリームStrとする。そのため、可変長符号化ユニットVLCは、第1符号化部と第2符号化部とを内部に有する。第1符号化部(以下WM符号化部と呼ぶ。)は、量子化マトリクスWMを可変長符号化する。第2符号化部は、量子化マトリクスWM以外の、量子化値Qcoef、参照インデックスIndexおよび動きベクトルMV等を可変長符号化する。WM符号化部は、前記量子化マトリクスの周波数成分毎に、周波数成分とその周波数成分に応じた所定値との差分値を求め、前記差分値を可変長符号に符号化する。この可変長符号は、一部を除いて前記差分値が小さいほど短い符号長を有している。
図4は、WM符号化部の構成を示すブロック図である。同図のようにWM符号化部は、減算器41、Wバッファ42、オフセット決定部43、加算器44、ブロックバッファ45、個数判定部46、終了符号保持部47、スイッチ48、可変長符号化部49を備える。
減算器41は、前記量子化マトリクスの周波数成分毎に、周波数成分とその周波数成分に応じた所定値との差分値を求める。所定値は、例えば最も出現頻度の高い周波数成分の値でもよいし、周波数成分の平均的な値を示す定数でもよいし、周波数成分毎に予め定められた値でもよい。本実施の形態では、所定値は、直前に求められた差分値に対応する周波数成分の値である。この場合、減算器41は、外部から入力された現在の周波数成分W[i]と、Wバッファ42に保持された直前の周波数成分W[i-1]との差分値を求める。周波数成分W[i]と直前の周波数成分W[i-1]とは通常は相関関係があるので、各差分値をより小さい値とすることができる。なお、W[i]は符号化順序がi番目の周波数成分を表す。
図5A〜図5Dは、減算器41に入力される量子化マトリクスの周波数成分の順序例を示す図である。この順序は、減算器41に入力される量子化マトリクスのスキャン順序である。画像符号化の直交変換では、4x4画素単位と8x8画素単位の2通りが最もよく使用される。そこで、図5Aと図5Bに4x4画素単位の例、図5Cと図5Dに8x8画素単位の例を示す。本実施の形態では量子化マトリクスの各成分を個別に図8A〜図8Cの何れかで符号化することから、図5Aや図5Cのように低周波数成分から高周波数成分の順番に符号化したとしても、図5Bや図5Bのように単純に水平順序で符号化したとしても符号化効率に差は無い。
図6Aは、減算器41に入力される量子化マトリクスの周波数成分の一部を示す。同図のW[0]、W[1]、W[2]、W[3]、・・・は図5Bの符号化順序に従っている。
Wバッファ42は、直前の周波数成分W[i-1]を保持するバッファである。符号化開始前に、Wバッファ42は、DC成分として最も取り得る代表的な値を初期値W[−1]として保持している。本実施形態では初期値W[−1]は8とする。なお、Wバッファ42は、直前の周波数成分W[i-1]を保持する代わりに、周波数成分に応じた所定値Kを予め保持するようにしてもよい。
オフセット決定部43は、減算器41からの差分(W[i]−W[i-1])を2のk乗(ここではk=8)で除算した剰余に変換するためのオフセット値を決定する。すなわち、(W[i]−W[i-1])にオフセットを加算した結果が-128から127までの値となるように、-256、0もしくは256のいずれかの値を出力する。
加算器44は、減算器41からの差分値(W[i]−W[i-1])とオフセット決定部43からのオフセット値とを加算することにより差分値D[i]を算出する。なお、D[i]は符号化順序がi番目の差分値を表す。
図6Bは、加算器44により算出された差分値D[i]の一例を示す。同図の差分値D[0]、D[1]、D[2]、D[3]・・・は、図6Aの周波数成分W[0]、W[1]、W[2]、W[3]・・・に対応する例である。
ブロックバッファ45は、加算器44から入力される差分値D[i]を1ブロック分(1量子化マトリクス分)保持するバッファである。
個数判定部46は、スキャン順序の最後(ブロックの最後)に連続して存在する差分値0(W[i]−W[i-1]=0)の個数をカウントし、ブロックバッファ45に保持されたD[0]〜D[M]を出力させるように48を制御する。ここで、D[M]は、上記連続して存在する差分値0の先頭の差分値0の直前の差分値である。
終了符号保持部47は、量子化マトリクスの可変長符号の終端を示す終了符号を保持する。終了符号は、差分値D[i]がとり得ない値であればよい。
スイッチ48は、ブロックバッファ45に保持されたD[0]〜D[M]を出力させるようにブロックバッファ45出力を選択した後、1個の終了符号を出力させるように終了符号保持部47出力を選択する。つまり、スイッチ48の出力は、量子化マトリクスの先頭に対応する差分値D[0]から最後に連続して存在する差分値0の直前の差分値D[M]までと、1つの終了符号である。なお、個数判定部46でカウントされた、スキャン順序の最後(ブロックの最後)に連続して存在する差分値0(W[i]−W[i-1]=0)の個数が0の場合には、スイッチ48は終了符号を出力しない。
可変長符号化部49は、ブロックバッファ45からスイッチ48を介して入力される差分値と、終了符号とを、差分値が小さいほど短いか同じ長さの符号長となるように可変長符号化する。
図6Cは、可変長符号化部49により図8Cの符号を用いて符号化された符号の具体例を示す。同図において、W[0]〜W[4]、D[0]〜D[4]は図6A、図6Bに対応している。可変長符号化部49による符号は、例えば、差分値が0のとき符号長が1ビットであり、差分値が1のとき符号長が3ビットである。このように、可変長符号化部49による可変長符号は、差分値が小さいほど短い符号長となっている。また、周波数成分W[30]〜W[63]まではいずれも同じ値64となっている。この場合、差分値D[30]〜D[63]は連続して0になる。この場合、差分値D[30]〜D[63]は符号化されない。差分値D[30]の0に対する符号”1”の代わりに終了符号が可変長符号化されることになる。
図7は、WM符号化部における量子化マトリクスの詳細な符号化処理を示すフローチャートである。同図においてNumは量子化マトリクス中の周波数成分の個数(16、64など)、i、jはそれぞれ0から(Num-1)までをカウントするための変数である。
WM符号化部は、まず、Wバッファ42に初期値W[−1](例えば8)を保持させ(S71)、ループ1に示す処理(S72〜S77)で量子化マトリクスの各周波数成分について差分値を求めてブロックバッファ45に格納し、その後ループ2(S78〜S81)に示す処理で差分値の可変長符号化を行う。
ループ1において、減算器41は、外部から入力された現在の周波数成分W[i]と、Wバッファ42に保持された直前の周波数成分W[i-1]との差分値Dを求める(S73)。オフセット決定部43は、減算器41からの差分Dを2のk乗(ここではk=8)をで除算した剰余に変換するためのオフセット値を決定する(S74)。例えばW[i]が−256〜+254の値を取り得る場合、オフセット決定部43は、Dが128以上の場合にオフセット値は−256、Dが−128よりも小さいときオフセット値は256、Dがそれ以外のときオフセット値は0と決定する。これにより、オフセット値加算後のD(つまりD[i])は、−128〜+127の範囲内の、正の値だけでなく負の値も含めた剰余となる。これにより、差分値D[i]の取り得る値が小さくなるので、図8Cの符号を用いて符号化した場合のD[i]の可変長符号も短くなる。
加算器44は、減算器41からの差分値D(=W[i]−W[i-1])とオフセット決定部43からのオフセット値とを加算することにより差分値D[i]を算出する(S75〜76)。
ループ2において、個数判定部46は、D[i]列の最後に連続して存在する差分値0の個数を判定し(S79)、その連続する差分値0の直前の差分値D[M]までをスイッチ48をブロックバッファ45出力に接続し、その後終了符号保持部47出力に接続する。
可変長符号化部49は、ブロックバッファ45からスイッチ48を介して入力される差分値D[i]と、終了符号保持部47からスイッチ48から入力される終了符号を符号化する(S82)。終了符号を、D[i]の取り得ない値であればよく、ここでは−W[M]つまりW[M]=0としている。量子化マトリクスの周波数成分は正数であるため、W[M]が0であることを終了符号として識別できるのである。
図8A〜図8Cは可変長符号化部49における可変長符号化の例を示す説明図である。いずれも指数ゴロム符号(Exponential Golom code)を利用している。
図8Aは、可変長符号の第1の例を示す。同図では、符号語(code)と、符号化前の差分値(value)の関係を示す。この例は、差分値が取り得る値が正数である場合に利用可能である。大きな差分値ほど生起頻度が小さく符号長が長い。従って小さな差分値には短い符号語が割り当てられている。符号語と各成分の値との変換は図8Aに示す算術式で容易に導出できる。例えば、差分値valueが7の場合、7=4+3=(2の2乗+二進数”11” )と表現される。これに対する符号語codeは、”000(3個の0)”と”1”と”11”を並べたビット列になる。図8AにおけるNはvalueを超えない直近の2のべき乗のべき数である。X012・・・XN-1は、valueから直近の2のべき乗を減じた値を示すビット列である。
図8Bは、可変長符号の第2の例を示す。同図では、value欄に量子化マトリクスの周波数成分W[i](つまり、所定値K+差分値)を記してある。量子化マトリクスの成分W[i]の値が所定値Kを最も取りやすい場合に適している。所定値Kの生起頻度が高いことから成分の値がKの場合に符号長が最短になり、成分の値がKから離れると符号長が長くなる。所定値Kは例えばW[i-1]でよいが、予め定められた定数でもよい。
図8Cは、可変長符号化の第3の例を示す。同図では、符号語(code)と、符号化前の差分値(value)の関係を示す。この例は、差分値が取り得る値が正数だけでなく負数である場合に利用可能である。図5A〜図5Dに示した順序で量子化マトリクスの各成分を符号化する際に、隣接する周波数成分W[i-1]の値は相関が大きい。従って、図5A〜図5Dの何れか順序で符号化する際に、直前に符号化した成分の値W[i-1]との差分値を符号化することで、差分値が0近傍に集中する。その結果、図8Cに示すように0近傍の値の符号化には短い符号長で0から離れた値は長い符号長の符号語を用いることで、可変長符号のビット数が更に削減できる。
図9A〜図9Cは、量子化マトリクスおよびストリーム中に符号化された量子化マトリクスのデータ構造を示す図である。同図において、Headerは図1のStream、GOP、もしくはピクチャのヘッダに相当する。図9Aは量子化マトリクスの周波数成分の配列を示す図である。Wi,jはi行j列の量子化マトリクスの成分を表している。図9Bと図9Cは量子化マトリクスの各成分の符号化されたデータがヘッダ部にどのように配置されているかを示している。量子化マトリクスを符号化したビットストリームがWeightingMatrixである。図9Bが図5Cの順序で符号化されたストリームであり、図9Cが図5Dの順序で符号化されたストリームである。なお、図9Bと図9Cのストリーム中でWi,jと記載されているのはWi,jに相当する符号化された可変長符号という意味である。
以上説明してきたように本実施の形態におけるWM符号化部によれば、周波数成分W[i]と所定値Kとの差分値D[i]をとるので、差分値D[i]は周波数成分W[i]よりも小さい値になる。W符号化部は、周波数成分W[i]そのものを符号化するのではなく、差分値D[i]を符号化するので、可変長符号の符号長を短くし符号化効率を向上させることができる。
また、所定値Kとして直前の周波数成分W[i-1]を用いることにより、各差分値D[i]をより小さい値にすることができ、さらに符号化効率を向上させることができる。周波数成分W[i]と直前の周波数成分W[i-1]とは通常は相関関係があるからである。
また、周波数成分W[i]は、低周波数から高周波数の順に周波数成分が符号化されるので、周波数成分W[i]と直前の周波数成分W[i-1]とは同じくらいの値をとる確率が高く、より確実に各差分値D[i]を小さい値にすることができ、より一層符号化効率を向上させることができる。
さらに、差分値D[i]が2の8乗(k=8)で割った剰余として表現される場合には、差分値を実質的に8ビットで表現できる値に小さくすることができ、さらに可変長符号のビット数を減らすことができる。
また、同じ値をもつ複数の周波数成分が量子化マトリクスの末尾に連続している場合に、同じビット列をもつ複数の可変長符号を生成するのではなく、複数の周波数成分に対して可変長符号が1つも生成されないので、符号化効率をさらに向上させることができる。また、この場合、終了符号を付加することにより、画像復号化装置の復号処理の効率を向上させることができる。
図10は本実施の形態1における画像復号化装置のブロック図である。同図において、図3の画像符号化装置のブロック図と同じ動作をするユニットは同じ番号を付し、説明を省略する。
可変長復号化ユニットVLDは、符号化ストリームStrを復号化し、量子化マトリクスWM、量子化値Qcoef、参照インデックスIndexおよび動きベクトルMVを出力する。
そのため、可変長復号ユニットVLDは、第1復号化部と第2復号化部とを内部に有する。第1復号化部(以下WM復号化部と呼ぶ。)は、符号化された量子化マトリクスWMを可変長復号化する。第2復号化部は、符号化された量子化マトリクスWM以外の、符号化された量子化値Qcoef、参照インデックスIndexおよび動きベクトルMV等を可変長復号化する。WM復号化部は、可変長符号化された量子化マトリクスを、周波数成分毎の差分値に可変長復号し、前記差分値と周波数成分に応じた所定値とを加算することにより、量子化マトリクスの周波数成分を求める。
量子化マトリクスQM、量子化値Qcoef、参照インデックスIndexおよび動きベクトルMVは、ピクチャメモリPicMem、動き補償ユニットMCおよび逆量子化ユニットIQに入力され復号化処理が行われるが、その動作は図3の画像復号化装置のブロック図で説明済みである。
図11は、WM復号化部の構成を示すブロック図である。WM復号化部は、可変長復号化部51、加算器52、乗余計算部53、スイッチ54、Wバッファ55、スイッチ56、最終係数判定部57を備える。
可変長復号化部51は、可変長符号化された周波数成分の可変長符号を、周波数成分毎の差分値D[i]に復号化する。
加算器52は、可変長復号化部51からの差分値D[i]と、Wバッファ55からの直前の周波数成分W[i-1]の値とを加算する。
乗余計算部53は、加算器52からの加算結果に2のk乗を加算し、さらに2のk乗の剰余を算出することにより、周波数成分W[i]を求める。具体的には、乗余計算部53は、(D[i]+W[i-1]+256)%256を算出する。ここで、%は(256で)除算した剰余を得る演算を示す。
スイッチ54は、乗余計算部53から終了符号が出力されていない間はオン、終了符号が出力されるとオフする。
Wバッファ55は、乗余計算部53からスイッチ54を介して入力される周波数成分W[i]を保持し、次のサイクルで周波数成分W[i-1]として加算器52に出力する。また、Wバッファ55は初期値としてW[i-1](例えば8)を保持している。
スイッチ56は、乗余計算部53から終了符号が出力されていない間は、乗余計算部53からスイッチ54を介して入力される周波数成分W[i]を選択し、終了符号が出力された後は、Wバッファ55を選択する。
最終係数判定部57は、乗余計算部53から終了符号が出力されたか否かを判定し、判定結果に応じてスイッチ54およびスイッチ56を制御する。
以上のようにして、全ての周波数成分に対応W[i]を復号できる。なお、終了符号が検出されなくても、ブロックに含まれる全ての周波数成分と同数の差分値D[i]を復号化した場合にはその時点で量子化マトリクスの復号化を終了する。
図12は、WM復号化部におけるWM復号化処理を示すフローチャートである。同図においてNumは量子化マトリクス中の周波数成分の個数(16、64など)、iは0から(Num-1)までをカウントするための変数、jはiから(Num-1)までをカウントするための変数である。同図のように、WM復号化部は、まず初期値W[i-1]をWバッファ55に保持させ(S121)、ループ1(S122〜127)において可変長復号および出力し、終了符号が検出された後はループ2(S128〜130)において同じ値をもつ連続する周波数係数を出力する。
ループ1において、可変長復号化部51は入力された可変長符号を差分値D[i]に復号化する(S123)。さらに、加算器52は可変長復号化部51からの差分値と、Wバッファ55からの直前の周波数成分とを加算し、乗余計算部53は、剰余W=(D[i]+W[i-1]+256)%256 を算出する(S124)。最終係数判定部57は、この剰余Wが終了符号であるか否か(ここでは正であるか否か)を判定する(S125)。終了符号でないと判定された場合には、剰余Wは周波数成分W[i-1]として乗余計算部53からスイッチ56を介して出力され、同時にスイッチ54を介してWバッファ55に保持される(S126)。終了符号であると判定された場合には、ループ2の処理が実行される。
ループ2では、同じ値をもつ複数の周波数成分が量子化マトリクスの末尾に連続している場合に、周波数成分W[i-1]を周波数成分W[i]として連続して出力する。すなわち、後続する各周波数成分W[i]〜W[Num-1]として、Wバッファ55に保持されたW[i-1]をスイッチ56を介して出力する(S129)。
以上説明してきたように本実施の形態におけるWM復号化部によれば、WM符号化部によって差分符号化された可変長符号を正しく復号する。さらに、同じ値をもつ複数の周波数成分が量子化マトリクスの末尾に連続している場合に、WM復号化部は、その複数の周波数成分を1つの可変長符号から復号化することができる。その際、同じ値をもつ複数の周波数成分が量子化マトリクスの末尾に連続していることを、終了符号によって容易に判別することができる。
さらに、上記各実施の形態で示した画像符号化方法および画像復号化方法を実現するためのプログラムを、フレキシブルディスク等の記録媒体に記録するようにすることにより、上記各実施の形態で示した処理を、独立したコンピュータシステムにおいて簡単に実施することが可能となる。
図13A〜Cは、上記各実施の形態の画像符号化方法および画像復号化方法を、フレキシブルディスク等の記録媒体に記録されたプログラムを用いて、コンピュータシステムにより実施する場合の説明図である。
図13Bは、フレキシブルディスクの正面からみた外観、断面構造、及びフレキシブルディスクを示し、図13Aは、記録媒体本体であるフレキシブルディスクの物理フォーマットの例を示している。フレキシブルディスクFDはケースF内に内蔵され、該ディスクの表面には、同心円状に外周からは内周に向かって複数のトラックTrが形成され、各トラックは角度方向に16のセクタSeに分割されている。従って、上記プログラムを格納したフレキシブルディスクでは、上記フレキシブルディスクFD上に割り当てられた領域に、上記プログラムが記録されている。
また、図13Cは、フレキシブルディスクFDに上記プログラムの記録再生を行うための構成を示す。画像符号化方法および画像復号化方法を実現する上記プログラムをフレキシブルディスクFDに記録する場合は、コンピュータシステムCsから上記プログラムをフレキシブルディスクドライブを介して書き込む。また、フレキシブルディスク内のプログラムにより画像符号化方法および画像復号化方法を実現する上記画像符号化方法および画像復号化方法をコンピュータシステム中に構築する場合は、フレキシブルディスクドライブによりプログラムをフレキシブルディスクから読み出し、コンピュータシステムに転送する。
なお、上記説明では、記録媒体としてフレキシブルディスクを用いて説明を行ったが、光ディスクを用いても同様に行うことができる。また、記録媒体はこれに限らず、ICカード、ROMカセット等、プログラムを記録できるものであれば同様に実施することができる。
さらにここで、上記実施の形態で示した画像符号化方法および画像復号化方法の応用例とそれを用いたシステムを説明する。
図14は、コンテンツ配信サービスを実現するコンテンツ供給システムex100の全体構成を示すブロック図である。通信サービスの提供エリアを所望の大きさに分割し、各セル内にそれぞれ固定無線局である基地局ex107〜ex110が設置されている。
このコンテンツ供給システムex100は、例えば、インターネットex101にインターネットサービスプロバイダex102および電話網ex104、および基地局ex107〜ex110を介して、コンピュータex111、PDA(personal digital assistant)ex112、カメラex113、携帯電話ex114、カメラ付きの携帯電話ex115などの各機器が接続される。
しかし、コンテンツ供給システムex100は図14のような組合せに限定されず、いずれかを組み合わせて接続するようにしてもよい。また、固定無線局である基地局ex107〜ex110を介さずに、各機器が電話網ex104に直接接続されてもよい。
カメラex113はデジタルビデオカメラ等の動画撮影が可能な機器である。また、携帯電話は、PDC(Personal Digital Communications)方式、CDMA(Code Division Multiple Access)方式、W−CDMA(Wideband-Code Division Multiple Access)方式、若しくはGSM(Global System for Mobile Communications)方式の携帯電話機、またはPHS(Personal Handyphone System)等であり、いずれでも構わない。
また、ストリーミングサーバex103は、カメラex113から基地局ex109、電話網ex104を通じて接続されており、カメラex113を用いてユーザが送信する符号化処理されたデータに基づいたライブ配信等が可能になる。撮影したデータの符号化処理はカメラex113で行っても、データの送信処理をするサーバ等で行ってもよい。また、カメラ116で撮影した動画データはコンピュータex111を介してストリーミングサーバex103に送信されてもよい。カメラex116はデジタルカメラ等の静止画、動画が撮影可能な機器である。この場合、動画データの符号化はカメラex116で行ってもコンピュータex111で行ってもどちらでもよい。また、符号化処理はコンピュータex111やカメラex116が有するLSIex117において処理することになる。なお、画像符号化・復号化用のソフトウェアをコンピュータex111等で読み取り可能な記録媒体である何らかの蓄積メディア(CD−ROM、フレキシブルディスク、ハードディスクなど)に組み込んでもよい。さらに、カメラ付きの携帯電話ex115で動画データを送信してもよい。このときの動画データは携帯電話ex115が有するLSIで符号化処理されたデータである。
このコンテンツ供給システムex100では、ユーザがカメラex113、カメラex116等で撮影しているコンテンツ(例えば、音楽ライブを撮影した映像等)を上記実施の形態同様に符号化処理してストリーミングサーバex103に送信する一方で、ストリーミングサーバex103は要求のあったクライアントに対して上記コンテンツデータをストリーム配信する。クライアントとしては、上記符号化処理されたデータを復号化することが可能な、コンピュータex111、PDAex112、カメラex113、携帯電話ex114等がある。このようにすることでコンテンツ供給システムex100は、符号化されたデータをクライアントにおいて受信して再生することができ、さらにクライアントにおいてリアルタイムで受信して復号化し、再生することにより、個人放送をも実現可能になるシステムである。
このシステムを構成する各機器の符号化、復号化には上記各実施の形態で示した画像符号化装置あるいは画像復号化装置を用いるようにすればよい。
その一例として携帯電話について説明する。
図15は、上記実施の形態で説明した画像符号化方法および画像復号化方法を用いた携帯電話ex115を示す図である。携帯電話ex115は、基地局ex110との間で電波を送受信するためのアンテナex201、CCDカメラ等の映像、静止画を撮ることが可能なカメラ部ex203、カメラ部ex203で撮影した映像、アンテナex201で受信した映像等が復号化されたデータを表示する液晶ディスプレイ等の表示部ex202、操作キーex204群から構成される本体部、音声出力をするためのスピーカ等の音声出力部ex208、音声入力をするためのマイク等の音声入力部ex205、撮影した動画もしくは静止画のデータ、受信したメールのデータ、動画のデータもしくは静止画のデータ等、符号化されたデータまたは復号化されたデータを保存するための記録メディアex207、携帯電話ex115に記録メディアex207を装着可能とするためのスロット部ex206を有している。記録メディアex207はSDカード等のプラスチックケース内に電気的に書換えや消去が可能な不揮発性メモリであるEEPROM(Electrically Erasable and Programmable Read Only Memory)の一種であるフラッシュメモリ素子を格納したものである。
さらに、携帯電話ex115について図16を用いて説明する。携帯電話ex115は表示部ex202及び操作キーex204を備えた本体部の各部を統括的に制御するようになされた主制御部ex311に対して、電源回路部ex310、操作入力制御部ex304、画像符号化部ex312、カメラインターフェース部ex303、LCD(Liquid Crystal Display)制御部ex302、画像復号化部ex309、多重分離部ex308、記録再生部ex307、変復調回路部ex306及び音声処理部ex305が同期バスex313を介して互いに接続されている。
電源回路部ex310は、ユーザの操作により終話及び電源キーがオン状態にされると、バッテリパックから各部に対して電力を供給することによりカメラ付ディジタル携帯電話ex115を動作可能な状態に起動する。
携帯電話ex115は、CPU、ROM及びRAM等でなる主制御部ex311の制御に基づいて、音声通話モード時に音声入力部ex205で集音した音声信号を音声処理部ex305によってディジタル音声データに変換し、これを変復調回路部ex306でスペクトラム拡散処理し、送受信回路部ex301でディジタルアナログ変換処理及び周波数変換処理を施した後にアンテナex201を介して送信する。また携帯電話機ex115は、音声通話モード時にアンテナex201で受信した受信信号を増幅して周波数変換処理及びアナログディジタル変換処理を施し、変復調回路部ex306でスペクトラム逆拡散処理し、音声処理部ex305によってアナログ音声信号に変換した後、これを音声出力部ex208を介して出力する。
さらに、データ通信モード時に電子メールを送信する場合、本体部の操作キーex204の操作によって入力された電子メールのテキストデータは操作入力制御部ex304を介して主制御部ex311に送出される。主制御部ex311は、テキストデータを変復調回路部ex306でスペクトラム拡散処理し、送受信回路部ex301でディジタルアナログ変換処理及び周波数変換処理を施した後にアンテナex201を介して基地局ex110へ送信する。
データ通信モード時に画像データを送信する場合、カメラ部ex203で撮像された画像データをカメラインターフェース部ex303を介して画像符号化部ex312に供給する。また、画像データを送信しない場合には、カメラ部ex203で撮像した画像データをカメラインターフェース部ex303及びLCD制御部ex302を介して表示部ex202に直接表示することも可能である。
画像符号化部ex312は、本願発明で説明した画像符号化装置を備えた構成であり、カメラ部ex203から供給された画像データを上記実施の形態で示した画像符号化装置に用いた符号化方法によって圧縮符号化することにより符号化画像データに変換し、これを多重分離部ex308に送出する。また、このとき同時に携帯電話機ex115は、カメラ部ex203で撮像中に音声入力部ex205で集音した音声を音声処理部ex305を介してディジタルの音声データとして多重分離部ex308に送出する。
多重分離部ex308は、画像符号化部ex312から供給された符号化画像データと音声処理部ex305から供給された音声データとを所定の方式で多重化し、その結果得られる多重化データを変復調回路部ex306でスペクトラム拡散処理し、送受信回路部ex301でディジタルアナログ変換処理及び周波数変換処理を施した後にアンテナex201を介して送信する。
データ通信モード時にホームページ等にリンクされた動画像ファイルのデータを受信する場合、アンテナex201を介して基地局ex110から受信した受信信号を変復調回路部ex306でスペクトラム逆拡散処理し、その結果得られる多重化データを多重分離部ex308に送出する。
また、アンテナex201を介して受信された多重化データを復号化するには、多重分離部ex308は、多重化データを分離することにより画像データの符号化ビットストリームと音声データの符号化ビットストリームとに分け、同期バスex313を介して当該符号化画像データを画像復号化部ex309に供給すると共に当該音声データを音声処理部ex305に供給する。
次に、画像復号化部ex309は、本願発明で説明した画像復号化装置を備えた構成であり、画像データの符号化ビットストリームを上記実施の形態で示した符号化方法に対応した復号化方法で復号することにより再生動画像データを生成し、これをLCD制御部ex302を介して表示部ex202に供給し、これにより、例えばホームページにリンクされた動画像ファイルに含まれる動画データが表示される。このとき同時に音声処理部ex305は、音声データをアナログ音声信号に変換した後、これを音声出力部ex208に供給し、これにより、例えばホームページにリンクされた動画像ファイルに含まる音声データが再生される。
なお、上記システムの例に限られず、最近は衛星、地上波によるディジタル放送が話題となっており、図17に示すようにディジタル放送用システムにも上記実施の形態の少なくとも画像符号化装置または画像復号化装置のいずれかを組み込むことができる。具体的には、放送局ex409では映像情報の符号化ビットストリームが電波を介して通信または放送衛星ex410に伝送される。これを受けた放送衛星ex410は、放送用の電波を発信し、この電波を衛星放送受信設備をもつ家庭のアンテナex406で受信し、テレビ(受信機)ex401またはセットトップボックス(STB)ex407などの装置により符号化ビットストリームを復号化してこれを再生する。また、記録媒体であるCDやDVD等の蓄積メディアex402に記録した符号化ビットストリームを読み取り、復号化する再生装置ex403にも上記実施の形態で示した画像復号化装置を実装することが可能である。この場合、再生された映像信号はモニタex404に表示される。また、ケーブルテレビ用のケーブルex405または衛星/地上波放送のアンテナex406に接続されたセットトップボックスex407内に画像復号化装置を実装し、これをテレビのモニタex408で再生する構成も考えられる。このときセットトップボックスではなく、テレビ内に画像復号化装置を組み込んでも良い。また、アンテナex411を有する車ex412で衛星ex410からまたは基地局ex107等から信号を受信し、車ex412が有するカーナビゲーションex413等の表示装置に動画を再生することも可能である。
更に、画像信号を上記実施の形態で示した画像符号化装置で符号化し、記録媒体に記録することもできる。具体例としては、DVDディスクex421に画像信号を記録するDVDレコーダや、ハードディスクに記録するディスクレコーダなどのレコーダex420がある。更にSDカードex422に記録することもできる。レコーダex420が上記実施の形態で示した画像復号化装置を備えていれば、DVDディスクex421やSDカードex422に記録した画像信号を再生し、モニタex408で表示することができる。
なお、カーナビゲーションex413の構成は例えば図16に示す構成のうち、カメラ部ex203とカメラインターフェース部ex303、画像符号化部ex312を除いた構成が考えられ、同様なことがコンピュータex111やテレビ(受信機)ex401等でも考えられる。
また、上記携帯電話ex114等の端末は、符号化器・復号化器を両方持つ送受信型の端末の他に、符号化器のみの送信端末、復号化器のみの受信端末の3通りの実装形式が考えられる。
なお、図3、図4、図10、図11に示したブロック図の各機能ブロックは典型的には集積回路装置であるLSIとして実現される。このLSIは1チップ化されても良いし、複数チップ化されても良い。(例えばメモリ以外の機能ブロックが1チップ化されていても良い。)ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてありえる。
また、各機能ブロックのうち、データを格納するユニットだけ1チップ化せずに、本実施形態の記録媒体115のように別構成としても良い。
なお、図3、図4、図10、図11に示したブロック図の各機能ブロックおよび図7、図12に示したフローチャートにおいて、中心的な部分はプロセッサおよびプログラムによっても実現される。
このように、上記実施の形態で示した画像符号化方法および画像復号化方法を上述したいずれの機器・システムに用いることは可能であり、そうすることで、上記実施の形態で説明した効果を得ることができる。
以下では、本発明の実施の形態2について説明する。
本発明は、画面内予測を用いる動画像符号化システムにおけるマトリクスの量子化を可能にするものであり、量子化したマトリクスの表現を可能にするものである。特に、符号付き指数ゴロム符号に適した巡回差分値の生成に関する。
従来、動画像符号化において量子化マトリクスが用いられており、Exp-Golomb符号が適用できることも知られている。また従来から、動画像の圧縮処理において、動画像符号は対応するセマンティクスとともに階層構造を持つシンタクス構造で表現され、ロッシー符号化およびロスレス符号化、または可変長符号化を用いている。さらに、変換ドメイン量子化も知られており活用されてきた。
ここでは量子化重み付けマトリクスを用いて動画像圧縮を表現、実行し、可能にする方法およびプログラムについて説明する。本発明の特徴は以下に挙げるとおりである。
1. 画面内符号化を用いる動画像符号化システムにおいて量子化マトリクスを伝送し、表現することを可能にする。
2. 整数に基づき、かつ除算を必要としない演算によって実現される量子化重み付けマトリクスを定義し、実行する。
3. 量子化マトリクスを、符号化効率を上げることが可能な巡回差分符号および指数ゴロム符号化する。
4. 冗長な重み付け値を通信伝送データで伝送せず、デコーダ側で導出できるような量子化マトリクスとして表現する。
0. 量子化マトリクスの差分符号化とは
量子化マトリクスの各成分を符号化するため、まずマトリクス成分を1次元の配列にマップさせる。このマッピングでは、MPEG-4 Part 10 (MPEG-2およびMPEG-4 Part 2にも同様の定義がある)に記述されているジグザグパターンを用いる。図5(a)および図5(b)にジグザグパターンの例を示す。変換により得られた1次元の配列は、8×8の量子化マトリクスの場合64個の要素を含み、4×4の量子化マトリクスの場合16個の要素を含む。上記規格の定義によれば、含まれる要素は1以上255以下の正の整数である。
従来の差分符号化では、1次元の各配列要素から当該各配列要素の直前の要素の値を減算することで差分符号を求める。ただし、先頭の配列要素からは8を減算する(先頭の要素の値はDCの重みであり、通常8の値をとるからである)。続いて各差分符号は、MPEG-4 Part 10. (lSO/IEC JTC1/SC29WG11, 14496-10)に定義されるように、さらにExp-Golomb符号を用いて符号化される。
従来の量子化マトリクスの差分符号化方法は以下のような問題を持つ。
1. 量子化マトリクスにおける各値と当該値の直前の値との差分は、-254〜+254の範囲内の値となる。差分値が取りうる値の範囲が大きくなると、Exp-Golombを用いた可変長符号化の効率が悪くなる。
2.符号化の対象のマトリクスの値の数を抑えるために"切捨て"を行う場合、一連のデータの終りを通知するために用いられる特別な値は、適切な値である必要がある。さもなければ"切捨て"方法は不適切となる。
本発明では、差分がとりうる値の範囲が-128〜+128となるように巡回差分値を生成することで上記問題を解決する。これによって、符号付きExp-Golomb符号により適した符号化を行うことができる。また本発明は、"切捨て"方法を用いる場合の符号配列の終りの通知に関する問題も解決することができる。
本発明では、"切捨て"方法を用いながらも連続する符号の終りを通知するためのメカニズムを改善するため、終りを通知するために必要となるビット数を9ビット以下にする。これを実現するため、複数の信号を用いて連続する符号を押さえるさせる。これは、64個の要素を持つ符号配列に適用可能であるが、16個の要素を持つ符号配列にも適用できるかもしれない。
1. 巡回差分符号化の逆処理
本処理では、D[i]を入力としW[i]を出力とする。ここで、D[i]は差分符号を表わし、W[i]はジグザグスキャンでサンプリングされた量子化マトリクスの各値を表わす。
入力されたW[i]に対し、以下の演算を行う。
Define: M=16, for 4x4 block; M=64, for 8x8 block
Define M=16, for 4x4 matrix or M=64, for 8x8 matrix
W[0] = (D[0] + 8+256)%256
k=0;
for(i=1; (i<M)&&(W[i-1] + D[i] +256) % 256>0;i++)
[
W[i] = (W[i-1] + D[i] +256)%256
]
for(j =I;j<M;j++)[
W[j] = W[i-1]
]
2. 差分符号生成処理
本処理では、W[i]を入力としD[i]を出力とする。ここで、W[i]はジグザグスキャンでサンプリングされた量子化マトリクスの各値を表わし、D[i]はW[i]から求められた差分符号を表わす。
入力されたW[i]に対し、以下の演算を行う。
Define M=16, for 4x4 matrix or M=64, for 8x8 matrix
D[0] =W[0]-8
k=M;
for(i=1; i<M; i++)
[
D[i] = W[i] -W[i-1]
if( D[i]>128)
D[i] = D[i]-256
else if (D[i]<-128)
D[i] = D[i] +256
else if(D[i]== 0) && (k== M)
k=i
else if(D[i]!=0)
k=M
]
// これはW[k]=0を満たす終り信号D[k]の挿入を目的とする
if(k!=M)[
if (W[k-1]>128)
D[k] = 256-W[k-1]
else
D[k] = -W[k-1]
]
// これは最適化を目的とする
if(Length_of-ExpGlomb_code (D[k]) > M-k-i ) [
for(i=k; i<M; i++)
D[k]=0
]
上記演算により、差分符号列の終りを示す値も含め、絶対値が128以下となる差分値D[i]が生成される。よって、上記演算により求められる差分符号は、符号付きExp-Golomb符号化により適したものとなる。
3.差分符号列の終りを通知するためのメカニズム
差分符号列の終りを示すためにWやDといった信号値を用いる代わりに、本発明では2つ以上の符号を用い、出力すべき符号をその中からエンコーダに選択させる。
符号列の終りを通知するため、エンコーダは以下の設定を行うことができる。ここで、デコーダはエンコーダが行った設定を認識できる必要がある。
符号化対象となる符号列の終りがkにある(すなわち、W[k] = W[k-1])と仮定する(ここで、W[i]は0〜Mの値をとる。またMは、4×4変換ブロックの場合16であり、8×8変換ブロックの場合64である)。
− W[k]の値を0に設定する。これは差分値D[k]に対応する。D[k]の絶対値は128以下である。
− D[k]の値を255を超える値、もしくは-255より小さい値に設定する。これにより、最初の9ビットが0になる符号付きExp-Golomb符号0000000001xxxxxxxxxが生成される。エンコーダは最初の10ビットのみを出力すればよい(ここで、"1"を出力せずに9ビットだけを出力することもできる)。復号処理後、デコーダは符号付きGolomb符号として255を超える値を得る。デコーダが不正なGolomb符号に対応可能な場合、連続する9ビットの0を出力するだけでよい。
これに対応して、復号処理は以下の手順で行われる。(以下に挙げる擬似符号では、D[k]が+255〜−255の値をとるか否かをチェックする代わりに、D[k]が適切な範囲内の値となっているかを単にチェックする。D[k]が適切な範囲内の値をとらない場合、D[k]が連続する符号の終りであると判断する。いずれの場合もチェックは必要であるため、条件付き演算を2つ省略することができる。)
Define: M=16, for 4x4 block; M=64, for 8x8 block
Define M=16, for 4x4 matrix or M=64, for 8x8 matrix
D[0] = (W[0] + 8+256)%256
k=0;
for (i=1; (i<M) &&(Golombcode Legal) && (-129<D[i]<129) && (W[i-1] +256) % 256>0; i++)
W[i] = (W[i-1] + D[i] +256)%256
[
for(j = i;j<M;j++)[
W[j] = W[i-1]
]
4. まとめ
符号化効率を向上させるため、必要に応じて固定長符号とExp-Golomb符号とを組み合わせて用いる。
− 巡回差分の生成
− 固定長符号を用いた2ビット (もしくは4ビット)のLSB
− Exp-Golomb符号を用いた6ビット (もしくは4ビット)のMSB
これらを用いることで、ビット数全体をさらに削減することができる。
なお、上記"1. 巡回差分符号化の逆処理"を以下のような量子化重み付けマトリクス導出処理として表現することもできる。
本処理では、Exp−Golomb符号化された連続する量子化重み付けマトリクスの値を入力とし、2次元配列として表現された量子化重み付けマトリクスの値を出力とする。
− 指数ゴロム符号化された連続する量子化重み付けマトリクスの値を復号するため、復号処理を呼び出す。
− 復号化値d(i)を用いて量子化重み付けマトリクスの各成分W(i)を導出する。その際、以下に示す数式を用いて処理を行う。以下の数式で、Mは4×4変換ブロックの場合16であり、8×8変換ブロックの場合64である。
W(0)=d(0)+8
If ((d(i)<128) && (d(i)>-128) && ((W(i-1) + d(i)+256)%256!=0))
・W(i)=(W(i-1) + d(i)+256)%256, for 0<i<M
それ以外の場合
・W(i)=W(k-1), for i=k, …<M, where D(k)>128 or D(k)<-128, or W(k)=0, and 0<i, k<M
[W[I] は0の値をとることができない]
− 量子化重み付けマトリクスW(i, j)は、逆ブロックスキャン処理を用いてW(i)から求められる。4×4変換ブロックでのスキャン順序を図5(a)に、8×8変換ブロックでのスキャン順序を図5(b)に示す。
さらに、上記"1. 巡回差分符号化の逆処理"は以下のような量子化重み付けマトリクス導出処理として実現することも可能である。ここで "ScalingList"は量子化マトリクスWMを示し、 "lastScale"はW[i-1]を示し、 "delta_scaling"はD[i]を示している。
scaling_list( scalingList, sizeOfScalingList, useDefaultScalingMatrixFlag ) [
lastScale = 8
nextScale = 8
for( j = 0; j < sizeOfScalingList; j++ ) [
if( nextScale != 0 ) [
delta_scale
nextScale = ( lastScale + delta_scale + 256 ) % 256
useDefaultScalingMatrixFlag = ( j = = 0 && nextScale = = 0 )
]
scalingList[ j ] = ( nextScale = = 0 ) ? lastScale : nextScale
lastScale = scalingList[ j ]
]
]
本発明は、画像を符号化又は復号化するする符号化装置、復号化装置に適しており、動画配信するウェブサーバー、それを受信するネットワーク端末、動画の記録再生可能なデジタルカメラ、カメラ付き携帯電話機、DVD録画/再生機、PDA、パーソナルコンピュータ等に適している。
図1は、ビットストリームのデータ構造の例を示した説明図である。 図2は、量子化マトリクスの例を示す図である。 図3は、画像符号化装置の構成を示すブロック図である。 図4は、WM符号化部のブロック図である。 図5Aは、量子化マトリクスの符号化順序を示す図である。 図5Bは、量子化マトリクスの符号化順序を示す図である。 図5Cは、量子化マトリクスの符号化順序を示す図である。 図5Dは、量子化マトリクスの符号化順序を示す図である。 図6Aは、量子化マトリクスの成分値の具体例を示す図である。 図6Bは、量子化マトリクスの符号化過程における差分値の具体例を示す図である。 図6Cは、周波数成分値から差分値および可変長符号までの符号化過程の具体例を示す図である。 図7は、WM符号化部におけるWM符号化処理を示すフローチャートである。 図8Aは、正数の場合の可変長符号化の具体例を示す図である。 図8Bは、符号付きの場合の可変長符号化の具体例を示す図である。 図8Cは、可変長符号化の具体例を示す図である。 図9Aは、量子化マトリクスの周波数成分の配列を示す図である。 図9Bは、量子化マトリクスの各成分の符号化されたデータがヘッダ部にどのように配置されているかを示す図である。 図9Cは、量子化マトリクスの各成分の符号化されたデータがヘッダ部にどのように配置されているかを示す図である。 図10は、画像復号化装置の構成を示すブロック図である。 図11は、WM復号化部の構成を示すブロック図である。 図12は、WM復号化部におけるWM復号化処理を示すフローチャートである。 図13Aは、上記実施形態における画像符号化方法及び画像復号化方法をコンピュータシステムによって実現するプログラムを格納するための記録媒体についての説明図である。 図13Bは、上記実施形態における画像符号化方法及び画像復号化方法をコンピュータシステムによって実現するプログラムを格納するための記録媒体についての説明図である。 図13Cは、上記実施形態における画像符号化方法及び画像復号化方法をコンピュータシステムによって実現するプログラムを格納するための記録媒体についての説明図である。 図14は、コンテンツ供給システムの全体構成を示すブロック図である。 図15は、画像符号化方法および画像復号化方法を用いた携帯電話の具体例を示す図である。 図16は、携帯電話のブロック図である。 図17は、ディジタル放送用システムの例を示す図である。

Claims (10)

  1. 動画像を復号化する動画像復号化装置で用いられる、各々の成分が1以上であり255以下である整数値をとる量子化マトリクスの復号化方法であって、
    前記量子化マトリクスの成分を予め定められた順序に並べた数列のI番目の要素を復号するための符号列を取得し、
    前記符号列から、−128以上であり+127以下である整数値をとる、前記数列のI−1番目の要素と前記数列のI番目の要素との差分値を示す値を復号し、
    前記数列のI−1番目の要素と前記差分値を示す値と256との加算結果を256で割った余りを算出し、
    算出された前記余りを、前記数列のI番目の要素が前記予め定められた順序で対応する前記量子化マトリクスの成分として復号する、
    量子化マトリクスの復号方法。
  2. 動画像を復号化する動画像復号化装置で用いられる、各々の成分が1以上であり255以下である整数値をとる量子化マトリクスの復号方法であって、
    前記量子化マトリクスの成分を予め定められた順序に並べた数列のI−1番目の要素を用いて前記数列のI番目の要素を復号するための符号列を取得し、
    前記符号列から、−128以上であり+127以下である整数値をとる、前記数列のI1番目の要素と前記数列のI番目の要素との差分値を示す値を復号し、
    前記数列のI−1番目の要素と前記差分値を示す値との和が0より小さい場合に前記数列のI−1番目の要素と前記差分値と+256との和を前記数列のI番目の要素とし、
    前記数列のI−1番目の要素と前記差分値を示す値との和が256以上である場合に前記数列のI−1番目の要素と前記差分値と−256との和を前記数列のI番目の要素とし、
    前記数列のI−1番目の要素と前記差分値を示す値との和が0以上であり255以下である場合に前記数列のI−1番目の要素と前記差分値との和を前記数列のI番目の要素として算出し、
    算出された前記数列のI番目の要素を前記予め定められた順序に対応する前記量子化マトリクスの成分として復号する、
    量子化マトリクスの復号方法。
  3. 前記差分値を示す値の復号は、前記符号列の先頭から続く0の個数Nを計数し、当該N個の0に後続する値1の1ビットと、当該1ビットに後続するNビットとを読み出し、当該Nビットに対応する値を前記差分値を示す値として得る、
    請求項または請求項に記載の量子化マトリクスの復号方法。
  4. 算出された前記余りが0である場合に、前記量子化マトリクスの復号を終了する、請求項に記載の量子化マトリクスの復号方法。
  5. 前記加算結果は正の値となる、
    請求項に記載の量子化マトリクスの復号方法。
  6. 動画像の復号装置であって、
    各々の成分が1以上であり255以下である整数値をとる量子化マトリクスの復号を行う逆量子化部を含み、
    前記逆量子化部は、
    前記量子化マトリクスの成分を予め定められた順序に並べた数列のI番目の要素に関する符号列を取得し、
    前記符号列から、−128以上であり+127以下である整数値をとる、前記数列のI−1番目の要素と前記数列のI番目の要素との差分値を復号し、
    前記数列のI−1番目の要素と前記差分値と256との加算結果を256で割った余りを算出し
    算出された余りを、前記数列のI番目の要素が前記予め定められた順序で対応する前記量子化マトリクスの成分として復号する、
    動画像の復号装置。
  7. 動画像の復号装置であって、
    各々の成分が1以上であり255以下である整数値をとる量子化マトリクスの復号を行う逆量子化部を含み、
    前記逆量子化部は、
    前記量子化マトリクスの成分を予め定められた順序に並べた数列のI−1番目の要素を用いて前記数列のI番目の要素を復号するための符号列を取得し、
    前記符号列から、−128以上であり+127以下である整数値をとる、前記数列のI−1番目の要素と前記数列のI番目の要素との差分値を復号し、
    前記数列のI−1番目の要素と前記差分値との和が0より小さい場合に前記数列のI−1番目の要素と前記差分値と+256との和を前記数列のI番目の要素とし、
    前記数列のI−1番目の要素と前記差分値との和が256以上である場合に前記数列のI−1番目の要素と前記差分値と−256との和を前記数列のI番目の要素とし、
    前記数列のI−1番目の要素と前記差分値との和が0以上であり255以下である場合に前記数列のI−1番目の要素と前記差分値との和を前記数列のI番目の要素として算出し、
    算出された前記数列のI番目の要素を前記予め定められた順序に対応する前記量子化マトリクスの成分として復号する、
    動画像の復号装置。
  8. 量子化マトリクスの復号を伴う動画像の復号装置に用いられる集積回路であって、
    前記集積回路は、可変長復号と加算と剰余演算とを行うための演算部を有し、
    前記演算部は、
    前記量子化マトリクスの成分を予め定められた順序に並べた数列のI番目の要素に関する符号列を取得し、
    前記符号列から、−128以上であり+127以下である整数値をとる、前記数列のI−1番目の要素と前記数列のI番目の要素との差分値を復号し、
    前記数列のI−1番目の要素と前記差分値と256と加算結果を256で割った余りを算出し
    算出された余りを、前記数列のI番目の要素が前記予め定められた順序で対応する前記量子化マトリクスの成分として復号する処理を行う
    集積回路。
  9. コンピュータで用いられる動画像を復号するプログラムであって、
    前記プログラムは前記コンピュータに、量子化マトリクスの復号を行うための複数のステップを実行させ、
    前記複数のステップは、
    前記量子化マトリクスの成分を予め定められた順序に並べた数列のI番目の要素に関する符号列を取得するステップと、
    前記符号列から、−128以上であり+127以下である整数値をとる、前記数列のI−1番目の要素と前記数列のI番目の要素との差分値を復号するステップと、
    前記数列のI−1番目の要素と前記差分値と256と加算結果を256割った余りを演算して、255以下の整数値である前記数列のI番目の要素を算出するステップと、
    算出された前記数列のI番目の要素を前記予め定められた順序に対応する前記量子化マトリクスの成分として復号するステップと、
    を含むプログラム。
  10. コンピュータで用いられる動画像を復号するプログラムを記録したコンピュータ読取可能な記録媒体であって、
    前記プログラムは前記コンピュータに、量子化マトリクスの復号を行うための複数のステップを実行させ、
    前記複数のステップは、
    前記量子化マトリクスの成分を予め定められた順序に並べた数列のI番目の要素に関する符号列を取得するステップと、
    前記符号列から、−128以上であり+127以下である整数値をとる、前記数列のI−1番目の要素と前記数列のI番目の要素との差分値を復号するステップと、
    前記数列のI−1番目の要素と前記差分値と256と加算結果を256割った余りを算出するステップと
    算出された余りを、前記数列のI番目の要素が前記予め定められた順序で対応する前記量子化マトリクスの成分として復号するステップと、
    を含むプログラムを記録したコンピュータ読取可能な記録媒体。
JP2006549708A 2004-01-20 2005-01-19 量子化マトリクスおよび動画像の復号化方法、復号化装置、プログラムおよび記録媒体 Expired - Lifetime JP4705921B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US53806504P 2004-01-20 2004-01-20
US60/538,065 2004-01-20
US56135104P 2004-04-12 2004-04-12
US60/561,351 2004-04-12
PCT/US2005/002227 WO2005072312A2 (en) 2004-01-20 2005-01-19 Picture coding method, picture decoding method, picture coding apparatus, picture decoding apparatus, and program thereof

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2011010283A Division JP5249363B2 (ja) 2004-01-20 2011-01-20 量子化マトリクスの符号化方法および動画像の符号化装置

Publications (3)

Publication Number Publication Date
JP2007520948A JP2007520948A (ja) 2007-07-26
JP2007520948A5 JP2007520948A5 (ja) 2008-03-06
JP4705921B2 true JP4705921B2 (ja) 2011-06-22

Family

ID=34830455

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2006549708A Expired - Lifetime JP4705921B2 (ja) 2004-01-20 2005-01-19 量子化マトリクスおよび動画像の復号化方法、復号化装置、プログラムおよび記録媒体
JP2011010283A Expired - Lifetime JP5249363B2 (ja) 2004-01-20 2011-01-20 量子化マトリクスの符号化方法および動画像の符号化装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2011010283A Expired - Lifetime JP5249363B2 (ja) 2004-01-20 2011-01-20 量子化マトリクスの符号化方法および動画像の符号化装置

Country Status (6)

Country Link
US (2) US7912122B2 (ja)
EP (2) EP3869802A1 (ja)
JP (2) JP4705921B2 (ja)
KR (2) KR101169895B1 (ja)
CN (1) CN101695132B (ja)
WO (1) WO2005072312A2 (ja)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060032944A (ko) * 2004-10-13 2006-04-18 한국전자통신연구원 LASeR 이진 표현의 포인트 시퀀스 부호화 방법 및 장치
CN101317463B (zh) 2006-03-16 2012-10-17 华为技术有限公司 在编解码中的实现量化的方法和装置
US8711925B2 (en) 2006-05-05 2014-04-29 Microsoft Corporation Flexible quantization
US20090238259A1 (en) * 2008-03-19 2009-09-24 Sung-Hung Yeh Method of rate control for video frame compression and encoder thereof
US8897359B2 (en) 2008-06-03 2014-11-25 Microsoft Corporation Adaptive quantization for enhancement layer video coding
KR101474756B1 (ko) 2009-08-13 2014-12-19 삼성전자주식회사 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치
KR101504887B1 (ko) * 2009-10-23 2015-03-24 삼성전자 주식회사 데이터 단위 레벨의 독립적 파싱 또는 복호화에 따른 비디오 복호화 방법 및 그 장치, 그리고 데이터 단위 레벨의 독립적 파싱 또는 복호화를 위한 비디오 부호화 방법 및 그 장치
US9467710B2 (en) 2009-10-30 2016-10-11 Sun Patent Trust Image decoding method, image coding method, image decoding apparatus, image coding apparatus, program, and integrated circuit
CN102577387B (zh) * 2009-10-30 2015-01-14 松下电器(美国)知识产权公司 解码方法、解码装置、编码方法以及编码装置
JP5499700B2 (ja) * 2009-12-25 2014-05-21 日本電気株式会社 情報圧縮装置、情報復元装置、情報圧縮方法、情報復元方法、及びその処理プログラム
KR101457396B1 (ko) 2010-01-14 2014-11-03 삼성전자주식회사 디블로킹 필터링을 이용한 비디오 부호화 방법과 그 장치, 및 디블로킹 필터링을 이용한 비디오 복호화 방법 및 그 장치
JP2012049087A (ja) * 2010-08-30 2012-03-08 Toshiba Corp 二次電池装置および車両
WO2012096156A1 (ja) * 2011-01-12 2012-07-19 パナソニック株式会社 画像符号化方法、画像復号方法、画像符号化装置及び画像復号装置
JP2012186617A (ja) * 2011-01-31 2012-09-27 Sony Corp 画像処理装置および方法
KR101874143B1 (ko) 2011-02-10 2018-07-03 벨로스 미디어 인터내셔널 리미티드 화상 처리 장치 및 화상 처리 방법
KR20130049526A (ko) * 2011-11-04 2013-05-14 오수미 복원 블록 생성 방법
US10277915B2 (en) 2011-11-07 2019-04-30 Qualcomm Incorporated Signaling quantization matrices for video coding
JP6120490B2 (ja) * 2011-11-07 2017-04-26 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
JP5871628B2 (ja) * 2011-11-07 2016-03-01 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
JP6312879B2 (ja) * 2011-11-07 2018-04-18 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
KR20200023500A (ko) 2011-12-19 2020-03-04 소니 주식회사 화상 처리 장치 및 방법
US10129540B2 (en) * 2012-04-10 2018-11-13 Texas Instruments Incorporated Reduced complexity coefficient transmission for adaptive loop filtering (ALF) in video coding
EP3787292A1 (en) 2012-04-16 2021-03-03 Electronics and Telecommunications Research Institute Method and device for encoding/ decoding image
EP3297283B1 (en) * 2012-06-11 2019-09-04 Samsung Electronics Co., Ltd. Encoding and decoding videos sharing sao parameters according to a color component
JP6041554B2 (ja) * 2012-06-27 2016-12-07 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
TWI592011B (zh) * 2012-06-29 2017-07-11 Sony Corp Image processing device and method
SG11201509001YA (en) * 2013-05-24 2015-12-30 Dolby Int Ab Audio encoder and decoder
JP6336058B2 (ja) 2013-10-14 2018-06-06 マイクロソフト テクノロジー ライセンシング,エルエルシー ビデオ及び画像符号化及び復号のためのベースカラーインデックスマップモードの機能
CN104751495B (zh) * 2013-12-27 2017-11-03 中国科学院沈阳自动化研究所 一种兴趣区域优先的多尺度压缩感知渐进编码方法
AU2014408228B2 (en) 2014-09-30 2019-09-19 Microsoft Technology Licensing, Llc Rules for intra-picture prediction modes when wavefront parallel processing is enabled
EP3308540B1 (en) * 2015-06-09 2020-04-15 Microsoft Technology Licensing, LLC Robust encoding/decoding of escape-coded pixels in palette mode
JP6272441B2 (ja) * 2016-11-08 2018-01-31 キヤノン株式会社 画像復号装置、画像復号方法及びプログラム
WO2020003740A1 (ja) * 2018-06-29 2020-01-02 キヤノン株式会社 画像符号化装置及び画像復号装置及びそれらの制御方法及びプログラム
CN110771167A (zh) * 2018-07-27 2020-02-07 深圳市大疆创新科技有限公司 视频压缩的方法、装置、计算机系统和可移动设备
GB2599509B (en) 2019-03-20 2023-08-23 V Nova Int Ltd Residual filtering in signal enhancement coding
EP4014490A1 (en) * 2019-08-14 2022-06-22 InterDigital VC Holdings France, SAS Quantization matrix prediction for video encoding and decoding

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5034965A (en) 1988-11-11 1991-07-23 Matsushita Electric Industrial Co., Ltd. Efficient coding method and its decoding method
JP2794842B2 (ja) * 1988-11-11 1998-09-10 松下電器産業株式会社 符号化方法とその復号化方法
JPH02235778A (ja) 1989-03-10 1990-09-18 Fujitsu Ltd プリンタ内蔵の情報処理装置
JP2765268B2 (ja) * 1991-05-21 1998-06-11 松下電器産業株式会社 高能率符号化方法と高能率符号の復号方法
JP2924416B2 (ja) * 1992-02-21 1999-07-26 松下電器産業株式会社 高能率符号化方法
US5392037A (en) 1991-05-21 1995-02-21 Matsushita Electric Industrial Co., Ltd. Method and apparatus for encoding and decoding
US5241383A (en) * 1992-05-13 1993-08-31 Bell Communications Research, Inc. Pseudo-constant bit rate video coding with quantization parameter adjustment
FR2697393A1 (fr) * 1992-10-28 1994-04-29 Philips Electronique Lab Dispositif de codage de signaux numériques représentatifs d'images, et dispositif de décodage correspondant.
JPH06284412A (ja) * 1993-03-26 1994-10-07 Sony Corp 画像信号符号化方法および画像信号符号化装置、画像信号復号化方法および画像信号復号化装置、ならびに画像信号記録媒体
KR950010632A (ko) * 1993-09-17 1995-04-28 배순훈 동영상부호화기
KR0178195B1 (ko) * 1995-03-28 1999-05-01 배순훈 벡터 양자화 방식을 이용한 영상 신호 부호화 장치
DE69629442T2 (de) 1995-12-06 2004-06-09 Harman Becker Automotive Systems (Xsys Division) Gmbh Verfahren und Einrichtung zur Kodierung digitaler Videosignale
JP3234807B2 (ja) 1997-02-08 2001-12-04 松下電器産業株式会社 デコード方法
EP1113673B1 (en) 1997-02-08 2003-04-16 Matsushita Electric Industrial Co., Ltd. Quantization matrix for still and moving picture decoding
JP4001969B2 (ja) 1997-03-31 2007-10-31 ソニー株式会社 符号化装置および方法、並びに復号装置および方法
EP1788814A3 (en) 1997-11-05 2008-10-15 Sony Corporation Simplified motion detection within a video transcoding scheme operating resolution conversion
JP3711762B2 (ja) * 1998-09-16 2005-11-02 富士ゼロックス株式会社 画像符号化装置および方法
JP4099682B2 (ja) 1998-09-18 2008-06-11 ソニー株式会社 画像処理装置および方法、並びに記録媒体
JP4593720B2 (ja) 2000-03-10 2010-12-08 パナソニック株式会社 剰余数係数の動的表示方法および装置
WO2001080567A1 (fr) 2000-04-14 2001-10-25 Sony Corporation Decodeur, procede de decodage, support enregistre et programme
US7082163B2 (en) 2000-11-20 2006-07-25 Matsushita Electric Industrial Co., Ltd. Picture coding method, picture coding apparatus and image relaying apparatus
US7391916B2 (en) * 2003-05-21 2008-06-24 Silicon Integrated Systems Corp. Quantization matrix adjusting method for quality improvement
US7388995B2 (en) 2003-05-21 2008-06-17 Silicon Integrated Systems Corp. Quantization matrix adjusting method for avoiding underflow of data

Also Published As

Publication number Publication date
JP2007520948A (ja) 2007-07-26
EP1665133A4 (en) 2009-05-13
KR101082233B1 (ko) 2011-11-09
WO2005072312A2 (en) 2005-08-11
JP5249363B2 (ja) 2013-07-31
EP3869802A1 (en) 2021-08-25
WO2005072312A3 (en) 2006-01-19
JP2011101420A (ja) 2011-05-19
US20110110423A1 (en) 2011-05-12
CN101695132A (zh) 2010-04-14
US7912122B2 (en) 2011-03-22
KR20110082090A (ko) 2011-07-15
WO2005072312A8 (en) 2006-07-20
KR20070026289A (ko) 2007-03-08
EP1665133A2 (en) 2006-06-07
KR101169895B1 (ko) 2012-07-31
CN101695132B (zh) 2012-06-27
US7995650B2 (en) 2011-08-09
US20070292039A1 (en) 2007-12-20

Similar Documents

Publication Publication Date Title
JP5249363B2 (ja) 量子化マトリクスの符号化方法および動画像の符号化装置
JP5627762B2 (ja) 画像符号化復号化装置
JP4348209B2 (ja) 画像符号化方法および画像復号化方法
JP5242719B2 (ja) 画像符号化方法
JP5208157B2 (ja) 復号化システム
KR100944852B1 (ko) 동화상 부호화 방법 및 동화상 복호화 방법
JP4481612B2 (ja) 画像復号化装置及びその方法
JP4481970B2 (ja) 画像符号化装置及びその方法
JP2004120138A (ja) 動画像符号化方法および動画像復号化方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080118

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110120

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110215

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110314

R150 Certificate of patent or registration of utility model

Ref document number: 4705921

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term