JP3301375B2 - 画像信号符号化装置及び方法、画像信号復号装置及び方法 - Google Patents
画像信号符号化装置及び方法、画像信号復号装置及び方法Info
- Publication number
- JP3301375B2 JP3301375B2 JP1161098A JP1161098A JP3301375B2 JP 3301375 B2 JP3301375 B2 JP 3301375B2 JP 1161098 A JP1161098 A JP 1161098A JP 1161098 A JP1161098 A JP 1161098A JP 3301375 B2 JP3301375 B2 JP 3301375B2
- Authority
- JP
- Japan
- Prior art keywords
- image signal
- circuit
- image
- signal
- upper layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
ば光磁気ディスクや磁気テープなどの記録媒体に記録
し、これを再生してディスプレイ装置などに表示した
り、テレビ会議システム、テレビ電話システム、放送用
機器、マルチメディアデータベース検索システムなど、
動画像信号を伝送路を介して送信側から受信側に伝送
し、受信側において、これを受信し、表示する場合や、
動画像信号を編集し記録する場合などに用いて好適な画
像信号符号化装置及び画像信号符号化方法、画像信号復
号装置および画像信号復号方法に関する。
話システムなどのように、動画像信号を遠隔地に伝送す
るシステムにおいては、伝送路を効率良く利用するた
め、映像信号のライン相関やフレーム間相関を利用し
て、画像信号を圧縮符号化するようになされている。
ものとしていわゆるMPEG(蓄積用動画像符号化)方
式がある。これはISO−IEC/JTC1/SC2/
WG11にて議論され標準案として提案されたものであ
り、動き補償予測符号化とDCT(Discrete Cosine Tr
ansform)符号化を組み合わせたハイブリッド方式が採
用されている。MPEGでは様々なアプリケーションや
機能に対応するために、いくつかのプロファイルおよび
レベルが定義されている。最も基本となるのが、メイン
プロファイルメインレベル(MP@ML)である。
MLのエンコーダの構成例について説明する。
1に入力され、その後このフレームメモリ201から読
み出されて、後段の回路に送られて所定の順番で符号化
されることになる。
マクロブロック単位で上記フレームメモリ201から読
み出され、動きベクトル検出(ME)回路202に入力
される。動きベクトル検出回路202は、予め設定され
ている所定のシーケンスに従って、各フレームの画像信
号を、Iピクチャ、Pピクチャ、またはBピクチャとし
て処理する。シーケンシャルに入力される各フレームの
画像を、I,P,Bのいずれのピクチャとして処理する
かは、予め定められている(例えば、I,B,P,B,
P,・・・B,Pの順番にて処理される)。
予め定められた所定の参照フレームを参照し、動き補償
を行うことにより、その動きベクトルを検出する。動き
補償(フレーム間予測)には前方予測、後方予測、両方
向予測の3種類の予測モードがある。Pピクチャの予測
モードは前方予測のみであり、Bピクチャの予測モード
は前方予測、後方予測、両方向予測の3種類である。動
きベクトル検出回路202は、予測誤差を最小にする予
測モードを選択しその際の動きベクトルを発生する。
クロブロックの分散値と比較され、マクロブロックの分
散値の方が小さい場合には、そのマクロブロックでは予
測は行わず、フレーム内符号化が行われる。この場合、
予測モードは画像内符号化(イントラ)となる。動きベ
クトルおよび上記予測モードの情報は、可変長符号化
(VLC)回路206および動き補償(MC)回路21
2に入力される。
ルに基づいて予測参照画像信号を生成し、この予測参照
画像信号を演算回路203に入力する。演算回路203
では、マクロブロック単位で上記フレームメモリ201
からの符号化する画像信号の値と、上記動き補償回路2
12からの予測参照画像信号の値との差分信号を求め、
その差分信号をDCT回路204に出力する。イントラ
マクロブロック(画像内符号化されるマクロブロック)
の場合、演算回路203は上記符号化する画像信号のマ
クロブロックをそのままDCT回路204に出力する。
3からの差分信号若しくは、画像信号そのものがDCT
(離散コサイン変換)処理され、DCT係数に変換され
る。このDCT係数は、量子化回路205に入力され、
ここで送信バッファ207のデータ蓄積量(バッファに
蓄積可能なデータ残量)に対応した量子化ステップで量
子化された後、量子化データとして可変長符号化回路2
06に入力される。
回路205より供給される量子化ステップ(量子化スケ
ール)に対応して、量子化回路205より供給される量
子化データを、例えばハフマン符号などの可変長符号に
変換し、この符号化データを送信バッファ207に出力
する。
回路205からの量子化ステップ(スケール)と、さら
に動きベクトル検出回路202からの予測モード(画像
内予測、前方予測、後方予測、または両方向予測のいず
れが設定されたかを示す予測モード)および動きベクト
ルとが入力されており、これらも可変長符号化される。
を一時蓄積し、またその蓄積量に対応するデータを量子
化制御信号として量子化回路205に出力(バッファフ
ィードバック)する。すなわち、送信バッファ207
は、そのデータ蓄積量(蓄積可能なデータ残量)が許容
上限値まで増量すると、上記量子化制御信号によって量
子化回路205の量子化スケールを大きくさせることに
より、量子化回路205から出力される量子化データの
データ量を低下させる。また、これとは逆に、データ蓄
積量(蓄積可能なデータ残量)が許容下限値まで減少す
ると、送信バッファ207は、量子化制御信号によって
量子化回路205の量子化スケールを小さくすることに
より、量子化回路205から出力される量子化データの
データ量を増大させる。このようにして、送信バッファ
207のオーバフローまたはアンダフローが防止され
る。
符号化データは、所定のタイミングで読み出され、伝送
路にビットストリームとして出力される。
子化データは、逆量子化(IQ)回路208にも入力さ
れる。この逆量子化回路208では、上記量子化回路2
05より供給された量子化データを、同じく量子化回路
205より供給される量子化ステップに対応して逆量子
化する。この逆量子化回路208の出力信号(逆量子化
することにより得られたDCT係数)は、IDCT(逆
DCT)回路209に入力され、ここで逆DCT処理さ
れた後、その出力信号(画像信号若しくは差分信号)が
演算回路210に送られる。この演算回路210では、
IDCT回路209からの出力信号がPピクチャの差分
信号である場合、IDCT回路209からの差分信号と
動き補償回路212からの画像信号とを加算して画像信
号を復元する。なお、IDCT回路209からの出力信
号がイントラマクロブロックの場合は、IDCT回路2
09からの画像信号がそのまま出力される。この画像信
号は、フレームメモリ211に記憶される。動き補償回
路212は、フレームメモリ211の画像と動きベクト
ルと予測モードとを用いて、予測参照画像信号を生成す
る。
MLのデコーダの構成例を説明する。
た画像データ(ビットストリーム)は、図示せぬ受信回
路で受信されたり、再生装置で再生され、受信バッファ
221に一時記憶された後、符号化データとして可変長
復号(IVLC)回路222に供給される。可変長復号
回路222は、受信バッファ221より供給された符号
化データを可変長復号化し、得られた動きベクトルと予
測モードを動き補償回路227に、また、量子化ステッ
プを逆量子化回路223に、それぞれ出力すると共に、
可変長復号されたデータ(量子化データ)を逆量子化
(IQ)回路223に出力する。
22より供給されたデータ(量子化データ)を、同じく
可変長復号化回路222より供給された量子化ステップ
に従って逆量子化し、逆量子化することにより得られた
DCT係数をIDCT回路224に出力する。逆量子化
回路223より出力されたDCT係数は、IDCT回路
224により逆DCT処理され、その出力信号(画像信
号若しくは差分信号)が演算回路225に供給される。
タが、Iピクチャ(画像信号)である場合、その画像信
号は演算回路225よりそのまま出力され、この演算回
路225に対して後に入力される差分信号(PまたはB
ピクチャのデータ)の予測参照画像信号を生成するため
に、フレームメモリ226に供給されて記憶される。ま
た、この演算回路225からの画像信号は、そのまま再
生画像として外部に出力される。
ピクチャの場合、動き補償回路227は、可変長復号回
路222より供給される動きベクトルおよび予測モード
に従って、予測参照画像信号を生成し、その予測参照画
像信号を演算回路225に出力する。演算回路225で
は、IDCT回路224より入力される差分画像信号
と、動き補償回路227より供給される予測参照画像信
号とを加算して再生画像として出力する。またPピクチ
ャの場合、演算回路225からの画像信号はまた、フレ
ームメモリ226に入力され記憶され、次に復号する画
像信号の参照画像とされる。
ロファイルおよびレベルが定義され、また各種ツールが
用意されている。以下に述べるスケーラビリティもMP
EGのこうしたツールの1つである。
ムレートに対応するスケーラビリティを実現するスケー
ラブル符号化方式が導入されている。例えば空間スケー
ラビリティの場合、下位レイヤのビットストリームのみ
を復号する場合は、画像サイズの小さい画像信号を復号
し、下位レイヤおよび上位レイヤのビットストリームを
復号する場合は、画像サイズの大きい画像信号を復号す
る。
ンコーダを説明する。空間スケーラビリティの場合、下
位レイヤは画像サイズの小さい画像信号、また上位レイ
ヤは画像サイズの大きい画像信号に対応する。
モリ261に入力され、後段の回路により、前述したM
P@MLと同様に符号化される。
ームメモリ261から読み出されたデータは、動きベク
トル検出回路262に入力される。動きベクトル検出回
路262は、予め設定されている所定のシーケンスに従
って、各フレームの画像データを、Iピクチャ、Pピク
チャ、またはBピクチャとして処理する。
られた所定の参照フレーム(すなわち前方原画像、後方
原画像、原画像)を参照し、動き補償を行うことによ
り、その動きベクトルを検出する。動き補償(フレーム
間予測)には前方予測、後方予測、両方向予測の3種類
の予測モードがある。動きベクトル検出回路262は、
予測誤差を最小にする予測モードを選択しその際の動き
ベクトルを発生する。上記動きベクトルおよび上記予測
モードの情報は、可変長符号化回路266および動き補
償回路272に入力される。
ルに基づいて予測参照画像信号を生成し、この予測参照
画像信号を演算回路263に入力する。演算回路263
では、マクロブロック単位で上記フレームメモリ261
からの符号化する画像信号の値と、上記動き補償回路2
72からの予測参照画像信号の値との差分信号を求め、
その差分信号をDCT回路264に出力する。なお、イ
ントラマクロブロック(画像内符号化されるマクロブロ
ック)の場合、演算回路263は符号化するマクロブロ
ックの信号をそのままDCT回路264に出力する。
3からの差分信号がDCT処理され、DCT係数に変換
される。このDCT係数は、量子化回路265に入力さ
れ、ここで送信バッファ267のデータ蓄積量(バッフ
ァに蓄積可能なデータ残量)に対応した量子化ステップ
で量子化された後、量子化データとして可変長符号化回
路266に入力される。
65より供給される量子化ステップ(量子化スケール)
に対応して、量子化回路265より供給される量子化デ
ータを、例えばハフマン符号などの可変長符号に変換
し、この符号化データを送信バッファ267に出力す
る。
回路265からの量子化ステップ(スケール)と、さら
に動きベクトル検出回路262からの予測モード(画像
内予測、前方予測、後方予測、または両方向予測のいず
れが設定されたかを示す予測モード)および動きベクト
ルとが入力されており、これらも可変長符号化される。
データを一時蓄積し、またその蓄積量に対応するデータ
を量子化制御信号として量子化回路265に出力(バッ
ファフィードバック)する。これにより、当該送信バッ
ファ267のオーバフローまたはアンダフローが防止さ
れる。
符号化データは、所定のタイミングで読み出され、伝送
路にビットストリームとして出力される。
子化データは、逆量子化回路268にも入力される。こ
の逆量子化回路268では、上記量子化回路265より
供給された量子化データを、同じく量子化回路265よ
り供給される量子化ステップに対応して逆量子化する。
この逆量子化回路268の出力信号(DCT係数)は、
IDCT回路269に入力され、ここで逆DCT処理さ
れた後、その出力信号(画像信号若しくは差分信号)が
演算回路270に送られる。この演算回路270では、
IDCT回路209からの出力信号がPピクチャの差分
信号である場合、IDCT回路269からの差分信号と
動き補償回路272からの画像信号とを加算して画像信
号を復元する。なお、IDCT回路209からの出力信
号がイントラマクロブロックである場合、IDCT回路
209からの画像信号がそのまま出力される。この画像
信号は、フレームメモリ271に記憶される。動き補償
回路272は、フレームメモリ271の画像信号と動き
ベクトルと予測モードとを用いて、予測参照画像信号を
生成する。
て、演算回路270の出力画像信号は、上記フレームメ
モリ271に供給されて下位レイヤの参照画像として用
いられるだけでなく、アップサンプリングにより画像拡
大を行う画像拡大回路243によって上位レイヤの画像
サイズと同一の画像サイズに拡大された後、上位レイヤ
の参照画像にも用いられる。
は、上記の通りフレームメモリ271および画像拡大回
路243に入力される。画像拡大回路243では演算回
路270によって生成された画像信号を拡大して上位レ
イヤの画像サイズと同一の大きさにして重み付加回路2
44に出力する。
43からの出力信号に重み(1−W)を乗算し、演算回
路258に出力する。
ームメモリ245に入力される。動きベクトル検出回路
246は、前述したMP@MLと同様に、動きベクトル
および予測モードを決定する。
動き補償回路256は、動きベクトル検出回路246に
よって決定された動きベクトルおよび予測モードに従っ
て予測参照画像信号を生成するが、この予測参照画像信
号は、重み付加回路257に供給される。この重み付加
回路257では、上記予測参照画像信号に対して重みW
(重み計数W)を乗算し演算回路258に出力する。
よび257からの画像信号を加算し、得られた画像信号
を予測参照画像信号として演算回路247に出力する。
演算回路258からの画像信号はまた、演算回路254
にも入力されIDCT回路253からの画像信号と加算
された後、フレームメモリ255に入力されこの後に符
号化される画像信号の参照画像信号として用いられる。
からの符号する画像信号と上記演算回路258からの予
測参照画像信号との差分を計算して出力する。ただし、
フレーム内符号化マクロブロックの場合、演算回路24
7は上記符号する画像信号をそのままDCT回路248
に出力する。
信号をDCT(離散コサイン変換)処理し、DCT係数
を生成し、量子化回路249に出力する。量子化回路2
49ではMP@MLの場合と同様に送信バッファ251
のデータ蓄積量などに基づいて決定された量子化スケー
ルにしたがってDCT係数を量子化し、量子化データと
して可変長符号化回路250に出力する。可変長符号化
回路250は、量子化データを可変長符号化した後、符
号化データを送信バッファ251を介して上位レイヤの
ビットストリームとして出力する。
た、逆量子化回路252にて上記量子化回路249で用
いた量子化スケールによって逆量子化され、出力データ
(DCT係数)をIDCT回路253に出力する。さら
にIDCT回路253はDCT係数を逆DCT処理した
後、出力信号(画像信号若しくは差分信号)が演算回路
254に入力される。演算回路254では、IDCT回
路253からの出力信号がPピクチャの差分画像である
場合、演算回路258からの画像信号とIDCT回路2
53からの差分信号を加算し、画像信号を復元する。な
お、IDCT回路253からの出力信号がイントラマク
ロブロックである場合、IDCT回路253からの画像
信号がそのまま出力される。この画像信号は、フレーム
メモリ255に記憶される。動き補償回路256はフレ
ームメモリ255の画像信号と動きベクトルと予測モー
ドとを用いて、予測参照画像信号を生成する。
クトル検出回路246で検出された動きベクトルおよび
予測モードと、量子化回路249で用いた量子化スケー
ルと、重み付加回路244および257で用いた重みW
が入力され、それぞれ符号化され伝送される。
ィのデコーダの一例を説明する。
ッファ301に入力された後、MP@MLと同様に復号
される。すなわち、受信バッファ301から読み出され
た符号化データは、可変長復号回路302に送られる。
可変長復号回路302は、受信バッファ301より供給
された符号化データを可変長復号化し、動きベクトルと
予測モードを動き補償回路307に、また、量子化ステ
ップを逆量子化回路303に、それぞれ出力すると共
に、可変長復号されたデータ(量子化データ)をマクロ
ブロック単位で逆量子化回路303に出力する。
02より供給されたデータ(量子化データ)を、同じく
可変長復号化回路302より供給された量子化ステップ
に従って逆量子化し、逆量子化することにより得られた
DCT係数をIDCT回路304に出力する。逆量子化
回路303より出力されたDCT係数は、IDCT回路
304で逆DCT処理され、出力信号(画像信号若しく
は差分信号)が演算回路305に供給される。
が、Iピクチャのデータである場合、その画像信号は演
算回路305よりそのまま出力され、演算回路305に
後に入力される差分信号(PまたはBピクチャのデー
タ)の予測参照画像信号を生成するために、フレームメ
モリ306に供給されて記憶される。また、この画像信
号は、そのまま再生画像として外部に出力される。
ピクチャの場合、動き補償回路307は、可変長復号回
路302より供給される動きベクトルおよび予測モード
に従って、予測参照画像信号を生成し、その予測参照画
像信号を演算回路305に出力する。演算回路305で
は、IDCT回路304より入力される差分信号と、動
き補償回路307より供給される予測参照画像信号とを
加算して、画像信号として出力する。また、Pピクチャ
の場合、演算回路305からの画像信号はまた、フレー
ムメモリ306に入力され記憶され、次に復号する画像
信号の予測参照画像信号として使用される。
うに演算回路305からの画像信号は外部に出力され、
またフレームメモリ306に蓄えられて、これ以後復号
する画像信号の予測参照画像信号として用いられるだけ
でなく、画像拡大回路327により上位レイヤの画像信
号と同一の画像サイズに拡大された後、上位レイヤの予
測参照画像信号としても用いられる。
上述のように下位レイヤの再生画像信号として出力さ
れ、またフレームメモリ306に出力されると同時に、
画像拡大回路327に供給され、上位レイヤの画像サイ
ズと同一の画像サイズに拡大された後、重み付加回路3
28に出力される。
27の画像信号に対して上記復号された重みWを用いて
計算した(1−W)を乗算し、この値を演算回路317
に出力する。
受信バッファ309を介して可変長復号回路310に供
給され、ここで符号化データが可変長復号され、量子化
データとともに量子化スケール、動きベクトル、予測モ
ードおよび重み係数が復号される。可変長復号回路31
0により可変長復号された量子化データは、同じく復号
された量子化スケールを用いて逆量子化回路311にお
いて逆量子化された後、DCT係数としてIDCT回路
312に出力される。IDCT回路312はDCT係数
を逆DCT処理し、出力信号(画像信号若しくは差分信
号)が演算回路313に供給される。
きベクトルおよび予測モードにしたがって予測参照画像
信号を生成し、この予測参照画像信号を重み付加回路3
16に入力する。重み付加回路316では、上記復号さ
れた重みWを動き補償回路315からの予測参照画像信
号に乗算し、この乗算結果から得られる画像信号を演算
回路317に出力する。
よび316の画像信号を加算し、得られた画像信号を演
算回路313に出力する。演算回路313では、IDC
T回路312からの出力信号が差分信号である場合に、
IDCT回路312からの差分信号と演算回路317か
らの画像信号を加算して上位レイヤの画像信号を復元す
る。なお、IDCT回路312からの出力信号が、イン
トラマクロブロックである場合、IDCT回路312か
らの画像信号がそのまま出力される。この画像信号はフ
レームメモリ314に記憶され、この後、復号する画像
信号の予測参照画像信号とされる。
いての説明であるが、色差信号の処理も同様に行われ
る。但し、この場合、動きベクトルは、輝度信号用のも
のを垂直方向および水平方向に1/2にしたものが用い
られる。
この他にも様々な動画像の高能率符号化方式が標準化さ
れている。例えば、いわゆるITU−T(Internationa
l Telecommunication Union−Telecommunication secto
r:国際電気通信連合の電気通信標準化部門)では、主に
通信用の符号化方式として、H.261やH.263と
いう方式を規定している。このH.261やH.263
も基本的にはMPEG方式と同様に動き補償予測符号化
とDCT変換符号化を組み合わせたものであり、ヘッダ
情報などの詳細は異なるが、符号化装置や復号装置は同
様となる。
空間スケーラビリティが既に標準化されているが、その
符号化効率は十分であるとは言い難い。したがって、M
PEG4方式やその他の新規符号化方式においては空間
スケーラビリティの符号化効率を向上することが課題と
なっている。
ティについて、ここで少し詳しく説明する。同スケーラ
ブル符号化方式においては、下位レイヤは通常の符号化
方式、すなわちMPEG2の場合はMP@MLと同様に
符号化する。上位レイヤは、同じ時刻の下位レイヤの画
像、および同じレイヤの直前に復号された画像を、参照
画像として用いる。この時、下位レイヤと上位レイヤの
予測モードはまったく独立に決定される。したがって、
下位レイヤにおいて情報を伝送したにもかかわらず、上
位レイヤでそれがまったく使われずに、上位レイヤの復
号画像から予測を行って符号化してしまうことがある。
これは、上位レイヤと下位レイヤで共有可能な情報をま
ったく独立に伝送していることに等しい。
をできるだけ少なくし、符号化効率を向上させることが
課題となっている。
単位でしか符号化モードを指定することができない。こ
れは比較的均一な領域の画像を扱う場合は問題無いが、
複雑な動きをするシーケンスや、異なる性質の画像(例
えば、静止領域と動領域)が一つのマクロブロックに含
まれる場合には符号化効率の低下の原因となっている。
てなされたものであり、空間スケーラブル符号化方法に
おいて、予測効率を改善し、符号化効率を向上すること
を可能にする、画像信号符号化装置及び方法、画像信号
復号装置及び方法を提供することを目的とするものであ
る。
装置は、上述した課題を解決するために提案されたもの
であり、所定の画像信号をそれぞれ表す下位階層の画像
信号と上位階層の画像信号を符号化する画像信号符号化
装置において、上記下位階層の画像信号を参照画像信号
を用いて符号化して、第1の符号化データを出力する第
1の符号化手段と、上記上位階層の画像信号を参照画像
信号を用いて符号化して、第2の符号化データを出力す
る第2の符号化手段と、上記第1の符号化データを復号
して、第1の参照画像信号を生成する第1の復号手段
と、上記第2の符号化データを復号して、第2の参照画
像信号を生成する第2の復号手段と、上記第1の参照画
像信号と上記第2の参照画像信号とを各画素毎に適応的
に切り替えることにより第3の参照画像信号を生成する
生成手段とを有し、上記第2の符号化手段は、上記第
1、第2若しくは第3の参照画像信号を選択して上記上
位階層の画像信号を符号化することを特徴としている。
述した課題を解決するために提案されたものであり、所
定の画像信号をそれぞれ表す下位階層の画像信号と上位
階層の画像信号を符号化する画像信号符号化方法におい
て、上記下位階層の画像信号を参照画像信号を用いて符
号化して、第1の符号化データを出力する第1の符号化
ステップと、上記上位階層の画像信号を参照画像信号を
用いて符号化して、第2の符号化データを出力する第2
の符号化ステップと、上記第1の符号化データを復号し
て、第1の参照画像信号を生成する第1の復号ステップ
と、上記第2の符号化データを復号して、第2の参照画
像信号を生成する第2の復号ステップと、上記第1の参
照画像信号と上記第2の参照画像信号とを各画素毎に適
応的に切り替えることにより第3の参照画像信号を生成
する生成ステップとを有し、上記第2の符号化ステップ
は、上記第1、第2若しくは第3の参照画像信号を選択
して上記上位階層の画像信号を符号化することを特徴と
している。
した課題を解決するために提案されたものであり、符号
化された下位階層の画像信号と符号化された上位階層の
画像信号からなる符号化データを受信し、その符号化デ
ータを復号する画像信号復号装置において、符号化され
た下位階層の画像信号と符号化された上位階層の画像信
号はそれぞれ参照画像信号を用いて符号化されており、
上記符号化データを受信する受信手段と、上記符号化さ
れた下位階層の画像信号を参照画像信号を用いて復号し
て、当該復号された下位階層の画像信号を第1の参照画
像信号として出力する第1の復号手段と、上記符号化さ
れた上位階層の画像信号を参照画像信号を用いて復号し
て、当該復号された上位階層の画像信号を第2の参照画
像信号として出力する第2の復号手段と、上記第1の参
照画像信号と上記第2の参照画像信号とを各画素毎に適
応的に切り替えることにより第3の参照画像信号を生成
する生成手段とを有し、上記第2の復号手段は、上記第
1、第2若しくは第3の参照画像信号を選択して上記上
位階層の画像信号を復号することを特徴としている。
した課題を解決するために提案されたものであり、符号
化された下位階層の画像信号と符号化された上位階層の
画像信号からなる符号化データを受信し、その符号化デ
ータを復号する画像信号復号方法において、符号化され
た下位階層の画像信号と符号化された上位階層の画像信
号はそれぞれ参照画像信号を用いて符号化されており、
上記符号化データを受信する受信ステップと、上記符号
化された下位階層の画像信号を参照画像信号を用いて復
号して、当該復号された下位階層の画像信号を第1の参
照画像信号として出力する第1の復号ステップと、上記
符号化された上位階層の画像信号を参照画像信号を用い
て復号して、当該復号された上位階層の画像信号を第2
の参照画像信号として出力する第2の復号ステップと、
上記第1の参照画像信号と上記第2の参照画像信号とを
各画素毎に適応的に切り替えることにより第3の参照画
像信号を生成する生成ステップとを有し、上記第2の復
号ステップは、上記第1、第2若しくは第3の参照画像
信号を選択して上記上位階層の画像信号を復号すること
を特徴としている。
及び方法により符号化された信号を記録してなる記録媒
体、すなわち、本発明の画像信号復号装置によって復号
可能な記録媒体は、符号化された下位階層の画像信号と
符号化された上位階層の画像信号とからなる符号化信号
を含んで記録してなり、符号化データは、下位階層の画
像信号を参照画像信号を用いて符号化して第1の符号化
データを出力し、上位階層の画像信号を参照画像信号を
用いて符号化して第2の符号化データを出力し、第1の
符号化データを復号して、第1の参照画像信号を生成
し、第2の符号化データを復号して、第2の参照画像信
号を生成し、第1の参照画像信号と第2の参照画像信号
とを各画素毎に適応的に切り替えることにより第3の参
照画像信号を生成し、上記第1、第2若しくは第3の参
照画像信号を選択して上位階層の画像信号を符号化して
生成される。
形態について、図面を参照しながら説明する。
的内容説明を行う前に、本発明の基本的な考え方につい
て、MPEGにおける各参照画像の性質と絡めて説明す
る。通常、上位レイヤの画像信号は下位レイヤの画像信
号と比較して画質が良い。したがって、フレーム間の変
化が少ない場合は、上位レイヤの画像を用いて動き補償
を行った方が、予測誤差が少なくなることが多い。しか
し、フレーム間の変化が大きい場合は、動き補償の効率
が下がるため、同時刻の画像を参照画像とした方が効率
が良い。このようなことから、フレーム間差分が大きい
領域では同時刻の下位レイヤからの画像信号を、また、
フレーム間差分が小さい場合には同じ階層(上位レイ
ヤ)の画像を、参照画像に用いれば良い。
号化の情報の重複について説明する。
する場合を考える。この時、当該上位レイヤのマクロブ
ロックに対応する下位レイヤのマクロブロックにおいて
情報(DCT係数)を伝送した場合に、上位レイヤの同
じ画像を参照して予測を行うと、下位レイヤと上位レイ
ヤとで独立に情報が伝送されることになる。即ち、下位
レイヤで伝送した情報が上位レイヤの符号化に生かされ
ないことになり、効率低下の原因となる。したがって、
上記対応する下位レイヤのマクロブロックでDCT係数
を伝送した場合は、下位レイヤの画像を予測参照画像に
用いた方が、データ伝送の重複が少なくなり、効率が良
い。
ブロックを符号化する場合において、フレーム間差分が
大きい領域では、同時刻の画像(下位レイヤの画像)を
参照画像に用いた方が良く、(2)上位レイヤのあるマ
クロブロックを符号化する場合において、上記対応する
下位レイヤのマクロブロックのDCT係数が伝送された
場合は、下位レイヤの画像を参照画像に用いた方が良
い、ということが言える。
号化方式においては、予測モードはマクロブロック単位
で切り替えられる。均一な画像領域の場合は、このよう
なマクロブロック単位の予測モード切り替えで十分であ
る。しかし、複雑な動きをする画像であったり、また画
像の大きさが小さい場合は、マクロブロック中に時間的
に画像が変化する領域と、しない領域とが混在すること
になり、効率が落ちる原因となっている。
切り替えることを可能にすれば、符号化効率を改善する
ことができる。
DCT後の差分画像を参照し、差分値があるしきい値以
下である画素は上位レイヤの画素を、また差分値がある
しきい値を越える画素は下位レイヤの画素を用いて、予
測参照画像を生成するために用いる参照画像を生成する
ようにする。このとき、生成された参照画像は、画素単
位で上位レイヤおよび下位レイヤの画像が切り替えられ
て用いられている。また、本発明においては、IDCT
後の差分画像を用いて画素単位の切り替えを行うことに
より、平行移動に対応することを可能にしている。
で適応的に切り替えを行って生成した参照画像、および
解像度変換後(本実施の形態では画像拡大後)の下位レ
イヤの画像、上位レイヤの直前に復号した画像を、参照
画像として用いる。また、このとき予測誤差を最小にす
る画像をマクロブロック単位で切り替えて予測参照画像
を決定して、動き補償を行い、符号化することにより、
空間スケーラブル符号化の符号化効率を向上させ、画質
を改善することを可能にしている。
信号符号化装置の一例を示す。
(key)信号は、まず画像信号階層化回路1に入力さ
れる。
を複数の画像(背景画像及び動き物体画像)信号に分離
して、それぞれの画像毎に符号化する際の1つの画像を
表している画像信号である。また、キー(key)信号
は、分離された動き物体画像の輪郭情報を表す信号であ
り、例えば、このキー(key)信号は、2値からなる
ハードキーや多値からなるソフトキーである。さらに、
分離された動き物体画像の背景画像の絶対座標における
位置を示すフラグ(VOPオフセット)及び分離された
動き物体画像の大きさを示すフラグ(VOPサイズ)が
画像信号階層化回路1に供給される。
及びキー(key)信号を複数の階層に分離する。な
お、図1には2階層(1つの下位レイヤと1つの上位レ
イヤ)の場合の構成を示してあるが、同様に複数の階層
に分離することも可能である。簡単のため、ここでは2
つの階層に分離する場合についてこれ以後説明する。
記画像信号階層化回路1は、入力画像信号及びキー信号
を解像度変換して、下位レイヤ及び上位レイヤの画像信
号及びキー信号を生成する。
(時間軸方向のスケーラビリティ)の場合、画像信号階
層化回路1は、時刻に応じて画像信号及びキー信号の出
力を下位レイヤおよび上位レイヤに切り替えて出力す
る。例えば、図2の場合、順次供給される画像(ピクチ
ャ)VOP0〜VOP6は、画像VOP0,VOP2,
VOP4,VOP6が下位レイヤに、また画像VOP
1,VOP3,VOP5が上位レイヤに出力される。こ
のテンポラルスケーラビリティの場合は、上記空間スケ
ーラビリティのように画像信号の拡大や縮小のような解
像度変換は行わない。
Noise Retio)スケーラビリティの場合、画像信号階層
化回路1は、入力画像信号とキー信号をそのまま各レイ
ヤに出力する。すなわち、下位レイヤと上位レイヤに同
一の画像信号およびキー信号を出力する。
ティの場合を例に挙げている。
ーラビリティの場合、入力画像信号およびキー信号を縮
小(解像度変換)した画像信号及びキー信号を、下位レ
イヤとして出力し、一方、上位レイヤには入力画像信号
及びキー信号をそのまま出力する。ここでの解像度変換
とは、例えば間引きフィルタによる縮小フィルタリング
処理などである。なお、画像信号階層化回路1では、入
力画像信号を拡大(解像度変換)した画像信号及びキー
信号を上位レイヤとして出力し、入力画像信号及びキー
信号をそのまま下位レイヤに出力するようにしてもよ
い。この場合の解像度変換は、拡大フィルタなどによる
拡大フィルタリング処理となる。さらに画像信号階層化
回路1では、独立に生成された2つの画像信号及びキー
信号(解像度は異なる場合と、同一の場合どちらでもよ
い。)を、それぞれ上位レイヤおよび下位レイヤに出力
するようにしてもよい。この場合、どの画像信号及びキ
ー信号を上位レイヤおよび下位レイヤに出力するかは、
予め決められている。上位レイヤの画像信号及びキー信
号は、遅延回路2を介して上位レイヤ符号化回路3に送
られ、下位レイヤの画像信号は下位レイヤ符号化回路5
に送られる。
解像度変換して下位レイヤと上位レイヤに出力する画像
信号階層化回路1はまた、上記下位レイヤの画像に対す
る上位レイヤの画像の解像度の倍率を示すフラグFRを
も出力する。このフラグFRは、遅延回路2を介して解
像度変換回路4および上位レイヤ符号化回路3に送られ
る。なお、上記解像度変換回路4は、上記画像信号階層
化回路1内に設けられる解像度変換手段とは異なるもの
である。さらに、この画像信号階層化回路1は、下位レ
イヤの画像(VOP)の大きさを示すフラグ(下位レイ
ヤVOPサイズ)と、絶対座標における位置を示すフラ
グ(下位レイヤVOPオフセット)、及び上位レイヤの
画像(VOP)の大きさを示すフラグ(上位レイヤVO
Pサイズ)と、絶対座標における位置を示すフラグ(上
位レイヤVOPオフセット)を、下位レイヤ符号化回路
3及び上位レイヤ符号化回路5にそれぞれに供給するた
めに出力する。なお、これらフラグは、上位レイヤ符号
化回路3及び下位レイヤ符号化回路5にて符号化され、
さらには、ビットストリームとして符号化され、スケー
ラブル復号装置に供給され、スケーラブル復号装置のお
いて利用される。
号化処理及び復号処理について説明するが、上位レイヤ
の入力画像信号及び下位レイヤの入力画像信号と上位レ
イヤの入力キー信号及び下位レイヤの入力キー信号の符
号化処理及び復号処理は同様であるため、以下では、上
位レイヤの入力画像信号及び下位レイヤの入力画像信号
の符号化処理及び復号処理についてのみ説明し、上位レ
イヤのキー信号及び下位レイヤのキー信号の符号化処理
及び復号処理の詳細については、その説明を省略する。
構成を図3を用いて説明する。
供給さらた下位レイヤの入力画像信号は、まずフレーム
メモリ21に入力され、所定の順番で読み出されて、後
段の構成により符号化される。この符号化されるべき画
像データは、マクロブロック単位でフレームメモリ21
から読み出され、動きベクトル検出回路22に入力され
る。動きベクトル検出回路22は、予め設定されている
所定のシーケンスに従って、各フレームの画像データを
Iピクチャ、Pピクチャ、またはBピクチャとして処理
する。シーケンシャルに入力される各フレームの画像
を、I,P,Bのいずれのピクチャとして処理するか
は、予め定められている(例えば、I,B,P,B,
P,・・・B,Pの順番で処理される)。
め定められた所定の参照フレーム(前方原画像、後方原
画像、原フレームの画像)を参照し、動き補償を行うこ
とにより、その動きベクトルを検出する。動き補償(フ
レーム間予測)には、前方予測、後方予測、両方向予測
の3種類の予測モードがある。Pピクチャの予測モード
は前方予測のみであり、Bピクチャの予測モードは前方
予測、後方予測、両方向予測の3種類である。この動き
ベクトル検出回路22は、予測誤差を最小にする予測モ
ードを選択し、その際の予測ベクトルを発生する。
マクロブロックの分散値と比較され、マクロブロックの
分散値の方が小さい場合には、そのマクロブロックでは
予測は行わず、フレーム内符号化が行われる。この場
合、予測モードは画像内符号化(イントラ)となる。動
きベクトルおよび上記予測モードの情報は、可変長符号
化回路26および動き補償回路32に入力される。
号符号化回路すなわち図1の上位レイヤ符号化回路3に
も供給される。
ルに基づいて予測参照画像信号を生成し、この予測参照
画像信号を演算回路23に供給する。演算回路23で
は、マクロブロック単位で上記フレームメモリ21から
の符号化する画像信号の値と、上記動き補償回路32か
らの予測参照画像信号の値との差分を求め、この差分信
号をDCT回路24に出力する。イントラマクロブロッ
クの場合、演算回路23は、上記符号化する画像信号を
そのままDCT回路24に出力する。なお、動きベクト
ル検出回路22及び動き補償回路32には、下位レイヤ
VOPサイズ及び下位レイヤVOPオフセットが供給さ
れて、それぞれの回路で利用される。ただし、図面の煩
雑化を防ぐため、図示はしない。
T(離散コサイン変換)処理してDCT係数に変換す
る。このDCT係数は、量子化回路25に入力され、送
信バッファ27のデータ蓄積量(バッファに蓄積可能な
データ残量)に対応した量子化ステップで量子化された
後、量子化データが可変長符号化回路26に入力され
る。
より供給される量子化ステップ(量子化スケール)に対
応して、上記量子化回路25より供給される量子化デー
タを、例えばハフマン符号などの可変長符号に変換し、
この符号化データを送信バッファ27に出力する。
路25からの量子化ステップ(量子化スケール)と、動
きベクトル検出回路22からの予測モード(画像内予
測、前方予測、後方予測、または両方向予測のいずれが
設定されたかを示すモード)および動きベクトルと、さ
らに、下位レイヤの画像(VOP)の大きさを示すフラ
グ(下位レイヤVOPサイズ)及び絶対座標における位
置を示すフラグ(下位レイヤVOPオフセット)が入力
されており、これらも可変長符号化される。
のデータが存在しない場合、そのマクロブロックはスキ
ップマクロブロックとして扱われる。つまり、動きベク
トルの値が0で且つ量子化されたDCT係数が0である
ときである。そして、マクロブロックのデータが存在す
るかどうかを示すフラグCODが伝送される。マクロブ
ロックのデータが存在する場合、COD=0、マクロブ
ロックのデータが存在しない場合(スキップマクロブロ
ック)、COD=1として示される。このフラグはま
た、上位レイヤ符号化回路3にも供給される。
ータを一時蓄積し、その蓄積量に対応する符号化データ
を、量子化制御信号として量子化回路25にフィードバ
ックする。すなわち、送信バッファ27は、そのデータ
蓄積量(蓄積可能なデータ残量)が許容上限値まで増量
すると、上記量子化制御信号によって量子化回路25の
量子化スケールを大きくさせることにより、量子化回路
25から出力される量子化データのデータ量を低下させ
る。また、これとは逆に、データ蓄積量(蓄積可能なデ
ータ残量)が許容下限値まで減少すると、送信バッファ
27は、量子化制御信号によって量子化回路25の量子
化スケールを小さくさせることにより、量子化回路25
から出力される量子化データのデータ量を増大させる。
このようにして、送信バッファ27のオーバフローまた
はアンダフローが防止される。
号化データは、所定のタイミングで読み出され、下位レ
イヤビットストリームとして伝送路に出力される。
化データは、逆量子化回路28にも入力される。この逆
量子化回路28では、上記量子化回路25より供給され
た量子化データを、同じく量子化回路25より供給され
る量子化ステップに対応して逆量子化する。この逆量子
化回路28の出力信号(逆量子化することにより得られ
たDCT係数)は、IDCT(逆DCT)回路29に入
力され、ここで逆DCT処理された後、出力信号(画像
信号若しくは差分信号)が演算回路30に送られる。こ
の演算回路30では、IDCT回路29の出力信号が差
分信号である場合、動き補償回路32からの画像信号と
IDCT回路29からの差分信号とを加算して画像信号
を復元する。なお、IDCT回路29の出力信号がイン
トラマクロブロックである場合は、IDCT回路29か
らの画像信号がそのまま出力される。この画像信号は、
フレームメモリ31に供給され記憶される。動き補償回
路32は、フレームメモリ31の画像と動きベクトルと
予測モードとを用いて予測参照画像信号を生成する。
復号された差分信号はまた、図1の上位レイヤ符号化回
路3に供給される。
イヤ符号化回路3での符号化に従い、所定の局所復号画
像を読み出して図1の解像度変換回路4に出力する。
レイヤの画像に対する上位レイヤの画像の解像度の倍率
を示すフラグFRに従い、下位レイヤ符号化回路5から
供給された画像信号の解像度を前述のようにフィルタリ
ング処理(この場合は拡大処理)により変換し、上位レ
イヤ符号化回路3に供給する。なお倍率が1の場合、す
なわち上位レイヤと下位レイヤの大きさが等しい場合
は、解像度変換回路4は何もせずにそのまま画像信号を
出力する。
生成された上位レイヤの画像信号は、遅延回路2を介し
て上位レイヤ符号化回路3に供給される。遅延回路2で
は、下位レイヤ符号化回路5において所定の下位レイヤ
の画像信号を符号化に要する時間だけ、上記上位レイヤ
の画像信号を遅延する。
構成を図4を用いて説明する。
供給された上位レイヤの入力画像信号は、まずフレーム
メモリ41に入力されて記憶され、所定の順番で読み出
されて、後段の構成により符号化される。この符号化さ
れるべき画像データは、マクロブロック単位で当該フレ
ームメモリ41から読み出され、動きベクトル検出回路
42に入力される。動きベクトル検出回路42は、予め
設定されている所定のシーケンスに従って、各フレーム
の画像データを、Iピクチャ、Pピクチャ、またはBピ
クチャとして処理する。シーケンシャルに入力される各
フレームの画像を、I,P,Bのいずれのピクチャとし
て処理するかは、予め定められている(例えば、I,
B,P,B,P,・・・B,Pの順番にて処理され
る)。
位レイヤと下位レイヤの画像信号は、例えば図5のよう
に符号化されることになる。図5において、下位レイヤ
の最初の画像VOP21Lは、Iピクチャとして符号化
される。また、2番目以後の下位レイヤの画像VOP2
1L〜VOP24Lは、Pピクチャとして符号化される。
この時の参照画像は、それぞれ直前の下位レイヤの画像
を参照画像として用いて符号化する。また、上位レイヤ
R>の最初の画像VOP21MはPピクチャとして符号化
される。この時の参照画像は下位レイヤの同時刻の画像
VOP21Lとなる。2番目以後の上位レイヤの画像V
OP22M〜VOP24MはBピクチャとして符号化され
る。この場合、これらの画像VOP22M〜VOP24M
は、それぞれ直前の上位レイヤの画像および、それぞれ
同時刻の下位レイヤの画像VOP22L,VOP23L,
VOP24Lを参照画像として用いて符号化する。また
この場合、上位レイヤのBピクチャは下位レイヤのPピ
クチャと同様に他の画像VOPを符号化する場合の参照
画像となる。なお、SNRスケーラビリティは、空間ス
ケーラビリティの特例であり、上位レイヤと下位レイヤ
の大きさが等しい場合であって、符号化の手順は同じで
ある。
は、例えば前記図2のようにして符号化されることにな
る。図2において、下位レイヤの最初の画像VOP0
は、Iピクチャとして符号化される。また、2番目以後
の下位レイヤの画像VOP2〜VOP6は、Pピクチャ
として符号化される。この時の参照画像は、それぞれ直
前の下位レイヤの画像を参照画像として用いて符号化す
る。また、上位レイヤの画像VOP1はBピクチャとし
て符号化され、この画像VOP1は下位レイヤの画像V
OP0および画像VOP2を参照画像とする。また、上
位レイヤの画像VOP3の場合は、Bピクチャとして符
号化され、直前の上位レイヤの画像VOP1および下位
レイヤの画像VOP4を参照画像とする。また、上位レ
イヤの画像VOP5の場合は、Pピクチャとして符号化
され、直前の上位レイヤの画像VOP3を参照画像とし
て用いる。
の参照画像について説明する。
画像だけでなく他の階層(スケーラブルレイヤ)の画像
も参照画像として用いることができる。例えば本実施の
形態のように2階層のスケーラビリティの場合、上位レ
イヤは下位レイヤの画像も参照画像として用いることが
できる。
画像として、同じ階層の画像または他の階層の画像を用
いることができる。Bピクチャでは、前方予測および後
方予測の参照画像としてそれぞれ同じ階層の画像または
他の階層の画像を用いることができる。また、Bピクチ
ャの場合、上記前方と後方の2枚の参照画像に加えて、
これら2枚の参照画像から生成される第3の画像を予測
参照画像生成に用いられる参照画像として用いることも
可能である。
11,VOP12は下位レイヤの画像を示し、画像V0
P13,VOP14は上位レイヤの画像を示す。下位レ
イヤの画像VOP11はIまたはPピクチャ、画像VO
P12はPピクチャである。また上位レイヤの画像VO
P13はPまたはBピクチャ、画像VOP14はBピク
チャである。拡大画像VM5及びVM6は下位レイヤの
画像を解像度変換(拡大)した画像である。図6の場
合、上位レイヤの画像VOP14は、前方予測の参照画
像として画像VOP13が用いられ、また後方予測の参
照画像として拡大画像VM6が用いられる。
Bピクチャでは、これら2枚の予測参照画像から生成さ
れる画像も参照画像として用いられる。例えば図6の場
合、上位レイヤの画像VOP13および拡大画像VM6
より生成される予測画像PVが上位レイヤのBピクチャ
(VOP14)の参照画像として用いられる。すなわ
ち、上位レイヤの画像VOP14を符号化する場合、上
記画像VOP13と拡大画像VM6、予測画像PVの3
枚の画像が参照画像として用いられる。このように予測
画像PVは従来のMPEG方式に加えて、本実施の形態
による新しい予測モードにおける参照画像に用いられ
る。
に、MPEGにおける各参照画像の性質として、フレー
ム間の変化(差分)が大きい場合には、動き補償の効率
が下がり、同時刻の画像を参照画像とした方が効率が良
いという性質があるので、本実施の形態では、このよう
にフレーム間差分が大きい領域では同時刻の下位レイヤ
の画像から生成した拡大画像VM6を、上位レイヤの画
像VOP14の参照画像に用いるようにしている。ま
た、上位レイヤの画像信号は下位レイヤの画像信号と比
較して画質が良く、従って例えばフレーム間の変化(差
分)が少ない場合は上位レイヤの画像を用いた方が予測
誤差が少なくなるので、本実施の形態では、このように
フレーム間差分が小さい領域では同じ階層(上位レイ
ヤ)の直前の画像(VOP13)を、画像VOP14の
参照画像に用いるようにしている。
空間スケーラブル符号化の情報が重複する場合、すなわ
ち上位レイヤのあるマクロブロックを符号化すると共に
それに対応する下位レイヤのマクロブロックの情報(D
CT係数)を伝送した場合には、同じ上位レイヤの直前
の画像を参照して予測を行うと、下位レイヤと上位レイ
ヤとで独立に情報が伝送されることになり、下位レイヤ
で伝送した情報が上位レイヤの符号化に生かされずに効
率低下の原因となるので、本実施の形態では、上記対応
する下位レイヤのマクロブロックのDCT係数を伝送し
た場合に、下位レイヤの画像を予測参照画像に用いるよ
うにして、データ伝送の重複を少なくし、符号化効率を
改善している。
信号符号化方式においては予測モードはマクロブロック
単位で切り替えられるため、均一な画像領域の場合に当
該マクロブロック単位の予測モード切り替えを行えば十
分であるが、例えば複雑な動きをする画像であったり、
また画像の大きさが小さい場合には、マクロブロック中
に時間的に変化する領域としない領域が混在することに
なり、効率が落ちる原因となっているので、本実施の形
態では、この予測モードを画素単位で切り替えることを
可能とし、符号化効率を改善している。
は、MPEG2方式の参照画像に加えて、新たな参照画
像を生成することによって実現可能である。この新たな
参照画像は、下位レイヤおよび上位レイヤの参照画像を
画素単位で切り替えてコピーすることにより生成され
る。
記画素単位の予測モード切り替えを実現する参照画像で
ある。すなわち予測画像PVは画素単位で、画像VOP
13または拡大画像VM6からコピーすることによって
生成される画像である。したがって、予測画像PVを参
照画像とする場合、実質的に画素単位で予測モードを切
り替えることと等価である。
を、図6を参考にして説明する。
予測画像PVを生成する際には、各画素毎に画像VOP
13または拡大画像VM6のどちらの画像の画素を用い
るかの判定を行う。最も単純な場合、画素単位で下位レ
イヤの画像VOP12およびVOP11のそれぞれ対応
する位置の画素の差分をとり、その差分値があるしきい
値SLより大きい場合には下位レイヤの画像すなわち拡
大画像VM6から画素をコピーし、逆に、差分値がしき
い値SL以下である場合には上位レイヤの画像すなわち
画像VOP13から画素をコピーするようにすればよ
い。ただし、この判別方法では、下位レイヤと上位レイ
ヤの情報の重複を抑制することはできない。また、画像
中の物体が平行移動した場合には、動き補償が正確にあ
たるため、上位レイヤの画像を予測参照画像とすべきで
あるが、この方法では常に差分が大きくなり、下位レイ
ヤから予測されてしまう。したがって、この単純に同一
位置の画素値の変化を調べるだけでは平行移動に対応で
きていない。また、このような平行移動を含む画像シー
ケンスは多く存在するため、平行移動に対応できるよう
にしなければならない。
画素の値(すなわち、動き補償を行う前の値)を調べ、
その絶対値があるしきい値SLより大きい場合には下位
レイヤの画像すなわち拡大画像VM6から画素をコピー
し、しきい値SL以下である場合には上位レイヤの画像
すなわち画像VOP13から画素をコピーして、予測画
像PVを生成するようにすればよい。この判別方法によ
り、下位レイヤでDCT係数が伝送された場合(この場
合、IDCT後の画素値は大きな値を持つ)、下位レイ
ヤの画像が参照画像として選ばれやすくなり、上位レイ
ヤと下位レイヤの情報の重複を抑制することが可能とな
る。
下位レイヤの画像のフレーム間差分を示す差分画像DV
7を用いる。この差分画像DV7は 各マクロブロック
のIDCT後の出力である。
と、図3におけるIDCT回路29の出力信号(下位レ
イヤの局部復号された差分信号)は、演算回路30に出
力されるとともに、図1及び図4に示す上位レイヤ符号
化回路3に伝送され、図4におけるフレームメモリ60
に記録される。フレームメモリ60に記録された差分画
像が、即ち図6における差分画像DV7である。したが
って、この差分画像DV7は、下位レイヤの画像VOP
12の符号化に用いられた動きベクトルを用いて動き補
償を行った際の差分画像である。画像VOP12におい
てフレーム内符号化(イントラ)されたマクロブロック
は、画像VOP12の復号画像信号そのものとなる。
い値SLを設定しており、差分画像DV7の各画素の値
(差分値)の絶対値がそのしきい値SLを越えた場合、
各画素の値をそのまま出力し、また差分画像DV7の各
画素の値がしきい値SL以下である場合、その画素の値
を0として出力する。
信号を参照し、画像VOP13および拡大画像VM6よ
り生成される。予測画像PVの各画素と差分画像DV7
の各画素の対応の一例を図7に示す。図7は上位レイヤ
の解像度が下位レイヤの解像度の2倍の場合を示してい
る。この場合、差分画像DV7の1画素に対して、予測
画像PVの4画素が対応することになる。即ち、予測画
像PVの4画素は、差分画像DV7中の1画素を参照し
て、切り替えを行う。
DV7の対応する位置の画素値がしきい値SLより大き
い値である場合、拡大画像VM6の画素に対する予測画
像PVの同一位置の画素の値を、この予測画像PVの画
素値とする。
素値がしきい値SL以下の値である場合、すなわちしき
い値回路62の出力が0である場合、画像VOP12の
対応する位置のマクロブロックの動きベクトルを用いて
動き補償した画像VOP13の画素を、予測画像PVの
画素値とする。
マクロブロックの動きベクトルは、上位レイヤの下位レ
イヤに対する解像度の倍率を示すフラグに従い、動きベ
クトルを変換する。たとえば、上位レイヤの解像度が下
位レイヤの解像度の2倍である場合、動きベクトルの値
を2倍する。予測画像PVの当該画素と同一位置から、
上記変換後の動きベクトル分だけ異なる位置の画像VO
P13の画素値を、予測画像PVの画素値とする。
ては、下位レイヤから供給される動きベクトルはスケー
ル変換回路63に入力され、それぞれ2倍される。また
動きベクトルの無いマクロブロック(イントラ)では動
きベクトルは0とされる。2倍された動きベクトルは動
き補償回路64に供給される。動き補償回路64ではス
ケール変換された下位レイヤの動きベクトルに従い、フ
レームメモリ51の画像を動き補償してフレームメモリ
61に供給する。
は、図4の画像信号符号化の構成ではフレームメモリ6
0に記録されている。また図6における予測画像PVは
図4におけるフレームメモリ61に記録される。
す。図8に示すように、差分画像DV7の画素の絶対値
がしきい値SL以下の領域では、上位レイヤの画像が用
いられ、また、しきい値SLより大きい場合は、下位レ
イヤの画像が用いられる。
の流れを示したのが図9である。
は、下位レイヤのIDCT後の値から差分画像を構成す
る。次のステップST2では、対応する位置の差分画像
の値がしきい値SL以下であるか否かの判断を行う。こ
のステップST2において、対応する位置の差分画像の
値がしきい値SLより大きいときには、ステップST5
に進む。このステップST5では、下位レイヤの拡大画
像VM6の同一位置の画素値をコピーする。
い値SL以下であるときには、ステップST3に進む。
このステップST3では、下位レイヤの動きベクトルを
2倍に拡大する。そして、次のステップST4では、そ
の動きベクトルを用いて動き補償を行い、上位レイヤの
参照画像からコピーすることにより、予測画像PVを構
成する。
チャでは上記の通り、3枚の参照画像が予測参照画像を
生成するために用いられる。この予測モードはマクロブ
ロック単位で決定される。
モードについて説明する。
に、マクロブロック単位で決定される。上位レイヤのマ
クロブロックの予測モードには以下の種類がある。
ロック (5) 画素単位予測マクロブロック 上記予測モードのうち、(1)〜(4)に示した予測モ
ードは、下位レイヤのマクロブロックの予測モードと同
様である。(5)に示した予測モードにおける画素単位
予測マクロブロックでは、予測画像PVを参照する。こ
のように予測画像PVを参照することにより、予測モー
ドを実質的に画素単位で切り替えることが可能となる。
当該画素単位予測マクロブロックでは、予測画像PVの
同一位置の画素を参照する。すなわち、動きベクトルは
0であるとし、動きベクトルは符号化されない。
では、予測誤差を最小とするモードが選択される。予測
モードを示すフラグは可変長符号化回路によって符号
化、伝送される。
は、予測参照画像を生成するための参照画像として、符
号化する画像と異なるスケーラブルレイヤの画像、例え
ば解像度の低い下位レイヤの画像を用いることが可能で
ある。したがって、上位レイヤでは、どのレイヤの画像
を予測参照画像を生成するための参照画像として用いた
かを示すフラグを伝送する必要がある。そこで、ここで
は、各スケーラブルレイヤについて同じレイヤ以外のど
のレイヤの画像を予測参照画像を生成するために用いた
のかを示すフラグ(後述するシンタクスの識別子(ref_
layer_id))を設定し符号化し、伝送する。また、各画
像(前記VOP)について、上記フラグ(ref_layer_i
d)に基づいて、前方(フォワード)予測および後方
(バックワード)予測をどのレイヤから予測するかを示
すフラグ(後述するシンタクスの識別子(ref_select_c
ode))を設定し符号化、伝送する。Pピクチャにおけ
るフラグ(ref_select_code)を図10の表に示す。ま
た、Bピクチャにおけるフラグ(ref_select_code)を
図11の表に示す。シンタクスについては詳細を後述す
る。
記図5および図2以外にも図10に示す表および図11
に示す表の許す範囲内で自由に設定して良い。また、図
10の表および図11の表のシンタクスにおいては、空
間スケーラビリティやテンポラスケーラビリティについ
て明示的な区別は無い。
f_select_code)が”11”の場合、フラグ(ref_layer
_id)が示すレイヤの同時刻の画像(VOP)を予測参
照画像を生成するための参照画像として用いる。これは
空間スケーラビリティやSNRスケーラビリティに用い
られる。その他のモードはテンポラルスケーラビリティ
に用いられる。
_code)が”00”の場合、フラグ(ref_layer_id)が
示すレイヤの同時刻の画像(VOP)と同じレイヤの直
前に復号した画像(VOP)を予測参照画像を生成する
ための参照画像として用いる。これは空間スケーラビリ
ティやSNRスケーラビリティに用いられる。その他の
モードはテンポラルスケーラビリティに用いられる。
路3の構成について説明する。
Bピクチャのどのタイプで符号化するかは予め決められ
る。前記図4の動きベクトル検出回路42は予め設定さ
れたピクチャタイプに基づき、フラグ(ref_layer_i
d)、(ref_select_code)を設定し、動き補償回路52
および可変長符号化回路46に出力する。
像信号は、図1の解像度変換回路4を介して上位レイヤ
符号化回路3に供給され、図4のフレームメモリ54に
供給される。
められた所定の参照フレームをフラグ(ref_layer_id)
およびフラグ(ref_select_code)に基づいてフレーム
メモリ41またはフレームメモリ51より参照し、動き
補償を行い、その動きベクトルを検出する。本発明にお
ける動き補償(フレーム間予測)には、前方予測,後方
予測,両方向予測、画素単位予測の4種類のモードがあ
る。Pピクチャの予測モードは前方予測のみであり、B
ピクチャの予測モードは前方予測,後方予測,両方向予
測,画素単位予測の4種類である。動きベクトル検出回
路42は、予測誤差を最小にする予測モードを選択しそ
の際の予測モードを発生する。
メモリ61に記録されている画像信号を参照する。ま
た、このモードでは動きベクトルを0とする。
クロブロックの分散と比較され、マクロブロックの分散
の方が小さい場合、そのマクロブロックでは予測は行わ
ず、フレーム内符号化が行われる。この場合予測モード
は画像内符号化(イントラ)となる。動きベクトルおよ
び上記予測モードは可変長符号化回路46および動き補
償回路52に入力される。
レイヤに対して上位レイヤの大きさ(解像度)が何倍で
あるかを示すフラグFRが供給される。図11に示した
表より、Bピクチャ(画像VOP)の場合は、フラグ
(ref_select_code=="00")の時空間スケーラビリティ
であり、この時、後方(バックワード)予測は下位レイ
ヤからの予測、前方(フォワード)予測は同じレイヤの
直前に後方予測を用いて復号した画像(VOP)からの
予測となる。倍率を示すフラグが1であり(下位レイヤ
と上位レイヤの解像度が等しい)、かつフラグ(ref_se
lect_code=="00")である場合は、空間スケーラビリテ
ィの特殊な場合であり、SNRスケーラビリティである
ことを示す。この場合、上位レイヤの前方予測には、下
位レイヤの同時刻のVOPが用いた動きベクトルと予測
モードとをそのまま用いる。したがって、この場合、動
きベクトル検出回路42は下位レイヤから供給される動
きベクトルおよび予測モードを、動き補償回路52に供
給する。この場合、可変長符号化回路46は動きベクト
ルを符号化しない。
(ref_select_code=="00")の場合にのみ画素単位予測
モードが用いられる。すなわち、Bピクチャにおいて
は、上位レイヤと同時刻の下位レイヤの画像を参照画像
として用いるときのみ、画素単位予測モードが用いられ
る。
位レイヤ符号化回路5からのフラグ(下位レイヤCO
D)が供給され、動きベクトルを検出する際に利用され
る。
ルに基づいてフレームメモリ51およびフレームメモリ
54に記憶された参照画像から予測参照画像を生成し、
予測参照画像信号として演算回路43に入力する。
補償回路52で、上位レイヤVOPサイズ及び上位レイ
ヤVOPオフセット、下位レイヤVOPサイズ及び下位
レイヤVOPオフセットが利用される。ただし、図面に
おいて、煩雑化を防ぐため、図示は省略する。
符号化する画像信号の値と予測参照画像信号の値の差分
信号をDCT回路24に出力する。イントラマクロブロ
ックの場合、演算回路43は符号するマクロブロックの
信号をそのままDCT回路44に出力する。
ン変換)処理され、DCT係数に変換される。このDC
T係数は、量子化回路45に入力され、送信バッファ4
7のデータ蓄積量(バッファ蓄積量)に対応した量子化
ステップで量子化された後、量子化データが可変長符号
化回路46に入力される。
より供給される量子化ステップ(スケール)に対応し
て、量子化回路45より供給される量子化データ(いま
の場合、Iピクチャのデータ)を、例えばハフマン符号
などの可変長符号に変換し、符号化データを送信バッフ
ァ47に出力する。なお、可変長符号化回路46には、
下位レイヤ符号化回路5からのフラグCODが供給さ
れ、可変長符号化する際に利用される。
路45より量子化ステップ(スケール)、動きベクトル
検出回路42より予測モード(画像内予測、前方予測、
後方予測、両方向予測または画素単位予測のいずれが設
定されたかを示すモード)および動きベクトルが入力さ
れており、これらも可変長符号化される。
の画像(VOP)の大きさを示すフラグ(上位レイヤV
OPサイズ)および絶対座標における位置を示すフラグ
(上位レイヤVOPオフセット)が入力されており、こ
れらも符号化される。
の解像度に対して上位レイヤの解像度が何倍であるかを
示すフラグFRが入力されており、これも符号化され
る。
ータを一時蓄積し、その蓄積量に対応するデータを量子
化回路45に出力する。
能なデータ残量)が許容上限値まで増量すると、量子化
制御信号によって量子化回路45の量子化スケールを大
きくすることにより、量子化データのデータ量を低下さ
せる。また、これとは逆に、蓄積量(蓄積可能なデータ
残量)が許容下限値まで減少すると、送信バッファ47
は、量子化制御信号によって量子化回路45の量子化ス
ケールを小さくすることにより、量子化データのデータ
量を増大させる。このようにして、送信バッファ47の
オーバフローまたはアンダフローが防止される。
ータは、所定のタイミングで読み出され、伝送路に出力
される。
化データは、逆量子化回路48にも入力され、ここで量
子化回路45より供給される量子化ステップに対応して
逆量子化される。逆量子化回路48の出力信号(逆量子
化により得られたDCT係数)は、IDCT(逆DC
T)回路49に入力され、ここで逆DCT処理された
後、出力信号(画像信号若しくは差分信号)が演算回路
50に送られる。
の出力信号が差分信号である場合、動き補償回路52の
画像信号とIDCT回路49の差分信号とを加算して画
像信号を復元する。なお、IDCT回路49の出力信号
がイントラマクロブロックである場合は、IDCT回路
50からの画像信号がそのまま出力される。この画像信
号はフレームメモリ51に記憶される。
び下位レイヤ符号化回路5のそれぞれ出力ビットストリ
ームである上位レイヤのビットストリームと下位レイヤ
のビットストリームは、多重化回路6に入力される。多
重化回路6は下位レイヤおよび上位レイヤのビットスト
リームを多重化し、ビットストリームとして出力する。
そして、このビットストリームは、伝送路7を介して受
信装置に伝送されるか、若しくは図示しない記録装置に
供給され、記録媒体8に記録される。なお、この際、他
に分離された画像信号がある場合には、さらに多重化さ
れて記録される。
符号化装置に対応する実施の形態における画像信号復号
装置の一例を示す。
供給されたビットストリームを図示しない受信装置で受
信するか、記録媒体87に記録されているビットストリ
ームを図示しない再生装置で再生する。そして、このビ
ットストリームはまず逆多重化回路81に入力される。
逆多重化回路81では、上記ビットストリームを逆多重
化、すなわち上位レイヤのビットストリームと下位レイ
ヤのビットストリームに分離して出力する。
下位レイヤ復号回路85に供給される。また上位レイヤ
のビットストリームは遅延回路82を介して上位レイヤ
復号回路83に供給される。
で1画像(1VOP分)を復号するのに要する時間だけ
遅延した後、上位レイヤ復号回路83に上位レイヤのビ
ットストリームを供給する。
図13を用いて説明する。
ファ91に一時記憶された後、符号化データとして可変
長復号回路92に供給される。可変長復号回路92は、
受信バッファ91より供給された符号化データを可変長
復号化し、動きベクトルと予測モードとを動き補償回路
97に、また、量子化ステップを逆量子化回路93にそ
れぞれ出力すると共に、可変長復号された量子化データ
を逆量子化回路93に出力する。
画像(VOP)の大きさを示すフラグ(下位レイヤVO
Pサイズ)及び絶対座標における位置を示すフラグ(下
位レイヤVOPオフセット)を復号し、動き補償回路9
7とフレームメモリ96で利用されるために出力する。
これらのフラグ及び動きベクトルと予測モードはまた図
12の上位レイヤ復号回路83に供給される。さらに、
可変長復号回路92は、スキップマクロブロックである
かどうかを示すフラグCODを復号し、下位レイヤCO
Dとして動き補償回路97及び図12の上位レイヤ復号
回路83に供給する。
より供給された量子化データを、同じく可変長復号化回
路92より供給された量子化ステップに従って逆量子化
し、出力信号IDCT回路94に出力する。逆量子化回
路93より出力された出力信号(DCT係数)は、ID
CT回路94で逆DCT処理された後、その出力信号
(画像信号若しくは差分画像信号)が演算回路95に供
給される。
号)はまた、図12の上位レイヤの復号回路85に供給
され記憶される。
が、Iピクチャのデータである場合、その画像信号は演
算回路95よりそのまま出力され、演算回路95に対し
て後に入力される差分画像信号(PまたはBピクチャの
データ)の予測参照画像信号の生成のために、フレーム
メモリ96に供給されて記憶される。また、この画像信
号は、そのまま、再生画像として外部に出力される。
ャの場合、動き補償回路97は可変長復号回路92より
供給される動きベクトルおよび予測モードに従って、予
測参照画像を生成し、予測参照画像信号を演算回路95
に出力する。演算回路95ではIDCT回路94より入
力される差分画像信号と動き補償回路97より供給され
る予測参照画像信号を加算して、出力再生画像として出
力する。またPピクチャの場合、演算回路95からの画
像信号はまた、フレームメモリ96に入力され記憶さ
れ、次に復号する画像信号の参照画像とされる。
て逆多重化された上位レイヤのビットストリームは、遅
延回路82を介して上位レイヤ復号回路83に供給され
る。図14を用いて上位レイヤ復号回路83の具体的構
成を説明する。
ッファ101に一時記憶された後、符号化データとして
可変長復号回路102に供給される。可変長復号回路1
02は、受信バッファ101より供給された符号化デー
タを可変長復号化し、動きベクトルと予測モードを動き
補償回路107に、また、量子化ステップを逆量子化回
路103にそれぞれ出力するとともに、可変長復号され
た量子化データを逆量子化回路103に出力する。
の画像(VOP)の大きさを示すフラグ(上位レイヤV
OPサイズ)及び絶対座標における位置を示すフラグ
(上位レイヤVOPオフセット)を復号し、動き補償回
路107とフレームメモリ106で利用するために出力
する。
の画像(VOP)に対する上位レイヤの画像(VOP)
の大きさ(解像度)の倍率を示すフラグFRを復号し、
動き補償回路107及び、図12における解像度変換回
路84に出力する。
号された下位レイヤの画像(VOP)の画像信号及びキ
ー(key)信号を、倍率を示すフラグFRに従ってフィ
ルタリングにより解像度変換し、上位レイヤ復号回路8
3中のフレームメモリ119に供給する。
に用いるレイヤを示すフラグ(ref_layer_id)及び(ref_s
elect_code)を復号し、動き補償回路107に出力す
る。
02より供給された量子化データを、同じく可変長復号
化回路102より供給された量子化ステップに従って逆
量子化し、出力信号IDCT回路104に出力する。逆
量子化回路103より出力された出力信号(DCT係
数)は、IDCT回路104で逆DCT処理され、その
出力信号(画像信号若しくは差分画像信号)が演算回路
105に供給される。
号が、Iピクチャである場合、その画像信号は演算回路
105よりそのまま出力され、演算回路105に後に入
力される差分画像信号(PまたはBピクチャのデータ)
の予測参照画像の生成のために、フレームメモリ106
に供給されて記憶される。また、この画像信号は、その
まま再生画像として外部に出力される。
ャの場合、動き補償回路107は可変長復号回路102
より供給される動きベクトルおよび予測モード及び下位
レイヤCOD及び参照するレイヤを示すフラグ(ref_la
yer_id),(ref_select_code)に従って、予測参照画
像をフレームメモリ106からの画像信号とフレームメ
モリ119からの画像信号より生成し、予測参照画像信
号を演算回路105に出力する。また、この時、上位レ
イヤVOPサイズ及び上位レイヤVOPオフセット、下
位レイヤVOPサイズ及び下位レイヤVOPオフセット
が利用される。演算回路105ではIDCT回路104
より入力される差分画像信号と動き補償回路107より
供給される予測参照画像信号を加算して、出力再生画像
として出力する。またPピクチャの場合、演算回路10
5からの画像信号はまた、フレームメモリ106に入力
され記憶され、次に復号する画像信号の予測参照画像と
される。
号化回路において前記図6の予測画像PVを生成した方
法と同様に予測参照画像を生成し、図14におけるフレ
ームメモリ112に記憶する。
IDCT回路94の出力信号(画像信号若しくは差分画
像信号)は上位レイヤ復号回路83に供給され、図14
におけるフレームメモリ110に供給される。しきい値
回路111は、図4の符号化回路におけるしきい値回路
62と同様に、フレームメモリ110に記録された信号
の絶対値があるしきい値SLを越えるどうかを調べ、し
きい値SL以下の場合に0を出力し、しきい値SLより
大きい場合にフレームメモリ110の信号をそのまま出
力する。
照画像信号は、フレームメモリ110に記録されている
対応する位置の差分画像信号の値がしきい値SLより大
きいかどうかに応じてフレームメモリ106またはフレ
ームメモリ119からコピーして生成される。しきい値
回路111の対応する位置の出力が0である場合、即ち
フレーム間差分が少ない場合、上位レイヤの画像信号即
ちフレームメモリ106からコピーされる。この時、図
12の下位レイヤ復号回路85から供給される動きベク
トルを用い、動き補償を行う。
れる動きベクトルは、スケール回路114によって2倍
される。2倍された動きベクトルは動き補償回路113
に供給される。動き補償回路113では、フレームメモ
リ106から画素をコピーする場合、スケール回路11
4より供給される動きベクトルにしたがって、動き補償
を行い、画素をコピーする。
画像信号を生成する際に、しきい値回路111の対応す
る出力が0以外である場合、下位レイヤの画像即ちフレ
ームメモリ119に記録されている画像信号の同一位置
の画素をコピーする(動き補償は行わない)。
号はフレームメモリ112に記録され、フレームメモリ
106、119の画像とともに予測に用いられる。
1でありかつフラグ(ref_select_code=="00")である
場合、下位レイヤの同時刻の画像(VOP)から供給さ
れる動きベクトルおよび予測モードを用いて予測参照画
像信号を生成し、演算回路105に出力する。
一例について説明する。なお、以下、シンタクスの説明
に関して、本発明に関係する部分のみ説明して、それ以
外はここでは省略する。
す。VS(Video Session Class)は一つ又は複数のVO
(Video Object Class)から構成される、ビットストリー
ムの集合である。
のシンタクスはいわゆるC++に準拠している。
下に示す。
リームである。VOL(Video Object Layer Class)はス
ケーラビリティのためのクラスである。
番号によって識別される。例えば、(video_object_lay
er_id=0)である VOL0は下位レイヤであり、例え
ば(video_object_layer_id=1)であるVOL1は上
位レイヤである。スケーラブルのレイヤの数は任意で良
い。
ットのフラグでそのVOLが下位レイヤであるか上位レ
イヤであるかを示す。(scalability=1)である場
合、そのVOLは下位レイヤであり、それ以外の場合上
位レイヤである。
以外のVOLを参照画像として用いる場合の参照画像V
OLの番号を示すフラグである。これは上位レイヤにの
み伝送される。
_sampling_factor_m)は下位レイヤの水平方向の長さに
対して上位レイヤの水平方向の長さが何倍であるかを示
す(水平方向の解像度の倍率を示す)。下位レイヤに対
する上位レイヤの水平方向の大きさは以下の式で与えら
れる。
ctor_m)は下位レイヤの垂直方向の長さに対して上位レ
イヤの垂直方向の長さが何倍であるかを示す(垂直方向
の解像度の倍率を示す)。下位レイヤに対する上位レイ
ヤの垂直方向の大きさは以下の式で与えられる。
actor_m VOP(Video Object Plane Class)のシンタクスを以下
に示す。
Pの大きさを示すフラグ(VOPサイズ)である。
ワード)および後方(バックワード)予測において識別
子(ref_layer_id)に基づき、どのレイヤの画像を参照
画像として用いるかを示すフラグである。図10に示し
た表および図11に示した表にその詳細が示されてい
る。
P)におけるマクロブロックのシンタクスを示す。(CO
D)はこれ以後そのマクロブロックのデータが存在するか
どうかを示すフラグである。(COD=1)の場合、これ以
後、そのマクロブロックのデータが存在しないことを示
す(即ちスキップマクロブロック)。(COD=0)の場合、
さらにフラグが伝送される。(MCBCP)はそのマクロブロ
ックのタイプを示すフラグで、これに従って所定のフラ
グおよびデータが伝送される。
クロブロックのシンタクスを示す。もし、最も最近に復
号されたIまたはPピクチャ(画像VOP)の対応する
マクロブロックがスキップマクロブロックであった場合
(COD=1)、Bピクチャ(画像VOP)におけるそのマ
クロブロックもスキップマクロブロックとなる。
クロブロックのタイプを示すフラグである。(MODB)の可
変長符号を図18に示す。(MODB=0)の場合、それ以上マ
クロブロックのデータが存在しないことを示す。(MODB=
10)の場合、(CBPB)は伝送されず、(MBTYPE)が伝送され
る。(MODB=11)の場合、(CBPB)および(MBTYPE)が伝送さ
れる。なお、図中のxは、現在のマクロブロックを示
す。
ク中の各ブロックにDCT係数が存在するかどうかを示
すフラグである。(CBPB)が伝送されない場合、(CBPB)は
0であると解釈され、そのマクロブロックではDCT係
数は伝送されない。
ロックの予測モードを示すフラグである。下位レイヤの
(MBTYPE)を図19に示す。(MBTYPE)に応じて図19に示
す通り、そのマクロブロックで伝送されるフラグが決定
される。なお、図中のxは、現在のマクロブロックを示
す。
す。(MBTYPE="1")の時、画素単位予測モードとなる。こ
の場合、動きベクトルは伝送されない。
クの条件は以下の通りである。
して扱われる。DCT係数は全て0であり、動きベクト
ルも0として扱われる。
クロブロックの条件は下位レイヤと同様である。
P)の対応するマクロブロックがスキップマクロブロッ
クである(COD=1)である場合。
る。予測はPピクチャ(VOP)と同様に行われ動きベ
クトルは0として扱われる。
の場合 この場合、スキップマクロブロックとして扱われ、この
マクロブロックの(MBTYPE)はダイレクト(Direct(H.2
63))となり、H.263のPBピクチャと同様に符号
化される。このとき動きベクトルは直前に復号されたP
ピクチャ(VOP)において同じ位置のマクロブロック
の動きベクトルが用いられる。
キップマクロブロックの条件は以下の通りである。
して扱われる。DCT係数は全て0であり、動きベクト
ルも0として扱われる。
クロブロックの条件は下位レイヤと同様である。
参照画像を最も一般的に効率が良いモードに設定してお
くべきである。したがって、空間スケーラビリティの場
合の上位レイヤのマクロブロックにおいては画素単位予
測モードとするのが効率が良い。
ピクチャ(VOP)のスキップマクロブロックの条件は
以下の通りである。
つMOBD=="0"である場合。
合、最も最近に復号されたIまたはPピクチャ(VO
P)の対応するマクロブロックがスキップマクロブロッ
クであるかどうか(CODの値)によらず、常にそれ以後
のデータを伝送する。このとき次に符号化される(MODB)
が0の場合スキップマクロブロックとなり、それ以上の
データは伝送されない。この時予測は 画素単位予測モ
ードとなり、動きベクトルは0として扱われる。
つ最も最近に復号されたIまたはPピクチャ(VOP)
の対応するマクロブロックがスキップマクロブロックで
ある(COD=1)である場合。
る。予測はPピクチャ(VOP)と同様に行われ動きベ
クトルは0として扱われる。
つ、MODB=="0"の場合 この場合、スキップマクロブロックとして扱われ、この
マクロブロックの(MBTYPE)はダイレクト(H.263)
となり、H.263のPBピクチャと同様に符号化され
る。このとき動きベクトルは(ref_select_code)によ
って示されるVOLの直前に復号されたPピクチャ(V
OP)において同じ位置のマクロブロックの動きベクト
ルが用いられる。
おいては、下位階層の画像信号を参照画像信号を用いて
符号化して第1の符号化データを出力し、上位階層の画
像信号を参照画像信号を用いて符号化して第2の符号化
データを出力し、第1の符号化データを復号して第1の
参照画像信号を生成し、第2の符号化データを復号して
第2の参照画像信号を生成し、第1の参照画像信号と第
2の参照画像信号とを各画素毎に適応的に切り替えるこ
とにより第3の参照画像信号を生成する生成し、第1、
第2若しくは第3の参照画像信号を選択して上位階層の
画像信号を符号化することにより、予測効率を改善し、
符号化効率を向上することが可能である。
においては、それぞれ参照画像信号を用いて符号化され
た下位階層の画像信号と上位階層の画像信号とからなる
符号化データを受信し、その符号化された下位階層の画
像信号を参照画像信号を用いて復号して第1の参照画像
信号として出力し、符号化された上位階層の画像信号を
参照画像信号を用いて復号して第2の参照画像信号とし
て出力し、第1の参照画像信号と第2の参照画像信号と
を各画素毎に適応的に切り替えることにより第3の参照
画像信号を生成し、第1、第2若しくは第3の参照画像
信号を選択して上位階層の画像信号を復号することによ
り、良好な復号画像信号を得ることが可能である。
び方法によれば、本発明の画像信号符号化装置及び方法
により符号化された信号を記録してなる記録媒体を再生
復号すること、すなわち、符号化された下位階層の画像
信号と符号化された上位階層の画像信号とからなる符号
化データを含んで記録してなり、符号化データは、下位
階層の画像信号を参照画像信号を用いて符号化して第1
の符号化データを出力し、上位階層の画像信号を参照画
像信号を用いて符号化して第2の符号化データを出力
し、第1の符号化データを復号して、第1の参照画像信
号を生成し、第2の符号化データを復号して、第2の参
照画像信号を生成し、第1の参照画像信号と第2の参照
画像信号とを各画素毎に適応的に切り替えることにより
第3の参照画像信号を生成し、上記第1、第2若しくは
第3の参照画像信号を選択して上位階層の画像信号を符
号化してなる記録媒体を再生復号することで、良好な画
像信号を得ることが可能となる。
参照画像を用いて符号化する装置及び方法において、各
層の画像信号を符号化した信号を復号して各層毎の参照
画像を生成し、各種の参照画像の各画素を適応的に切り
替えた予測参照画像をも生成し、この予測参照画像を利
用して上位階層の画像信号を符号化することにより、空
間スケーラブル符号化方法において、予測効率を改善
し、符号化効率を向上することが可能となる。
離された動き物体画像の場合には、キー(key)信号
が入力されるが、入力画像信号が分離された背景画像の
場合は、キー(key)信号は入力されない。
の場合は、キー(key)信号の符号化及び復号処理は
省略されることになる。
画像(背景画像及び動き物体画像)信号に分離して、そ
れぞれの画像毎に符号化するような場合の他に、通常の
動画像信号が入力画像信号として供給されてもよい。こ
の場合、キー(key)信号の符号化及び復号処理は、
省略されることになる。
いて、様々な変形や応用例が考えられる。したがって、
本発明の要旨は、実施の形態に限定されるものではな
い。
る実施の形態の画像信号符号化装置の概略構成を示すブ
ロック回路図である。
を示す図である。
具体的構成を示すブロック回路図である。
具体的構成を示すブロック回路図である。
用いる図である。
説明に用いる図である。
応の一例を示す図である。
ーチャートである。
e)の表を示す図である。
e)の表を示す図である。
る実施の形態の画像信号復号装置の概略構成を示すブロ
ック回路図である。
体的構成を示すブロック回路図である。
体的構成を示すブロック回路図である。
図である。
のシンタクスを示す図である。
クスを示す図である。
を示すフラグであるMODBの可変長符号を示す図である。
ロックの予測モードを示すフラグであるMBTYPEを示す図
である。
ダの概略構成例を示すブロック回路図である。
略構成例を示すブロック回路図である。
構成例を示すブロック回路図である。
成例を示すブロック回路である。
ヤ符号化回路、 4解像度変換回路、 5 下位レイヤ
符号化回路、 6 多重化回路、 81 逆多重化回
路、 82 遅延回路、 83 上位レイヤ復号回路、
94 解像度変換回路、 95 下位レイヤ復号回路
Claims (4)
- 【請求項1】 所定の画像信号をそれぞれ表す下位階層
の画像信号と上位階層の画像信号を符号化する画像信号
符号化装置において、 上記下位階層の画像信号を参照画像信号を用いて符号化
して、第1の符号化データを出力する第1の符号化手段
と、 上記上位階層の画像信号を参照画像信号を用いて符号化
して、第2の符号化データを出力する第2の符号化手段
と、 上記第1の符号化データを復号して、第1の参照画像信
号を生成する第1の復号手段と、 上記第2の符号化データを復号して、第2の参照画像信
号を生成する第2の復号手段と、 上記第1の参照画像信号と上記第2の参照画像信号とを
各画素毎に適応的に切り替えることにより第3の参照画
像信号を生成する生成手段とを有し、 上記第2の符号化手段は、上記第1、第2若しくは第3
の参照画像信号を選択して上記上位階層の画像信号を符
号化することを特徴とする画像信号符号化装置。 - 【請求項2】 所定の画像信号をそれぞれ表す下位階層
の画像信号と上位階層の画像信号を符号化する画像信号
符号化方法において、 上記下位階層の画像信号を参照画像信号を用いて符号化
して、第1の符号化データを出力する第1の符号化ステ
ップと、 上記上位階層の画像信号を参照画像信号を用いて符号化
して、第2の符号化データを出力する第2の符号化ステ
ップと、 上記第1の符号化データを復号して、第1の参照画像信
号を生成する第1の復号ステップと、 上記第2の符号化データを復号して、第2の参照画像信
号を生成する第2の復号ステップと、 上記第1の参照画像信号と上記第2の参照画像信号とを
各画素毎に適応的に切り替えることにより第3の参照画
像信号を生成する生成ステップとを有し、 上記第2の符号化ステップは、上記第1、第2若しくは
第3の参照画像信号を 選択して上記上位階層の画像信号
を符号化することを特徴とする画像信号符号化方法。 - 【請求項3】 符号化された下位階層の画像信号と符号
化された上位階層の画像信号からなる符号化データを受
信し、その符号化データを復号する画像信号復号装置に
おいて、 符号化された下位階層の画像信号と符号化された上位階
層の画像信号はそれぞれ参照画像信号を用いて符号化さ
れており、 上記符号化データを受信する受信手段と、 上記符号化された下位階層の画像信号を参照画像信号を
用いて復号して、当該復号された下位階層の画像信号を
第1の参照画像信号として出力する第1の復号手段と、 上記符号化された上位階層の画像信号を参照画像信号を
用いて復号して、当該復号された上位階層の画像信号を
第2の参照画像信号として出力する第2の復号手段と、 上記第1の参照画像信号と上記第2の参照画像信号とを
各画素毎に適応的に切り替えることにより第3の参照画
像信号を生成する生成手段とを有し、 上記第2の復号手段は、上記第1、第2若しくは第3の
参照画像信号を選択して上記上位階層の画像信号を復号
することを特徴とする画像信号復号装置。 - 【請求項4】 符号化された下位階層の画像信号と符号
化された上位階層の画像信号からなる符号化データを受
信し、その符号化データを復号する画像信号復号方法に
おいて、 符号化された下位階層の画像信号と符号化された上位階
層の画像信号はそれぞれ参照画像信号を用いて符号化さ
れており、 上記符号化データを受信する受信ステップと、 上記符号化された下位階層の画像信号を参照画像信号を
用いて復号して、当該復号された下位階層の画像信号を
第1の参照画像信号として出力する第1の復号ステップ
と、 上記符号化された上位階層の画像信号を参照画像信号を
用いて復号して、当該復号された上位階層の画像信号を
第2の参照画像信号として出力する第2の復号ステップ
と、 上記第1の参照画像信号と上記第2の参照画像信号とを
各画素毎に適応的に切り替えることにより第3の参照画
像信号を生成する生成ステップとを有し、 上記第2の復号ステップは、上記第1、第2若しくは第
3の参照画像信号を選択して上記上位階層の画像信号を
復号することを特徴とする画像信号復号方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1161098A JP3301375B2 (ja) | 1997-01-24 | 1998-01-23 | 画像信号符号化装置及び方法、画像信号復号装置及び方法 |
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP9-11635 | 1997-01-24 | ||
| JP1163597 | 1997-01-24 | ||
| JP1161098A JP3301375B2 (ja) | 1997-01-24 | 1998-01-23 | 画像信号符号化装置及び方法、画像信号復号装置及び方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH10271512A JPH10271512A (ja) | 1998-10-09 |
| JP3301375B2 true JP3301375B2 (ja) | 2002-07-15 |
Family
ID=26347064
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1161098A Expired - Fee Related JP3301375B2 (ja) | 1997-01-24 | 1998-01-23 | 画像信号符号化装置及び方法、画像信号復号装置及び方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3301375B2 (ja) |
Families Citing this family (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP1352526B1 (en) | 2000-11-23 | 2006-06-14 | Koninklijke Philips Electronics N.V. | Video decoding method and corresponding decoder |
| US20050013498A1 (en) | 2003-07-18 | 2005-01-20 | Microsoft Corporation | Coding of motion vector information |
| US8064520B2 (en) * | 2003-09-07 | 2011-11-22 | Microsoft Corporation | Advanced bi-directional predictive coding of interlaced video |
| KR20070074451A (ko) | 2006-01-09 | 2007-07-12 | 엘지전자 주식회사 | 베이스 레이어의 영상신호를 레이어간 예측에 사용하는방법 |
| EP1972152A4 (en) | 2006-01-09 | 2014-12-17 | Lg Electronics Inc | METHOD FOR PREDICTING INTER-LAYER OF VIDEO SIGNAL |
-
1998
- 1998-01-23 JP JP1161098A patent/JP3301375B2/ja not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JPH10271512A (ja) | 1998-10-09 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6173013B1 (en) | Method and apparatus for encoding enhancement and base layer image signals using a predicted image signal | |
| KR100323489B1 (ko) | 비디오데이타를가지는비트스트림의트랜스코딩방법및장치 | |
| US6389173B1 (en) | Picture encoding and/or decoding apparatus and method for providing sacalability of a video object whose position changes with time and a recording medium having the same recorded thereon | |
| US6343098B1 (en) | Efficient rate control for multi-resolution video encoding | |
| US8630342B2 (en) | Picture coding method and picture decoding method | |
| US7194032B1 (en) | Circuit and method for modifying a region of an encoded image | |
| KR100934290B1 (ko) | 엠피이지-2 4:2:2-프로파일 비트스트림을 메인-프로파일비트스트림으로 컨버팅 하기 위한 방법 및 아키텍처 | |
| Puri | Video coding using the MPEG-2 compression standard | |
| EP2384002B1 (en) | Moving picture decoding method using additional quantization matrices | |
| US6608935B2 (en) | Picture encoding method and apparatus, picture decoding method and apparatus and furnishing medium | |
| US6031575A (en) | Method and apparatus for encoding an image signal, method and apparatus for decoding an image signal, and recording medium | |
| US20020075956A1 (en) | Bidirectionally predicted pictures or video object planes for efficient and flexible video coding | |
| US6535558B1 (en) | Picture signal encoding method and apparatus, picture signal decoding method and apparatus and recording medium | |
| JPH06343173A (ja) | 可変解像度イメージの生成を助ける空間/周波数ハイブリッドビデオ符号化 | |
| US20040028129A1 (en) | Picture encoding method and apparatus, picture decoding method and apparatus and furnishing medium | |
| JP2001211455A (ja) | 画像符号化方法及び画像符号化装置 | |
| US6498816B1 (en) | Circuit and method for formatting each of a series of encoded video images into respective regions | |
| JP3263901B2 (ja) | 画像信号符号化方法及び装置、画像信号復号化方法及び装置 | |
| JP3301375B2 (ja) | 画像信号符号化装置及び方法、画像信号復号装置及び方法 | |
| KR100364748B1 (ko) | 영상 변환 부호화 장치 | |
| US6556714B2 (en) | Signal processing apparatus and method | |
| Haskell et al. | Mpeg video compression basics | |
| JP3318707B2 (ja) | 画像信号符号化装置および画像信号符号化方法、画像信号復号装置および画像信号復号方法、画像信号伝送方法、並びに画像信号記録媒体 | |
| JP3318712B2 (ja) | 画像信号符号化装置および画像信号符号化方法、画像信号復号装置および画像信号復号方法、画像信号伝送方法、並びに画像信号記録媒体 | |
| Liu | Performance comparison of MPEG1 and MPEG2 video compression standards |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20020326 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080426 Year of fee payment: 6 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090426 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090426 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100426 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100426 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110426 Year of fee payment: 9 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120426 Year of fee payment: 10 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130426 Year of fee payment: 11 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140426 Year of fee payment: 12 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| LAPS | Cancellation because of no payment of annual fees |