[go: up one dir, main page]

JP3677165B2 - 動画像符号化装置および動画像符号化方法 - Google Patents

動画像符号化装置および動画像符号化方法 Download PDF

Info

Publication number
JP3677165B2
JP3677165B2 JP11638399A JP11638399A JP3677165B2 JP 3677165 B2 JP3677165 B2 JP 3677165B2 JP 11638399 A JP11638399 A JP 11638399A JP 11638399 A JP11638399 A JP 11638399A JP 3677165 B2 JP3677165 B2 JP 3677165B2
Authority
JP
Japan
Prior art keywords
motion vector
texture
information
macroblock
shape
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP11638399A
Other languages
English (en)
Other versions
JP2000308066A (ja
Inventor
昇 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP11638399A priority Critical patent/JP3677165B2/ja
Publication of JP2000308066A publication Critical patent/JP2000308066A/ja
Application granted granted Critical
Publication of JP3677165B2 publication Critical patent/JP3677165B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、ISO/IEC JTC/SC29/WG11において標準化作業が進行中である、動画像符号化の国際標準方式MPEG4で実現される、任意形状のオブジェクトを個別に符号化する機能を利用した動画像符号化装置および動画像符号化方法に関する。
【0002】
【従来の技術】
現在標準化作業が進行中であるMPEG4( Motion Picture Experts Group phase 4)では、従来の動画像符号化の国際標準方式であるMPEG1( Motion Picture Experts Group phase 1)やMPEG2( Motion Picture Experts Group phase 2)では実現出来ない機能である、任意形状のオブジェクト(例えば、画面内に写っている人物)ごとに個別に符号化する機能が実現されることになっている。
【0003】
この機能を実現するためには、各オブジェクトの形や大きさを表わす情報(形状情報)が必要であり、この情報は、オブジェクト内部の輝度・色差の変化を表わすテクスチャ情報と共に符号化された後、伝送・蓄積される。
【0004】
すなわち、背景とオブジェクトからなる画像があったとすると、この画像を背景とオブジェクトに分け、符号化する。そして、背景やオブジェクトを別々に符号化するために、各オブジェクトの形や大きさを表わす情報(形状情報)が別途与えられる。これがアルファマップ信号と呼ばれる形状情報信号である。
【0005】
このアルファマップ信号は、オブジェクトの形状や画面内の位置を表す例えば2値の副画像情報として与えられる(なお、背景のアルファマップ信号は、オブジェクトのアルファマップ信号から一意に求められる)。
【0006】
このように、MPEG4では各オブジェクトの形や大きさを表わす情報(形状情報)を、オブジェクト内部の輝度・色差の変化を表わすテクスチャ情報と共に符号化することにより、情報量を小さくして、復号側ではこれを元にオブジェクトを再現できる機能が実現できるようになっている。
【0007】
ここで、MPEG4の画像符号化および画像復号化装置について概略を説明しておく。図7は、画像を符号化する場合に、画面内を背景とオブジェクトに分割して符号化する方式の画像符号化装置のブロック構成図である。この画像符号化装置は、図7に示すように、差分回路1100、動き補償予測回路(MC)1110、直交変換回路(DCT)1120、量子化回路1130、可変長符号化回路(VLC)1140、逆量子化回路(IQ)1150、逆直交変換回路(IDCT)1160、加算回路1170、多重化回路1180、アルファマップ符号化回路1200とから構成される。
【0008】
アルファマップ符号化回路1200は、入力されたアルファマップを符号化し、この符号化された信号をアルファマップ信号として多重化回路1180に出力する機能と、このアルファマップ信号を復号して局部復号信号として出力する機能を有する。
【0009】
特に、本アルファマップ符号化回路1200は、入力されたアルファマップを符号化するにあたり、与えられた縮小率(倍率)で解像度を縮小する処理を行い、この解像度縮小処理されたものを符号化すると共に、この符号化したものと縮小率の情報(倍率情報)とを多重化してこれをアルファマップ信号として多重化回路180に出力する機能を有する。そして、局部復号信号としては、解像度縮小処理されたものを元の解像度に戻す処理をして得たものを用いる構成である。
【0010】
差分回路1100は、動き補償予測回路1110より供給される動き補償予測信号と入力画像信号との差分信号を算出するものであり、直交変換回路1120は、差分回路1100から供給された差分信号を、アルファマップの情報にしたがって、直交変換係数に変換して出力するものである。
【0011】
量子化回路1130はこの直交変換回路1120により得られた直交変換係数を量子化する回路であり、可変長符号化回路1140はこの量子化回路1130の出力を符号化して出力するものである。多重化回路1180はこの可変長符号化回路1140により符号化されたものと、前記アルファマップ信号とを、動きベクトル情報等のサイド情報と共に多重化多重化してビットストリームとして出力するものである。
【0012】
逆量子化回路1150は量子化回路1130の出力を逆量子化するものであり、逆直交変換回路1160はこの逆量子化回路1150の出力を前記アルファマップに基いて逆直交変換するものであり、加算回路1170はこの逆直交変換回路1160の出力と動き補償予測回路1110から与えられる予測信号(動き補償予測信号)とを加算して差分回路1100に出力するものである。
【0013】
動き補償予測回路1110は、フレームメモリを有し、アルファマップ復号化回路1200から与えられる局部復号信号にもとづいて動作してオブジェクト領域の信号、背景領域の信号を蓄積する機能を有する。また、動き補償予測回路1110は蓄積したオブジェクト領域の画像から動き補償値を予測して予測値として出力し、また、蓄積した背景領域の画像から動き補償値を予測して予測値として出力する機能を有する。
【0014】
このような構成の本装置の作用を説明する。
本装置には、画像信号とその画像信号のアルファマップが入力される。そして、これらのうち、画像信号はフレーム毎にそれぞれ所定画素サイズ(例えば、M×N画素(M:水平方向の画素数、N:垂直方向の画素数))のブロックに分割された後、ブロック位置順に信号線1010を介して差分回路1100に供給される。そして、差分回路1100では、この入力(画像信号)と、予測信号(オブジェクト予測回路1110からの動き補償予測信号の出力)との差分信号が算出され、直交変換回路1120に供給される。
【0015】
直交変換回路1120では、供給された差分信号を、信号線1040を介してアルファマップ符号化回路1200から供給されるアルファマップの情報にしたがって、直交変換係数に変換した後、量子化回路1130に供給する。そして、ここで量子化される。量子化回路1130にて量子化されて得られた変換係数は、可変長符号化回路1140において符号化されると共に、逆量子化回路1150に供給される。
【0016】
逆量子化回路1150に供給された変換係数は、ここで逆量子化された後、逆直交変換回路1160において逆変換される。そして、加算回路1170において動き補償予測回路1110より供給される動き補償予測値と加算され、局部復号画像として出力されて、再び動き補償予測回路1110に入力される。
【0017】
そして、この加算回路1170の出力である局部復号画像は、動き補償予測回路1110内のフレームメモリに蓄えられる。
【0018】
一方、この動き補償予測回路1110は、アルファマップ復号化回路1200から与えられる局部復号信号に基づいてオブジェクトの領域のブロックの処理のタイミングでは“オブジェクトの動き補償予測値”を、また、それ以外のタイミングでは“背景部分の動き補償予測値”を出力して差分回路1100に与える。
【0019】
すなわち、動き補償予測回路1110ではアルファマップ信号の局部復号信号から現在、オブジェクトのブロック対応部分の画像信号が差分回路1100に入力されているのか、あるいは背景部分のブロック対応部分の画像信号が差分回路1100に入力されているのかを知り、オブジェクトのブロック対応部分の画像信号の入力期間中であれば、オブジェクトの動き補償予測信号を、そして、背景部分のブロック対応部分の画像信号入力期間中であれば、背景の動き補償予測信号を、差分回路1100に与える。
【0020】
差分回路1100では、この入力された画像信号と、その画像の領域対応の予測信号との差を算出するので、その結果、入力画像がオブジェクト対応の領域のものであれば、そのオブジェクトの対応位置での予測値との差分信号が、また、入力画像が背景の領域のものであれば、その背景位置対応の予測値との差分信号が算出され、直交変換回路1120に供給される。
【0021】
直交変換回路1120では、供給された差分信号を信号線1040を介して供給されるアルファマップの情報にしたがって、離散コサイン変換などの処理を施すことにより、直交変換係数に変換した後、量子化回路1130に供給する。そして、直交変換係数はこの量子化回路1130にて量子化される。
【0022】
量子化回路1130にて量子化された変換係数は、可変長符号化回路1140において符号化されると共に、逆量子化回路1150に供給される。そして、逆量子化回路1150に供給された変換係数はここで逆量子化された後、逆直交変換回路1160において逆変換されて加算回路1170に供給される。そして、予測値切り換え回路1500を介して加算回路1170に供給される予測値と加算されることになる。
【0023】
加算回路1170の出力である局部復号画像の信号は、動き補償予測回路1110に供給される。そして、この動き補償予測回路1110ではアルファマップ信号の局部復号信号から現在、加算回路1170からオブジェクトのブロック対応の信号が出力されているのか、あるいは背景部分のブロック対応の信号が出力されているのかを知り、その結果、オブジェクトのブロック対応の信号の出力中であれば、オブジェクト用のフレームメモリに、また、背景部分のブロック対応の信号の出力中であれば、背景用のメモリに与えるべく動作して対応のメモリに蓄える。
【0024】
そして、これにより、オブジェクト用のフレームメモリにはオブジェクト画像のみが、また、背景用のメモリには背景画像のみの画像が得られることになる。これにより、動き補償予測回路1110はオブジェクト画像を利用してオブジェクト画像の予測値を求めることができ、また、背景部分の画像を利用して背景画像の予測値を求めることができる。
【0025】
上述したように、アルファマップ符号化回路1200では、入力されるアルファマップを符号化し、この符号化されたアルファマップ信号を信号線30を介して多重化回路1180に供給している。
【0026】
また、多重化回路180には、可変長符号化回路140から出力された変換係数が線1040を介して供給されている。そして、多重化回路180は供給されているこれらアルファマップ信号および変換係数の符号化値とを、動きベクトル情報等のサイド情報と共に多重化した後、信号線1050を介して出力して本画像符号化装置の最終出力としての符号化ビットストリームとなる。
【0027】
一方、図8は復号化装置のブロック図である。復号化装置は、図8に示すように、分離化回路2300、可変長復号化回路2310、逆量子化回路2320、逆直交変換回路2330、加算回路2340、動き補償予測回路2350、アルファマップ復号化回路2400とより構成される。
【0028】
分離化回路2300は入力される符号化ビットストリームを分離化処理してアルファマップ信号と画像の符号化信号等を得る回路であり、アルファマップ復号化回路2400はこの分離化回路2300にて分離されたアルファマップ信号を復号してアルファマップを再生する回路である。
【0029】
可変長復号化回路2310は、分離化回路2300にて分離された画像の符号化信号を復号するものであり、逆量子化回路2320はこの復号されたものを逆量子化して元の係数に戻すものであり、逆直交変換回路2330はこの係数をアルファマップにしたがって逆直交変換して予測誤差信号に戻すものであり、加算回路2340は、この予測誤差信号に動き補償予測回路2350からの動き補償予測値を加算して再生画像信号として出力するものである。この再生画像信号が復号化装置の最終出力となる。
【0030】
動き補償予測回路2350は、加算回路2340から出力された再生画像信号をアルファマップにしたがってフレームメモリに蓄積することによりオブジェクト画像と背景画像とを得ると共に、この蓄積されて得られた画像からオブジェクトの動き補償予測信号、背景の動き補償予測を得るものである。
【0031】
このような構成の復号化装置においては、符号化ビットストリームは、線2070を介して分離化回路2300に供給され、分離化回路2300において各々の情報毎に分離されることにより、アルファマップ信号に関する符号と、画像信号の可変長符号とに分けられる。
【0032】
そして、アルファマップ信号に関する符号は、信号線2080を介してアルファマップ復号化回路2400に供給され、また、画像信号の可変長符号は可変長復号化回路2310にそれぞれ供給される。
【0033】
アルファマップ信号に関する符号はアルファマップ復号化回路2400においてアルファマップ信号に再生され、信号線2090を介して逆直交変換回路2330と動き補償予測回路2350に出力される。
【0034】
一方、可変長復号化回路2310では、分離化回路2300から供給される符号を復号し、逆量子化回路2320に供給して、ここで逆量子化する。逆量子化された変換係数は、線2090を介して供給されるアルファマップにしたがって逆直交変換回路2330により逆変換され、加算回路2340に供給される。加算回路2340では、逆直交変換回路2330からの逆直交変換された信号と、動き補償予測回路2350より供給される動き補償予測信号とを加算し、再生画像を得る。
【0035】
以上がMPEG4用の画像符号化装置および画像復号化装置の概要である。
【0036】
ここで、アルファマップの符号化について説明する。アルファマップ、すなわち、形状情報の画素値は2値信号であり、これは“0”,“1”あるいは“0”,“255”で表現される。
【0037】
アルファマップの符号化は、まずはじめに、図9に示されるように、画面(フレーム)内で符号化対象となるオブジェクト(MPEG4では、VOP(▲5▼ideo Object Plane)と呼ばれている)を包含する符号化領域(Bounding-Rectangleと呼ばれる)を設定する。そして、この領域内を16×16画素のマクロブロックに分割して、各マクロブロック毎に該オブジェクトを符号化する。
【0038】
ここで、各VOP毎に、Bounding−Rcctangleの大きさ(vop-width,vop-height)と位置ベクトル(Spatial-refference(vop-horizontal-mc-spatial-ref,vop-vertical-mc-spatial-ref))の値が符号化される。
【0039】
図10は、各マクロブロックの属性を説明する図である。マクロブロックは分類すると、マクロブロック内にオブジェクトを含まない“透過マクロブロック”(オブジェクトの画素が一つもない)と、マクロブロックが全てオブジェクト内に含まれる“不透過マクロブロック”(全てがオブジェクトの画素で埋められている)と、マクロブロック内の一部がオブジェクトに含まれる“境界マクロブロック”(オブジェクトの画素が一部含まれる)とに分けられる。
【0040】
従って、マクロブロックは“透過マクロブロック”、“不透過マクロブロック”、“境界マクロブロック”のうちのいずれかの属性を持つことになる。
【0041】
各マクロブロックの符号化データには、形状情報とテクスチャ情報とが含まれる。なお、透過マクロブロックにはテクスチャ情報は含まれない。
【0042】
参考文献(三木 編著、“MPEG−4のすべて”第3章、工業調査会、1998)を参照して、MPEG4検証(▲5▼erification)モデルのエンコーダにおける形状情報の符号化法と任意形状オブジェクトのテクスチャ情報の符号化法を説明する。
【0043】
<形状情報の符号化法>
形状情報(A)の符号化法を説明する。図11に従来技術としてのモデルシステムの構成例を示す。形状符号化は、図11に示す如き構成の形状符号化用エンコーダ(形状情報符号化手段(Binary Shape encoder)500)によって実施される。当該形状符号化用エンコーダ(形状情報符号化手段500)は、図11に示すように、モード判定手段501、形状動きベクトル検出手段502、動き補償手段503、算術符号化手段504、動きベクトル予測手段505、フレームメモリ506、セレクタ507、形状動きベクトル情報記憶手段508、差分回路509、縮小回路510,511、拡大回路512、可変長符号化回路513,514、マルチプレクサ515とから構成されている。
【0044】
形状動きベクトル検出手段502は、フレーム画像中の対象とするオブジェクトの存在する領域である符号化領域を検知する符号化領域検出手段(Bounding-rectangle)を介して入力されるアルファマップ信号(形状情報A)と動きベクトル予測手段505にて求められた予測ベクトルの情報とフレームメモリ506の形状情報信号とから形状動きベクトルを検出してこれを形状動きベクトル情報として出力するものであり、動き補償手段503はこの形状動きベクトル検出手段502で検出された形状動きベクトル情報とフレームメモリ506の形状情報信号と動きベクトル予測回路505の出力する予測ベクトルとから動き補償予測のための動きベクトル情報を求めるためのものである。
【0045】
また、形状動きベクトル情報記憶手段508は形状動きベクトル検出手段502で検出された形状動きベクトル情報を記憶するためのものであり、動きベクトル予測手段505は形状動きベクトル情報記憶手段508の保持した形状動きベクトル情報と輝度信号53とをもとに動きベクトルの予測値である予測ベクトルを求めるものである。
【0046】
また、差分回路509は、形状動きベクトル検出手段502の求めた形状動きベクトルと動きベクトル予測手段505にて求められた予測ベクトルとの差分を得るためのものであり、モード判定手段501は入力される形状情報と動き補償手段503の出力する動き補償予測のための動きベクトル情報と形状動きベクトル検出手段502の出力する形状動きベクトル情報とからモード判定するものである。
【0047】
ここで、モード情報は次の7通りある。すなわち、
(モード1):透過(Transparent)
(モード2):不透過(Opaque)
(モード3):2値画像符号化(フレーム内)
(モード4):動き補償(MV=0)
(モード5):動き補償(MV=0)+算術符号化(フレーム間)
(モード6):動き補償(MV≠0)
(モード7):動き補償(MV≠0)+算術符号化(フレーム間)
である。
【0048】
これらのうち、“モード1”はマクロブロック内の全データが透過、すなわち、マクロブロック内にオブジェクトを一つも含まない場合であり、“モード2”はマクロブロック内の全データが不透過、すなわち、マクロブロック内が全てオブジェクトの場合であり、“モード3”は算術符号化(フレーム内)の場合である。また、“モード4”は動き補償ベクトルがゼロ(MV=0)の場合であり、“モード5”は動き補償ベクトルがゼロ(MV=0)で、且つ、算術符号化(フレーム間)を行っている場合であり、また、“モード6”は動き補償ベクトルがゼロではない(MV≠0)場合であり、また、“モード7”は動き補償ベクトルがゼロではなく(MV≠0)、しかも、算術符号化(フレーム間)を行っている場合である。
【0049】
算術符号化手段504は、モード判定手段501のモード判定結果に応じて第1及び第2の縮小手段510,511の出力のうちの、いずれか一方を算術符号化してマルチプレクサ515に出力するものであり、また、セレクタ507は、動き補償手段503の出力する動き補償予測のための動きベクトル情報と拡大化手段512の出力と、予め設定された固定値である透過画素の値(Transparent pixel value;例えば、値“0”)と、予め設定された固定値である不透過画素 の値(Opaque pixel value;例えば、値“1”)が与えられ、これらのうちのいずれか一つをモード判定手段501から与えられるモード情報が何であるかにより、選択して出力するものである。
【0050】
また、フレームメモリ506は、セレクタ507の出力を形状情報信号として保持するメモリである。
【0051】
第1の縮小化手段510は、アルファマップの2値化信号である形状情報入力を縮小化処理し、算術符号化手段504に出力するものであり、第2の縮小化手段511は、動き補償手段503の出力する動きベクトル情報を縮小化処理し、算術符号化手段504に出力するものであり、拡大回路512は、第1の縮小化手段510の出力をモード判定手段501のモード判定結果に応じてセレクタ507に出力するものである。
【0052】
第1の可変長符号化回路513は、差分回路509の出力を可変長符号化して出力するものであり、第2の可変長符号化回路514は、モード判定手段501の判定結果を可変長符号化して出力するものであり、マルチプレクサ515は、第1及び第2の可変長符号化手段の出力と算術符号化手段504の出力を受けてこれらを多重化してこれを形状情報符号化出力52として出力するものである。
【0053】
このような構成において、アルファマップの2値化信号である形状情報信号51が入力される。すると、これを受けたモード判定手段501は、当該供給される形状情報と形状動きベクトル検出手段502の出力する形状動きベクトルと、動き補償手段503の出力する動きベクトル情報を元にモード判定する。そして、このモード判定手段501によるマクロブロック毎に決定された各マクロブロックのモードにしたがって、マクロブロック毎に情報が以下の如きに符号化されることになる。
【0054】
ここで、モード判定手段501による判定結果としてのモード情報は次の7通りのいずれかである。“モード1”(透過(Transparent))、“モード2” (不透過(Opaque))、“モード3”(算術符号化(フレーム内))、“モード4”(動き補償(MV=0))、“モード5”((動き補償(MV=0)+算術符号化(フレーム間))、“モード6”(動き補償(MV≠0))、“モード7”(動き補償(MV≠0)+算術符号化(フレーム間))、である。
【0055】
そして、セレクタ507では、モード判定手段501の判定したモードの情報にしたがって、マクロブロック毎に再生信号を出力する。そして、出力された各マクロブロックの再生信号はフレームメモリ(FM)506に蓄積されると共に、出力線54を介してテクスチャ情報の符号化手段に供給され、符号化されることになる。
【0056】
ここで、モード判定手段501からセレクタ507に与えられるモード情報が何であるかにより、セレクタ507からの出力は次のようになる。
【0057】
“モード1”の場合: 該マクロブロック内の形状情報の再生画素値を、全て”Transparcnt pixel“(例えば、各画素値を“255”)にしたものを出力す る。
【0058】
“モード3,5,7”の場合: 供給されるマクロブロックの形状情報信号51を第1の縮小化手段510にて縮小処理して得た信号(算術符号化手段504の符号化対象)を更に拡大化手段512により拡大処理することにより元のサイズに戻して再生画素値にしたものを出力する。
【0059】
“モード4,6”の場合: マクロブロック内の形状情報の再生画素値を、動き補償手段503により動き補償予測して得た値を出力する。
【0060】
一方、形状動きベクトル検出手段502では、入力線51より入力された形状入力信号と、動きベクトル予測手段505にて求められた予測ベクトルと、フレームメモリ(FM)506に蓄積された形状情報信号とから形状動きベクトルの情報を得る。この形状動きベクトル検出手段502で検出された形状動きベクトル情報は、各マクロブロックの形状を動き補償手段503において動き補償予測するために用いられる動きベクトル情報であり、動き補償手段503に供給されると共に、形状動きベクトル情報記憶手段(MVmemoly)508に蓄積される。
【0061】
ここで、形状動きベクトル検出手段502では、動きベクトル予測手段505にて求められた予測ベクトルを中心に、その周囲±16画素の範囲で予測誤差ベクトルを検出している。
【0062】
従って、図3のようにゼロベクトルが検出される頻度が最も多いため、形状動きベクトルがゼロベクトルであるか否かの情報を、モード情報に含めるようにすることで、形状動きベクトル情報の符号量を削減している。また、この性質(ゼロベクトル近傍のベクトルが検出される確率が高い)を用いることで、動きベクトル検出の処理量を削減することも可能になる。
【0063】
動きベクトル予測手段505では、形状動きベクトル情報記憶手段(MVmemoly)508に蓄積されている形状動きベクトルと、信号線53を介して供給されるテクスチャ動きベクトルから、形状動きベクトルの予測値を求めている。
【0064】
“モード3,5,7”が選択された場合には、算術符号化手段504では、フレーム内符号化の場合では第1の縮小化手段510によって縮小化処理されて得た信号を算術符号化することになる。また、フレーム間符号化の場合、算術符号化手段504では、第1の縮小化手段510により縮小化処理されて得られた信号について、第2の縮小化手段511により縮小化された信号を参照しつつ算術符号化する。一方、“モード5,7”が選択された場合には、差分回路509により得られた予測誤差ベクトルが、可変長符号化手段513により可変長符号化されることになる。
【0065】
そして、算術符号化手段504より得られた算術符号あるいは可変長符号化手段513により得られた予測誤差ベクトルの可変長符号は、第2の可変長符号化手段514により可変長符号化されて得られたモード情報と共に、多重化手段 (MUX)515に送られ、ここで多重化されて形状情報符号化出力52として出力される。
【0066】
ところで、算術符号化手段504で符号化された2値画像符号化情報は、各マクロブロック内の詳細な形状を2値画像として扱い、符号化した情報である。ここで、形状動きベクトルは、動きベクトル予測手段505にて求められた予測ベクトルの周囲16画素を探索して求められたものである。
【0067】
従って、図3のようにゼロベクトルが検出される頻度が最も多いため、形状動きベクトルがゼロベクトルか否かの情報をモード情報に含めることで、形状動きベクトル情報の符号量を削減している。
【0068】
このようにして、形状情報符号化手段500による形状情報の符号化処理が行われる。なお、ここでの形状情報は、2階調化したアルファマップを対象としており、アルファマップには多階調グレースケールのものもあるので、これと区別して形状情報と称した。
【0069】
<テクスチャ情報の符号化法>
アルファマップはオブジェクトの形や大きさを表す情報(形状情報)であるが、オブジェクトの内部の輝度や色差の変化を表す情報であるテクスチャ情報がないとオブジェクトの画像を再生できない。従って、MPEG4ではアルファマップと共に、テクスチャ情報も符号化されてアルファマップと対で利用される。
【0070】
テクスチャ情報(図12のYUV)の符号化法を図12を用いて説明する。
図12は従来技術のモデルシステムとして構成例を示すエンコーダ部分のブロック構成図である。
図12において、図に強調表記された構成要素である符号化領域(Bounding-Rectangle)検出手段301、参照画像パディング手段302、LPEパディング手段303、ゼロパディング手段304、ベクトルパディング手段306および形状情報符号化手段500は、任意形状のオブジェクトを符号化するためだけに必要な構成要素である。従って、MPEG1やMPEG2のような旧来の符号化法と同様に、矩形のオブジェクトを符号化するためには、これ以外の構成要素、すなわち、図12における動きベクトル検出手段305、フレームメモリ307、動き補償手段308、切替スイッチ309,310、動きベクトル予測手段311、動きベクトル記憶手段312、差分回路313、第3の可変長符号化手段314、量子化手段315、逆量子化手段316、直交変換手段317、第4の可変長符号化手段318、逆直交変換手段319、加算回路320、スイッチ321、マルチプレクサ322とから構成される要素が備わっていればよい。
【0071】
ここで、符号化領域(Bounding-Rectangle)検出手段301はフレーム画像中の対象とするオブジェクトの存在する領域である符号化領域を検出するためのものであり(図9参照)、形状情報符号化手段500については、図11を用いて説明した通りである。
【0072】
図12の構成においては、“不透過マクロブロック”と“境界マクロブロック”に対して、テクスチャ情報(YUV)の符号化が行われることになるが、これらのうち、“不透過マクロブロック”に対しては、従来の符号化法と同様に、入力されたマクロブロックの信号をそのまま動き補償予測+DCT(離散コサイン変換)法で符号化する。
【0073】
一方、“境界マクロブロック”に対しては、オブジェクト外部の信号をパディング(補填処理)した後、動き補償予測+DCT法で符号化する。
【0074】
そして、ここでのパディング(補填処理)には以下の3通りの手法がある。
【0075】
[1] 参照画像パディング: これは参照画像パディング手段302による補充処理であって、動き補償予測の参照画像をパディングする。境界マクロブロックに対する処理と、透過マクロブロックに対する処理がある。
【0076】
[2] LPEパディング: これはLPEパディング手段303による補充処理であって、イントラマクロブロック内のブロックをDCT(離散コサイン変換)する前に、オブジェクト外の画素(図13の白丸部)値をオブジェクト内部の画素(図13の黒丸部)値の平均値で置き換えた後、ローパスフィルタをかけるという処理である。処理単位は、DCTの場合と同じ8×8画素である。
【0077】
[3] ゼロパディング: これはゼロパディング手段304による補充処理であって、インターマクロブロック内のブロックをDCTする前に、動き補償予測誤差信号のオブジェクト外の画素(図13の白丸部)値をゼロ値で置き換えると云う処理である。処理単位は、DCTと同じ8×8画素である。
【0078】
ここで、上記[1]のパディングはMPEG4の規格における必須の処理であるが、上記[2]と上記[3]のパディングは、符号化効率向上のために必要なものであって、規格上での必須の処理では無いため、上記構成要素による処理に限らず他の手段を用いて実施してもよい。
【0079】
また、動きベクトル検出手段305では、信号線31を介して符号化領域検出手段301より供給される形状信号に基づき、信号線32を介して供給される原画像の輝度信号(YUV)と、信号線33を介してフレームメモリ307から供給される参照画像の輝度信号との間で動きベクトル検出を行う。そして、その結果、得られた動きベクトル34は動き補償手段(MC)308とベクトルパディング手段(Vector padding)306に出力している。
【0080】
ベクトルパディング手段(Vector padding)306では、形状情報符号化手段500より出力されて供給される形状情報の再生値データ54に基づいて、動きベクトルの無い8×8画素単位のブロック(透明ブロックやイントラマクロブロック)に適切な動きベクトルを充填した後、動きベクトル記憶手段(MVmemory)312に蓄積する。
【0081】
動きベクトルが検出される際に、参照画像はパディングによりオブジエクト内の画素値と滑らかにつながるように、オブジェクト外の画素値がパディングされている。
【0082】
一方、原画像ではオブジェクト境界部の画素値はエッジの境界である場合が多いので、画素値変動が大きい。従って、境界マクロブロックで通常のブロックマッチングを行うと、オブジェクト外の画素値のミスマッチが大きく、正常な動きベクトルが検出されない場合が多い。
【0083】
そこで、従来モデルでは境界マクロブロックに対しては、形状情報を参照してオブジェクト内部の画素値(図14の黒丸部)のみで誤差を評価して動きベクトルを検出するようにしている(これをポリゴンマッチングと言う)。しかし、この方法は画素毎に、それがオブジェクトの内部か否かを判定しながら動きベクトルを検出することとなるため、勢い処理量が多くなってしまう。
【0084】
【発明が解決しようとする課題】
上述したように、アルファマップはオブジェクトの形や大きさを表す情報(形状情報)であるが、オブジェクトの内部の輝度や色差の変化を表す情報であるテクスチャ情報がないとオブジェクトの画像を再生できない。従って、MPEG4ではアルファマップと共に、テクスチャ情報も符号化されてアルファマップと対で利用される。
【0085】
そして、テクスチャ情報(YUV)の符号化は、“不透過マクロブロック”と“境界マクロブロック”に対して行われることになるが、これらのうち、“不透過マクロブロック”については、入力されたマクロブロックの信号をそのまま動き補償予測+DCT(離散コサイン変換)法で符号化し、“境界マクロブロック”については、オブジェクト外部の信号をパディング(補填処理)した後、動き補償予測+DCT法で符号化する。
【0086】
すなわち、“境界マクロブロック”については、動き補償予測が行われるので、動きベクトル検出の際に、参照画像はオブジエクト内の画素値と滑らかにつながるようにオブジェク卜外の画素値をパディングしておくわけである。
【0087】
しかし、原画像ではオブジェクト境界部の画素値は、エッジの境界である場合が多いので画素値変動が大きく、従って、境界マクロブロックで通常のブロックマッチングを行うと、オブジェクト外の画素値のミスマッチが大きく、正常な動きベクトルが検出されない場合が多い。
【0088】
そこで、境界マクロブロックに対し、形状情報を参照してオブジェクト内部の画素値(図14の黒丸部)のみで誤差を評価して動きベクトルを検出する手法であるポリゴンマッチングを採用する。
【0089】
しかし、この方法は画素毎にオブジェクトの内部か否かを判定しながら動きベクトルを検出することとなることから、処理量が多くなってしまう問題がある。
【0090】
従って、本発明の目的とするところは、符号化効率向上を図りつつ、少ない演算量で動きベクトルの検出を行うことができるようにした動画像符号化装置および動画像符号化方法を提供することにある。
【0091】
【課題を解決するための手段】
本発明は、上記目的を達成するため、次のように構成する。
【0092】
[1] 第1には、画像を構成する所望オブジェクトについて、その所望オブジェクトをマクロブロック単位で形状情報とテクスチャ情報とから構成される任意形状オブジェクトとして符号化する動画像符号化方式の符号化装置において、各マクロブロック毎にテクスチャ情報の動きベクトルを検出する手段と、該マクロブロックにおける形状情報の動きベクトルを検出するために、テクスチャ情報の動きベクトルの利用の可否を判定する判定手段と、前記マクロブロックにおける形状情報の動きベクトルを検出するために、テクスチャ情報の動きベクトルの信頼性を評価する評価手段と、形状情報の動きベクトル検出範囲を、テクスチャ情報の動きベクトルが利用不可能時には利用可能時より広く設定され、テクスチャ情報の動きベクトルが利用可能な場合においてはテクスチャ情報の動きベクトルの信頼性が高い場合よりも低い場合の方が広く設定される設定手段と、既に検出されているテクスチャ情報の動きベクトルを利用して前記マクロブロックにおける形状情報の動きベクトルを検出する動きベクトル検出手段とを備えて構成したものである。
そして、この装置は、形状情報とテクスチャ情報とから構成される任意形状オブジェクトを符号化するにあたり、テクスチャ情報の動きベクトルも利用できるように動きベクトル検出手段にはテクスチャ情報の動きベクトルも検出できる機能を持たせ、入力されたオブジェクトの形状情報とテクスチャ情報のうち、テクスチャ情報の動きベクトルが利用できるか否かを識別手段にて識別させ、また、評価手段により、テクスチャ情報の動きベクトルの信頼性を評価し、また、符号化対象のマクロブロックの符号化にあたっては、そのマクロブロックの周辺のマクロブロックの形状動きベクトルを探索して形状動きベクトルを求めるが、その探索範囲はテクスチャ情報の動きベクトルが利用できる場合には狭く、また、テクスチャ情報の動きベクトルが利用できない場合には、利用できる場合よりも広くし、テクスチャ情報の動きベクトルが利用できる場合においてはテクスチャ情報の動きベクトルの信頼性が高い場合よりも信頼性の低い方が広く設定されるようにしてテクスチャ情報の動きベクトルの利用の可否と、信頼性の度合いに応じてマクロブロックの形状動きベクトル探索範囲を適正な範囲にするようにした。
【0093】
すなわち、この発明は、動きベクトル検出に関する発明であって、このようにした結果、符号化効率を落とすことなく動きベクトル検出の計算量を低減することができるようになる技術が提供できる。
【0094】
[2] また、本発明は、上記目的を達成するため、第2には、画像を構成する所望オブジェクトについて、その所望オブジェクトをマクロブロック単位で形状情報とテクスチャ情報とから構成される任意形状オブジェクトとして符号化する動画像符号化方式の符号化装置において、入力されるオブジェクトの形状情報から形状動きベクトルおよびテクスチャ情報の動きベクトルを検出する動きベクトル検出手段を備えると共に、符号化時の誤差を指定するためのしきい値を設定するしきい値設定手段と、探索範囲内を複数の探索範囲に分割する分割手段と、検出された動きベクトルによる動き補償予測誤差がしきい値よりも大きいか否かを判定する判定手段とを備え、前記動きベクトル検出手段は、前記分割された探索範囲のうち、最も狭い探索範囲から動きベクトル検出を開始し、該探索範囲内で検出された最適な動きベクトルによる動き補償予測誤差がしきい値よりも大きい場合は、より広い探索範囲で最適な動きベクトルを検出し、動き補償予測誤差がしきい値よりも小さい場合は、動きベクトル検出を終了し、該動きべクトルを検出結果として出力する機能を備える構成とする。
【0095】
MPEG4においては、予測ベクトルがゼロベクトルであった場合、予測ベクトルがゼロベクトルであることを表す情報をモード情報に組み込んで別途符号化することにより、符号化効率を向上させるが、このゼロベクトルを効率的に検出できるようにすることも演算量軽減に大きく寄与する。そこで、本発明では、しきい値設定手段を設けて、符号化時の誤差を指定するためのしきい値を設定しておき、また、分割手段にて探索範囲内を複数の探索範囲に分割する。そして、動きベクトル検出手段は、これら分割された探索範囲のうち、最も狭い探索範囲から動きベクトル検出を開始し、判定手段はこの動きベクトル検出手段にて検出された動きベクトルを元に、当該検出された動きベクトルによる動き補償予測誤差がしきい値よりも大きいか否かを判定する。そして、動きベクトル検出手段は、最も狭い探索範囲から動きベクトル検出を開始した結果、判定手段が、該探索範囲内で検出された最適な動きベクトルによる動き補償予測誤差がしきい値よりも大きいと判定した場合は、より広い探索範囲で最適な動きベクトルを検出するように動作し、動き補償予測誤差がしきい値よりも小さいと判断した場合は、動きベクトル検出を終了し、該動きべクトルを検出結果として出力する。このように、探索範囲内で検出された最適な動きベクトルによる動き補償予測誤差が大きい場合は、より広い探索範囲で最適な動きベクトルを検出し、動き補償予測誤差が小さい場合は、動きベクトル検出を終了し、該動きべクトルを検出結果として出力するようにした結果、誤差が小さければ少ない演算量でゼロベクトルを効率的に検出できるようになり、演算量軽減に大きく寄与する。
【0096】
[3] また本発明は、上記目的を達成するため、第3には、画像を構成する所望オブジェクトについて、その所望オブジェクトをマクロブロック単位で形状情報とテクスチャ情報とから構成される任意形状オブジェクトとして符号化する動画像符号化方式の符号化装置において、形状符号化およびテクスチャ符号化を行うに先立ち、該符号化手段に入力された形状信号を参照して、オブジェクトを一部に含む形態の境界マクロブロックについてはそのマクロブロック内を不連続性解消のためのパディング処理を施こすことによりテクスチャ符号化対象となるマクロブロック内の画素を全て補填処理する手段を有し、形状符号化およびテクスチャ符号化は当該パディング処理済みの画像を使用して行う構成としたものである。
【0097】
この発明は、“境界マクロブロック”におけるテクスチャ符号化に関する発明であって、原画像は、境界マクロブロックについては、オブジェクト境界部での画素値の不連続性が解消できるパディング処理、すなわち、LPEパディングにてパディング処理してから、形状符号化およびテクスチャ符号化に供するようにした。そのため、オブジェクト境界部での画素値の不連続性がほとんど無くなることから、通常のブロックマッチングを行った場合でも、正常な動きベクトルを検出することができるようになる。故に、“境界マクロブロック”において処理量の多いポリゴンマッチングを行わずに済み、計算時間の短縮を図ることができると共に、通常のブロックマッチングを行った場合でも、正常な動きベクトルを検出することができるようになる。
【0098】
【発明の実施の形態】
以下、本発明具体例について、図面を参照して説明する。本発明は、MPEG4エンコーダ(動画像符号化装置)の構成要素の処理順序を変更することによる符号化効率向上と、形状動きベクトルの検出法を改良することで、符号化効率を低下させずに、少ない演算量で動きベクトルの検出を行うことができるようにするものであり、以下、詳細を説明する。
【0099】
<第1の具体例>
図を参照して本発明の第1の具体例を説明する。
第1の具体例において説明する技術は、符号化効率を落とすことなく動きベクトル検出の計算量を低減することができるようにする技術である。
【0100】
前述した通り、図11に示した従来技術としてのモデルシステムの構成では、形状動きベクトル(MVs)は、動きベクトル予測手段505にて求められた予測ベクトル(MVPs)の周囲±16画素(図3の探索範囲3)を探索して求められる。つまり、予測ベクトルMVPsからの差分ベクトルMVDsを検出している(式1)。
【0101】
MVDs=MVs−MVPs …(式1)
通常、予測誤差信号の頻度分布は、図1に示す如きに“0”近傍の頻度が高く、“0”から離れるにしたがって頻度が急激に小さくなる傾向がある。図1では、差分ベクトルMVDsの水平成分を“mvds_y”、垂直成分を“mvds_y”と表記している。
【0102】
ここで、予測ベクトルMVPsの予測精度が低い場合は、頻度分布が緩慢となり、MVPsの予測精度が高い場合は頻度分布が急峻となる。図2は予測ベクトルMVPsを求める方法を説明する図である。図2(a)は形状信号成分に関して、そして、図2(b)は輝度信号成分に関しての情報をマクロブロック単位で示した図であり、符号化対象のマクロブロックMBとその近隣のマクロブロックとして形状動きベクトルMVs1、MVs2、MVs3を有するマクロブロックがあることを示している。また、図2(b)は符号化対象のマクロブロックMBとその近隣のマクロブロックとして、テクスチャ動きベクトルMV1、MV2、MV3を有するマクロブロックがあることを示している。
【0103】
そして、この場合、マクロブロックMBを符号化するにあたり、本発明システムでは、符号化対象のマクロブロックの符号化処理に際して、まずはじめに、MVs1、MVs2、MVs3の順番でその符号化対象マクロブロックの周囲のマクロブロックについて、形状動きベクトルが存在するか否かを調べ、最初に存在する形状動きベクトルをMVPsとする。
【0104】
形状動きベクトルMVs1、MVs2、MVs3のいずれも存在しない場合には、今度はMV1、MV2、M▲5▼3の順番でテクスチャ動きベクトルが存在するか否かを調べ、最初に存在する動きべクトルを予測ベクトルMVPsとする。
【0105】
テクスチャ動きベクトルMV1、MV2、MV3いずれも存在しない場合は、予測ベクトルMVPsをゼロベクトルにする。
【0106】
本発明システムでは、動きベクトル予測手段505にはこのような機能を持たせる。
【0107】
なお、前記参考文献にも記載されている通り、テクスチャ動きベクトル(MV1、MV2、MV3)を利用できる場合とできない場合がある。例えば、テクスチャ情報を符号化せずに形状情報だけを符号化するモードや、符号化対象マクロブロックに対する、MV1、MV2、MV3何れも存在しない場合などである。つまり、テクスチャ動きベクトルが信頼できると仮定すれば、この手法においては、テクスチャ動きベクトルを利用できる場合には、利用できない場合と比べて予測ベクトルMVpsの予測精度が高いといえる。
【0108】
(第1の具体例その1)
そこで、本実施例では図3に示すように、探索範囲を数段階分用意し、テクスチャ動きベクトルを利用できる場合には、予測ベクトルMVPsの予測精度に応じて探索範囲を切り替えるようにする。例えば、探索範囲を“探索範囲1”、 “探索範囲2”、“探索範囲3”と云った具合に数段分、用意し、“探索範囲1”の領域サイズは4×4画素、“探索範囲2”の領域サイズは8×8画素、“探索範囲3”の領域サイズは16×16画素、と云った具合にする。
【0109】
そして、図11に示した構成において、形状動きベクトル検出手段502の機能として、このように予測ベクトルMVPsの予測精度の検出と、この予測精度に応じて動きベクトル探索範囲を切り替える機能を付加した構成に改良することで、符号化効率を落とすことなく動きベクトル検出の計算量を低減することができる。予測精度は、例えば、動きベクトル予測手段505の求めた予測ベクトルMVPsについての誤差の大きさで決めるようにすれば良い。
【0110】
動きベクトル探索範囲の具体例としては、テクスチャ動きベクトルが信頼できる場合には最小領域サイズとなる“探索範囲1”内を、そして、テクスチャ動きベクトルが信頼できない場合にはそれよりも幾分広い領域とした“探索範囲2”内を、探索範囲とする。また、テクスチャ動きベクトルが利用できない場合は最も広い領域とした“探索範囲3”を探索領域として探索するようにする。
【0111】
すなわち、形状動きベクトル検出手段502には、フレーム画像中の対象とするオブジェクトの存在する領域である符号化領域を検知する符号化領域検出手段(Bounding-rectangle)を介して入力されるアルファマップ信号(形状情報A)と動きベクトル予測手段505にて求められた予測ベクトルの情報とフレームメモリ506の形状情報信号とから動きベクトル検出するに当たり、予測ベクトルMVPsの予測精度を求めて、それに応じて切り替えた最適な動きベクトル探索範囲で形状動きベクトルを検出するように動作させる。そして、これにより検出したベクトルを形状動きベクトル情報として出力させる。
【0112】
このようにすると、マクロブロックの符号化に当たり、テクスチャ動きベクトルの予測精度に基づく信頼度を調べた結果、その信頼度が高ければ、符号化しようとしているマクロブロックの周辺の狭い探索範囲を用いて動きベクトル検出の計算を済ませることが可能となり、動きベクトル検出に必要な計算量を低減することができることになる。また、テクスチャ動きベクトルが信頼できない場合やテクスチャ動きベクトルが利用できない場合は探索範囲を広げることで、動きベクトルの検出が可能になる。
【0113】
図4は本具体例のフローチャートである。すなわち、テクスチャ動きベクトルが利用できるか否かをチェックし(ステップS11)、その結果、利用できなければ探索範囲を“探索範囲3”とすることとする。ステップS11でのチェックの結果、利用できるのであれば、次にテクスチャ動きベクトルが信頼できるか否かをチェックし(ステップS12)、その結果、信頼できなければ探索範囲を “探索範囲2”とすることとする。ステップS12でのチェックの結果、信頼できるのであれば、探索範囲を“探索範囲1”とする。
【0114】
なお、ここではテクスチャ動きクトルの信頼性は、テクスチャ動きベクトルの探索範囲によって判断している。つまり、テクスチャ動きベクトルの検出は、テクスチャ動きベクトルそのものを直接検出しているため、探索範囲が広い場合は大きな動きにも追従できることから、探索範囲が狭い場合よりも信頼性が高いと推測できる。なお、MPEG4では、テクスチャ動きベクトルの探索範囲は±1024まで拡張可能である。
【0115】
このようにすることで、予測ベクトルMVPsの予測精度に応じて探索範囲を切り替えることができるようになり、このような予測ベクトルMVPsの予測精度に応じた探索範囲切り替えを実施することで、符号化効率を落とすことなく動きベクトル検出の計算量を低減することができる。
【0116】
(第1の具体例その2)
予測ベクトルMVDsがゼロベクトルであった場合、前述したように、当該予測ベクトルMVDsがゼロベクトルであることを表す情報は、符号化効率向上のためモード情報に組み込まれて別途符号化される。
【0117】
そこで、図12に示したMPEG4用の従来技術としてのモデルエンコードシステムでは、ゼロベクトルが検出され易いように、比較基準としての所定のしきい値を定め、ゼロベクトル時の動き補償予測誤差(MC誤差)をこのしきい値と比較すると共に、当該ゼロベクトル時の動き補償予測誤差(MC誤差)が前記しきい値よりも小さいときには、その時点で検出を打ち切り、予測ベクトルMVPsを形状動きベクトルMVsとしている。
【0118】
本具体例では、上記打ち切りを更に拡張したもので、たとえば、図3の“探索範囲1”まで検出した際の最適な動きベクトルでの動き補償予測誤差が、所定のしきい値よりも小さいときには、その時点で検出を打ち切るようにする。動き補償予測誤差が所定のしきい値よりも大きい場合には、探索範囲を“探索範囲2”まで拡張し、“探索範囲1”のときと同様に、“探索範囲2”の残りの範囲を探索した際の最適な動きベクトルでの動き補償予測誤差が所定のしきい値よりも小さいときには、その時点で検出を打ち切るようにする。
【0119】
つまり、予測ベクトルMVPsの予測精度に応じて探索範囲を切り替えるようにし、このような予測ベクトルMVPsの予測精度に応じた探索範囲切り替えを実施することで、符号化効率を落とすことなく動きベクトル検出の計算量低減を図るようにする。
【0120】
図5は、本具体例のフローチャートである。すなわち、予測ベクトルMVDsを“0”に初期化し(ステップS1)、次にMC(動き補償)誤差が閾値より大きいか否かをチェックする(ステップS2)。その結果、小さければ処理を終了し、大きければ“探索範囲1”内を探索する(ステップS3)。
【0121】
そして、次にMC(動き補償)誤差が閾値より大きいか否かをチェックする (ステップS4)。その結果、小さければ処理を終了し、大きければ“探索範囲2−探索範囲1”内を探索する(ステップS5)。
【0122】
そして、次にMC(動き補償)誤差が閾値より大きいか否かをチェックする (ステップS6)。その結果、小さければ処理を終了し、大きければ“探索範囲3−探索範囲2”内を探索し(ステップS7)、それが終われば処理を終了する。
【0123】
このようにすることで、予測ベクトルMVPsの予測精度に応じて探索範囲を切り替えることができるようになり、このような予測ベクトルMVPsの予測精度に応じた探索範囲切り替えを実施することで、符号化効率を落とすことなく動きベクトル検出の計算量を低減することができるようになる。
【0124】
前述したように、ゼロベクトル近傍に差分ベクトルMVDsの最適値がある可能性が高いため、狭い探索範囲から段階的に探索範囲を拡張し、途中段階で所定の条件を満たした場合は探索を打ち切ることで、符号化効率の低下なしに、動きベクトル検出の計算量を低減することができる。
【0125】
“具体例その1”、“具体例その2”共に、図11のMPEG4用モデルエンコーダと比較して、大きさの小さいベクトルが選択されるため、動きベクトルの符号量が低減されて結果として符号化効率が向上する場合もある。
【0126】
なお、“具体例その1”と“具体例その2”に示した技術を組み合せれば、さらに動きベクトル検出の計算量の低減が可能になる。
【0127】
以上は、MPEG4において、テクスチャ動きベクトルを利用して動きベクトル検出を行うことにより、動きベクトル検出に当たっての計算量を低減することができるようにした技術であった。
【0128】
次に、“境界マクロブロック”におけるテクスチャ符号化について説明する。
【0129】
<第2の具体例>
次に、本発明の第2の具体例を説明する。本具体例は、マクロブロック内の一部にオブジェクトを含む形態である“境界マクロブロック”におけるテクスチャ符号化に関わるものである。
【0130】
図6において、図に強調表記された構成要素である符号化領域(Bounding-Rectangle)検出手段301、参照画像パディング手段302、LPEパディング手段303a、ゼロパディング手段304、ベクトルパディング手段306および形状情報符号化手段500は、任意形状のオブジェクトを符号化するためだけに必要な構成要素である。従って、MPEG1やMPEG2のような旧来の符号化法と同様に、矩形のオブジェクトを符号化するためには、これ以外の構成要素、すなわち、図6における動きベクトル検出手段305、フレームメモリ307、動き補償手段308、切替スイッチ309,310、動きベクトル予測手段311、動きベクトル記憶手段312、差分回路313、第3の可変長符号化手段314、量子化手段315、逆量子化手段316、直交変換手段317、第4の可変長符号化手段318、逆直交変換手段319、加算回路320、スイッチ321、マルチプレクサ322とから構成される要素が備わっていればよい。
【0131】
ここで、動きベクトル検出手段305は、LPEパディング手段303の出力するLPEパディング済みのマクロブロックデータと、形状情報符号化手段500の出力する形状情報の再生値データ54と、フレームメモリ307から供給される参照画像の輝度信号との間で動きベクトル検出を行う。そして、その結果、得られた動きベクトルは、動き補償手段(MC)308とベクトルパディング (Vector padding)手段306と差分回路313とに出力している。
【0132】
フレームメモリ307は、参照画像パディング手段302から出力されるパディング処理済みの参照画像の輝度信号を保持するためのものである。また、動き補償手段308は、動きベクトル検出手段305にて検出された動きベクトルと、形状情報符号化手段500の出力する形状情報の再生値データ54とを用いて動き補償予測のための動きベクトル情報を求めるためのものであり、切替スイッチ309,310は、LPEパディング手段303の出力をゼロパディング手段304に与えるか、迂回させるかを選択切り換えするための経路切り替えスイッチである。
【0133】
直交変換手段317は、この切替スイッチ310を介して与えられる出力を直交変換(離散コサイン変換)して周波数成分に分解する処理をするためのものであり、量子化手段315は、この直交変換手段317の出力を量子化して出力するものであり、第4の可変長符号化手段318は、この量子化出力を可変長符号化処理してテクスチャストリームとしてマルチプレクサ322に出力するものである。
【0134】
また、動きベクトル予測手段311は、形状情報符号化手段500の出力する形状情報の再生値データ54と、動きベクトル記憶手段312の保持するデータとを用いて動きベクトルを予測するためのものであり、差分回路313は、この動きベクトル予測手段311の出力する動きベクトル予測値と動きベクトル検出手段305の出力する動きベクトルとの差分値を得るためのものであり、第3の可変長符号化手段314は、この差分回路313の出力を可変長符号化処理してモーションストリームとしてマルチプレクサ322に出力するものである。
【0135】
逆量子化手段316は、量子化手段315の量子化出力を逆量子化してもとのデータに戻して出力するものであり、逆直交変換手段319は、この逆量子化手段316の出力するデータを逆直交変換(逆離散コサイン変換)して元のゼロパディング処理時点でのデータに戻すためのものである。
【0136】
マルチプレクサ322は、第3の可変長符号化手段314の出力する可変長符号化されたモーションストリームと、第4の可変長符号化手段318の出力する可変長符号化されたテクスチャストリームと、符号化領域(Bounding-Rectangle)検出手段301の出力する符号化領域の情報と、形状情報符号化手段500の出力する形状情報の再生値データ54とを受けてこれらを多重化して出力するものである。
【0137】
また、前記逆直交変換手段319は、この逆量子化手段316の出力するデータを逆直交変換(逆離散コサイン変換)して元のゼロパディング処理時点でのデータに戻すためのものである。
【0138】
また、加算回路320は、スイッチ321を介して与えられる動き補償手段308からの動きベクトル情報と逆直交変換手段319から与えられる元のゼロパディング処理時点でのデータとを加算して参照画像パディング手段302に与えるためのものであり、動きベクトル記憶手段312は、ベクトルパディング手段306の出力する形状情報の再生値データ54に基づいて、動きベクトルの無い8×8画素単位のブロック(透明ブロックやイントラマクロブロック)に適切な動きベクトルを充填したデータを受けてこれを蓄積するものである。
【0139】
ここで、本実施例でのエンコーダと従来のエンコーダの仕組みの違いに触れておく。従来のエンコーダは図12に示すように、動きベクトル検出手段305は入力されるテクスチャ情報(YUV)と符号化領域(Bounding-Rectangle)検出手段301からの検出出力とフレームメモリ307からの記憶情報とを用いて動きベクトル34を得るようにしていた。ここで、符号化領域(Bounding-Rectangle)検出手段301はフレーム画像中の対象とするオブジェクトの存在する領域である符号化領域を検出するためのものである。
【0140】
また、LPEパディング手段303はゼロパディング手段304と並列におき、入力テクスチャ情報(YUV)を条件に応じていずれか一方に与えてパディングさせて、そのパディング処理済みの出力を直交変換手段317に与える構成であった。
【0141】
これを本発明では、図6に示す如く、LPEパディング手段303は初段において、入力テクスチャ情報(YUV)を条件に係わりなく、LPEパディング処理し、これを動きベクトル検出手段305と、そして、条件に応じてゼロパディング手段304に与える構成としている。ここで、LPEパディングとは、前述したように、イントラマクロブロック内のブロックをDCT(離散コサイン変換)する前に、オブジェクト外の画素(図13の白丸部)値をオブジェクト内部の画素(図13の黒丸部)値の平均値で置き換えた後、ローパスフィルタをかける処理であって、処理単位は、DCTの場合と同様、8×8画素である。また、ゼロパディングは、インターマクロブロック内のブロックをDCTする前に、動き補償予測誤差信号のオブジェクト外の画素(図13の白丸部)値をゼロ値で置き換える処理であって、処理単位は、DCTの場合と同様、8×8画素である。これらLPEパディングおよびゼロパディングは、MPEG4の規格において必須の処理ではないが、符号化効率向上のために実施するものである。
【0142】
本具体例のブロック構成は図6に示す如きのものである。そして、本具体例の構成は、動きベクトル検出手段305の処理位置が図12に示した従来モデルの構成における動きベクトル検出手段305の位置と異なり、また、LPEパディング303の処理位置が従来モデルのLPEパディング303の位置と異なる。
【0143】
<LPEパディング手段>
まず、本実施例システムにおけるLPEパディング手段303aでの処理と、従来技術としてのシステムにおけるLPEパディング手段303での処理との相違点を説明する。
【0144】
LPEパディング手段303aでのパディング処理は、信号線を介して供給されるテクスチャ画像の原信号(YUV)41の境界マクロブロックのみに施される。ここで、境界マクロブロックか否かは符号化領域(Bounding-Rectangle)検出手段301を介して供給される形状画像の原信号42を用いて判断する。つまり、LPEパディング手段303aでの処理は、符号化の前処理としてLPEパディングを施していることになる。
【0145】
当該前処理を行ったことにより、LPEパディング手段303aから出力されるテクスチャ画像43は、符号化される前に符号化対象となるマクロブロック内の画素値が全て補填されることになる。
【0146】
なお、従来技術としてのモデルシステムにおけるLPEパディング手段303では、信号線35を介して形状情報符号化手段500より供給される形状画像の局部復号信号に基づき、8×8画素のブロックが境界ブロックであればパディングを施している。
【0147】
本具体例では、8×8画素のブロック単位でパディングして、図14の左上のブロックのように、ブロック内にオブジェクト内の画素を含まない場合は、たとえば、周囲のブロックの平均値でパディングすることで、マクロブロック内の画素が全てパディングされるようにする。
【0148】
以上、説明したように、本具体例と従来モデルシステムとでは、第1には、形状画像の原信号に基づきパディングするか、局部復号信号に基づきパディングするかという点が異なる。
【0149】
ここで、本発明の手法である“形状画像の原信号に基づきパディング”する方式の効果を具体的に示すために、1次元信号のモデルに対してLPEパディングを施した例を示す。輝度信号をY、形状信号をA、形状の局部復号信号(その1)をA′、形状の局部復号信号(その2)をA″とする。そして、これらがそれぞれ以下のような信号であったとする。
【0150】
以下の例では、簡単のため、形状信号を“0”(オブジェクト外)か、“1”(オブジェクト内)かで表現している。
【0151】
Y={50,50,50,50,180,190,200,210}
A={0,0,0,0,1,1,1,1,1}
A′={0,0,0,1,1,1,1,1}
A″={0,0,0,0,0,1,1,1}
ここで、輝度信号Yを上述のA、A′、A″でそれぞれLPEパディングした結果をYp、Yp′、Yp″とすると、例えば、以下のようになる。
【0152】
Yp={195,195,195,188,180,190,200,210}
Yp′={166,166,108,50,180,190,200,210}
Yp″={200,200,200,200,195,190,200,210}
すなわち、Ypの場合、もとのYなるデータの“50”,“50”,“50”,“50”,“180”,“190”,“200”,“210”なるデータ列がパディングの結果、
“195”,“195”,“195”,“188”,“180”,“190”,“200”,“210”となったことを示しており、Yp′の場合にはデータ値が“166”,“166”,“108”,“50”,“180”,“190”,“200”,“210”となったことを示しており 、Yp″の場合はデータ値が“200”,“200”,“200”,“200”,“195”, “190”,“200”,“210”となったことを示している。尚、ここに示した数値 は下限値を“0”(白)、上限値を“255”(黒)とする256段階のグレースケール値である。
【0153】
一般に、オブジェクトの境界は、像のエッジ部であり、上記の例のように輝度信号Yが大きく変動する。形状情報符号化手段500での処理において、形状の局部復号信号に誤差が発生した場合には、上記の例(Yp)のように滑らかにパディングされない場合がある。そのため、“境界マクロブロック”におけるテクスチャ符号化をする場合に、このような誤差を含む信号を用いなければならなくなったときはエッジが不明確となってしまう問題が浮上することとなる。
【0154】
しかし、本発明方式の場合は、形状信号を“0”(オブジェクト外)、“1”(オブジェクト内)とすることで、このような心配が全くなくなる。
【0155】
<動きベクトル検出手段>
次に、本実施例システムにおける動きベクトル検出手段305aの処理と従来モデルのシステムにおける動きベクトル検出手段305の処理との相違点を説明する。
本システムにおける動きベクトル検出手段305aでは、形状情報符号化手段500から出力され、信号線44を介して供給される形状情報の再生値データ54と、LPEパディング手段303aの出力するパディング処理済みデータとに基づいて透過マクロブロック以外のマクロブロックに対する動きべクトルを検出する。
【0156】
LPEパディング手段303aより信号線45を介して供給される原画像データ(パディング処理済みデータ)と、フレームメモリ307から信号線46を介して供給される参照画像との間で動きベクトルを検出し、この検出した動きベクトルは、信号線47を介してベクトルパディング(Vector padding)手段306と、動き補償手段308と、差分回路313とに出力する。
【0157】
ここで、信号線45を介して供給される原画像は、すでにLPEパディング403により境界マクロブロックがパディングされている。そのため、オブジェクト境界部での画素値の不連続性がほとんど無い。
【0158】
従って、従来モデルシステムにおける動きベクトル検出手段305の場合と異なり、本発明システムの動きベクトル検出手段305aにおいては、“境界マクロブロック”において処理量の多いポリゴンマッチングを行わずに済み、しかも、通常のブロックマッチングを行った場合でも、正常な動きベクトルを検出することができるようになる。
【0159】
以上、種々の実施例を説明したが、要するに本発明は、第1には、画像を構成する所望オブジェクトについて、その所望オブジェクトをマクロブロック単位で形状情報とテクスチャ情報とから構成される任意形状オブジェクトとして符号化する動画像符号化方式の符号化装置において、入力されるオブジェクトの形状情報から動き補償予測に用いるための形状動きベクトルおよびテクスチャ情報の動きベクトルとを検出する動きベクトル検出手段と、入力されるテクスチャ情報から当該テクスチャ情報の動きベクトルの利用の可否を識別する識別手段と、テクスチャ情報における前記検出された動きベクトルの信頼性を評価する評価手段と、形状動きベクトルの探索範囲を、テクスチャ情報の動きベクトル不可能時には利用可能時より広く設定され、テクスチャ情報の動きベクトルが利用可能な場合においてはテクスチャ情報の動きベクトルの信頼性が高い場合より低い方が広く設定される設定手段とを有するものである。そして、この装置は、形状情報とテクスチャ情報とから構成される任意形状オブジェクトを符号化するにあたり、テクスチャ情報の動きベクトルも利用できるように動きベクトル検出手段にはテクスチャ情報の動きベクトルも検出できる機能を持たせ、入力されたオブジェクトの形状情報とテクスチャ情報のうち、テクスチャ情報の動きベクトルが利用できるか否かを識別手段にて識別させ、また、評価手段により、テクスチャ情報の動きベクトルの信頼性を評価し、また、符号化対象のマクロブロックの符号化にあたっては、そのマクロブロックの周辺のマクロブロックの形状動きベクトルを探索して形状動きベクトルを求めるが、その探索範囲はテクスチャ情報の動きベクトルが利用できる場合には狭く、また、テクスチャ情報の動きベクトルが利用できない場合には、利用できる場合よりも広くし、テクスチャ情報の動きベクトルが利用できる場合においてはテクスチャ情報の動きベクトルの信頼性が高い場合よりも信頼性の低い方が広く設定されるようにしてテクスチャ情報の動きベクトルの利用の可否と、信頼性の度合いに応じてマクロブロックの形状動きベクトル探索範囲を適正な範囲にするようにした。
すなわち、この発明は、動きベクトル検出に関する発明であって、このようにした結果、符号化効率を落とすことなく動きベクトル検出の計算量を低減することができるようになる技術が提供できる。
【0160】
また、第2には、本発明は、画像を構成する所望オブジェクトについて、その所望オブジェクトをマクロブロック単位で形状情報とテクスチャ情報とから構成される任意形状オブジェクトとして符号化する動画像符号化方式の符号化装置において、入力されるオブジェクトの形状情報から形状動きベクトルおよびテクスチャ情報の動きベクトルを検出する動きベクトル検出手段を備えると共に、符号化時の誤差を指定するためのしきい値を設定するしきい値設定手段と、探索範囲内を複数の探索範囲に分割する分割手段と、検出された動きベクトルによる動き補償予測誤差がしきい値よりも大きいか否かを判定する判定手段とを備え、前記動きベクトル検出手段は、前記分割された探索範囲のうち、最も狭い探索範囲から動きベクトル検出を開始し、該探索範囲内で検出された最適な動きベクトルによる動き補償予測誤差がしきい値よりも大きい場合は、より広い探索範囲で最適な動きベクトルを検出し、動き補償予測誤差がしきい値よりも小さい場合は、動きベクトル検出を終了し、該動きべクトルを検出結果として出力する機能を備える構成とした。
【0161】
MPEG4においては、予測ベクトルがゼロベクトルであった場合、予測ベクトルがゼロベクトルであることを表す情報をモード情報に組み込んで別途符号化することにより、符号化効率を向上させるが、このゼロベクトルを効率的に検出できるようにすることも演算量軽減に大きく寄与する。そこで、本発明では、しきい値設定手段を設けて、符号化時の誤差を指定するためのしきい値を設定しておき、また、分割手段にて探索範囲内を複数の探索範囲に分割する。そして、動きベクトル検出手段は、これら分割された探索範囲のうち、最も狭い探索範囲から動きベクトル検出を開始し、判定手段はこの動きベクトル検出手段にて検出された動きベクトルを元に、当該検出された動きベクトルによる動き補償予測誤差がしきい値よりも大きいか否かを判定する。そして、動きベクトル検出手段は、最も狭い探索範囲から動きベクトル検出を開始した結果、判定手段が、該探索範囲内で検出された最適な動きベクトルによる動き補償予測誤差がしきい値よりも大きいと判定した場合は、より広い探索範囲で最適な動きベクトルを検出するように動作し、動き補償予測誤差がしきい値よりも小さいと判断した場合は、動きベクトル検出を終了し、該動きべクトルを検出結果として出力する。このように、探索範囲内で検出された最適な動きベクトルによる動き補償予測誤差が大きい場合は、より広い探索範囲で最適な動きベクトルを検出し、動き補償予測誤差が小さい場合は、動きベクトル検出を終了し、該動きべクトルを検出結果として出力するようにした結果、誤差が小さければ少ない演算量でゼロベクトルを効率的に検出できるようになり、演算量軽減に大きく寄与する。
【0162】
また本発明は、第3には、画像を構成する所望オブジェクトについて、その所望オブジェクトをマクロブロック単位で形状情報とテクスチャ情報とから構成される任意形状オブジェクトとして符号化する動画像符号化方式の符号化装置において、形状符号化およびテクスチャ符号化を行うに先立ち、該符号化手段に入力された形状信号を参照して、オブジェクトを一部に含む形態の境界マクロブロックについてはそのマクロブロック内を不連続性解消のためのパディング処理を施こすことによりテクスチャ符号化対象となるマクロブロック内の画素を全て補填処理する手段を有し、形状符号化およびテクスチャ符号化は当該パディング処理済みの画像を使用して行う構成としたものである。
【0163】
この発明は、“境界マクロブロック”におけるテクスチャ符号化に関する発明であって、原画像は、境界マクロブロックについては、オブジェクト境界部での画素値の不連続性が解消できるパディング処理、すなわち、LPEパディングにてパディング処理してから、形状符号化およびテクスチャ符号化に供するようにした。そのため、オブジェクト境界部での画素値の不連続性がほとんど無くなることから、通常のブロックマッチングを行った場合でも、正常な動きベクトルを検出することができるようになる。故に、“境界マクロブロック”において処理量の多いポリゴンマッチングを行わずに済み、計算時間の短縮を図ることができると共に、通常のブロックマッチングを行った場合でも、正常な動きベクトルを検出することができるようになる。
【0164】
なお、本発明は上述した実施例に限定されるものではなく、要旨を変更しない範囲内で適宜変形して実施可能である。
【0165】
【発明の効果】
以上、詳述したように、本発明によれば、任意形状オブジェクトの符号化に必要な構成要素の処理順序を変更することで、処理量の増加なしに符号化効率の向上が図れる。また、形状動きベクトルの検出処理を適応的に打ち切ることで、符号化効率の低下を招くことなく処理量の削減が可能となる。
【図面の簡単な説明】
【図1】差分ベクトルMVDsの頻度分布の特徴を説明する図。
【図2】予測ベクトルMVPsを求める方法を説明する図。
【図3】本発明の形状動きベクトルの探索範囲を説明する図。
【図4】本発明を説明するための図であって、本発明の第1の具体例その1での処理例示すフローチャート。
【図5】本発明を説明するための図であって、本発明の第1の具体例その2での処理例示すフローチャート。
【図6】本発明を説明するための図であって、本発明のエンコーダの構成例を示すブロック図。
【図7】画像を符号化する場合に、画面内を背景とオブジェクトに分割して符号化する方式の画像符号化装置のブロック構成図。
【図8】復号化装置のブロック図。
【図9】本発明を説明するための図であって、オブジェクトを含む符号化領域を説明する図。
【図10】本発明を説明するための図であって、各マクロブロックの属性を説明する図。
【図11】従来技術としてのモデルシステムにおける形状符号化エンコーダ(Binary Shape encoder 500)部分のブロック構成図。
【図12】従来技術としてのモデルシステムにおけるエンコーダのブロック構成図。
【図13】オブジェクト内の画素とオブジェクト外の画素を説明する図。
【図14】本発明のLPEパディングを説明する図。
【符号の説明】
301…符号化領域(Bounding-Rectangle)検出手段
302…参照画像パディング手段
303…LPEパディング手段
304…ゼロパディング手段
306…ベクトルパディング手段
500…形状情報符号化手段(Binary Shape encoder)
305,305a…動きベクトル検出手段
307…フレームメモリ
308,308a…動き補償手段
309,310、…切替スイッチ
312…動きベクトル記憶手段
313…差分回路
314…第3の可変長符号化手段
315…量子化手段
316…逆量子化手段
317…直交変換手段(DCT)
318…第4の可変長符号化手段
319…逆直交変換手段
320…加算回路
321…スイッチ
322…マルチプレクサ

Claims (4)

  1. 画像を構成する所望オブジェクトについて、その所望オブジェクトをマクロブロック単位で形状情報とテクスチャ情報とから構成される任意形状オブジェクトとして符号化する動画像符号化方式の符号化装置において、
    マクロブロック毎にテクスチャ情報のテクスチャ動きベクトルを探索するテクスチャ動きベクトル探索手段と、
    各マクロブロックにおける形状情報の動きベクトルを検出するために、前記テクスチャ動きベクトルの有無により前記テクスチャ動きベクトルの利用の可否を判定する判定手段と、
    前記マクロブロックにおける形状情報の動きベクトルを検出するために、前記テクスチャ動きベクトルの探索範囲の増加に従って前記テクスチャ動きベクトルの信頼性を高く評価する評価手段と、
    前記形状情報の動きベクトルの探索範囲を、前記テクスチャ動きベクトルが利用不可能時には利用可能時より広く設定し、前記テクスチャ動きベクトルが利用可能な場合においては前記テクスチャ動きベクトルの信頼性が高い場合よりも低い場合に広く設定する設定手段と、
    既に検出されているテクスチャ動きベクトルを利用して前記マクロブロックにおける形状情報の動きベクトルを検出する動きベクトル検出手段と、
    を有することを特徴とする動画像符号化装置。
  2. 画像を構成する所望オブジェクトについて、その所望オブジェクトをマクロブロック単位で形状情報とテクスチャ情報とから構成される任意形状オブジェクトとして符号化する動画像符号化方式の符号化方法において、
    マクロブロック毎にテクスチャ情報のテクスチャ動きベクトルを探索するステップと、
    各マクロブロックにおける形状情報の動きベクトルを検出するために、前記テクスチャ動きベクトルの有無により前記テクスチャ動きベクトルの利用の可否を判定するステップと、
    前記マクロブロックにおける形状情報の動きベクトルを検出するために、前記テクスチャ動きベクトルの探索範囲の増加に従って前記テクスチャ動きベクトルの信頼性を高く評価するステップと、
    前記形状情報の動きベクトルの探索範囲を、前記テクスチャ動きベクトルが利用不可能時には利用可能時より広く設定し、前記テクスチャ動きベクトルが利用可能な場合においては前記テクスチャ動きベクトルの信頼性が高い場合よりも低い場合に広く設定するステップと、
    既に検出されているテクスチャ動きベクトルを利用して前記マクロブロックにおける形状情報の動きベクトルを検出するステップと、
    を具備することを特徴とする動画像符号化方法。
  3. 画像を構成する所望オブジェクトをマクロブロック単位で形状情報とテクスチャ情報とから構成される任意形状オブジェクトとして符号化する動画像符号化装置において、
    マクロブロック毎にテクスチャ情報のテクスチャ動きベクトルを探索するテクスチャ動きベクトル探索手段と、
    そのマクロブロックにおける形状情報の動きベクトルを検出するために前記テクスチャ動きベクトルの有無により前記テクスチャ動きベクトルの利用の可否を判定する手段と、
    前記テクスチャ動きベクトルの探索範囲の増加に従って前記テクスチャ動きベクトルの信頼性を高く評価する評価手段と、
    既に検出されているテクスチャ動きベクトルを利用して前記マクロブロックにおける形状情報の動きベクトルを検出する動きベクトル検出手段と
    を具備し、前記テクスチャ動きベクトルの信頼性が高く、前記形状情報の動きベクトルを検出するために前記テクスチャ動きベクトルが利用可能な場合には、前記形状情報の動きベクトルの探索範囲を第1の領域に制限し、前記テクスチャ動きベクトルの信頼性が低 い場合と、前記テクスチャ動きベクトルが利用不可の場合には、前記第1の領域よりも広い第2の領域を探索範囲とすることを特徴とする動画像符号化装置。
  4. 画像を構成する所望オブジェクトをマクロブロック単位で形状情報とテクスチャ情報とから構成される任意形状オブジェクトとして符号化する動画像符号化方法において、
    マクロブロック毎にテクスチャ情報のテクスチャ動きベクトルを検出し、そのマクロブロックにおける形状情報の動きベクトルを検出するために前記テクスチャ動きベクトルの有無により前記テクスチャ動きベクトルの利用の可否を判定すると共に、前記テクスチャ動きベクトルの探索範囲の増加に従って前記テクスチャ動きベクトルの信頼性を高く評価し、既に検出されているテクスチャ動きベクトルを利用して前記マクロブロックにおける形状情報の動きベクトルを検出し、前記テクスチャ動きベクトルの信頼性が高く、前記形状情報の動きベクトルを検出するために前記テクスチャ動きベクトルが利用可能な場合には、前記形状情報の動きベクトルの検出範囲を第1の領域に制限し、前記テクスチャ動きベクトルの信頼性が低い場合と、前記テクスチャ動きベクトルが利用不可の場合には、前記第1の領域よりも広い第2の領域を探索範囲とすることを特徴とする動画像符号化方法。
JP11638399A 1999-04-23 1999-04-23 動画像符号化装置および動画像符号化方法 Expired - Fee Related JP3677165B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11638399A JP3677165B2 (ja) 1999-04-23 1999-04-23 動画像符号化装置および動画像符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11638399A JP3677165B2 (ja) 1999-04-23 1999-04-23 動画像符号化装置および動画像符号化方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2004330956A Division JP2005094803A (ja) 2004-11-15 2004-11-15 動画像符号化装置および動画像符号化方法

Publications (2)

Publication Number Publication Date
JP2000308066A JP2000308066A (ja) 2000-11-02
JP3677165B2 true JP3677165B2 (ja) 2005-07-27

Family

ID=14685664

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11638399A Expired - Fee Related JP3677165B2 (ja) 1999-04-23 1999-04-23 動画像符号化装置および動画像符号化方法

Country Status (1)

Country Link
JP (1) JP3677165B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009116595A1 (ja) * 2008-03-21 2009-09-24 日本電気株式会社 画像処理方法、画像処理装置及び画像処理プログラム
WO2009116586A1 (ja) * 2008-03-21 2009-09-24 日本電気株式会社 画像処理方法、画像処理装置及び画像処理プログラム

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2473897C (en) 2002-11-25 2012-10-16 Matsushita Electric Industrial Co., Ltd. Motion compensation method, picture coding method and picture decoding method
US7408989B2 (en) * 2003-01-16 2008-08-05 Vix5 Systems Inc Method of video encoding using windows and system thereof
JP4239894B2 (ja) * 2004-05-11 2009-03-18 日本ビクター株式会社 画像符号化装置及び画像復号化装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009116595A1 (ja) * 2008-03-21 2009-09-24 日本電気株式会社 画像処理方法、画像処理装置及び画像処理プログラム
WO2009116586A1 (ja) * 2008-03-21 2009-09-24 日本電気株式会社 画像処理方法、画像処理装置及び画像処理プログラム
US8497938B2 (en) 2008-03-21 2013-07-30 Nec Corporation Image processing method, image processing apparatus and image processing program
JP5333791B2 (ja) * 2008-03-21 2013-11-06 日本電気株式会社 画像処理方法、画像処理装置及び画像処理プログラム
JP5435242B2 (ja) * 2008-03-21 2014-03-05 日本電気株式会社 画像処理方法、画像処理装置及び画像処理プログラム
US8698954B2 (en) 2008-03-21 2014-04-15 Nec Corporation Image processing method, image processing apparatus and image processing program

Also Published As

Publication number Publication date
JP2000308066A (ja) 2000-11-02

Similar Documents

Publication Publication Date Title
EP1528813B1 (en) Improved video coding using adaptive coding of block parameters for coded/uncoded blocks
KR100803611B1 (ko) 영상의 부호화, 복호화 방법 및 장치
US7444026B2 (en) Image processing apparatus and method of motion vector detection in a moving picture, and recording medium used therewith
US5808700A (en) Motion video coding systems with motion vector detection
JP2002532029A (ja) ビデオ圧縮のための効率的マクロブロックヘッダ符号化
US20140105295A1 (en) Moving image encoding method and apparatus, and moving image decoding method and apparatus
JPH09182084A (ja) 動画像符号化装置および動画像復号化装置
JP2001197501A (ja) 動きベクトル探索器及び動きベクトル探索方法並びに動画像符号化装置
JP2002527958A (ja) Mpeg−4形符号化における発生ビデオ速度制御方法
CN114079782B (zh) 视频图像重建方法、装置、计算机设备及存储介质
US20050276331A1 (en) Method and apparatus for estimating motion
US6697430B1 (en) MPEG encoder
JPH06311502A (ja) 動画像伝送装置
JP3677165B2 (ja) 動画像符号化装置および動画像符号化方法
WO2003056838A1 (en) Moving picture compression/coding apparatus and motion vector detection method
JP2005094803A (ja) 動画像符号化装置および動画像符号化方法
JP2002058032A (ja) 画像符号化装置および方法、画像復号装置および方法、ならびに画像処理装置
JP2001309388A (ja) 画像復号装置におけるエラー画像補完方法
JPH07274182A (ja) 映像信号符号化方式
JP2002209213A (ja) 動きベクトル検出方法及び装置、並びに画像符号化装置
KR100657714B1 (ko) 3차원 스캐닝을 이용한 영상데이터 부호화 방법
KR19980066971A (ko) 움직임 이동량 검출기능을 갖는 영상 부호화 장치
Shin et al. Block effect reduction with content-based AC prediction in an MPEG-2 compressed video
WO1999059342A1 (en) Method and system for mpeg-2 encoding with frame partitioning
JP2014239373A (ja) 動画像符号化装置および動画像符号化方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040914

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050201

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050404

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050426

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050506

LAPS Cancellation because of no payment of annual fees