JP2010268505A - ブロック動きビデオのコード化及びデコード化 - Google Patents
ブロック動きビデオのコード化及びデコード化 Download PDFInfo
- Publication number
- JP2010268505A JP2010268505A JP2010160883A JP2010160883A JP2010268505A JP 2010268505 A JP2010268505 A JP 2010268505A JP 2010160883 A JP2010160883 A JP 2010160883A JP 2010160883 A JP2010160883 A JP 2010160883A JP 2010268505 A JP2010268505 A JP 2010268505A
- Authority
- JP
- Japan
- Prior art keywords
- data
- motion
- block
- transform
- video
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/107—Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/112—Selection of coding mode or of prediction mode according to a given display mode, e.g. for interlaced or progressive display mode
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/186—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/40—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/48—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
- H04N19/619—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding the transform being operated outside the prediction loop
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【課題】逆変換を行なわずにトランスコードが可能となる符号化方法を提供する。
【解決手段】変換ベースのビデオ圧縮処理で、動き推定中に識別されて動き補正されたインターフレーム差分演算に用いられる動きベクトルは、基準データのブロック境界に一致するよう限定される。このような動きベクトルの制限は、逆方向及び順方向変換をせずに変換領域において得られたコード化ビデオビットストリームをさらに処理することを可能にする。入力ビットストリームは、部分的にコード化され、動きベクトル及び予測誤差を回復する。動きベクトルは基準データのブロック境界と一致するので、動き補正されたインターフレーム差分追加演算が変換領域において実行され引き続く処理のために変換データを発生させる。動き補正が変換領域で実行されるので、ビットストリームデータはさらに変換領域で処理でき、コスト高で損失の大きな逆方向及び順方向の変換を回避できる。
【選択図】図1
【解決手段】変換ベースのビデオ圧縮処理で、動き推定中に識別されて動き補正されたインターフレーム差分演算に用いられる動きベクトルは、基準データのブロック境界に一致するよう限定される。このような動きベクトルの制限は、逆方向及び順方向変換をせずに変換領域において得られたコード化ビデオビットストリームをさらに処理することを可能にする。入力ビットストリームは、部分的にコード化され、動きベクトル及び予測誤差を回復する。動きベクトルは基準データのブロック境界と一致するので、動き補正されたインターフレーム差分追加演算が変換領域において実行され引き続く処理のために変換データを発生させる。動き補正が変換領域で実行されるので、ビットストリームデータはさらに変換領域で処理でき、コスト高で損失の大きな逆方向及び順方向の変換を回避できる。
【選択図】図1
Description
この発明は、ビデオ圧縮及び伸長アルゴリズムに関する。
(優先権の主張)
この出願は、1998年9月29日に出願された米国仮出願No.60/102,214及び1999年2月25日に出願された米国仮出願No.60/121,531の出願日に基づく利益を請求するものである。
この出願は、1998年9月29日に出願された米国仮出願No.60/102,214及び1999年2月25日に出願された米国仮出願No.60/121,531の出願日に基づく利益を請求するものである。
Moving Picture Experts Group(MPEG)ファミリのアルゴリズムに対応するような典型的な変換ベースのビデオ圧縮アルゴリズムにおいては、離散コサイン変換(DCT)のようなブロックベースの変換が、例えば、動き補正されたインターフレーム差別体系に基づいて発生された画素値又は画素差のいずれかに対応した像データのブロックに施される。それぞれのブロックに対する得られた変換係数は、次いで、引き続くコード化(例えば、可変長さコード化によってフォローされるラン長さコード化)のために一般的に量子化されてコード化されたビデオビットストリームを発生させる。
特定のビデオ圧縮アルゴリズムに応じて、像は、圧縮処理のために以下のような種々のフレームとして指定できる。
・イントラフレーム圧縮技術のみを用いてコード化されるイントラ(I)フレーム、
・予測される(P)フレームであって、予めI又はPフレームに対応する基準フレームに基づいてイントラフレーム圧縮技術を用いてコード化されるとともにそれ自身一つ又はそれ以上のその他のフレームをコード化するための基準フレームを発生するのに用いることができる予測される(P)フレーム、及び、
・(i)予めのI又はPフレーム、(ii)引き続くI又はPフレーム、(iii)両方の組み合わせのいずれかから(i)順方向、(ii)逆方向、又は、(iii)双方向予測に基づいてインターフレーム圧縮技術を用いてコード化され、及び、それ自身はその他のフレームのコード化には使えない双方向(B)フレーム。
・予測される(P)フレームであって、予めI又はPフレームに対応する基準フレームに基づいてイントラフレーム圧縮技術を用いてコード化されるとともにそれ自身一つ又はそれ以上のその他のフレームをコード化するための基準フレームを発生するのに用いることができる予測される(P)フレーム、及び、
・(i)予めのI又はPフレーム、(ii)引き続くI又はPフレーム、(iii)両方の組み合わせのいずれかから(i)順方向、(ii)逆方向、又は、(iii)双方向予測に基づいてインターフレーム圧縮技術を用いてコード化され、及び、それ自身はその他のフレームのコード化には使えない双方向(B)フレーム。
P及びBフレームにおいて、像データの一つ又はそれ以上のブロックは、イントラフレーム圧縮技術を用いてコード化できる。
いずれにしても、得られたコード化されたビデオビットストリームをデコード化するために、特定の圧縮処理が、逆転又は反転されなければならない。例えば、可変長さデコード化が、ラン長さデコード化に引き続いてビットストリームに施すことができて、次いで、非量子化によって非量子化された変換係数のブロックが発生する。反転変換が、次いで、非量子化された変換係数のブロックに施され、(1)デコード化された画素データ又は(2)画素差データのいずれかが発生する(像データの対応するブロックが、当初に、それぞれ、(1)イントラフレーム又は(2)インターフレーム圧縮技術を用いてコード化されたかどうかに応じて)。動き補正されたインターフレーム圧縮技術が使われるとき、次いで、イントラフレーム追加が、動き補正された基準フレームデータを用いる画素差データに施されてデコード化された画素データを発生させ、ここで、動き補正の量は、圧縮処理中にビットストリームにコード化される動きベクトルによって決定される。動き補正された基準フレームデータは、デコード化された像データの予測であると考えられ、画素差データは、その予測における誤差であると考えられる。このようにして、動き補正されたインターフレーム圧縮追加過程は、予測の補正に対応する。
いくつかのアプリケーションにおいて、追加的な処理が、コード化されたビデオビットストリームが発生された後に施される。典型的に、コード化されたビデオビットストリームは、別の、多分離れて位置するプロセッサによって予め発生されており、必要な追加の処理の目的で入力として取り扱われる。例えば、「トランスコーディング(transcoding)」が実行できることが好ましく、これは、一つのビデオ圧縮/伸長(コーデック)アルゴリズムに適合する存在するコード化ビデオビットストリームが、異なるビデオコーデックアルゴリズムに適合する対応するコード化されたビデオビットストリームに変換されることである。このような 「トランスコーディング」操作が実行できる一つの「暴力的な(brute force)」アプローチは、入力ビットストリームを第1のビデオコーデックアルゴリズムに基づいてデコード化された画素領域に完全にデコード化し、次いで、得られたデコード化画素データを第2のビデオコーデックアルゴリズムに基づいて出力ビットストリームに完全にコード化することである。
その他の可能なアプリケーションは、存在するコード化ビデオビットストリームへのウォータマークの挿入である。ここで、またウォータマーク挿入への一つの暴力的なアプローチは、入力ビットストリームをデコード化される画素領域に完全にデコード化し、画素領域内のデコード化される画素データを処理して必要なウォータマークを挿入し、次いで、修正された画素データを完全に再コード化し、必要な処理を受けた出力コード化ビデオビットストリームを発生することである。
典型的な変換ベースのビデオコーデックアルゴリズムにおいて、進行方向及び逆方向変換過程は、コード化の複雑さと処理時間の両方のために比較的コスト高である。さらに、損失のある変換において、存在するコード化されたビデオビットストリームの乱暴な強行な処理中における逆方向変換の適用と、次に順方向変換の再適用は、入力ビットストリームに含まれる情報の損失を一般的に招き、処理されたビットストリームにおけるデコード化された画質に劣化をもたらす。このようにして、最初にビットストリームを完全にデコード化せずに入力ビットストリームにある処理操作(例えば、トランスコーディングやウォータマーク挿入のような)を行なえることが望ましい。このような処理操作が情報の大きな損失無しに変換領域において実行できるときは、コスト高で損失の大きな逆方向及び順方向変換過程は、回避される。
この発明は、ビデオ圧縮及び伸長技術に関するものであって、入力ビットストリームを最初に完全にデコード化することなく存在するコード化ビデオビットストリームをさらに処理することを可能にする技術に関する。特に、この発明は、入力ビットストリームに含まれている情報の大きな損失のない、又は、できればまったく損失のない変換領域における部分的にデコード化されたビデオデータを処理することを可能にするものである。このようにして、この発明は、存在する入力ビットストリームの処理中にコスト高で損失の大きな逆方向及び順方向変換過程を施すことを回避する。
この発明によれば、コード化された入力ビデオビットストリームを発生させるのに用いられる動き補正されたインターフレームビデオ圧縮技術は、ブロック境界に一致する動きベクトルに基づくものに限定される。例えば、(8×8)DCT変換に基づいたMPEGビデオ圧縮アルゴリズムにおいて、動きベクトル成分は、整数×8(整数は、正、負又は0であることができる)に限定される。その結果、処理操作が、大きな情報の損失のない(又は、できればまったく損失のない)変換領域において部分的にデコード化されたビデオデータに適用できる。典型的なMPEGビデオコーデックアルゴリズムに対して、可変長さデコード化、ラン長さデコード化が、コード化された入力ビデオビットストリームに施すことができて、次いで、非量子化によってDCT係数データが発生される。動きベクトルはブロック境界との一致に限定されるので、動き補正されたインターフレーム追加が、次いで、逆方向DCT変換を最初に適用することなくDCT変換領域において実行される。得られた動き補正された変換データは、次いで、変換領域において特別の必要な処理操作(例えば、トランスコーディング操作、ウォータマークの挿入)を受けることができる。適用の仕方に対応して、得られた処理されたDCT係数データは、次に動き推定、動き補正されたインターフレーム減算、再量子化、ラン長さ再コード化、及び、可変長さ再コード化の少なくとも一部分を受けることができて逆方向及び順方向DCT変換過程を別々に展開することなく必要な処理された出力コード化ビデオビットストリームを発生させる。
一つの実施例によれば、この発明は、ビデオデータを圧縮する方法であって、
(a)対応する基準データに基づいてビデオデータのフレームについて動き推定を行なってそのフレームに対する動きベクトルの組を識別し、その際前記動き推定が、前記基準データにおけるブロック境界と一致するブロックベースの動きベクトルのみの識別に制限され、及び、ブロックベースの動きベクトルの少なくとも一つが、非ゼロ動きベクトルであり、
(b)前記基準データ及び前記ブロックベースの動きベクトルに基づいた前記ビデオデータに対して動き補正されたインターフレーム差別を行なってインターフレーム差データを発生させ、及び、
(c)前記インターフレーム差データに一つ又はそれ以上のビデオ圧縮過程を与えて前記ビデオデータに対応するコード化されたビデオビットストリームに対してコード化されたデータを発生させる過程からなるものである。
(a)対応する基準データに基づいてビデオデータのフレームについて動き推定を行なってそのフレームに対する動きベクトルの組を識別し、その際前記動き推定が、前記基準データにおけるブロック境界と一致するブロックベースの動きベクトルのみの識別に制限され、及び、ブロックベースの動きベクトルの少なくとも一つが、非ゼロ動きベクトルであり、
(b)前記基準データ及び前記ブロックベースの動きベクトルに基づいた前記ビデオデータに対して動き補正されたインターフレーム差別を行なってインターフレーム差データを発生させ、及び、
(c)前記インターフレーム差データに一つ又はそれ以上のビデオ圧縮過程を与えて前記ビデオデータに対応するコード化されたビデオビットストリームに対してコード化されたデータを発生させる過程からなるものである。
この発明の他の実施例によれば、この発明は、存在する入力コード化ビデオビットストリームを処理する方法であって、
(a)一つ又はそれ以上のデコード化過程を入力ビットストリームに施して変換領域内における変換係数データ及び対応するブロックベースの動きベクトルを回復し、その際前記ブロックベースの動きベクトルが、対応する基準データにおけるブロック境界との一致に制限され、
(b)前記ブロックベースの動きベクトルと前記基準データに基づいて変換領域内において動き補正されたインターフレーム追加を実行して予測エラー補正された(PEC)変換係数データを発生させ、及び、
(c)変換領域内において前記PEC変換係数データの引き続いての処理を実行するようにした過程からなるものである。
(a)一つ又はそれ以上のデコード化過程を入力ビットストリームに施して変換領域内における変換係数データ及び対応するブロックベースの動きベクトルを回復し、その際前記ブロックベースの動きベクトルが、対応する基準データにおけるブロック境界との一致に制限され、
(b)前記ブロックベースの動きベクトルと前記基準データに基づいて変換領域内において動き補正されたインターフレーム追加を実行して予測エラー補正された(PEC)変換係数データを発生させ、及び、
(c)変換領域内において前記PEC変換係数データの引き続いての処理を実行するようにした過程からなるものである。
この発明のさらに他の実施例によれば、この発明は、ビデオデータを圧縮する方法であって、
(a)対応する基準データに基づいてビデオデータのフレームについて動き推定を行なってそのフレームに対する動きベクトルの組を識別し、その際前記動き推定が、前記基準データにおけるブロック境界と一致するブロックベースの動きベクトルのみの識別に制限され、及び、ブロックベースの動きベクトルのすべてが、0動きベクトルであり、
(b)前記基準データ及び前記ブロックベースの動きベクトルに基づいた前記ビデオデータに対して動き補正されたインターフレーム差別を行なってインターフレーム差データを発生させ、及び、
(c)前記インターフレーム差データに一つ又はそれ以上の追加のビデオ圧縮過程を与えて前記ビデオデータに対応するコード化されたビデオビットストリームに対してコード化されたデータを発生させ、その際前記コード化されたビデオビットストリームが、MPEGコーデックアルゴリズムに適合する過程からなるものである。
(a)対応する基準データに基づいてビデオデータのフレームについて動き推定を行なってそのフレームに対する動きベクトルの組を識別し、その際前記動き推定が、前記基準データにおけるブロック境界と一致するブロックベースの動きベクトルのみの識別に制限され、及び、ブロックベースの動きベクトルのすべてが、0動きベクトルであり、
(b)前記基準データ及び前記ブロックベースの動きベクトルに基づいた前記ビデオデータに対して動き補正されたインターフレーム差別を行なってインターフレーム差データを発生させ、及び、
(c)前記インターフレーム差データに一つ又はそれ以上の追加のビデオ圧縮過程を与えて前記ビデオデータに対応するコード化されたビデオビットストリームに対してコード化されたデータを発生させ、その際前記コード化されたビデオビットストリームが、MPEGコーデックアルゴリズムに適合する過程からなるものである。
この発明によれば、入力ビットストリームを最初に完全にデコード化することなく存在するコード化ビデオビットストリームをさらに処理することができる。
この発明のその他の構成、特徴、及び、利点は、以下の詳細な説明、付属する特許請求の範囲、及び、添付の図面から完全に明らかになろう。
この発明の一つの実施例における動き補正されたインターフレームビデオ圧縮処理のブロック図である。
従来周知の動き推定処理(図2)を示している。
(8×8)ブロックの像データに対するこの発明による動き推定処理(図3)の差を示している。
この発明の他の実施例における動き補正されたインターフレームビデオ圧縮処理のブロック図である。
この発明の一つの実施例における部分的なデコード化処理のブロック図である。
図1は、この発明の一つの実施例における動き補正されたインターフレームビデオ圧縮処理のブロック図である。この実施例により、動きベクトルが、ブロック境界と一致するものに限定される。
特に、ブロックベースの動き推定102が、適切な基準データに対して入力像データに施される。インターフレームビデオ圧縮処理が(i)順方向予測、(ii)逆方向予測、又は、(iii)双方向予測に基づいているかどうかにより、基準データが、それぞれ、(i)予めのフレーム、(iii)引き続くフレーム、(iii)両方の組み合わせ(例えば、予めのフレームと引き続くフレームの平均)のいずれかに基づいて発生される。いずれにせよ、動き推定処理は、なんらかの適切な同様の尺度(例えば、絶対的な画素差の和(SAD))に基づいて像データのその時点でのブロックに極めて密に一致する基準データのブロックを識別しようとするものである。この発明によれば、動き推定処理中に用いられる基準データのブロックの組は、ブロック境界に一致するものに限定される。従来周知の動き推定処理においては、このような制限は存在せず、従って、動き推定処理に使うことができる基準データのブロックは、特定のサーチ範囲内の画素(又はサブ画素)位置に対応する。
図2及び図3は、従来周知の動き推定処理(図2)及び(8×8)ブロックの像データに対するこの発明による動き推定処理(図3)の差を示している。図2及び図3は、像データの特定の(8×8)ブロックに対する基準データのサーチ領域を示しており、基準データにおけるその対応する位置は、ブロックの中央に対する(0,0)の動きベクトルを備えた太い(8×8)ブロックにより図において示されている。図2及び図3におけるサーチ領域は、その成分が8画素の大きさにそれぞれ制限されている動きベクトルに基づいている(すなわち、動きベクトル成分は、−8から+8に独立に変動する)。
図2に示されているように、従来周知の整数画素ベースの動き推定処理では、−8から+8までの17の異なる整数成分値の組み合わせに基づく289の異なる整数ベースの動きベクトルに対応する基準データの289の異なる使用可能な(8×8)ブロックが存在する。「フラクショナル画素」に基づいた動き推定体系においては、それ以上の基準データのブロックを使うことができる。
他方、図3に示されるように、この発明によるブロックベースの動き推定処理のこのような特定の実施例に対して、使用可能な基準データのブロックは、ブロック境界に対応して9ブロックに限定される(すなわち、−8,0,+8の3個の異なる成分値の組み合わせに基づいた9個の動きベクトルの一つを備えた)。このブロックベースの動き推定処理体系から得られた典型的な予測は、従来周知の画素ベースの動き推定処理体系よりも精度が低いが、多くのアプリケーションにおいて、ブロックベースの動き推定処理予測の精度は、許容し得るものであろう。
使用可能な基準データのブロックの数は所定のサーチ範囲に対して非常に小さいので(例えば、図2及び図3の実施例において289から9に)、この発明によるブロックベースの動き推定処理は、より迅速に実行が可能である。その上、サーチ範囲は、従来周知の画素ベースの動き推定処理体系よりも動き推定に対して必要な処理時間が少ないのにもかかわらず、非常に拡張されている。例えば、±8の代わりに±24にサーチ範囲を拡大しても処理されるべき基準データは49(8×8)ブロックを残すのみである。実際のところ、サーチ範囲は、同一の数の基準ブロック(すなわち、289)が±8に制限されているサーチ範囲を備えた画素ベースの動き推定に使えるようになる前に、±64に拡大可能である。
特別なビデオ圧縮アルゴリズム及びフレームのタイプ(例えば、P又はB)に対応して、ブロック102における動き推定処理は、像データのブロックのそれぞれに対して3個の、順方向光予測、逆方向予測及び双方向予測からなる異なるブロックベースの動きベクトルを識別できる。モード制御処理104が、動き推定後に実行され、イントラフレームコード化技術を用いてコード化する可能性を含んで、その時点での像データにおけるブロックのコード化の仕方を決定する。このコード化モード制御の結果に応じて、イントラフレーム差別化106が、次いで、対応する動き補正された基準データを用いる像データに実行されてブロック動き補正されたインターフレーム画素差データを発生させる。
いずれにせよ、(8×8)DCTブロック変換のような変換108が、次いで、画素領域データのブロックに適用され、110で量子化され、112でラン長さコード化され、114で可変長さコード化される変換係数のブロックを発生してコード化されたビデオビットストリームの一部分を発生させる。図1には示されていないが、可能ならば、像データのブロックをコード化するために使われる動きベクトルは、また、ビットストリーム内でコード化される。
ラン長さコード化112及び可変長さコード化114は典型的な損失の少ないコード化過程であるので、図1における圧縮アルゴリズムの一部分(すなわち、図1の上方部分)であるデコード化処理は、ビデオコーデックアルゴリズムに対する信頼性を損なうことなく量子化ブロック110によって発生させられる量子化係数とともにスタートできる。特に、ブロック110からの量子化された変換係数は、116で非量子化され、118で逆方向に変換され、及び、もし可能ならば、動き補正されたインターフレーム追加120が施されて、像データにおけるその他の組のコード化において使われる可能性のある基準データを発生させる。
この発明によるブロックベースの動き推定に対するものを除いて、図1の処理過程のその他が、MPEG標準に適合するような従来周知のビデオ圧縮技術に基づいて展開できるものであることは、当該技術に通常の知識を有する者には明らかなことであろう。
図4は、この発明の他の実施例における動き補正されたインターフレームビデオ圧縮処理のブロック図である。図1の実施例と同じように、動きベクトルは、ブロック境界に一致するものに限定される。しかしながら、図4において、変換401が、動き推定402の前に未処理の像データに施される。このようにして、ブロック限定の動き推定402、モード制御404、及び、動き補正されたインターフレーム差別化406が、図1の実施例におけるような画素領域においてではなく、変換領域においてすべて実行される。動き推定及び補正が変換領域において実行されるので、コード化フィードバック路において生じる動き補正されたインターフレーム追加420の過程は、また、変換領域において実行される。その結果、逆方向変換は、コード化処理の間はまったく実行されない。量子化110、ラン長さコード化412、可変長さコード化414、非量子化416は、図1に示されている実施例における過程と類似した過程で実行される。
図5は、この発明の一つの実施例における部分的なデコード化処理のブロック図である。図5の部分的なデコード化処理は、図1におけるブロックベースの動き補正されたインターフレームビデオ圧縮アルゴリズムを用いて発生される存在するコード化されたビデオビットストリームで動作するように設計されている。特に、部分的なデコード化処理が、入力ビットストリームを受け入れて部分的にデコード化して出力非量子化変換データを発生させる。追加の処理過程(例えば、トランスコーディングやウォータ挿入に関連し、図5には示されていない)が、次いで、変換領域内において非量子化された変換データに適用されて処理された変換データを発生し、次いで、さらにコード化されて、必要な処理をされたコード化されたビデオビットストリームを発生させる。
特に、動きベクトルデコード化502、モードデコード化504、及び、可変長さデコード化/ラン長さデコード化/非量子化506は、入力ビットストリームに適用され、それぞれ、(1)ブロックベース動きベクトル、(2)モード制御情報(すなわち、いずれのブロックが、順方向、逆方向又は双方向(すなわち、内挿された)予測に基づいてイントラフレーム技術又はインターフレーム技術を用いてコード化されたか)、及び、(3)変換領域における予測誤差に対応する非量子化された変換(例えば、DCT)を回復する。
もし可能ならば、メモリA508は、引き続くフレームに対応する変換領域基準データ(例えば、非量子化されたDCT係数)を保持し、他方で、メモリB510は、先行するフレームに対応する変換領域基準データを保持している。メモリA及びBからの基準データの対応するブロックは、デコード化ブロック502によって回復されたブロックベースの動きベクトルによって識別されるように、平均化ノード512によって平均化されて双方向予測のための内挿された基準データを形成する。
4位置スイッチ514の状態は、ブロック504からのデコード化モード制御データによって指令される。モード制御データが「後方予測」を指示しているとき、スイッチ514は、メモリAから加算ノード516への適切な(すなわち、動き補正された)引き続くフレーム基準データを送るように配置されている。モード制御データが「前方予測」を指示しているとき、スイッチ514は、メモリBから加算ノード516への適切な先行フレーム基準データを送るように配置されている。モード制御データが「双方向予測」を指示しているとき、スイッチ514は、平均化ノード512から加算ノード516への適切な内挿された基準データを送るように配置されている。最後に、モード制御データが「イントラコード化」を指示しているとき、スイッチ514は、0を加算ノード516へ送る「接地」に配置されている。
いずれにせよ、加算ノード516において、ブロック506からの非量子化されたDCT係数が、スイッチ514から選択された変換領域基準データに加えられてすべて変換領域内にある予測誤差とともに予測を補正する。もし適切ならば(すなわち、現時点でのフレームがI又はPフレームであるとき)、加算ノード516からの変換データは、一つ又はそれ以上のその他のビデオフレームをコード化するために基準データとして使うためにメモリA又はBにフィードバックされる。
動きベクトルはブロック境界に一致するものに限定されるとともにDCTのような変換が直線的であるために、加算ノード516における動き補正されたインターフレーム追加は、変換領域において、逆方向変換を最初に行なわずに実行できる。このようにして、量子化損失などを除いて、加算ノード516において発生された得られた動き補正された変換データは、原像データに直接変換を施したときに得られるであろう変換データに対応する。追加の処理(図5には示されていない)が、次いで、逆方向変換を施さずに得られた補正された変換データに対して実行される。この追加の処理は、典型的に、必要な処理を受けた出力コード化ビデオビットストリームを発生させるのに必要な過程を含んでいる。その場合、追加の処理は、変換領域における動き推定及び動き補正、再量子化、ラン長さ再コード化、及び、可変長さ再コード化過程を含むことができる。適当な状況において、変換領域における動き推定及び/又は動き補正過程は、省略することができる。例えば、入力ビットストリームからの動きベクトルが再使用されるときは、動き推定が省略できる。動き補正なしに出力ビットストリームが発生されるときは、動き推定及び動き補正の両方が省略できる。
MPEGビデオコーデックアルゴリズムに加えて、この発明は、その他の適切なビデオコーデックアルゴリズムに展開することができ、それらには、(8×8)DCT変換以外の変換に基づいたアルゴリズム及び/又はラン長さコード化及び可変長さコード化過程を含まず及び/又は追加のその他の量子化後コード化過程を含むアルゴリズムが含まれる。
この発明は、単一の集積回路への適用可能性を含む回路ベースの処理として展開できる。当該技術に通常の知識を備えた者には明らかなように、回路部材の種々の機能が、ソフトウェアプログラムにおける処理過程としてデジタル領域において展開できる。このようなソフトウェアは、例えば、デジタル信号プロセッサ、マイクロコントローラ、又は、汎用のコンピュータにおいて使える。
この発明は、方法の形で具体化され、さらに、それらの方法を実施する装置の形で具体化できる。この発明は、また、フロッピー(登録商標)ディスク、CD−ROM、ハードドライブ、又は、その他の機械読み取り可能な記憶媒体のような実体的な媒体において実現されるプログラムコードの形で具体化され、その際プログラムコードがコンピュータのような機械によって装填されるとともに実行されるとき、この機械は、この発明を具体化する装置となる。この発明は、また、例えば、記憶媒体に記憶され、機械に装填され及び/又は機械によって実行され、又は、光学繊維を介して、又は、電磁放射線を経由して電線又はケーブルのようなものからなるいくつかの通信媒体又はキャリヤにまたがって搬送されるプログラムコードの形で具体化可能であり、その際プログラムコードがコンピュータのような機械に装填され及び実行されるとき、この機械は、この発明を具体化する装置となる。汎用のプロセッサのために実行されるとき、プログラムコードセグメントは、プロセッサに組み合わせられて特定の論理回路をアナログ的に作動させるユニークな装置を構成する。
この発明の性質を説明するために記述され、図示された細部、材料、部品の配置の様々な変化が、特許請求の範囲に表現されているような発明の原理及び範囲を逸脱することなく当該技術に通常の知識を備えた者にとって容易に行ない得ることは明らかであろう。
Claims (12)
- ビデオデータを圧縮する方法において、
(a)対応する基準データに基づいてビデオデータのフレームについて動き推定を行なってそのフレームに対する動きベクトルの組を識別し、その際前記動き推定が、前記基準データにおけるブロック境界と一致するブロックベースの動きベクトルのみの識別に制限され、及び、ブロックベースの動きベクトルの少なくとも一つが、非ゼロ動きベクトルであり、
(b)前記基準データ及び前記ブロックベースの動きベクトルに基づいた前記ビデオデータに対して動き補正されたインターフレーム差別を行なってインターフレーム差データを発生させ、及び、
(c)前記インターフレーム差データに一つ又はそれ以上のビデオ圧縮過程を与えて前記ビデオデータに対応するコード化されたビデオビットストリームに対してコード化されたデータを発生させるようにした方法。 - 過程(a)及び(b)が、画素領域において実行され、及び、過程(c)が、
(1)前記インターフレーム差データに変換を加えて変換領域に変換係数データを発生させ、及び、
(2)前記変換係数データを量子化して量子化された変換係数データを発生させる過程からなるようにした特許請求の範囲第1項に記載の方法。 - 前記コード化されたビデオビットストリームが、MPEGコーデックアルゴリズムに適合し、及び、前記変換が、離散コサイン変換(DCT)であるようにした特許請求の範囲第2項に記載の方法。
- 過程(a)が、さらに、画素データに変換を加えて変換領域において変換係数データを発生させ、その際前記動き推定が、変換領域において前記基準データに基づいて前記変換係数データに加えられるようにした過程を含むようにした特許請求の範囲第1項に記載の方法。
- コード化されたプログラムコードを含む機械読み取り可能な媒体であって、前記プログラムコードが機械によって実行されるとき、前記機械が、
(a)対応する基準データに基づいてビデオデータのフレームについて動き推定を行なってそのフレームに対する動きベクトルの組を識別し、その際前記動き推定が、前記基準データにおけるブロック境界と一致するブロックベースの動きベクトルのみの識別に制限され、及び、ブロックベースの動きベクトルの少なくとも一つが、非ゼロ動きベクトルであり、
(b)前記基準データ及び前記ブロックベースの動きベクトルに基づいた前記ビデオデータに対して動き補正されたインターフレーム差別を行なってインターフレーム差データを発生させ、及び、
(c)前記インターフレーム差データに一つ又はそれ以上のビデオ圧縮過程を与えて前記ビデオデータに対応するコード化されたビデオビットストリームに対してコード化されたデータを発生させることからなる過程を展開するようにした機械読み取り可能な媒体。 - 存在する入力コード化ビデオビットストリームを処理する方法において、
(a)一つ又はそれ以上のデコード化過程を入力ビットストリームに施して変換領域内における変換係数データ及び対応するブロックベースの動きベクトルを回復し、その際前記ブロックベースの動きベクトルが、対応する基準データにおけるブロック境界との一致に制限され、
(b)前記ブロックベースの動きベクトルと前記基準データに基づいて変換領域内において動き補正されたインターフレーム追加を実行して予測エラー補正された(PEC)変換係数データを発生させ、及び、
(c)変換領域内において前記PEC変換係数データの引き続いての処理を実行するようにした方法。 - 前記ブロックベースの動きベクトルの少なくとも一つが、非ゼロ動きベクトルであるようにした特許請求の範囲第6項に記載の方法。
- 前記コード化されたビデオビットストリームが、MPEGコーデックアルゴリズムに適合し、及び、前記変換領域が、DCT変換領域に対応するようにした特許請求の範囲第6項に記載の方法。
- 前記過程(c)が、一つ又はそれ以上のビデオ圧縮過程を施して処理された出力コード化ビデオビットストリームを発生させる過程を含むようにした特許請求の範囲第6項に記載の方法。
- 前記一つ又はそれ以上のビデオ圧縮過程が、動き補正されたインターフレーム差別を変換領域において処理された変換係数に行なって変換係数差データを発生させるようにした特許請求の範囲第9項に記載の方法。
- コード化されたプログラムコードを含む機械読み取り可能な媒体であって、前記プログラムコードが機械によって実行されるとき、前記機械が、
(a)一つ又はそれ以上のデコード化過程を存在する入力コード化ビデオビットストリームに施して変換領域内における変換係数データ及び対応するブロックベースの動きベクトルを回復し、その際前記ブロックベースの動きベクトルが、対応する基準データにおけるブロック境界との一致に制限され、
(b)前記ブロックベースの動きベクトルと前記基準データに基づいて変換領域内において動き補正されたインターフレーム追加を実行して予測エラー補正された(PEC)変換係数データを発生させ、及び、
(c)変換領域内において前記PEC変換係数データの引き続いての処理を実行するようにした機械読み取り可能な媒体。 - ビデオデータを圧縮する方法において、
(a)対応する基準データに基づいてビデオデータのフレームについて動き推定を行なってそのフレームに対する動きベクトルの組を識別し、その際前記動き推定が、前記基準データにおけるブロック境界と一致するブロックベースの動きベクトルのみの識別に制限され、及び、ブロックベースの動きベクトルのすべてが、0動きベクトルであり、
(b)前記基準データ及び前記ブロックベースの動きベクトルに基づいた前記ビデオデータに対して動き補正されたインターフレーム差別を行なってインターフレーム差データを発生させ、及び、
(c)前記インターフレーム差データに一つ又はそれ以上のビデオ圧縮過程を与えて前記ビデオデータに対応するコード化されたビデオビットストリームに対してコード化されたデータを発生させ、その際前記コード化されたビデオビットストリームが、MPEGコーデックアルゴリズムに適合するようにした方法。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US10221498P | 1998-09-29 | 1998-09-29 | |
| US12153199P | 1999-02-25 | 1999-02-25 | |
| US09/388,701 US6188728B1 (en) | 1998-09-29 | 1999-09-02 | Block motion video coding and decoding |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2000573099A Division JP2002526998A (ja) | 1998-09-29 | 1999-09-29 | ブロック動きビデオのコード化及びデコード化 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2010268505A true JP2010268505A (ja) | 2010-11-25 |
Family
ID=27379311
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2000573099A Withdrawn JP2002526998A (ja) | 1998-09-29 | 1999-09-29 | ブロック動きビデオのコード化及びデコード化 |
| JP2010160883A Pending JP2010268505A (ja) | 1998-09-29 | 2010-07-15 | ブロック動きビデオのコード化及びデコード化 |
Family Applications Before (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2000573099A Withdrawn JP2002526998A (ja) | 1998-09-29 | 1999-09-29 | ブロック動きビデオのコード化及びデコード化 |
Country Status (3)
| Country | Link |
|---|---|
| EP (1) | EP1118224A1 (ja) |
| JP (2) | JP2002526998A (ja) |
| WO (1) | WO2000019725A1 (ja) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| GB2519289B (en) | 2013-10-11 | 2016-10-12 | Canon Kk | Method and apparatus for displacement vector component transformation in video coding and decoding |
| CN120075457A (zh) * | 2025-02-24 | 2025-05-30 | 北京大学深圳研究生院 | 视频编码方法、系统、电子设备及存储介质 |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH01300781A (ja) * | 1988-05-30 | 1989-12-05 | Nec Corp | 動画像信号の符号化・復号化方式 |
| JPH02181586A (ja) * | 1989-01-06 | 1990-07-16 | Nec Corp | 動き補償フレーム間予測符号化方式 |
| JPH05501944A (ja) * | 1989-11-14 | 1993-04-08 | ドイチエ トムソン―ブラント ゲゼルシヤフト ミツト ベシユレンクテル ハフツング | 伝送系 |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4245248A (en) * | 1979-04-04 | 1981-01-13 | Bell Telephone Laboratories, Incorporated | Motion estimation and encoding of video signals in the transform domain |
| JP3089165B2 (ja) * | 1994-11-10 | 2000-09-18 | 株式会社グラフィックス・コミュニケーション・ラボラトリーズ | 動きベクトル探索装置 |
| US5708732A (en) * | 1996-03-06 | 1998-01-13 | Hewlett-Packard Company | Fast DCT domain downsampling and inverse motion compensation |
-
1999
- 1999-09-29 WO PCT/US1999/022635 patent/WO2000019725A1/en not_active Ceased
- 1999-09-29 JP JP2000573099A patent/JP2002526998A/ja not_active Withdrawn
- 1999-09-29 EP EP99950015A patent/EP1118224A1/en not_active Withdrawn
-
2010
- 2010-07-15 JP JP2010160883A patent/JP2010268505A/ja active Pending
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH01300781A (ja) * | 1988-05-30 | 1989-12-05 | Nec Corp | 動画像信号の符号化・復号化方式 |
| JPH02181586A (ja) * | 1989-01-06 | 1990-07-16 | Nec Corp | 動き補償フレーム間予測符号化方式 |
| JPH05501944A (ja) * | 1989-11-14 | 1993-04-08 | ドイチエ トムソン―ブラント ゲゼルシヤフト ミツト ベシユレンクテル ハフツング | 伝送系 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2002526998A (ja) | 2002-08-20 |
| EP1118224A1 (en) | 2001-07-25 |
| WO2000019725A1 (en) | 2000-04-06 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6188728B1 (en) | Block motion video coding and decoding | |
| US6625215B1 (en) | Methods and apparatus for context-based inter/intra coding mode selection | |
| TWI328357B (ja) | ||
| KR101365567B1 (ko) | 영상의 예측 부호화 방법 및 장치, 그 복호화 방법 및 장치 | |
| US20050002458A1 (en) | Spatial scalable compression | |
| JPH11275592A (ja) | 動画像符号列変換装置及びその方法 | |
| JP2003250157A (ja) | 静止映像及び動映像を符号化/復号化するための変換係数の最適走査方法 | |
| US20100119169A1 (en) | Method for processing images and the corresponding electronic device | |
| US8194748B2 (en) | Apparatus for scalable encoding/decoding of moving image and method thereof | |
| KR100772391B1 (ko) | 직교 변환 및 벡터 양자화에 기반한 동영상 부호화 및복호화 방법과 이를 이용한 장치 | |
| US6847684B1 (en) | Zero-block encoding | |
| KR100694137B1 (ko) | 동영상 부호화 장치, 동영상 복호화 장치, 및 그 방법과,이를 구현하기 위한 프로그램이 기록된 기록 매체 | |
| CN100428800C (zh) | 运动图像解码设备及方法 | |
| KR100928325B1 (ko) | 영상의 부호화, 복호화 방법 및 장치 | |
| JP2006511164A (ja) | 弾性記憶 | |
| JP4597511B2 (ja) | 細粒度スケーラブル・ビデオ用の動き補償 | |
| JP2010268505A (ja) | ブロック動きビデオのコード化及びデコード化 | |
| TW462184B (en) | Block motion video coding and decoding | |
| JP3691725B2 (ja) | 符号化画像編集装置,符号化画像編集方法および符号化画像編集プログラム記録媒体 | |
| JP2005507620A (ja) | 圧縮 | |
| JP4847423B2 (ja) | 動画像符号化装置、および、コンピュータプログラム | |
| JP4253572B2 (ja) | 画像符号化装置、画像符号化方法および画像符号化プログラム | |
| WO2006024988A2 (en) | A method and apparatus for motion estimation | |
| JPH06169453A (ja) | 画像データ符号化および復号化装置および方法 | |
| JPH07154802A (ja) | 画像符号化方法および画像符号化装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100927 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121012 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130107 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130315 |