[go: up one dir, main page]

JP2004503964A - カラービデオ符号化及び復号方法 - Google Patents

カラービデオ符号化及び復号方法 Download PDF

Info

Publication number
JP2004503964A
JP2004503964A JP2002511117A JP2002511117A JP2004503964A JP 2004503964 A JP2004503964 A JP 2004503964A JP 2002511117 A JP2002511117 A JP 2002511117A JP 2002511117 A JP2002511117 A JP 2002511117A JP 2004503964 A JP2004503964 A JP 2004503964A
Authority
JP
Japan
Prior art keywords
coefficients
lis
chroma
insignificant
coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002511117A
Other languages
English (en)
Inventor
ペスクエト−ポペスク ベアトリス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of JP2004503964A publication Critical patent/JP2004503964A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • H04N19/615Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding using motion compensated temporal filtering [MCTF]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/64Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission
    • H04N19/647Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission using significance based coding, e.g. Embedded Zerotrees of Wavelets [EZW] or Set Partitioning in Hierarchical Trees [SPIHT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Color Television Systems (AREA)

Abstract

本カラービデオ圧縮方法は、3つのカラー面YUVにおいてSPIHT処理を用い、ピクセルを3つの配列されたリストLIS、LIP及びLSPにより並べられた係数に変換する。自然系列に関しては、クロミナンス係数は殆どの場合ルートサブバンドにおける輝度の係数よりも小さな振幅を有している。輝度係数が所与のビット面レベルにおいて重要でない子孫(子)を持つ場合、同一位置におけるクロミナンス係数も高い確率で重要でない子を持つ。このY、U及びV面間の冗長性を利用するため、3つの空間時間的零ツリーの非重要性は、3つの面における同一の位置に対応する3つの係数が重要でないシンボルのリストLIS内で近隣の位置にある場合に、ユニークシンボルにより符号化することができる。

Description

【0001】
【技術分野】
本発明は、フレームの群に編成された連続したフレームを含むようなビデオ系列を圧縮する符号化方法に係り、各フレームが所与の数の連続した解像度レベルに繋がるような三次元(3D)ウェーブレット変換により分解され、上記方法は“階層ツリーへの集合分割(SPIHT)”と呼ばれる階層的サブバンド符号化処理に基づくもので、各群のフレームの画素(ピクセル)の原集合から、二進フォーマットで符号化されると共に階層ピラミッドを構成するウェーブレット変換係数に導き、これら係数は上記3Dウェーブレット変換から生じる最低周波数(又は近似サブバンド)に根を下ろすと共に高い周波数サブバンドにおける子により完成される空間時間的オリエンテーションツリーに編成され、該ツリーの係数は前記ピクセルを含むと共に重要度の各レベルに対応する分割集合に並べられ、これら集合は重要度情報の重要でない集合のリスト(LIS)、重要でないピクセルのリスト(LIP)及び重要なピクセルのリスト(LSP)と呼ばれる3つの順序づけられたリストへの分類に繋がる振幅テストにより定義され、上記テストは各重要係数が前記二進表現内で符号化されるまで継続するような分割処理により前記ピクセルの原集合を前記分割集合へ分割するために実行され、上記空間時間的オリエンテーションツリーは前記階層ピラミッド内の空間時間的関係を規定し、前記SPIHTアルゴリズムが下記のステップ、即ち初期化、分類パス(又は複数のパス)、改良(refinement)パス及び量子化ステップ更新なる各ステップを有しているような符号化方法に関する。
【0002】
また、本発明は対応する復号方法にも関する。
【0003】
【背景技術】
マルチメディアアプリケーションの最近の拡大により、ビデオ符号化システムは高度にスケーラブルになることが期待される。マルチメディアアプリケーションにおいては、圧縮されたビデオ系列が、マルチキャスト態様で、異なる要件及び能力の一団の受信者に向けストリーム伝送される。この場合、複数ネットワーク接続の間で複数レベルの品質を配信する1つの方法は、当該ビデオ信号を、各々が異なる出力レートを生成する一群の独立したエンコーダを用いて符号化することである。この“同時放送”解決策の大きな欠点は、主に、その準最適な圧縮性能及び大きな記憶である。
【0004】
ビデオ符号化システムは、目下、一層柔軟になることが期待されている。特に、斯かるシステムは、単一のビデオビットストリームを多様な伝送条件(帯域幅、エラー率、…)並びに多様な受信器能力及び要件(CPU、表示寸法、アプリケーション、…)に適応させることができなければならない。このような枠組み内で、“スケーラビリティ”は、これらの問題に対処するための期待される機能である。“スケーラブル”なる用語は、圧縮されたビットストリームの部分的な復号を可能にする方法を指す。即ち、条件(ビットレート、エラー、資源)に応じて、デコーダは当該ストリームの一部を読み取り、画像を異なる品質レベルで復号することができるというものである。
【0005】
H.263、MPEG−2又はMPEG−4のような現在の規格は表示されるフレーム差分(DFD)のブロックDCT符号化に基づいており、スケーラビリティは単一スケール予測ループの追加のレベルを介して実施されている。しかしながら、それらの解像度及びレートのスケーラビリティに関するものの効率は限られたものであり、サブバンド分解に基づくプログレッシブ符号化技術の動向を調査することにより改善することができる。確かに、ウェーブレットは静止画像及びビデオの自然な複数スケール表現を提供し、それらの画像をプログレッシブに符号化する高効率は、スケーラブルな表現をもたらす。上記の複数スケール表現は、分解内に時間的次元を含む三次元(3D)、又は空間時間(2D+t)的ウェーブレット解析によりビデオに拡張することができる。斯様な3Dサブバンド分解方法への動き補償ステップの導入は、ビデオ信号の空間時間的複数解像度(階層)表現に繋がり、これは低ビットレートのハイブリッドコーダより著しく性能が勝る。
【0006】
サブバンド分解は、当然、スケーラブル構成に繋がり、階層空間時間的ツリーに沿って存在する依存性を利用する符号化アルゴリズムは、最良の圧縮性能、及びビットストリーム埋め込みのような所望の特性をもたらす。これらのアルゴリズムは、最近、3Dビデオ符号化システムに拡張され、最も有効なスケーラブルビデオコーダの幾つか、即ち三重零ツリーに基づく3D階層ツリー集合分割(SPIHT)エンコーダ及び該エンコーダの変形、を得ている。既存の符号化方法の殆どは、固有の符号化戦略を考慮し、各カラー面を独立に符号化するために該戦略を適用する。発生されたビットストリームは、各カラー面に対応する3つの明確に分離されたビットストリームを連結している。しかしながら、この戦略はスケーラブル方法には適合しない。何故なら、低ビットレートに対しては、クロミナンス情報に対応するビットが復号されないからである。
【0007】
【発明の開示】
本発明の目的は、上記欠点を除去するため、クロミナンス係数を符号化する方法を提供することにある。
【0008】
この目的のため、本発明は、発明の詳細な説明の導入部分に記載したような符号化方法であって、
付録Bに示されるアルゴリズムにしたがい、
(a)初期化ステップにおいて、
− 3つのカラー面Y、U及びVにおける同一の位置に対応する3つの前記係数は前記LISに順番に投入されて、隣接する位置を占めると共に、各重要度レベルにおいて次から次へと解析される際に全てが重要でない子を持つ場合に後続する分類パスに対して該LIS内に一緒に留まるようにし、
− 輝度における重要でない子がクロミナンスにおける重要でない子を意味するような最終ビット面nが、ルートサブバンドにおける係数の集合重要度レベルに基づいて計算されると共に、ビットストリームに出力され、
(b)nmaxからnへ進む前記分類パス(又は複数のパス)において、輝度係数が重要でない子を有し、且つ、前記LISにおいて該係数に後続する2つの係数により下記3つの条件:
− 前記2つの係数は、各々、U及びV係数であり、
− 前記2つの係数は、前記輝度係数と同一の空間時間的座標を有し、
− 前記2つの係数は、重要でない子を持つ、
が満たされる場合に、この状況がユニークシンボルのみにより符号化され、全ての他の場合には前記出力ビットストリームは元の前記SPIHTアルゴリズムに対して変更されない、
ことを特徴とする。
【0009】
提案された該方法は、有利にも、輝度及びクロミナンスの空間時間的オリエンテーションツリーの間に存在する冗長性を利用している。更に、該方法は結果としてのビットストリームへの原SPIHTアルゴリズムよりも一層強いカラーの埋め込みを提供し、これに関して、該方法は増加された符号化効率、及び関係する圧縮ビデオ系列のプログレッシブな復号に対する改善された知覚的品質に繋がる。
【0010】
また、本発明は斯様な符号化方法により処理されたビデオ系列の伸張のための復号方法にも関するものであるが、上記符号化アルゴリズムにおける“出力(output)”処理は、対応する復号アルゴリズムにおいては“入力(input)”処理に置換される。
【0011】
以下、本発明を例示として添付図面を参照して説明する。
【0012】
【発明を実施するための最良の形態】
ビデオ系列の時間的サブバンド分解が図1に示されている。動き補償を伴う図示の3Dウェーブレット分解は、F1ないしF8で示す一群のフレーム(GOF)に適用される。この3Dサブバンド分解方法において、入力ビデオの各GOFは先ず動き補償(MC)され(このステップは、大きな動きを伴う系列を処理するのを可能にする)、次いでハールウェーブレットを用いて時間的にフィルタ処理(TF)される(破線矢印はハイパス時間的フィルタ処理に対応し、他のものはローパス時間的フィルタ処理に対応する)。図1には3つの分解段階が示されている(L及びHは第1段、LL及びLHは第2段、LLL及びLLHは第3段である)。この3Dウェーブレット分解方法の、予測方法に対する主な利点は:
− 時間的スケーラビリティを達成する能力であり、これは、当然、種々の時間的解像度での再生により得ることができる;
− 古典的予測方法におけるよりも高いエネルギ圧縮;
− 非反復的デコーダ構造であり、これは伝送エラーの広がりを防止する;
− 伝送エラーに対する情報データの効率的な保護を導入する能力;
である。
【0013】
動きの方向に時間的フィルタ処理を実行するような、MCTF(動き補償された時間的フィルタ処理)処理が、幾つかの時間的解像度レベルに対して階層的に適用され、結果として、葉(時間的サブバンド)が幾つかのフレームを含むような時間的分解ツリーが得られる。これらのフレームは更に空間的に分解されて、ウェーブレット係数の空間時間的ツリーとなる。この場合、空間的複数解像度解析の実施のために非常に柔軟性のある解決策、即ち所謂持ち上げ(lifting)又は昇降演算子(ladder)法の分解、が選択された。SNR(又は品質)スケーラビリティは、変形されたSPIHTアルゴリズムにより提供される。例えば、1996年6月のビデオ技術に関する回路及びシステムについてのIEEE論文集第6巻、第3号の第243〜250頁における、A. Said及びW.A. Pearlmanによる論文“階層ツリーへの集合分割に基づく新たな高速且つ有効な画像符号化”に記載されたようなAPIHT技術によれば、空間時間的ツリーのウェーブレット変換係数は、それらの振幅(magnitude)のビット面表現における最も重要なビットのレベルにより規定されるような集合に分割される。この分割アルゴリズムは、重要でない係数の大きな部分集合を作成するために、空間時間的オリエンテーションツリーにおけるエネルギ再分割を利用している。該アルゴリズムにおいては、3つの係数集合が操作される。即ち、重要でない集合のリスト(LIS)、重要でないピクセルのリスト(LIP)及び重要なピクセルのリスト(LSP)である。近似サブバンドからの係数が上記LIPを初期化するために使用され、これらのうちの、子孫を持つものが上記LISを初期化するために使用される。固定の閾との比較が部分集合に対して実現され、それらは、単一の重要な係数が分離されて更に改良(refine)されるべきLSPに転送されるまで、更に分割される。
【0014】
本発明による符号化方法を説明する前に、当該ビデオ系列はQCIFフォーマット(176x144ピクセル)であり、3つのレベルの時間的且つ空間的ウェーブレット分解が実行されると仮定する。該原理は、nレベルの分解が実行されるような2n+1の倍数の画像寸法を持つ系列にも当てはまる。
【0015】
ビデオ系列の表現にしばしば使用される4:2:0フォーマットは空間時間的分解ツリーの深さに関して問題を生じさせ、該問題は実際にSPIHTアルゴリズムの性能を変化させることに言及する必要がある。一方において、この技術は偶数寸法のサブバンドの場合のみ良好に動作する。他方において、輝度及びクロミナンスの間の寸法の差は上記3つのツリーに対して同一の分解を適用することを妨害する。この問題を解決して、クロミナンス面に関し適切な数の分解レベルを選択するために、2つの戦略が規定された:
1)輝度及びクロミナンス複数解像度解析に対して同数の解像度レベルが考慮され、これはクロミナンス面の最低解像度レベルにおいて奇数寸法のサブバンドに繋がり、原SPIHTアルゴリズムは適応化なしでは対処することができない(例えば、176x144ピクセルのQCIFフレーム及び3つのレベルの分解の場合、輝度ルートサブバンドは22x18ピクセルを有する一方、クロミナンス近似サブバンドは11x9ピクセルを有する);
2)各カラー面に対して適宜の数(Y面に対してn、U及びV面に対してn−1)の分解レベルが、SPIHTアルゴリズムを直接適用することができるように選択される。これは、CQIFフレームの場合、輝度に関しては3つのレベル、クロミナンス面に対しては2つのレベルを意味する。
【0016】
上記第1の戦略は、1998年2月のIEEE画像処理に関する会報、第8巻、第2号の第155〜167頁におけるS.J. Choi及びJ.W. Woodsによる文献“ビデオの動き補償された3Dサブバンド符号化”に記載されている。3つのカラー面のウェーブレット分解が図2に図示されており、原SPIHTアルゴリズムにおける依存性(及び矢印により示された親子関係)を示している。LIP及びLISは、3つの全ての面において、最上レベルの適切な係数で初期化される。奇数寸法サブバンドの問題を解決するために、最低の空間時間的サブバンドフレームに対して空間的補外が実行される。結果的に、該補外は原画像に対して適用される。この画像を分解する場合、人工的に作成された係数を符合化しなければならず、従って該アルゴリズムの効率は低下する。同様の種類のアーチファクトが動き補償の間に入り込む。これらの補外は、不可避的に、最終的ビットレートを増加させる。更に、この解決策はY、U及びV面の間の冗長性を利用していない。
【0017】
本発明は、前記第2の戦略を利用し、4:2:0フォーマットにおけるU及びV面は輝度面に関しては既にサブサンプルされたフォーマットに存在するという事実を使用する。従って、全解像度クロミナンス面は、全解像度輝度面の近似として見ることができる。幾つかの解像度レベルにわたりウェーブレット分解を実行する場合、輝度のn番目の解像度レベルは、クロミナンスの(n−1)番目のレベルと同一の寸法を有する。これが図3に示され、提案された該方法により導入されるカラー面分解の間の付加的依存性を示している(実線矢印は親子関係を示す一方、破線矢印は輝度及びクロミナンス面間の依存関係に対応している)。3つの成分面の埋め込みは、3つのカラー空間時間的ツリーから到来するルートサブバンドの係数を同時に処理することにより達成され、それらはLIP及びLISの両者を設定するために使用される。
【0018】
なすことができ、且つ、幾つかの系列に対して検証された第1の観察点は、クロミナンス係数が自然系列に対して高い確率でルートサブバンドにおける輝度のものより小さな振幅を有するという点である。この場合、本発明によれば、輝度係数が所与のビット面で重要でない子を有するならば、同じ位置におけるクロミナンス係数も重要でない子を持つ確率が高いと仮定される。従って、3つの空間時間的零ツリーの非重要性をユニークシンボルにより符号化することができる。これは、3つのカラー面における同一の位置に対応する3つの係数がLISにおける隣接位置内にある場合に可能である。このリストの特別な初期化が、係数を正しく配列する。
【0019】
この初期化が図4及び5に図示され、ここで、図4は元の初期化に対応し、図5は提案された特別な初期化に対応する。元の初期化においては、ルートサブバンドからの全ての輝度係数が先ずLISに投入され、次いで、クロミナンスの係数が含められる。提案した初期化においては、ルートサブバンドY、U及びVからの同一の空間時間的座標を持つ3つの係数はLISに順番に投入される。提案されたようにカラー面を混合する他の利点は、クロミナンスの最終的ビットストリームへの良好な埋め込みにある。
【0020】
上記初期化の後、各重要レベルにおいて当該アルゴリズムはY、U、V成分を次から次へと解析する。これらが全て重要でない子を持つなら、該SPIHTアルゴリズムの後続の分類パス(sorting passes)のために、一緒にLIS中に留まる。上記アルゴリズムは該分類パスを、重要でない子を持つ各輝度係数に関し、LISにおいて該係数に続く2つの係数がU及びVであり、且つ、これら係数が全て同じ空間時間的座標を有するかが調査されるように、変更する。この場合、これら係数が重要でない子を持つことも検証され、斯かる場合は0ビットにより符号化される。全ての他の場合には、出力ビットストリームは原アルゴリズムに対して変更されない。
【0021】
しかしながら、元々なされた仮説(基本的仮定)は全ての重要性レベルに関しては満足されない(nmaxが最大の重要性レベルである)。典型的には、常に最初のレベルで検証され、最低の重要性レベルは検証を行わない。この振る舞いの変化が現れる精密なビット面レベルは、当該系列に依存し、符号化を開始する前に決定されねばならない。このレベルを見付ける作業は初期化ステップの間に実行され、重要性レベルの最大数と一緒に出力される。更に、この作業は、各係数に関連する集合重要度レベルSSLが当該アルゴリズムの初期に算出される事実により容易化される。インターレースレベルnは下記の関係(1)により得られる:
=minx,y,z{SSL(x,y,z)SSL(x,y,z)及びSSL(x,y,z)SSL(x,y,z)のようなSSL(x,y,z)}             (1)
【0022】
実際には、このレベルnは次のように算出される。各ビット面に対して、及びルートサブバンドにおける各ピクセルに対して、集合重要性レベルSSLは既に利用可能である。従って、重要でない子を持つ輝度係数が同じ位置でクロミナンス係数により後続されるなら、輝度の非重要性のみが符号化される。この条件が満たされない最初のビット面がnである。
【0023】
このステップを1回実行することは、繰り返してツリーの重要性を計算し、それを連続する分類パスの間に減少する閾と比較することを避けることにもなる。原及び提案されたアルゴリズムは(原英文明細書の)第9ないし第11頁の付録A及びBに示される。実験的結果は、クロミナンス面に関してのコーダの圧縮性能に対する、改善されたSPIHTカラー符号化アルゴリズムの影響を際だたせている。
【0024】
より有効な圧縮を得るために輝度及びクロミナンス成分の間の依存性を利用する上述した符号化方法は、下記のような主たる利点を有している:
− U及びV面は低減された数の解像度レベルにわたり分解され、これは当該アルゴリズムの計算上の複雑さを減少させる;
− 輝度及びクロミナンス成分の間の依存性が空間時間的ツリーを介して利用される。もっと正確には、輝度係数が重要でない子を有するなら、対応するクロミナンス係数も重要でない子をもつ傾向が非常に強く、これが、3つの子ツリーを効率的に符号化するために利用される;
− 補外は必要とされず、従って人工的な係数は導入されない。即ち、実際のピクセルのみが分解及び符号化され、斯かる人工的ピクセルに関して動きベクトルは計算されないので、当該アルゴリズムに追加の単純化度が導入される;
− 結果としてのビットストリームの完全な埋め込みが保証される。何故なら、ピクセルの輝度及びクロミナンス成分が、ここでは3つのリストにおいて非常に近いからである(原アルゴリズムにおいては、LIP及びLISの初期化はY、U及びV係数を分離することにより実行され、これは、それらの各解像度レベルにおける順次の処理を意味することが思い出されるべきである)。
【0025】
次に、可能な実施化についての幾つかの細部を説明する。GOFを構成するフレームの数の選択は、好ましくは、多過ぎるフレームの処理により生じる遅延と、十分な数の解像度レベルにわたり実行される時間的ウェーブレット解析により達成されるエネルギ圧縮との間の取り引きでなければならない。実行された実験においては、16フレームのGOFが最良の圧縮結果を生ずることが分かった。全サーチブロック整合アルゴリズムが、半ピクセル精度で実施された。時間的分解のためにハールフィルタが使用される場合、2による時間的下降サンプリングにより、動き推定及び動き補償(ME/MC)は入力系列の2フレーム毎にしか実行されないことに注意することができる。近似サブバンドにおける幾つかの分解レベルにわたり該手順を反復することによって、ME/MC処理の合計数は予測方法におけるものと大凡同じになる。動きベクトルは差分的に符号化され、GOFの最初でビットストリームに投入される。
【0026】
しかしながら、ビットストリームのこの部分で発生する如何なるエラーも、再生される系列に重大な損傷を生じ得る。チャンネルエラーに対する強さを保証するために、ビットストリームの2つの部分の異なるエラー保護が導入される。空間的分解の持ち上げ構成は、使用される演算子の型式に関するものにおけるライン又は列レベルで大きな柔軟性を可能にする。
【0027】
原SPIHTアルゴリズムと比較した場合、提案された方法は、改善された符号化効率及び圧縮されたビデオ系列のプログレッシブな復号に関する改善された知覚上の品質に繋がる。この方法が、例えば176x144ピクセルのフレーム寸法、4:2:0のサブサンプルされたフォーマット及び10f/sなるフレームレートを持つカラービデオQCIF系列に適用される場合、低ビットレートで得られた実験的結果は、該方法のクロミナンス面に関する圧縮性能に対する影響を示す。輝度及びクロミナンス面の間における上記の自動的なビット割り付けにより、クロミナンスドメインにおける本方法により得られるビット節約は、輝度及びクロミナンス面に分散され、これらの3つのドメインにおける改善に繋がる。
【0028】
かくして、本方法は特に低ビットレートにおいてMPEG−4規格の競争相手として考えることができる。何故なら、提案された方法は、原理的に、高いビット予算ではLSPに割り当てられた予算に関する影響があまり重要でないようなLIS符号化を変更するからである。MPEG−4でのイントラフレームの符号化が非常に変動する品質となってしまう(特に、各イントラ符号化されたフレームに続くインター符号化されたフレームに関してはバッファ制御戦略によりPSNRピークが生じる)ことにも注意すべきである。提案された方法によれば、GOFを形成するフレームは一緒に処理され、これが全系列にわたる一層一様なPSNR変化となる。
【0029】
付録A
関数Sn()は所与のレベルnに対するピクセル又はピクセルの集合の重要度を示し、ウェーブレット変換の係数はcx,y,z,chromaにより示され、原アルゴリズムは以下のように実行する:
【表1】
Figure 2004503964
set the LSP as an empty list, and add the coordinates (x,y,z, chroma) ∈ H to the LIP, and only those with descendants also to the LIS, as type A entries, according to the following order : (x,y,z, chroma = Y) for all (x,y,z) ∈ H, then (x,y,z, chroma = U) for all (x,y,z) ∈ H, then (x,y,z, chroma = V) for all (x,y,z) ∈ H.
2. Sorting pass:
2.1 For each entry (x,y,z,chroma) in the LIP, do:
2.1.1 output bit = S(x,y,z,chroma);
2.1.2 if (bit = 1), then :
move (x,y,z,chroma) to the LSP and output bit = sign(x,y,z,chroma);
2.2 For each entry (x,y,z,chroma) in the LIS, do:
2.2.1 if the entry is of type A, then:
. output bit = S(D(x,y,z,chroma));
. if (bit = 1), then:
a) for each (x’, y’, z’, chroma) ∈ 0(x,y,z, chroma), do:
. output bit = S(x’,y’,z’,chroma);
. if (bit=1), then:
move (x’,y’,z’,chroma) to the end of LSP and output bit = sign(x’,y’,z’,chroma);
. else move (x’,y’,z’,chroma) to the end of the LIP;
b) if L(x,y,z, chroma) ≠ 0, then move (x,y,z, chroma) to the end of the LIS as an entry of type B, and go to step 2.2.2, else remove entry (x,y,z, chroma) from the LIS;
2.2.2 if the entry is of type B, then:
. output bit = S(L(x,y,z, chroma));
. if (bit = 1), then:
a) add each (x’,y’,z’,chroma) ∈ 0 (x,y,z, chroma) to the end of the LIS as an entry of type A;
b) remove (x,y,z chroma) from the LIS.
3. Refinement pass :
For each entry (x,y,z, chroma) in the LSP, except those included in the last sorting pass (i.e., with same n), output the nth most significant bit of c(x,y,z,chroma)
4. Quantization−step update : decrement n by 1 and go to step 2.
【0030】
付録B
関数Sn及びウェーブレット変換の係数は同様に示される。LISにおける現在のものの後の次の係数は“next”により示され、この係数“next”の後の係数は“next2”により示され、それらの座標及びクロミナンスは各々(x,y,z)_next,chroma_next,(x,y,z)_next2及びchroma_next2と指標される。この場合、提案されたアルゴリズムは以下のように実行する(太字の文は修正された処理ステップである):
【表2】
Figure 2004503964
output n_color, the last bitplane level for which insignificant offspring in luminance implies insignificant offspring in chrominance, set the LSP as an empty list, and add the coordinates (x,y,z, chroma) ∈H to the LIP, and only those with descendants also to the LIS, as type A entries, according to the same order for each spatio−temporal coordinate (x,y,z) ∈H.
2. Sorting pass:
2.1 For each entry (x,y,z,chroma) in the LIP, do:
2.1.1 output bit = S(x,y,z,chroma) ;
2.1.2 if (bit = 1), then:
move (x,y,z,chroma) to the LSP and output bit = sign(x,y,z,chroma);
2.2 For each entry (x,y,z,chroma) in the LIS, do:
2.2.1 if the entry is of type A, then:
. bit = S(D(x,y,z,chroma));
− if n > n_color:
− if (bit = 0 and chroma = Y), then:
−if (chroma_next=U and chroma_next2 = V), then:
− if((x,y,z) = (x,y,z)_next =(x,y,z)_next2), then:
move forward of two coefficients in the LIS
− else : output bit, and break.
. if (bit = 1), then:
a) for each (x’, y’, z’, chroma) ∈0(x,y,z, chroma), do:
. output bit = S(x’,y’,z’,chroma) ;
. if (bit=1), then :
move (x’,y’,z’,chroma) to the end of LSP and output bit = sign(x’,y’,z’,chroma);
. else move (x’,y’,z’,chroma) to the end of the LIP;
b) if L(x,y,z, chroma) ≠ 0, then move (x,y,z, chroma) to the end of the LIS as an entry of type B, and go to step 2.2.2, else remove entry (x,y,z, chroma) from the LIS;
2.2.2 if the entry is of type B, then :
. output bit = S(L(x,y,z, chroma));
. if (bit = 1), then:
a) add each (x’,y’,z’,chroma) ∈0 (x,y,z, chroma) to the end of the LIS as an entry of type A;
b) remove (x,y,z chroma) from the LIS.
3. Refinement pass:
For each entry (x,y,z, chroma) in the LSP, except those included in the last sorting pass (i.e., with same n), output the nth most significant bit of c(x,y,z,chroma)
4. Quantization−step update: decrement n by 1 and go to step 2.

【図面の簡単な説明】
【図1】図1は、動き補償を伴う、ビデオ情報の時間的サブバンド分解を示す。
【図2】図2は、原SPIHTアルゴリズムにおける空間的依存性を示し、矢印はY面、U面及びV面における親子関係を示している。
【図3】図3は、図2に対して、本発明による符号化方法の実施により導入された、カラー面分解の間の付加的依存性を示す。
【図4】図4は、原SPIHTアルゴリズムにおけるLIS及びLIPリストの初期構造を示す。
【図5】図5は、本発明による方法の場合の上記初期構造を示す。

Claims (3)

  1. フレームの群に編成された連続したフレームを含むようなビデオ系列を圧縮する符号化方法であって、各フレームが所与の数の連続した解像度レベルに繋がるような三次元(3D)ウェーブレット変換により分解され、前記方法は“階層ツリーへの集合分割(SPIHT)”と呼ばれる階層的サブバンド符号化処理に基づくもので、各群のフレームの画素(ピクセル)の原集合から、二進フォーマットで符号化されると共に階層ピラミッドを構成するようなウェーブレット変換係数に導き、これら係数は上記3Dウェーブレット変換から生じる最低周波数(又は近似サブバンド)に根を下ろすと共に高い周波数サブバンドにおける子により完成される空間時間的オリエンテーションツリーに編成され、該ツリーの係数は前記ピクセルを含むと共に重要度の各レベルに対応する分割集合に並べられ、これら集合は重要度情報の重要でない集合のリスト(LIS)、重要でないピクセルのリスト(LIP)及び重要なピクセルのリスト(LSP)と呼ばれる3つの順序づけられたリストへの分類に繋がる振幅テストにより定義され、前記テストは各重要係数が前記二進表現内で符号化されるまで継続するような分割処理により前記ピクセルの原集合を前記分割集合へ分割するために実行され、前記空間時間的オリエンテーションツリーは前記階層ピラミッド内の空間時間関係を規定し、前記SPIHTのアルゴリズムが下記のステップ、即ち初期化、分類パス(又は複数のパス)、改良パス及び量子化ステップ更新なる各ステップを有しているような符号化方法において、該方法が付録Bに示されるアルゴリズムにしたがい、
    (a)前記初期化ステップにおいて、
    − 3つのカラー面Y、U及びVにおける同一の位置に対応する3つの前記係数は前記LISに順番に投入されて、隣接する位置を占めると共に、各重要度レベルにおいて次から次へと解析される際に全てが重要でない子を持つ場合に後続する前記分類パスに対して該LIS内に一緒に留まるようにし、
    − 輝度における重要でない子がクロミナンスにおける重要でない子を暗示するような最終ビット面nが、ルートサブバンドにおける係数の集合重要度レベルに基づいて計算されると共に、ビットストリームに出力され、
    (b)nmaxからnへ進む前記分類パス(又は複数のパス)において、輝度係数が重要でない子を有し、且つ、前記LISにおいて該係数に後続する2つの係数により下記3つの条件:
    − 前記2つの係数は、各々、U及びV係数であり、
    − 前記2つの係数は、前記輝度係数と同一の空間時間的座標を有し、
    − 前記2つの係数は、重要でない子を持つ、
    が満たされる場合に、この状況がユニークシンボルのみにより符号化され、全ての他の場合には前記出力ビットストリームは元の前記SPIHTアルゴリズムに対して変更されない、
    ことを特徴とする符号化方法。
  2. 請求項1に記載の符号化方法において、処理される前記ビデオ系列に応じて、前記ユニークシンボルによる符号化サブステップが最初の重要度レベルに限定されて最低の重要度レベルには適用されず、限界と考えられる正確な前記ビット面レベルnは前記初期化ステップの間において、
    =minx,y,z{SSL(x,y,z)SSL(x,y,z)及びSSL(x,y,z)SSL(x,y,z)のようなSSL(x,y,z)}             (1)
    なる関係により定義され、ここで、SSLは各係数に関連する集合重要度レベルであり、nmaxは最大重要度レベルであることを特徴とする符号化方法。
  3. 請求項1又は請求項2に記載の符号化方法により処理されたビデオ系列を伸張する復号方法において、該方法が、付録Bに示された前記アルゴリズムと同一のステップに従うが、“output”処理が“input”処理に置換されることを特徴とする復号方法。
JP2002511117A 2000-06-14 2001-06-08 カラービデオ符号化及び復号方法 Pending JP2004503964A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP00401683 2000-06-14
PCT/EP2001/006474 WO2001097527A1 (en) 2000-06-14 2001-06-08 Color video encoding and decoding method

Publications (1)

Publication Number Publication Date
JP2004503964A true JP2004503964A (ja) 2004-02-05

Family

ID=8173728

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002511117A Pending JP2004503964A (ja) 2000-06-14 2001-06-08 カラービデオ符号化及び復号方法

Country Status (6)

Country Link
US (1) US6898324B2 (ja)
EP (1) EP1297709A1 (ja)
JP (1) JP2004503964A (ja)
KR (1) KR20020026254A (ja)
CN (1) CN1383684A (ja)
WO (1) WO2001097527A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008007760A1 (fr) * 2006-07-13 2008-01-17 Nec Corporation Dispositif de codage et de décodage, procédé de codage et procédé de décodage
US8477849B2 (en) 2002-12-13 2013-07-02 Ntt Docomo, Inc. Wavelet based multiresolution video representation with spatially scalable motion vectors

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7020201B2 (en) * 2002-11-20 2006-03-28 National Chiao Tung University Method and apparatus for motion estimation with all binary representation
CN1720744A (zh) * 2002-12-04 2006-01-11 皇家飞利浦电子股份有限公司 视频编码方法和装置
EP1573676A1 (en) * 2002-12-11 2005-09-14 Koninklijke Philips Electronics N.V. Video encoding method and corresponding computer programme
US7715480B2 (en) * 2003-10-17 2010-05-11 Mitsubishi Electric Research Laboratories, Inc. Video encoding with motion-selective wavelet transform
US20050111746A1 (en) * 2003-11-26 2005-05-26 Kumar Bharath S. Progressive medical image volume navigation
WO2005081539A1 (ja) * 2004-02-23 2005-09-01 Nec Corporation 2次元信号の符号化/復号方法および装置
KR100668345B1 (ko) * 2004-10-05 2007-01-12 삼성전자주식회사 움직임 보상된 계층 생성장치 및 방법
KR100714071B1 (ko) * 2004-10-18 2007-05-02 한국전자통신연구원 적응적으로 세분화된 gop 구조를 이용한 mctf-기반동영상 부호화 및복호화 방법
WO2006043754A1 (en) * 2004-10-21 2006-04-27 Samsung Electronics Co., Ltd. Video coding method and apparatus supporting temporal scalability
KR100697516B1 (ko) * 2004-10-27 2007-03-20 엘지전자 주식회사 3차원 웨이블릿 변환 기반의 동영상 코딩 방법
CN1316829C (zh) * 2004-12-03 2007-05-16 大唐微电子技术有限公司 基于小波变换的视频流编码/解码方法
US7583849B2 (en) * 2005-07-25 2009-09-01 Microsoft Corporation Lossless image compression with tree coding of magnitude levels
US8164592B2 (en) * 2006-07-13 2012-04-24 University Of Central Florida Research Foundation, Inc. Systems and methods for graphical rendering
US8164593B2 (en) * 2006-07-13 2012-04-24 University Of Central Florida Research Foundation, Inc. Systems and methods for graphical rendering
US7707224B2 (en) 2006-11-03 2010-04-27 Google Inc. Blocking of unlicensed audio content in video files on a video hosting website
CA2667782A1 (en) * 2006-11-03 2008-05-15 Google Inc. Content management system
AU2008247347A1 (en) * 2007-05-03 2008-11-13 Google Inc. Monetization of digital content contributions
US8094872B1 (en) 2007-05-09 2012-01-10 Google Inc. Three-dimensional wavelet based video fingerprinting
US8611422B1 (en) 2007-06-19 2013-12-17 Google Inc. Endpoint based video fingerprinting
CN101252665B (zh) * 2008-03-06 2010-04-14 华为技术有限公司 接口装置
CN106303523B (zh) 2010-04-13 2020-09-11 Ge视频压缩有限责任公司 解码器及方法、编码方法
KR101792967B1 (ko) 2010-04-13 2017-11-02 지이 비디오 컴프레션, 엘엘씨 샘플 배열 멀티트리 세부분할에서 계승
BR122020007922B1 (pt) 2010-04-13 2021-08-31 Ge Video Compression, Llc Predição interplano
DK2947884T3 (da) * 2010-04-13 2019-10-28 Ge Video Compression Llc Videokodning ved anvendelse af multitræsunderinddeling af billeder
EP3404918B1 (en) 2010-09-30 2025-08-13 Samsung Electronics Co., Ltd. Video decoding method for decoding hierarchical-structure symbols
WO2013049412A2 (en) 2011-09-29 2013-04-04 Dolby Laboratories Licensing Corporation Reduced complexity motion compensated temporal processing
US9008184B2 (en) 2012-01-20 2015-04-14 Blackberry Limited Multiple sign bit hiding within a transform unit
EP3094094B1 (en) * 2012-01-20 2018-03-28 BlackBerry Limited Multiple sign bit hiding within a transform unit
WO2014013647A1 (ja) * 2012-07-19 2014-01-23 日本電気株式会社 ウェーブレット変換符号化/復号方法および装置
US20140133574A1 (en) * 2012-11-13 2014-05-15 Mediatek Inc. Method and Apparatus for Sign Data Hiding of Video and Image Data
KR20140071809A (ko) * 2012-12-04 2014-06-12 삼성전자주식회사 비디오 데이터의 처리 방법 및 장치
US9258517B2 (en) * 2012-12-31 2016-02-09 Magnum Semiconductor, Inc. Methods and apparatuses for adaptively filtering video signals
CA3005713A1 (en) * 2015-12-14 2017-06-22 Panasonic Intellectual Property Corporation Of America Three-dimensional data encoding method, three-dimensional data decoding method, three-dimensional data encoding device, and three-dimensional data decoding device
CN110251076B (zh) * 2019-06-21 2021-10-22 安徽大学 融合视觉注意力基于对比度的显著性检测方法及装置
EP4049454A4 (en) * 2019-10-25 2023-11-08 Kakadu R & D Pty Ltd Method and apparatus for complexity control in high throughput jpeg 2000 (htj2k) encoding
IL310037A (en) * 2021-08-03 2024-03-01 Vertiv It Systems Inc DVCX and DVCY extensions for DVC video compression
CN114665923B (zh) * 2022-03-09 2024-05-07 深圳市国电科技通信有限公司 用于载波通信的数据处理方法、装置及处理器

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5808683A (en) * 1995-10-26 1998-09-15 Sony Corporation Subband image coding and decoding
JPH11191153A (ja) * 1997-12-26 1999-07-13 Ricoh Co Ltd ウェーブレット変換係数の符号化方法
EP1145563A1 (en) * 1999-10-28 2001-10-17 Koninklijke Philips Electronics N.V. Color video encoding method based on a wavelet decomposition

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8477849B2 (en) 2002-12-13 2013-07-02 Ntt Docomo, Inc. Wavelet based multiresolution video representation with spatially scalable motion vectors
WO2008007760A1 (fr) * 2006-07-13 2008-01-17 Nec Corporation Dispositif de codage et de décodage, procédé de codage et procédé de décodage

Also Published As

Publication number Publication date
US6898324B2 (en) 2005-05-24
WO2001097527A1 (en) 2001-12-20
CN1383684A (zh) 2002-12-04
EP1297709A1 (en) 2003-04-02
KR20020026254A (ko) 2002-04-06
US20020009233A1 (en) 2002-01-24

Similar Documents

Publication Publication Date Title
JP2004503964A (ja) カラービデオ符号化及び復号方法
US7680190B2 (en) Video coding system and method using 3-D discrete wavelet transform and entropy coding with motion information
US8031776B2 (en) Method and apparatus for predecoding and decoding bitstream including base layer
KR100679011B1 (ko) 기초 계층을 이용하는 스케일러블 비디오 코딩 방법 및 장치
US20050166245A1 (en) Method and device for transmitting scalable video bitstream
US7023923B2 (en) Motion compensated temporal filtering based on multiple reference frames for wavelet based coding
US7042946B2 (en) Wavelet based coding using motion compensated filtering based on both single and multiple reference frames
EP1538566A2 (en) Method and apparatus for scalable video encoding and decoding
US20050169379A1 (en) Apparatus and method for scalable video coding providing scalability in encoder part
US20030202599A1 (en) Scalable wavelet based coding using motion compensated temporal filtering based on multiple reference frames
KR20060109241A (ko) 인트라 코딩을 선택적으로 적용하여 인트라 bl 예측모드의 비디오 신호를 인코딩 및 디코딩하는 방법 및 장치
US20050163224A1 (en) Device and method for playing back scalable video streams
US20050152611A1 (en) Video/image coding method and system enabling region-of-interest
US20050163217A1 (en) Method and apparatus for coding and decoding video bitstream
KR20040106418A (ko) 웨이브렛 부호화에 대한 다중 기준 프레임들에 기초한움직임 보상 시간 필터링
US20060088100A1 (en) Video coding method and apparatus supporting temporal scalability
Pesquet-Popescu et al. Embedded color coding for scalable 3D wavelet video compression
Akujuobi Application of Wavelets to Video Compression
Zhang et al. High performance full scalable video compression with embedded multiresolution MC-3DSPIHT
Jia et al. High performance video compression based on improved VSPIHT algorithm
eatrice Pesquet-Popescu et al. IMPROVED COLOR CODING FOR SCALABLE 3D WAVELET VIDEO COMPRESSION
Choupani et al. Adaptive embedded zero tree for scalable video coding
WO2006080665A1 (en) Video coding method and apparatus

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080606

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110510

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20111013