[go: up one dir, main page]

JP4654244B2 - ビデオシーケンスのフレームを形成する方法 - Google Patents

ビデオシーケンスのフレームを形成する方法 Download PDF

Info

Publication number
JP4654244B2
JP4654244B2 JP2007525299A JP2007525299A JP4654244B2 JP 4654244 B2 JP4654244 B2 JP 4654244B2 JP 2007525299 A JP2007525299 A JP 2007525299A JP 2007525299 A JP2007525299 A JP 2007525299A JP 4654244 B2 JP4654244 B2 JP 4654244B2
Authority
JP
Japan
Prior art keywords
frame
frames
gop
sub
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007525299A
Other languages
English (en)
Other versions
JP2008509617A (ja
Inventor
ベルゴー、キャサリン ラミ
ベルジェロン、シリル
Original Assignee
テールズ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テールズ filed Critical テールズ
Publication of JP2008509617A publication Critical patent/JP2008509617A/ja
Application granted granted Critical
Publication of JP4654244B2 publication Critical patent/JP4654244B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は(「スケーリビティー」(scalibity)として知られる)時間的な細分性を得るための、ビデオシーケンスのフレームを形成する方法に関する。
後に続く説明において、「細分性」(「granularity/granularite」)と言う用語はより大きい、又はより小さい粒子サイズを伴う選択によって解読されるビデオストリームの容量を示すであろう。単語の「フレーム」(「frame/trame」)又は「画像」(「image」)は、一つの同じオブジェクトを示すために同様に用いられるであろう。
本発明は例えばH.264/MPEG−4 AVC規格の背景において適用される。
ビデオ規格における細分性
「スケーラブル圧縮ビットストリーム」(「a scalable compressed bit−stream」)と呼ばれる細分性を確実にする手順により圧縮されたデータストリームは、幾つかの密接に絡み合った部分集合を含む。これらの各部分集合は(画像サイズに変化をもたらす)特定の空間分解能のための初期のビデオ・コンテンツ、(ビデオフレーム・ビットレートの変化をもたらす)時間分解能、又は(量子化パラメータの変化をもたらす)表示品位に関する解像度を表わす。これらの各部分集合は、それが含む情報の効果的な圧縮に対応すると想定される。図1は時間的細分性の一例を図式的に示す。
細分性の利点は多種多様である。細分性により各瞬間における伝送条件の再評価を必要とせずに、様々な要件又は容量を満足させることが可能である。特にエンコーダの視点から、利点は後で様々なビットレートで使用されるように一度圧縮できることであり、サービスの提供者の視点から、利点はリンクの帯域幅の容量に従って様々なビットレートに切り替え得る可能性にあり、そしてユーザーの視点から、利点はユーザーが現在の要件に適応させるために彼の要件と要求をリアルタイムで容易に変更できるという事実にある。現状の伝送ネットワークの、そして有り得る他のユーザー及び干渉の存在におけるチャンネル伝送条件のために、帯域幅及び利用できる有用なビットレートが急速に変化し得る無線通信の状況において、「細分性を提供する能力」は現在重要な特性になりつつある。
H.264/MPEG−4 AVC
ITU−Tのビデオコード化の専門家グループ(VCEG)のレベルでの研究は、特定の無線ネットワークとインターネットにおいて、その実施のために妥当な複雑さのレベルを提示し、そして究極的にネットワーク適用のために容易に使用できる一方で現存の解決法と比較してより効果的な圧縮を提供する能力がある、新たなビデオ規格を確立するために1999年に始められた。MPEGコンソーシアムはVCEGの専門家グループに、H.264又はMPEG−4 AVC(高度なビデオコード化)の名のもとに指定された共通の規格確立のためにパートナーシップの創設を提案した。ITU JVT−G050の文書の最終版はビデオコード化の局面のみを規定する。
現時点で、H.264規格の主な適用は以下の通りである。
・1Mb/s未満のビットレート及び少しの時間遅れを伴う(UMTSユニバーサル移動体通信システムのような)、例えば有線又は無線ネットワーク上のテレビ会議のようなリアルタイムの二重の音声サービスと、
・ビットレートが1〜8Mb/sの間にあり、時間遅れが大幅になることがある、衛星、xDLS、又はDVD放送の伝送(「ストリーミング」(「streaming」))用の良質及び高品質のビデオサービスと、
・(ビットレートが2Mb/s未満で、時間遅れが大幅になることがある)インターネット・アプリケーションのような低いビットレートを有するビデオサービス用の、低品質のストリーム。
図2はH.264規格により定義される三つのプロファイル及び、各プロファイル用に設定された主要なツールを表わす。:
・特にテレビ会議、IP上のビデオ、及び可動性の用途に適する基本プロファイル又はベースライン(Baseline)。それは単にI(イントラ)及びP(予測)フレーム又はセグメントと、少しのエラー保護ツールによるコード化を統合するだけである。
・テレビ放送とビデオ放送、及び大幅な時間遅れを伴う用途に適する「主要な」(「principal」)又はメインのプロファイル。それは特に(テレビ用途の)インターレースモード、Bフレーム、算術エントロピー・コード化を統合する。
・様々なチャンネル、特に無線チャンネル上の「ストリーミング」に合った「拡張」プロファイル又は「X」プロファイル。それは特にビットレートの適応解とエラー保護ツールを統合する。
H.264規格は有益で、他の良く知られた規格に置き換わることが出来るように見えるが、それは可変チャンネルの用途に使用されるとき、若干の主要な欠点を示す。それは時間的な細分性のためのメインプロファイル又は拡張プロファイルにおけるBフレームの可能な使用は別として、実際何ら「細分性」の能力を備えていない。
フレームのナンバリング及び復号化の順序
現在、H.264/MPEG−4 AVC規格におけるビデオフレームをナンバリングするために二つの解決法が存在する。
「フレームナンバー」(「frame number」/「numero de frame」)又は「frame_num」に依存する第一の解決法は、ストリームにおけるアクセスユニットの復号化の順序に対応する。このパラメータは画像セグメントの各ヘッダに基づき復号化され、該アクセスユニットの復号化の順に増加する。それは必ずしもデコーダが用いるであろう表示の最終順序を示さない。
第二の解決法は、デコーダにより使用されるであろう復号化されたフレーム(又はフィールド)の表示順序に対応する、画像出現番号又は「ピクチャ・オーダー・カウント」(「Picture Order Count」)に対する用語「POC」で慣習的に呼ばれている。それは次のようにして得られる。
− 各々のコード化されたフレームは、それぞれ「トップフィールド・オーダーカウント」(「topfieldordercnt」)及び「ボトムフィールド・オーダーカウント」(「bottomfieldordercnt」)と呼ばれる、トップフィールドの出現番号及びボトムフィールドの出現番号に相当する二つのPOCパラメータと関連付けられる。
− 各々のコード化されたフィールドは、トップフィールドに関して「topfieldordercnt」、及びボトムフィールドに関して「bottomfieldordercnt」と称される「POC」パラメータと関連付けられる。
二つのパラメータであるトップの出現番号「トップオーダーカウント」(「top order count」)と、ボトムの出現番号「ボトムオーダーカウント」(「bottom order count」)との間の差は、デフォルトではゼロに等しいパラメータ「delta_POC bottom」により与えられる。実際上、ノンインターレースモードによって、差のDelta_Poc_bottomはゼロに等しい。
現在のH.264規格は三つのタイプに関してPOCの値を得ることを可能にする。
− タイプ0:POCパラメータは各ヘッダ部へ明確に送られる。
− タイプ1:POCパラメータは復号化(frame_num)の順序及び、調整パラメータのシーケンスに表示された増分に依存し、差異は順序において予期された変化がない場合にのみ送られる。
− タイプ2:表示順序は復号化の順序と同じである。
本発明による方法は特にPOCパラメータの値を修正し、従ってタイプ0を用いる。
その他の二つのタイプ(1及び2)に関して、表示順序はフレーム番号又は「frame_num」によって直接的又は間接的に得られる。
標準の場合、タイプ0のパラメータTopFieldOrderCnt(TopFOC)は次のように得られる。
TopFieldOrderCount=POCMsb+POCLsb
ここで、文字Msbは最上位のビットに、文字Lsbは最下位のビットに相当し、POCLsbは画像のサブ部分又はセグメントの各ヘッダに送られ、そしてパラメータPOCMsbはPOCLsbがその最大値に達した時に増やされる。
POCの再配置により得られる表示順序の例示的配置結果は表1にて与えられる。
Figure 0004654244
複数参照及び離れた参照
単純な参照モードで使用された、すなわち出現の予測が与えられた前の画像を用いてのみ実施される、これ迄のビデオコード化規格と対照的に、H.264規格は各Pセグメント(又はPスライス)に対して最大32までの異なるフレームを参照として使用すること、及び各Bセグメント(又はBスライス)に対して最大64までの異なるフレームを使用することを可能にする。コード化及び復号化され、参照として利用できる画像は、復号化された画像(復号化されたピクチャ・バッファ(decoded picture buffer)の略であるDPB)を含むメモリ内に格納される。それらはPicOrderCountの関数として指標付けされた「短期画像参照」の表現としてより良く知られる、近い参照を有する画像として参照されるか、又は離れた参照画像カウンターであるLongTermPicNumの関数として指標付けされた「長期画像参照」としてより良く知られる、離れた参照を有する画像として参照される。DPBメモリが一杯のとき、近い参照を有する最も古い期間のみがメモリから除去される。「長期」参照はビットストリームにおける明確なコマンドは別として、除去されない。
本発明は少なくとも、
− 最も重要なフレームを規則正しく配置し、一方でそれらの間に間隔を置くステップと、
− 該間隔をより低い重要度のフレームで充たすステップと、
− こうして得られた新たなシーケンスをコード化するステップと
に適合したミキシングテーブルを利用するステップを含むことを特徴とする、ビデオシーケンスのフレーム又はピクチャ・グループGOPを形作る手順に関する。
本発明はとりわけH.264/MPEG−4 AVC規格に完全に適合しているという利点を与える。H.264規格は現在標準化されている機能性を適応させる必要なしに、提案された時間的細分性モードを用いることができ、定義された全てのプロファイル、特に基本プロファイルのためにそうすることができる。本発明を用いることにより、H.264エンコーダは「拡張性のないコードストリーム」(「non−scalable codestream」)の表現でより良く知られている、細分性を提供出来ないデータストリームと比較して、時間的細分性の性能を冗長性に関して低コスト又はコストなしで提供するであろう。
本発明の他の特徴及び利点は、図面と共に全く制限されない例証のために与えられた例に従う説明を読むことにより、より明らかになるであろう。
本発明はとりわけH.264規格により提案されているフレームのナンバリングにおいて、第一にデータを効率的にコード化し、第二にビデオシーケンスの洗練レベルに従ってデータを伝送する、二つのシステムの使用に依存する。本原理は特に、最も重要なフレーム(最も低いビットレートに関して復号化されるであろうフレーム)を規則正しい方法で再配置することによりフレームをミックスし、該最重要フレーム間の間隔をより低い重要度のフレーム(最も高いビットレートでのみ復号化されるであろうフレーム)で充たし、そしてこの新たなシーケンスをあたかもそれが従来のシーケンスであるかのようにコード化することから成る。このミックスモードは第一に時間的細分性及び、Bフレームを用いる必要なしに再帰的な予測を得ること、そして第二にシーケンスにおいて規則正しい方法で(最初のイントラフレームを含む)参照フレームを位置付けることを可能にする。フレーム同士はそれらの参照よりもシステム的に近いため、これは圧縮におけるゲイン及び、マスキング(又は「隠すこと」(「concealment」))の場合の視覚的復元(又は「レンダリング」(「rendering」))におけるゲインをもたらすことが可能である。
フレームの再配置を通じた時間的細分性
上述のように、時間的細分性を有するビデオコード化・アルゴリズムは、初期のバイナリストリームに基づく様々な時間分解能を有するシーケンスのビデオデコーダによる抽出を可能にする。そのような「細分性」を可能にするため、図1でピクチャ・グループ又はGOPに例示されるように、各々がビデオシーケンスの残りと無関係なグループとして復号化されることのできる、連続的なフレームの番号に対応する幾つかの重要度レベルが定義される。
図1において、低いビットレートのデータストリームを有する基本レベル、三つの中間的ビットレートのフレーム又は画像を有する第一の洗練レベル、及び高いビットレートのフレームに対する第二の洗練レベルの三段階の重要度レベルが表わされている。
時間的細分性は、このようにGOPの部分集合のより大きいか又はより小さい番号を復号化することにより得られる。実際に、可変の重要度レベルが時間にわたって等しいか又は実質的に等しい方法で分布している場合、自然な時間的細分性は画像のビットレートが、復号化された部分集合の数と関連付けられることをもたらす。
本発明による方法は、特に出来る限り規則正しく分布するような方法でピクチャ・グループGOP内のフレームを再配置することにより、先験的に細分性を得ることが出来ない手順に従ってコード化されたデータストリーム(「先験的ノンスケーラブル・コードストリーム」(「a priori nonscalable codestream」))のために時間的細分性の特性を導入することにある。(最も低いビットレートの復号化されたフレームに相当するであろう)最も重要なフレームは、(時間的な意味で)規則正しくフレーム内に分配される。従ってこれらのフレームの間に形成されるスペースはより低い重要度のフレームを受ける。より低い重要度と呼ばれるフレームは様々な洗練レベルにあるフレームに対応する。「重要度レベル」(「importance level」)の表現は、ここで例えば(特により高い量子化パラメータに相当する)、より低いレベルの精度でコード化されることができるフレームを意味するために指定される。
このように再編成されたシーケンスは後で、例えばH.264/MPEG−4 AVCタイプのエンコーダにより従来の方法でコード化され、その後同じ規格のデコーダにより復号化されることが可能である。
可能な規則正しい分布は、ピクチャ・グループの中央でのイントラフレーム又はIフレームの位置決め、及びその他の予測されるフレーム又はPフレームの規則正しい分布に相当し得る。
全体的又は準全体的な互換性は、エンコーダが復号化の初期オーダーをPOC値として用いるように強制することによりデコーダ側で得られる。
本発明による手順の様々な実施用変形の実行が可能であり、その中の三つが全く無制限の例示によって与えられている。それらは図式的に図3、4及び5において示される。
図3はフレームを再配置する操作が、H.264エンコーダ2の前にあるインターレース手段Π又は1の助けにより、直接ビデオシーケンスに適用される変形を示す。例えば、この図においてグループは1、2、3、4、5、6、及び7(シーケンスS1)と番号を付けられた7つの画像を含み、それらはインターレースの第一ステップの後で、図中の再ナンバリングA、B、C、D、E、F、Gに対応する、シーケンスS2=4、2、6、1、3、5、及び7へと再編成されている。H.264エンコーダはこのシーケンスS2を例えばイントラフレームAとして捉え、そしてその他の六つをB、...、Gに対応するPフレームを用いて予測することによりコード化する。該エンコーダはまたPOCフィールド内への正しい復号化順序の挿入を可能にするため、該再配置又は使用されるインターレース・テーブルから情報を受け取る。伝送チャンネル4を経由して伝送されるH.264コードストリームは規格に完全に適合し、H.264/MPEG−4−AVC規格に適合したあらゆるデコーダ3により直接復号化される。このバージョンはエンコーダの軽微な変更により、H.264デコーダを用いて直接実施される利点を有する。
図4はフレームを再配置する操作が、シーケンスS2=4、2、6、1、3、5、及び7を生じさせるために、インターレース手段5を用いてビデオシーケンスS1=1、2、3、4、5、6、及び7に直接適用される、別の変形の実施形態を表わす。該シーケンスS2は通常の動作中には変更されない、例えばH.264タイプのビデオエンコーダ6によりコード化される。コード化されたストリームS’2はその後にチャンネル4により伝送され、標準のあらゆるビデオデコーダ7によって復号化される。復号化の後、該シーケンスは初期シーケンスS1を検索するためにインターレース解除手段8を通過する。この実施用の変形は如何なるビデオエンコーダにも適用できる利点を有するが、しかしインターレース装置及びインターレース解除装置の挿入による送信者側及び受信者側の変更を必要とする欠点を有する。
図5はフレームを再配置する操作が、インターレース作業を実施するために適応し、そして利用されるミキシングテーブルを知っている、変更されたエンコーダ9の中でコード化されるビデオシーケンスに対して行なわれる、別の変形の実施形態を図式的に表わす。このように変更されたH.264エンコーダは、ビデオシーケンスS1のコード化を行なう。コード化作業の間、ミキシングテーブルにより定められた順序に従って、復号化の初期順序がPOCフィールド内へと挿入される。コード化されたシーケンスは、データを初期の順序に戻すために伝送されたビデオシーケンスのPOCフィールド内に含まれる情報を使用するであろう、H.264/MPEG−4−AVC規格に適合したあらゆるデコーダ10により復号化される前に、伝送チャンネルによる伝送の後で受信される。この変形はビデオソース及びビデオデコーダに関して透過性が高く、ピクチャ・グループのレベルにおいてインターレース作業を行なうために適応可能な、あらゆるH.264タイプのエンコーダに適用可能であるという利点を提供する。
図6は初期の時間的参照{1、2、3、4、5、6、7}により指定された七つのフレームを含むピクチャ・グループ又はGOPに関する例示的実施を表わす。ミキシング操作の原理は採用されたコード化方法が有効であるように、適切な方法で該フレームを分布させることである。実際的に、与えられたフレームTdに先行する全てのフレームTiが、この考慮されたフレームのための参照として使用できると考えることにより、例えばGOPの中央で(イントラ・コード化される必要がある)最初の参照画像を用いて、規則正しい方法でフレームを再配置するためのチャートを作ることは利点である。第二の参照レベルはその後に、イントラフレームのいずれかの側で二つのサブフレームの中央に置かれ、以下同様である。
このように、最初にコード化されたフレームは必然的にI又はイントラフレームに対応するが、ピクチャ・グループの最初のフレームは必ずしもそうではない。
最も重要なフレーム(第一重要度レベル)について、GOPの初期順序における予測フレームと参照フレームの間の分離は、より大きいことがあるため、コード化の有効性は最適ではない。これは最も遅れたフレーム同士はイントラフレームにより近いため(参照フレームと予測されたフレームを隔てている距離の減少)、それらはより良い圧縮のレベルを提供すべきであるという事実によって補償されることが可能である。イントラフレームを最初の復号化された画像として絶対的に使用したい場合、図7によるフレームの再配置は容易に採用されることができる。
図8は七つのフレーム・グループに対して、従来技術による方法(点線のカーブ)、及び本発明による方法の実施(実線のカーブ)により得られた全体の視覚効率に関する性能の例を表わす。これらの結果は七つのフレームのピクチャ・グループに関する、視覚効率又はPSNR(ピーク信号対雑音比)の客観的な測定結果の変遷についての検討に相当する。考慮された画像は、64kbits/sの目標総合ビットレートを有する15フレーム/sのリフレッシュ速度を伴う、ITU−Tにより提供された「フォアマン」(‘Foreman’)参照シーケンスである。第一の場合に(点線のカーブ)我々は七つのフレームに対し、イントラフレームに関して31に等しく、予測されたフレームに関して34に等しく、それによって63.98kbits/sの最終ビットレートを与える、量子化パラメータQPを有するIPPPPPPの順序に相当する、従来のH.264コード化/復号化により得られたPSNRの発展を見出した。第二の曲線(実線)は七つのフレームに対し、図6に与えられるミキシングテーブルに従って本発明の適用により得られたPSNRの発展を示す。三つのレベルがそれぞれ次の量子化パラメータ:第一レベル(Iフレーム)に対するQP=31、洗練レベル1(Pフレーム)に対するQP=33、及び63.03kbits/sの最終ビットレートを得ることを可能にした洗練レベル2に対するQP=38を用いてコード化されている。想定されるように、この第二の曲線に対して、三つの最も重要なフレームが(第二洗練レベルに相当する)その他四つのフレームよりも良好なPSNRの値を有し、しかしまた、一方で僅かにより大きなビットレートを有する、従来シーケンスのPSNR33.42dBに対して、この第二のシーケンスは33.54dBの平均PSNRを与えるため、これはシーケンスの平均PSNRの低均化なしに得られるということが観察される。本発明に説明されているこの方法は、従ってビットレートに関しても、あるいは表示品位の低下に関しても、費用なしに(又はそのうえ利益を伴って)時間的な細分性を提供する。
図9は様々なサイズのピクチャ・グループ又はGOPのための手順の一般化を表わす。実際には、該手順を以下の方法で実施することが可能である。
− 第一の参照イントラフレームをピクチャ・グループ又はGOPの中央として選び、そして幾つかのフレームを含む残り部分をサブのピクチャ・グループ又はサブGOPとして選ぶ方法と、
− 各サブGOPに関して、次のステップを繰り返す方法:
サブのピクチャ・グループGOPの中央を参照フレームとして取り、そして残った二つのサブピクチャ・グループを残り部分として定義する。ピクチャ・グループの中央は、例えば(GOPのサイズ+1)/2の値の整数部分に基づいて定義され、すなわち(GOPのサイズ+1)/2に等しいか、又は最も近いそれ未満の整数として定義される。
図9は15フレームのピクチャ・グループに対する例を与え、図10は12フレームのピクチャ・グループに対する例を与える。
本発明の範囲から逸脱することなく、このアプローチを一般化させ、そして2とは異なるnの値によって、各洗練レベルの間の効率の分割に対応するミキシングチャートを定義することができる。これは第一のイントラフレームをピクチャ・グループの中央以外の位置に置くことをもたらす。この場合、我々はこれらn−1の画像の一つのIフレーム(例えば第一)、及び予測された画像に相当する残りを持つ、規則正しく分配されたn−1の画像を伴うであろう第一レベルを有する。第一の拡張性レベルにおいて現れるこれらn−2の予測された画像は、Iフレームと同じ重要度レベルを有する(それらは「最も重要なフレーム」(「frames of the highest importance」/「trames d’importance la plus elevee」)の部分を形成する)。我々はこのように各レベルにおけるフレームの参照フレーム数がn−1に等しく選ばれ、平均値mi=E〔i(GOPのサイズ+1)/n〕(ここでi=1、...、n−1)の整数部分に導くレベルのために進める。
図10は各レベル間の目標効率の分割n=3のための例を表わす。
例において、第一のフレーム(7−A)はイントラフレームであり、その他の19フレームはP型の予測されたフレームである。
本発明による手順は、例えば次の用途において使用できる。
− ビデオデコーダが、それが受け取り、より低いビットレートを伴う低下したバージョンのみを与えるように選択する、コードストリームを十分なビットレートで復号化することが出来ない場合。
− エンコーダが、初期に利用できるその帯域幅が減少し、本発明による構造のおかげで最も重要度が低いことが判明した最後の画像の幾つかを犠牲にするか、又はこれらの最後の画像の表示品位を低くすることによって、それが相応に作用しなければならないという情報を与えられる場合。
時間的な細分性の例証である。 H.264規格の現行の構成である。 本方法の実施における変形である。 本方法の実施における変形である。 本方法の実施における変形である。 七つのフレームを含むピクチャ・グループの場合の例である。 七つのフレームを含むピクチャ・グループの場合の例である。 従来技術又は本発明による方法で得られる視覚効率の比較である。 異なるサイズのピクチャ・グループに対する手順の適用例である。 異なるサイズのピクチャ・グループに対する手順の適用例である。 異なるサイズのピクチャ・グループに対する手順の適用例である。

Claims (12)

  1. ビデオシーケンスのピクチャ・グループおよびフレームをその伝送及び復号化の前に形成する手順であって、
    前記手順は、
    ミキシングステップと、
    エンコードステップとからなり、
    前記ミキシングステップは、さらに、
    一つのイントラフレーム(Iフレーム)とIフレームに基づいて予測されるN−1個の参照フレームとが、その再生時の時間的細分が等間隔となる位置に配置されるように構成される総フレーム数がNのピクチャ・ループ(GOP) の各フレームに、重要度の高いフレームほどより低いビットレートで復号化されるべく所定数m段階(mは、1、2、3・・・)の洗練レベルのいずれかをフレームの重要度に応じて設定する際、
    当該GOPの先頭から、
    PLmi=平均値E〔n(GOPに属する総フレーム数+1)/D〕(Dは2以上の任意の整数、nは1から...D−1迄の各自然数の値をそれぞれ取る)の整数部分の値F(PLmi)番目の位置に対応する(D−1)個のフレームを、
    最も高いレベルの洗練レベルLmのフレームとして設定するとともに、Dが3以上であることにより同一洗練レベルのフレームが複数設定される場合は、同一の洗練レベルにおいてその再生時の出現順序がより早い位置にあるフレームを他のフレームよりも優先順位が高いフレームであると設定する洗練レベル決定ステップと、
    前記洗練レベル決定ステップにおいて前記F(PLmi)番目の位置に対応するフレームで前記GOPがD分割されることにより、洗練レベルが未設定のD個にグループ化されたフレーム郡それぞれをサブGOPとして新たに再設定し、該再設定されたサブGOPそれぞれに対して、その出現が早い位置にあるサブGOPから順に、上記洗練レベル決定ステップにて示した前記GOPを当該サブGOPに置き換えて、前記洗練レベルLmの次に重要な第(m+1)番目の洗練レベルL(m+1)となるD−1個のフレームの設定、および、その優先順位を前記洗練レベル決定ステップと同様に、順次設定するサブGOP設定ステップと、
    前記サブGOP設定ステップにおいて新たに設定されたサブGOPに属するフレームの数が、D−1個以下になるまでは、前記サブGOP設定ステップによるさらなる新たなサブGOPへの細分化および当該細分化されるサブGOPにおいて次なる洗練レベルのフレームの設定および該次なる洗練レベルが設定されたフレームの優先順位の設定を繰り返して実行するサブGOP細分化ステップと、
    前記各フレームに設定された重要度レベルおよび前記優先順位をミキシングテーブルに記録する重要度レベル登録ステップと、
    前記ミキシングテーブルに記録された前記重要度の高いフレームから低いフレームの順で、かつ、前記優先順位が高い順で、前記ピクチャ・グループ内の各フレームの並びを前記ピクチャ・グループ内にて再配置した再配置ビデオシーケンスでのフレームの復号化順序を前記ミキシングテーブルに記録する再配置ステップと、
    前記エンコードステップは、
    前記再配置ビデオシーケンスを所定のビデオエンコード規格にてエンコードするエンコードステップと
    からなる手順。
  2. 前記ミキシングステップは、前記エンコードステップの前にて行なわれ、
    前記ミキシングテーブルを参照して前記ピクチャ・グループ内における前記フレーム毎の復号化の順序を示す情報を前記フレーム内に挿入する
    ことを特徴とする請求項1に記載の手順。
  3. 前記ミキシングステップは、
    前記エンコードステップの前にて行なわれ
    前記エンコードステップにより、前記再配置ビデオシーケンスがエンコードされたデータストリームがビデオデコーダに伝送される伝送ステップと、
    前記伝送ステップにて伝送された前記データストリームが前記ビデオデコーダにてデコードされるデコードステップと、
    前記デコードステップにてデコードされた前記デコードデータをインターレース解除装置に伝送し、再生時における前記フレームの出現順にて再配置された初期のビデオシーケンスを取得する初期シーケンス取得ステップと
    からなる請求項1に記載の手順。
  4. 前記ミキシングステップおよび前記エンコードステップが同時に行なわれる
    ことを特徴とする請求項1に記載の手順。
  5. 前記ミキシングステップは、
    再生順における時間的細分が等間隔となる位置に各フレームが配置された前記ピクチャ・グループにおいて、
    (前記ピクチャ・グループに属するフレームの総数+1)/2の値の整数部分の値の位置にある中央のフレームを重要度が最も高いフレームであるイントラフレームとし、前記ピクチャ・グループの残りのフレームを前記イントラフレームに対する参照フレームとして選択するとともに、前記ピクチャ・グループの残りのフレームを前記中央のフレームを境に分割された残りの新たなサブグループのピクチャ・グループとしてそれぞれ新たに定義する選択ステップと、
    前記各サブグループのピクチャ・グループそれぞれに対し、
    (前記サブグループに属するフレームの総数+1)/2の値の整数部分の値の位置にあるフレームを、前記中央フレームよりも重要度が低い新たな中央フレームとして決定し、前記各サブグループを前記決定した新たな中央フレームを境に分割される残りの新たな2つのサブグループのピクチャ・グループとして新たに再定義するサブグループ再定義ステップを、
    前記サブグループ再定義ステップにて新たに再定義されたサブグループがさらに分割できなくなるまで繰り返す繰り返しステップと
    を含む
    ことを特徴とする請求項1に記載の手順。
  6. 前記エンコードステップ、又は、前記デコードステップによる復号化は、H.264/MPEG−4 AVC規格に対応する
    請求項1に記載の手順。
  7. 一つのイントラフレーム(Iフレーム)とIフレームに基づいて予測されるN−1個の参照フレームとが、その再生時の時間的細分が等間隔となる位置に配置されるように構成される総フレーム数がNのピクチャ・ループ(GOP) の各フレームに、重要度の高いフレームほどより低いビットレートで復号化されるべくm段階(mは、1、2、3・・・)の洗練レベルのいずれかをフレームの重要度に応じて設定する際、
    当該GOPの先頭から、
    PLmi=平均値E〔n(GOPに属する総フレーム数+1)/D〕(Dは2以上の任意の整数、nは1から...D−1迄の各自然数の値をそれぞれ取る)の整数部分の値F(PLmi)番目の位置に対応する(D−1)個のフレームを、
    最も高いレベルの洗練レベルLmのフレームとして設定するとともに、Dが3以上であることにより同一洗練レベルのフレームが複数設定される場合は、同一の洗練レベルにおいてその再生時の出現順序がより早い位置にあるフレームを他のフレームよりも優先順位が高いフレームであると設定し、
    前記F(PLmi)番目の位置に対応するフレームで前記GOPがD分割されることにより、洗練レベルが未設定のD個にグループ化されたフレーム郡それぞれをサブGOPとして新たに再設定し、該再設定されたサブGOPそれぞれに対して、その出現位置が早いサブGOPから順に、前記GOPを当該サブGOPに置き換えて、前記洗練レベルLmの次に重要な第(m+1)番目の洗練レベルL(m+1)のD−1個のフレームの設定、および、その優先順位を同様に順次設定し、
    前記新たに設定されたサブGOPに属するフレームの数が、D−1個以下になるまでは、前記サブGOP設定ステップによるさらなる新たなサブGOPへの細分化および当該細分化されるサブGOPにおいて次なる洗練レベルのフレームの設定および該次なる洗練レベルが設定されたフレームの優先順位の設定を繰り返して実行し、
    前記各フレームに設定された重要度レベルおよび前記優先順位をミキシングテーブルに記録し、
    前記ミキシングテーブルに記録された前記重要度の高いフレームから低いフレームの順で、かつ、前記優先順位が高い順で、前記ピクチャ・グループ内の各フレームの並びを前記ピクチャ・グループ内にて再配置した再配置ビデオシーケンスでのフレームの復号化順序を前記ミキシングテーブルに記録するインターレーサ(5)
    と、
    前記インターレーサ(5)にて作成された前記再配置ビデオシーケンスをエンコードするビデオエンコーダ(6)と
    を少なくとも具備する
    ビデオシーケンスのピクチャ・グループおよびフレームをその伝送及び復号化の前に形成する装置。
  8. 一つのイントラフレーム(Iフレーム)とIフレームに基づいて予測されるN−1個の参照フレームとが、その再生時の時間的細分が等間隔となる位置に配置されるように構成される総フレーム数がNのピクチャ・ループ(GOP) の各フレームに、重要度の高いフレームほどより低いビットレートで復号化されるべくm段階(mは、1、2、3・・・)の洗練レベルのいずれかをフレームの重要度に応じて設定する際、
    当該GOPの先頭から、
    PLmi=平均値E〔n(GOPに属する総フレーム数+1)/D〕(Dは2以上の任意の整数、nは1から...D−1迄の各自然数の値をそれぞれ取る)の整数部分の値F(PLmi)番目の位置に対応する(D−1)個のフレームを、
    最も高いレベルの洗練レベルLmのフレームとして設定するとともに、Dが3以上であることにより同一洗練レベルのフレームが複数設定される場合は、同一の洗練レベルにおいてその再生時の出現順序がより早い位置にあるフレームを他のフレームよりも優先順位が高いフレームであると設定し、
    前記F(PLmi)番目の位置に対応するフレームで前記GOPがD分割されることにより、洗練レベルが未設定のD個にグループ化されたフレーム郡それぞれをサブGOPとして新たに再設定し、該再設定されたサブGOPそれぞれに対して、その出現位置が早いサブGOPから順に、上記前記GOPを当該サブGOPに置き換えて、前記洗練レベルLmの次に重要な第(m+1)番目の洗練レベルL(m+1)のD−1個のフレームの設定、および、その優先順位を同様に、順次設定し、
    前記新たに設定されたサブGOPに属するフレームの数が、D個以上である限りは、前記サブGOP設定ステップによるさらなる新たなサブGOPへの細分化および当該細分化されるサブGOPにおいて次なる洗練レベルのフレームの設定および該次なる洗練レベルが設定されたフレームの優先順位の設定を繰り返して実行し、
    前記各フレームに設定された重要度レベルおよび前記優先順位をミキシングテーブルに記録し、
    前記ミキシングテーブルに記録された前記重要度の高いフレームから低いフレームの順で、かつ、前記優先順位が高い順で、前記ピクチャ・グループ内の各フレームの並びを前記ピクチャ・グループ内にて再配置した再配置ビデオシーケンスでのフレームの復号化順序を前記ミキシングテーブルに記録するインターレーサ(1)と、
    前記インターレーサにて配置された各フレームの復号化時のビットレートの低い順におよびフレームの再生順にて復号化されるよう前記各フレーム内に復号化の順序を挿入してエンコードするエンコーダ(2)と
    を少なくとも具備する
    ビデオシーケンスのピクチャ・グループおよびフレームをその伝送及び復号化の前に形成する装置。
  9. 前記請求項8のビデオシーケンスのピクチャ・グループおよびフレームをその伝送及び復号化の前に形成する装置と、
    前記フレーム内に挿入されたピクチャ・グループにおける復号化の順序にて前記フレームを復号化するビデオデコーダ(3)とを
    具備する
    ことを特徴とするコード化/復号化装置。
  10. 請求項8のビデオシーケンスのピクチャ・グループおよびフレームをその伝送及び復号化の前に形成する装置と、
    前記装置からチャンネルを介して伝送されたデータストリームを復号化するビデオデコーダ(7)と、
    前記ビデオデコーダ(7)にて復号化されたデコードデータにおけるフレームの配置をフレームの再生順序に再配置するインターレース解除装置(8)と
    をさらに具備する
    ことを特徴とする請求項9記載のコード化/復号化装置。
  11. 前記ビデオシーケンスのピクチャ・グループおよびフレームをその伝送及び復号化の前に形成する装置は、
    前記復号化の順序を各フレームに挿入する
    前記請求項7に記載のビデオシーケンスのピクチャ・グループおよびフレームをその伝送及び復号化の前に形成する装置。
  12. 前記エンコーダあるいは前記デコーダは、
    H.264/MPEG−4 AVC規格に対応する
    ことを特徴とする請求項7及至11のいずれか一項に記載の装置。
JP2007525299A 2004-08-10 2005-08-09 ビデオシーケンスのフレームを形成する方法 Expired - Fee Related JP4654244B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0408802A FR2874292B1 (fr) 2004-08-10 2004-08-10 Procede de mise en forme de trames d'une sequence video
PCT/EP2005/053911 WO2006015979A1 (fr) 2004-08-10 2005-08-09 Procede de mise en forme de trames d'une sequence video

Publications (2)

Publication Number Publication Date
JP2008509617A JP2008509617A (ja) 2008-03-27
JP4654244B2 true JP4654244B2 (ja) 2011-03-16

Family

ID=34951401

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007525299A Expired - Fee Related JP4654244B2 (ja) 2004-08-10 2005-08-09 ビデオシーケンスのフレームを形成する方法

Country Status (5)

Country Link
US (1) US8284846B2 (ja)
EP (1) EP1779669A1 (ja)
JP (1) JP4654244B2 (ja)
FR (1) FR2874292B1 (ja)
WO (1) WO2006015979A1 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102006057983A1 (de) * 2006-12-08 2008-06-12 Siemens Ag Verfahren zur Vidoecodierung einer Folge digitalisierter Bilder
US8385404B2 (en) 2008-09-11 2013-02-26 Google Inc. System and method for video encoding using constructed reference frame
US8638854B1 (en) 2011-04-07 2014-01-28 Google Inc. Apparatus and method for creating an alternate reference frame for video compression using maximal differences
WO2012178008A1 (en) * 2011-06-22 2012-12-27 General Instrument Corporation Construction of combined list using temporal distance
PL3229474T3 (pl) * 2011-06-30 2019-05-31 Ericsson Telefon Ab L M Sygnalizacja obrazu referencyjnego
US9432665B2 (en) 2011-12-02 2016-08-30 Qualcomm Incorporated Coding least significant bits of picture order count values identifying long-term reference pictures
US9609341B1 (en) 2012-04-23 2017-03-28 Google Inc. Video data encoding and decoding using reference picture lists
US9426459B2 (en) 2012-04-23 2016-08-23 Google Inc. Managing multi-reference picture buffers and identifiers to facilitate video data coding
US9319679B2 (en) * 2012-06-07 2016-04-19 Qualcomm Incorporated Signaling data for long term reference pictures for video coding
US9332255B2 (en) 2012-06-28 2016-05-03 Qualcomm Incorporated Signaling long-term reference pictures for video coding
US9928159B2 (en) 2013-02-26 2018-03-27 Qualcomm Incorporated System and method to select a packet format based on a number of executed threads
US9756331B1 (en) 2013-06-17 2017-09-05 Google Inc. Advance coded reference prediction
KR20150033162A (ko) * 2013-09-23 2015-04-01 삼성전자주식회사 컴포지터, 이를 포함하는 시스템온칩 및 이의 구동 방법
WO2020159994A1 (en) * 2019-01-28 2020-08-06 Op Solutions, Llc Online and offline selection of extended long term reference picture retention

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02200084A (ja) * 1989-01-30 1990-08-08 Victor Co Of Japan Ltd 高能率符号化方式
JP2858631B2 (ja) * 1994-06-29 1999-02-17 日本ビクター株式会社 画像データ編集装置及び画像データ復号装置
JP3318707B2 (ja) * 1996-11-08 2002-08-26 ソニー株式会社 画像信号符号化装置および画像信号符号化方法、画像信号復号装置および画像信号復号方法、画像信号伝送方法、並びに画像信号記録媒体
JP2004088722A (ja) * 2002-03-04 2004-03-18 Matsushita Electric Ind Co Ltd 動画像符号化方法および動画像復号化方法
TWI249356B (en) * 2002-11-06 2006-02-11 Nokia Corp Picture buffering for prediction references and display
US9084010B2 (en) * 2002-11-15 2015-07-14 Thomson Licensing Method and system for staggered statistical multiplexing
US20050254575A1 (en) * 2004-05-12 2005-11-17 Nokia Corporation Multiple interoperability points for scalable media coding and transmission

Also Published As

Publication number Publication date
FR2874292B1 (fr) 2007-01-26
EP1779669A1 (fr) 2007-05-02
WO2006015979A1 (fr) 2006-02-16
FR2874292A1 (fr) 2006-02-17
JP2008509617A (ja) 2008-03-27
US8284846B2 (en) 2012-10-09
US20090052550A1 (en) 2009-02-26

Similar Documents

Publication Publication Date Title
RU2326505C2 (ru) Способ кодирования последовательностей картинок
KR101454495B1 (ko) 공간 및 비트 심도 예측을 위하여 적응적 예측 순서를 이용하여 비디오 데이터를 인코딩 및/또는 디코딩하기 위한 방법 및 장치
US7961786B2 (en) Signaling field type information
RU2452128C2 (ru) Адаптивное кодирование информации заголовка видеоблока
US6895052B2 (en) Coded signal separating and merging apparatus, method and computer program product
US8081678B2 (en) Picture coding method and picture decoding method
US20050094726A1 (en) System for encoding video data and system for decoding video data
US6025888A (en) Method and apparatus for improved error recovery in video transmission over wireless channels
US9924179B2 (en) Method and apparatus for coding multilayer video, method and apparatus for decoding multilayer video
JP4654244B2 (ja) ビデオシーケンスのフレームを形成する方法
EP1553779A1 (en) Data reduction of video streams by selection of frames and partial deletion of transform coefficients
HUP0402623A2 (hu) Eljárás videokódolásra, kép videodekódolására, videokódoló, videodekódoló, számítógépes programtermék, valamint videojel
US20060072667A1 (en) Transcoder for a variable length coded data stream
CN102106147A (zh) 动态图像编码方法以及动态图像编码装置
Dominguez et al. The H. 264 video coding standard
JP2000253403A (ja) 画像符号化方式変換装置及び画像通信システム
US20090279599A1 (en) Device and Method for Coding and Decoding Video Data and Data Train
US8422810B2 (en) Method of redundant picture coding using polyphase downsampling and the codec using the method
Bjelopera et al. Scalable video coding extension of H. 264/AVC
SECTOR et al. Information technology–Generic coding of moving pictures and associated audio information: Video
Igarta A study of MPEG-2 and H. 264 video coding
Wang et al. Error-robust inter/intra macroblock mode selection using isolated regions
Mazataud et al. A practical survey of H. 264 capabilities
US20150085915A1 (en) Method and system for automatically encoding video with uniform throughput
WO2002096115A1 (en) A fine granularity scalability scheme

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080728

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090210

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090511

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090527

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090609

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100713

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20101008

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20101018

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101112

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101207

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101220

R150 Certificate of patent or registration of utility model

Ref document number: 4654244

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131224

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees