[go: up one dir, main page]

JP2010505354A - 効果的なレート制御および拡張したビデオ符号化品質のためのρ領域フレームレベルビット割り当てのための方法 - Google Patents

効果的なレート制御および拡張したビデオ符号化品質のためのρ領域フレームレベルビット割り当てのための方法 Download PDF

Info

Publication number
JP2010505354A
JP2010505354A JP2009530426A JP2009530426A JP2010505354A JP 2010505354 A JP2010505354 A JP 2010505354A JP 2009530426 A JP2009530426 A JP 2009530426A JP 2009530426 A JP2009530426 A JP 2009530426A JP 2010505354 A JP2010505354 A JP 2010505354A
Authority
JP
Japan
Prior art keywords
frame
bit rate
frames
encoding
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009530426A
Other languages
English (en)
Other versions
JP5087627B2 (ja
Inventor
ホワ ヤン
マクドナルド ボイス ジル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2010505354A publication Critical patent/JP2010505354A/ja
Application granted granted Critical
Publication of JP5087627B2 publication Critical patent/JP5087627B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/114Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

目標ビットレートでグループオブピクチャを符号化するための方法が特許請求される。事前解析手順(105)が、一連のパラメータを作り出すために、グループオブピクチャ内の各フレームについて実行される。次に、事前処理手順が、前記グループオブピクチャ(115)から選択されたフレームについて実行され、その結果、選択されたフレームに関連するパラメータが更新されるが、グループオブピクチャからの未符号化フレームに関連するパラメータは同じままである。次に、これら2つの組のパラメータは、フレームが実際に符号化される場合に、割り当てビットレートが符号化操作のために確保されるように、フレームのための割り当てビットレートを決定するために使用される(125)。割り当てビットレートとグループオブピクチャのための目標ビットレートとは、異なってよく、割り当てビットレートに関連する量子化レベルは、フレームを符号化するために使用される実際のビットレートに関連する量子化レベルと異なってよい。

Description

関連出願の相互参照
本出願は、参照によりその全体が本明細書に組み込まれる、2007年9月28日に出願された、米国特許仮出願第60/848,254号の利益を主張する。
本原理は、一般に、ビデオ符号化に関し、より詳細には、指定された平均ビットレートを満たすようにビデオを符号化するための方法および装置に関する。
ビデオ符号化システムでは、レート制御は、良好な全体的ビデオ符号化性能を引き出すうえで、重要な役割を演じる。実際には、異なるアプリケーションシナリオは、異なるタイプのレート制御問題を引き起こすことがあり、それらは、固定ビットレート(CBR:constant bit rate)または可変ビットレート(VBR:variable bit rate)レート制御に大きく分類することができる。ビデオオンデマンド、ビデオ放送、ビデオ会議、およびビデオ電話などの、リアルタイムのビデオオーバーネットワークアプリケーションでは、制限されたチャネル帯域幅のため、入力ビデオ信号は、通常は一定の平均ビットレートで符号化されなければならず、したがって、CBRレート制御が必要とされる。他方、例えば、ホームビデオまたは映画をDVDに圧縮するなど、様々なオフラインビデオ圧縮アプリケーションの場合、唯一の制限は全体的な記憶空間であるので、厳格な固定ビットレート制限は存在しない。この場合、CBR符号化ほど難しいレート制御課題を課さないVBR符号化が許容される。
実際のビデオストリーミングシステムでは、フレーム間のビットレート変動と、可変伝送遅延とを吸収し、ひいては、復号ビデオ信号の平滑で連続的なプレイアウトを保証するために、デコーダ側でバッファリングが必要である。異なるフレーム間でビットレート変動が大きすぎる場合、バッファは、アンダーフローまたはオーバーフロー状態になることがある。いずれの場合も、連続的で平滑なビデオのプレイアウトは、もはや維持できない。したがって、良好なCBRレート制御スキームの目的は主に、(i)平均目標ビットレートを達成すること、(ii)バッファ制約を満たすこと、(iii)一貫したビデオ品質を維持すること、の3つである。これらの中でも、最初の2つの目的が、システムにとってより緊要であり、したがって、一般に実施においてより高い優先順位を与えられる。
ビデオストリーミングアプリケーションは、遅延依存(delay-sensitive)または遅延非依存(delay-insensitive)にさらに分類することができる。例えば、ビデオ会議またはビデオ電話などの、対話型双方向ストリーミングアプリケーションは、(通常は数百ミリ秒より短い)非常に厳格な遅延要件を有し、したがって、小さなサイズのデコーダバッファをもたらす。この場合、平均ビットレートを達成し、バッファ制約を満たした後は、一貫した符号化ビデオ品質のための非常に制限された範囲が存在する。他方、例えば、ビデオオンデマンドまたはビデオ放送などの、一方向ストリーミングアプリケーションでは、数秒または数十秒の遅延が通常は許容可能であり、大きなサイズのバッファが利用できる。
米国特許出願第2007/01848号明細書
Z. He, Y. Kim, and S. K. Mitra, "Object-level bit allocation and scalable rate control for MPEG-4 video coding," Proc. Workshop and Exhibition on MPEG-4, pp. 63-6, San Jose, CA, June 2001 B. Xie and W. Zeng, "A sequence-based rate control framework for constant quality video," IEEE Trans. Circuits Syst. Video Technol., vol. 16, no. 1, pp.56-71, Jan. 2006 I.-M. Pao and M.-T. Sun, "Encoding stored video for streaming applications," IEEE Trans. Circuits Syst. Video Technol, vol. 11, no. 2, pp.199-209, Feb. 2001 P. H. Westerink, R. Rajagopalan, and C. A. Gonzales, "Two-pass MPEG-2 variable-bit-rate encoding," IBM J. Res. Develop., vol. 43, no. 4, pp. 471-488, Jul. 1999 L.-J. Lin and A. Ortega, "Bit-rate control using piecewise approximated rate-distortion characteristics," IEEE Trans. Circuits Syst. Video Technol., vol.8, no.4, pp.446-59, Aug. 1998 Y. Yue, J. Zhou, Y. Wang, and C. W. Chen, "A novel two-pass VBR coding algorithm for fixed size storage applications," IEEE Trans. Circuits Syst. Video Technol, vol. 11, no. 3, pp.345-36, Mar. 2001 J. Cai, Z. He, and C. W. Chen, "Optimal bit allocation for low bit rate video streaming applications," Proc. ICIP 2002, vol. 1, pp. 22-5, Sept. 2002 N. Kamaci, Y. Altunbasak, and R. M. Mersereau, "Frame bit allocation for the H.264/AVC video coder via Cauchy-density-based rate and distortion models," IEEE Trans. Circuits Syst. Video Technol., vol. 15, no. 8, pp.994-1006, Aug. 2005 A. Ortega, K. Ramchandran, and M. Vetterli, "Optimal trellis-based buffered compression and fast approximations," IEEE Tran. Image Processing, vol. 3, no. 1, pp. 26-40, Jan. 1994 Y. Sermadevi and S. Hemami, "Linear programming optimization for video coding under multiple constraints," Proc. DCC 2003 G. M. Schuster, G. Melnikov, and A. K. Katsaggelos, "A review of the minimum maximum criterion for optimal bit allocation among dependent quantizers," IEEE Trans. on Multimedia, vol. 1, no. 1, pp. 3-17, 1999
これらの考察のすべてに鑑みて、全体的平均ビットレート(CBR)を有する一連のビデオフレームで構成されるグループオブピクチャを提供できる一方で、そのような要件を達成するためにそのようなフレームの相対品質を損なうことのない、ビデオエンコーダを製造する必要がある。
従来技術の上記および他の難点並びに不都合は、本原理によって対処され、本原理は、ビデオ符号化のための動き推定予測器(motion estimation predictor)としての、利用可能な動き情報を再使用するための方法および装置に関する。
本原理の一態様によれば、符号化されるフレームのグループオブピクチャを解析する場合に事前符号化および事前解析を使用するエンコーダが提供される。各グループオブピクチャについてのそのようなステップの結果は、同一または類似の全体的平均ビットレートを有するが、そのようなグループオブピクチャ内のフレームは、そのようなフレームの符号化のために割り当てられて確保(reserve)される可変ビットレートを有する。
本原理の上記および他の態様、特徴、並びに利点は、添付の図面と併せて読まれる、例示的な実施形態についての以下の詳細な説明から明らかになろう。
本原理は、以下の例示的な図面によって、より良く理解することができる。
本発明の原理の一実施形態による、グループオブピクチャを符号化するための事前解析および事前処理ステップを実行する例示的なプロセスのブロック図である。 本発明の原理の一実施形態による、グループオブピクチャ上で事前解析動作を実行する例示的なプロセスのフローチャートである。 本発明の原理の一実施形態による、ρ領域および歪みモデリングに基づいてフレームレベルビット割り当てを実行する例示的なプロセスのフローチャートである。 本発明の原理の一実施形態による、各グループオブピクチャを固定ビットレートで符号化する例示的なプロセスであって、そのようなグループオブピクチャ内のフレームは可変ビットレートを有する、例示的なプロセスのフローチャートである。 本原理の一実施形態による、本原理が適用され得る事前処理要素を備える例示的なビデオエンコーダのブロック図である。
本発明の原理は、いずれのフレーム内およびフレーム間ベース符号化規格にも適用することができる。加えて、本明細書全体で、「ピクチャ」という用語と「フレーム」という用語は、同義語的に使用される。したがって、フレームという用語またはピクチャという用語は、同じものを表す。
本説明は、本原理を説明する。したがって、本明細書で明示的に説明され、示されていなくても、本原理を実施し、その主旨および範囲内に含まれる様々な構成を、当業者であれば考案できることが理解されよう。
本明細書で述べられるすべての例および条件付きの言葉は、教示を目的とするもので、本原理と当技術分野を発展させるために発明者(ら)が寄与した概念とを読者が理解する助けとなるように意図されており、そのような具体的に述べられた例および条件に限定されると解釈されるべきではない。
さらに、本原理の原理、態様、および実施形態を述べる本明細書内のすべての言表は、それらの具体的な例と同様に、それらの構造的均等物および機能的均等物の両方を包含することが意図されている。加えて、そのような均等物は、現在知られている均等物ばかりでなく、将来開発される均等物も含むことが、すなわち、構造にかかわらず同一機能を実行する、開発されたいかなる要素をも含むことが意図されている。
したがって、例えば、本明細書で提示されるブロック図は、本原理を実施する説明的な回路の概念図を表すことが、当業者であれば理解されよう。同様に、いかなるフローチャート、フロー図、状態遷移図、および疑似コードなども、実際にはコンピュータ可読媒体内で表され、そのため、コンピュータまたはプロセッサが明示的に示されているかどうかにかかわらず、そのようなコンピュータまたはプロセッサによって実行され得る、様々なプロセスを表すことが理解されよう。
図面に示された様々な要素の機能は、専用ハードウェアの使用を通してだけなく、適切なソフトウェアと関連する、ソフトウェアを実行可能なハードウェアの使用を通しても提供することができる。プロセッサによって提供される場合、機能は、単一の専用プロセッサによって、単一の共用プロセッサによって、またはその中のいくつかは共用されてよい複数の個別プロセッサによって提供することができる。さらに、「プロセッサ」または「コントローラ」という用語の明示的な使用は、ソフトウェアを実行可能なハードウェアを排他的に指示すると解釈されるべきではなく、デジタル信号プロセッサ(「DSP」)ハードウェア、ソフトウェアを保存するためのリードオンリーメモリ(「ROM」)、ランダムアクセスメモリ(「RAM」)、および不揮発性ストレージを、これらに限定することなく、暗黙的に含むことができる。
他の従来のハードウェアおよび/またはカスタムハードウェアも含むことができる。同様に、図面に示されたスイッチはいずれも、概念的なものに過ぎない。それらの機能は、プログラムロジックの動作を通して、専用ロジックを通して、プログラム制御と専用ロジックの対話を通して、または手動ですらも実施することができ、具体的な技法は、文脈からより具体的に理解されるように、実装者によって選択可能である。
本明細書の特許請求の範囲では、指定された機能を実行する手段として表された要素はいずれも、例えば、a)その機能を実行する回路要素の組合せ、またはb)任意の形態のソフトウェアであって、したがって、ファームウェアまたはマイクロコードなどを含み、そのソフトウェアを実行するための適切な回路と組み合わされて当該機能を実行するソフトウェアを含む、その機能を実行する任意の方法を包含することが意図されている。そのような特許請求の範囲によって確定される本原理は、列挙された様々な手段によって提供される機能が、特許請求の範囲が要請する方法で組み合わされ、一緒にされるという事実に存している。したがって、それらの機能を提供できる手段はいずれも、本明細書で示される手段と等価であると見なされる。
本明細書における本原理の「一実施形態(one embodiment)」または「一実施形態(an embodiment)」に対する言及は、その実施形態に関連して説明された特定の機能、構造、および特徴などが、本原理の少なくとも1つの実施形態に含まれることを意味する。したがって、本明細書の様々な場所で見られる「一実施形態では(in one embodiment)」または「一実施形態では(in an embodiment)」という句の出現は、必ずしもすべてが同一の実施形態に言及しているわけではない。
本発明の原理は、事前解析/事前処理要素を備える、ハードウェアとして、ソフトウェアで、またはそれらの組合せとして実施される例示的なビデオエンコーダを用いて、図5に示されるように実施され、ビデオエンコーダおよび事前解析/事前処理要素は、全体として、それぞれ参照番号500および590によって示される。事前解析/事前処理要素590は、本発明の様々な要素の動作に関する、以下で説明される様々な事前処理および事前解析動作を実行する。
ビデオエンコーダ500は、変換器(transformer)515の入力と信号通信で接続される出力を有する合成器510を含む。変換器515の出力は、量子化器520の入力と信号通信で接続される。量子化器の出力は、可変長コーダ(VLC:variable length coder)560の第1の入力および逆量子化器525の入力と信号通信で接続される。逆量子化器525の出力は、逆変換器(inverse transformer)530の入力と信号通信で接続される。逆変換器530の出力は、合成器535の第1の非反転入力と信号通信で接続される。合成器535の出力は、ループフィルタ540の入力と信号通信で接続される。ループフィルタ540の出力は、フレームバッファ545の入力と信号通信で接続される。フレームバッファ545の第1の出力は、動き補償器555の第1の入力と信号通信で接続される。フレームバッファ545の第2の出力は、動き推定器550の第1の入力と信号通信で接続される。動き推定器550の第1の出力は、可変長コーダ(VLC)560の第2の入力と信号通信で接続される。動き推定器550の第2の出力は、動き補償器555の第2の入力と信号通信で接続される。動き補償器の第2の出力は、合成器535の第2の非反転入力および合成器510の反転入力と信号通信で接続される。合成器510の非反転入力、動き推定器550の第2の入力、および動き推定器550の第3の入力は、エンコーダ500への入力として利用可能である。事前処理要素590への入力が、入力ビデオを受け取る。事前解析/事前処理要素590の第1の出力は、合成器510の非反転入力および動き推定器550の第2の入力と信号通信で接続される。事前解析/事前処理590の第2の出力は、動き推定器550の第3の入力と信号通信で接続される。可変長コーダ(VLC)560の出力は、エンコーダ500の出力として利用可能である。図5のエンコーダは例示的なエンコーダを表しているので、事前解析/事前処理要素590は、いくつかのさらなる要素に分割できること、エンコーダの他の要素に結合できることを理解されたい。
本発明の特定の処理要素が、そのような要素がなぜ本発明によって利用されるのかについての対応する説明とともに提示される前に、図4は、本発明の例示的な符号化方法400のフローチャートを詳述しており、当該方法は、固定ビットレートのグループオブピクチャ(GOP間CBR)を生成するために使用されるが、その一方で、各グループオブピクチャ内のフレームは、異なるビットレート(フレーム内VBR)で符号化される。符号化方法400は、本発明で使用される符号化解析/符号化プロセスの全体像を表している。
ステップ405は、符号化される原グループオブフレーム(original group of frame)内の各フレームの事前解析を実行する問題を導入する。後で説明されるように、本発明の一実施形態は、グループオブピクチャ内の各フレームについて共通の歪みを仮定する、ρ領域レートモデルを利用する。事前解析動作の結果は、符号化されたグループオブピクチャを生成するために、後でそのようなフレームが符号化される場合に利用される、ρ−QPおよびD’−QPなどのパラメータを生成する。
ステップ410は、原グループオブピクチャ(original group of picture)からの特定のフレームが、符号化される前のその特定のフレームに関連するρ−QPおよびD’−QPを更新するために解析される、事前処理ステップを導入する。すなわち、符号化される現フレームの後に来るフレームに関連するρ−QPおよびD’−QPは、事前解析フェーズからのものであるが、現フレームのρ−QPおよびD’−QPは、このステップの最中に更新され、その結果、符号化されるGOPについて全体的目標ビットレートが満たされ得るように、割り当てビットレートが現フレームの符号化のために確保される。これは、例えば、Iフレーム/ピクチャ(または複合Pフレーム/ピクチャ)の割り当てビットレートは、単純な複雑さのIまたはPフレーム/ピクチャよりも、符号化動作のために確保されるビットをより多く有することを意味する。これはまた、特定のグループオブピクチャについて、第1のフレームのために割り当てられるビットレートが第2のフレームの符号化のために割り当てられるビットレートと異なるように、各フレームのための割り当てビットレートがフレーム毎に変化し得ることも意味する。
フレームが符号化される場合、エンコーダは、グループオブピクチャが符号化されるときに目標ビットレート(CBR)にあることを提供するために、符号化される先行および現フレームの符号化において消費されるビットレートを考えなければならない。したがって、ρ−QPパラメータおよびD’−QPパラメータは、(フレームを符号化するために使用される量子化レベルに影響する)割り当てビットレートがGOPのフレーム毎に変化する場合に、符号化されるGOPの目標ビットレートが満たされるように調整される。これは、エンコーダが、全体的目標ビットレートが満たされ得るように、各フレームのための割り当てビットレートを確保しなければならないことを意味する。
ステップ415において、現フレームが符号化され、割り当てビットレートは、現フレームに関連づけられる。しかし、現フレームが実際に符号化される場合、そのようなフレームを符号化するために使用される実際の量子化レベルを決定するために、マクロブロックレベルのビット割り当てなどの操作が使用されることを理解されたい(その場合、フレームのために確保された割り当てビットレートに関連する量子化レベルは、その特定のフレームを符号化するために使用される当該量子化レベルではない)。しかし、本発明の目的は、実際の符号化プロセスのための割り当てビットレートを取っておき(set aside)、その結果、システムは、どのフレームが(第1の量子化レベルにおける)符号化のためにより多くのビットを必要とし、どのフレームがそのフレームのための割り当てビットレートに関連するビットを僅かしか必要としないかを事前推測し、その場合、ステップ410および415は、(原GOPのフレームのすべてが符号化されるステップ420において)符号化されるGOPのための目標ビットレートが満たされるように、原GOP内の連続する各フレームについて繰り返される。
本発明は、GOP内の選択フレームだけが符号化される場合に実施することができ、上で説明されたプロセスは、それらのフレームに対してだけ実行される。例えば、原GOPは30フレーム毎秒での配信用に構成されてよいが、(符号化された場合の)GOPの実際の配信は、15フレーム毎秒でだけビデオを復号できるシステム用とし得ると決定することができる。したがって、原GOP内のフレームがある間隔で選択される、または特定のフレームタイプ「Iフレーム/ピクチャ」が他のフレームタイプ「Pフレーム/ピクチャ」よりも優先して選択されるといった、事前解析の追加操作が存在してよい。
上述の所望の結果を実施するため、本発明の一実施形態は、ρ領域レートおよび歪み(RD:rate and distortion)モデリングに基づいた、フレームレベルビット割り当て(FBA:frame-level bit allocation)についてのソリューションを利用する。提示されるFBAスキームは、簡略化された符号化、新しい効率的で正確な歪みモデル、低複雑度最適化アルゴリズム、および適切に設計されたモデルパラメータ更新スキームを介した、参照および符号化モード不一致の効果的な削減にある。他の既存のFBAソリューションと比較して、提案されるスキームは、複雑度 対 性能のより良いトレードオフを達成する。複雑度の適度な増大によって、提案されるFBAスキームは、既存の分散ベースFBAスキームが達成するよりもはるかに効率的なレート制御を達成し、知覚ビデオ符号化品質に著しい改善をもたらす。
本発明の以下の実施形態は、一方向非対話型ビデオストリーミングアプリケーションを目標とするが、本発明のそのような原理は、双方向および/または対話型能力を使用する他のビデオ配信アプリケーションでも使用することができる。特に、そのような他の配信アプリケーションは、ビデオストリームの復号/配信においてバッファ/メモリ制約が問題ではなくなる、十分なバッファサイズおよび配信コンテンツの事前ローディング時間が仮定される場合に使用することができる。
実際には、レート制御は、フレームレベルおよびマクロブロック(MB)レベルで実行される。総符号化ビットレートが、特定のフレーム当たりどれだけのビットがその符号化のために必要かを指定するために、最初にフレームレベルで割り当てられ、次に、フレームの異なるMBに対して、ビットがさらに割り当てられる。その結果、各MBの量子化スケールが、MBの実際の符号化のために決定される。本発明は、フレームレベルビット割り当て(FBA)に基づいた完全なソリューションを説明する。
具体的には、本発明は、ρ領域RDモデルベースのFBAソリューションを提示する。本発明は、非特許文献1の既存のρ領域レートモデルからの概念と、フレームの実際のRD特性を推定するための、H.YangおよびJ.Boyceによって、2007年8月21日に出願された「An analytic and empirical hybrid source coding distortion model with high modeling accuracy and low computation complexity」と題するPCT出願である特許文献1において提示された、新しい効率的な歪みモデルからの概念に基づいて構築される(および改良される)。参照および符号モード不一致の影響を緩和し、ひいてはRDモデリングの動作精度を改善するため、慎重に設計され簡略化された符号化アルゴリズムが、グループオブピクチャ(GOP)内のすべてのフレームのRDデータを収集するために、GOPの符号化に先立つ事前解析プロセスを介して適用される。現フレームに関しては、FBAのために使用されるそのRDデータは、そのフレームの符号化に先立つ事前処理手順において再計算され、その時点で、その正確な参照フレームが利用可能である。フレームレベルRDデータに基づいて、FBA問題を解決する効率的な最適化スキームが提案され、そのスキームでは、GOPのすべてのフレームは、同じ歪みレベルを用いて符号化され、その目的は、目標の総ビットレートの制約を受ける、最小の固定歪みを見出すことである。さらに、他のいかなるρ領域FBA手法とも異なり、提案されるスキームは、事前解析および事前プロセスデータに関するRDモデルパラメータを別々に更新するために、独特に設計された手法を採用する。最後に、徹底的な実験を通して、発明者らは、提案されるFBAスキームが一貫して、既存の分散ベースFBA手法よりも性能的に優れており、全体的な知覚ビデオ符号化品質に著しい改善をもたらすことを確認した。
FBAに関して、既存のスキームは、発見的スキームまたはRD効率ベーススキームとして、大きく分類することができる。大部分の発見的FBAスキームは、複雑度測定ベーススキームと見なすことができ、そのようなスキームはたいてい、単純だが有益な直観から始められ、すなわち、すべてのフレームが同様の符号化品質を担い、総ビット予算(total bit budget)が同時に正しく使い切られるように、より多くのビットを複雑なフレームに割り当て、より少ないビットを単純なフレームに割り当てる。これらのスキームでは、ある種の量、例えば、差分絶対値和(平均差分絶対値、MAD:mean-absolute-difference)(非特許文献2を参照)、または予測残差フレーム(prediction residue frame)の分散(非特許文献3を参照)、またはCBR符号化におけるフレームの量子化パラメータ(QP)(非特許文献4を参照)が、フレームの符号化複雑度を測定するために使用され、ビットは、複雑度の値に従って、比例的に各フレームに割り当てられる。
他方、符号化複雑度を発見的に測定する代わりに、RD FBAスキームは、フレームのRD関数(RD function)を直接的に推定し、その後、これらのRDデータをアルゴリズム内で適用して、FBA解(FBA solution)を見出す。RD効率ベースFBAスキームは一般に、発見的な手法よりも効果的なレート制御および良好な全体的ビデオ符号化品質をもたらし、したがって、(例えば、低複雑度実施(非特許文献5を参照)のため、または厳格な複雑度制約を引き起こさないオフラインビデオ符号化(非特許文献6、非特許文献7を参照)のため)増大する複雑度が妥当なものである場合は常に、実際的により好ましい。本発明は、RD効率ベースFBAにも焦点を置く。次に、従来技術にまさる本発明のいくつかの主要な特徴が開示される。
RD最適化FBAでは、第1の重大問題は、各フレームのRD関数をいかに正確に推定するかであり、それに対して、非常に様々な異なるRDモデルが、これまでに提案されてきた。レートモデリングに関して、He、Kim、およびMitraの論文(非特許文献1)で提案されたρ領域レートモデルは、低い計算複雑度で高いモデリング精度をもたらし、したがって、他の既存のレートモデルと比べて優れた方法である。しかし、正確なρ領域レートモデルの既存のアプリケーションの大部分は、MBレベルのレート制御に焦点を置いている。本発明は、そのモデルをフレームレベルのレート制御で適用するためのスキームを提示する。既存のMBレベルのスキームとともに、申し分のないρ領域レートモデリングベースのレート制御フレームワークが達成できる。発明者らの知る限りでは、同様のトピックについて唯一公表された研究は、Cai、He、およびChenの論文(非特許文献7)のものであるが、その論文では、DVDおよび映画用のオフラインビデオ圧縮アプリケーションを目標にしており、ρ領域RDモデルは、全ビデオ系列のVBR符号化において最適化FBAのために適用されている。対照的に、本発明者らのスキームは、CBRレート制御を用いたリアルタイムビデオストリーミングアプリケーションを目標にしており、そうしたアプリケーションは、符号化遅延および複雑度に対してはるかに厳格な制限を課す。
ソース符号化歪みモデリングに関して、既存のRD効率ベースFBAスキームは、QPベースまたはρベース解析モデル(He、Kim、およびMitraの論文(非特許文献1)、非特許文献8、および非特許文献9を参照)、またはLinおよびOrtegaの論文(非特許文献5)で開示されたような、補間ベース経験的モデルを採用している。YangおよびBoyceの特許出願(特許文献1)で開示されたモデルでは、より正確な解析的および経験的ハイブリッド歪みモデルが提案されており、そのモデルは、高速テーブル検索(fast table look-up)計算のために依然として低い計算複雑度をもたらす。本発明の説明される実施形態では、発明者らが提案するRD最適化FBAソリューションにおける、この優れた歪みモデルが採用され、他のあまり正確ではないモデルにまさる改善された性能をもたらす。
正確なソース符号化RDモデルを用いた場合、あるフレームの予測参照フレームと、(動きベクトルとMBまたはブロック符号化モードとの両方を含む)すべてのMBの符号化モードとが与えられると、そのフレームのR−QPとD−QPの関係を正確に推定することができる。しかし、実際のFBA問題では、フレームのRD関数は、符号化プロセスに先立って推定されなければならない。動き補償予測ビデオ符号化フレームワークのため、すべての先行フレームを実際に符号化することなく、あるフレームの正確な参照および符号化モードを知ることは決してできない。したがって、FBAにおいて仮定された参照および符号化モードと実際の符号化から得られるそれらとの間には、必然的な不一致が存在し、その不一致は、基本RDモデルの実際の動作推定精度をはっきりと低下させる。
実際、この不一致問題は、RD関数のフレーム間依存問題として、長く認識されてきた。フレーム間依存の影響を正確に考慮するため、いくつかの既存のスキームは、網羅的な符号化(非特許文献9を参照)、またはフレームのすべての可能なQP組合せに対する(LinおよびOrtegaの論文(非特許文献5)で説明されているような)網羅的なモデリングに頼っているが、それらは、法外な計算複雑度を招く。低複雑度の方を追求するもう一方の極端として、いくつかのスキームは、事前解析における参照フレームとして単純に原ビデオフレームを利用するが(Yue/Zhou/Wang/Chenの論文(非特許文献6)を参照)、しかし、それらは、RD推定精度を、ひいては結果のレート制御性能を大きく低下させることがある。複雑度と性能のより良好なトレードオフを図るため、いくつかのソリューションは、符号化の1つの単一パスを介して事前解析を行う(Cai、He、Chenの論文(非特許文献7)、および非特許文献10を参照)。不一致の影響を効果的に補償するため、事前解析符号化のパスは、目標ビットレートを用いたCBR符号化(Sermadevi/Hemamiの論文(非特許文献10)を参照)とすること、またはすべてのフレームに対してある固定QPを使用すること(Cai/He/Chenの論文(非特許文献7)を参照)ができる。本発明では、1つのパスの「完全(full)」符号化を使用する代わりに、発明者らは、参照および符号化モードの不一致補償のための、固定QPを用いる「簡略化された(simplified)」符号化の手法を開発し、その手法では、P16×16(またはI16×16)モードだけが、Pフレーム(またはIフレーム)符号化において適用され、エントロピー符号化は含まれない。実際には、完全符号化は、含まれる符号化オプションをより多くまたはより少なくすることで、様々な異なる度合いに簡略化することができる。発明者らの簡略化スキームは、ある1組の符号化オプションを含み、その符号化オプションは、良好な複雑度 対 性能のトレードオフを表すことが、徹底的な実験の結果に裏づけられて判明している。さらに、QP不一致の影響の徹底的な調査の後、発明者らは、固定QPのレベルを選択するための効果的な方法を開発した。したがって、本発明の原理は、事前解析不一致補償におけるより効果的なソリューションを開示する。
各フレームのRDデータを計算した後、次にそれらを使用して、FBAを最適化することができる。改善基準に関して、一般に採用されるスキームは、平均MSE歪みを最小化することである(Lin/Ortegaの論文(非特許文献5)またはYue/Zhouの論文(非特許文献6)を参照)。しかし、平均歪みの最小化は、良好な知覚ビデオ品質にとっても重要な、フレーム間での低い品質変動を補償しない。したがって、いくつかのより高度なスキームは、最大歪みを最小化すること(非特許文献11を参照)、または歪みの平均および変動の組合せを最小化すること(Lin/Ortegaの論文(非特許文献5)を参照)を選択する。本発明では、歪みが固定レベルにある場合が、最適化手法において、すべてのフレームに対して仮定され、勾配降下探索(gradient descent search)と2分探索(bisectional search)を組み合わせた高速探索アルゴリズムが、目標ビットレート制約を満たしながら、最小歪みレベルを見出すために開発された。既存の最適化アルゴリズムと比較すると、発明者らのスキームは、複雑度がより低いばかりでなく、固定品質最大化をより直接的に目標にし、したがって、実際のビデオストリーミングシステムにおいて、改善された知覚ビデオ符号化品質のためにより適切である。
提案されるFBAソリューションは、その独特に設計されたRDモデルパラメータ更新スキームにも立脚しており、そのスキームでは、事前解析および事前プロセスモデルのパラメータは、2つの異なるサイズのスライディングウィンドウを用いて別々に維持される。実際には、ビデオ信号は、例えば、白一色のフレームまたはまったく動きのないフレームなど、通常とは異なるフレームを含むことがあり、そうしたフレームの符号化は、非常に僅かなビットしか消費せず、モデルパラメータ更新に含まれるべきではない。したがって、本発明は、実施に際して様々なシステム障害を防止し、システム全体をスムーズに動作させ続けるために、通常とは異なるフレームの効果的な識別と、他のいくつかの例外処理とを含む。
図4で説明された概念を実施するため、本発明は、効果的なレート制御のためのρ領域RD FBAソリューションを提案する。発明者らのスキームは、一方向非対話型ビデオストリーミングアプリケーションを目標とし、そうしたアプリケーションは通常、厳格な遅延制約をもたない。本明細書において、発明者らは、十分なバッファサイズを仮定し、したがって、バッファ制約は関係しない。発明者らは、符号化前にGOP全体が利用可能であることを仮定し、それは、1つのGOPの符号化遅延を招く。ある指定された目標ビットレートについて、異なるGOP間のCBR符号化と、単一のGOP内のVBR符号化が仮定され、それは、各GOPが(目標平均ビットレートから決定される)同じ総ビット予算を有し、FBAがGOP内のすべてのフレームにわたって実行されることを意味する。
符号化されるピクチャで構成される原GOPの符号化プロセス100が、図1に示されている。原ビデオフレームからなる1つのGOPが利用可能になると、発明者らが提案する簡略化された符号化手法を使用して、各フレームからRDモデリングデータを収集するために、事前解析プロセス105が最初に開始される。シーン変化検出も、事前解析において実現される。GOP内部にシーン変化が存在しない場合、そのGOPは、第1フレームがIフレームになり、残りのフレームがPフレームになるように符号化される。シーン変化が存在する場合、シーン変化フレームは、同様にIフレームとして符号化される。事前解析の後、ステップ110において、原GOPの実際の符号化が、フレーム毎に実行される。各Pフレームが符号化される前に、現フレームのRDデータが、簡略化された符号化を介して再収集される。この時点で、正確な予測参照フレームが利用可能になるので、参照不一致なしに、より正確なRD推定が達成できる。発明者らは、ステップ115において、この動作を事前プロセスと呼んでいる。次に、ステップ120において、最適化FBAが、残りのすべてのフレームにわたって実行され、各フレームは、ある量のビットを割り当てられる。次に、MBレベルのレート制御の助けを借りて、割り当てられたビット予算を達成するように、現フレームが実際に符号化される。実際の消費ビットに基づいて、GOP内の残りのフレームのための予算が更新される。事前プロセス、FBA、および符号化からなるステップ110のプロセス全体が、次のフレームに対しても繰り返され、それ以降も同様である。
各モジュールの詳細に取りかかる前に、最初に、提案されたFBAスキームにおいて採用されたRDモデルについて検討する。レートモデリングのために、発明者らは、He/Kim/Mitraの論文において提案されたρ領域モデルを採用するが、それは以下のように定義される。
R(QP)=θ・(1−ρ(QP))+C (1)
ここで、ρ(QP)は、QPを用いた量子化の後の、すべての係数に対するゼロ量子化係数の比を表す。Cは、係数符号化ビット以外の他のすべてのオーバーヘッドビットを表し、ピクチャヘッダビット、マクロブロックヘッダビット、符号化モードビット、および動きベクトル(MV)ビットを含む。θは、QPとは独立の、別のモデルパラメータである(上記論文を参照)。ρがQPとの1対1のマッピングを有することに留意されたい。He/Kim/Mitraの論文(非特許文献1)では、Rがρと非常に強い線形関係を有することが示され、それは、当該モデルの高いモデリング精度を補償する。その優れた性能は、発明者らの徹底的な実験においても立証された。
発明者らの歪みモデルは、Yang/Boyceの特許出願(特許文献1)において開示されたハイブリッドモデルであり、
Figure 2010505354
と定義される。
ここで、Aは、フレーム内のピクセルの総数を表す。Qは、QPに関係する量子化ステップサイズを表す。H.264では、QPは、0から51までの範囲にわたり、QPとQの間の関係は、
Q≒2(QP-4)/6 (3)
である。Coeffz(QP)は、QPを用いてゼロに量子化される係数の大きさを表す。この歪みモデルでは、全体的なMSE歪みは、非ゼロ量子化係数の歪み寄与Dnz(QP)とゼロ量子化係数の歪み寄与Dz(QP)の2つの部分に分割されることが理解できる。モデリング近似は、一様に分布される量子化誤差が仮定される、非ゼロ量子化係数の歪みを計算する際にだけ行われる。ゼロ量子化係数の歪みは、いかなる近似も行わずに、正確に計算される。当該モデルの最も顕著な利点は、Dz(QP)の正確な計算が、複雑度の最低限の増大を招くに過ぎない、高速テーブル検索手法を用いて実行できることである。したがって、当該モデルは、既存モデルよりも高い精度を達成しながらも、依然として低い複雑度を維持する。
実際には、発明者らは、参照および符号化モード不一致が、歪みモデリングの性能を、レートモデリングに対して行うよりも深刻に低下させ得ることを見出した。したがって、追加のモデルパラメータαが、以下に示されるように、不一致効果を補償するために導入される。ここで、D’は、(2)からの歪み推定を表す。
D(QP)=α・D’(QP) (4)
事前解析の目的は、GOPの各フレームについて、ρ−QPテーブルおよびD’−QPテーブルを計算することであり、それらのテーブルは、後で最適化FBAにおいて使用される。発明者らが提案する事前解析スキーム200のブロック図が、図2に示されている(ステップ105を参照し直されたい)。RDモデリングにおける参照および符号化モード不一致の影響を効果的に緩和するため、事前解析用の簡略化された符号化手法は、フレームを符号化する場合に、1つの単一MB符号化だけを、すなわち、Pフレームに対してはP16×16、またはIフレームに対してはI16×16を、それぞれ使用する。
ステップ205におけるように、フレームから開始して、H.264の完全符号化プロセスでは、様々な符号化モードが、各MBについて、例えば、P16×16、P16×8、P8×16、P8×8、P8×4、P4×8、P4×4、途中を省略して、I16×16、およびI4×4などについて、チェックされることを必要とし(ステップ210、ステップ215)、それは、相当量の複雑度を招く。既存の事前解析スキームは、完全符号化を利用するか(Cai/He/Chen(非特許文献7)を参照)、またはまったく符号化を行わない(Yue/Zhou/Wang/Chen(非特許文献6)を参照)。本発明では、2つの極端の間の良好なバランスを使用し、それは、複雑度とモデリング精度の間の良好なトレードオフをもたらす。徹底的な実験を通して、(i)P16×16またはI16×16モードだけの使用は、すべての合法なモードを用いてチェックすることに比べて、モデリング精度を大きく犠牲にしないこと、(ii)フルピクセル動き推定(ME)は貧弱なモデリング性能をもたらすので、サブピクセルMEが必要であること、(iii)拡張予想区域探索(EPZS:enhanced predictive zonal search)MEは、完全探索MEの精度に近い精度を達成し、ログ探索の低複雑度MEスキームの精度よりもはるかに良好であること、(iv)実際の符号化のME探索範囲が128である場合、事前解析にとって良好な探索範囲は64とすることができるが、32とすることはできないことが決定された。これらの有益な結果は、提案された事前解析スキームの対応する設定を最終的なものにする。
発明者らの事前解析プロセスでは、レートモデリングのためのρ−QPデータを収集することだけを必要とするので、エントロピー符号化は関与しないことに留意されたい。それ以外に、発明者らのスキームは、予測参照のための再構成フレームを取得するために、量子化、逆変換、および逆量子化などを必要とする。本明細書では、量子化のためのQPをどのように選択するかを決定する必要がある。Cai/He/Chenの論文(非特許文献7)におけるのと同様に、GOPのすべてのフレームが、事前解析のために固定QPを使用することが仮定される。この場合、元の参照不一致問題は、QP不一致問題になり、その問題については、発明者らは、採用したRDモデルの性能に対するその影響を完全に調査した。実験では、多くの様々なビデオ系列について、発明者らは、実際の符号化の場合は、QP=25、35、45を適用し、事前解析の場合は、符号化QP+5または符号化QP−5を適用した。実験結果は、レートモデリングに関して、過小評価QP(すなわち、事前解析QPが実際の符号化QPより小さい)は、過大評価QPよりも好ましく、符号化QP+5を用いた場合、レートモデリング精度は、符号化QP−5のレートモデリング精度よりもはるかに悪くなることを示した。歪みモデリングに関しては、過大評価QPは、過小評価QPよりも良好である。しかし、過小評価QPによる性能低下は、あまり大きくない。さらに、実際には、正確なレート制御は、バッファオーバーフローまたはアンダーフローに起因するシステム障害を回避するために常に必要であるので、正確なレートモデリングは、正確な歪みモデリングの優先順位よりも高い優先順位をもつ。したがって、全体として、QP不一致が不可避である場合、事前解析においては、過小評価QPが過大評価QPよりも好ましい。発明者らのスキームでは、現GOPの事前解析QP QPpreA,currGOPは、
Figure 2010505354
によって決定される。
ここで、「preA」は、事前解析を表す。
Figure 2010505354
は、先に符号化されたGOPの平均QPを表す。ΔQPguardは、より高い可能性でQPpreA,currGOPを実際の符号化QPよりも過小評価させるための、QP保護ギャップ(guardian gap)である。
発明者らの事前解析スキームでは、(ステップ225におけるような)ρ−QPテーブルおよびD’−QPテーブルの計算は、高速テーブル検索を介して実行され、したがって、計算全体は、複雑度の著しい増大を招かない。参照が便利なように、(ステップ225、230、233に関して実行される)高速計算アルゴリズムが、以下で与えられる。当該方法は、フレーム内の各マクロブロックについて、ステップ210からステップ235を使用して、ピクチャのそのようなマクロブロックがすべて処理されるまで、そのような解析を繰り返す。
ブロックレベル計算:各変換ブロックについて:
1.初期化:∀QP,ρ(QP)=0,Dz(QP)=0
2.ワンパステーブル検索:各係数Coeffiについて:
1)Leveli=|Coeffi
2)QPi=QP_level_Table[Leveli]。QP_level_Tableは、各係数レベルについて、その特定のレベルの係数をゼロになるように量子化する最小QPを指示するテーブルである。
3)
Figure 2010505354
3.合算:各QPについて、QPminからQPmaxまで:
Figure 2010505354
上記のことから、すべてのQPのρおよびDzは、すべての変換係数にわたる、ワンパスのQP_level_Table検索を介して正確に計算することができ、それにかかる計算コストはかなり低い。フレームのすべてのブロックについて{ρ(QP),Dz(QP)}QPを獲得した後、以下に示されるように、対応するフレームレベルの量を取得するために(ステップ240)、これらのデータをそれぞれ平均することができる。ここで、Bは、フレーム内のブロックの総数を表す。
フレームレベル計算:各QPについて:
1)
Figure 2010505354
2)
Figure 2010505354
それ以外の場合は、Dz(QP)=0
3)次に、(2)におけるように、ρ(QP)およびDz(QP)を用いて、D’(QP)が計算できる。
(図1のステップ125におけるように)Pフレームを符号化する前に、そのPフレームの先行フレームがすでに符号化されており、したがって、実際の参照が分かることに留意されたい。この時点で、より正確なρ(QP)およびD’(QP)データが、(図1のステップ115に関する)フレームの事前プロセスを介して計算できる。Pフレームの事前プロセスのステップは、量子化および他の再構成ステップをもはや必要としないことを除いて、事前解析のものとほとんど同じである。Iフレームはフレーム内予測しか伴わないので、事前プロセスを必要としないことに留意されたい。
(ステップ120に関する)FBAアルゴリズムの例示的な一実施形態が、FBAフローチャート300として図3に示されている。事前解析および事前処理ステップからのパラメータが、符号化されるフレームに対して使用され、そのようなパラメータは、ステップ305において、メモリから獲得される。加えて、エンコーダは、符号化されるグループオブピクチャのための全体的なビットレートを満たすように、ステップ310において、GOP内の符号化されるフレームのために残っているビット予算について検討しなければならない。(ステップ315において)残りの予算が十分であるかどうかについて、検討が行われる。
異なるフレームにわたって一貫したビデオ品質を達成するため、発明者らのFBAスキームは、固定歪み最小化に直接的に焦点を置き、その場合、GOPのすべての残りフレームについて、固定レベルの歪みが仮定され、アルゴリズムは、目標ビット予算を満たす最小の固定歪みを探索する。簡略化された符号化が、事前解析において参照および符号化モード不一致を効果的に補償する場合、異なるフレームのRD関数は独立であると仮定することができ、それが全体的な最適化のための単純で容易な探索スキームをもたらすことに留意されたい。対照的に、従属RD関数を仮定した場合、既存のスキームは、動的プログラミングおよび反復降下探索(iterative descent search)を提案し、それは、高い計算複雑度を伴うか、または局所最適化ソリューションをもたらす。
発明者らの固定歪み探索アルゴリズム(325)は、勾配降下探索および2分探索の両方を含む。実際には、探索複雑度に影響を与える別の重要なファクタが、初期探索点になる。良好な開始点が使用された場合、探索ははるかに高速になり得る。発明者らのスキームでは、初期歪みレベルは、固定QP結果からの平均歪みであり、それは、最適な固定歪みレベルに対する近い近似を与える。探索プロセスは、達成レートと目標レートの間の相対誤差が一定の閾値を下回るか、または反復回数が一定の限界に達した場合に終了する。実験結果は、ほとんどの場合、探索は5〜6回以内の反復で終了することを示しており、これはかなり高速である。探索アルゴリズムが以下で説明される。本明細書では、簡潔にするため、通常の2分探索についての詳細は省略される。また、RTargetは、GOP内のすべての残りフレームについての、係数符号化の総ビット予算を表し、オーバーヘッドビットはすでに排除されていることに留意されたい。これは単純に、QPは、係数符号化で消費されるビットにだけ影響し、オーバーヘッドビットには影響しないからである。
固定歪みベースFBAアルゴリズム:
1.固定QP(ステップ325):
Figure 2010505354
ここで、Kは、GOP内の残りの未符号化フレームの数を表し、Riは、Cがないことを除いて、(2)におけるように計算される。高速2分探索が、最適QPを探索するために使用される。
2.初期化(ステップ330):
Figure 2010505354
ここで、Diは、(4)におけるように計算される。
3.D(n)を与え、各未符号化フレームiについて、2分探索を使用して、QP* iによって表される最良のQPを見出す。次に、これらのQPを使用して、対応するRi(QP* i)を見出す。したがって、
Figure 2010505354
4.ΔR(n)=(R(n)−RTarget)/RTarget ΔR(n)が閾値(発明者らの実施においては3%)より小さい場合、7に進む。
5.n=0の場合、またはn>0かつΔR(n)・ΔR(n-1)>0の場合、探索はまだ最適なDを通り過ぎていない。勾配降下探索を使用し、D(n+1)=D(n)・(1+η・ΔR(n))を用いて更新する(発明者らの実施においては、η=1)。それ以外の場合、探索はすでに最適を通り過ぎている。2分探索を使用し、
Figure 2010505354
を用いて更新する。
6.nが限界(発明者らの実施においては10)に達した場合、7に進む。それ以外の場合、n=n+1とし、ステップ3に進む。
7.探索が終了し、
Figure 2010505354
が、現フレームのためのビットの総数である。ここで、Aは、フレームサイズを表す。[ポイント3〜7は、ステップ335に相当する]。
実施においてアルゴリズムをスムーズに動作させ続けるため、特別な処理を求める極端な状況を識別することが常に必要である。図3に示されるように、FBAの開始において、係数符号化のための残りのビット予算が十分かどうかをチェックする(ステップ315)。総予算に対する係数符号化予算の比が一定の閾値(発明者らの実施においては0.15)を下回る場合、予算は不十分であると見なされる。この場合、最適化FBAは必要でなく、何らかの単純なその場限りの(ad hoc)ビット割り当てスキームの方がより適切である(ステップ320)。具体的には、符号化のためのビットが尽きた場合、または所望の全体的ビットレートを満たすにはあまりにも少ない場合、ピクチャヘッダ符号化のために、より多くのビットが割り当てられる。残りのビットが依然としてピクチャヘッダビットよりも多い場合、その余剰ビットは、すべての残りのフレームに均等に割り当てられる。
関連するRDモデルパラメータ(すなわち、(2)におけるθおよびC、(4)におけるα)をいかに効率的に更新するかが、最終的なレート制御性能に決定的に影響し得る、別の重要な問題である。事前解析および事前プロセスは、異なるモデリング性能をもたらすので、それらのモデルパラメータは、別々に計算される。発明者らのスキームでは、発明者らは、一般的なスライディングウィンドウ手法を採用し、その手法では、現在のパラメータは、一定のサイズのウィンドウ内の過去の符号化結果から更新される。より大きなウィンドウサイズは、より良好な安定性をもたらすが、同様により悪化した適応性ももたらす。(ステップ140からの)更新された事前解析モデルパラメータは、現フレームを除くすべての残りの未符号化フレームに適用されるので、安定性は、事前プロセスにおけるよりも重要である。したがって、発明者らのソリューションでは、最新のフレーム符号化結果から導出されたパラメータを単純に用いて(ステップ150における参照フレームの保存)、現フレームパラメータを更新するが、事前解析については、実際にスライディングウィンドウ更新を使用し、Pフレームパラメータ更新のためのウィンドウサイズは6であり、Iフレーム更新のためのウィンドウサイズは3である。Iフレームパラメータ更新のウィンドウサイズがより短い理由は、実施において、Iフレームは、GOPの第1フレームであるか、またはシーン変化フレームであるからである。したがって、Pフレーム用のものと同じウィンドウサイズを使用した場合、ウィンドウは、実際にははるかに長い時間距離にわたり、したがって、十分な適応性をもたらさないことがある。
さらに説明されるように、GOP内の符号化される各フレームについて、それが符号化された後(ステップ155の後)、そのようなフレームを参照フレームとして使用することに関して、ρ−QPおよびD’−QPがフレームに関連付けられ(ステップ115、120、125、135、140)、そのような符号化されたフレームは、GOP内の次のフレームが事前処理および符号化される場合に(ステップ115、120、125、135、140)、再構成される(ステップ15を参照)。
効果的なパラメータ更新のための別の重要な測定は、更新計算からそれらの通常と異なるフレームの符号化結果を排除することである(ステップ135)。実際には、ビデオ信号は、(特に今日の映画トレーラにおける)白一色のフレーム、およびスコアボードや株式情報を表示するニュースにおけるようなまったく動きのないフレームなど、様々なタイプの通常と異なるフレームを含むことがあり、それらの符号化は、極めて少量のビットしか消費しないことが可能である。これらのフレームの特性は、他の典型的なビデオフレームに一般化できないので、それらの符号化も、パラメータ更新に含められるべきではない。発明者らのスキームは、以下の条件、すなわち、(i)総ビットに対する係数符号化ビットの比が15%を下回る、(ii)フレームのすべての残差MBの平均分散が0.1未満、(iii)すべてのMBに対する平均QPが10を下回る、(iv)ピクセル当たりの結果ビットが0.01より小さい、のいずれか1つが満たされる場合、通常と異なるフレームとして符号化フレームを識別する。
符号化プロセス100は、特定のGOPのすべてのフレームが符号化されるまで、(110に示されるように)それ自体を繰り返し、その場合、符号化されたGOPは、全体的必要ビットレート(CBR)を満たす。ステップ160において、ステップ152において決定された
Figure 2010505354
のすべての総和を合計することによって、QPpreAが計算される。次に、計算されたQPpreAは、総合計
Figure 2010505354
の平均として決定され、平均量子化レベルの結果は、それから減算される保護値(guard value)を有する(式5を参照)。
開示されたFBAソリューションは、ローモーション、ミディアムモーション、およびハイモーション系列(CIFおよびQCIF系列)を含む、様々なテストビデオ系列とともに、様々な関連符号化ビットレートで動作する。
本原理の上記および他の特徴および利点は、本明細書の教示に基づいて、当業者によって容易に確認できよう。本原理の教示は、ハードウェア、ソフトウェア、ファームウェア、専用プロセッサ、またはそれらの組合せといった様々な形態で実施できることを理解されたい。
最も好ましくは、本原理の教示は、ハードウェアとソフトウェアの組合せとして実施される。さらに、ソフトウェアは、プログラム記憶ユニット上で有形に実施されるアプリケーションプログラムとして実施されてよい。アプリケーションプログラムは、任意の適切なアーキテクチャを備えるマシンによって、アップロードされ、実行されてよい。好ましくは、マシンは、1つまたは複数の中央処理装置(「CPU」)、ランダムアクセスメモリ(「RAM」)、および入出力(「I/O」)インターフェースなどのハードウェアを有する、コンピュータプラットフォーム上で実施される。コンピュータプラットフォームは、オペレーティングシステムおよびマイクロ命令コードも含んでよい。本明細書で説明された様々なプロセスおよび関数は、CPUによって実行され得る、マイクロ命令コードの部分もしくはアプリケーションプログラムの部分、またはそれらの任意の組合せとすることができる。加えて、追加のデータ記憶ユニットおよび印刷ユニットなど、他の様々な周辺ユニットが、コンピュータプラットフォームに接続されてよい。
添付の図面に示される構成要素のシステムコンポーネントおよび方法のいくつかは、好ましくはソフトウェアで実施されるので、システムコンポーネントまたはプロセス機能ブロックの間の実際の接続は、本原理がプログラムされる方法に応じて異なり得ることをさらに理解されたい。本明細書で開示された教示を与えれば、当業者は、本原理の上記および類似の実施または構成を企図することができる。
説明的な実施形態が、添付の図面を参照しながら本明細書で説明されたが、本原理は、それらの実施形態そのままに限定されず、本原理の範囲または主旨から逸脱することなく、当業者によって、それらの実施形態に様々な変更および修正が施され得ることを理解されたい。そのような変更および修正のすべては、添付の特許請求の範囲において説明される本原理の範囲内に含まれることが意図されている。

Claims (8)

  1. 目標ビットレートでビデオのグループオブピクチャを符号化するための方法であって、
    符号化されるグループオブピクチャから少なくとも2つの未符号化フレームのためのパラメータを導出するステップと、
    前記少なくとも2つのフレームから符号化されるフレームに関連するパラメータを更新するステップと、
    前記フレームの符号化のために割り当てビットレートを確保するステップであって、前記割り当てビットレートは、前記更新されたパラメータと、前記少なくとも2つの未符号化フレームからの前記未符号化フレームに関連する前記導出されたパラメータとから決定され、前記フレームを符号化するために確保された前記割り当てビットレートは、前記目標ビットレートとは異なる、ステップと
    を含むことを特徴とする方法。
  2. 前記フレームは、前記割り当てビットレートに関連する量子化レベルとは異なる量子化レベルで符号化されることを特徴とする請求項1に記載の方法。
  3. 前記符号化量子化レベルは、前記フレーム上でマクロブロックレベルのビット割り当て操作を実行するときに決定されることを特徴とする請求項2に記載の方法。
  4. 前記少なくとも2つの未符号化フレームからの第2のフレームを符号化するステップであって、前記符号化操作のために第2の割り当てビットレートが確保され、前記第2の割り当てビットレートは、前記符号化フレームに関連する前記割り当てビットレートとは異なるステップ
    をさらに含むことを特徴とする請求項1に記載の方法。
  5. 前記フレームのために割り当てられる前記ビットレートは、ρ領域フレームレベルのビット割り当て操作を使用することによって決定されることを特徴とする請求項1に記載の方法。
  6. 前記フレームビットレート割り当ては、各フレームが同じ歪み係数を有することを仮定して決定されることを特徴とする請求項1に記載の方法。
  7. 前記グループオブピクチャに関連する前記フレームのすべては、そのようなフレームがグループオブピクチャの前記目標ビットレートを満たして符号化される場合に、ビットレートが各フレームに割り当てられるように解析されることを特徴とする請求項6に記載の方法。
  8. 前記符号化グループオブピクチャおよび第2の符号化グループオブピクチャは、同じ目標ビットを有することを特徴とする請求項1に記載の方法。
JP2009530426A 2006-09-28 2007-09-28 効果的なレート制御および拡張したビデオ符号化品質のためのρ領域フレームレベルビット割り当てのための方法 Expired - Fee Related JP5087627B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US84825406P 2006-09-28 2006-09-28
US60/848,254 2006-09-28
PCT/US2007/020929 WO2008042259A2 (en) 2006-09-28 2007-09-28 Method for rho-domain frame level bit allocation for effective rate control and enhanced video coding quality

Publications (2)

Publication Number Publication Date
JP2010505354A true JP2010505354A (ja) 2010-02-18
JP5087627B2 JP5087627B2 (ja) 2012-12-05

Family

ID=39268993

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009530426A Expired - Fee Related JP5087627B2 (ja) 2006-09-28 2007-09-28 効果的なレート制御および拡張したビデオ符号化品質のためのρ領域フレームレベルビット割り当てのための方法

Country Status (6)

Country Link
US (1) US20100111163A1 (ja)
EP (1) EP2067358A2 (ja)
JP (1) JP5087627B2 (ja)
KR (1) KR101329860B1 (ja)
CN (1) CN101518088B (ja)
WO (1) WO2008042259A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2024124559A (ja) * 2020-12-15 2024-09-12 日本電気株式会社 符号化装置および復号装置

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090290636A1 (en) * 2008-05-20 2009-11-26 Mediatek Inc. Video encoding apparatuses and methods with decoupled data dependency
WO2010093430A1 (en) * 2009-02-11 2010-08-19 Packetvideo Corp. System and method for frame interpolation for a compressed video bitstream
CA2751785C (en) 2009-02-13 2016-04-05 Research In Motion Limited Adaptive quantization with balanced pixel-domain distortion distribution in image processing
FR2945697B1 (fr) * 2009-05-18 2016-06-03 Actimagine Procede et dispositif de compression d'une sequence video
US20110110422A1 (en) 2009-11-06 2011-05-12 Texas Instruments Incorporated Transmission bit-rate control in a video encoder
US20120249869A1 (en) * 2009-12-14 2012-10-04 Thomson Licensing Statmux method for broadcasting
RU2527740C2 (ru) * 2010-05-12 2014-09-10 Ниппон Телеграф Энд Телефон Корпорейшн Способ управления кодированием видео, устройство кодирования видео и программа кодирования видео
JP5551308B2 (ja) * 2010-05-26 2014-07-16 クゥアルコム・インコーポレイテッド カメラパラメータ支援型のビデオフレームレート・アップコンバージョン
KR101651027B1 (ko) * 2011-12-23 2016-08-24 인텔 코포레이션 콘텐츠 적응적 고정밀 매크로블록 레이트 제어
KR20130116782A (ko) 2012-04-16 2013-10-24 한국전자통신연구원 계층적 비디오 부호화에서의 계층정보 표현방식
CN103517080A (zh) * 2012-06-21 2014-01-15 北京数码视讯科技股份有限公司 实时视频流编码器和实时视频流编码方法
US20140029664A1 (en) * 2012-07-27 2014-01-30 The Hong Kong University Of Science And Technology Frame-level dependent bit allocation in hybrid video encoding
KR101487628B1 (ko) * 2013-12-18 2015-01-29 포항공과대학교 산학협력단 단말에서 에너지를 효율적으로 사용하기 위한 어플리케이션 인지 패킷 전송 방법 및 장치
KR101790671B1 (ko) * 2016-01-05 2017-11-20 한국전자통신연구원 하다마드-양자화 비용에 기반하여 율-왜곡 최적화를 수행하는 장치 및 방법
KR102851376B1 (ko) 2016-11-11 2025-08-26 삼성전자주식회사 계층 구조를 구성하는 프레임들에 대한 인코딩을 수행하는 비디오 처리 장치
CN108235016B (zh) 2016-12-21 2019-08-23 杭州海康威视数字技术股份有限公司 一种码率控制方法及装置
WO2018132964A1 (zh) 2017-01-18 2018-07-26 深圳市大疆创新科技有限公司 传输编码数据的方法、装置、计算机系统和移动设备
KR101960470B1 (ko) * 2017-02-24 2019-07-15 주식회사 칩스앤미디어 오프라인 cabac을 지원하는 비디오 코딩 프로세스의 비트 예측 기반 비트 레이트 컨트롤 방법 및 그 장치
CN107027030B (zh) 2017-03-07 2018-11-09 腾讯科技(深圳)有限公司 一种码率分配方法及其设备
EP3616074A4 (en) * 2017-04-26 2020-09-23 DTS, Inc. BINARY RATE CONTROL ON GROUPS OF FRAMES

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005204158A (ja) * 2004-01-16 2005-07-28 Mitsubishi Electric Corp 画像符号化装置
JP2006121657A (ja) * 2004-07-08 2006-05-11 Qualcomm Inc ビデオ符号化のための効率的なレート制御技術
WO2006099226A1 (en) * 2005-03-10 2006-09-21 Qualcomm Incorporated Quasi-constant-quality rate control with look-ahead

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6278735B1 (en) * 1998-03-19 2001-08-21 International Business Machines Corporation Real-time single pass variable bit rate control strategy and encoder
US6895048B2 (en) * 1998-03-20 2005-05-17 International Business Machines Corporation Adaptive encoding of a sequence of still frames or partially still frames within motion video
JP2001245303A (ja) * 2000-02-29 2001-09-07 Toshiba Corp 動画像符号化装置および動画像符号化方法
US7042948B2 (en) * 2001-03-05 2006-05-09 Intervideo, Inc. Systems and methods for management of data in a ring buffer for error resilient decoding of a video bitstream
US7072393B2 (en) * 2001-06-25 2006-07-04 International Business Machines Corporation Multiple parallel encoders and statistical analysis thereof for encoding a video sequence
EP1513350A1 (en) * 2003-09-03 2005-03-09 Thomson Licensing S.A. Process and arrangement for encoding video pictures
US7346106B1 (en) * 2003-12-30 2008-03-18 Apple Inc. Robust multi-pass variable bit rate encoding
US7349472B2 (en) * 2004-02-11 2008-03-25 Mitsubishi Electric Research Laboratories, Inc. Rate-distortion models for error resilient video transcoding
US7933328B2 (en) * 2005-02-02 2011-04-26 Broadcom Corporation Rate control for digital video compression processing
US8693537B2 (en) * 2005-03-01 2014-04-08 Qualcomm Incorporated Region-of-interest coding with background skipping for video telephony
US20060227870A1 (en) * 2005-03-10 2006-10-12 Tao Tian Context-adaptive bandwidth adjustment in video rate control
US8139090B2 (en) * 2005-03-10 2012-03-20 Mitsubishi Electric Corporation Image processor, image processing method, and image display device
US20070025441A1 (en) * 2005-07-28 2007-02-01 Nokia Corporation Method, module, device and system for rate control provision for video encoders capable of variable bit rate encoding
CN100574427C (zh) * 2005-08-26 2009-12-23 华中科技大学 视频编码比特率的控制方法
US7876819B2 (en) * 2005-09-22 2011-01-25 Qualcomm Incorporated Two pass rate control techniques for video coding using rate-distortion characteristics
US8077775B2 (en) * 2006-05-12 2011-12-13 Freescale Semiconductor, Inc. System and method of adaptive rate control for a video encoder
WO2007143876A1 (en) * 2006-06-09 2007-12-21 Thomson Licensing Method and apparatus for adaptively determining a bit budget for encoding video pictures

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005204158A (ja) * 2004-01-16 2005-07-28 Mitsubishi Electric Corp 画像符号化装置
JP2006121657A (ja) * 2004-07-08 2006-05-11 Qualcomm Inc ビデオ符号化のための効率的なレート制御技術
WO2006099226A1 (en) * 2005-03-10 2006-09-21 Qualcomm Incorporated Quasi-constant-quality rate control with look-ahead

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2024124559A (ja) * 2020-12-15 2024-09-12 日本電気株式会社 符号化装置および復号装置
US12425594B2 (en) 2020-12-15 2025-09-23 Nec Corporation Encoding device, decoding device, encoding method, decoding method, and program

Also Published As

Publication number Publication date
WO2008042259A3 (en) 2008-07-31
US20100111163A1 (en) 2010-05-06
JP5087627B2 (ja) 2012-12-05
KR20090074173A (ko) 2009-07-06
KR101329860B1 (ko) 2013-11-14
EP2067358A2 (en) 2009-06-10
CN101518088B (zh) 2013-02-20
CN101518088A (zh) 2009-08-26
WO2008042259A2 (en) 2008-04-10

Similar Documents

Publication Publication Date Title
JP5087627B2 (ja) 効果的なレート制御および拡張したビデオ符号化品質のためのρ領域フレームレベルビット割り当てのための方法
Wang et al. Rate-distortion optimization of rate control for H. 264 with adaptive initial quantization parameter determination
CN103402099B (zh) 视频编码的图片级速率控制的方法和系统
US8542733B2 (en) Multipass video rate control to match sliding window channel constraints
EP1549074A1 (en) A bit-rate control method and device combined with rate-distortion optimization
US20070274396A1 (en) Complexity adaptive skip mode estimation for video encoding
US10432961B2 (en) Video encoding optimization of extended spaces including last stage processes
US9392280B1 (en) Apparatus and method for using an alternate reference frame to decode a video frame
KR100960249B1 (ko) Min-max 접근법을 이용하여 비디오 코딩을 하기 위한2 패스 레이트 제어 기술
KR101959490B1 (ko) 비디오 비트율 제어 방법 및 그 장치
Lei et al. Rate adaptation transcoding for precoded video streams
JP5087624B2 (ja) 解析的且つ実験的な複合型の符号化歪みモデル化のための方法及び装置
Martins et al. Statistical motion learning for improved transform domain Wyner–Ziv video coding
JP5173409B2 (ja) 符号化装置および符号化装置を備えた動画像記録システム
Lei et al. Accurate bit allocation and rate control for DCT domain video transcoding
US8654844B1 (en) Intra frame beating effect reduction
KR20130032807A (ko) 동영상 부호화 장치 및 방법
Liu et al. Joint temporal-spatial rate control with approximating rate-distortion models
Li et al. Low-delay window-based rate control scheme for video quality optimization in video encoder
KR20030083109A (ko) 비트율 변환부호화장치
JPH11196423A (ja) 画像処理装置および方法、並びに提供媒体
Park PSNR-based initial QP determination for low bit rate video coding
Zheng et al. Consistent quality control for wireless video surveillance using distributed video coding
Chen An intra-rate estimation method for H. 264 rate control
Chang et al. Improved MB-layer rate control for H. 264/AVC

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100927

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120120

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120419

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120426

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120718

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120810

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120910

R150 Certificate of patent or registration of utility model

Ref document number: 5087627

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150914

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees