JPH0998427A - 動画像符号化装置 - Google Patents
動画像符号化装置Info
- Publication number
- JPH0998427A JPH0998427A JP7276988A JP27698895A JPH0998427A JP H0998427 A JPH0998427 A JP H0998427A JP 7276988 A JP7276988 A JP 7276988A JP 27698895 A JP27698895 A JP 27698895A JP H0998427 A JPH0998427 A JP H0998427A
- Authority
- JP
- Japan
- Prior art keywords
- code amount
- generated code
- generated
- code
- variable length
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
(57)【要約】
【課題】量子化ステップ幅と発生符号量の関係を高精度
に推定できるように発生符号量を収集することを可能と
した動画像符号化装置を提供する。 【解決手段】入力画像信号10について動き補償予測を
行って得られた予測残差信号を直交変換し、得られた直
交変換係数を量子化した後、可変長符号化し、得られた
可変長符号22と動き補償予測において検出された動き
ベクトル情報および符号化モード情報を含む付加情報2
3とを出力符号31とする動画像符号化装置において、
出力符号31の発生符号量を可変長符号22の少なくと
も一部の符号量を含む第1の発生符号量と少なくとも付
加情報23の符号量を含む第2の発生符号量とに分離し
て収集する発生符号量収集回路23を有する。
に推定できるように発生符号量を収集することを可能と
した動画像符号化装置を提供する。 【解決手段】入力画像信号10について動き補償予測を
行って得られた予測残差信号を直交変換し、得られた直
交変換係数を量子化した後、可変長符号化し、得られた
可変長符号22と動き補償予測において検出された動き
ベクトル情報および符号化モード情報を含む付加情報2
3とを出力符号31とする動画像符号化装置において、
出力符号31の発生符号量を可変長符号22の少なくと
も一部の符号量を含む第1の発生符号量と少なくとも付
加情報23の符号量を含む第2の発生符号量とに分離し
て収集する発生符号量収集回路23を有する。
Description
【0001】
【発明の属する技術分野】本発明は、動き補償予測と直
交変換を用いた動画像符号化装置に係り、特に発生符号
量に基づいた符号量制御を行う動画像符号化装置に関す
る。
交変換を用いた動画像符号化装置に係り、特に発生符号
量に基づいた符号量制御を行う動画像符号化装置に関す
る。
【0002】
【従来の技術】動画像の圧縮符号化方式の国際規格とし
て、比較的低ビットレートの蓄積メディアをターゲット
としたMPEG−1(ISO/IEC11172)や、次世代のディジ
タル放送、VOD(Video On Demand)、あるいはDVD
(Digital Video Disk)などへの応用が期待されているM
PEG−2(ISO/IEC13818)などが知られている。
て、比較的低ビットレートの蓄積メディアをターゲット
としたMPEG−1(ISO/IEC11172)や、次世代のディジ
タル放送、VOD(Video On Demand)、あるいはDVD
(Digital Video Disk)などへの応用が期待されているM
PEG−2(ISO/IEC13818)などが知られている。
【0003】MPEG符号化方式では、動き補償予測と
DCT(離散コサイン変換)をベースにしたエントロピ
ー符号化が用いられているため、均一な画質での符号化
を行う場合、入力画像の予測効率や解像度といった性質
に応じて、発生符号量が大幅に変動する。しかし、伝送
路やメディアの制約から、発生符号量の時間変動は規定
された範囲の中に制限される必要がある。従来では、発
生符号量の目標符号量からのずれから、DCT係数の量
子化ステップ幅を制御するフィードバック制御のレート
制御回路により、これらの条件を満たすように発生符号
量の制御を行っている。
DCT(離散コサイン変換)をベースにしたエントロピ
ー符号化が用いられているため、均一な画質での符号化
を行う場合、入力画像の予測効率や解像度といった性質
に応じて、発生符号量が大幅に変動する。しかし、伝送
路やメディアの制約から、発生符号量の時間変動は規定
された範囲の中に制限される必要がある。従来では、発
生符号量の目標符号量からのずれから、DCT係数の量
子化ステップ幅を制御するフィードバック制御のレート
制御回路により、これらの条件を満たすように発生符号
量の制御を行っている。
【0004】すなわち、図13は従来の動画像符号化装
置におけるレート制御回路の構成例を示した図であり、
目標符号量110と実際の発生符号量117との誤差を
積分器112で累積加算し、その積分値113に応じて
量子化ステップ幅の修正を順次行うフィードバック制御
系を構成している。この場合、フィードバックされる発
生符号量は、マクロブロック単位あるいはフレーム単位
での発生符号量の総和が用いられる。
置におけるレート制御回路の構成例を示した図であり、
目標符号量110と実際の発生符号量117との誤差を
積分器112で累積加算し、その積分値113に応じて
量子化ステップ幅の修正を順次行うフィードバック制御
系を構成している。この場合、フィードバックされる発
生符号量は、マクロブロック単位あるいはフレーム単位
での発生符号量の総和が用いられる。
【0005】このようなレート制御を行った場合、入力
画像の動きが激しく予測効率が低い場合や、解像度が高
くフレーム内の情報量が大きい場合、量子化による符号
化歪みが大きくなり、画質劣化が顕著となる。
画像の動きが激しく予測効率が低い場合や、解像度が高
くフレーム内の情報量が大きい場合、量子化による符号
化歪みが大きくなり、画質劣化が顕著となる。
【0006】伝送方式として固定レート伝送方式を用い
た場合は、発生符号量の時間変動は平滑化バッファによ
って吸収される範囲で変動することが許される。伝送レ
ートを時間的に変動させる可変レート伝送方式では、伝
送路の最大レートと平滑化バッファサイズにより制限さ
れる範囲で、固定レート伝送に比べて大幅な発生符号量
の時間変動が許容される。固定レート伝送方式および可
変レート伝送のいずれにおいても、入力画像の性質に応
じた最適な符号量配分と安定したレート制御を行うこと
で、より高能率な符号化を実現することが可能となる。
た場合は、発生符号量の時間変動は平滑化バッファによ
って吸収される範囲で変動することが許される。伝送レ
ートを時間的に変動させる可変レート伝送方式では、伝
送路の最大レートと平滑化バッファサイズにより制限さ
れる範囲で、固定レート伝送に比べて大幅な発生符号量
の時間変動が許容される。固定レート伝送方式および可
変レート伝送のいずれにおいても、入力画像の性質に応
じた最適な符号量配分と安定したレート制御を行うこと
で、より高能率な符号化を実現することが可能となる。
【0007】
【発明が解決しようとする課題】量子化ステップ幅の動
的な制御による符号量制御において、より安定で高能率
な符号量制御を実現するためには、量子化ステップ幅と
発生符号量の関係を精度よく推定できることが重要とな
る。
的な制御による符号量制御において、より安定で高能率
な符号量制御を実現するためには、量子化ステップ幅と
発生符号量の関係を精度よく推定できることが重要とな
る。
【0008】また、特に蓄積系への応用では実時間での
符号化は必ずしも要求されず、できるだけ効率的な符号
化による記録時間の拡大や高画質化が重要となる。この
ような応用では、事前に一連の入力画像シーケンス全体
の性質を分析して、量子化ステップ幅と発生符号量の関
係を精度よく推定し、その結果に基づいて最適な符号量
制御を行うことが有効であると考えられる。
符号化は必ずしも要求されず、できるだけ効率的な符号
化による記録時間の拡大や高画質化が重要となる。この
ような応用では、事前に一連の入力画像シーケンス全体
の性質を分析して、量子化ステップ幅と発生符号量の関
係を精度よく推定し、その結果に基づいて最適な符号量
制御を行うことが有効であると考えられる。
【0009】しかし、量子化ステップ幅と発生符号量と
の関係は、入力画像の性質や符号化方式に大きく依存し
ており、高精度にその関係を推定することは一般に困難
である。
の関係は、入力画像の性質や符号化方式に大きく依存し
ており、高精度にその関係を推定することは一般に困難
である。
【0010】本発明は、高能率で安定した符号量制御に
よる高画質化を実現するため、量子化ステップ幅と発生
符号量の関係を高精度に推定できるように発生符号量を
収集することを可能とした動画像符号化装置を提供する
ことを目的とする。
よる高画質化を実現するため、量子化ステップ幅と発生
符号量の関係を高精度に推定できるように発生符号量を
収集することを可能とした動画像符号化装置を提供する
ことを目的とする。
【0011】
【課題を解決するための手段】上記の課題を解決するた
め、本発明は入力される動画像信号について動き補償予
測を行って得られた予測残差信号を直交変換し、得られ
た直交変換係数を量子化した後、可変長符号化を行い、
その可変長符号と動き補償予測において検出された動き
ベクトル情報および符号化モード情報を含む付加情報と
を出力符号とする動画像符号化装置において、出力符号
の発生符号量を可変長符号の少なくとも一部の符号量を
含む第1の発生符号量と少なくとも付加情報の符号量を
含む第2の発生符号量とに分離して収集する発生符号量
収集手段を備えたことを基本的な特徴とする。
め、本発明は入力される動画像信号について動き補償予
測を行って得られた予測残差信号を直交変換し、得られ
た直交変換係数を量子化した後、可変長符号化を行い、
その可変長符号と動き補償予測において検出された動き
ベクトル情報および符号化モード情報を含む付加情報と
を出力符号とする動画像符号化装置において、出力符号
の発生符号量を可変長符号の少なくとも一部の符号量を
含む第1の発生符号量と少なくとも付加情報の符号量を
含む第2の発生符号量とに分離して収集する発生符号量
収集手段を備えたことを基本的な特徴とする。
【0012】また、本発明は上記の基本構成に加えて、
発生符号量収集手段により収集された発生符号量に基づ
いて少なくとも直交変換係数の量子化手段における量子
化ステップ幅を制御することにより出力符号の発生符号
量を制御する符号量制御手段を備えたことを特徴とす
る。この符号量制御手段は、例えば第1の発生符号量と
その目標符号量との誤差および第2の発生符号量とその
目標符号量との誤差の重み付け加算値を用いて量子化ス
テップ幅を制御するように構成される。
発生符号量収集手段により収集された発生符号量に基づ
いて少なくとも直交変換係数の量子化手段における量子
化ステップ幅を制御することにより出力符号の発生符号
量を制御する符号量制御手段を備えたことを特徴とす
る。この符号量制御手段は、例えば第1の発生符号量と
その目標符号量との誤差および第2の発生符号量とその
目標符号量との誤差の重み付け加算値を用いて量子化ス
テップ幅を制御するように構成される。
【0013】また、本発明は上記の基本構成に加えて、
発生符号量収集手段により収集された発生符号量に基づ
いて入力画像信号のシーケンス全体にわたる発生符号量
の配分をフレーム単位または所定の領域単位に行う符号
量配分手段を有し、この符号量配分手段により配分され
た符号量に基づいて入力画像信号のシーケンス全体の再
符号化を行うことを特徴とする。入力画像信号のシーケ
ンス全体とは、例えば1本の映画などの入力画像信号の
データをいう。
発生符号量収集手段により収集された発生符号量に基づ
いて入力画像信号のシーケンス全体にわたる発生符号量
の配分をフレーム単位または所定の領域単位に行う符号
量配分手段を有し、この符号量配分手段により配分され
た符号量に基づいて入力画像信号のシーケンス全体の再
符号化を行うことを特徴とする。入力画像信号のシーケ
ンス全体とは、例えば1本の映画などの入力画像信号の
データをいう。
【0014】また、本発明は発生符号量収集手段におい
て直交変換係数の交流成分に対応する発生符号量を第1
の発生符号量として収集し、直交変換係数の直流成分に
対応する発生符号量を第2の発生符号量に含めて収集す
ることを特徴とする。
て直交変換係数の交流成分に対応する発生符号量を第1
の発生符号量として収集し、直交変換係数の直流成分に
対応する発生符号量を第2の発生符号量に含めて収集す
ることを特徴とする。
【0015】また、本発明は発生符号量収集手段におい
て、フレーム内符号化ブロックの直交変換係数に対応す
る発生符号量と、フレーム間符号化ブロックの直交変換
係数に対応する発生符号量とをそれぞれ独立に収集する
ことを特徴とする。
て、フレーム内符号化ブロックの直交変換係数に対応す
る発生符号量と、フレーム間符号化ブロックの直交変換
係数に対応する発生符号量とをそれぞれ独立に収集する
ことを特徴とする。
【0016】前述したように、動画像信号を動き補償予
測と直交変換により符号化する方式では、発生符号量と
量子化ステップ幅の関係は符号化方式と入力画像の性質
に依存するために、一般的な定式化が困難であるが、与
えられたある量子化ステップ幅に対する発生符号量を例
えば1つまたは複数のマクロブロックあるいはフレーム
単位に実測し、この実測結果から他の量子化ステップ幅
で量子化した場合の発生符号量を推定することが可能で
ある。
測と直交変換により符号化する方式では、発生符号量と
量子化ステップ幅の関係は符号化方式と入力画像の性質
に依存するために、一般的な定式化が困難であるが、与
えられたある量子化ステップ幅に対する発生符号量を例
えば1つまたは複数のマクロブロックあるいはフレーム
単位に実測し、この実測結果から他の量子化ステップ幅
で量子化した場合の発生符号量を推定することが可能で
ある。
【0017】この点に着目し、本発明では発生符号量の
計測の際に、量子化ステップ幅と一般に単調な関係にあ
る直交変換係数に対応した発生符号量と、量子化ステッ
プ幅との相関が低い動きベクトル情報や符号化モード情
報などの付加情報の発生符号量を独立に収集することに
よって、量子化ステップ幅に対する発生符号量の関係を
高精度に推定することが可能となる。
計測の際に、量子化ステップ幅と一般に単調な関係にあ
る直交変換係数に対応した発生符号量と、量子化ステッ
プ幅との相関が低い動きベクトル情報や符号化モード情
報などの付加情報の発生符号量を独立に収集することに
よって、量子化ステップ幅に対する発生符号量の関係を
高精度に推定することが可能となる。
【0018】MPEGの符号化方式においては、フレー
ム内符号化マクロブロックの直交変換係数は、通常は符
号量制御のための量子化ステップ幅制御の影響を受け
ず、固定の量子化幅で量子化されて符号化される。これ
は人間の視覚特性を考慮したものであり、視覚的に目立
ちやすい空間周波数の低周波成分の歪みを抑えるためで
ある。そこで、本発明では直交変換係数の交流成分と直
流成分に対応した発生符号量を独立に収集し、量子ステ
ップ幅との相関が低いフレーム内符号化マクロブロック
の直流成分に対応した発生符号量を切り離すことで、さ
らに高精度な発生符号量と量子化ステップ幅との関係の
推定が可能となる。また、発生符号量の収集の際に、フ
レーム内符号化マクロブロックの直流成分の符号量を付
加情報の符号量と同等に扱うことにより、発生符号量収
集回路を簡素化することが可能となる。
ム内符号化マクロブロックの直交変換係数は、通常は符
号量制御のための量子化ステップ幅制御の影響を受け
ず、固定の量子化幅で量子化されて符号化される。これ
は人間の視覚特性を考慮したものであり、視覚的に目立
ちやすい空間周波数の低周波成分の歪みを抑えるためで
ある。そこで、本発明では直交変換係数の交流成分と直
流成分に対応した発生符号量を独立に収集し、量子ステ
ップ幅との相関が低いフレーム内符号化マクロブロック
の直流成分に対応した発生符号量を切り離すことで、さ
らに高精度な発生符号量と量子化ステップ幅との関係の
推定が可能となる。また、発生符号量の収集の際に、フ
レーム内符号化マクロブロックの直流成分の符号量を付
加情報の符号量と同等に扱うことにより、発生符号量収
集回路を簡素化することが可能となる。
【0019】ブロックあるいはマクロブロック単位にフ
レーム内符号化とフレーム間符号化とを切り替えて符号
化する符号化方式においては、フレーム内符号化とフレ
ーム間符号化の符号化特性の違いを考慮し、それぞれの
場合の発生符号量を独立に集計することで、より高精度
に量子化ステップ幅に対する発生符号量の関係を推定す
ることが可能となる。
レーム内符号化とフレーム間符号化とを切り替えて符号
化する符号化方式においては、フレーム内符号化とフレ
ーム間符号化の符号化特性の違いを考慮し、それぞれの
場合の発生符号量を独立に集計することで、より高精度
に量子化ステップ幅に対する発生符号量の関係を推定す
ることが可能となる。
【0020】実時間符号化においては、次に符号化すべ
き画像に対する符号量の割り当てや量子化ステップ幅の
決定に、それまでに符号化された画像の発生符号量と量
子化ステップ幅の関係を用いることで、より安定した符
号化制御を実現することが可能となる。発生符号量をフ
ィードバックさせて目標符号量との誤差の累積値から次
の量子化ステップ幅を決定するフィードバックレート制
御系においても、発生符号量のうち量子化ステップ幅の
相関のある部分と相関のない部分を分離して処理するこ
とで、フィードバック系をより安定化させることも可能
となる。
き画像に対する符号量の割り当てや量子化ステップ幅の
決定に、それまでに符号化された画像の発生符号量と量
子化ステップ幅の関係を用いることで、より安定した符
号化制御を実現することが可能となる。発生符号量をフ
ィードバックさせて目標符号量との誤差の累積値から次
の量子化ステップ幅を決定するフィードバックレート制
御系においても、発生符号量のうち量子化ステップ幅の
相関のある部分と相関のない部分を分離して処理するこ
とで、フィードバック系をより安定化させることも可能
となる。
【0021】実時間符号化が要求されないDVD(Digit
al Vidoe Disc)等のメディアを用いた蓄積系への応用で
は、入力画像信号のシーケンス全体にわたってマクロブ
ロック単位あるいはフレーム単位の発生符号量を収集
し、この収集された発生符号量に基づいて入力画像信号
のシーケンス全体にわたる最適な発生符号量の配分をフ
レーム単位またはマクロブロック単位などの領域単位に
施した後、予め蓄積しておいた同じ入力画像信号のシー
ケンス全体または一部について再符号化を行うことによ
り、より高能率で高画質な符号化を実現することが可能
となる。
al Vidoe Disc)等のメディアを用いた蓄積系への応用で
は、入力画像信号のシーケンス全体にわたってマクロブ
ロック単位あるいはフレーム単位の発生符号量を収集
し、この収集された発生符号量に基づいて入力画像信号
のシーケンス全体にわたる最適な発生符号量の配分をフ
レーム単位またはマクロブロック単位などの領域単位に
施した後、予め蓄積しておいた同じ入力画像信号のシー
ケンス全体または一部について再符号化を行うことによ
り、より高能率で高画質な符号化を実現することが可能
となる。
【0022】
(第1の実施形態)図1は、本発明の第1の実施形態に
係る動画像符号化装置の構成を示すブロック図である。
動画像信号である入力画像信号10は、まずフレームメ
モリからなるリオーダリングバッファ11により入力順
と符号化順の入れ替えが行われる。この入れ替え後の画
像信号12は動き検出回路13に入力され、ここでマク
ロブロック単位の動きベクトル検出と符号化モードの決
定が行われる。符号化モードとしては、フレーム予測/
フィールド予測符号化と、前方予測/後方予測/両方向
予測/イントラ符号化等の組み合わせでマクロブロック
単位に決定される。
係る動画像符号化装置の構成を示すブロック図である。
動画像信号である入力画像信号10は、まずフレームメ
モリからなるリオーダリングバッファ11により入力順
と符号化順の入れ替えが行われる。この入れ替え後の画
像信号12は動き検出回路13に入力され、ここでマク
ロブロック単位の動きベクトル検出と符号化モードの決
定が行われる。符号化モードとしては、フレーム予測/
フィールド予測符号化と、前方予測/後方予測/両方向
予測/イントラ符号化等の組み合わせでマクロブロック
単位に決定される。
【0023】イントラ符号化(フレーム内符号化)マク
ロブロックでは、スイッチ14で入力画像信号が選択さ
れ、この選択された入力画像信号15そのものがDCT
回路17により離散コサイン変換される。予測符号化
(フレーム間符号化)マクロブロックでは、参照画像メ
モリ38に参照画像信号として格納されている前フレー
ムの局部復号画像信号39から動き補償回路40により
作成された参照マクロブロック42と入力画像信号のマ
クロブロックとの差である予測残差信号16がスイッチ
14で選択され、この予測残差信号16がDCT回路1
7により離散コサイン変換される。離散コサイン変換に
より得られた直交変換係数すなわちDCT係数18は、
量子化回路19により量子化される。
ロブロックでは、スイッチ14で入力画像信号が選択さ
れ、この選択された入力画像信号15そのものがDCT
回路17により離散コサイン変換される。予測符号化
(フレーム間符号化)マクロブロックでは、参照画像メ
モリ38に参照画像信号として格納されている前フレー
ムの局部復号画像信号39から動き補償回路40により
作成された参照マクロブロック42と入力画像信号のマ
クロブロックとの差である予測残差信号16がスイッチ
14で選択され、この予測残差信号16がDCT回路1
7により離散コサイン変換される。離散コサイン変換に
より得られた直交変換係数すなわちDCT係数18は、
量子化回路19により量子化される。
【0024】量子化回路19により量子化されたDCT
係数20は、逆量子化回路32で逆量子化されて量子化
前のDCT係数33が生成され、このDCT係数33は
逆DCT回路34により逆離散コサイン変換されて予測
残差信号35が生成される。この予測残差信号35は加
算器36で動き補償回路40からの参照画像信号41と
加算されて局部復号画像信号37が生成され、この局部
復号信号37が参照画像メモリ38に参照画像信号とし
て格納される。
係数20は、逆量子化回路32で逆量子化されて量子化
前のDCT係数33が生成され、このDCT係数33は
逆DCT回路34により逆離散コサイン変換されて予測
残差信号35が生成される。この予測残差信号35は加
算器36で動き補償回路40からの参照画像信号41と
加算されて局部復号画像信号37が生成され、この局部
復号信号37が参照画像メモリ38に参照画像信号とし
て格納される。
【0025】また、量子化回路19により量子化された
DCT係数20は、可変長符号化回路21にも入力され
て可変長符号符号22に変換され、動きベクトル情報お
よび符号化モード情報からなる付加情報23とともに文
法生成/データ多重化回路28により符号化データ29
に変換される。この符号化データ29は、送信バッファ
30を経て伝送路に最終的な出力符号化データ31とし
て送出される。
DCT係数20は、可変長符号化回路21にも入力され
て可変長符号符号22に変換され、動きベクトル情報お
よび符号化モード情報からなる付加情報23とともに文
法生成/データ多重化回路28により符号化データ29
に変換される。この符号化データ29は、送信バッファ
30を経て伝送路に最終的な出力符号化データ31とし
て送出される。
【0026】ここで、可変長符号化回路21から出力さ
れる量子化されたDCT係数の可変長符号22と動きベ
クトル情報および符号化モード情報を含む付加情報23
は、発生符号量収集回路24にも入力され、これら可変
長符号22および付加情報23の各々の発生符号量がフ
レーム単位またはマクロブロック単位に収集される。D
CT係数の可変長符号22の符号量の収集については、
イントラ符号化/予測符号化のマクロブロック符号化モ
ード毎に独立に累積加算してフレーム単位の発生符号量
を求めたり、イントラ符号化マクロブロックでは、DC
T係数の直流成分の符号量と交流成分の符号量を独立に
収集することも可能となっている。
れる量子化されたDCT係数の可変長符号22と動きベ
クトル情報および符号化モード情報を含む付加情報23
は、発生符号量収集回路24にも入力され、これら可変
長符号22および付加情報23の各々の発生符号量がフ
レーム単位またはマクロブロック単位に収集される。D
CT係数の可変長符号22の符号量の収集については、
イントラ符号化/予測符号化のマクロブロック符号化モ
ード毎に独立に累積加算してフレーム単位の発生符号量
を求めたり、イントラ符号化マクロブロックでは、DC
T係数の直流成分の符号量と交流成分の符号量を独立に
収集することも可能となっている。
【0027】次に、発生符号量収集回路24について詳
細に説明する。図2は、発生符号量収集回路24の一構
成例を示した図である。量子化されたDCT係数の可変
長符号22の符号量を示すDCT係数符号量データ15
0と、動きベクトル情報および符号化モード情報等を含
む付加情報23の符号量を示す付加情報符号量データ1
51が図示しない符号量計算部によって生成され、セレ
クタ152に入力される。
細に説明する。図2は、発生符号量収集回路24の一構
成例を示した図である。量子化されたDCT係数の可変
長符号22の符号量を示すDCT係数符号量データ15
0と、動きベクトル情報および符号化モード情報等を含
む付加情報23の符号量を示す付加情報符号量データ1
51が図示しない符号量計算部によって生成され、セレ
クタ152に入力される。
【0028】セレクタ152では、DCT係数符号量デ
ータ150の交流成分と直流成分が分離して取り出さ
れ、交流成分は積分器153によって、また直流成分と
付加情報符号量データ151は積分器154によって、
それぞれマクロブロック単位に累積加算され、マクロブ
ロック単位の発生符号量データ155,156が生成さ
れる。これらマクロブロック単位の発生符号量データ1
55,156は、さらに積分器157,158によりそ
れぞれフレーム単位に累積加算され、フレーム単位の発
生符号量データ159,160が生成される。これらの
発生符号量データ155,157,159,160は、
まとめて図1のレート制御部26へ発生符号量データ2
5として送られる。
ータ150の交流成分と直流成分が分離して取り出さ
れ、交流成分は積分器153によって、また直流成分と
付加情報符号量データ151は積分器154によって、
それぞれマクロブロック単位に累積加算され、マクロブ
ロック単位の発生符号量データ155,156が生成さ
れる。これらマクロブロック単位の発生符号量データ1
55,156は、さらに積分器157,158によりそ
れぞれフレーム単位に累積加算され、フレーム単位の発
生符号量データ159,160が生成される。これらの
発生符号量データ155,157,159,160は、
まとめて図1のレート制御部26へ発生符号量データ2
5として送られる。
【0029】図3は、発生符号量収集回路24の他の構
成例を示す図である。図2と同様に量子化されたDCT
係数の可変長符号22の符号量を示すDCT係数符号量
データ190と、動きベクトル情報および符号化モード
情報を含む付加情報の符号量を示す付加情報符号量デー
タ191が生成される。セレクタ182によりDCT係
数符号量データ190のうち交流成分の符号量データ1
93と直流成分の符号量データ194とが分離され、交
流成分の符号量データ193はさらにセレクタ195で
イントラ符号化マクロブロックの符号量データと予測符
号化マクロブロックの符号量データに分離される。
成例を示す図である。図2と同様に量子化されたDCT
係数の可変長符号22の符号量を示すDCT係数符号量
データ190と、動きベクトル情報および符号化モード
情報を含む付加情報の符号量を示す付加情報符号量デー
タ191が生成される。セレクタ182によりDCT係
数符号量データ190のうち交流成分の符号量データ1
93と直流成分の符号量データ194とが分離され、交
流成分の符号量データ193はさらにセレクタ195で
イントラ符号化マクロブロックの符号量データと予測符
号化マクロブロックの符号量データに分離される。
【0030】一方、付加情報符号量データ191はセレ
クタ192で分離されたDCT係数符号量データ190
の交流成分の符号量データ194とともにセレクタ19
6に入力され、イントラ符号化マクロブロックの符号量
データと予測符号化マクロブロックの符号量データとに
分離される。
クタ192で分離されたDCT係数符号量データ190
の交流成分の符号量データ194とともにセレクタ19
6に入力され、イントラ符号化マクロブロックの符号量
データと予測符号化マクロブロックの符号量データとに
分離される。
【0031】DCT係数符号量データ190の交流成分
の符号量データ193のうちのイントラ符号化マクロブ
ロックの符号量データは積分器197によって、予測符
号化マクロブロックの符号量データは積分器198によ
ってそれぞれマクロブロック単位に累積加算される。同
様に、付加情報符号量データ191およびDCT係数符
号量データ190の交流成分の符号量データ194のイ
ントラ符号化マクロブロックの符号量データは積分器1
99によって、予測符号化マクロブロックの符号量デー
タは積分器200によってそれぞれマクロブロック単位
に累積加算される。このようにして生成されたマクロブ
ロック単位の発生符号量データ201,202,20
3,204は、さらに積分器205,206,207,
208によってそれぞれフレーム単位に累積加算される
ことにより、フレーム単位の発生符号量データ209,
210,211,212が生成される。そして、これら
の発生符号量データ201〜204,209〜212
は、まとめて図1のレート制御部26へ発生符号量デー
タ25として送られる。
の符号量データ193のうちのイントラ符号化マクロブ
ロックの符号量データは積分器197によって、予測符
号化マクロブロックの符号量データは積分器198によ
ってそれぞれマクロブロック単位に累積加算される。同
様に、付加情報符号量データ191およびDCT係数符
号量データ190の交流成分の符号量データ194のイ
ントラ符号化マクロブロックの符号量データは積分器1
99によって、予測符号化マクロブロックの符号量デー
タは積分器200によってそれぞれマクロブロック単位
に累積加算される。このようにして生成されたマクロブ
ロック単位の発生符号量データ201,202,20
3,204は、さらに積分器205,206,207,
208によってそれぞれフレーム単位に累積加算される
ことにより、フレーム単位の発生符号量データ209,
210,211,212が生成される。そして、これら
の発生符号量データ201〜204,209〜212
は、まとめて図1のレート制御部26へ発生符号量デー
タ25として送られる。
【0032】レート制御回路26では、発生符号量収集
回路24で得られた発生符号量データ25に基づいて、
量子化器19での量子化ステップ幅の制御を動的に行
い、規定された伝送レートおよび送受信バッファサイズ
(送信バッファ30の容量)を破綻させないための発生
符号量制御を行う。
回路24で得られた発生符号量データ25に基づいて、
量子化器19での量子化ステップ幅の制御を動的に行
い、規定された伝送レートおよび送受信バッファサイズ
(送信バッファ30の容量)を破綻させないための発生
符号量制御を行う。
【0033】図4は、レート制御回路26の具体的な構
成例を示したものである。レート制御回路26には、フ
レーム単位の目標符号量データ170が与えられ、この
目標符号量データ170は乗算器171,172によっ
てA/A+B,B/A+Bがそれぞれ乗じられ、量子化
制御の直接の影響を受けるDCT係数の交流成分の目標
符号量データと、その他の目標符号量データ、すなわち
DCT係数の直流成分と付加情報の目標符号量データと
に分離される。このように目標符号量データを分離する
ために乗算器171,172に与えられる係数A,B
は、それぞれそれ以前に符号化されたフレームにおける
DCT係数の交流成分の符号量とその他の符号量との比
率とする。乗算器171,172で分離された各目標符
号量データは、乗算器173,174においてフレーム
単位のマクロブロックの数MBで除算され、1マクロブ
ロック当たりの目標符号量データとなる。
成例を示したものである。レート制御回路26には、フ
レーム単位の目標符号量データ170が与えられ、この
目標符号量データ170は乗算器171,172によっ
てA/A+B,B/A+Bがそれぞれ乗じられ、量子化
制御の直接の影響を受けるDCT係数の交流成分の目標
符号量データと、その他の目標符号量データ、すなわち
DCT係数の直流成分と付加情報の目標符号量データと
に分離される。このように目標符号量データを分離する
ために乗算器171,172に与えられる係数A,B
は、それぞれそれ以前に符号化されたフレームにおける
DCT係数の交流成分の符号量とその他の符号量との比
率とする。乗算器171,172で分離された各目標符
号量データは、乗算器173,174においてフレーム
単位のマクロブロックの数MBで除算され、1マクロブ
ロック当たりの目標符号量データとなる。
【0034】そして、符号化装置179から図2または
図3に示した発生符号量収集回路24によってそれぞれ
独立に求められたDCT係数の交流部分のマクロブロッ
ク単位の発生符号量データ182とその他の符号量デー
タ181と、それぞれの目標符号量データとの誤差が積
分器175,176で累積加算される。これらの累積加
算結果は乗算器177,178をそれぞれ介して重み付
き加算され、次マクロブロックの量子化ステップ幅の決
定に用いられる。マクロブロック毎の量子化ステップ幅
の初期値184は、目標符号量データ170から初期量
子化ステップ幅決定回路183により、後述する方法で
決定される。各マクロブロック量子化ステップ幅は、積
分器175,176の累積加算結果を乗算器177,1
78を介して重み付き加算した値と、量子化ステップ幅
の初期値184から動的に決定される。
図3に示した発生符号量収集回路24によってそれぞれ
独立に求められたDCT係数の交流部分のマクロブロッ
ク単位の発生符号量データ182とその他の符号量デー
タ181と、それぞれの目標符号量データとの誤差が積
分器175,176で累積加算される。これらの累積加
算結果は乗算器177,178をそれぞれ介して重み付
き加算され、次マクロブロックの量子化ステップ幅の決
定に用いられる。マクロブロック毎の量子化ステップ幅
の初期値184は、目標符号量データ170から初期量
子化ステップ幅決定回路183により、後述する方法で
決定される。各マクロブロック量子化ステップ幅は、積
分器175,176の累積加算結果を乗算器177,1
78を介して重み付き加算した値と、量子化ステップ幅
の初期値184から動的に決定される。
【0035】図5は、1フレーム当たりの発生符号量と
量子化ステップ幅の関係の例を示した図である。図中の
実線で示す曲線101および102は、それぞれ異なる
フレームに対する発生符号量と量子化ステップ幅との関
係を示している。通常、発生符号量と量子化ステップ幅
との間には負の相関があり、図5に示されるように量子
化ステップ幅に対して発生符号量は単調に減少する。た
だし、両者の関係は入力画像の空間解像度や予測効率等
に応じて、また符号化方式に応じても大きく異なる。
量子化ステップ幅の関係の例を示した図である。図中の
実線で示す曲線101および102は、それぞれ異なる
フレームに対する発生符号量と量子化ステップ幅との関
係を示している。通常、発生符号量と量子化ステップ幅
との間には負の相関があり、図5に示されるように量子
化ステップ幅に対して発生符号量は単調に減少する。た
だし、両者の関係は入力画像の空間解像度や予測効率等
に応じて、また符号化方式に応じても大きく異なる。
【0036】また、フレームの発生符号量の中には、量
子化の影響を直接受けるDCT係数の符号量と、入力画
像の性質に依存するが量子化の影響を直接受けない動き
ベクトルや符号化モード情報等の付加情報の符号量とが
含まれており、これらは分離して考えることが可能であ
る。図5では、破線103および104で示される符号
量がそれぞれ実線101および102に対応するフレー
ムの量子化の影響を直接受けない符号量部分に相当して
いる。通常は、レート制御が量子化ステップ幅の制御
で、発生符号量の制御を行っているため、フレーム単位
あるいはマクロブロック単位に図5で示される発生符号
量と量子化ステップ幅の関係を高精度に推定することが
レート制御の安定化と高能率化につながると考えられ
る。
子化の影響を直接受けるDCT係数の符号量と、入力画
像の性質に依存するが量子化の影響を直接受けない動き
ベクトルや符号化モード情報等の付加情報の符号量とが
含まれており、これらは分離して考えることが可能であ
る。図5では、破線103および104で示される符号
量がそれぞれ実線101および102に対応するフレー
ムの量子化の影響を直接受けない符号量部分に相当して
いる。通常は、レート制御が量子化ステップ幅の制御
で、発生符号量の制御を行っているため、フレーム単位
あるいはマクロブロック単位に図5で示される発生符号
量と量子化ステップ幅の関係を高精度に推定することが
レート制御の安定化と高能率化につながると考えられ
る。
【0037】そこで、本実施形態で説明したように、D
CT係数の符号量と動きベクトルや符号化モード等の付
加情報の符号量とを分離して実測することで、量子化ス
テップ幅に対する発生符号量の高精度な推定が可能とな
り、レート制御の改善による高能率・高画質符号化を実
現することができる。
CT係数の符号量と動きベクトルや符号化モード等の付
加情報の符号量とを分離して実測することで、量子化ス
テップ幅に対する発生符号量の高精度な推定が可能とな
り、レート制御の改善による高能率・高画質符号化を実
現することができる。
【0038】図6は、MPEGビデオ符号化における階
層構造を示した図である。入力ビデオシーケンスは、通
常10〜20程度のピクチャ(符号化されたフレーム)
で構成されるGOP(Group Of Pictures)に区切られ、
各ピクチャはイントラ符号化画像(I−picture)、前方
予測符号化画像(P−picture)および両方向符号化画像
(B−picture)の組み合わせとして符号化される。各ピ
クチャは16×16画素のマクロブロックに分割され、
各マクロブロック毎に動き補償予測符号化、あるいはイ
ントラ符号化等のモードが選択される。各マクロブロッ
クは、さらに8×8画素のブロックに分割され、それぞ
れのブロック毎に動き補償予測符号化マクロブロックで
は残差信号、イントラ符号化マクロブロックでは入力画
像信号に対してそれぞれDCTが施される。マクロブロ
ック以上の各階層では、それぞれヘッダ情報が符号化さ
れる。また、動きベクトルの情報は、可変長符号化され
て、符号化モード情報とともにマクロブロックのヘッダ
部分に多重される。動きベクトルや符号化モード情報の
符号量は、個々の入力画像の性質に応じて変動するもの
となるが、量子化の影響は直接的に大きく受けないの
で、各ヘッダ情報とあわせて図5における103および
104のような各ピクチャにおける固定符号量として近
似することが可能である。
層構造を示した図である。入力ビデオシーケンスは、通
常10〜20程度のピクチャ(符号化されたフレーム)
で構成されるGOP(Group Of Pictures)に区切られ、
各ピクチャはイントラ符号化画像(I−picture)、前方
予測符号化画像(P−picture)および両方向符号化画像
(B−picture)の組み合わせとして符号化される。各ピ
クチャは16×16画素のマクロブロックに分割され、
各マクロブロック毎に動き補償予測符号化、あるいはイ
ントラ符号化等のモードが選択される。各マクロブロッ
クは、さらに8×8画素のブロックに分割され、それぞ
れのブロック毎に動き補償予測符号化マクロブロックで
は残差信号、イントラ符号化マクロブロックでは入力画
像信号に対してそれぞれDCTが施される。マクロブロ
ック以上の各階層では、それぞれヘッダ情報が符号化さ
れる。また、動きベクトルの情報は、可変長符号化され
て、符号化モード情報とともにマクロブロックのヘッダ
部分に多重される。動きベクトルや符号化モード情報の
符号量は、個々の入力画像の性質に応じて変動するもの
となるが、量子化の影響は直接的に大きく受けないの
で、各ヘッダ情報とあわせて図5における103および
104のような各ピクチャにおける固定符号量として近
似することが可能である。
【0039】図7は、MPEGビデオ符号化における各
ブロックの2次元DCT係数のジグザクスキャン順を示
したものである。8×8画素ブロックの信号は、2次元
DCTが施されて8×8の2次元の係数となる。この2
次元の変換係数は、量子化された後に、図7に示すよう
に、空間周波数の低域成分から高域成分に向かうジグザ
グスキャン順に従って1次元への並べ替えを行い、可変
長のランレングス符号化が行われる。ただし、MPEG
ビデオ符号化では、イントラ符号化マクロブロックの各
ブロックでは、DCT係数のうち直流成分だけは、ブロ
ック歪み低減のために固定ステップ幅の量子化を行い、
その隣接ブロックとの差分値が可変長符号化される。つ
まり、イントラマクロブロックのDCT係数の直流成分
については、レート制御の量子化制御の影響を受けず
に、入力画像の性質にのみ依存してそのマクロブロック
に固有な符号量が決まることになる。従って、DCT係
数の符号量を集計する際に、イントラマクロブロックに
ついては、その直流成分の符号量を交流成分の符号量と
は独立に集計し、動きベクトルの符号量と同様に、量子
化制御の影響を受けない固定符号量として扱うことによ
り、前述の発生符号量と量子化ステップ幅の関係を精度
よく求めることが可能となる。
ブロックの2次元DCT係数のジグザクスキャン順を示
したものである。8×8画素ブロックの信号は、2次元
DCTが施されて8×8の2次元の係数となる。この2
次元の変換係数は、量子化された後に、図7に示すよう
に、空間周波数の低域成分から高域成分に向かうジグザ
グスキャン順に従って1次元への並べ替えを行い、可変
長のランレングス符号化が行われる。ただし、MPEG
ビデオ符号化では、イントラ符号化マクロブロックの各
ブロックでは、DCT係数のうち直流成分だけは、ブロ
ック歪み低減のために固定ステップ幅の量子化を行い、
その隣接ブロックとの差分値が可変長符号化される。つ
まり、イントラマクロブロックのDCT係数の直流成分
については、レート制御の量子化制御の影響を受けず
に、入力画像の性質にのみ依存してそのマクロブロック
に固有な符号量が決まることになる。従って、DCT係
数の符号量を集計する際に、イントラマクロブロックに
ついては、その直流成分の符号量を交流成分の符号量と
は独立に集計し、動きベクトルの符号量と同様に、量子
化制御の影響を受けない固定符号量として扱うことによ
り、前述の発生符号量と量子化ステップ幅の関係を精度
よく求めることが可能となる。
【0040】本実施形態では、フレーム単位の符号量を
R、量子化ステップ幅をQとし、その関係を以下のよう
にモデル化する。
R、量子化ステップ幅をQとし、その関係を以下のよう
にモデル化する。
【0041】 R(Q)=f(Q)+A (1) ここで、Aは量子化ステップ幅によらず固定の符号量、
fは量子化ステップ幅に依存する発生符号量を示す。固
定の符号量Aは、計測された発生符号量のうちDCT係
数の交流成分以外の符号量から求めることが可能であ
り、また関数fの近似係数は、計測されたDCT係数の
交流成分と量子化ステップ幅から、回帰分析等を用いて
推定される。
fは量子化ステップ幅に依存する発生符号量を示す。固
定の符号量Aは、計測された発生符号量のうちDCT係
数の交流成分以外の符号量から求めることが可能であ
り、また関数fの近似係数は、計測されたDCT係数の
交流成分と量子化ステップ幅から、回帰分析等を用いて
推定される。
【0042】図4で説明した初期量子化ステップ幅決定
回路183は、直前に符号化された1つあるいは複数の
フレームの発生符号量と量子化ステップ幅との関係から
上式の係数を求め、その逆関数R(Q)-1より初期量子
化ステップ幅を決定する。
回路183は、直前に符号化された1つあるいは複数の
フレームの発生符号量と量子化ステップ幅との関係から
上式の係数を求め、その逆関数R(Q)-1より初期量子
化ステップ幅を決定する。
【0043】(第2の実施形態)図8は、本発明の第2
の実施形態に係る動画像符号化装置の構成を示すブロッ
ク図である。図8において図1と同一の記号が内部に記
載されたブロックは、第1の実施形態と基本的に同一機
能を有するものとして詳細な説明を省略し、第1の実施
形態との相違点を中心に説明すると、本実施形態は第1
の実施形態の構成に加えて、データメモリ90とハード
ディスク装置92が新たに追加された構成となってい
る。
の実施形態に係る動画像符号化装置の構成を示すブロッ
ク図である。図8において図1と同一の記号が内部に記
載されたブロックは、第1の実施形態と基本的に同一機
能を有するものとして詳細な説明を省略し、第1の実施
形態との相違点を中心に説明すると、本実施形態は第1
の実施形態の構成に加えて、データメモリ90とハード
ディスク装置92が新たに追加された構成となってい
る。
【0044】本実施形態では、入力画像信号50はDV
D、ディジタルVTRあるいは画像メモリ装置等の蓄積
メディアに蓄積されていることを前提としている。従っ
て、入力画像信号50全体あるいはその一部を蓄積メデ
ィアから読み出して再符号化することが可能である。
D、ディジタルVTRあるいは画像メモリ装置等の蓄積
メディアに蓄積されていることを前提としている。従っ
て、入力画像信号50全体あるいはその一部を蓄積メデ
ィアから読み出して再符号化することが可能である。
【0045】統計データ収集回路64は、マクロブロッ
ク単位あるいはフレーム単位のDCT係数の発生符号量
および符号化モード等の付加情報の符号量を第1の実施
形態と同様に収集し、その発生符号量データを入力画像
信号50全体に渡ってデータメモリ90を介してハード
ディスク装置92に記録することが可能に構成されてい
る。
ク単位あるいはフレーム単位のDCT係数の発生符号量
および符号化モード等の付加情報の符号量を第1の実施
形態と同様に収集し、その発生符号量データを入力画像
信号50全体に渡ってデータメモリ90を介してハード
ディスク装置92に記録することが可能に構成されてい
る。
【0046】レート制御回路66は、第1の実施形態と
同様にして実時間で求められた発生符号量データ65に
基づいたフィードバックレート制御に加えて、事前に同
じ入力画像信号のシーケンスを符号化して、その際にハ
ードディスク装置92に記録した発生符号量データ91
を利用してビット配分およびレート制御を行う再符号化
も可能となっている。
同様にして実時間で求められた発生符号量データ65に
基づいたフィードバックレート制御に加えて、事前に同
じ入力画像信号のシーケンスを符号化して、その際にハ
ードディスク装置92に記録した発生符号量データ91
を利用してビット配分およびレート制御を行う再符号化
も可能となっている。
【0047】図9は、図8の動画像符号化装置を用いて
同じ入力画像信号のシーケンスを2回符号化する2パス
符号化の手順を示した図である。ここでは、総符号量が
規定されたDVD等の蓄積メディアに対して、一定時間
の動画像データを符号化して記録する場合を想定してい
る。
同じ入力画像信号のシーケンスを2回符号化する2パス
符号化の手順を示した図である。ここでは、総符号量が
規定されたDVD等の蓄積メディアに対して、一定時間
の動画像データを符号化して記録する場合を想定してい
る。
【0048】第1の符号化においては、入力画像信号5
0のシーケンス全体(例えば、映画1本分)にわたり符
号化を行い、少なくとも量子化ステップ幅および発生符
号量を含むフレーム単位の統計量の収集を行う(ステッ
プS1)。次に、式(1)に示した発生符号量と量子化
ステップ幅の関係をモデル化し、その近似係数を求める
ことを含む符号化特性の分析を入力画像信号50のシー
ケンス全体にわたって行う(ステップS2)。さらに、
各フレーム単位に得られた近似係数を用いて、以下の条
件を満たすフレーム単位のビット割り当て(ビット配
分)を全シーケンスに渡って行う(ステップS3)。
0のシーケンス全体(例えば、映画1本分)にわたり符
号化を行い、少なくとも量子化ステップ幅および発生符
号量を含むフレーム単位の統計量の収集を行う(ステッ
プS1)。次に、式(1)に示した発生符号量と量子化
ステップ幅の関係をモデル化し、その近似係数を求める
ことを含む符号化特性の分析を入力画像信号50のシー
ケンス全体にわたって行う(ステップS2)。さらに、
各フレーム単位に得られた近似係数を用いて、以下の条
件を満たすフレーム単位のビット割り当て(ビット配
分)を全シーケンスに渡って行う(ステップS3)。
【0049】 ΣRi (qi )≦総記録容量 (2)
【0050】
【数1】 0≦B(i)≦Bmax ,0≦B* (i)≦Bmax (4) ここで、Ri (qi )は第1の符号化での符号化結果か
ら得られた近似係数に基づいた、i番目のフレームを量
子化ステップ幅qi で符号化した場合の発生符号量の推
定値、q′は各フレームの初期量子化ステップ幅の全画
像シーケンスに渡る平均値、B(i),B* (i)はそ
れぞれフレームiに対する、仮想デコーダにおけるi番
目のフレームを復号化デコードする直前および直後のバ
ッファ占有量、Bmax は仮想デコーダバッファサイズを
それぞれ示す。式(2)を満たすようにすることで、総
記録容量を満たす符号化を行い、また式(3)により量
子化ステップ幅の分散が最小化され、その時間変動を抑
えて安定した画質を実現することが可能となる。さら
に、式(4)はMPEGで規定されるVBV(ISO/IEC1.
3818-1 Annex C参照)に相当し、発生符号量のバースト
性を制限するための仮想バッファである。
ら得られた近似係数に基づいた、i番目のフレームを量
子化ステップ幅qi で符号化した場合の発生符号量の推
定値、q′は各フレームの初期量子化ステップ幅の全画
像シーケンスに渡る平均値、B(i),B* (i)はそ
れぞれフレームiに対する、仮想デコーダにおけるi番
目のフレームを復号化デコードする直前および直後のバ
ッファ占有量、Bmax は仮想デコーダバッファサイズを
それぞれ示す。式(2)を満たすようにすることで、総
記録容量を満たす符号化を行い、また式(3)により量
子化ステップ幅の分散が最小化され、その時間変動を抑
えて安定した画質を実現することが可能となる。さら
に、式(4)はMPEGで規定されるVBV(ISO/IEC1.
3818-1 Annex C参照)に相当し、発生符号量のバースト
性を制限するための仮想バッファである。
【0051】図10は、本実施形態によりシーケンス全
体に渡ってフレーム単位に求めた量子化ステップ幅の初
期値と符号量割当を示している。このように量子化ステ
ップ幅の変動を小さくすることにより、限られた総符号
量の下での安定した画質の符号化を実現するための最適
ビット割当が可能となる。
体に渡ってフレーム単位に求めた量子化ステップ幅の初
期値と符号量割当を示している。このように量子化ステ
ップ幅の変動を小さくすることにより、限られた総符号
量の下での安定した画質の符号化を実現するための最適
ビット割当が可能となる。
【0052】ここで得られたフレーム単位の量子化ステ
ップ幅の初期値および割当符号量を用いて、シーケンス
全体に渡って第2の符号化を行う(ステップ4)。第2
の符号化では、第1の実施形態と同様にマクロブロック
単位のフィードバック制御をかけながら、割当符号量に
対する発生符号量の誤差を動的に吸収し、最終的な高画
質符号化を行う。これにより、高能率かつ高画質な画像
符号化を行うことが可能となる。
ップ幅の初期値および割当符号量を用いて、シーケンス
全体に渡って第2の符号化を行う(ステップ4)。第2
の符号化では、第1の実施形態と同様にマクロブロック
単位のフィードバック制御をかけながら、割当符号量に
対する発生符号量の誤差を動的に吸収し、最終的な高画
質符号化を行う。これにより、高能率かつ高画質な画像
符号化を行うことが可能となる。
【0053】(第3の実施形態)図11は、本発明の第
3の実施形態に係る動画像符号化装置の構成を示すブロ
ック図である。図11において図1および図8と同一の
記号が記載されたブロックは第1および第2の実施形態
と基本的に同一機能を有するものとして詳細な説明を省
略し、第2の実施形態との相違点のみを説明すると、本
実施形態では図8に示した第2の実施形態の構成に加え
て、さらにアクティビティ検出回路130が付加された
構成となっている。
3の実施形態に係る動画像符号化装置の構成を示すブロ
ック図である。図11において図1および図8と同一の
記号が記載されたブロックは第1および第2の実施形態
と基本的に同一機能を有するものとして詳細な説明を省
略し、第2の実施形態との相違点のみを説明すると、本
実施形態では図8に示した第2の実施形態の構成に加え
て、さらにアクティビティ検出回路130が付加された
構成となっている。
【0054】このアクティビティ検出回路130で検出
された入力画像信号52のアクティビティを示すデータ
131と、残差信号成分の大きさを示すデータ132が
統計データ収集回路64に入力される。統計データ収集
回路64は、第1および第2の実施形態における発生符
号量収集回路の機能を拡張したもので、入力されるデー
タ131,132は、レート制御回路66での視覚補正
処理に用いられるとともに、発生符号量や符号化モード
等の情報と同様にデータメモリ90を介してハードディ
スク装置92に記録することが可能となっている。
された入力画像信号52のアクティビティを示すデータ
131と、残差信号成分の大きさを示すデータ132が
統計データ収集回路64に入力される。統計データ収集
回路64は、第1および第2の実施形態における発生符
号量収集回路の機能を拡張したもので、入力されるデー
タ131,132は、レート制御回路66での視覚補正
処理に用いられるとともに、発生符号量や符号化モード
等の情報と同様にデータメモリ90を介してハードディ
スク装置92に記録することが可能となっている。
【0055】本実施形態においても、第2の実施形態と
同様に、事前に符号化して得られた発生符号量データに
基づく入力画像シーケンス全体に渡るビット配分が可能
である。また、本実施形態ではさらにアクティビティデ
ータ131や、残差信号成分の大きさデータ132から
求まる予測効率等のパラメータに応じて、人間の視覚特
性を考慮した視覚補正を加えることも可能である。
同様に、事前に符号化して得られた発生符号量データに
基づく入力画像シーケンス全体に渡るビット配分が可能
である。また、本実施形態ではさらにアクティビティデ
ータ131や、残差信号成分の大きさデータ132から
求まる予測効率等のパラメータに応じて、人間の視覚特
性を考慮した視覚補正を加えることも可能である。
【0056】図12は、入力画像シーケンス全体に渡る
視覚補正パラメータとこれに基づく量子化ステップ幅お
よび符号量配分の例を示したものである。ここでも、事
前の符号化による統計データから、量子化ステップ幅と
発生符号量の関係を推定することにより、適切な符号量
配分が可能となる。
視覚補正パラメータとこれに基づく量子化ステップ幅お
よび符号量配分の例を示したものである。ここでも、事
前の符号化による統計データから、量子化ステップ幅と
発生符号量の関係を推定することにより、適切な符号量
配分が可能となる。
【0057】
【発明の効果】以上説明したように、本発明によれば動
画像信号を動き補償予測と直交変換を組み合わせて符号
化する動画像符号化装置において、量子化された直交変
換係数に対応する発生符号量の少なくとも一部、具体的
には量子化ステップ幅と相関のある直交変換係数の交流
成分に対応した符号量を含む第1の発生符号量と、量子
化ステップ幅との相関が小さい動きベクトル情報や符号
化モード情報などの付加情報と直交変換係数の直流成分
に対応した符号量を含む第2の発生符号量とをそれぞれ
独立して分離収集し、さらにはフレーム内符号化マクロ
ブロックとフレーム間マクロブロックの発生符号量を独
立に収集することで、量子化ステップ幅と発生符号量の
関係を高精度に推定することが可能となる。
画像信号を動き補償予測と直交変換を組み合わせて符号
化する動画像符号化装置において、量子化された直交変
換係数に対応する発生符号量の少なくとも一部、具体的
には量子化ステップ幅と相関のある直交変換係数の交流
成分に対応した符号量を含む第1の発生符号量と、量子
化ステップ幅との相関が小さい動きベクトル情報や符号
化モード情報などの付加情報と直交変換係数の直流成分
に対応した符号量を含む第2の発生符号量とをそれぞれ
独立して分離収集し、さらにはフレーム内符号化マクロ
ブロックとフレーム間マクロブロックの発生符号量を独
立に収集することで、量子化ステップ幅と発生符号量の
関係を高精度に推定することが可能となる。
【0058】従って、この発生符号量収集結果を用いる
ことにより、実時間符号化においては、次に符号化すべ
き画像に対する符号量の割り当てや量子化ステップ幅の
決定に先に符号化した時の発生符号量と量子化ステップ
幅の関係を用いることで、より高能率・高画質かつ安定
した符号化制御を実現することが可能となり、またフィ
ードバックレート制御を行う場合は、発生符号量のうち
量子化ステップ幅の相関のある部分と相関のない部分を
分離して処理すれば、フィードバック系をより安定化さ
せる効果も得られる。
ことにより、実時間符号化においては、次に符号化すべ
き画像に対する符号量の割り当てや量子化ステップ幅の
決定に先に符号化した時の発生符号量と量子化ステップ
幅の関係を用いることで、より高能率・高画質かつ安定
した符号化制御を実現することが可能となり、またフィ
ードバックレート制御を行う場合は、発生符号量のうち
量子化ステップ幅の相関のある部分と相関のない部分を
分離して処理すれば、フィードバック系をより安定化さ
せる効果も得られる。
【0059】また、蓄積系への応用に際しては、まず1
回目の符号化において入力画像信号のシーケンス全体に
わたってはフレーム単位あるいは領域単位の発生符号量
を収集し、この発生符号量に基づいて入力画像信号のシ
ーケンス全体にわたる最適な発生符号量の配分をフレー
ム単位またはマクロブロック単位などの領域単位に施し
た後、予め蓄積メディアに蓄積しておいた同じ入力画像
信号のシーケンス全体または一部について2回目の符号
化を行うことによって、高能率かつ高画質な動画像符号
化を実現することができる。
回目の符号化において入力画像信号のシーケンス全体に
わたってはフレーム単位あるいは領域単位の発生符号量
を収集し、この発生符号量に基づいて入力画像信号のシ
ーケンス全体にわたる最適な発生符号量の配分をフレー
ム単位またはマクロブロック単位などの領域単位に施し
た後、予め蓄積メディアに蓄積しておいた同じ入力画像
信号のシーケンス全体または一部について2回目の符号
化を行うことによって、高能率かつ高画質な動画像符号
化を実現することができる。
【図1】本発明の第1の実施形態に係る動画像符号化装
置の構成を示す図
置の構成を示す図
【図2】本発明で用いる発生符号量収集回路の一構成例
を示すブロック図
を示すブロック図
【図3】本発明で用いる発生符号量収集回路の他の構成
例を示すブロック図
例を示すブロック図
【図4】本発明で用いるレート制御回路の構成例を示す
ブロック図
ブロック図
【図5】発生符号量と量子化ステップ幅の関係の例を示
す図
す図
【図6】MPEGビデオ符号化の階層構造を示す図
【図7】2次元DCT係数のジグザグスキャン順を示す
図
図
【図8】本発明の第2の実施形態に係る動画像符号化装
置の構成を示すブロック図
置の構成を示すブロック図
【図9】同実施形態における蓄積系用2パス符号化手順
の例を示す図
の例を示す図
【図10】同実施形態における符号量配分の例を示す図
【図11】本発明の第3の実施形態に係る動画像符号化
装置の構成を示すブロック図
装置の構成を示すブロック図
【図12】同実施形態における符号量配分の例を示す図
【図13】従来の動が画像符号化装置で用いられるフィ
ードバックレート制御回路の例を示すブロック図
ードバックレート制御回路の例を示すブロック図
10,50…入力動画像信号 11,51…リオーダリングバッファ 13,53…動き検出回路 17,57…DCT(離散コサイン変換)回路 19,59…量子化回路 21,61…可変長符号化回路 22,62…直交変換係数可変長符号化データ 23,63…動きベクトル及び動き補償モード情報 24,64…発生符号量収集回路(統計データ収集回
路) 26,66…レート制御回路 28,68…文法生成及びデータ多重化回路 30,70…送信バッファ 31,71…符号化データ 32,72…逆量子化回路 34,74…逆DCT回路 38,78…参照画像メモリ 40,80…動き補償回路 90…データメモリ 92…ハードディスク装置 112…積分器 114…量子化ステップ幅修正回路 116…符号化器 118…量子化ステップ幅初期値計算回路 130…アクティビティ検出回路 150,190…DCT係数の可変長符号発生符号量 150,191…動きベクトル及びモード情報を含むデ
ータの発生符号量 152,192,195,196…セレクタ 153,154,197〜200…マクロブロック単位
の符号量累積加算用の積分器 157,158,205〜208…フレーム単位の符号
量累積加算積分器 170…フレーム目標符号量 171〜174,177,178…乗算器 175,176…積分器 183…初期量子化ステップ幅算出器 179…符号化装置
路) 26,66…レート制御回路 28,68…文法生成及びデータ多重化回路 30,70…送信バッファ 31,71…符号化データ 32,72…逆量子化回路 34,74…逆DCT回路 38,78…参照画像メモリ 40,80…動き補償回路 90…データメモリ 92…ハードディスク装置 112…積分器 114…量子化ステップ幅修正回路 116…符号化器 118…量子化ステップ幅初期値計算回路 130…アクティビティ検出回路 150,190…DCT係数の可変長符号発生符号量 150,191…動きベクトル及びモード情報を含むデ
ータの発生符号量 152,192,195,196…セレクタ 153,154,197〜200…マクロブロック単位
の符号量累積加算用の積分器 157,158,205〜208…フレーム単位の符号
量累積加算積分器 170…フレーム目標符号量 171〜174,177,178…乗算器 175,176…積分器 183…初期量子化ステップ幅算出器 179…符号化装置
Claims (6)
- 【請求項1】入力される動画像信号について動き補償予
測を行って予測残差信号を生成する動き補償予測手段
と、 前記予測残差信号を直交変換して直交変換係数を得る直
交変換手段と、 前記直交変換係数を量子化する量子化手段と、 この量子化手段により量子化された直交変換係数を可変
長符号に変換する可変長符号化手段と、 前記可変長符号と前記動き補償予測手段により検出され
た動きベクトル情報および符号化モード情報を含む付加
情報とを出力符号とする符号出力手段と、 前記出力符号の発生符号量を前記可変長符号の少なくと
も一部の符号量を含む第1の発生符号量と少なくとも前
記付加情報の符号量を含む第2の発生符号量とに分離し
て収集する発生符号量収集手段とを有することを特徴と
する動画像符号化装置。 - 【請求項2】入力される動画像信号について動き補償予
測を行って予測残差信号を生成する動き補償予測手段
と、 前記予測残差信号を直交変換して直交変換係数を得る直
交変換手段と、 前記直交変換係数を量子化する量子化手段と、 この量子化手段により量子化された直交変換係数を可変
長符号に変換する可変長符号化手段と、 前記可変長符号と前記動き補償予測手段により検出され
た動きベクトル情報および符号化モード情報を含む付加
情報とを出力符号とする符号出力手段と、 前記出力符号の発生符号量を前記可変長符号の少なくと
も一部の符号量を含む第1の発生符号量と少なくとも前
記付加情報の符号量を含む第2の発生符号量とに分離し
て収集する発生符号量収集手段と、 この発生符号量収集手段により収集された発生符号量に
基づいて少なくとも前記量子化手段における量子化ステ
ップ幅を制御することにより前記出力符号の発生符号量
を制御する符号量制御手段とを有することを特徴とする
動画像符号化装置。 - 【請求項3】前記符号量制御手段は、前記第1の発生符
号量とその目標符号量との誤差および前記第2の発生符
号量とその目標符号量との誤差の重み付け加算値を用い
て前記量子化ステップ幅を制御することを特徴とする請
求項3に記載の動画像符号化装置。 - 【請求項4】入力される動画像信号について動き補償予
測を行って予測残差信号を生成する動き補償予測手段
と、 前記予測残差信号を直交変換して直交変換係数を得る直
交変換手段と、 前記直交変換係数を量子化する量子化手段と、 この量子化手段により量子化された直交変換係数を可変
長符号に変換する可変長符号化手段と、 前記可変長符号と前記動き補償予測手段により検出され
た動きベクトル情報および符号化モード情報を含む付加
情報とを出力符号とする符号出力手段と、 前記出力符号の発生符号量を前記可変長符号の少なくと
も一部の符号量を含む第1の発生符号量と少なくとも前
記付加情報の符号量を含む第2の発生符号量とに分離し
て収集する発生符号量収集手段と、 この発生符号量収集手段により収集された発生符号量に
基づいて前記入力画像信号のシーケンス全体にわたる発
生符号量の配分をフレーム単位または所定の領域単位に
行う符号量配分手段とを有し、 前記符号量配分手段により配分された符号量に基づいて
前記入力画像信号のシーケンス全体の再符号化を行うこ
とを特徴とする動画像符号化装置。 - 【請求項5】前記発生符号量収集手段は、前記直交変換
係数の交流成分に対応する発生符号量を第1の発生符号
量として収集し、前記直交変換係数の直流成分に対応す
る発生符号量を第2の発生符号量に含めて収集すること
を特徴とする請求項1、2または4に記載の動画像符号
化装置。 - 【請求項6】前記発生符号量収集手段は、フレーム内符
号化ブロックの前記直交変換係数に対応する発生符号量
と、フレーム間符号化ブロックの前記直交変換係数に対
応する発生符号量とをそれぞれ独立に収集することを特
徴とする請求項1、2、4または5に記載の動画像符号
化装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP7276988A JPH0998427A (ja) | 1995-09-29 | 1995-09-29 | 動画像符号化装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP7276988A JPH0998427A (ja) | 1995-09-29 | 1995-09-29 | 動画像符号化装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0998427A true JPH0998427A (ja) | 1997-04-08 |
Family
ID=17577209
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP7276988A Pending JPH0998427A (ja) | 1995-09-29 | 1995-09-29 | 動画像符号化装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0998427A (ja) |
Cited By (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7075982B2 (en) | 2001-06-29 | 2006-07-11 | Kabushiki Kaisha Toshiba | Video encoding method and apparatus |
| WO2008111458A1 (ja) * | 2007-03-14 | 2008-09-18 | Nippon Telegraph And Telephone Corporation | 符号化ビットレート制御方法及び装置、そのプログラム並びにプログラムを記録した記録媒体 |
| JP2008283607A (ja) * | 2007-05-14 | 2008-11-20 | Kddi Corp | 画像データトランスコーディング装置及びトランスコーディング方法 |
| WO2009052697A1 (fr) * | 2007-10-15 | 2009-04-30 | Zhejiang University | Procédé et dispositif de codage et de décodage vidéo de prédiction à double fonction |
| JP2011071778A (ja) * | 2009-09-25 | 2011-04-07 | Mega Chips Corp | 画像処理装置 |
| JP2011239425A (ja) * | 2005-03-22 | 2011-11-24 | Qualcomm Incorporated | 動的にスケーリングされるファイル符号化 |
| JP2012529865A (ja) * | 2009-06-12 | 2012-11-22 | マイクロソフト コーポレーション | モーションベースの動的解像度マルチビットレートの動画符号化 |
| US8396130B2 (en) | 2007-03-14 | 2013-03-12 | Nippon Telegraph And Telephone Corporation | Motion vector search method and apparatus, program therefor, and storage medium which stores the program |
| US9161042B2 (en) | 2007-03-14 | 2015-10-13 | Nippon Telegraph And Telephone Corporation | Quantization control method and apparatus, program therefor, and storage medium which stores the program |
| US9271008B2 (en) | 2007-07-17 | 2016-02-23 | Nippon Telegraph And Telephone Corporation | Video encoding apparatus and method, video encoding program, and storage medium which stores the program |
| US9455739B2 (en) | 2007-03-14 | 2016-09-27 | Nippon Telegraph And Telephone Corporation | Code amount estimating method and apparatus, and program and storage medium therefor |
-
1995
- 1995-09-29 JP JP7276988A patent/JPH0998427A/ja active Pending
Cited By (14)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7075982B2 (en) | 2001-06-29 | 2006-07-11 | Kabushiki Kaisha Toshiba | Video encoding method and apparatus |
| JP2011239425A (ja) * | 2005-03-22 | 2011-11-24 | Qualcomm Incorporated | 動的にスケーリングされるファイル符号化 |
| US8396130B2 (en) | 2007-03-14 | 2013-03-12 | Nippon Telegraph And Telephone Corporation | Motion vector search method and apparatus, program therefor, and storage medium which stores the program |
| JPWO2008111458A1 (ja) * | 2007-03-14 | 2010-06-24 | 日本電信電話株式会社 | 符号化ビットレート制御方法及び装置、そのプログラム並びにプログラムを記録した記録媒体 |
| US8265142B2 (en) | 2007-03-14 | 2012-09-11 | Nippon Telegraph And Telephone Corporation | Encoding bit-rate control method and apparatus, program therefor, and storage medium which stores the program |
| WO2008111458A1 (ja) * | 2007-03-14 | 2008-09-18 | Nippon Telegraph And Telephone Corporation | 符号化ビットレート制御方法及び装置、そのプログラム並びにプログラムを記録した記録媒体 |
| US9161042B2 (en) | 2007-03-14 | 2015-10-13 | Nippon Telegraph And Telephone Corporation | Quantization control method and apparatus, program therefor, and storage medium which stores the program |
| US9455739B2 (en) | 2007-03-14 | 2016-09-27 | Nippon Telegraph And Telephone Corporation | Code amount estimating method and apparatus, and program and storage medium therefor |
| JP2008283607A (ja) * | 2007-05-14 | 2008-11-20 | Kddi Corp | 画像データトランスコーディング装置及びトランスコーディング方法 |
| US9271008B2 (en) | 2007-07-17 | 2016-02-23 | Nippon Telegraph And Telephone Corporation | Video encoding apparatus and method, video encoding program, and storage medium which stores the program |
| WO2009052697A1 (fr) * | 2007-10-15 | 2009-04-30 | Zhejiang University | Procédé et dispositif de codage et de décodage vidéo de prédiction à double fonction |
| US8582904B2 (en) | 2007-10-15 | 2013-11-12 | Zhejiang University | Method of second order prediction and video encoder and decoder using the same |
| JP2012529865A (ja) * | 2009-06-12 | 2012-11-22 | マイクロソフト コーポレーション | モーションベースの動的解像度マルチビットレートの動画符号化 |
| JP2011071778A (ja) * | 2009-09-25 | 2011-04-07 | Mega Chips Corp | 画像処理装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3954656B2 (ja) | 画像符号化装置及び方法 | |
| JP3072035B2 (ja) | 2ステージビデオフィルム圧縮方法及びシステム | |
| JP3871840B2 (ja) | 圧縮動画像再符号化装置 | |
| US20090097546A1 (en) | System and method for enhanced video communication using real-time scene-change detection for control of moving-picture encoding data rate | |
| JP2004527960A (ja) | メディアプロセッサにおけるmpeg2デコード処理の動的複雑性予測及び調整 | |
| JP2004201298A (ja) | 画像のシーケンスを適応的に符号化するシステムおよび方法 | |
| JP3911035B2 (ja) | 動画像符号化方法及び動画像符号化装置 | |
| JPH0998427A (ja) | 動画像符号化装置 | |
| JP3888533B2 (ja) | 画像特徴に応じた画像符号化装置 | |
| US9185420B2 (en) | Moving image coding apparatus and moving image coding method | |
| JP3480067B2 (ja) | 画像符号化装置及び方法 | |
| JP4362794B2 (ja) | 動画像符号化装置及びその方法 | |
| JP3734286B2 (ja) | 動画像符号化装置及び動画像伝送装置 | |
| JPH08149413A (ja) | 可変ビットレート符号化装置および記録装置および記録媒体 | |
| JP3586069B2 (ja) | 動画像符号化方法および装置 | |
| JPH10108197A (ja) | 画像符号化装置、画像符号化制御方法および画像符号化制御用プログラムを記録した媒体 | |
| JP2003018593A (ja) | 映像符号化方法及び装置、映像符号量割当て方法及び装置、並びに記録媒体 | |
| JPH0775095A (ja) | レート制御回路 | |
| JP3934772B2 (ja) | 可変転送レート符号化方法および装置 | |
| JP4765961B2 (ja) | デジタル動画像記録装置 | |
| KR100793781B1 (ko) | 실시간 동영상 부호화 장치 및 방법 | |
| JP4031231B2 (ja) | 符号化パラメータの解析装置 | |
| JP4000581B2 (ja) | 画像符号化装置および方法 | |
| JP3922581B2 (ja) | 可変転送レート符号化方法および装置 | |
| JPH0646411A (ja) | 画像符号化装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20050415 |
|
| RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20050606 |