JP2009278609A - Information processing device and method - Google Patents
Information processing device and method Download PDFInfo
- Publication number
- JP2009278609A JP2009278609A JP2008289345A JP2008289345A JP2009278609A JP 2009278609 A JP2009278609 A JP 2009278609A JP 2008289345 A JP2008289345 A JP 2008289345A JP 2008289345 A JP2008289345 A JP 2008289345A JP 2009278609 A JP2009278609 A JP 2009278609A
- Authority
- JP
- Japan
- Prior art keywords
- unit
- encoding
- data
- coefficient
- decoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
本発明は、情報処理装置および方法に関し、特に、画像データを、高品質かつ低遅延に伝送することができるようにした情報処理装置および方法に関する。 The present invention relates to an information processing apparatus and method, and more particularly, to an information processing apparatus and method capable of transmitting image data with high quality and low delay.
従来、双方向テレビジョン会議システムのような映像や音声を用いたコミュニケーションシステムや、放送局などにおける非圧縮環境との混在システム等において、映像や音声のデータをより遅延無く伝送することが求められている。近年、特に、映像や音声の高品質化に伴いそれらのデータ量も増大しており、伝送の際の画像圧縮は必須となっているが、その画像圧縮による遅延時間の増大を抑制し、より低遅延にデータ伝送を行うことが求められている。 Conventionally, it has been required to transmit video and audio data without delay in a communication system using video and audio such as an interactive video conference system, and in a mixed system with an uncompressed environment in a broadcasting station or the like. ing. In recent years, in particular, the amount of data has increased along with the improvement in quality of video and audio, and image compression at the time of transmission has become indispensable. There is a demand for data transmission with low delay.
例えば、MPEG(Moving Picture Experts Group)やH.26x系の圧縮方式では動き予測により圧縮率を高めているが、動き予測を行うとアルゴリズムが複雑になり、その処理時間はフレームサイズの2乗に比例して大きくなるため、原理的に数フレームの符号化遅延が発生する。双方向実時間通信を行う際には、許容遅延時間250msぎりぎりの遅延時間となり、無視できない大きさである。 For example, MPEG (Moving Picture Experts Group) and H.264. In the 26x compression method, the compression rate is increased by motion prediction. However, if motion prediction is performed, the algorithm becomes complicated, and the processing time increases in proportion to the square of the frame size. Encoding delay occurs. When bi-directional real-time communication is performed, the delay time is a marginal delay time of 250 ms, which cannot be ignored.
また、JPEG(Joint Photographic Experts Group)2000に代表されるような、イントラフレームコーデックはフレーム間の差分情報を利用しないため、上述したような遅延は発生しない。しかしながら、フレーム単位での圧縮となるため、エンコード開始まで、最低でも1フレームは待つ必要がある。現在の一般的なシステムでは1秒間に30フレームであることが多いため、エンコード開始までに16ms程度の待ち時間が必要となる。 In addition, since an intra-frame codec such as JPEG (Joint Photographic Experts Group) 2000 does not use difference information between frames, the above-described delay does not occur. However, since compression is performed in units of frames, it is necessary to wait at least one frame until encoding starts. In the current general system, there are many 30 frames per second, so a waiting time of about 16 ms is required before starting encoding.
また、映像や音声の高品質化に伴い、画像圧縮の高品質化も求められている。JPEG2000は、ウェーブレット変換に、ビットプレーン単位のビットモデリングと算術符号化による高能率エントロピ符号化を組み合わせた圧縮符号化方式を採用している。例えば、特許文献1には、より符号化効率を向上させたウェーブレット変換方法が記載されている。
In addition, with the improvement of the quality of video and audio, there is a demand for higher quality of image compression. JPEG2000 employs a compression coding scheme that combines bit modeling for each bit plane and high-efficiency entropy coding by arithmetic coding in wavelet transform. For example,
しかしながら、従来の方法では、高品質かつ低遅延に画像データを伝送することは困難であった。 However, it has been difficult for the conventional method to transmit image data with high quality and low delay.
本発明は、このような従来の実情に鑑みて提案されたものであり、画像データを、元のデータを復元可能な可逆な方法で符号化し、低遅延に伝送させることができるようにするものである。 The present invention has been proposed in view of such conventional circumstances, and enables image data to be encoded by a reversible method capable of restoring the original data and transmitted with low delay. It is.
本発明の一側面は、画像データを、逆方向の変換により変換後の係数データから元の前記画像データを復元可能な可逆な方法で周波数帯域毎に分解し、前記周波数帯域毎の係数データからなるサブバンドを生成する分析フィルタ処理を、少なくとも最低域成分のサブバンドの1ライン分の係数データを生成するのに必要なライン数分の前記画像データを含むラインブロック毎に行う分析フィルタ手段と、前記分析フィルタ手段による前記分析フィルタ処理により生成された前記係数データを、複数の前記ラインブロックより生成された前記係数データ群毎に、復号処理により符号化データから元の前記係数データを復元可能な可逆な方法で符号化する符号化手段とを備える情報処理装置である。 According to one aspect of the present invention, image data is decomposed for each frequency band by a reversible method capable of restoring the original image data from the converted coefficient data by reverse conversion, and the coefficient data for each frequency band is used. Analysis filter means for performing analysis filter processing for generating subbands for each line block including the image data for the number of lines necessary to generate coefficient data for one line of at least the subband of the lowest frequency component; The coefficient data generated by the analysis filter processing by the analysis filter means can be restored to the original coefficient data from the encoded data by decoding processing for each coefficient data group generated from a plurality of the line blocks. It is an information processing apparatus provided with the encoding means to encode by a reversible method.
前記符号化手段により符号化されて得られる前記符号化データに対し、所定のデータ単位毎に、少なくとも前記符号化データが可逆な方法の符号化により生成されたことを示す情報を含む前記符号化データに関する情報を生成する生成手段をさらに備えることができる。 The encoding including information indicating that at least the encoded data is generated by encoding in a reversible method for each predetermined data unit with respect to the encoded data obtained by encoding by the encoding means Generation means for generating information about the data can be further provided.
前記生成手段は、前記符号化データに関する情報として、前記分析フィルタ手段により実行される前記分析フィルタ処理の種類に関する情報も生成することができる。 The generation means can also generate information on the type of the analysis filter process executed by the analysis filter means as information on the encoded data.
前記生成手段は、前記符号化データに関する情報として、前記符号化手段が前記符号化の処理単位とする前記係数データ群を生成するのに必要な前記ラインブロックの数に関する情報も生成することができる。 The generating means can also generate information relating to the number of line blocks necessary for the coding means to generate the coefficient data group that is the processing unit of the coding as information relating to the coded data. .
前記分析フィルタ手段による前記分析フィルタ処理により生成された前記係数データを、前記ラインブロック毎に、各サブバンドの前記係数データを合成して元の前記画像データを復元する合成フィルタ処理を実行する順に並び替える並び替え手段をさらに備え、前記符号化手段は、前記係数データを、複数の前記ラインブロックより生成された前記係数データ群毎に、前記並び替え手段により並び替えられた順に符号化することができる。 The coefficient data generated by the analysis filter processing by the analysis filter means is combined with the coefficient data of each subband for each line block in order of executing synthesis filter processing for restoring the original image data. Rearrangement means for rearranging further, wherein the encoding means encodes the coefficient data in the order rearranged by the rearrangement means for each coefficient data group generated from a plurality of the line blocks. Can do.
前記符号化手段により符号化されて得られる前記符号化データに対し、所定のデータ単位毎に、少なくとも、前記符号化データが可逆な方法の符号化により生成されたことを示す情報と、前記並び替え手段による前記係数データの並び替えに関する情報とを含む前記符号化データに関する情報を生成する生成手段をさらに備えることができる。 For the encoded data obtained by encoding by the encoding means, at least information indicating that the encoded data has been generated by encoding in a reversible method for each predetermined data unit, and the arrangement Generation means for generating information related to the encoded data including information related to the rearrangement of the coefficient data by the replacement means may be further provided.
前記分析フィルタ手段は、さらに、前記画像データを、逆方向の変換による元の前記画像データの復元が保証されていない非可逆な方法で周波数帯域毎に分解し、前記周波数帯域毎の係数データからなるサブバンドを生成する分析フィルタ処理を、少なくとも最低域成分のサブバンドの1ライン分の係数データを生成するのに必要なライン数分の前記画像データを含むラインブロック毎に行い、前記分析フィルタ手段による分析フィルタ処理を可逆な方法で行うか非可逆な方法で行うかを制御する制御手段をさらに備えることができる。 The analysis filter means further decomposes the image data for each frequency band by an irreversible method in which restoration of the original image data by reverse conversion is not guaranteed, and from the coefficient data for each frequency band The analysis filter processing for generating a subband is performed for each line block including the image data for the number of lines necessary to generate coefficient data for one line of at least the subband of the lowest frequency component, and the analysis filter Control means for controlling whether the analysis filter processing by the means is performed by a reversible method or an irreversible method can be further provided.
本発明の一側面はまた、分析フィルタ手段が、画像データを、逆方向の変換により変換後の係数データから元の前記画像データを復元可能な可逆な方法で周波数帯域毎に分解し、前記周波数帯域毎の係数データからなるサブバンドを生成する分析フィルタ処理を、少なくとも最低域成分のサブバンドの1ライン分の係数データを生成するのに必要なライン数分の前記画像データを含むラインブロック毎に行い、符号化手段が、前記分析フィルタ処理により生成された前記係数データを、複数の前記ラインブロックより生成された前記係数データ群毎に、復号処理により符号化データから元の前記係数データを復元可能な可逆な方法で符号化する情報処理方法である。 According to another aspect of the present invention, the analysis filter unit decomposes the image data for each frequency band by a reversible method capable of restoring the original image data from the coefficient data after conversion by reverse conversion, and the frequency For each line block including the image data corresponding to the number of lines necessary to generate at least one line of coefficient data for the subband of the lowest band component in the analysis filter processing for generating subbands including coefficient data for each band And the encoding means converts the coefficient data generated by the analysis filter processing from the encoded data by decoding processing to the original coefficient data for each of the coefficient data groups generated from the plurality of line blocks. This is an information processing method for encoding by a reversible and reversible method.
本発明の他の側面は、画像データが符号化された符号化データに関する情報を解析し、前記符号化データが、復号処理により符号化前のデータを復元可能な可逆な方法の符号化処理により生成されたものであるか否かを特定する解析手段と、前記解析手段による解析の結果、前記符号化データが前記可逆な方法の符号化処理により生成されたものであると判定される場合、前記符号化データに対して、前記符号化処理に対応する方法で復号処理を行う復号手段と、前記復号手段による復号処理により前記符号化データから生成された係数データに対して、合成して前記画像データを生成する合成フィルタ手段とを備える情報処理装置である。 According to another aspect of the present invention, information related to encoded data obtained by encoding image data is analyzed, and the encoded data is encoded by a reversible method capable of restoring data before encoding by decoding processing. When it is determined that the encoded data is generated by the encoding process of the reversible method, as a result of the analysis by the analyzing unit that identifies whether or not the generated data is analyzed, Decoding means for performing decoding processing on the encoded data by a method corresponding to the encoding processing, and coefficient data generated from the encoded data by decoding processing by the decoding means An information processing apparatus including synthesis filter means for generating image data.
本発明の他の側面はまた、解析手段が、画像データが符号化された符号化データに関する情報を解析し、前記符号化データが、復号処理により符号化前のデータを復元可能な可逆な方法の符号化処理により生成されたものであるか否かを特定し、復号手段が、解析の結果、前記符号化データが前記可逆な方法の符号化処理により生成されたものであると判定される場合、前記符号化データに対して、前記符号化処理に対応する方法で復号処理を行い、合成フィルタ手段が、復号処理により前記符号化データから生成された係数データに対して、合成して前記画像データを生成する情報処理方法である。 Another aspect of the present invention is also a reversible method in which the analysis unit analyzes information related to encoded data obtained by encoding image data, and the encoded data can restore data before encoding by decoding processing. The decoding unit determines whether the encoded data is generated by the reversible encoding method as a result of analysis. A decoding process is performed on the encoded data by a method corresponding to the encoding process, and a synthesis filter unit synthesizes the coefficient data generated from the encoded data by the decoding process, and This is an information processing method for generating image data.
本発明の一側面においては、画像データが、逆方向の変換により変換後の係数データから元の画像データを復元可能な可逆な方法で周波数帯域毎に分解され、周波数帯域毎の係数データからなるサブバンドが生成される分析フィルタ処理が、少なくとも最低域成分のサブバンドの1ライン分の係数データを生成するのに必要なライン数分の画像データを含むラインブロック毎に行われ、分析フィルタ処理により生成された係数データが、複数のラインブロックより生成された係数データ群毎に、復号処理により符号化データから元の係数データを復元可能な可逆な方法で符号化される。 In one aspect of the present invention, image data is decomposed for each frequency band by a reversible method capable of restoring the original image data from the converted coefficient data by reverse conversion, and consists of coefficient data for each frequency band. The analysis filter processing for generating the subband is performed for each line block including the image data for the number of lines necessary to generate the coefficient data for one line of at least the subband of the lowest band component. The coefficient data generated by the above is encoded by a reversible method capable of restoring the original coefficient data from the encoded data by decoding processing for each coefficient data group generated from a plurality of line blocks.
本発明の他の側面においては、画像データが符号化された符号化データに関する情報が解析され、符号化データが、復号処理により符号化前のデータを復元可能な可逆な方法の符号化処理により生成されたものであるか否かが特定され、解析の結果、符号化データが可逆な方法の符号化処理により生成されたものであると判定される場合、符号化データに対して、符号化処理に対応する方法で復号処理が行われ、復号処理により符号化データから生成された係数データが、合成されて画像データが生成される。 In another aspect of the present invention, information on encoded data obtained by encoding image data is analyzed, and the encoded data is subjected to a reversible encoding process that can restore the data before encoding by the decoding process. If it is determined whether or not the encoded data is generated by a reversible encoding process, the encoded data is encoded. A decoding process is performed by a method corresponding to the process, and coefficient data generated from the encoded data by the decoding process is combined to generate image data.
本発明によれば、画像データを伝送することができる。特に、画像データを、高品質かつ低遅延に伝送することができる。 According to the present invention, image data can be transmitted. In particular, image data can be transmitted with high quality and low delay.
以下、本発明の実施の形態について説明する。 Hereinafter, embodiments of the present invention will be described.
図1は、本発明を適用した符号化装置の構成例を示すブロック図である。 FIG. 1 is a block diagram showing a configuration example of an encoding apparatus to which the present invention is applied.
図1において、符号化装置100は、画像データを符号化する装置である。符号化装置100は、ベースバンドの画像データを符号化して得られる符号化データを復号することにより、符号化前のベースバンドの画像データを復元することができるように符号化する。つまり、符号化装置100は、順方向と逆方向の変換が完全に保証される可逆な方法により画像データを符号化する。これにより符号化装置100は、復号後においても高品質な画像データが得られるように画像データを符号化することができる。また、符号化装置100は、画像データを後述するプレシンクト単位で符号化する。これにより符号化装置100は、画像データを符号化して復号するまでの遅延時間を低減させることができる。
In FIG. 1, an
符号化装置100は、ウェーブレット変換部101、途中計算用バッファ部102、およびエントロピ符号化部103を有する。
The
符号化装置100に入力された画像データは、ウェーブレット変換部101を介して途中計算用バッファ部102に一時的に溜め込まれる。ウェーブレット変換部101は、途中計算用バッファ部102に溜め込まれた画像データに対して、順方向と逆方向の変換が完全に保証された可逆な方法でデータ変換を行う可逆フィルタを用いてウェーブレット変換を施す。ウェーブレット変換部101は、途中計算用バッファ部102から画像データを読み出して可逆な分析フィルタによりフィルタ処理を施して低域成分および高域成分の係数のデータを生成し、生成された係数データを途中計算用バッファ部102に格納する。
The image data input to the
ウェーブレット変換部101は、水平分析フィルタと垂直分析フィルタとを有し、画像データ群に対して、画面水平方向と画面垂直方向の両方について可逆な分析フィルタ処理を行う。ウェーブレット変換部101は、途中計算用バッファ部102に格納された低域成分の係数データを再度読み出し、読み出した係数データに対して分析フィルタによるフィルタ処理を施して、高域成分および低域成分の係数のデータをさらに生成する。生成された係数データは、途中計算用バッファ部102に格納される。つまり、ウェーブレット変換部101は、入力データを低域成分と高域成分に分離するフィルタ処理を低域成分に対して再帰的に所定回数繰り返す。
The
ウェーブレット変換部101は、この処理を繰り返して分解レベルが所定レベルに達したら、途中計算用バッファ部102から係数データを読み出し、読み出された係数データをエントロピ符号化部103に書き込む。
When the decomposition level reaches a predetermined level by repeating this process, the
なお、ウェーブレット変換部101および途中計算用バッファ部102を併せて分析フィルタ処理部111とも称する。
The
エントロピ符号化部103は、ウェーブレット変換部101(分析フィルタ処理部111)より供給される係数データを、例えば、ハフマン符号化や算術符号化といった所定のエントロピ符号化方式を用い、順方向と逆方向の変換が完全に保証された可逆な方法で符号化する。つまり、エントロピ符号化部103は、ベースバンドの画像データを符号化して得られる符号化データを復号することにより、符号化前のベースバンドの画像データを復元することができるように符号化する。
The
このとき、エントロピ符号化部103は、より多くの情報量を使って符号化処理を行うことにより符号化の効率を向上させる。特に、可逆の方法で符号化処理を行う場合、遅延時間よりも画像圧縮の高品質化や高効率化が優先されることが多い。そのために、エントロピ符号化部103は、少なくとも「2プレシンクト」以上の、予め定められた所定の数のプレシンクト分の係数データが得られるまで待機し、そのプレシンクト数毎に係数データをエントロピ符号化する。このように複数のプレシンクト数分の係数データを用いて符号化を行うことにより、エントロピ符号化部103は、1プレシンクト毎に符号化を行う場合よりも、高効率かつ高品質に画像を圧縮することができる。
At this time, the
エントロピ符号化部103は、生成した符号化データを符号化装置100の外部に出力する。
The
次に、図1のウェーブレット変換部101で行われる処理について、より詳細に説明する。先ず、ウェーブレット変換部101に入力されるデータについて説明する。
Next, processing performed by the
ウェーブレット変換部101においては、可逆に分析フィルタ処理を行うために、例えば、整数精度で計算を行う、後述する整数型の5×3フィルタが用いられる。ウェーブレット変換部101は、入力データの最下位のビットまでを整数部として用いる。
In the
図2は、ウェーブレット変換部101の入力データの例を示す模式図である。図2において、各四角は入力データの各ビットを示し、図中左端が最上位ビットを示し、図中右端が最下位ビットを示す。
FIG. 2 is a schematic diagram illustrating an example of input data of the
また、図2に示される点Pは、小数点の位置を示す。図2においてはこの点Pが右端(最下位側)に存在する。また、この整数精度の計算では、最上位側(図中左端側)の1ビットが、符号(+/−)を示すビットとして利用される。 A point P shown in FIG. 2 indicates the position of the decimal point. In FIG. 2, this point P exists at the right end (lowest side). In this integer precision calculation, one bit on the most significant side (left side in the figure) is used as a bit indicating a sign (+/−).
次に、ウェーブレット変換について、概略的に説明する。図3は、画像データに対するウェーブレット変換の演算の構成例を模式的に示す図である。この図3の例は、幾つかある手法の中で最も一般的なウェーブレット変換であるオクターブ分割を複数レベルに亘って行う構成例を示している。なお、この図3の場合は、レベル数が3(レベル1乃至レベル3)であり、画像信号を低域と高域に分割し、且つ低域成分のみを階層的に分割する構成を取っている。また図3では、便宜上1次元の信号(例えば画像の水平成分)についてのウェーブレット変換を例示しているが、これを2次元に拡張する(例えば画像の垂直成分に対しても適用する)ことで2次元画像信号に対応することができる。
Next, the wavelet transform will be schematically described. FIG. 3 is a diagram schematically illustrating a configuration example of a wavelet transform operation on image data. The example of FIG. 3 shows a configuration example in which octave division, which is the most general wavelet transform among several methods, is performed over a plurality of levels. In the case of FIG. 3, the number of levels is 3 (
図3に示されるウェーブレット変換部への入力画像信号140は、まずローパスフィルタ131(伝達関数H0(z))とハイパスフィルタ132(伝達関数H1(z))とによって帯域分割され、得られた低域成分と高域成分は、それぞれ対応するダウンサンプラ133aおよびダウンサンプラ133bによって、解像度がそれぞれ2分の1倍に間引かれる(レベル1)。この時の出力がL成分141とH成分146の2つである。ここで、上記LはLowで低域、HはHighで高域を示す。この図3のローパスフィルタ131、ハイパスフィルタ132、ダウンサンプラ133a、およびダウンサンプラ133bによってレベル1の回路部121が構成されている。
The
上述したダウンサンプラ133a、およびダウンサンプラ133bによりそれぞれ間引かれた信号の内の低域成分、すなわちダウンサンプラ133aからの信号のみが、さらに、レベル2の回路部122のローパスフィルタ及びハイパスフィルタによって帯域分割され、それぞれ対応するダウンサンプラによって、解像度をそれぞれ2分の1倍に間引かれる(レベル2)。これらのレベル2のローパスフィルタ、ハイパスフィルタ及びダウンサンプラから成る回路部122の構成は、上述したレベル1のローパスフィルタ131、ハイパスフィルタ132、ダウンサンプラ133a、およびダウンサンプラ133bから成る回路部121と同様である。
Only the low-frequency components of the signals thinned out by the down-
このような処理を所定のレベルまで行うことで、低域成分を階層的に帯域分割した帯域成分が順次生成されていくことになる。レベル2で生成された帯域成分は、LL成分142とLH成分145である。図3には、レベル3まで帯域分割する例が示されており、レベル2の回路部122のローパスフィルタ側のダウンサンプラからの出力は、上述した回路部121と同様な構成のレベル3の回路部123に供給される。このようにレベル3まで帯域分割した結果、LLL成分143、LLH成分144、LH成分145、H成分146が生成される。
By performing such processing to a predetermined level, band components obtained by hierarchically dividing the low frequency component into bands are sequentially generated. The band components generated at
以上のようなウェーブレット変換により、図4に概略的に示されるように、画像データを空間周波数の高い帯域と低い帯域とに分割する処理が、分割の結果得られる空間周波数の低い帯域のデータに対して再帰的に繰り返される。符号化装置100は、このように分析フィルタ処理部111において空間周波数の低い帯域のデータをより小さな領域に追い込んでいくことにより、エントロピ符号化部103において効率的な圧縮符号化を行うことができるようにする。
As schematically shown in FIG. 4, by the wavelet transform as described above, the process of dividing the image data into a high spatial frequency band and a low spatial frequency is performed on the low spatial frequency band data obtained as a result of the division. It is recursively repeated. The
なお、図4は、画像データの最低域成分領域に対する低域成分の領域Lおよび高域成分の領域Hへの分割処理を3回、繰り返し、分割の階層の総数を示す分割レベル=3とした場合の例である。図4において、"L"および"H"は、それぞれ低域成分および高域成分を表し、"L"および"H"の順序は、前側が横方向(水平方向)に分割した結果の帯域を示し、後側が縦方向(垂直方向)に分割した結果の帯域を示す。また、"L"および"H"の前の数字は、その領域の階層を示しており、低域成分の階層ほど小さい値で表されている。この階層の最大値が、ウェーブレット変換のその時の分割レベル(分割数)を示す。 In FIG. 4, the division processing into the low-frequency component region L and the high-frequency component region H with respect to the lowest-frequency component region of the image data is repeated three times to obtain a division level = 3 indicating the total number of division layers. This is an example. In FIG. 4, “L” and “H” represent a low-frequency component and a high-frequency component, respectively, and the order of “L” and “H” is a band obtained by dividing the front side in the horizontal direction (horizontal direction). In the figure, the rear side shows a band obtained as a result of division in the vertical direction (vertical direction). The numbers before “L” and “H” indicate the hierarchy of the area, and the lower-frequency component hierarchy is represented by a smaller value. The maximum value of this hierarchy indicates the current division level (number of divisions) of the wavelet transform.
つまり、図4において「0LL」、「1HL」、「1LH」、および「1HH」が、図3のレベル3の分析フィルタ処理により(2LLが分割されて)得られるサブバンドであり、図4において「2HL」、「2LH」、および「2HH」が、図3のレベル2の分析フィルタ処理により(1LLが分割されて)得られるサブバンドであり、図4において、「3HL」、「3LH」、および「3HH」が、図3のレベル1の分析フィルタ処理により(ベースバンドの画像データが分割されて)得られるサブバンドである。
That is, “0LL”, “1HL”, “1LH”, and “1HH” in FIG. 4 are subbands obtained by the
すなわち、図4の例では、「3HH」が最も低域成分の少ない(高域成分が最も多く含まれる)サブバンドであり、「0LL」が、最も低域成分を多く含むサブバンドである。 That is, in the example of FIG. 4, “3HH” is the subband with the lowest low frequency component (the highest frequency component is included most), and “0LL” is the subband with the highest low frequency component.
低域成分に対して繰り返し変換および分割を行うのは、画像のエネルギが低域成分に集中しているためである。このことは、図5のAに一例が示される分割レベル=1の状態から、図5のBに一例が示される分割レベル=3の状態のように分割レベルを進めていくに従って、図5のBに示されるようにしてサブバンドが形成されていくことからも、理解される。図4の例の場合、ウェーブレット変換の分割レベルは3であり、この結果、10個のサブバンドが形成されている。 The reason why the low-frequency component is repeatedly converted and divided is that the energy of the image is concentrated on the low-frequency component. This is because, as the division level is advanced from the division level = 1 example shown in FIG. 5A to the division level = 3 example shown in FIG. 5B, FIG. It is understood from the fact that subbands are formed as shown in FIG. In the example of FIG. 4, the division level of the wavelet transform is 3, and as a result, 10 subbands are formed.
ウェーブレット変換部51は、通常、低域フィルタと高域フィルタとから構成されるフィルタバンクを用いて、上述のような処理を行う。なお、デジタルフィルタは、通常、複数タップ長のインパルス応答すなわちフィルタ係数を持っているため、フィルタ処理を行えるだけの入力画像データまたは係数データを予めバッファリングしておく必要がある。また、ウェーブレット変換を多段にわたって行う場合も同様に、前段で生成したウェーブレット変換係数を、フィルタ処理が行える数だけバッファリングしておく必要がある。 The wavelet transform unit 51 normally performs the above-described processing using a filter bank composed of a low-pass filter and a high-pass filter. Since a digital filter usually has an impulse response having a plurality of taps, that is, a filter coefficient, it is necessary to buffer in advance input image data or coefficient data that can be filtered. Similarly, when wavelet transform is performed in multiple stages, it is necessary to buffer the wavelet transform coefficients generated in the previous stage as many times as can be filtered.
JPEG-2000 Part-1のFCD(Final Committee Draft)で規定されている整数精度型の5×3分析フィルタによる可逆な整数型ウェーブレット変換演算について説明する。図6は、整数精度型の5×3分析フィルタ(以下、整数型5×3分析フィルタとも称する)の演算を説明するための図であり、1次元の分析フィルタ処理を1回行い、図中左端の入力画像データを低域成分sと高域成分dとに変換する動作を示している。ここで、dm nをウェーブレット変換のレベルがnのm番目の高域成分係数であるとする。同様に、sm nをウェーブレット変換のレベルがnのm番目の低域成分係数であるとする。なお、n=0の場合は、図6にも示されるように、入力画像そのものである。
A reversible integer type wavelet transform operation by an
この図6に示すように、低域成分係数sの算出式は、一般的に、以下の式(1)のように表わすことができる。 As shown in FIG. 6, the formula for calculating the low frequency component coefficient s can be generally expressed as the following formula (1).
sm+1 n+1=sm+1 n+((dm n+1+dm+1 n+1+2)/4)・・・・・(1) s m + 1 n + 1 = s m + 1 n + ((d m n + 1 + d m + 1 n + 1 +2) / 4) (1)
ここで、式中の1/4の演算は、ビットシフトによって実現でき、2ビット右シフトを「>>2」で表記するとき、上記式(1)は、以下の式(1')のように表わすことができる。 Here, the ¼ operation in the equation can be realized by a bit shift, and when the 2-bit right shift is expressed as “>> 2”, the above equation (1) is expressed as the following equation (1 ′): Can be expressed as
sm+1 n+1=sm+1 n+((dm n+1+dm+1 n+1+2)>>2)・・・・(1') s m + 1 n + 1 = s m + 1 n + ((d m n + 1 + d m + 1 n + 1 +2) >> 2) (1 ′)
なお、上記式(1)の括弧内の+2は、右シフトの際に生じる丸め誤差に対する補償を行うためのものである。 Note that +2 in parentheses in the above formula (1) is for compensating for a rounding error that occurs during a right shift.
また、高域成分係数dの算出式は、一般的に、以下の式(2)のように表わすことができる。 Further, the calculation formula of the high frequency component coefficient d can be generally expressed as the following formula (2).
dm n+1=dm n−((sm n+sm+1 n)/2) ・・・(2) d m n + 1 = d m n − ((s m n + s m + 1 n ) / 2) (2)
あるいは、1ビット右シフトを「>>1」で表して、以下の式(2’)のように表わすことができる。 Alternatively, 1-bit right shift can be expressed by “>> 1” and expressed as the following expression (2 ′).
dm n+1=dm n−((sm n+sm+1 n)>>1) ・・・(2') d m n + 1 = d m n − ((s m n + s m + 1 n ) >> 1) (2 ′)
ここで、図6の例では、入力画像データに対して初段のウェーブレット変換係数、すなわち、レベルn=1の低域成分係数および高域成分係数を計算しており、この場合の入力画像データのs、dは、低域成分係数や高域成分係数を表わすものではない。また、画面の端部に相当する位置では、画面外部に相当するデータを画面外部のデータの折り返しで用いている。例えば、図6中のデータs0 1を求めるためには、s0 0と、d0 1と、さらにd0 1の折り返しとしての同じd0 1とを用いている。またd7 1を求めるためにs7 0を2つ用いるのも同様である。 Here, in the example of FIG. 6, the first-stage wavelet transform coefficient, that is, the low-frequency component coefficient and the high-frequency component coefficient of level n = 1 are calculated for the input image data. s and d do not represent a low-frequency component coefficient or a high-frequency component coefficient. Further, at a position corresponding to the edge of the screen, data corresponding to the outside of the screen is used for returning data outside the screen. For example, in order to obtain the data s 0 1 in FIG. 6, a s 0 0, and d 0 1, further using the same d 0 1 as wrapping d 0 1. Similarly, two s 7 0 are used to obtain d 7 1 .
図6中の破線で囲った部分SPは、上記式(1)におけるn=0,m=1に相当する低域成分係数s2 1を求めている部分であり、以下の式(3)のような計算が行われている。 A portion SP surrounded by a broken line in FIG. 6 is a portion for obtaining a low-frequency component coefficient s 2 1 corresponding to n = 0 and m = 1 in the above equation (1), and in the following equation (3): Such a calculation is performed.
s2 1=s2 0+((d1 1+d2 1+2)/4) ・・・(3) s 2 1 = s 2 0 + ((d 1 1 + d 2 1 +2) / 4) (3)
また、図6中の破線で囲った部分DPは、上記式(2)のn=0,m=0に相当する高域成分係数d0 1を求めている部分であり、以下の式(4)のような計算が行われている。 Further, a part DP surrounded by a broken line in FIG. 6 is a part for obtaining a high frequency component coefficient d 0 1 corresponding to n = 0 and m = 0 in the above formula (2). ) Is calculated.
d0 1=d0 0−((s0 0+s1 0)/2) ・・・(4) d 0 1 = d 0 0 − ((s 0 0 + s 1 0 ) / 2) (4)
ここで、1/4乗算は2ビット右シフト「>>2」により、また1/2乗算は1ビット右シフト「>>1」によりそれぞれ実現できることは、上述した通りである。 Here, as described above, ¼ multiplication can be realized by 2-bit right shift “>> 2” and ½ multiplication can be realized by 1-bit right shift “>> 1”.
上述した式(1)および式(2)を計算するために要する演算量は、乗算を上述したようにシフト演算で実現するとして、乗算「0」、加減算「5」、およびシフト演算「2」となる。この動作を上から下まで同様に行うことですべての係数を算出することができる。なお、上述したように、画像のような2次元信号に対しては、1次元方向(例えば垂直方向)のウェーブレット変換で生成された係数群に対して、もう1方向(例えば水平方向)に、上記と同様にウェーブレット変換を施せば良い。 The amount of calculation required to calculate the above-described equations (1) and (2) is as follows: multiplication “0”, addition / subtraction “5”, and shift operation “2”, assuming that multiplication is realized by shift operation as described above. It becomes. By performing this operation in the same manner from top to bottom, all the coefficients can be calculated. As described above, for a two-dimensional signal such as an image, a coefficient group generated by a wavelet transform in a one-dimensional direction (for example, the vertical direction), in another direction (for example, a horizontal direction), The wavelet transform may be performed as described above.
なお、実際には、リフティング(Lifting)技術を用いることで、上述したフィルタ処理の計算を減らすことができる。このリフティングについて説明する。図7は、整数型5×3フィルタ(分析フィルタおよび合成フィルタ)のリフティングによる1次元のフィルタ処理を分解レベル=2まで実行した例を示している。なお、図7において、図の左側に分析フィルタとして示される部分は、図1のウェーブレット変換部101のフィルタである。また、図の右側に合成フィルタとして示される部分は、後述するウェーブレット逆変換部のフィルタである。
In practice, the above-described filter processing calculation can be reduced by using a lifting technique. This lifting will be described. FIG. 7 shows an example in which one-dimensional filter processing by lifting of an
図7において、左端列は、ベースバンドの画像データである原画像データ(つまり、符号化装置100に入力された画像データ)のある1ライン(または1列)上の連続する画素データを示している。図7中の左端から1列目乃至3列目が分割レベル=1のフィルタ処理を示し、4列目乃至6列目が分割レベル=2のフィルタ処理を示す。 In FIG. 7, the leftmost column indicates continuous pixel data on one line (or one column) of original image data (that is, image data input to the encoding device 100) that is baseband image data. Yes. The first through third columns from the left end in FIG. 7 show the filter processing at the division level = 1, and the fourth through sixth columns show the filter processing at the division level = 2.
分解レベル=1の分析フィルタ処理において、第1段階の分析フィルタ処理として、原画像データに基づき高域成分の係数データが算出され、第2段階の分析フィルタ処理として、第1段階の分析フィルタ処理で算出された高域成分の係数データと、原画像データとに基づき低域成分の係数データが算出される。図7中の左端から2列目が高域成分出力を示し、左端から3列目が低域成分出力を示す。
In the analysis filter processing at the decomposition level = 1, high-frequency component coefficient data is calculated based on the original image data as the first-stage analysis filter processing, and the first-stage analysis filter processing is performed as the second-stage analysis filter processing. The coefficient data of the low frequency component is calculated based on the coefficient data of the high frequency component calculated in
算出された高域成分の係数データは、図1のエントロピ符号化部103に供給される。また、算出された低域成分の係数データは、図1の途中計算用バッファ部102に格納される。図7において、エントロピ符号化部103は一点鎖線で囲まれた部分として示され、途中計算用バッファ部102は点線で囲まれた部分として示される。
The calculated coefficient data of the high frequency component is supplied to the
途中計算用バッファ部102に保持された分解レベル=1の分析フィルタ処理の結果に基づき、分解レベル=2の分析フィルタ処理が行われる。分解レベル=2のフィルタ処理では、分解レベル=1のフィルタ処理において低域成分の係数として算出された係数データを、低域成分および高域成分を含んだ係数データと見做して、分解レベル=1と同様のフィルタ処理を行う。分解レベル=2のフィルタ処理により算出された、高域成分の係数データおよび低域成分の係数データは、図1のエントロピ符号化部103に供給される。
Based on the analysis filter processing result of decomposition level = 1 held in the midway
図1のウェーブレット変換部101では、上述したようなフィルタ処理を、画面の水平方向および垂直方向にそれぞれ行う。例えば、ウェーブレット変換部101は、先ず、分解レベル=1のフィルタ処理を水平方向に行い、生成された高域成分および低域成分の係数データを途中計算用バッファ部102に格納する。次に、ウェーブレット変換部101は、途中計算用バッファ部102に格納された係数データに対して、垂直方向に分解レベル=1のフィルタ処理を行う。この分解レベル=1の水平および垂直方向の処理により、高域成分をさらに高域成分および低域成分に分解した係数データのそれぞれによるサブバンドHHおよびサブバンドHLと、低域成分をさらに高域成分および低域成分に分解した係数データのそれぞれによるサブバンドLHおよびサブバンドLLとの4つのサブバンドが形成される。
The
そして、分解レベル=2では、水平方向および垂直方向のそれぞれについて、分解レベル=1で生成された低域成分の係数データに対してさらに分析フィルタ処理が行われる。すなわち、分解レベル=2の分析フィルタ処理により、分解レベル=1で分割されて形成されたサブバンドLLがさらに4分割され、サブバンドHH、サブバンドHL、サブバンドLHおよびサブバンドLLが形成される。 At the decomposition level = 2, the analysis filter processing is further performed on the coefficient data of the low frequency component generated at the decomposition level = 1 for each of the horizontal direction and the vertical direction. That is, by the analysis filter processing at the decomposition level = 2, the subband LL divided and formed at the decomposition level = 1 is further divided into four to form the subband HH, subband HL, subband LH, and subband LL. The
ウェーブレット変換部101は、画面の縦方向については、上述したようなウェーブレット変換による可逆な分析フィルタ処理を、数ライン毎の処理に分割して、複数回に分けて段階的に行うようにしている。図7の例では、画面上の第1ラインからの処理になる1回目の処理は、7ラインについてフィルタ処理を行い、8ライン目からの処理になる2回目以降の処理は、4ライン毎にフィルタ処理を行っている。この各回のライン数は、上述した分析フィルタ処理により1ライン分の最低域成分を生成するために必要なライン数に基づく。
In the vertical direction of the screen, the
なお、以下において、この最低域成分の1ライン分(最低域成分のサブバンドの1ライン分の係数データ)を生成するために必要な、他のサブバンドも含めたラインの集まりを、プレシンクト(またはラインブロック)と称する。ここでラインとは、ウェーブレット変換前の画像データに対応するピクチャ(フレームまたはフィールド)、または各サブバンド内において形成される1行分の画素データ若しくは係数データのことを示す。すなわち、プレシンクト(ラインブロック)とは、ウェーブレット変換前の元の画像データにおける、ウェーブレット変換後の最低域成分のサブバンド1ライン分の係数データを生成するために必要なライン数分の画素データ群、または、その画素データ群をウェーブレット変換して得られる各サブバンドの係数データ群のことを示す。 In the following, a collection of lines including other subbands necessary for generating one line of the lowest frequency component (coefficient data for one line of the subband of the lowest frequency component) is precinct ( Or a line block). Here, the line indicates a picture (frame or field) corresponding to image data before wavelet transform, or pixel data or coefficient data for one row formed in each subband. That is, the precinct (line block) is a pixel data group corresponding to the number of lines necessary for generating coefficient data for one subband of the lowest frequency component after wavelet transformation in the original image data before wavelet transformation. Or the coefficient data group of each subband obtained by wavelet transforming the pixel data group.
図7によれば、分解レベル=2のフィルタ処理結果で得られる係数C5は、係数C4および途中計算用バッファ部102に格納された係数Caに基づき算出され、係数C4は、途中計算用バッファ部102に格納された係数Ca、係数Cbおよび係数Ccに基づき算出される。さらに、係数Ccは、エントロピ符号化部103に供給される係数C2および係数C3、並びに、第5ラインの画素データに基づき算出される。また、係数C3は、第5ライン乃至第7ラインの画素データに基づき算出される。このように、分割レベル=2における低域成分の係数C5を得るためには、第1ライン乃至第7ラインの画素データが必要とされる。
According to FIG. 7, the coefficient C5 obtained as a result of the filter processing of decomposition level = 2 is calculated based on the coefficient C4 and the coefficient Ca stored in the midway
これに対して、2回目以降のフィルタ処理においては、前回までのフィルタ処理で既に算出されエントロピ符号化部103に供給された係数データ(実際には供給した係数データと同じものをウェーブレット変換部101(または途中計算用バッファ部102)が保持している)を用いることができるので、必要なライン数が少なくて済む。 On the other hand, in the second and subsequent filter processing, the coefficient data already calculated in the previous filter processing and supplied to the entropy encoding unit 103 (actually the same as the supplied coefficient data is used as the wavelet transform unit 101). (Or held by the midway calculation buffer unit 102) can be used, and the number of necessary lines can be reduced.
すなわち、図7によれば、分解レベル=2のフィルタ処理結果で得られる低域成分の係数のうち、係数C5の次の係数である係数C9は、係数C4および係数C8、並びに、途中計算用バッファ部102に格納された係数Ccに基づき算出される。係数C4は、上述した1回目のフィルタ処理により既に算出され、エントロピ符号化部103に供給される(実際には供給した係数データと同じものをウェーブレット変換部101(または途中計算用バッファ部102)が保持している)。同様に、係数Ccは、上述の1回目のフィルタ処理により既に算出され、途中計算用バッファ部102に格納されている。したがって、この2回目のフィルタ処理においては、係数C8を算出するためのフィルタ処理のみが、新たになされることになる。この新たなフィルタ処理は、第8ライン乃至第11ラインがさらに用いられてなされる。
That is, according to FIG. 7, the coefficient C9, which is the coefficient next to the coefficient C5 among the coefficients of the low-frequency component obtained from the filter processing result of the decomposition level = 2, is the coefficient C4, the coefficient C8, and the intermediate calculation It is calculated based on the coefficient Cc stored in the
このように、2回目以降のフィルタ処理は、前回までのフィルタ処理により算出され途中計算用バッファ部102およびエントロピ符号化部103に供給されるデータ(実際にはウェーブレット変換部101(または途中計算用バッファ部102)が保持しているデータ)を用いることができるので、それぞれ4ライン毎の処理で済むことになる。
In this way, the second and subsequent filtering processes are calculated by the previous filtering process and supplied to the midway
なお、画面上のライン数が符号化のライン数と合致しない場合は、原画像データのラインを所定の方法で複製してライン数を符号化のライン数と合わせて、フィルタ処理を行う。 If the number of lines on the screen does not match the number of lines to be encoded, the original image data lines are copied by a predetermined method, and the number of lines is matched with the number of lines to be encoded.
このように、ウェーブレット変換部101は、最低域成分1ライン分の係数データが得られるだけのフィルタ処理を段階的に、画面全体のラインに対して複数回に分けて(プレシンクト(ラインブロック)単位で)行うことで、符号化データを伝送した際に低遅延で復号画像を得ることを可能としている。
In this way, the
既に説明したように、ウェーブレット変換においては、高域成分側から低域成分側へと係数が生成されていく。図7の例では、1回目において、原画像の画素データにより、分解レベル=1のフィルタ処理で、高域成分の係数C1、係数C2および係数C3が順次生成される。そして、分解レベル=1のフィルタ処理で得られた低域成分の係数データに対して分解レベル=2のフィルタ処理を行い、低域成分の係数C4および係数C5が順次生成される。すなわち、第1回目では、係数C1、係数C2、係数C3、係数C4、係数C5の順に、係数データが生成される。この係数データの生成順は、ウェーブレット変換の原理上、必ずこの順序(高域から低域の順)になる。 As already described, in the wavelet transform, coefficients are generated from the high frequency component side to the low frequency component side. In the example of FIG. 7, at the first time, the high-frequency component coefficient C1, coefficient C2, and coefficient C3 are sequentially generated from the pixel data of the original image by the filter processing of decomposition level = 1. Then, the filter processing of decomposition level = 2 is performed on the coefficient data of the low frequency component obtained by the filter processing of decomposition level = 1, and the low frequency component coefficient C4 and the coefficient C5 are sequentially generated. That is, in the first time, coefficient data is generated in the order of coefficient C1, coefficient C2, coefficient C3, coefficient C4, and coefficient C5. The generation order of the coefficient data is always in this order (order from high to low) on the principle of wavelet transform.
これに対して、復号処理は低域成分から先に行われる。図7の例を用いて、より具体的に説明する。図7の右側は、上述したウェーブレット変換(分析フィルタ処理)の逆変換であるウェーブレット逆変換を行う合成フィルタ処理の例を示す。復号側の、出力画像データの第1ライン目を含む1回目の合成フィルタ処理(ウェーブレット逆変換処理)は、符号化側の1回目のフィルタ処理で生成された最低域成分の係数C4および係数C5と、係数C1とを用いて行われる。 On the other hand, the decoding process is performed first from the low frequency component. This will be described more specifically with reference to the example of FIG. The right side of FIG. 7 shows an example of synthesis filter processing for performing wavelet inverse transformation, which is the inverse transformation of the above-described wavelet transformation (analysis filter processing). The first synthesis filter process (wavelet inverse transform process) including the first line of the output image data on the decoding side is performed by the coefficient C4 and the coefficient C5 of the lowest frequency component generated by the first filter process on the encoding side. And the coefficient C1.
すなわち、1回目の合成処理においては、分解レベル=2に対応する合成処理である合成レベル=2の処理で係数C5および係数C4に対して合成フィルタ処理が行われ、係数Cfが生成され、その係数Cfがバッファに格納される。そして、分解レベル=1に対応する合成処理である合成レベル=1の処理で、この係数Cfと係数C1に対して合成フィルタ処理が行われ、ベースバンドの画像データの第1ラインが生成される。 That is, in the first synthesis process, the synthesis filter process is performed on the coefficient C5 and the coefficient C4 in the synthesis level = 2 process that is the synthesis process corresponding to the decomposition level = 2, and the coefficient Cf is generated. The coefficient Cf is stored in the buffer. A synthesis filter process is performed on the coefficient Cf and the coefficient C1 in a process of synthesis level = 1, which is a synthesis process corresponding to the decomposition level = 1, and a first line of baseband image data is generated. .
このように、第1回目の合成フィルタ処理は、符号化側の分析フィルタ処理により係数C1、係数C2、係数C3、係数C4、係数C5の順に生成された係数データを、係数C5、係数C4、係数C1、・・・の順に処理する。 As described above, the first synthesis filter processing is performed by converting coefficient data generated in the order of the coefficient C1, the coefficient C2, the coefficient C3, the coefficient C4, and the coefficient C5 by the analysis filter processing on the encoding side into the coefficient C5, the coefficient C4, Processing is performed in the order of the coefficients C1,.
なお、図7の右側に示す合成フィルタ側では、符号化側から供給される係数について、括弧内に分析フィルタ側でのライン順を示し、括弧外に合成フィルタ側でのライン順を示す。例えば係数C1(5)は、図7の左側の分析フィルタ側では第5ライン目であって、合成フィルタ側では第1ライン目であることを示す。 On the synthesis filter side shown on the right side of FIG. 7, for the coefficients supplied from the coding side, the line order on the analysis filter side is shown in parentheses, and the line order on the synthesis filter side is shown outside the parentheses. For example, the coefficient C1 (5) indicates that it is the fifth line on the left analysis filter side in FIG. 7 and the first line on the synthesis filter side.
2回目以降の分析フィルタ処理で生成された係数データに対する合成フィルタ処理は、分析フィルタ側から供給された係数データの他に、前回の合成フィルタ処理の際に合成された係数データや画像データを用いて行われる。図7の例の場合、2回目の合成フィルタ処理は、分析フィルタ側から供給された係数データとして、2回目の分析フィルタ処理により生成された低域成分の係数C8および係数C9の他に、1回目の分析フィルタ処理により生成された係数C2および係数C3が用いられて行われる。この2回目の合成フィルタ処理により、ベースバンドの画像データの第2ライン乃至第5ラインが復号される。 The synthesis filter process for the coefficient data generated in the second and subsequent analysis filter processes uses coefficient data and image data synthesized in the previous synthesis filter process in addition to the coefficient data supplied from the analysis filter side. Done. In the case of the example in FIG. 7, the second synthesis filter process is performed by using the coefficient data supplied from the analysis filter side as well as the low-frequency component coefficient C8 and coefficient C9 generated by the second analysis filter process. This is performed using the coefficient C2 and the coefficient C3 generated by the second analysis filter process. Through the second synthesis filter processing, the second to fifth lines of the baseband image data are decoded.
すなわち、2回目の合成処理においては、係数C9、係数C8、係数C2、係数C3の順に処理される。つまり、合成レベル=2の合成フィルタ処理は、係数C8および係数C9と、1回目の合成フィルタ処理の際に符号化側から供給された係数C4とを用いて係数Cgを生成し、バッファに格納する。また、合成レベル=2の合成フィルタ処理は、この係数Cgと、上述の係数C4と、1回目の合成フィルタ処理により生成されバッファに格納された係数Cfとを用いて係数Chを生成し、バッファに格納する。 That is, in the second combining process, the coefficient C9, the coefficient C8, the coefficient C2, and the coefficient C3 are processed in this order. That is, in the synthesis filter process of synthesis level = 2, the coefficient Cg is generated using the coefficients C8 and C9 and the coefficient C4 supplied from the encoding side in the first synthesis filter process, and stored in the buffer. To do. In addition, the synthesis filter process of synthesis level = 2 generates a coefficient Ch using the coefficient Cg, the above-described coefficient C4, and the coefficient Cf generated by the first synthesis filter process and stored in the buffer, To store.
そして、合成レベル=1の合成フィルタ処理は、合成レベル=2の合成フィルタ処理で生成されバッファに格納された係数Cgおよび係数Chと、分析フィルタ側から供給された係数C2(合成フィルタ側では係数C6(2)と示されている)および係数C3(合成フィルタ側では係数C7(3)と示されている)とを用い、ベースバンドの画像データの第2ライン乃至第5ラインを復号する。 Then, the synthesis filter process of synthesis level = 1 includes the coefficient Cg and coefficient Ch generated by the synthesis filter process of synthesis level = 2 and stored in the buffer, and the coefficient C2 supplied from the analysis filter side (coefficient C2 on the synthesis filter side). C6 (2)) and coefficient C3 (denoted as coefficient C7 (3) on the synthesis filter side) are used to decode the second to fifth lines of baseband image data.
このように、第2回目の合成フィルタ処理においては、分析フィルタ側において係数C2、係数C3、(係数C4、係数C5)、係数C6、係数C7、係数C8、係数C9の順に生成された係数データが、係数C9、係数C8、係数C2、係数C3、・・・の順に処理される。 In this way, in the second synthesis filter process, coefficient data generated in the order of coefficient C2, coefficient C3, (coefficient C4, coefficient C5), coefficient C6, coefficient C7, coefficient C8, and coefficient C9 on the analysis filter side. Are processed in the order of coefficient C9, coefficient C8, coefficient C2, coefficient C3,.
3回目以降の合成フィルタ処理においても、同様にして、分析フィルタ処理により生成された係数データが所定の順序に並び替えられて処理され、4ラインずつ、ベースバンドの画像データのラインが復号される。 Similarly, in the third and subsequent synthesis filter processing, the coefficient data generated by the analysis filter processing is rearranged in a predetermined order, and the lines of the baseband image data are decoded by four lines. .
なお、画面の下端のラインを含む分析フィルタ処理(以下、最後の回と呼ぶ)に対応する合成フィルタ処理では、それまでの処理で生成されバッファに格納された係数データを全て出力することになるため、出力ライン数が多くなる。図7の例では、最後の回に8ラインが出力される。 In the synthesis filter processing corresponding to the analysis filter processing including the line at the lower end of the screen (hereinafter referred to as the last round), all the coefficient data generated in the previous processing and stored in the buffer are output. As a result, the number of output lines increases. In the example of FIG. 7, 8 lines are output in the last round.
図8を用いて、上述までの処理をより具体的に説明する。図8は、整数型の5×3分析フィルタを用いて、分解レベル=2までウェーブレット変換によるフィルタ処理を施す場合の例である。ウェーブレット変換部101において、図8のAに一例が示されるように、入力画像データの第1ラインから第7ラインに対して1回目の分析フィルタ処理が水平および垂直方向にそれぞれ行われる(図8のAのIn−1)。
The processing up to the above will be described more specifically with reference to FIG. FIG. 8 is an example in the case of performing filter processing by wavelet transform up to decomposition level = 2 using an
1回目の分析フィルタ処理の分解レベル=1の、水平および垂直方向の処理により、少なくともいずれか一方の処理において上述した係数C1、係数C2、および係数C3に対応するとされる係数データが、図8のBに一例が示されるように、分解レベル=1で形成されるサブバンドHH、サブバンドHL、およびサブバンドLHのそれぞれについて3ライン分ずつ生成される(図8のBのWT−1)。 The coefficient data that corresponds to the coefficient C1, the coefficient C2, and the coefficient C3 described above in at least one of the processes in the horizontal and vertical directions with the decomposition level = 1 of the first analysis filter process is shown in FIG. As shown in FIG. 8B, three lines are generated for each of subband HH, subband HL, and subband LH formed at decomposition level = 1 (WT-1 in FIG. 8B). .
また、1回目の分析フィルタ処理の分解レベル=1の、水平および垂直方向の処理の両方において低域成分とされる係数データで形成されるサブバンドLLは、分解レベル=2による水平および垂直方向の分割フィルタ処理でさらに4分割される。1回目の分析フィルタ処理の分解レベル=2の、水平および垂直方向の処理により、その両方の処理において係数C5に対応するとされる係数データが、サブバンドLL内のサブバンドLLの1ライン分生成される。また、1回目の分析フィルタ処理の分解レベル=2の、水平および垂直方向の処理により、少なくともいずれか一方の処理において係数C4に対応するとされる係数データが、サブバンドLL内のサブバンドHH、サブバンドHL、およびサブバンドLHのそれぞれについて1ライン分ずつ生成される。 In addition, the subband LL formed by coefficient data that is a low-frequency component in both the horizontal and vertical processing at the decomposition level = 1 of the first analysis filter processing is in the horizontal and vertical directions according to the decomposition level = 2. Is further divided into four by the division filter processing. Coefficient data corresponding to the coefficient C5 in both processes is generated for one line of the subband LL in the subband LL by the horizontal and vertical processes at the decomposition level = 2 of the first analysis filter process. Is done. In addition, the coefficient data that is assumed to correspond to the coefficient C4 in at least one of the processes in the horizontal and vertical directions at the decomposition level = 2 of the first analysis filter process is subband HH in subband LL, One line is generated for each of the subband HL and the subband LH.
ウェーブレット変換部51による2回目以降のフィルタ処理では、4ライン毎にフィルタ処理が行われ(図8のAのIn−2・・・)、各サブバンドについて、分解レベル=1で2ラインずつの係数データが生成され(図8のBのWT−2)、分解レベル=2で1ラインずつの係数データが生成される。 In the second and subsequent filter processing by the wavelet transform unit 51, filter processing is performed every four lines (In-2 in FIG. 8A), and for each subband, two lines at a decomposition level = 1. Coefficient data is generated (WT-2 in FIG. 8B), and coefficient data for each line is generated at the decomposition level = 2.
図8のBのようにウェーブレット変換された係数データを復号する際、図8のCに一例が示されるように、第1ライン乃至第7ラインによる1回目の分析フィルタ処理に対して、1回目の合成フィルタ処理により第1ラインが出力される(図8のCのOut−1)。以降、2回目から最後の1つ前の回までの分析フィルタ処理に対する合成フィルタ処理により、4ラインずつ画像データが出力される(図8のCのOut−2・・・)。そして、最後の回の分析フィルタ処理に対する合成フィルタ処理により8ラインの画像データが出力される。 When decoding the wavelet-transformed coefficient data as shown in FIG. 8B, as shown in FIG. 8C, the first analysis filter processing by the first line to the seventh line is performed for the first time. The first line is output by the synthesis filter processing (Out-1 in FIG. 8C). Thereafter, image data is output line by line (Out-2... In FIG. 8C) by the synthesis filter processing for the analysis filter processing from the second time to the last previous time. Then, 8-line image data is output by the synthesis filter processing for the last analysis filter processing.
ウェーブレット変換部101で高域成分側から低域成分側へと生成された係数データは、エントロピ符号化部103に順次、供給される。
The coefficient data generated by the
エントロピ符号化部103は、供給される係数データを、可逆な方法で順次符号化し、生成した符号化データを符号化装置100の外部に出力する。
The
図9は、図1の符号化装置100に対応する復号装置の構成例を示すブロック図である。図9に示される復号装置200は、図1の符号化装置100に対応する方法で、符号化装置100により画像データが符号化されて得られた符号化データを復号し、符号化前のベースバンドの画像データを復元する。つまり、復号装置200は、順方向と逆方向の変換が完全に保証される可逆な方法により画像データを復号する。これにより復号装置200は、高品質な画像データが得られるように、符号化装置100により符号化されて得られた符号化データを復号することができる。また、復号装置200は、符号化装置100により、画像データがプレシンクト単位で符号化されて得られた符号化データを、そのプレシンクト毎に復号する。これにより復号装置200は、画像データを符号化して復号するまでの遅延時間を低減させることができる。
FIG. 9 is a block diagram illustrating a configuration example of a decoding apparatus corresponding to the
復号装置200は、エントロピ復号部201、係数並び替え部202、係数バッファ部203、およびウェーブレット逆変換部204を有する。
The
エントロピ復号部201は、供給された符号化データを、エントロピ符号化部103(図1)による符号化方法に対応する可逆な復号方法で復号し、係数データを得る。その係数データは、係数並び替え部202に供給される。係数並び替え部202は、その供給された係数データ、つまり、高域成分から低域成分の順に供給される係数データを、低域成分から高域成分の順に並び替える。係数並び替え部202は、並び替えた係数データを、係数バッファ部203に格納する。ウェーブレット逆変換部204は、係数バッファ部203に格納された係数データを用いて、合成フィルタ処理(ウェーブレット逆変換)を行い、合成フィルタ処理の結果を再び係数バッファ部203に格納する。ウェーブレット逆変換部204は、この処理を分解レベルに応じて繰り返し、ベースバンドの画像データを得る。このベースバンドの画像データは、図1の符号化装置100に入力されるベースバンドの画像データと同等である。
The
つまり、復号装置200は、符号化装置100によりベースバンドの画像データが符号化されて得られる符号化データを復号することにより、符号化前のベースバンドの画像データを復元することができる。ベースバンドの画像データを得ると、ウェーブレット逆変換部204は、それを復号装置200の外部に出力する。
That is, the
ウェーブレット逆変換部204は、水平合成フィルタと垂直合成フィルタとを有し、係数データ群に対して、画面水平方向と画面垂直方向の両方について可逆なフィルタ処理を行う。ウェーブレット逆変換部204は、係数バッファ部203に格納された低域成分の係数データと高域成分の係数データを読み出し、合成フィルタ処理を施して、1つ下位のレベルの低域成分の係数データを生成する。生成された係数データは、係数バッファ部203に格納される。つまり、ウェーブレット逆変換部204は、入力データである低域成分と高域成分を合成し、1つ下位のレベルの低域成分を生成するフィルタ処理をレベル1の処理が終了するまで再帰的に繰り返す。
The wavelet
ウェーブレット逆変換部204は、この処理を繰り返してレベル1における合成フィルタ処理が終了したら(ベースバンドの画像データが得られたら)、係数バッファ部203からそのベースバンドの画像データを読み出し、読み出されたベースバンドの画像データを出力する。
When the wavelet
なお、係数バッファ部203およびウェーブレット逆変換部204を併せて合成フィルタ処理部211とも称する。
The
次に、図10のウェーブレット変換部101で行われる処理について、より詳細に説明する。先ず、ウェーブレット変換部101に入力されるデータについて説明する。
Next, processing performed by the
次に、ウェーブレット逆変換について、概略的に説明する。図10は、係数データに対するウェーブレット逆変換の演算の構成例を模式的に示す図である。図3を参照して説明したウェーブレット変換処理の出力である、LLL成分143に対応するLLL成分243、LLH成分144に対応するLLH成分244、LH成分145に対応するLH成分245、H成分146に対応するH成分246のうち、LLL成分243およびLLH成分244が、まず、それぞれアップサンプラ231aおよびアップサンプラ231bによって2倍の解像度にアップサンプルされる。アップサンプラ231aによりアップサンプルされた低域成分(LLL成分243)は、ローパスフィルタ232によってフィルタリングされ、加算器234に供給される。アップサンプラ231bによりアップサンプルされた高域成分(LLH成分244)は、ローパスフィルタ233によってフィルタリングされ、加算器234に供給される。
Next, the wavelet inverse transformation will be schematically described. FIG. 10 is a diagram schematically illustrating a configuration example of wavelet inverse transform operation on coefficient data. The output of the wavelet transform process described with reference to FIG. 3 is the
加算器234は、それらの低域成分および高域成分(LLL成分243およびLLH成分244)を合成する。ここまでの回路部221の処理により、図3のレベル3の回路部123での順方向変換に対応する逆変換が完了し、レベル2の低域成分であるLL成分247が得られる。
The
この処理を以後各レベルにおいてレベル1まで繰り返すことで、最終的な逆変換後の復号画像249が出力される。すなわち、レベル2の回路部222およびレベル1の回路部223は、上述したレベル3の回路部221と同様の構成を有する。つまり、レベル3の回路部221の出力(LL成分247)は、レベル2の回路部222の低域側に入力される。回路部222は、低域側に入力されたLL成分247と高域側に入力されたLH成分245を回路部221の場合と同様に合成し、レベル1の低域成分であるL成分248を出力する。このL成分248は、レベル1の回路部223の低域側に入力される。回路部223は、低域側に入力されたL成分248と高域側に入力されたH成分246を回路部221の場合と同様に合成し、ベースバンドの画像データ(復号画像)249を出力する。以上が、ウェーブレット逆変換処理の基本構成である。
By repeating this process to
JPEG-2000 のPart-1のFCDで規定されている整数精度型の5×3合成フィルタの演算について説明する。図11は、整数精度型の5×3合成フィルタ(以下、整数型5×3合成フィルタとも称する)の演算を説明するための図であり、1次元の合成フィルタ処理を1回行い、図中左端の低域成分sと中央部の高域成分dとから、図中右端の出力画像データを算出する様子を示している。この図11において、dm nをウェーブレット変換のレベルがnのm番目の高域成分係数であるとする。同様に、sm nをウェーブレット変換のレベルがnのm番目の低域成分係数であるとする。ここで、n=0の場合は、図11に示されるように出力画像となる。
The operation of the
この図9に示されるように、1つ下位レベルの低域成分係数sの算出式は、一般的に、以下の式(5)のように表わすことができる。 As shown in FIG. 9, the calculation formula for the low-frequency component coefficient s of one lower level can be generally expressed as the following formula (5).
sm+1 n=sm+1 n+1−((dm n+1+dm+1 n+1+2)/4) ・・・(5) s m + 1 n = s m + 1 n + 1 − ((d m n + 1 + d m + 1 n + 1 +2) / 4) (5)
ここで、この式(5)中の1/4の乗算をビットシフトで実現し、2ビット右シフトを「>>2」で表わすことにより、式(5)は、以下の式(5’)のように表わすことができる。 Here, by multiplying 1/4 in the equation (5) by bit shift and expressing a 2-bit right shift by “>> 2”, equation (5) can be expressed by the following equation (5 ′) It can be expressed as
sm+1 n=sm+1 n+1−((dm n+1+dm+1 n+1+2)>>2) ・・・(5') s m + 1 n = s m + 1 n + 1 − ((d m n + 1 + d m + 1 n + 1 +2) >> 2) (5 ′)
式(5)あるいは式(5')の括弧内の「+2」は、右シフトの際に生じる丸め誤差に対するものであるが、これは上述した分析フィルタの丸め処理と表裏一体のものである。この丸め処理が分析・合成側で一致していることが、可逆性を保持するために必要となることは勿論である。 “+2” in parentheses in the equation (5) or the equation (5 ′) relates to a rounding error that occurs in the right shift, and this is an integral part of the rounding process of the analysis filter described above. Of course, it is necessary for the rounding process to coincide on the analysis / synthesis side in order to maintain reversibility.
同様に、高域成分係数dの算出式は、一般的に、以下の式(6)のように表わすことができる。 Similarly, the calculation formula of the high frequency component coefficient d can be generally expressed as the following formula (6).
dm n=dm n+1+((sm n+sm+1 n)/2) ・・・(6) d m n = d m n + 1 + ((s m n + s m + 1 n ) / 2) (6)
ここで、1ビット右シフトを「>>1」で表わすことにより、式(6)は、以下の式(6’)のように表わすことができる。 Here, when the 1-bit right shift is represented by “>> 1”, Expression (6) can be represented as the following Expression (6 ′).
dm n=dm n+1+((sm n+sm+1 n)>>1) ・・・(6') d m n = d m n + 1 + ((s m n + s m + 1 n ) >> 1) (6 ′)
ここで、図11中の破線で囲った部分SPは、上述した式(5)におけるn=0,m=1に相当する低域成分係数s2 0を求めている部分であり、以下の式(7)に示される計算が行なわれている。 Here, a portion SP surrounded by a broken line in FIG. 11 is a portion for obtaining a low-frequency component coefficient s 2 0 corresponding to n = 0 and m = 1 in the above-described equation (5). The calculation shown in (7) is performed.
s2 0=s2 1−((d1 1+d2 1+2)/4) ・・・(7) s 2 0 = s 2 1 − ((d 1 1 + d 2 1 +2) / 4) (7)
また、図11中の破線で囲った部分DPは、上述した式(6)のn=0,m=0に相当する高域成分係数d0 0を求めている部分であり、以下の式(8)に示される計算が行なわれている。 A portion DP surrounded by a broken line in FIG. 11 is a portion for obtaining a high frequency component coefficient d 0 0 corresponding to n = 0 and m = 0 in the above-described equation (6). The calculation shown in 8) is performed.
d0 0=d0 1+((s0 0+s1 0)/2) ・・・(8) d 0 0 = d 0 1 + ((s 0 0 + s 1 0 ) / 2) (8)
ここで、1/4乗算は2ビット右シフト「>>2」により、また1/2乗算は1ビット右シフト「>>1」によりそれぞれ実現することができる。 Here, 1/4 multiplication can be realized by 2-bit right shift “>> 2”, and 1/2 multiplication can be realized by 1-bit right shift “>> 1”.
上述した式(5)および式(6)、特に、シフト演算を用いた式(5')および式(6')を計算するために要する演算量、すなわち、偶数番目・奇数番目の係数の1組を生成するのに要する演算量は、乗算「0」、加減算「5」、およびシフト演算「2」となる。この動作を上から下まで同様に行うことですべての係数を算出することができる。なお、上述したように、画像のような2次元信号に対しては、1次元方向(例えば垂直方向)のウェーブレット逆変換(合成フィルタ処理)で生成された係数群に対して、もう1方向(例えば水平方向)に、上記と同様にウェーブレット逆変換を施せば良い。 The above-described equations (5) and (6), in particular, the amount of calculation required to calculate the equations (5 ′) and (6 ′) using the shift operation, that is, 1 of even-numbered and odd-numbered coefficients. The amount of calculation required to generate a set is multiplication “0”, addition / subtraction “5”, and shift calculation “2”. By performing this operation in the same manner from top to bottom, all the coefficients can be calculated. As described above, with respect to a two-dimensional signal such as an image, another direction (with respect to a coefficient group generated by wavelet inverse transform (synthesis filter processing) in a one-dimensional direction (for example, vertical direction) ( For example, the wavelet inverse transform may be performed in the same manner as described above in the horizontal direction.
次に、以上の符号化装置100および復号装置200による処理の流れについて説明する。最初に、図12のフローチャートを参照して符号化装置100により実行される符号化処理の流れの例を説明する。
Next, the flow of processing by the
符号化処理が開始されると、符号化装置100のウェーブレット変換部101は、ステップS101において、処理対象プレシンクトの番号Aを初期設定にする。例えば、番号Aは「1」に設定される。設定が終了すると、ウェーブレット変換部101は、ステップS102において、変換後の最低域サブバンドの上からA番目の1ラインを生成するのに必要なライン数(すなわち、1プレシンクト)の画像データを取得する。
When the encoding process is started, the
1プレシンクト分の画像データを取得すると、ウェーブレット変換部101は、その画像データに対して、ステップS103において画面垂直方向に並ぶ画像データに対して可逆な方法で分析フィルタリングを行う可逆垂直分析フィルタリング処理を行い、ステップS104において画面水平方向に並ぶ画像データに対して可逆な方法で分析フィルタリング処理を行う可逆水平分析フィルタリング処理を行う。
When the image data for one precinct is acquired, the
ステップS105においてウェーブレット変換部101は、可逆垂直分析フィルタリング処理および可逆水平分析フィルタリング処理を最終レベルまで行ったか否かを判定する。分解レベルが予め定められた最終レベルに達していないと判定された場合、処理はステップS103に戻り、現在の分解レベルに対して、ステップS103およびステップS104の分析フィルタリング処理が繰り返される。
In step S105, the
ステップS105において、分析フィルタリング処理が最終レベルまで行われたと判定された場合、処理は、ステップS106に進む。 If it is determined in step S105 that the analysis filtering process has been performed to the final level, the process proceeds to step S106.
ステップS106において、エントロピ符号化部103は、ウェーブレット変換部101が所定数のプレシンクトを処理したか否かを判定し、処理したと判定した場合、ステップS107に処理を進め、蓄積された係数データに対してエントロピ符号化を行う。符号化が終了すると、エントロピ符号化部103は、得られた符号化データを出力し、処理をステップS108に進める。また、ステップS106において、所定数のプレシンクトが処理されていないと判定された場合、ステップS107の処理は省略され、ステップS108に処理が進められる。
In step S106, the
ステップS108において、ウェーブレット変換部101は、プレシンクト番号Aの値を「1」インクリメントする。ステップS109において、ウェーブレット変換部101は、未処理のラインが存在するか否かを判定し、存在すると判定した場合、処理をステップS102に戻し、それ以降の処理を繰り返す。また、ステップS109において、未処理のラインが存在しないと判定した場合、ウェーブレット変換部101は、符号化処理を終了する。
In step S108, the
符号化装置100は、以上のような符号化処理をピクチャ(フレームまたはフィールド)単位で繰り返す。
The
このように、ウェーブレット変換部101は、プレシンクト単位で可逆垂直分析フィルタリング処理および可逆水平分析フィルタリング処理を最終レベルまで連続して行うので、従来の方法と比較して、一度に(同時期に)保持する(バッファリングする)必要のあるデータの量が少なく、用意すべきバッファのメモリ量を大幅に低減させることができる。従って、画面全体に対してウェーブレット変換を行う方法と比較して遅延時間を大幅に低減させることができる。また、エントロピ符号化の処理を複数のプレシンクト単位で行うことができる。従って、1プレシンクト単位毎に符号化を行う場合よりも高効率および高品質に画像データをエントロピ符号化することができる。さらに、ウェーブレット変換やエントロピ符号化を可逆な方法で行うことにより、符号化装置100は、画像データを、高品質かつ低遅延に伝送することができる。
As described above, the
次に、図13のフローチャートを参照して、符号化装置200により実行される復号処理の流れの例を説明する。
Next, an example of the flow of decoding processing executed by the
復号処理が開始されると、エントロピ復号部201は、ステップS201において、入力された符号化データをエントロピ復号する。ステップS202において、係数並び替え部202は、係数データを低域成分から高域成分の順に並び替える。ステップS203において、ウェーブレット逆変換部204は、係数バッファ部203に、係数並び替え部202より供給された係数データが1プレシンクト分以上保持されると、その1プレシンクト分の係数データを読み出して、可逆垂直合成フィルタ処理を行い、ステップS204において可逆水平合成フィルタ処理を行う。
When the decoding process is started, the
ステップS205において、ウェーブレット逆変換部204は、合成フィルタ処理をレベル1まで行ったか否かを判定し、まだレベル1まで達していないと判定した場合、処理をステップS203に戻し、それ以降の処理を繰り返す。また、ステップS205において、合成フィルタ処理をレベル1まで行ったと判定した場合、処理はステップS206に進む。
In step S205, the wavelet
ステップS206において、エントロピ復号部201は、復号処理を終了するか否かを判定し、終了しないと判定した場合、処理をステップS201に戻し、それ以降の処理を繰り返す。また、ステップS206において、復号処理を終了すると判定した場合、復号処理が終了される。
In step S206, the
復号装置200は、以上のような復号処理をピクチャ(フレームまたはフィールド)単位で繰り返す。
The
従来のウェーブレット逆変換の方法の場合、処理対象の分解レベルの全係数に対して、まず、画面水平方向に水平合成フィルタリング処理を行い、次に画面垂直方向に垂直合成フィルタリング処理を行っていた。つまり、各合成フィルタリング処理の度に、その合成フィルタリング処理の結果をバッファに保持させる必要があるが、その際、バッファは、その時点の分解レベルの合成フィルタリング結果と、次の分解レベルの全係数を保持する必要があり、多大なメモリ容量を必要とすることになる(保持するデータ量が多い)。 In the case of the conventional wavelet inverse transformation method, the horizontal synthesis filtering process is first performed in the horizontal direction on the screen and then the vertical synthesis filtering process is performed in the vertical direction on the screen with respect to all coefficients of the decomposition level to be processed. In other words, for each synthesis filtering process, the result of the synthesis filtering process needs to be held in the buffer. At this time, the buffer stores the synthesis filtering result of the current decomposition level and all coefficients of the next decomposition level. Must be held, and a large memory capacity is required (a large amount of data is held).
また、この場合、ピクチャ(フレームまたはフィールド)内において全てのウェーブレット逆変換が終了するまで画像データ出力が行われないので、入力から出力までの遅延時間が増大する。 Further, in this case, since image data output is not performed until all wavelet inverse transformations are completed in the picture (frame or field), the delay time from input to output increases.
これに対して、復号装置200のウェーブレット逆変換部203の場合、上述したようにプレシンクト単位で垂直合成フィルタリング処理および水平合成フィルタリング処理をレベル1まで連続して行うので、従来の方法と比較して、一度に(同時期に)バッファリングする必要のあるデータの量が少なく、用意すべきバッファのメモリ量を大幅に低減させることができる。また、レベル1まで合成フィルタリング処理(ウェーブレット逆変換処理)が行われることにより、ピクチャ内の全画像データが得られる前に(プレシンクト単位で)画像データを順次出力させることができ、従来の方法と比較して遅延時間を大幅に低減させることができる。
On the other hand, in the case of the wavelet
また、可逆な方法でエントロピ復号処理やウェーブレット逆変換処理を行うことにより、復号装置200は、高品質な復元画像を得ることができる。
Also, the
すなわち、符号化装置100および復号装置200は、画像データを、高品質かつ低遅延に伝送することができる。
That is, the
次に、以上に説明したような可逆な方法の符号化処理および復号処理に対する、順方向と逆方向の変換が完全に保証されていない非可逆な方法の符号化処理および復号処理について説明する。 Next, an irreversible method encoding process and a decoding process for which conversion between the forward direction and the reverse direction is not completely guaranteed with respect to the reversible method encoding process and decoding process as described above will be described.
図14は、非可逆な方法で画像データを符号化する符号化装置の構成例を示すブロック図である。図14において、符号化装置300は、非可逆な方法で符号化処理を行う。符号化装置300は、ウェーブレット変換部301、途中計算用バッファ部302、量子化部303、係数並び替え用バッファ部304、係数並び替え部305、エントロピ符号化部306、およびレート制御部307を有する。
FIG. 14 is a block diagram illustrating a configuration example of an encoding device that encodes image data using an irreversible method. In FIG. 14, the
ウェーブレット変換部301は、基本的にウェーブレット変換部101と同様であるが、後述する固定小数点精度型の5×3分析フィルタを用いて非可逆のウェーブレット変換を行う。途中計算用バッファ部302は、基本的に途中計算用バッファ部102と同様である。
The
量子化部303は、ウェーブレット変換部301において変換された係数データを所定の量子化係数で量子化し、量子化後の係数データを係数並び替え用バッファ部304に供給して保持させる。なお、この量子化部303は省略するようにしてももちろんよい。量子化を行うことにより、さらに圧縮効果の向上を期待することができる。この量子化の方法としてはどのようなものを用いても良く、例えば、係数データWを量子化ステップサイズΔで除算する手法であってもよい。この時の量子化ステップサイズΔは、例えばレート制御部307において算出される。係数並び替え部305は、基本的に、係数並び替え部202と同様であり、係数並び替え用バッファ部304に高域成分から低域成分の順に保持される係数データを、低域成分から高域成分の順に並び替え、エントロピ符号化部306に供給する。
The
エントロピ符号化部306は、基本的に、エントロピ符号化部103と同様であり、供給された係数データを、例えばハフマン符号化や算術符号化といった所定のエントロピ符号化方式で符号化する。
The
エントロピ符号化部306は、レート制御部307と連動的に動作し、出力される圧縮符号化データのビットレートが略一定値となるように制御される。すなわち、レート制御部307は、エントロピ符号化部306からの符号化データ情報に基づき、エントロピ符号化部306により圧縮符号化されたデータのビットレートが目標値に達した時点あるいは目標値に達する直前でエントロピ符号化部306による符号化処理を終了するように制御する制御信号を、エントロピ符号化部306に対して供給する。エントロピ符号化部306は、レート制御部307から供給される制御信号に応じて符号化処理が終了した時点で、符号化データを符号化装置300の外部に出力する。
The
なお、ウェーブレット変換部301および途中計算用バッファ部302を併せて、分析フィルタ処理部311とも称する。図15は、その分析フィルタ処理部のさらに詳細な構成例を示すブロック図である。
The
図15に示されるように、固定小数点型のウェーブレット変換部301は、ビットシフト器321およびウェーブレット変換器322を有する。
As illustrated in FIG. 15, the fixed-point
ビットシフト器321は、入力画像データを1回だけビットシフト処理し、図16に示されるような固定小数点精度の入力データを生成する。図16において各四角は入力データの各ビットを示している。点Pは、固定小数点の位置を示し、この点Pより上位側(図中左側)のビットが整数部、下位側(図中右側)のビットが小数部を示している。図16の例では、小数部が6ビットあるので、1/26=1/64の精度で固定小数点精度が確保できることになる。また、図16の例では、整数部が8ビットのデータを取り扱うものとし、全体として16ビットの計算を行うもの(演算精度が16ビット)としている。さらに、図16の例では、最上位側(図中左端側)に2ビットのガードビット(Guard-bit)が備えられており、この内の1ビットは符号(+/−)を示すビットであり、もう1ビットはオーバーフロー(Overflow)回避のためのビットである。
The
図15に戻り、ビットシフト器321により生成された固定小数点精度のデータは、ウェーブレット変換器322により途中計算用バッファ部302に格納される。ウェーブレット変換器322は、途中計算用バッファ部302に固定小数点型のデータが所定量(1プレシンクト分)蓄積されると、その途中計算用バッファ部302に蓄積された1プレシンクト分のデータに対して、5×3分析フィルタを用いて分析フィルタ処理を行い、各サブバンドの係数データを生成する。
Returning to FIG. 15, the fixed-point precision data generated by the
図17は、固定小数点精度の5×3分析フィルタ(以下、固定小数点型5×3分析フィルタとも称する)を用いた分析側の固定小数点型ウェーブレット変換演算について説明する。図17は、1次元のウェーブレット変換を行い、左端の入力画像データを低域成分sと高域成分dとに変換する動作を示している。以下、同図を用いて詳細動作を説明する。ここで、dm nをウェーブレット変換のレベルがnのm番目の高域成分係数であるとする。n=0の場合は、図より入力画像であることは明らかである。同様に、sm nをウェーブレット変換のレベルがnのm番目の低域成分係数であるとする。
FIG. 17 illustrates a fixed-point wavelet transform operation on the analysis side using a fixed-
この図17から明らかなように、低域成分係数sの算出式は、一般的に、以下の式(9a)または式(9b)のように表わすことができる。 As can be seen from FIG. 17, the formula for calculating the low-frequency component coefficient s can be generally expressed as the following formula (9a) or formula (9b).
sm+1 n+1=sm+1 n+β×(dm n+1+dm+1 n+1+2)・・・(9a)
sm+1 n+1=sm+1 n+β×(dm n+1+dm+1 n+1)・・・(9b)
で与えられる。
s m + 1 n + 1 = s m + 1 n + β × (d m n + 1 + d m + 1 n + 1 +2) (9a)
s m + 1 n + 1 = s m + 1 n + β × (d m n + 1 + d m + 1 n + 1 ) (9b)
Given in.
同様に、高域成分係数dの算出式は、一般的に、以下の式(10)により表わすことができる。 Similarly, the calculation formula of the high frequency component coefficient d can be generally expressed by the following formula (10).
dm n+1=dm n−α×(sm n+sm+1 n) ・・・(10) d m n + 1 = d m n −α × (s m n + s m + 1 n ) (10)
ここでα=0.5、β=0.25となり、高域成分にあたるdは分析側ではNyquist gain=2なので、Nyquist gain=1になるようにゲイン調整する。これが高域成分係数dに、SH=0.5を乗算する理由である。また、上述した整数型5×3分析フィルタの場合は、ゲイン調整をすると、可逆変換が保証されないため、ゲイン調整をしなくてよい。なお、この周辺の技術については、一般のデジタル信号処理技術として知られていることである。
Here, α = 0.5 and β = 0.25, and d corresponding to the high frequency component is Nyquist gain = 2 on the analysis side, so that the gain is adjusted so that Nyquist gain = 1. This is the reason why the high frequency component coefficient d is multiplied by SH = 0.5. Further, in the case of the
なお、画面端部の位置のデータを算出する際に、画面外部のデータが必要になるとき、隣接する画面内部のデータを折り返して用いる(例えば図17のs0 1を求めるためのd0 1)ことは、上述した整数型分析フィルタの場合と同様であり、さらに合成フィルタの場合でも同様である。 When calculating the data of the position of the screen edge, when data outside the screen is required, the data inside the adjacent screen is used by folding (for example, d 0 1 for obtaining s 0 1 in FIG. 17). This is the same as in the case of the integer analysis filter described above, and also in the case of the synthesis filter.
次に、上述した式(9a)と(9b)との違いについて述べる。固定小数点型5×3分析フィルタでは、整数精度に比べて高精度になるので、整数型5×3分析フィルタで説明した「+2」の丸めを行う場合の式(9a)(互換)と、「+2」の丸めを付けない式(9b)(非互換)の両方が考えられる。
Next, the difference between the above formulas (9a) and (9b) will be described. Since the fixed-
この固定小数点型5×3分析フィルタと、上述した整数型5×3分析フィルタとの間で、演算手段の構成を共通化する場合には、式(9a)を用いることが必要である。すなわち、固定小数点型5×3分析フィルタに用いられるウェーブレット変換器として、式(9a)の演算を行う構成を用いる場合、整数型5×3分析フィルタに用いられるウェーブレット変換器としても共通に使用することができる。
When the configuration of the arithmetic means is made common between the fixed-
このような図17と共に説明した固定小数点型5×3分析フィルタにおいて、低域成分、高域成分の1組の係数を生成するのに要する演算量は、乗算「3」、加減算「5」(互換)、または加減算「4」(非互換)となる。
In the fixed-
次に、以上の非可逆な符号化装置300に対応する復号装置について説明する。図18は、非可逆な方式で符号化データを復号する復号装置の構成例を示すブロック図である。
Next, a decoding apparatus corresponding to the above
図18に示される復号装置400は、上述した符号化装置300の符号化処理に対応する方法で復号処理を行う。つまり復号装置400は、順方向と逆方向の変換が完全に保証されていない非可逆な方法で復号処理を行う。復号装置400は、エントロピ復号部401、逆量子化部402、係数バッファ部403、およびウェーブレット逆変換部404を有する。
18 performs a decoding process by a method corresponding to the encoding process of the
エントロピ復号部401は、基本的にエントロピ復号部201と同様であり、供給される符号化データを、エントロピ符号化部306に対応する方法で復号し、係数データを生成する。エントロピ復号部401は、生成した係数データを逆量子化部402に供給する。逆量子化部402は、量子化部303に対応する方法で逆量子化し、逆量子化した係数データを係数バッファ部403に供給し、保持させる。なお、符号化装置300において量子化部303を省略する場合、この逆量子化部402も省略される。
The
係数バッファ部403は、基本的に、係数バッファ部203と同様であり、逆量子化部402より供給される係数データを保持するとともに、ウェーブレット逆変換部404にその係数データを適宜供給したり、ウェーブレット逆変換部404において生成される中間データや画像データを保持したりする。
The
ウェーブレット逆変換部404は、基本的にウェーブレット逆変換部204と同様であるが、後述する固定小数点精度型の5×3合成フィルタ(以下、固定小数点型5×3合成フィルタとも称する)を用いて非可逆のウェーブレット逆変換を行う。
The wavelet
なお、係数バッファ部403およびウェーブレット逆変換部404を併せて、合成フィルタ処理部411とも称する。図19は、その合成フィルタ処理部411のさらに詳細な構成例を示すブロック図である。
The
図19に示されるように、固定小数点型のウェーブレット逆変換部404は、ウェーブレット逆変換器421およびビットシフト器422を有する。
As shown in FIG. 19, the fixed-point wavelet
固定小数点精度については整数精度との差異について上述したが、固定小数点精度の場合、データは、分析フィルタ側で左にビットシフトされているので、合成フィルタ側では、逆に右ビットシフトされ、値が元のレベルまで戻される。この右ビットシフトは、最終的な復号画像(レベル0)に対して行われる。すなわち、ウェーブレット逆変換器421は、係数バッファ部403を用いて、合成フィルタ処理を各レベルに対して繰り返し行い、最終的にベースバンドの画像データが得られたら、それをビットシフト器422に供給する。ビットシフト器422は、供給されたベースバンドの画像データに対して右ビットシフト処理を行い、シフト後のデータを出力する。
Regarding fixed-point precision, the difference from integer precision has been described above. However, in the case of fixed-point precision, the data is bit-shifted to the left on the analysis filter side. Is restored to its original level. This right bit shift is performed on the final decoded image (level 0). That is, the wavelet
次に、図20を用いて、固定小数点型5×3合成フィルタを用いた固定小数点型ウェーブレット逆変換演算について説明する。図20は、1次元のウェーブレット変換(逆変換)を行い、図中左端の低域成分sと高域成分dとを図中右端の出力画素に変換する動作を示している。ここで、dm nをウェーブレット変換のレベルがnのm番目の高域成分係数であるとする。同様に、sm nをウェーブレット変換のレベルがnのm番目の低域成分係数であるとする。なお、n=0のときは、s、dはそれぞれ奇数番目、偶数番目の画素となる。
Next, the fixed-point wavelet inverse transform operation using the fixed-
この図20から明らかなように、図中右端の奇数番目の画素s、あるいは低域成分係数sの算出式は、一般的に、以下の式(11a)または式(11b)のように表わすことができる。 As is clear from FIG. 20, the calculation formula for the odd-numbered pixel s at the right end of the drawing or the low-frequency component coefficient s is generally expressed as the following formula (11a) or formula (11b). Can do.
sm+1 n=sm+1 n+1−β×(dm n+1+dm+1 n+1+2) ・・・(11a)
sm+1 n=sm+1 n+1−β×(dm n+1+dm+1 n+1) ・・・(11b)
s m + 1 n = s m + 1 n + 1 −β × (d m n + 1 + d m + 1 n + 1 +2) (11a)
s m + 1 n = s m + 1 n + 1 −β × (d m n + 1 + d m + 1 n + 1 ) (11b)
同様に、図中右端の偶数番目の画素d、あるいは高域成分係数dの算出式は、一般的に、以下の式(12)で表わすことができる。 Similarly, the even-numbered pixel d at the right end of the figure or the calculation formula for the high frequency component coefficient d can be generally expressed by the following formula (12).
dm n=dm n+1+α×(sm n+sm+1 n) ・・・(12) d m n = d m n + 1 + α × (s m n + s m + 1 n ) (12)
ここでα=0.5、β=0.25となる。分析フィルタ側において、高域成分にあたるdはNyquist gain=2なので、Nyquist gain=1になるようにゲイン調整されている。つまり、分析フィルタ側において高域成分係数dには、SH=−0.5が乗算される。これに対して、合成フィルタ側では、Nyquist gainを1から2に戻すようにする必要がある。このため、高域係数dは、合成フィルタ側において、SH=−2.0が乗算され、さらに式(12)の演算が施される。 Here, α = 0.5 and β = 0.25. On the analysis filter side, since d corresponding to the high frequency component is Nyquist gain = 2, the gain is adjusted so that Nyquist gain = 1. That is, the high frequency component coefficient d is multiplied by SH = −0.5 on the analysis filter side. On the other hand, on the synthesis filter side, it is necessary to return Nyquist gain from 1 to 2. For this reason, the high frequency coefficient d is multiplied by SH = −2.0 on the synthesis filter side, and further subjected to the calculation of Expression (12).
次に、上記式(11a)と(11b)との違いについて述べる。固定小数点型5×3合成フィルタは、整数精度の場合よりも高精度に変換処理を行うことができるので、上述した分析フィルタにおける丸め処理の場合と同様に、「+2」の丸めを行う場合の式(11a)(互換)と、「+2」を付けない式(11b)(非互換)の両方が考えられる。
Next, the difference between the above formulas (11a) and (11b) will be described. Since the fixed-
この固定小数点型5×3合成フィルタと、上述した整数型5×3合成フィルタとの間で、演算手段の構成を共通化する場合には、式(11a)を用いることが必要である。
When the configuration of the arithmetic means is shared between the fixed-
図10のような演算を行う固定小数点型5×3合成フィルタにおいて、低域成分、高域成分の1組の係数を生成するのに要する演算量は、乗算「3」、加減算「5」(互換)、または加減算「4」(非互換)となる。
In the fixed-
次に、以上のような非可逆な符号化処理および復号処理の流れについて説明する。最初に、図21のフローチャートを参照して、符号化装置300による符号化処理の流れの例を説明する。この符号化処理は、順方向と逆方向の変換が完全に保証されない非可逆な方法により画像データを符号化する処理である。
Next, the flow of the irreversible encoding process and decoding process as described above will be described. First, an example of the flow of encoding processing by the
分析フィルタ処理部311は、上述したように、整数精度ではなく固定小数点精度で処理を行う以外は、基本的に可逆の場合(分析フィルタ処理部111による分析フィルタ処理の場合)と同様に分析フィルタ処理を行う。すなわち、ステップS301乃至ステップS305の処理は、図12のステップS101乃至ステップS105の処理のそれぞれと同様に実行される。
As described above, the analysis
分析フィルタ処理部311(ウェーブレット変換部301)により、1プレシンクト分の画像データが固定小数点精度で最終レベルまで分析フィルタ処理されると、ステップS306において、量子化部306は、その1プレシンクト分の係数データを量子化する。実際には、量子化部306は、ウェーブレット変換部301より供給される係数データを順次量子化する。
When the analysis filter processing unit 311 (wavelet transform unit 301) performs analysis filter processing on the image data for one precinct to the final level with fixed-point precision, in step S306, the
ステップS307において、係数並び替え部305は、高域成分から低域成分の順に並ぶ量子化された係数データを低域成分から高域成分の順に並び替える。ステップS308において、エントロピ符号化部306は、並び替えられた係数データをエントロピ符号化する。符号化が終了すると、ウェーブレット変換部301は、ステップS309において、処理対象プレシンクト番号Aの値をインクリメントし、次のプレシンクトに処理対象を変更する。ステップS310において、ウェーブレット変換部301は、未処理のラインが存在するか否かを判定し、存在すると判定した場合、処理をステップS302に戻し、それ以降の処理を繰り返す。また、ステップS310において、未処理のラインが存在しないと判定した場合、ウェーブレット変換部301は、符号化処理を終了する。
In step S307, the
符号化装置300は、以上のような符号化処理をピクチャ(フレームまたはフィールド)単位で繰り返す。
The
次に、図22のフローチャートを参照して、復号装置400による復号処理の流れの例を説明する。この復号処理は、順方向と逆方向の変換が完全に保証されない非可逆な方法により符号化データを復号する処理である。
Next, an example of the flow of decoding processing by the
復号装置400は、上述したように、整数精度ではなく固定小数点精度で処理を行う以外は、基本的に可逆の場合(復号装置200による復号処理の場合)と同様に復号処理を行う。ただし、非可逆の場合、遅延時間の低減が最優先されるため、係数の並び替えは符号化装置100において行われる。また、非可逆の場合、符号化装置300において量子化も行われる。したがって、復号装置400は、係数を並び替える代わりに逆量子化を行う。
As described above, the
復号処理が開始されると、エントロピ復号部401は、ステップS401において、入力された符号化データをエントロピ復号する。ステップS402において、逆量子化部402は、係数データをステップS306(図21)に対応する方法で逆量子化する。ステップS403において、ウェーブレット逆変換部404は、係数バッファ部403に、逆量子化部402より供給された係数データが1プレシンクト分以上保持されると、その1プレシンクト分の係数データを読み出して、固定少数点精度の非可逆垂直合成フィルタ処理を行い、ステップS404において、固定小数点精度の非可逆水平合成フィルタ処理を行う。
When the decoding process is started, the
ステップS405において、ウェーブレット逆変換部404は、合成フィルタ処理をレベル1まで行ったか否かを判定し、まだレベル1まで達していないと判定した場合、処理をステップS403に戻し、低域成分に対してそれ以降の処理を繰り返す。また、ステップS405において、合成フィルタ処理をレベル1まで行ったと判定した場合、処理はステップS406に進む。
In step S405, the wavelet
ステップS406において、エントロピ復号部401は、復号処理を終了するか否かを判定し、終了しないと判定した場合、処理をステップS401に戻し、それ以降の処理を繰り返す。また、ステップS406において、復号処理を終了すると判定した場合、復号処理が終了される。
In step S406, the
復号装置400は、以上のような復号処理をピクチャ(フレームまたはフィールド)単位で繰り返す。
The
以上のような各種処理は、例えば、図23に示されるように、適宜、並列的に実行させることもできる。 The various processes as described above can be appropriately executed in parallel as shown in FIG. 23, for example.
図23は、図14に示される符号化装置300と図18に示される復号装置400の各部により実行される非可逆の場合の処理の各要素の並列動作の例を概略的に示す図である。この図23は、上述した図7や図8と対応するものである。画像データの入力In−1(図23のA)に対して、ウェーブレット変換部301(図14)で1回目のウェーブレット変換WT−1が施される(図23のB)。この1回目のウェーブレット変換WT−1は、最初の3ラインが入力された時点で開始され、係数C1が生成される。すなわち、画像データIn−1の入力からウェーブレット変換WT−1が開始されるまで、3ライン分の遅延が生じる。
FIG. 23 is a diagram schematically illustrating an example of parallel operation of each element of processing in the case of irreversible executed by each unit of the
生成された係数データは、量子化後、係数並び替え用バッファ部304(図14)に格納される。以降、入力された画像データに対してウェーブレット変換が施され、1回目の処理が終了すると、そのまま2回目のウェーブレット変換WT−2に処理が移行する。 The generated coefficient data is stored in the coefficient rearranging buffer unit 304 (FIG. 14) after quantization. Thereafter, wavelet transform is performed on the input image data, and when the first process is completed, the process proceeds to the second wavelet transform WT-2.
2回目のウェーブレット変換WT−2のための画像データIn−2の入力と、その2回目のウェーブレット変換WT−2の処理と並列的に、係数並び替え部305(図14)により3個の、係数C1、係数C4、および係数C5の並び替えOrd−1が実行される(図23のC)。 In parallel with the input of the image data In-2 for the second wavelet transform WT-2 and the processing of the second wavelet transform WT-2, the coefficient rearrangement unit 305 (FIG. 14) The rearrangement Ord-1 of the coefficient C1, the coefficient C4, and the coefficient C5 is executed (C in FIG. 23).
なお、ウェーブレット変換WT−1の終了から並び替えOrd−1が開始されるまでの遅延は、例えば、並び替え処理を係数並び替え部305に指示する制御信号の伝達に伴う遅延や、制御信号に対する係数並び替え部305の処理開始に要する遅延、プログラム処理に要する遅延といった、装置やシステム構成に基づく遅延であって、符号化処理における本質的な遅延ではない。
Note that the delay from the end of the wavelet transform WT-1 to the start of the reordering Ord-1 is, for example, a delay associated with transmission of a control signal instructing the
係数データは、並び替えが終了した順に係数並び替え用バッファ部304から読み出され、エントロピ符号化部306(図14)に供給され、エントロピ符号化EC−1が行われる(図23のD)。このエントロピ符号化EC−1は、3個の、係数C1、係数C4、および係数C5の、全ての並び替えの終了を待たずに開始することができる。例えば、最初に出力される係数C5による1ラインの並び替えが終了した時点で、その係数C5に対するエントロピ符号化を開始することができる。この場合、並び替えOrd−1の処理開始からエントロピ符号化EC−1の処理開始までの遅延は、1ライン分となる。
The coefficient data is read from the coefficient rearranging
エントロピ符号化部306によるエントロピ符号化EC−1が終了した符号化データは、所定の信号処理が施された後、復号装置400(図18)に伝送される(図23のE)。
The encoded data that has undergone the entropy encoding EC-1 by the
以上のように、符号化装置300に対しては、1回目の処理による7ライン分の画像データ入力に続けて、画面上の下端のラインまで画像データが順次、入力される。符号化装置300では、画像データの入力In−n(nは2以上)に伴い、上述したようにして、4ライン毎にウェーブレット変換WT−n、並び替えOrd−nおよびエントロピ符号化EC−nを行う。符号化装置300における最後の回の処理に対する並び替えOrdおよびエントロピ符号化ECは、6ラインに対して行われる。これらの処理は、符号化装置300において、図23のA乃至図23のDに例示されるように、並列的に行われる。
As described above, the image data is sequentially input to the
符号化装置300によるエントロピ符号化EC−1により符号化された符号化データは、復号装置400に供給される。復号装置400のエントロピ復号部401(図18)は、供給された、エントロピ符号化EC−1により符号化された符号化データに対して、順次、エントロピ符号の復号iEC−1を行い、係数データを復元する(図23のF)。復元された係数データは、逆量子化された後、順次、係数バッファ部403に格納される。ウェーブレット逆変換部404は、係数バッファ部403にウェーブレット逆変換が行えるだけ係数データが格納されたら、係数バッファ部403から係数データを読み出して、読み出された係数データを用いてウェーブレット逆変換iWT−1を行う(図23のG)。
The encoded data encoded by the entropy encoding EC-1 by the
図7および図8を参照して説明したように、ウェーブレット逆変換部404によるウェーブレット逆変換iWT−1は、係数C4および係数C5が係数バッファ部403に格納された時点で開始することができる。したがって、エントロピ復号部401による復号iEC−1が開始されてからウェーブレット逆変換部404によるウェーブレット逆変換iWT−1が開始されるまでの遅延は、2ライン分となる。
As described with reference to FIGS. 7 and 8, the wavelet inverse transformation iWT-1 by the wavelet
ウェーブレット逆変換部404において、1回目のウェーブレット変換による3ライン分のウェーブレット逆変換iWT−1が終了すると、ウェーブレット逆変換iWT−1で生成された画像データの出力Out−1が行われる(図23のH)。出力Out−1では、図7および図8を用いて説明したように、第1ライン目の画像データが出力される。
When the wavelet
符号化装置300における1回目の処理による3ライン分の符号化された係数データの入力に続けて、エントロピ符号化EC−n(nは2以上)により符号化された係数データが順次、復号装置400に対して入力される。復号装置400では、入力された係数データに対して、上述したようにして、4ライン毎にエントロピ復号iEC−nおよびウェーブレット逆変換iWT−nを行い、ウェーブレット逆変換iWT−nにより復元された画像データの出力Out−nを順次、行う。符号化装置300の最後の回に対応するエントロピ復号iECおよびウェーブレット逆変換iWTは、6ラインに対して行われ、出力Outは、8ラインが出力される。これらの処理は、復号装置400において、図23のF乃至図23のHに例示されるように、並列的に行われる。
Coefficient data encoded by entropy encoding EC-n (n is 2 or more) is sequentially decoded after the input of the encoded coefficient data for three lines by the first processing in the
上述のようにして、画面上部から下部の方向に順番に、符号化装置300および復号装置400における各処理を並列的に行うことで、画像圧縮処理および画像復号処理をより低遅延で行うことが可能となる。
As described above, the image compression processing and the image decoding processing can be performed with lower delay by performing the processes in the
図23を参照して、固定小数点型5×3分析フィルタおよび固定小数点型5×3合成フィルタを用いて分解レベル=2までウェーブレット変換およびウェーブレット逆変換を行った場合の、画像入力から画像出力までの遅延時間を計算してみる。第1ライン目の画像データが符号化装置300に入力されてから、この第1ライン目の画像データが復号装置400から出力されるまでの遅延時間は、下記の各要素の総和となる。なお、ここでは、伝送路における遅延や、装置各部の実際の処理タイミングに伴う遅延などの、システムの構成により異なる遅延は、除外している。
Referring to FIG. 23, from the image input to the image output when wavelet transform and wavelet inverse transform are performed up to decomposition level = 2 using a fixed-
(1)最初のライン入力から7ライン分のウェーブレット変換WT−1が終了するまでの遅延D_WT
(2)3ライン分の計数並び替えOrd−1に伴う時間D_Ord
(3)3ライン分のエントロピ符号化EC−1に伴う時間D_EC
(4)3ライン分のエントロピ復号iEC−1に伴う時間D_iEC
(5)3ライン分のウェーブレット逆変換iWT−1に伴う時間D_iWT
(1) Delay D_WT from completion of first line input to completion of wavelet transform WT-1 for 7 lines
(2) Time D_Ord associated with count rearrangement Ord-1 for three lines
(3) Time D_EC associated with entropy encoding EC-1 for 3 lines
(4) Time D_iEC associated with entropy decoding iEC-1 for 3 lines
(5) Time D_iWT associated with wavelet inverse transformation iWT-1 for 3 lines
図23を参照して、上述の各要素による遅延の計算を試みる。(1)の遅延D_WTは、10ライン分の時間である。(2)の時間D_Ord、(3)の時間D_EC、(4)の時間D_iEC、および(5)の時間D_iWTは、それぞれ3ライン分の時間である。また、符号化装置300において、並び替えOrd−1が開始されてから1ライン後には、エントロピ符号化EC−1を開始することができる。同様に、復号装置400において、エントロピ復号iEC−1が開始されてから2ライン後には、ウェーブレット逆変換iWT−1を開始することができる。また、エントロピ復号iEC−1は、エントロピ符号化EC−1で1ライン分の符号化が終了した時点で処理を開始することができる。
Referring to FIG. 23, an attempt is made to calculate a delay by each of the above-described elements. The delay D_WT in (1) is a time for 10 lines. The time D_Ord in (2), the time D_EC in (3), the time D_iEC in (4), and the time D_iWT in (5) are times for three lines, respectively. In the
したがって、この図23の例では、符号化装置300に第1ライン目の画像データが入力されてから、復号装置400からその第1ライン目の画像データが出力されるまでの遅延時間は、10+1+1+2+3=17ライン分となる。
Therefore, in the example of FIG. 23, the delay time from when the first line of image data is input to the
遅延時間について、より具体的な例を挙げて考察する。入力される画像データがHDTV(High Definition Television)のインタレースビデオ信号の場合、例えば1920画素×1080ラインの解像度で1フレームが構成され、1フィールドは、1920画素×540ラインとなる。したがって、フレーム周波数を30Hzとした場合、1フィールドの540ラインが16.67msec(=1sec/60フィールド)の時間に、符号化装置300に入力されることになる。
Consider the delay time with a more specific example. When the input image data is an HDTV (High Definition Television) interlaced video signal, for example, one frame is configured with a resolution of 1920 pixels × 1080 lines, and one field is 1920 pixels × 540 lines. Therefore, when the frame frequency is 30 Hz, one field of 540 lines is input to the
したがって、7ライン分の画像データの入力に伴う遅延時間は、0.216msec(=16.67msec×7/540ライン)であり、例えば1フィールドの更新時間に対して非常に短い時間となる。また、上述した(1)の遅延D_WT、(2)の時間D_Ord、(3)の時間D_EC、(4)の時間D_iEC、および(5)の時間D_iWTの総和についても、処理対象のライン数が少ないため、遅延時間が非常に短縮される。 Accordingly, the delay time associated with the input of the image data for 7 lines is 0.216 msec (= 16.67 msec × 7/540 lines), which is a very short time with respect to the update time of one field, for example. Also, the total number of lines to be processed is the sum of the delay D_WT of (1), the time D_Ord of (2), the time D_EC of (3), the time D_iEC of (4), and the time D_iWT of (5). Since the delay time is small, the delay time is greatly reduced.
以上のように、図14乃至図23を参照して説明した非可逆な方法による符号化処理および復号処理の場合、遅延時間の低減が優先されるので、符号化装置300のエントロピ符号化部306は、1プレシンクト毎に係数データを符号化する。また、より遅延時間を低減させるために、係数データの並び替えは符号化装置300(係数並び替え部305)において行う。さらに、非可逆方式の場合、係数データの量子化を行うことができる。符号化装置300(量子化部303)において、この量子化を行うことにより、圧縮効果の向上を期待することができる。
As described above, in the case of the encoding process and the decoding process using the irreversible method described with reference to FIGS. 14 to 23, priority is given to the reduction of the delay time. Therefore, the
また、非可逆方式の場合、符号化装置300は、ウェーブレット変換部301において、例えば固定小数点型5×3分析フィルタのような非可逆のフィルタを用いることができる。これにより、符号化装置300は、例えば整数型5×3分析フィルタのような可逆の分析フィルタを用いる場合よりも精度良く分析フィルタ処理を行うことができる。なお、例えば、9×7分析フィルタ、13×3分析フィルタ、または9×2分析フィルタのように、固定小数点型5×3分析フィルタ以外の非可逆な分析フィルタも適用可能である。同様に、復号装置400に、例えば、9×7合成フィルタ、13×3合成フィルタ、または9×2合成フィルタのように、固定小数点型5×3合成フィルタ以外の非可逆な合成フィルタを適用することもできる。
In the case of the irreversible method, the
これに対して、図1乃至図13を参照して説明した可逆な方法による符号化処理および復号処理の場合、ベースバンドの画像データを符号化装置100において符号化し、復号装置200において復号すると、符号化前のベースバンドの画像データが復元される。つまり、符号化前に比べて画質が劣化していない高品質な復号画像を得ることができる。したがって、この可逆な方法の場合、従来のMPEGやJPEG2000等の方式の場合よりも、データ伝送の遅延時間を低減させることは当然であるが、ある程度、高品質なデータ伝送を考慮するようにしてもよい。一般的に、遅延時間の低減とデータ伝送の高品質化はトレードオフの関係にあるので、データ伝送の高品質化を行うためには、ある程度遅延時間の低減を抑制する必要がある。
On the other hand, in the case of encoding processing and decoding processing by the reversible method described with reference to FIGS. 1 to 13, when baseband image data is encoded by the
例えば、符号化装置100の分析フィルタ処理部111は、1プレシンクト単位で分析フィルタ処理を行うが、エントロピ符号化部103は、圧縮効率を向上させ、データを高品質化させるために、複数プレシンクト分の係数データが得られるまで待機し、その複数プレシンクト分の係数データを使ってエントロピ符号化を行う。また、可逆方式であるので、符号化装置100は、係数データの量子化は行わない(復号装置200は逆量子化を行わない)。係数の並び替えは、復号装置200において行うように説明したが、遅延時間の低減を重視するのであれば、符号化装置100において行うようにしてもよい。
For example, the analysis
また、符号化装置100のウェーブレット変換部101が、整数型5×3分析フィルタを用いてウェーブレット変換を行うように説明したが、例えば、2×1分析フィルタのような整数型5×3分析フィルタ以外の可逆な分析フィルタを適用することもできる。同様に、復号装置200のウェーブレット逆変換部204に対しては、整数型5×3合成フィルタの代わりに、例えば、2×1合成フィルタのような整数型5×3合成フィルタ以外の可逆な分析フィルタを適用するようにしてもよい。
Further, the
以上のように、可逆な方法により符号化処理および復号処理を行うことにより、符号化装置100および復号装置200は、画像データを、高品質かつ低遅延に伝送することができる。
As described above, by performing the encoding process and the decoding process by a reversible method, the
なお、以上においては、可逆な方法により符号化・復号処理を行いデータ伝送を行う場合、係数の並び替えを復号装置において行うように説明したが、遅延時間を低減させるために係数の並び替えは符号化装置において行うようにしてもよい。 In the above description, when encoding / decoding processing is performed by a reversible method and data transmission is performed, the coefficient rearrangement is performed in the decoding device. However, in order to reduce the delay time, the coefficient rearrangement is performed. You may make it perform in an encoding apparatus.
また、符号化データを伝送する場合、一般的には、符号化データは、パケット化されて伝送される。このとき、例えば可逆な方法により符号化したこと、符号化に使用したフィルタ、エントロピ符号化の処理単位数、または、係数データの並び替えの有無など、符号化に関する情報をパケットのヘッダ情報に付加するようにし、復号装置において、そのヘッダ情報に基づいて、符号化処理の内容に応じた適切な復号処理を行うことができるようにしてもよい。 When transmitting encoded data, generally, encoded data is packetized and transmitted. At this time, information related to encoding, such as encoding using a reversible method, filters used for encoding, the number of processing units of entropy encoding, or whether or not coefficient data is rearranged, is added to the header information of the packet. Thus, the decoding device may be configured to perform an appropriate decoding process according to the content of the encoding process based on the header information.
以下にそれらの場合について説明する。図24は、本発明を適用した符号化装置の他の構成例を示すブロック図である。図24において、符号化装置500は、符号化装置100同様、可逆な方法によりベースバンドの画像データを符号化し、符号化データを生成する。ただし、符号化装置500は、さらに、その符号化データをパケット化して出力する。このとき、符号化装置500は、符号化に関する情報を用いてヘッダ情報を生成し、符号化データとともに復号装置に供給する。これにより、符号化装置500は、復号装置に符号化処理に関する情報を提供することができ、復号装置が、そのヘッダ情報に基づいて、符号化処理の内容に応じた適切な復号処理を行うことができるようにすることができる。
These cases will be described below. FIG. 24 is a block diagram showing another configuration example of the encoding apparatus to which the present invention is applied. In FIG. 24, the
符号化装置500は、図24に示されるように、制御部501、符号化部502、ヘッダ生成部503、パケット化部504、および送信部505を有する。
As illustrated in FIG. 24, the
制御部501は、制御情報を符号化部502に供給することにより、エントロピ符号化部515の符号化処理の処理単位(プレシンクト数)の指定等、符号化部502による符号化処理の制御を行う。制御部501は、例えば、図示せぬ入力部を介して入力されるユーザの指示、予め入力されている所定の設定情報、外部の機器より供給された設定情報、または、所定の条件に従って制御部501自身が作成した設定情報等に従って制御情報を生成または取得し、それを符号化部502に供給する。
The
符号化部502は、基本的に図1の符号化装置100に対応する処理部であり、符号化装置100と同様の構成、すなわち、ウェーブレット変換部101に対応するウェーブレット変換部511、途中計算用バッファ部102に対応する途中計算用バッファ部512(分析フィルタ処理部111に対応する分析フィルタ処理部521)、および、エントロピ符号化部103に対応するエントロピ符号化部515を有する。ただし、符号化部502は、分析フィルタ処理部521より出力される、高域成分から低域成分の順に並ぶ係数データを低域成分から高域成分の順に並び替える機能を有しており、そのための構成として、係数並び替え用バッファ部513および係数並び替え部514を有する。
The
係数並び替え用バッファ部513は、ウェーブレット変換部511において可逆な方法で画像データが符号化されて生成されて供給された係数データをその順に保持する。係数並び替え部514は、係数並び替え用バッファ部513に高域成分から低域成分の順に保持される係数データを、低域成分から高域成分の順に並び替え、エントロピ符号化部515に供給する。
The coefficient rearranging
分析フィルタ処理部521のウェーブレット変換部511は、分析フィルタ処理部511と同様に、途中計算用バッファ部512を利用して、入力画像データに対して可逆な分析フィルタ処理を行い、符号化データを生成し、係数並び替え用バッファ部513に供給する。なお、ウェーブレット変換部511が、使用する可逆な分析フィルタを選択可能としてもよい。その場合、ウェーブレット変換部511は、例えば、制御部501より供給される制御情報に含まれる指定に基づいて、フィルタを選択する。
Similar to the analysis
エントロピ符号化部515は、係数並び替え部514において順序が並び替えられた係数データを、予め設定されたプレシンクト数毎に可逆な方法で符号化し、得られた符号化データをパケット化部504に供給する。
The
また、符号化部502は、制御部501より供給される制御情報に基づいて、符号化部502内の各部の設定や制御を行う。また、符号化部502は、その符号化の設定内容を含む、符号化処理に関する関連情報を生成し、その関連情報をヘッダ生成部503に供給する。
In addition, the
ヘッダ生成部503は、供給された関連情報に基づいて、例えば、ピクチャ毎等、所定のデータ単位毎にヘッダ情報を生成する。
Based on the supplied related information, the
図25は、ヘッダ生成部503により生成されるピクチャヘッダの例を模式的に示す図である。図25に示されるピクチャヘッダ530は、画像データのピクチャ毎に付加される、そのピクチャに関する情報よりなるヘッダ情報である。つまり、このピクチャヘッダ530は、1ピクチャに対応するパケット群のうち、先頭パケットのヘッダ部に付加される。このピクチャヘッダ530は、例えば、各ピクチャの先頭パケットのヘッダ部に付加される。もちろん、先頭パケット以外に付加されるようにしてももちろんよい。
FIG. 25 is a diagram schematically illustrating an example of a picture header generated by the
図25に示されるように、ピクチャヘッダ530は、ピクチャヘッダであることを表すフラグであるピクチャヘッダフラグが、先頭に配置される。また、ピクチャヘッダ530には、符号化部502より供給される関連情報、例えば、可逆非可逆識別情報532、フィルタタイプ情報533、処理単位プレシンクト数情報534、および、係数並び替え情報535等の、符号化処理に関する情報が含まれる。
As shown in FIG. 25, in the
可逆非可逆識別情報532は、符号化部502による符号化処理が可逆方式であるか非可逆方式であるかを示す。例えば、1ビットのフラグ情報により構成される。フィルタタイプ情報533は、ウェーブレット変換部511において使用される分析フィルタのフィルタタイプを示す。例えば、所定の識別番号や、フィルタ型名等により構成される。処理単位プレシンクト数情報534は、エントロピ符号化部515による符号化の処理単位を示す。例えば、プレシンクト数により示される。係数並び替え情報535は、符号化部502において係数の並び替えが行われたか否かを示す。例えば、1ビットのフラグ情報により構成される。
The reversible
もちろん、ピクチャヘッダ530には、これ以外の情報が含まれていてもよく、上述した符号化処理に関する情報のうち一部が省略されていても良いし、上述した以外の符号化処理に関する情報がさらに含まれていてもよい。
Of course, the
符号化部502において生成された符号化データを復号する復号装置がこのような関連情報を取得することにより符号化部502において行われた符号化処理の内容を容易に把握することができる。したがって、例えば、符号化部502において生成された符号化データを、多様な符号化方式に対応する復号装置において復号する場合、その復号装置は、このヘッダ情報に基づいて容易に、適切な復号処理の設定を行うことができる。
The content of the encoding process performed in the
パケット化部504は、符号化部502より供給される符号化データを所定のデータ単位毎にパケット化し、そのパケットに対して、ヘッダ生成部503より供給されるヘッダ情報を適宜付加し、生成したパケットを送信部505に供給する。送信部505は、伝送路となる通信網のフォーマットに従って、そのパケットを、その伝送路を介して復号装置に送信する。
The
なお、以上においては、ヘッダ生成部503が関連情報に基づいてピクチャヘッダを生成するように説明したが、ピクチャヘッダ以外のヘッダにヘッダ生成部503が符号化に関する情報を含めるようにしてもよい。つまり、ヘッダ生成部503が符号化に関する情報を生成するタイミングは、任意であり、ピクチャ単位以外であってもよい。
In the above description, the
以上のような符号化装置500による符号化処理の流れの例を図26のフローチャートを参照して説明する。
An example of the flow of the encoding process by the
ステップS501において、符号化部502は、制御部501より供給される制御情報に基づいて、各部、すなわち符号化処理の設定を行う。符号化部502は、ステップS502において、画像データの符号化を開始する。この符号化処理の詳細については、図27のフローチャートを参照して後述する。これ以降、符号化部502による符号化処理は以下の処理と並行して実行される。
In step S501, the
画像データに対する符号化処理が開始されると、パケット化部504は、ステップS503において、符号化部502より供給される符号化データを所定のデータ単位毎にパケット化する。ステップS504において、ヘッダ生成部503は、1ピクチャ分の画像データが符号化されたか否かを判定する。1ピクチャ分の画像データが符号化されたと判定した場合、ヘッダ生成部503は、処理をステップS505に進め、符号化部502より供給される関連情報に基づいて符号化データに関する情報を含むピクチャヘッダ530を生成する。このピクチャヘッダ生成処理については、図28のフローチャートを参照して後述する。
When the encoding process for the image data is started, the
ステップS506において、パケット化部504は、生成されたピクチャヘッダをパケットのヘッダ部に付加し、処理をステップS507に進める。また、ステップS504において、1ピクチャ分の画像データが符号化されていないと判定した場合、パケット化部504は、ステップS505およびステップS506の処理を省略し、ステップS507に処理を進める。ステップS507において、送信部505は、生成されたパケットを伝送路に送信する。
In step S506, the
ステップS508において、符号化部502は、制御部501より供給される制御情報が更新されたか否かを判定し、更新されたと判定した場合、処理をステップS509に進め、符号化の設定を更新する。設定を更新すると符号化部502は、処理をステップS510に進める。また、ステップS508において、制御部501より供給される制御情報が更新されていないと判定した場合、符号化部502は、ステップS509の処理を省略し、処理をステップS510に進める。ステップS510において、符号化部502は、符号化処理を終了するか否かを判定し、例えば、画像データがまだ供給されており符号化処理を継続すると判定した場合、処理をステップS503に戻し、それ以降の処理を繰り返す。また、ステップS510において、符号化処理を終了すると判定した場合、符号化部502は、符号化処理を終了する。
In step S508, the
次に、図27のフローチャートを参照して、符号化部502により実行される符号化処理の流れの例を説明する。
Next, an example of the flow of encoding processing executed by the
この符号化処理は、基本的に図12のフローチャートを参照して説明した符号化装置100による符号化処理と同様に実行される。つまり、ステップS531乃至ステップS535の各処理は、図12のステップS101乃至ステップS105の各処理と同様に実行される。ただし、図27の符号化処理の場合、ステップS536において、係数並び替え部514が、高域成分から低域成分の順に並ぶ係数データを低域成分から高域成分の順に並び替える。また、ステップS537およびステップS540の各処理は、図12のステップS106乃至ステップS109の各処理と同様に実行される。
This encoding process is basically executed in the same manner as the encoding process by the
符号化部502による符号化処理は以上のように実行される。
The encoding process by the
次に、図28のフローチャートを参照して、図26のステップS505において実行されるピクチャヘッダ生成処理の流れの例を説明する。 Next, an example of the flow of the picture header generation process executed in step S505 in FIG. 26 will be described with reference to the flowchart in FIG.
ピクチャヘッダ生成処理が開始されると、ヘッダ生成部503は、ステップS61において、ピクチャヘッダフラグ531を立てる。ステップS562において、ヘッダ生成部503は、符号化部502より供給される関連情報に基づいて、符号化方式が可逆方式であったか、非可逆方式であったかに応じて可逆非可逆識別情報532を設定する。
When the picture header generation process is started, the
ステップS563において、ヘッダ生成部503は、符号化部502より供給される関連情報に基づいて、ウェーブレット変換に使用したフィルタのタイプに応じて、フィルタタイプ情報533を設定する。ステップS564において、ヘッダ生成部503は、符号化部502より供給される関連情報に基づいて、符号化処理単位に応じて、処理単位プレシンクト数情報534を設定する。ステップS565において、ヘッダ生成部503は、符号化部502より供給される関連情報に基づいて、係数を並び替えたことを示すように係数並び替え情報535を設定する。さらに、ステップS566において、ヘッダ生成部503は、符号化部502より供給される関連情報に基づいて、その他の情報を設定する。
In step S563, the
ステップS566の処理が終了すると、処理は、図26のステップS505に戻り、ステップS506以降の処理が実行される。 When the process of step S566 ends, the process returns to step S505 in FIG. 26, and the processes after step S506 are executed.
以上のように、符号化装置500は、画像データを符号化し、その符号化データをパケット化して出力するとともに、その符号化処理に関する情報を生成し、出力するので、その符号化データを復号する復号装置が容易に符号化処理の内容を把握し、適切な設定で復号処理を行うことができるようにすることができる。つまり、符号化装置500は、伝送時における、画質劣化に繋がるような不要なデータ欠損等の発生を抑制し、より高品質なデータ伝送を実現することができる。
As described above,
また、符号化装置500は、高域成分から低域成分の順に生成される係数データを、復号処理(ウェーブレット逆変換処理)の順序である低域成分から高域成分の順に並び替えることにより、よりデータ伝送による(符号化処理開始から復号処理終了までの)遅延時間を低減させることができる。
In addition, the
この符号化処理に対応する復号処理については後述する。その前に符号化装置についての説明を続ける。 A decoding process corresponding to this encoding process will be described later. Before that, description of the encoding device will be continued.
以上においては、符号化装置が可逆な方法または非可逆な方法により符号化を行うように説明したが、この他にも、符号化装置が符号化の方法を選択することができるようにしてもよい。例えば、符号化装置が、可逆な方法による符号化処理と、非可逆な方法による符号化処理の両方を実行することができ、どちらの方法で符号化するかを選択することができるようにしてもよい。さらに、符号化装置が、係数並び替えを行うか否かを選択することができるようにしてもよいし、エントロピ符号化の処理単位を任意に設定することができるようにしてもよい。つまり、符号化装置が、符号化処理に関する設定を任意に行うことができるようにしてもよい。 In the above description, the encoding apparatus has been described as performing encoding using a reversible method or an irreversible method. However, in addition to this, the encoding apparatus may select an encoding method. Good. For example, the encoding apparatus can execute both the encoding process by a reversible method and the encoding process by an irreversible method, and can select which method to encode. Also good. Furthermore, the encoding apparatus may be able to select whether or not to perform coefficient rearrangement, or may be able to arbitrarily set the processing unit for entropy encoding. That is, the encoding device may be configured to arbitrarily set the encoding process.
図29は、本発明を適用した符号化装置の、さらに他の構成例を示すブロック図である。 FIG. 29 is a block diagram showing still another configuration example of the encoding apparatus to which the present invention is applied.
図29において、符号化装置600は、画像データを符号化する符号化装置であり、上述した符号化装置500等と基本的に同様の構成を有する。ただし、符号化装置600は、分析フィルタ処理を可逆な方法で行うか非可逆な方法で行うか、および、並び替え処理を行うか否かを選択することができる。また、符号化装置600は、エントロピ符号化処理の処理単位を任意に設定することができる。
In FIG. 29, an
図29に示されるように、符号化装置600は、制御部601、符号化部602、ヘッダ生成部603、パケット化部604、および送信部605を有する。これらの制御部601、符号化部602、ヘッダ生成部603、パケット化部604、および送信部605は、符号化装置500の制御部501、符号化部502、ヘッダ生成部503、パケット化部504、および送信部505にそれぞれ対応し、それぞれ、基本的に同様の構成を有し、同様の処理を行う。
As illustrated in FIG. 29, the
ただし、符号化部602は、上述したように、分析フィルタ処理、並び替え処理、およびエントロピ符号化処理のそれぞれについて設定変更可能である。図29に示されるように、符号化部602は、分析フィルタ処理部621、並び替え処理部622、および符号化部623を有する。
However, the
分析フィルタ処理部621は、分析フィルタ処理部521に対応し、ウェーブレット変換部611および途中計算用バッファ部612を有する。並び替え処理部622は、係数並び替え用バッファ部513と同様の係数並び替え用バッファ部614と、係数並び替え部514と同様の係数並び替え部615の他に、切替部613および切替部616を有する。切替部613および切替部616は、制御部601の制御に基づいて、係数並び替えを行うか否かを切り替える。
The analysis
例えば、並び替え処理部622は、制御部601の制御に基づいて、係数並び替え部615において係数データの並び替えを行う場合、切替部613に、ウェーブレット変換部611より供給される係数データを係数並び替え用バッファ部614に供給するように接続を切り替えさせ、切替部616に、係数並び替え部615の出力を符号化処理部623の符号化用バッファ部617に供給するように接続を切り替えさせる。
For example, when the
また、例えば、並び替え処理部622は、制御部601の制御に基づいて、係数並び替え部615において係数データの並び替えを行わない場合、切替部613に、ウェーブレット変換部611より供給される係数データを切替部616に供給するように接続を切り替えさせ、切替部616に、切替部613の出力を符号化処理部623の符号化用バッファ部617に供給するように接続を切り替えさせる。
Further, for example, the
符号化処理部623は、符号化用バッファ部617とエントロピ符号化部618を有する。符号化用バッファ部617は、切替部616より供給される係数データを順次蓄積する。エントロピ符号化部618は、符号化バッファ部617に蓄積された係数データに対して、符号化装置500のエントロピ符号化部515と同様のエントロピ符号化を行うが、このとき、制御部601に指定されるプレシンクト数を処理単位としてエントロピ符号化を行う。この符号化用バッファ部617に係数データを蓄積させることにより、エントロピ符号化部618は、例えば2プレシンクトや3プレシンクト等のように、任意の数(複数)のプレシンクト分の係数データを処理単位として符号化処理を行うこともできる。
The
図30は、分析フィルタ処理部621の詳細な構成例を示すブロック図である。図30に示されるように、ウェーブレット変換部611は、バッファ部631、切替部632、整数型ウェーブレット変換部633、固定小数点型ウェーブレット変換部634、および切替部635を有する。
FIG. 30 is a block diagram illustrating a detailed configuration example of the analysis
バッファ部631は、入力画像データを蓄積する。切替部632は、接続を切り替えることにより、バッファ部631より出力される入力画像データを整数型ウェーブレット変換部633または固定小数点型ウェーブレット変換部634のいずれか一方に供給する。整数型ウェーブレット変換部633は、基本的にウェーブレット変換部111やウェーブレット変換部511と同様の構成を有し、可逆な方法で分析フィルタ処理を行う。固定小数点型ウェーブレット変換部634は、基本的にウェーブレット変換部301と同様の構成を有し、非可逆な方法で分析フィルタ処理を行う。切替部635は、接続を切り替えることにより、整数型ウェーブレット変換部633の出力、または、固定小数点型ウェーブレット変換部634のうちいずれか一方を切替部613に供給する。
The
制御部601は、制御情報を供給することにより、切替部632、整数型ウェーブレット変換部633、固定小数点型ウェーブレット変換部634、および切替部635の動作を制御し、入力画像データに対して、整数型ウェーブレット変換部633または固定小数点型ウェーブレット変換部634のうちいずれか一方においてウェーブレット変換処理(分析フィルタ処理)を行わせる。つまり、分析フィルタ処理部621(ウェーブレット変換部611)は、制御部601の制御に従って、可逆な方法または非可逆な方法によりウェーブレット変換処理を行う。
The
符号化装置600による符号化処理の流れは、基本的に、図26を参照して説明した場合と同様であるのでその説明を省略する。図31のフローチャートを参照して、図29のウェーブレット変換部611により、図26のステップS502に対応する処理において実行が開始される符号化処理の流れの例を説明する。
The flow of the encoding process performed by the
ステップS601乃至ステップS605の各処理は、基本的にステップS531乃至ステップS535の各処理と同様に実行される。ただし、ステップS603およびステップS604において、ウェーブレット変換部611は、制御部601の制御に基づいて、整数型ウェーブレット変換部633または固定小数点型ウェーブレット変換部634のうちいずれか一方、つまり、可逆な方法か若しくは非可逆な方法により分析フィルタリング(垂直分析フィルタリングおよび水平分析フィルタリング)を行う。
Steps S601 to S605 are basically executed in the same manner as steps S531 to S535. However, in step S603 and step S604, the
ステップS606において、並び替え処理部622は、制御部601の制御に基づいて、係数データを並び替えるか否かを判定し、並び替えると判定した場合、切替部613および切替部616を制御し、係数並び替え部615を利用することができるようにし、ステップS607において、ウェーブレット変換部611より出力された、高域成分から低域成分の順に並ぶ係数データを低域成分から高域成分の順に並び替える。ステップS606において係数データの並び替えを行わないと判定した場合、並び替え処理部622は、ステップS607の処理を省略する。
In step S606, the
ステップS608乃至ステップS611の各処理は、ステップS537乃至ステップS540の各処理と基本的に同様に実行される。ただし、エントロピ符号化部618は、制御部601により設定されたデータ単位(プレシンクト数)を処理単位としてエントロピ符号化を行う。
The processes in steps S608 to S611 are executed basically in the same manner as the processes in steps S537 to S540. However, the
符号化部602は、以上のような符号化処理をピクチャ単位で繰り返し実行する。
The
次に、図32のフローチャートを参照して、図26のステップS501に対応する処理において実行される設定処理の流れの例を説明する。 Next, an example of the flow of the setting process executed in the process corresponding to step S501 in FIG. 26 will be described with reference to the flowchart in FIG.
設定処理が開始されると、ステップS631において、ウェーブレット変換部611は、制御部601より供給される制御情報に基づいて、可逆符号化を行うか否かを判定する。可逆方式による符号化を行うと判定した場合、ウェーブレット変換部611は、処理をステップS632に進め、整数型ウェーブレット変換部633を選択するように切替部632および切替部635を制御し、整数型ウェーブレット変換部633をアクティブにする。
When the setting process is started, in step S631, the
また、ステップS631において非可逆方式による符号化を行うと判定した場合、ウェーブレット変換部611は、処理をステップS633に進め、固定小数点型ウェーブレット変換部634を選択するように切替部632および切替部635を制御し、固定小数点型ウェーブレット変換部634をアクティブにする。
If it is determined in step S631 that encoding by the irreversible method is to be performed, the
ステップS634において、並び替え処理部622は、制御部601より供給される制御情報に基づいて、並び替えを行うか否かを判定する。係数データを並び替えると判定した場合、並び替え処理部622は、処理をステップS635に進め、並び替えを行うように切替部613および切替部616を制御し、係数並び替え部615および係数並び替え用バッファ部614をアクティブにする。これに対して、ステップS634において並び替えを行わないと判定した場合、並び替え処理部622は、処理をステップS636に進め、並び替えを行わないように切替部613および切替部616を制御する。
In step S634, the
ステップS637において、エントロピ符号化部618は、制御部601より供給される制御情報に基づいて、エントロピ符号化の処理単位(例えばプレシンクト数)を設定する。つまり、エントロピ符号化部618は、設定された処理単位プレシンクト数の係数データが符号化用バッファ部617に蓄積されるまで待機し、設定された処理単位プレシンクト数の係数データが符号化用バッファ部617に蓄積されると、それらの係数データを用いて、エントロピ符号化処理を実行する。
In step S637, the
ステップS637の処理が終了すると、処理は、図26のステップS501に対応する処理に戻され、それ以降の処理が実行される。 When the process of step S637 ends, the process returns to the process corresponding to step S501 of FIG. 26, and the subsequent processes are executed.
以上のようにして、符号化装置600は、制御情報に基づいて符号化部602の符号化方法に関する設定を行うことができる。なお、設定を更新する場合も基本的に同様の処理により行うことができる。また、符号化装置600のヘッダ生成部603は、以上のように行った符号化処理の設定を、符号化に関する情報としてピクチャヘッダに埋め込む。その方法は、図28のフローチャートを参照して説明した場合と同様であり、ヘッダ生成部603は、符号化部602より供給される関連情報に基づいて各情報をピクチャヘッダに埋め込む。
As described above, the
なお、以上においては、可逆な方法でウェーブレット変換を行う場合と、非可逆な方法でウェーブレット変換を行う場合との切り替えを、整数型ウェーブレット変換部633と固定小数点型ウェーブレット変換部634のいずれか一方を使用することにより行うように説明したが、上述したように、可逆な分析フィルタ処理と非可逆な分析フィルタ処理は、ビット精度以外については共通化することができる。
In the above, switching between the case of performing the wavelet transform by a reversible method and the case of performing the wavelet transform by an irreversible method is performed by either one of the integer
図33は、分析フィルタ処理621の他の構成例を示すブロック図である。
FIG. 33 is a block diagram showing another configuration example of the
図33に示されるように、この場合、ウェーブレット変換部611は、バッファ部641、切替部642、ビットシフト器643、切替部644、およびウェーブレット変換器645を有する。ビットシフト器643およびウェーブレット変換器645は、ビットシフト器321およびウェーブレット変換器322(図15)と同様である。バッファ部641は、入力される画像データを一時的に保持し、所定のタイミングで切替部642に供給する。切替部642および切替部644は、制御部601の制御に従って、ビットシフト器643を使用するか否かを選択するように接続を切り替える。
As shown in FIG. 33, in this case, the
例えば、制御部601の制御情報に基づいて、ウェーブレット変換部611が整数精度の分析フィルタ処理(可逆な方法で分析フィルタ処理)を行うようにする場合、切替部642および切替部644は、バッファ部641より出力される画像データがビットシフト器643を介さずにウェーブレット変換器645に供給されるように接続を切り替える。
For example, when the
また、例えば、制御部601の制御情報に基づいて、ウェーブレット変換部611が固定小数点精度の分析フィルタ処理(非可逆な方法で分析フィルタ処理)を行うようにする場合、切替部642および切替部644は、バッファ部641より出力される画像データがビットシフト器643を介してウェーブレット変換器645に供給されるように接続を切り替える。
Further, for example, when the
つまり、ウェーブレット変換器645は、入力画像データをビットシフトせずに、ウェーブレット変換する場合、整数精度の(可逆な方法で)ウェーブレット変換処理を行う。これに対して、入力画像データをビットシフト器643においてビットシフトさせてから、ウェーブレット変換する場合、ウェーブレット変換器645は、固定小数点精度の(非可逆な方法で)ウェーブレット変換処理を行う。
That is, the
このように構成の一部を共通化することにより、ハードウェア(回路規模)の増大を抑制することができ、符号化装置600の消費電力やコストを低減させることができる。なお、切り替え方法やピクチャヘッダの生成方法は、図30の構成の場合と同様であるのでその説明は省略する。
By sharing a part of the configuration in this way, an increase in hardware (circuit scale) can be suppressed, and power consumption and cost of the
次に、以上に説明した符号化装置500および符号化装置600に対応し、ピクチャヘッダ(符号化に関する情報)を解析し、適切な復号処理を行う復号装置について説明する。図34は、復号装置の他の構成例を示すブロック図である。
Next, a decoding apparatus corresponding to the
図34において、復号装置700は、符号化装置500および符号化装置600に対応し、それらより供給されるピクチャヘッダ(符号化に関する情報)を解析し、適切な復号処理を行う。復号装置700は、受信部701、パケット解析部702、ヘッダ解析部703、および復号部704を有する。
In FIG. 34, a
受信部701は、符号化装置より供給されるパケットを受信し、パケット解析部702に供給する。パケット解析部702は、供給されたパケットを解析し、パケットよりピクチャヘッダ等のヘッダ情報を抽出し、そのヘッダ情報をヘッダ解析部703に供給するとともに、パケットより符号化データを抽出し、その符号化データを復号部704に供給する。ヘッダ解析部703は、供給されるヘッダ情報を解析し、例えば、上述したピクチャヘッダに含まれる符号化に関する情報を抽出し、その符号化に関する情報に基づいて復号処理の設定を最適化するように、復号処理のための制御情報を生成し、その制御情報を復号部704の制御部711に供給する。
The
復号部704は、復号装置200や復号装置400と基本的に同様の構成を有し、供給される符号化データを、符号化装置において行われた符号化処理に対応する方法で復号し、ベースバンドの画像データを生成する。
The
図34に示されるように、復号部704は、制御部711、エントロピ復号部712、並び替え処理部731、および合成フィルタ処理部732を有する。
As shown in FIG. 34, the
制御部711は、ヘッダ解析部703より供給される制御情報に基づいて、エントロピ復号部712、並び替え処理部731、および合成フィルタ処理部732の動作を制御する。エントロピ復号部712は、制御部711の制御に基づいて、パケット解析部702より供給される符号化データに対して、符号化装置において行われたエントロピ符号化処理に対応する方法でエントロピ復号処理を行い、得られた係数データを並び替え処理部731の切替部713に供給する。
The
並び替え処理部731は、並び替え処理部622と基本的に同様の構成を有し、制御部711の制御に基づいて、係数データの並び替えを行うか否かを選択することができる。図34に示されるように、並び替え処理部731は、切替部713、係数並び替え用バッファ部714、係数並び替え部715、および切替部716を有する。つまり、並び替え処理部731は、制御部711の制御に基づいて、切替部713および切替部716の接続を切り替えることにより、係数並び替え用バッファ部714および係数並び替え部715を利用して係数データの並び替えを行うか否かを切り替える。なお、並び替え処理部731は、符号化装置側において係数並び替えが行われていない場合、係数データの並び替えを行い、符号化装置側において係数並び替えが行われた場合、係数データの並び替えを行わないようにする。
The rearrangement processing unit 731 has basically the same configuration as that of the
以上のように、並び替え処理部731は、容易に、符号化装置側において係数データの並びか処理が行われたか否かに応じて係数データの並び替えを行うか否かを選択することができる。切替部716は、供給された係数データを合成フィルタ処理部732のゲイン調整部717に供給する。
As described above, the rearrangement processing unit 731 can easily select whether or not to rearrange the coefficient data according to whether or not the coefficient data is rearranged or processed on the encoding device side. it can. The
合成フィルタ処理部732は、ゲイン調整部717、係数バッファ部718、およびウェーブレット逆変換部719を有する。係数バッファ部718およびウェーブレット逆変換部719は、基本的に、係数バッファ部203およびウェーブレット逆変換部204(図9)や、係数バッファ部403およびウェーブレット変換部404(図18)と同様の構成を有し、同様の処理を行う。ただし、ウェーブレット逆変換部719は、可逆方式および非可逆方式の両方の合成フィルタ処理を行うことができる。ゲイン調整部717は、必要に応じて係数データの高域成分のゲイン調整を行う。
The synthesis
図35は、合成フィルタ処理部732の詳細な構成例を示すブロック図である。
FIG. 35 is a block diagram illustrating a detailed configuration example of the synthesis
図35に示されるように、ゲイン調整部717は、切替部751、高域成分ゲイン調整部752、および切替部753を有し、制御部711の制御に基づいて、高域成分のゲインを調整するか否かを選択する。ゲイン調整を行う場合、ゲイン調整部717は、制御部711の制御に基づいて、切替部751および切替部753に、切替部751に入力される係数データが高域成分ゲイン調整部752を介して切替部753に供給されるように接続を切り替えさせる。高域成分ゲイン調整部752は、供給される係数データの高域成分に対して所定のゲイン調整を行なう。例えば、符号化側においてゲイン調整が行われた場合、ゲイン調整部717は、ゲイン調整を符号化時と逆方向に行うようにする。
As shown in FIG. 35, the
また、ゲイン調整を行わない場合、ゲイン調整部717は、制御部711の制御に基づいて、切替部751および切替部753に、切替部751に入力される係数データが、高域成分ゲイン調整部752を介さずに切替部753に供給されるように接続を切り替えさせる。
In addition, when gain adjustment is not performed, the
以上のように、ゲイン調整部717は、容易に、符号化装置側の分析フィルタ処理の方法(ゲイン調整処理の有無)に応じてゲイン調整を行うか否かを選択することができる。切替部753は、供給された係数データを係数バッファ部718に供給し、保持させる。
As described above, the
ウェーブレット逆変換部719は、係数バッファ部718に蓄積された係数データに対して合成フィルタ処理を行い、ベースバンドの画像データを生成するが、ウェーブレット変換部611(図30)の場合と同様に、可逆な方法で合成フィルタ処理を行う整数型ウェーブレット逆変換部754と、非可逆な方法で合成フィルタ処理を行う固定小数点型逆ウェーブレット変換部755の両方を有している。ウェーブレット逆変換部719は、さらに切替部756およびバッファ部757を有しており、制御部711の制御に基づいて切替部756が接続を切り替えることにより、整数型ウェーブレット逆変換部754または固定小数点型逆ウェーブレット変換部755のいずれか一方を用いて合成フィルタ処理を行う。バッファ部757は、切替部756を介して供給される整数型ウェーブレット逆変換部754または固定小数点型逆ウェーブレット変換部755の出力、すなわち、ベースバンドの画像データを一時的に保持し、所定のタイミングで出力する。
The wavelet
例えば、符号化装置において可逆な方法で符号化が行われた場合、ウェーブレット逆変換部719は、制御部711の制御に基づいて、整数型ウェーブレット逆変換部754を選択し、整数型ウェーブレット逆変換部754を用いて合成フィルタ処理を行うようにする。そして、ウェーブレット逆変換部719は、制御部711の制御に基づいて、切替部756に整数型ウェーブレット逆変換部754とバッファ部757とを接続させ、整数型ウェーブレット逆変換部754の出力がバッファ部757に格納されるようにする。
For example, when encoding is performed in a reversible manner in the encoding device, the wavelet
また、例えば、符号化装置において非可逆な方法で符号化が行われた場合、ウェーブレット逆変換部719は、制御部711の制御に基づいて、固定小数点型逆ウェーブレット変換部755を選択し、固定小数点型逆ウェーブレット変換部755を用いて合成フィルタ処理を行うようにする。そして、ウェーブレット逆変換部719は、制御部711の制御に基づいて、切替部756に固定小数点型逆ウェーブレット変換部755とバッファ部757とを接続させ、固定小数点型逆ウェーブレット変換部755の出力がバッファ部757に格納されるようにする。
Further, for example, when encoding is performed by an irreversible method in the encoding device, the wavelet
以上のように、ウェーブレット逆変換部719は、容易に、符号化装置側の分析フィルタ処理の方法に応じた適切な方法で合成フィルタ処理を行うことができる。
As described above, the wavelet
次に、図36のフローチャートを参照して、復号装置700により実行される復号処理の流れの例を説明する。
Next, an example of the flow of decoding processing executed by the
復号処理が開始されると、復号装置700の受信部701は、ステップS701においてパケットを受信する。ステップS702において、パケット解析部702は、そのパケットを解析し、ステップS703において、そのパケットがピクチャヘッダ(符号化に関する情報)を含むか否かを判定する。なお、符号化に関する情報が他のヘッダに含まれる場合、パケット解析部702は、そのヘッダ情報を含むか否かを判定する。
When the decoding process is started, the receiving
ピクチャヘッダを含むと判定した場合、パケット解析部702は、処理をステップS704に進める。ステップS704において、ヘッダ解析部703は、そのピクチャヘッダを解析し、制御情報を作成し、復号部704の設定を行う。この処理の詳細は、図37のフローチャートを参照して説明する。ステップS704の処理が終了すると、ヘッダ解析部703は、処理をステップS705に進める。
If it is determined that the picture header is included, the
また、ステップS703において、パケットにピクチャヘッダが含まれないと判定した場合、パケット解析部702は、ステップS704の処理を省略し、処理をステップS705に進める。
If it is determined in step S703 that the picture header is not included in the packet, the
ステップS705において、復号部704は、上述したパケットの受信および解析により所定量の符号化データがエントロピ復号部712に蓄積されたか否かを判定し、蓄積されていないと判定した場合、処理をステップS701に戻し、さらにパケットの取得および解析を継続する。また、ステップS705において、所定量の符号化データが得られたと判定した場合、復号部704は、ステップS706に処理を進め、符号化データの復号処理を実行する。この復号処理の詳細については、図38のフローチャートを参照して後述する。
In step S705, the
ステップS707において、受信部701は、復号処理を終了するか否かを判定し、終了しないと判定した場合、処理をステップS701に戻し、それ以降の処理を繰り返す。また、ステップS707において復号処理を終了すると判定した場合、受信部701は、パケットの受信を終了し、復号処理を終了する。
In step S707, the receiving
次に、図37のフローチャートを参照して、図36のステップS704において実行されるピクチャヘッダ解析処理の流れの例を説明する。 Next, an example of the flow of the picture header analysis process executed in step S704 in FIG. 36 will be described with reference to the flowchart in FIG.
ステップS721において、ヘッダ解析部703は、ピクチャヘッダ530の可逆非可逆識別情報532を参照する。ステップS722においてヘッダ解析部703は、可逆非可逆識別情報532に基づいて、符号化データの符号化方式が可逆方式であるか否かを判定し、可逆方式であると判定した場合、処理をステップS723に進める。
In step S721, the
ステップS723において、ヘッダ解析部703は、ゲイン調整を行わないように切替部751および切替部753を制御する。なお、実際には、ヘッダ解析部703は制御情報を作成するのみである。実際の制御は、制御部711がヘッダ解析部703により作成された制御情報に基づいて行う。以下においても同様である。
In step S723, the
ステップS724において、ヘッダ解析部703は、整数型ウェーブレット逆変換部754を選択するように切替部756を制御し、整数型ウェーブレット逆変換部754をアクティブにする。
In step S724, the
また、ステップS722において、可逆非可逆識別情報532に基づいて、符号化方式が非可逆方式であると判定した場合、ヘッダ解析部703は、処理をステップS725に進める。
If it is determined in step S722 that the encoding method is the irreversible method based on the reversible
ヘッダ解析部703は、ステップS725において、ゲイン調整を行うように切替部751および切替部753を制御し、ステップS726において、固定小数点型ウェーブレット逆変換部755を選択するように切替部756を制御し、固定小数点型ウェーブレット逆変換部755をアクティブにする。
In step S725, the
ステップS724またはステップS726の処理が終了するとヘッダ解析部703は、ステップS727において、フィルタタイプ情報533に示されるタイプのフィルタを選択する。これは、整数型ウェーブレット逆変換部754または固定小数点型ウェーブレット逆変換部755(アクティブにされたウェーブレット逆変換部)が使用するフィルタを選択することができる場合であり、整数型ウェーブレット逆変換部754または固定小数点型ウェーブレット逆変換部755(アクティブにされたウェーブレット逆変換部)が1つのフィルタしか使用できない場合、この処理は省略される。
When the process of step S724 or step S726 ends, the
ヘッダ解析部703は、ステップS728において、ピクチャヘッダ530の係数並び替え情報535を参照し、ステップS729において、係数データの並び替えを行うか否かを判定し、係数データの並び替えを行うと判定した場合、処理をステップS730に進める。
In step S728, the
ステップS730において、ヘッダ解析部703は、並び替えを行うように切替部713および切替部716を制御し、係数並び替え部715および係数並び替え用バッファ部714をアクティブにする。また、ステップS729において、係数データの並び替えを行わないと判定した場合、ヘッダ解析部703は、処理をステップS731に進め、並び替えを行わないように切替部713および切替部716を制御する。
In step S730, the
ステップS732において、ヘッダ解析部703は、処理単位数プレシンクト情報534に示される処理単位をエントロピ復号の設定に反映させる。さらに、ヘッダ解析部703は、ステップS733において、必要に応じて、ピクチャヘッダ530に含まれるその他の情報を各種設定に反映し、ピクチャヘッダ解析処理を終了し、処理を図36のステップS704に戻し、それ以降の処理を実行させる。
In step S732, the
以上のようにヘッダ解析部703が、符号化装置より供給されるピクチャヘッダ(符号化に関する情報)を解析し、符号化の設定に合わせて復号の設定を適切に行うように制御情報を作成する。これにより、復号装置700は、容易に符号化の設定に応じた適切な方法で復号処理を行うことができ、不要なデータ劣化や遅延時間の発生を抑制し、高品質かつ低遅延にデータ伝送を行うことができる。
As described above, the
次に、図38のフローチャートを参照して、図36のステップS706において、復号部704により実行される復号処理の流れの例を説明する。
Next, an example of the flow of the decoding process executed by the
ステップS751において、エントロピ復号部712は、符号化データをエントロピ復号する。ステップS752において、係数並び替え部715は、係数の並び替えを行うか否かを判定し、並び替えを行うと判定した場合、処理をステップS753に進め、係数データを並び替える。また、ステップS752において係数の並び替えを行わないと判定した場合、係数並び替え部715は、ステップS753の処理を省略する。
In step S751, the
ステップS754において、ゲイン調整部717は、ゲイン調整を行うか否かを判定し、ゲイン調整を行うと判定した場合、ステップS755に処理を進め、高域成分のゲインを調整する。また、ステップS754において、ゲイン調整を行わないと判定した場合、ゲイン調整部717は、ステップS755の処理を省略する。
In step S754, the
ステップS756において、ウェーブレット逆変換部719は、整数型ウェーブレット逆変換部754または固定小数点型ウェーブレット逆変換部755のいずれか一方を用いて、可逆方式または非可逆方式により垂直合成フィルタリングを行う。ステップS757において、ウェーブレット逆変換部719は、整数型ウェーブレット逆変換部754または固定小数点型ウェーブレット逆変換部755のいずれか一方を用いて、可逆方式または非可逆方式により水平合成フィルタリングを行う。
In step S756, the wavelet
ステップS758において、ウェーブレット逆変換部719は、合成フィルタ処理をレベル1まで行ったか否かを判定し、レベル1の合成フィルタ処理まで終了していないと判定した場合、処理をステップS756に戻し、次のレベルの合成フィルタ処理を行う。ステップS758において、レベル1の合成フィルタ処理まで終了したと判定した場合、ウェーブレット逆変換部719は、処理をステップS759に進める。ステップS759において、復号部704は、復号処理を終了するか否かを判定する。符号化データの供給が継続しており、復号処理を終了しないと判定した場合、復号部704は、処理をステップS751に戻し、それ以降の処理を繰り返す。ステップS759において、復号処理を終了すると判定した場合、復号部704は、復号処理を終了する。
In step S758, the wavelet
復号部704は、このような復号処理をピクチャ毎に実行する。
The
なお、ウェーブレット逆変換部719の場合もウェーブレット変換部611の場合と同様に、整数型ウェーブレット逆変換部754と固定小数点型ウェーブレット逆変換部755の構成の一部を共通化することができる。
Note that in the case of the wavelet
図39は、合成フィルタ処理部732の他の構成例を示すブロック図である。図39において、ウェーブレット変換部719は、可逆方式と非可逆方式で共通のウェーブレット逆変換器764、切替部765、ビットシフト器766、切替部767、およびバッファ部768を有する。ウェーブレット逆変換部719は、合成フィルタ処理のビット精度以外の部分を可逆方式と非可逆方式で共通化する。つまり、非可逆方式の場合、ウェーブレット逆変換器764は、固定小数点精度で合成フィルタ処理を行うので、ウェーブレット逆変換部719は、制御部711の制御に従って、切替部765および切替部766に、ビットシフト器766においてデータを符号化時と逆方向にビットシフトさせるように、接続を切り替えさせる。
FIG. 39 is a block diagram illustrating another configuration example of the synthesis
逆に、可逆方式の場合、ウェーブレット逆変換器764は、整数精度で合成フィルタ処理を行うので、ウェーブレット逆変換部719は、制御部711の制御に従って、切替部765および切替部766に、データがビットシフト器766を介さないように、接続を切り替えさせる。
On the contrary, in the case of the reversible method, the wavelet
バッファ部768は、切替部767より供給されるベースバンドの画像データを一時的に保持し、所定のタイミングでそれを出力する。
The
図40および図41は、合成側の高域・低域成分の係数を算出するためのハードウェア構成の一例を示している。先ず、低域成分の係数値または画素値(レベル0の場合)を算出するための構成について図40を参照しながら説明する。ここでは説明の便宜上、Rm、Rn、Rdの3つのレジスタと、図中+、+2、−でそれぞれ示される各加算器771、772、775と、×0.25の演算をする乗算器773と、floorで示される丸め器774とを有して構成されているものとする。またRm、Rn、Rdの各レジスタは、それぞれ例えばx、y、z、wの4つの値を格納できる構成になっており、レジスタに格納された係数値に対して、既に述べた所定のフィルタリングの演算を施すことで、1つ下位レベルの係数値または画素値(レベル0の場合)を算出する。
40 and 41 show an example of a hardware configuration for calculating the coefficients of the high-frequency and low-frequency components on the synthesis side. First, a configuration for calculating the coefficient value or pixel value (in the case of level 0) of the low frequency component will be described with reference to FIG. Here, for convenience of explanation, three registers Rm, Rn, and Rd,
すなわち、レジスタRmからの4つの値(例えばd0 1,d0 1,d1 1,d2 1)と、レジスタRnからの4つの値(例えばd0 1,d1 1,d2 1,d3 1)とを、加算器771でそれぞれ加算し、各加算結果に対して加算器772でそれぞれ2を加算し、加算器772からの4つの出力値に対して乗算器773でそれぞれ0.25を乗算(あるいは2ビット右シフト)し、丸め器774でそれぞれ丸め処理を行って得られた4つの値を加算器775に送り、これらの4つの値をレジスタRdからの4つの値(例えばs0 1,s1 1,s2 1,s3 1)からそれぞれ減算することで、1つ下位レベルの低域成分の係数値または画素値(例えばs0 0,s1 0,s2 0,s3 0)を算出している。
That is, four values from the register Rm (for example, d 0 1 , d 0 1 , d 1 1 , d 2 1 ) and four values from the register Rn (for example, d 0 1 , d 1 1 , d 2 1 , d 3 1 ) are respectively added by the
また、例えばあるビット長の整数レジスタを設ければ、既に述べた整数精度のフィルタリングを実行でき、あるビット長の固定小数点レジスタにすれば、既に述べた固定小数点精度のフィルタリングを実行できる。しかも、レジスタの精度以外では、ハードウェア構成を全く変える必要もなく、実現できる。このようにして、ハードウェア構成要素の共通化が実現できる。 For example, if an integer register having a certain bit length is provided, the above-described filtering with integer precision can be executed, and if a fixed-point register having a certain bit length is used, the above-described filtering with fixed point precision can be performed. In addition to the register accuracy, the hardware configuration need not be changed at all. In this way, common hardware components can be realized.
図40の具体例の構成では、レジスタRdに低域成分を格納して置き、レジスタRmとRnには高域成分を格納し、演算結果を新たにレジスタRdに格納している。こうすることにより、既に使用して不要になった係数に上書きするので余分のレジスタを使わないで済み、効率的である。またハードウェアの縮小にも貢献する。 In the configuration of the specific example of FIG. 40, the low frequency component is stored in the register Rd, the high frequency component is stored in the registers Rm and Rn, and the operation result is newly stored in the register Rd. By doing so, the coefficient that has been used and overwritten is overwritten, so that it is not necessary to use an extra register, which is efficient. It also contributes to hardware reduction.
図40中でfloorで示される丸め器774の丸め処理の具体例であるが、floorによる切捨ては、小数点以下の切り捨てではなく、値として小さい方の整数に丸める処理を行うように定義しておく。この定義によれば、例えば、
+2.3 → +2 (正の値)
−2.3 → −3 (負の値)
になる。
40 is a specific example of the rounding process of the rounding
+2.3 → +2 (positive value)
-2.3 → -3 (negative value)
become.
次に、高域成分の係数値または画素値(レベル0の場合)を算出するための構成について図41を参照しながら説明する。ここでは説明の便宜上、Rm、Rn、Rdの3つのレジスタと、各加算器781、785と、×0.5の演算をする乗算器782と、floorで示される丸め器783とを有して構成されているものとする。またRm、Rn、Rdの各レジスタは、それぞれ例えばx、y、z、wの4つの値を格納できる構成になっており、レジスタに格納された係数値に対して、既に述べた所定のフィルタリングの演算を施すことで、1つ下位レベルの係数値または画素値(レベル0の場合)を算出する。
Next, a configuration for calculating the coefficient value or pixel value (in the case of level 0) of the high frequency component will be described with reference to FIG. Here, for convenience of explanation, there are provided three registers Rm, Rn, and Rd,
すなわち、レジスタRnからの4つの値(例えばs0 0,s1 0,s2 0,s3 0)と、レジスタRmからの4つの値(例えばs1 0,s2 0,s3 0,s4 0)とを、加算器781でそれぞれ加算し、各加算結果に対して乗算器782でそれぞれ0.5を乗算(あるいは1ビット右シフト)し、丸め器783でそれぞれ丸め処理を行って得られた4つの値を加算器784に送り、これらの4つの値をレジスタRdからの4つの値(例えばd0 1,d0 1,d1 1,d2 1)から減算することで、1つ下位レベルの高域成分の係数値または画素値(例えばd0 0,d1 0,d2 0,d3 0)を算出している。ここで、レジスタRdの4つの値(d0 1,d0 1,d1 1,d2 1)の内、d0 1を2つ用いているのは、上述したように、画面の端部で画面外部に位置するデータを、画面内部の隣接データで補っている(図11のd0 1とその折り返しとなる破線丸印参照)からである。
That is, four values from the register Rn (for example, s 0 0 , s 1 0 , s 2 0 , s 3 0 ) and four values from the register Rm (for example, s 1 0 , s 2 0 , s 3 0 , s 4 0 ) are respectively added by an
この図41の具体例の場合も、上記図40の具体例と同様に、各レジスタRm、Rn、Rdを整数レジスタとして使用するか、固定小数点レジスタとして使用するかだけで、ハードウェア構成を全く変えずに、整数型合成フィルタと固定小数点型合成フィルタの構成を共通化することができる。また、図41中でfloorで示される丸め器783の丸め処理も、上記図40の丸め器774と同様に、小数点以下の切り捨てではなく、値として小さい方の整数に丸める処理を行うように定義しておく。また、図41の具体例では、レジスタRmとRnに低域成分を格納して置き、レジスタRdには高域成分を格納し、演算結果を新たにRdのレジスタに格納する。このように既に使用して不要になった係数に上書きするので余分のレジスタを使わないで済み、効率的である。またハードウェアの縮小にも貢献する。なお、これらのレジスタの使い方はこれ以外にも存在することは自明であり、レジスタが大きければそれだけ格納できるデータ量が増えるので、同時にフィルタリングできる量も増え、処理の高速化に寄与することができる。
In the specific example of FIG. 41, as in the specific example of FIG. 40, the hardware configuration is completely different only by using each register Rm, Rn, Rd as an integer register or a fixed-point register. The configuration of the integer type synthesis filter and the fixed-point type synthesis filter can be made common without changing. In addition, the rounding process of the
ところで、上記図40および図41の乗算器773、782はシフト演算器で代用することができる。具体的に、図40の×0.25の乗算器773は右2ビットシフト、図41の×0.5の乗算器782は右1ビットシフトに相当することは明らかである。一般に、乗算器よりもシフト演算器の方が、ハードウェア化が軽減されることが知られており、効率的である。
Incidentally, the
なお、図39のようにウェーブレット逆変換部の一部の構成を可逆方式と非可逆方式とで共通化する場合も、方式の選択(切替部の切り替え等)や、復号処理の方法は、基本的に図35の場合と同様であるのでその説明は省略する。 Even when a part of the structure of the wavelet inverse transform unit is shared between the reversible method and the irreversible method as shown in FIG. 39, the method selection (switching unit switching, etc.) and the decoding processing method are basically the same. Since it is similar to the case of FIG. 35, its description is omitted.
また、非可逆方式の場合、符号化装置600において量子化処理を行うか否かを選択することができるようにしてもよい。その方法は、図29を参照して説明した並び替え処理部622の場合と同様にすればよい。ピクチャヘッダ530にも量子化処理を行ったか否かを示す情報を係数並び替えの場合と同様に埋め込むようにしてもよい。同様に、非可逆方式の場合、復号装置700において逆量子化処理を行うか否かを選択することができるようにしてもよい。その方法は、図34を参照して説明した並び替え処理部731の場合と同様にすればよい。復号装置は、ピクチャヘッダを参照し、符号化装置において量子化処理が行われている場合、逆量子化を行うようにすればよい。
In the case of the irreversible method, the
上述した一連の処理は、ハードウェアにより実行させることもできるし、ソフトウェアにより実行させることもできる。一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータ、または、複数の装置よりなる情報処理システムの情報処理装置などに、プログラム記録媒体からインストールされる。 The series of processes described above can be executed by hardware or can be executed by software. When a series of processing is executed by software, a program constituting the software may execute various functions by installing a computer incorporated in dedicated hardware or various programs. For example, it is installed from a program recording medium into a general-purpose personal computer or an information processing apparatus of an information processing system including a plurality of apparatuses.
図42は、上述した一連の処理をプログラムにより実行する情報処理システムの構成の例を示すブロック図である。 FIG. 42 is a block diagram illustrating an example of a configuration of an information processing system that executes the above-described series of processing by a program.
図42に示されるように、情報処理システム800は、情報処理装置801、その情報処理装置801とPCIバス802によって接続された、記憶装置803、複数台のビデオテープレコーダ(VTR)であるVTR804-1乃至VTR804-S、ユーザがこれらに対する操作入力を行うためのマウス805、キーボード806、並びに操作コントローラ807により構成されるシステムであり、インストールされたプログラムによって、上述したような画像符号化処理や画像復号処理等を行うシステムである。
As shown in FIG. 42, an
例えば情報処理システム800の情報処理装置801は、RAID(Redundant Arrays of Independent Disks)でなる大容量の記憶装置803に記憶されている動画コンテンツを符号化して得られた符号化データを記憶装置803に記憶させたり、記憶装置803に記憶されている符号化データを復号して得られた復号画像データ(動画コンテンツ)を記憶装置803に記憶させたり、符号化データや復号画像データをVTR804-1乃至VTR804-Sを介してビデオテープに記録したりすることができる。また、情報処理装置801は、VTR804-1乃至VTR804-Sに装着されたビデオテープに記録された動画コンテンツを記憶装置803に取り込み得るようにもなされている。その際、情報処理装置801が、動画コンテンツを符号化するようにしてもよい。
For example, the
情報処理装置801は、マイクロプロセッサ901、GPU(Graphics Processing Unit)902、XDR(Extreme Data Rate)-RAM903、サウスブリッジ904、HDD(Hard Disk Drive)905、USBインタフェース(USB I/F)906、およびサウンド入出力コーデック907を有している。
The
GPU902は専用のバス911を介してマイクロプロセッサ901に接続される。XDR-RAM903は専用のバス912を介してマイクロプロセッサ901に接続される。サウスブリッジ904は、専用のバスを介してマイクロプロセッサ901のI/Oコントローラ944に接続される。このサウスブリッジ904には、HDD905、USBインタフェース906、および、サウンド入出力コーデック907も接続されている。このサウンド入出力コーデック907にはスピーカ921が接続されている。また、GPU902にはディスプレイ922が接続されている。
The
またサウスブリッジ904には、さらに、PCIバス802を介して、マウス805、キーボード806、VTR804-1乃至VTR804-S、記憶装置803、並びに、操作コントローラ807が接続されている。
The
マウス805およびキーボード806は、ユーザの操作入力を受け、PCIバス802およびサウスブリッジ904を介して、ユーザの操作入力の内容を示す信号を、マイクロプロセッサ901に供給する。記憶装置803およびVTR804-1乃至VTR804-Sは、所定のデータを記録または再生できるようになされている。
The
PCIバス802にはさらに、必要に応じてドライブ808が接続され、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア811が適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じてHDD905にインストールされる。
Further, a
マイクロプロセッサ901は、OS(Operating System)等の基本プログラムを実行する汎用のメインCPUコア941と、メインCPUコア941に内部バス945を介して接続された複数(この場合8個)のRISC(Reduced Instruction Set Computer)タイプの信号処理プロセッサである、サブCPUコア942-1乃至サブCPUコア942-8と、例えば256[MByte]の容量を持つXDR-RAM903に対するメモリコントロールを行うメモリコントローラ943と、サウスブリッジ904との間でデータの入出力を管理するI/O(In/Out)コントローラ944とが1チップに集積されたマルチコア構成でなり、例えば動作周波数4[GHz]を実現している。
The
このマイクロプロセッサ901は、起動時、HDD905に格納された制御プログラムに基づき、HDD905に格納されている必要なアプリケーションプログラムを読み出してXDR-RAM903に展開し、この後このアプリケーションプログラム及びオペレータ操作に基づいて必要な制御処理を実行する。
At startup, the
また、マイクロプロセッサ901は、ソフトウェアを実行することにより、例えば、上述した符号化処理や復号処理を実現し、エンコードの結果得られた符号化ストリームを、サウスブリッジ904を介して、HDD905に供給して記憶させたり、デコードした結果得られる動画像コンテンツの再生映像を、GPU902へデータ転送して、ディスプレイ922に表示させたりすることができる。
Further, the
マイクロプロセッサ901内の各CPUコアの使用方法は任意であるが、例えば、メインCPUコア941が、画像符号化処理や画像復号処理の制御に関する処理を行い、8個のサブCPUコア942-1乃至サブCPUコア942-8に、ウェーブレット変換、係数並び替え、エントロピ符号化、エントロピ復号、ウェーブレット逆変換、量子化、および逆量子化等の各処理を、例えば図39を参照して説明したように同時並列的に実行させるようにしてもよい。その際、メインCPUコア941が、8個のサブCPUコア942-1乃至サブCPUコア942-8のそれぞれに対してプレシンクト単位で処理を割り振るようにすれば、符号化処理や復号処理が、上述したようにプレシンクト単位で同時並列的に実行される。つまり、符号化処理や復号処理の効率を向上させ、処理全体の遅延時間を短縮させ、さらに、負荷、処理時間、および、処理に必要なメモリ容量を低減させることができる。もちろん、これ以外の方法で各処理を行うようにしてもよい。
The usage method of each CPU core in the
例えば、マイクロプロセッサ901の8個のサブCPUコア942-1乃至サブCPUコア942-8のうちの一部がエンコード処理を、他の部分がデコード処理を、同時並列的に実行するようにすることも可能である。
For example, a part of the eight sub CPU cores 942-1 to 942-8 of the
また、例えば、PCIバス802に、独立したエンコーダまたはデコーダ、もしくは、コーデック処理装置が接続されている場合、マイクロプロセッサ901の8個のサブCPUコア942-1乃至サブCPUコア942-8が、サウスブリッジ904およびPCIバス802を介して、これらの装置が実行する処理を制御するようにしてもよい。さらに、これらの装置が複数接続されている場合、または、これらの装置が複数のデコーダまたはエンコーダを含んでいる場合、マイクロプロセッサ901の8個のサブCPUコア942-1乃至サブCPUコア942-8は、複数のデコーダまたはエンコーダが実行する処理を、分担して制御するようにしてもよい。
For example, when an independent encoder or decoder or a codec processing device is connected to the
このときメインCPUコア941は、8個のサブCPUコア942-1乃至サブCPUコア942-8の動作を管理し、各サブCPUコアに対して処理を割り当てたり、処理結果を引き取ったりする。さらに、メインCPUコア941は、これらのサブCPUコアが行う以外の処理も行う。例えば、メインCPUコア941は、サウスブリッジ904を介してマウス805、キーボード806、または、操作コントローラ807から供給された命令を受け付け、命令に応じた種々の処理を実行する。
At this time, the main CPU core 941 manages the operations of the eight sub CPU cores 942-1 to 942-8, assigns processing to each sub CPU core, and collects processing results. Further, the main CPU core 941 performs processes other than those performed by these sub CPU cores. For example, the main CPU core 941 accepts commands supplied from the
GPU902は、ディスプレイ922に表示する動画コンテンツの再生映像を動かすときのテクスチャの張り込みなどに関する最終的なレンダリング処理に加えて、動画コンテンツの再生映像及び静止画コンテンツの静止画像をディスプレイ922に一度に複数表示するときの座標変換計算処理や、動画コンテンツの再生映像及び静止画コンテンツの静止画像に対する拡大・縮小処理等を行う機能を司り、マイクロプロセッサ901の処理負担を軽減させるようになされている。
In addition to the final rendering processing related to texture embedding when moving the playback video of the moving image content displayed on the
GPU902は、マイクロプロセッサ901の制御のもとに、供給された動画コンテンツの映像データや静止画コンテンツの画像データに対して所定の信号処理を施し、その結果得られた映像データや画像データをディスプレイ922へ送出して、画像信号をディスプレイ922へ表示させる。
Under the control of the
例えば、マイクロプロセッサ901における8個のサブCPUコア942-1乃至サブCPUコア942-8で同時並列的にデコードされた複数の動画コンテンツにおける再生映像は、バス911を介してGPU902へデータ転送されるが、このときの転送速度は、例えば、最大30[Gbyte/sec]であり、特殊効果の施された複雑な再生映像であっても高速かつ滑らかに表示し得るようになされている。
For example, reproduced videos of a plurality of moving image contents decoded in parallel in parallel by the eight sub CPU cores 942-1 to 942-8 in the
また、マイクロプロセッサ901は、動画コンテンツの映像データ及び音声データのうち音声データに対して音声ミキシング処理を施し、その結果得られた編集音声データを、サウスブリッジ904およびサウンド入出力コーデック907を介して、スピーカ921へ送出することにより、音声信号に基づく音声をスピーカ921から出力させることもできる。
Further, the
上述した一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、ネットワークや記録媒体からインストールされる。 When the above-described series of processing is executed by software, a program constituting the software is installed from a network or a recording medium.
この記録媒体は、例えば、図42に示されるように、装置本体とは別に、ユーザにプログラムを配信するために配布される、プログラムが記録されている磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM,DVDを含む)、光磁気ディスク(MDを含む)、もしくは半導体メモリなどよりなるリムーバブルメディア811により構成されるだけでなく、装置本体に予め組み込まれた状態でユーザに配信される、プログラムが記録されているHDD905や記憶装置803等で構成される。もちろん、記録媒体は、ROMやフラッシュメモリ等の半導体メモリであってもよい。
For example, as shown in FIG. 42, the recording medium is distributed to distribute the program to the user separately from the apparatus main body, and includes a magnetic disk (including a flexible disk) on which the program is recorded, an optical disk ( In addition to being constituted by a removable medium 811 made up of a CD-ROM, DVD), a magneto-optical disk (including MD), or a semiconductor memory, etc., it is delivered to the user in a state of being pre-installed in the apparatus body. It is composed of an
以上においては、マイクロプロセッサ901内に8個のサブCPUコアが構成されるように説明したが、これに限らず、サブCPUコアの数は任意である。また、マイクロプロセッサ901が、メインCPUコアとサブCPUコアのような複数のコアにより構成されていなくてもよく、シングルコア(1つのコア)により構成されるCPUを用いるようにしてもよい。
また、マイクロプロセッサ901の代わりに複数のCPUを用いるようにしてもよいし、複数の情報処理装置を用いる(すなわち、本発明の処理を実行するプログラムを、互いに連携して動作する複数の装置において実行する)ようにしてもよい。
In the above description, eight sub CPU cores are configured in the
Further, a plurality of CPUs may be used in place of the
なお、本明細書において、記録媒体に記録されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。 In the present specification, the step of describing the program recorded on the recording medium is not limited to the processing performed in chronological order according to the described order, but is not necessarily performed in chronological order. It also includes processes that are executed individually.
また、本明細書において、システムとは、複数のデバイス(装置)により構成される装置全体を表すものである。 Further, in this specification, the system represents the entire apparatus composed of a plurality of devices (apparatuses).
なお、以上において、1つの装置として説明した構成を分割し、複数の装置として構成するようにしてもよい。逆に、以上において複数の装置として説明した構成をまとめて1つの装置として構成されるようにしてもよい。また、各装置の構成に上述した以外の構成を付加するようにしてももちろんよい。さらに、システム全体としての構成や動作が実質的に同じであれば、ある装置の構成の一部を他の装置の構成に含めるようにしてもよい。 In the above, the configuration described as one device may be divided and configured as a plurality of devices. Conversely, the configurations described above as a plurality of devices may be combined into a single device. Of course, configurations other than those described above may be added to the configuration of each device. Furthermore, if the configuration and operation of the entire system are substantially the same, a part of the configuration of a certain device may be included in the configuration of another device.
以上説明したこの発明は、データ伝送を高品質かつ低遅延に行うものであり、画像を圧縮符号化して伝送し、伝送先で圧縮符号を復号して出力するような装置またはシステムであれば、様々なものに適用することができる。この発明は、特に、画像の圧縮符号化から復号および出力までの遅延が短いことが要求されるような装置またはシステムに用いて好適である。 The present invention described above is a device or system that performs data transmission with high quality and low delay, transmits an image after compression encoding, and decodes and outputs the compression code at the transmission destination. It can be applied to various things. The present invention is particularly suitable for use in an apparatus or system that requires a short delay from image compression encoding to decoding and output.
例えば、この発明は、ビデオカメラで撮影された映像を見ながらマジックハンドを操作して治療行為を行うような、医用遠隔医療診断の用途に用いて好適である。また、この発明は、放送局内などにおける、画像を符号化して伝送し、復号して表示または記録するようなシステムに用いて好適である。 For example, the present invention is suitable for use in medical telemedicine diagnosis in which a magic hand is operated while performing a therapeutic action while watching an image taken with a video camera. Further, the present invention is suitable for use in a system in which an image is encoded and transmitted and decoded and displayed or recorded in a broadcasting station or the like.
さらに、実況中継される映像の配信を行うシステム、教育現場において生徒と教師との間でインタラクティブな通信を可能としたシステムなどに、この発明を適用することができる。 Furthermore, the present invention can be applied to a system that distributes live-streamed video, a system that enables interactive communication between students and teachers in an educational setting, and the like.
さらにまた、カメラ機能付き携帯電話端末といった、撮像機能を有するモバイル端末で撮影された画像データの送信や、テレビジョン会議システム、監視カメラおよび監視カメラで撮影された映像を記録するレコーダによるシステムなどに、この発明を適用することができる。 Furthermore, for transmission of image data taken by a mobile terminal having an imaging function, such as a mobile phone terminal with a camera function, a system using a video conference system, a surveillance camera, and a recorder that records video taken by the surveillance camera. The present invention can be applied.
100 符号化装置, 101 ウェーブレット変換部, 102 途中計算用バッファ部, 103 エントロピ符号化部, 111 分析フィルタ処理部, 200 復号装置, 201 エントロピ復号部, 202 係数並び替え部, 203 係数バッファ部, 204 ウェーブレット逆変換部, 211 合成フィルタ処理部, 300 符号化装置, 321 ビットシフト器, 322 ウェーブレット変換器, 400 復号装置, 421 ウェーブレット逆変換器, 422 ビットシフト器, 500 符号化装置, 501 制御部, 502 符号化部, 503 ヘッダ生成部, 504 パケット化部, 505 送信部, 513 係数並び替え用バッファ部, 514 係数並び替え部, 600 符号化装置, 601 制御部, 602 符号化部, 603 ヘッダ生成部, 604 パケット化部, 605 送信部, 611 ウェーブレット変換部, 613 切替部, 616 切替部, 622 並び替え処理部, 623 符号化処理部, 632 切替部, 633 整数型ウェーブレット変換部, 634 固定小数点型ウェーブレット変換部, 635 切替部, 542 切替部, 644 切替部, 700 復号装置, 701 受信部, 702 パケット解析部, 703 ヘッダ解析部, 704 復号部, 713 切替部, 716 切替部, 717 ゲイン調整部, 731 並び替え処理部, 732 合成フィルタ処理部, 751 切替部, 752 高域成分ゲイン調整部, 753 切替部, 754 整数型ウェーブレット逆変換部, 755 固定小数点型ウェーブレット逆変換部, 756 切替部, 765 切替部, 767 切替部 DESCRIPTION OF SYMBOLS 100 encoding apparatus, 101 wavelet transformation part, 102 intermediate calculation buffer part, 103 entropy encoding part, 111 analysis filter processing part, 200 decoding apparatus, 201 entropy decoding part, 202 coefficient rearrangement part, 203 coefficient buffer part, 204 Wavelet inverse transform unit, 211 synthesis filter processing unit, 300 encoding device, 321 bit shifter, 322 wavelet transformer, 400 decoding device, 421 wavelet inverse transform unit, 422 bit shifter, 500 encoding device, 501 control unit, 502 encoding unit, 503 header generating unit, 504 packetizing unit, 505 transmitting unit, 513 coefficient rearranging buffer unit, 514 coefficient rearranging unit, 600 encoding device, 601 control unit, 60 Coding section, 603 header generation section, 604 packetization section, 605 transmission section, 611 wavelet transform section, 613 switching section, 616 switching section, 622 rearrangement processing section, 623 coding processing section, 632 switching section, 633 integer type Wavelet transform unit, 634 fixed-point wavelet transform unit, 635 switching unit, 542 switching unit, 644 switching unit, 700 decoding device, 701 receiving unit, 702 packet analysis unit, 703 header analysis unit, 704 decoding unit, 713 switching unit, 716 switching unit, 717 gain adjustment unit, 731 rearrangement processing unit, 732 synthesis filter processing unit, 751 switching unit, 752 high-frequency component gain adjustment unit, 753 switching unit, 754 integer wavelet inverse transformation unit, 755 fixed-point type c Over wavelet inverse transformation unit, 756 switching unit, 765 switching unit, 767 switching unit
Claims (10)
前記分析フィルタ手段による前記分析フィルタ処理により生成された前記係数データを、複数の前記ラインブロックより生成された前記係数データ群毎に、復号処理により符号化データから元の前記係数データを復元可能な可逆な方法で符号化する符号化手段と
を備える情報処理装置。 Analysis that decomposes image data for each frequency band in a reversible manner that can restore the original image data from the converted coefficient data by reverse conversion, and generates subbands composed of the coefficient data for each frequency band Analysis filter means for performing filtering for each line block including the image data for the number of lines necessary to generate coefficient data for one line of at least the subband of the lowest frequency component;
The coefficient data generated by the analysis filter processing by the analysis filter means can be restored to the original coefficient data from the encoded data by decoding processing for each coefficient data group generated from a plurality of the line blocks. An information processing apparatus comprising: encoding means for encoding by a reversible method.
請求項1に記載の情報処理装置。 The encoding including information indicating that at least the encoded data is generated by encoding in a reversible method for each predetermined data unit with respect to the encoded data obtained by encoding by the encoding means The information processing apparatus according to claim 1, further comprising a generation unit configured to generate information regarding data.
請求項2に記載の情報処理装置。 The information processing apparatus according to claim 2, wherein the generation unit also generates information about a type of the analysis filter process executed by the analysis filter unit as information about the encoded data.
請求項2に記載の情報処理装置。 The generation unit also generates information on the number of the line blocks necessary for generating the coefficient data group that is used as the processing unit of the encoding by the encoding unit as information on the encoded data. The information processing apparatus described in 1.
前記符号化手段は、前記係数データを、複数の前記ラインブロックより生成された前記係数データ群毎に、前記並び替え手段により並び替えられた順に符号化する
請求項1に記載の情報処理装置。 The coefficient data generated by the analysis filter processing by the analysis filter means is combined with the coefficient data of each subband for each line block in order of executing synthesis filter processing for restoring the original image data. It further comprises a sorting means for sorting,
The information processing apparatus according to claim 1, wherein the encoding unit encodes the coefficient data in the order in which the coefficient data group generated from the plurality of line blocks is rearranged by the rearrangement unit.
請求項5に記載の情報処理装置。 For the encoded data obtained by encoding by the encoding means, at least information indicating that the encoded data has been generated by encoding in a reversible method for each predetermined data unit, and the arrangement The information processing apparatus according to claim 5, further comprising a generation unit that generates information regarding the encoded data including information regarding rearrangement of the coefficient data by a replacement unit.
前記分析フィルタ手段による分析フィルタ処理を可逆な方法で行うか非可逆な方法で行うかを制御する制御手段をさらに備える
請求項1に記載の情報処理装置。 The analysis filter means further decomposes the image data for each frequency band by an irreversible method in which restoration of the original image data by reverse conversion is not guaranteed, and from the coefficient data for each frequency band An analysis filtering process for generating a subband is performed for each line block including the image data for the number of lines necessary to generate at least one line of coefficient data of the subband of the lowest frequency component,
The information processing apparatus according to claim 1, further comprising a control unit that controls whether the analysis filter processing by the analysis filter unit is performed in a reversible method or a non-reversible method.
前記情報処理装置は、
分析フィルタ手段と、
符号化手段と
を備え、
前記分析フィルタ手段が、画像データを、逆方向の変換により変換後の係数データから元の前記画像データを復元可能な可逆な方法で周波数帯域毎に分解し、前記周波数帯域毎の係数データからなるサブバンドを生成する分析フィルタ処理を、少なくとも最低域成分のサブバンドの1ライン分の係数データを生成するのに必要なライン数分の前記画像データを含むラインブロック毎に行い、
前記符号化手段が、前記分析フィルタ処理により生成された前記係数データを、複数の前記ラインブロックより生成された前記係数データ群毎に、復号処理により符号化データから元の前記係数データを復元可能な可逆な方法で符号化する
情報処理方法。 In the information processing method of the information processing apparatus,
The information processing apparatus includes:
Analysis filter means;
Encoding means, and
The analysis filter means decomposes the image data for each frequency band by a reversible method capable of restoring the original image data from the converted coefficient data by reverse conversion, and includes the coefficient data for each frequency band. Analysis filter processing for generating subbands is performed for each line block including the image data for the number of lines necessary to generate coefficient data for one line of at least the subband of the lowest frequency component,
The encoding means can restore the original coefficient data from the encoded data by decoding the coefficient data generated by the analysis filter process for each coefficient data group generated from a plurality of the line blocks. Information processing method that encodes in a reversible manner.
前記解析手段による解析の結果、前記符号化データが前記可逆な方法の符号化処理により生成されたものであると判定される場合、前記符号化データに対して、前記符号化処理に対応する方法で復号処理を行う復号手段と、
前記復号手段による復号処理により前記符号化データから生成された係数データに対して、合成して前記画像データを生成する合成フィルタ手段と
を備える情報処理装置。 Whether or not the encoded data obtained by encoding the image data is analyzed, and the encoded data is generated by a reversible encoding process capable of restoring the data before encoding by the decoding process. An analysis means for identifying
As a result of analysis by the analysis means, when it is determined that the encoded data is generated by the reversible encoding process, a method corresponding to the encoding process for the encoded data Decryption means for performing decryption processing in
An information processing apparatus comprising: synthesis filter means for synthesizing the coefficient data generated from the encoded data by the decoding processing by the decoding means to generate the image data.
前記情報処理装置は、
解析手段と、
復号手段と、
合成フィルタ手段と
を備え、
前記解析手段が、画像データが符号化された符号化データに関する情報を解析し、前記符号化データが、復号処理により符号化前のデータを復元可能な可逆な方法の符号化処理により生成されたものであるか否かを特定し、
前記復号手段が、解析の結果、前記符号化データが前記可逆な方法の符号化処理により生成されたものであると判定される場合、前記符号化データに対して、前記符号化処理に対応する方法で復号処理を行い、
前記合成フィルタ手段が、復号処理により前記符号化データから生成された係数データに対して、合成して前記画像データを生成する
情報処理方法。 In the information processing method of the information processing apparatus,
The information processing apparatus includes:
Analysis means;
Decryption means;
A synthesis filter means, and
The analysis unit analyzes information related to encoded data obtained by encoding image data, and the encoded data is generated by a reversible method encoding process capable of restoring data before encoding by a decoding process. Whether it ’s a thing,
When the decoding means determines that the encoded data is generated by the reversible encoding process as a result of the analysis, the decoding unit corresponds to the encoding process for the encoded data. Decryption with the method
An information processing method in which the synthesis filter unit generates the image data by synthesizing the coefficient data generated from the encoded data by a decoding process.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2008289345A JP4821835B2 (en) | 2008-05-16 | 2008-11-12 | Information processing apparatus and method |
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| PCT/JP2008/059002 WO2008143157A1 (en) | 2007-05-17 | 2008-05-16 | Information processing device and method |
| JPPCT/JP2008/059002 | 2008-05-16 | ||
| JP2008289345A JP4821835B2 (en) | 2008-05-16 | 2008-11-12 | Information processing apparatus and method |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2009278609A true JP2009278609A (en) | 2009-11-26 |
| JP4821835B2 JP4821835B2 (en) | 2011-11-24 |
Family
ID=41443571
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2008289345A Expired - Fee Related JP4821835B2 (en) | 2008-05-16 | 2008-11-12 | Information processing apparatus and method |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4821835B2 (en) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2016002577A1 (en) * | 2014-07-03 | 2016-01-07 | ソニー株式会社 | Image processing apparatus and method |
| CN113763238A (en) * | 2020-06-01 | 2021-12-07 | 杭州海康威视数字技术股份有限公司 | Picture synthesis method and device and electronic equipment |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2000358183A (en) * | 1999-06-14 | 2000-12-26 | Canon Inc | Image processing apparatus and method |
| JP2004166096A (en) * | 2002-11-15 | 2004-06-10 | Ricoh Co Ltd | Image transmitting device, image receiving device, network system, program, storage medium, image transmitting method, and image receiving method |
| JP2005142673A (en) * | 2003-11-04 | 2005-06-02 | Canon Inc | Image processing method and apparatus |
-
2008
- 2008-11-12 JP JP2008289345A patent/JP4821835B2/en not_active Expired - Fee Related
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2000358183A (en) * | 1999-06-14 | 2000-12-26 | Canon Inc | Image processing apparatus and method |
| JP2004166096A (en) * | 2002-11-15 | 2004-06-10 | Ricoh Co Ltd | Image transmitting device, image receiving device, network system, program, storage medium, image transmitting method, and image receiving method |
| JP2005142673A (en) * | 2003-11-04 | 2005-06-02 | Canon Inc | Image processing method and apparatus |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2016002577A1 (en) * | 2014-07-03 | 2016-01-07 | ソニー株式会社 | Image processing apparatus and method |
| JPWO2016002577A1 (en) * | 2014-07-03 | 2017-04-27 | ソニー株式会社 | Image processing apparatus and method |
| US10284879B2 (en) | 2014-07-03 | 2019-05-07 | Sony Corporation | Image processing apparatus and method based on integerprecision image data |
| CN113763238A (en) * | 2020-06-01 | 2021-12-07 | 杭州海康威视数字技术股份有限公司 | Picture synthesis method and device and electronic equipment |
| CN113763238B (en) * | 2020-06-01 | 2023-09-26 | 杭州海康威视数字技术股份有限公司 | Image synthesis method, device and electronic equipment |
Also Published As
| Publication number | Publication date |
|---|---|
| JP4821835B2 (en) | 2011-11-24 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN101543037B (en) | Information processing device and method | |
| JP4356028B2 (en) | Information processing apparatus and method | |
| JP4888729B2 (en) | Encoding apparatus and method, and decoding apparatus and method | |
| JP4356033B2 (en) | Image data processing apparatus and method | |
| JP4707681B2 (en) | Multi-resolution image data management system and method based on tiled wavelet transform and sparse data coding | |
| CN101106719B (en) | Wavelet transformation device, wavelet inverse transformation device and method, program, and recording medium | |
| JPWO2007066709A1 (en) | Encoding apparatus, encoding method and encoding program, and decoding apparatus, decoding method and decoding program | |
| JPWO2007066710A1 (en) | Encoding apparatus, encoding method and encoding program, and decoding apparatus, decoding method and decoding program | |
| CN101309419B (en) | Information processing device and method | |
| JP4517306B2 (en) | Information processing apparatus and method | |
| JP4360379B2 (en) | Image processing apparatus, image processing method, program, and recording medium | |
| JP2021077942A (en) | Encoding apparatus, encoding method, decoding apparatus and decoding method | |
| JP5950157B2 (en) | Image processing apparatus and method, and program | |
| JP4356032B2 (en) | Information processing apparatus and method | |
| CN101120584B (en) | Encoding device and method, composite device and method, and transmission system | |
| JP2008288841A (en) | Encoding apparatus and method | |
| JP4821835B2 (en) | Information processing apparatus and method | |
| US8213731B2 (en) | Information processing device and method | |
| JP4793320B2 (en) | Information processing apparatus and method | |
| CN111264062A (en) | Encoder, encoding system and encoding method |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101102 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101109 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110106 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110519 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110712 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110809 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110822 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140916 Year of fee payment: 3 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| LAPS | Cancellation because of no payment of annual fees |