JP2003047005A - Image encoding apparatus and method, program, and storage medium - Google Patents
Image encoding apparatus and method, program, and storage mediumInfo
- Publication number
- JP2003047005A JP2003047005A JP2001232812A JP2001232812A JP2003047005A JP 2003047005 A JP2003047005 A JP 2003047005A JP 2001232812 A JP2001232812 A JP 2001232812A JP 2001232812 A JP2001232812 A JP 2001232812A JP 2003047005 A JP2003047005 A JP 2003047005A
- Authority
- JP
- Japan
- Prior art keywords
- image
- resolution
- subband
- area
- coding apparatus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
(57)【要約】
【課題】 異なる解像度レベルを必要とする領域を含む
画像データを符号化する場合に、効率の良い画像符号化
を行うこと。又、符号化を行った画像データを復号する
際に、注目解像度領域を早期に特定可能な符号列を生成
する符号化を行うこと。
【解決手段】 高解像度領域情報入力部101から入力
した高解像度領域情報に基づき領域決定部102はフラ
グを生成し、高解像度画像入力部103及び低解像度画
像入力部104はフラグに基づき高、低解像度画像を読
込み、離散ウェーブレット変換部105は高解像度画像
に2次元離散ウェーブレット変換を施す。係数合成部1
06は高解像度画像の低周波サブバンドと低解像度画像
との合成を行う。離散ウェーブレット変換部107は合
成したサブバンドに2次元離散ウェーブレット変換を施
し、ビットプレーン符号化部108は符号列を生成す
る。
(57) [Problem] To efficiently perform image encoding when encoding image data including areas requiring different resolution levels. In addition, when decoding encoded image data, encoding is performed to generate a code string capable of specifying a target resolution area at an early stage. SOLUTION: An area determination unit 102 generates a flag based on high resolution area information input from a high resolution area information input unit 101, and a high resolution image input unit 103 and a low resolution image input unit 104 generate high, low based on the flag. The resolution image is read, and the discrete wavelet transform unit 105 performs a two-dimensional discrete wavelet transform on the high-resolution image. Coefficient synthesis unit 1
06 synthesizes the low-frequency subband of the high-resolution image with the low-resolution image. The discrete wavelet transform unit 107 performs a two-dimensional discrete wavelet transform on the synthesized subband, and the bit plane encoding unit 108 generates a code sequence.
Description
【0001】[0001]
【発明の属する技術分野】本発明は、画像データを符号
化する画像符号化装置及びその方法並びにプログラム、
記憶媒体に関するものである。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an image coding apparatus for coding image data, a method therefor, and a program,
It relates to a storage medium.
【0002】[0002]
【従来の技術】近年、デジタルカメラ、スキャナといっ
た画像入力装置の技術の向上にともない、これら入力装
置により取り込む画像データの解像度は増加の一途を辿
っている。低解像度の画像であれば画像データの量も少
なく、伝送、蓄積といった処理に支障をきたすことはな
かった。しかし高解像度になるにつれ、画像データ量も
膨大なものになり、伝送する際に多くの時間がかかった
り、蓄積に多くの記憶容量を必要とするという問題が生
じる。このため画像の伝送、蓄積に際しては高能率符号
化を用いることにより、画像の冗長性を除く、あるいは
視覚的に許容できる範囲で画像を加工し、データ量の削
減を行うことが一般的である。復号により元の画像を完
全に再現できる符号化方式を可逆符号化、視覚的に近い
画像を得るものの完全には元の画像を再現できない符号
化方式を非可逆符号化と呼んでいる。非可逆符号化の場
合、視覚的に劣化が目立たない部分を変化させて符号量
の削減を図ることが肝要であるが、これは画像の特性に
大きく依存している。画像データと一口にいってもその
タイプは様々であり、人物・風景等を銀塩写真で撮影
し、スキャナで読み取る、あるいは直接デジタルカメラ
で撮影するなどして生成される自然画像、文字、線情報
をラスタライズした文字・線画像、コンピュータで生成
した2次元画像データや3次元形状をレンダリングした
CG画像などがあり、良好な再生画質を得るためにはそ
れぞれに必要解像度、必要階調数が異なると言われる。
一般には文字画像、線画像は自然画像に比べて高い解像
度が必要であるとされている。2. Description of the Related Art In recent years, with the improvement of the technology of image input devices such as digital cameras and scanners, the resolution of image data captured by these input devices has been increasing. If the image has a low resolution, the amount of image data is small, and it does not hinder processing such as transmission and storage. However, as the resolution becomes higher, the amount of image data also becomes enormous, and it takes a lot of time for transmission and a large storage capacity is required for storage. For this reason, it is common to reduce the amount of data by using high-efficiency coding when transmitting and storing images to eliminate image redundancy or to process the image in a visually permissible range. . The coding method that can completely reproduce the original image by decoding is called lossless coding, and the coding method that obtains a visually close image but cannot completely reproduce the original image is called lossy coding. In the case of lossy encoding, it is important to reduce the code amount by changing the portion where deterioration is not noticeable visually, but this largely depends on the characteristics of the image. There are various types of image data, even if it's just a bit.Natural images, characters, and lines that are created by shooting people, landscapes, etc. with silver salt photos, reading them with a scanner, or shooting them directly with a digital camera. There are character / line images in which information is rasterized, computer-generated 2D image data and CG images in which 3D shapes are rendered, etc., and each has a different required resolution and required number of gradations to obtain good playback image quality. Is said.
Generally, character images and line images are required to have higher resolution than natural images.
【0003】従来、高能率符号化の一手法としてウェー
ブレット変換を利用する方法が用いられている。従来方
式では、まず、離散ウェーブレット変換を用いて符号化
対象画像を複数の周波数帯域(サブバンド)に分割し、
次に,各サブバンドの変換係数をさまざまな方法で量子
化,エントロピー符号化して符号列を生成する。画像の
ウェーブレット変換の方法としては、図4(a),
(b),(c)にその過程を示すように1次元の変換処
理を水平、垂直方向にそれぞれに適用して4つのサブバ
ンドに分割する方法が用いられる。さらに、低周波サブ
バンド(LLサブバンド)のみを繰り返して分割する方
法が一般的である。図5に1次元の変換を2回繰り返し
て行った場合の例を示す。Conventionally, a method utilizing wavelet transform has been used as one method of high efficiency coding. In the conventional method, first, an image to be coded is divided into a plurality of frequency bands (subbands) by using the discrete wavelet transform,
Next, the transform coefficients of each subband are quantized and entropy coded by various methods to generate a code string. As a method of wavelet transform of an image, as shown in FIG.
As shown in (b) and (c), a method of applying one-dimensional conversion processing in the horizontal and vertical directions to divide into four subbands is used. Furthermore, a method of repeatedly dividing only the low frequency subband (LL subband) is common. FIG. 5 shows an example in which the one-dimensional conversion is repeated twice.
【0004】ウェーブレット変換を用いた画像符号化の
利点の一つとして、空間解像度の段階的復号の実現が容
易であるということが挙げられる。図5のようにウェー
ブレット変換を施し、低周波サブバンドLLから高周波
サブバンドHH1へと順々に各サブバンドの係数を符号
化・伝送した場合、復号側ではLLサブバンドの係数を
受信した段階で1/4の解像度の復元画像を、また、L
L,LH1,HL1,HH1を受信した段階で1/2の
解像度の復元画像を、さらにLH2,HL2,HH2ま
でを受信した場合には元の解像度の復元画像をといった
具合に、徐々に解像度を上げて画像を復号することがで
きる。One of the advantages of the image coding using the wavelet transform is that it is easy to realize the stepwise decoding of the spatial resolution. When the wavelet transform is performed as shown in FIG. 5 and the coefficients of the respective subbands are sequentially encoded and transmitted from the low frequency subband LL to the high frequency subband HH1, the decoding side receives the coefficients of the LL subband. To restore a 1/4 resolution image,
When the L, LH1, HL1, and HH1 are received, the restored image with a resolution of 1/2 is received, and when LH2, HL2, and HH2 are received, the restored image with the original resolution is gradually displayed. You can raise and decode the image.
【0005】文字・写真の混在画像に見られるように、
画像中に必要解像度の異なる部分が混在する場合に、ウ
ェーブレット変換の空間解像度の段階性を利用して必要
な部分だけ高解像度を復号するために必要なデータを符
号化し、高解像度の必要ない領域については高解像度を
復号するために必要なデータを破棄するといった方法が
用いられている。As seen in a mixed image of characters and photographs,
When parts with different required resolutions are mixed in the image, the data required for decoding the high resolution only for the required part is encoded by using the spatial resolution of the wavelet transform. For, the method of discarding the data necessary for decoding the high resolution is used.
【0006】[0006]
【発明が解決しようとする課題】しかしながら、上述し
た様な従来型の高能率符号化方法では、自然画像、文字
・線画像の混在画像など、必要解像度の異なる領域を含
む画像データを符号化する際には、一旦、高い解像度で
画像データを読み込まなければならず、効率の良い符号
化方式とは言えなかった。However, in the conventional high-efficiency encoding method as described above, image data including areas having different required resolutions such as natural images and mixed images of character / line images are encoded. In that case, the image data had to be read once with a high resolution, which was not an efficient encoding method.
【0007】本発明は以上の問題に鑑みて成されたもの
であり、異なる解像度レベルを必要とする領域を含む画
像データを符号化する場合に、効率の良い画像符号化を
行うことを目的とする。The present invention has been made in view of the above problems, and an object of the present invention is to perform efficient image encoding when encoding image data including areas requiring different resolution levels. To do.
【0008】又、符号化を行った画像データを復号する
際に、注目解像度領域を早期に特定可能な符号列を生成
する符号化を行うことを目的とする。It is another object of the present invention to perform coding for generating a code string that can specify a resolution area of interest at an early stage when decoding coded image data.
【0009】[0009]
【課題を解決するための手段】本発明の目的を達成する
ために、例えば本発明の画像符号化装置は以下の構成を
備える。In order to achieve the object of the present invention, for example, an image coding apparatus of the present invention has the following configuration.
【0010】すなわち、画像を符号化する画像符号化装
置であって、原画像の第1の領域を第1の解像度で読み
込み、読み込んだ領域を含む第1の画像を生成する第1
の読み込み手段と、前記原画像において、前記第1の解
像度よりも高い第2の解像度で、前記第1の領域とは異
なる第2の領域を読み込み、読み込んだ領域を含む第2
の画像を生成する第2の読み込み手段と、前記第2の画
像に対して周波数変換を行い、サブバンド毎の係数を得
る第1の周波数変換手段と、前記第1の周波数変換手段
による複数のサブバンドのうち所定のサブバンドに前記
第1の画像を合成し、合成サブバンドを生成する合成手
段と、前記合成サブバンドに対して更に周波数変換を行
い、サブバンド毎の係数を得る第2の周波数変換手段
と、前記第1の周波数変換手段、及び第2の周波数変換
手段により得られたサブバンドの係数から、符号列を生
成する符号列生成手段とを備える。That is, an image coding apparatus for coding an image, wherein a first area of an original image is read at a first resolution and a first image including the read area is generated.
Reading means and a second area including a read area in the original image at a second resolution higher than the first resolution and different from the first area.
Second reading means for generating an image of the first image, a first frequency converting means for performing frequency conversion on the second image to obtain a coefficient for each sub-band, and a plurality of the first frequency converting means. A synthesizing unit for synthesizing the first image in a predetermined subband of the subbands to generate a synthetic subband, and second frequency conversion for the synthetic subband to obtain a coefficient for each subband. And a code string generating means for generating a code string from the coefficients of the sub-bands obtained by the first frequency converting means and the second frequency converting means.
【0011】更に、前記第2の読み込み手段が読み込む
領域を指定するフラグを生成するフラグ生成手段を備え
る。Further, it is provided with a flag generating means for generating a flag designating an area to be read by the second reading means.
【0012】一方、更に、前記第1の画像において、所
定の領域を示すフラグを生成するフラグ生成手段を備え
る。On the other hand, the first image further comprises a flag generating means for generating a flag indicating a predetermined area.
【0013】この場合、前記符号列生成手段が前記合成
サブバンドに対して周波数変換を行った際に生成される
サブバンドを構成する係数のうち、前記第2の画像に関
連する係数を示すマスクを生成するマスク生成手段を更
に備える。In this case, a mask indicating a coefficient associated with the second image among the coefficients forming the subband generated when the code string generating means frequency-converts the combined subband. It further comprises a mask generating means for generating.
【0014】[0014]
【発明の実施の形態】以下添付図面を参照して、本発明
を好適な実施形態に従って詳細に説明する。BEST MODE FOR CARRYING OUT THE INVENTION The present invention will now be described in detail according to preferred embodiments with reference to the accompanying drawings.
【0015】[第1の実施形態]図1に本実施形態にお
ける画像符号化装置の機能構成を示す。同図に於いて1
01は高解像度領域情報入力部、102は高解像度スキ
ャン領域決定部、103は高解像度画像入力部、104
は低解像度画像入力部、105は離散ウェーブレット変
換部、106は係数合成部、107は離散ウェーブレッ
ト変換部、108はビットプレーン符号化部、109は
符号列形成部、109は符号出力部である。[First Embodiment] FIG. 1 shows the functional arrangement of an image coding apparatus according to this embodiment. 1 in the figure
Reference numeral 01 is a high resolution area information input unit, 102 is a high resolution scan area determination unit, 103 is a high resolution image input unit, and 104.
Is a low-resolution image input unit, 105 is a discrete wavelet transform unit, 106 is a coefficient synthesis unit, 107 is a discrete wavelet transform unit, 108 is a bit plane coding unit, 109 is a code string formation unit, and 109 is a code output unit.
【0016】又、図10に本実施形態における画像符号
化装置の基本構成を示す。Further, FIG. 10 shows the basic configuration of the image coding apparatus in this embodiment.
【0017】1001はCPUで、RAM1002やR
OM1003に格納されたプログラムやデータを用いて
本装置全体の制御を行うと共に、後述の符号化処理を行
う。Reference numeral 1001 is a CPU, which is a RAM 1002 or R
The program and data stored in the OM 1003 are used to control the entire apparatus and also to perform encoding processing described later.
【0018】1002はRAMで、外部記憶装置100
4や記憶媒体ドライブ1010からロードされたプログ
ラムやデータ、処理対象のデータなどを一時的に記憶し
ておくエリアを備えると共に、CPU1001が処理を
行う際に用いるワークエリアも備える。A RAM 1002 is an external storage device 100.
4 and a storage medium drive 1010, a program area, a data area, a processing target data area, and the like are temporarily stored, and a work area used by the CPU 1001 for processing is also provided.
【0019】1003はROMで、装置全体の制御を行
うプログラムやデータを格納する。A ROM 1003 stores programs and data for controlling the entire apparatus.
【0020】1004はハードディスクなどの外部記憶
装置で、記憶媒体ドライブ1010から読み込まれたプ
ログラムやデータなどをファイルの形式で保存する。ま
た、CPU1001が処理を実行する際に用いるワーク
エリアのサイズがRAM1002に設けられなくなった
場合に、ファイルとして提供することもできる。An external storage device 1004, such as a hard disk, stores programs and data read from the storage medium drive 1010 in a file format. Further, when the size of the work area used when the CPU 1001 executes the processing is no longer provided in the RAM 1002, it can be provided as a file.
【0021】1005、1006は夫々キーボード、マ
ウスで、各種の指示を本装置に入力することができる。Reference numerals 1005 and 1006 denote a keyboard and a mouse, respectively, which can input various instructions to the apparatus.
【0022】1007は表示装置で、CRTや液晶画面
などにより構成されており、画像や文字などを表示する
ことができる。A display device 1007 is composed of a CRT, a liquid crystal screen, etc., and can display images and characters.
【0023】1008は画像入力装置で、ディジタルカ
メラやスキャナ等により構成されており、画像をデータ
として入力することができる。また、入力する画像に対
する処理(γ補正や色補正など)を行う回路などもこれ
に含まれる。An image input device 1008 is composed of a digital camera, a scanner or the like, and can input an image as data. Further, a circuit for performing processing (γ correction, color correction, etc.) on an input image is also included in this.
【0024】1009は記憶媒体ドライブで、CD−R
OMやDVDなどの記憶媒体からプログラムやデータな
どを読み込むドライブで、読み込んだプログラムやデー
タは外部記憶装置1004やRAM1002に出力され
る。A storage medium drive 1009 is a CD-R.
A drive that reads programs and data from a storage medium such as an OM and a DVD outputs the read programs and data to the external storage device 1004 and the RAM 1002.
【0025】1010は上述の各部を繋ぐバスである。A bus 1010 connects the above-mentioned units.
【0026】又上述の通り、本実施形態の画像符号化装
置は図10に示す基本構成を備えるが、図1に示した機
能構成を有するプログラムを記憶媒体ドライブ100
9,もしくは外部記憶装置1004等から読み込み、C
PU1001により実行することで、本画像符号化装置
を図1に示す構成を備える装置としても良い。As described above, the image coding apparatus of this embodiment has the basic structure shown in FIG. 10, but the program having the functional structure shown in FIG.
9, or read from the external storage device 1004, C
By being executed by the PU 1001, the present image coding device may be a device having the configuration shown in FIG.
【0027】本実施形態では白黒原稿を、各画素の輝度
値を8ビットで表現した画像データとして読み取り、符
号化するものとして説明する。しかしながらこれに限ら
ず、4ビット、10ビット、12ビットなど8ビット以
外のビット数で輝度値を表現する画像データとして読み
取って符号化する場合にも適用できる。また各画素をR
GB、CMYKなどの複数の色成分或いはYCrCb等
の輝度と色度/色差成分で表現するカラー画像データと
して読み取る場合にも適用できる。この場合にはカラー
画像データ中の各成分がモノクロ画像データであると見
なせば良い。In the present embodiment, a black-and-white original will be described as being read and encoded as image data in which the brightness value of each pixel is represented by 8 bits. However, the present invention is not limited to this, and can also be applied to the case of reading and encoding as image data expressing a luminance value with a bit number other than 8 bits such as 4 bits, 10 bits, 12 bits. In addition, each pixel is R
It can also be applied to the case of reading as color image data represented by a plurality of color components such as GB and CMYK or luminance and chromaticity / color difference components such as YCrCb. In this case, each component in the color image data may be regarded as monochrome image data.
【0028】以下、図1、図10を参照して、本実施形
態における各部の機能とその動作について説明する。本
実施形態では符号化対象となる白黒原稿を所定の解像度
で読み取り、符号化するものであるが、その一部分だけ
を水平・垂直方向ともに倍の解像度で読み取るものであ
る。以降、所定の解像度を低解像度、水平・垂直方向と
もにこれを倍にした解像度を高解像度と呼ぶ。白黒原稿
の大きさは固定であるものとし、原稿全体を高解像度で
読み取った場合の画像サイズをX,Yとして表す。ま
た、X,Yともに4の倍数とする。The function and operation of each unit in this embodiment will be described below with reference to FIGS. 1 and 10. In the present embodiment, a black-and-white original to be encoded is read at a predetermined resolution and encoded, but only a part thereof is read at double the resolution in both the horizontal and vertical directions. Hereinafter, the predetermined resolution will be referred to as low resolution, and the resolution obtained by doubling the predetermined resolution will be referred to as high resolution. It is assumed that the size of the black and white original is fixed, and the image size when the entire original is read at high resolution is represented as X and Y. Both X and Y are multiples of 4.
【0029】まず、高解像度領域情報入力部101から
原稿のどの部分を高解像度で読み取るかを指定する高解
像度領域情報が入力される。本実施形態では高解像度で
読み取る領域は矩形とする。また、高解像度領域情報は
高解像度で読み取った場合の画像サイズを基準とした左
上隅画素位置(Ulx,Uly)と右下隅画素位置(L
Rx,LRy)により特定される。図2に原稿と高解像
度領域情報の例を示す。First, the high resolution area information input section 101 inputs high resolution area information for specifying which part of the document is to be read at high resolution. In this embodiment, the area to be read at high resolution is rectangular. In addition, the high resolution area information includes the pixel position at the upper left corner (Ulx, Uly) and the pixel position at the lower right corner (L) based on the image size when reading at high resolution.
Rx, LRy). FIG. 2 shows an example of a document and high resolution area information.
【0030】高解像度スキャン領域決定部102は、高
解像度領域情報入力部101から入力される高解像度領
域の左上隅画素位置と右下隅画素位置から実際に高解像
度で読み取る画素位置を指定する解像度フラグF(x,
y)を生成する。生成した解像度フラグF(x、y)は
RAM1002内に一時的に記憶される。実際に高解像
度で読み取る画素位置については解像度フラグF(x,
y)を1に設定し、それ以外は0とする。具体的には、
とする。図7に図2のように高解像度領域情報を指定し
た場合の解像度フラグF(x,y)の例を示す。The high resolution scan area determination unit 102 specifies a pixel position to be actually read in high resolution from the upper left corner pixel position and the lower right corner pixel position of the high resolution area input from the high resolution area information input unit 101. F (x,
y) is generated. The generated resolution flag F (x, y) is temporarily stored in the RAM 1002. Regarding the pixel position that is actually read in high resolution, the resolution flag F (x,
y) is set to 1 and 0 otherwise. In particular, And FIG. 7 shows an example of the resolution flag F (x, y) when the high resolution area information is designated as shown in FIG.
【0031】高解像度スキャン領域決定部102により
高解像度で読み取る領域が決定されると、解像度フラグ
F(x,y)に基づき、高解像度画像入力部103およ
び低解像度画像入力部104により高解像度部分、低解
像度部分の画像読み込みが行われる。実際には高解像度
画像入力部103、低解像度画像入力部104に同じ原
稿の画像が入力され、夫々の入力部103,104で高
解像度部分、低解像度部分が読み込まれる。When the high resolution scan area determining unit 102 determines the area to be read at high resolution, the high resolution image input unit 103 and the low resolution image input unit 104 determine the high resolution area based on the resolution flag F (x, y). , The low-resolution image is read. Actually, the image of the same document is input to the high resolution image input unit 103 and the low resolution image input unit 104, and the high resolution portion and the low resolution portion are read by the respective input units 103 and 104.
【0032】高解像度画像入力部103は解像度フラグ
F(x,y)=1の部分についてのみ、白黒原稿から画
素データを読み込み、高解像度画像データPh(x,
y)をRAM1002内に形成する。解像度フラグF
(x,y)=0である位置についてはPh(x,y)=
0として実際の読み込み動作は行わない。The high-resolution image input unit 103 reads pixel data from a black-and-white document only for the portion of the resolution flag F (x, y) = 1, and the high-resolution image data Ph (x,
y) is formed in the RAM 1002. Resolution flag F
For a position where (x, y) = 0, Ph (x, y) =
When 0 is set, the actual read operation is not performed.
【0033】離散ウェーブレット変換部105は高解像
度画像入力部103から入力される高解像度画像データ
の各画素データPh(x,y)をRAM1002に適宜
格納しながら2次元の離散ウェーブレット変換を施し、
LL,LH,HL,HHの4つのサブバンドに分解す
る。そして各サブバンドの係数を再度RAM1002内
であって、画像データPh(x、y)が格納されている
エリアとは別のエリアに出力する。以降、各サブバンド
の係数をC(S,x,y)と表す。Sはサブバンドを表
し、LL,LH,HL,HHのいずれかである。また、
x,yは各サブバンド内の左上隅の係数位置を(0,
0)とした場合の、水平方向および垂直方向の係数位置
を表す。The discrete wavelet transform unit 105 performs two-dimensional discrete wavelet transform while appropriately storing each pixel data Ph (x, y) of the high resolution image data input from the high resolution image input unit 103 in the RAM 1002.
It is decomposed into four subbands LL, LH, HL, and HH. Then, the coefficient of each subband is output again to the RAM 1002 in an area different from the area in which the image data Ph (x, y) is stored. Hereinafter, the coefficient of each subband is represented as C (S, x, y). S represents a subband and is any one of LL, LH, HL, and HH. Also,
x, y is the coefficient position of the upper left corner in each subband (0,
0) represents the coefficient positions in the horizontal direction and the vertical direction.
【0034】2次元離散ウェーブレット変換は、1次元
の変換(フィルタ処理)を水平・垂直方向それぞれに適
用することにより実現する。図4に2次元離散ウェーブ
レット変換処理を示す。同図より2次元離散ウェーブレ
ット変換は、まず符号化対象画像(図4(a))に対し
て、垂直方向に1次元の離散ウェーブレット変換を適用
し、低周波サブバンドLと高周波サブバンドHに分解す
る(図4(b))。さらに、それぞれに水平方向の1次
元離散ウェーブレット変換を適用することにより、L
L,HL,LH,HHの4つのサブバンドに分解する
(図4(c))。本画像符号化装置では、N個の1次元
信号x(n)(nは0からN−1とする)に対する1次
元離散ウェーブレット変換は以下の式により行われるも
のとする。The two-dimensional discrete wavelet transform is realized by applying a one-dimensional transform (filter process) to each of the horizontal and vertical directions. FIG. 4 shows the two-dimensional discrete wavelet transform process. From the figure, in the two-dimensional discrete wavelet transform, first, the one-dimensional discrete wavelet transform in the vertical direction is applied to the image to be encoded (FIG. 4A), and the low frequency subband L and the high frequency subband H are applied. Disassemble (FIG. 4 (b)). Further, by applying a horizontal one-dimensional discrete wavelet transform to each of them, L
It is decomposed into four subbands of L, HL, LH, and HH (FIG. 4 (c)). In this image coding apparatus, the one-dimensional discrete wavelet transform for N one-dimensional signals x (n) (n is 0 to N-1) is performed by the following equation.
【0035】
h(n)=x(2n)−x(2n+1) (1)
l(n)=floor{(x(2n)+x(2n+1))/2} (2)
ここで、h(n)は高周波サブバンドの係数、l(n)
は低周波サブバンドの係数を表す。また、floor
{R}は実数Rを超えない最大の整数値を得る関数とす
る。H (n) = x (2n) −x (2n + 1) (1) l (n) = floor {(x (2n) + x (2n + 1)) / 2} (2) where h (n) Is the coefficient of the high frequency subband, l (n)
Represents the coefficient of the low frequency subband. Also, floor
Let {R} be a function that obtains the maximum integer value that does not exceed the real number R.
【0036】一方、低解像度画像入力部104は高解像
度スキャン領域決定部102で生成する解像度フラグを
参照し、F(x,y)=0である画素について低解像度
で画像データを読み込み、低解像度画像Pl(lx,l
y)をRAM1002内(高解像度画像データPh
(x、y)が記憶されているエリアとは別のエリア)に
形成する。ここでlxは0〜(X/2−1)、lyは0
〜(Y/2−1)までである。低解像度画像の一つの画
素Pl(lx,ly)に、対応する4つのフラグF(l
x×2,ly×2),F(lx×2+1,ly×2),
F(lx×2,ly×2+1),F(lx×2+1,l
y×2+1)を設ける。高解像度領域の4隅の座標値が
偶数であることから、これら4つのフラグは全て同じ値
を取るので、F(lx×2,ly×2)を読み込みの要
否を判断する指標として用いる。解像度フラグF(lx
×2,ly×2)=1であるlx,lyについてはPl
(lx,ly)=0として実際の読み込み動作は行わな
い。On the other hand, the low resolution image input unit 104 refers to the resolution flag generated by the high resolution scan area determination unit 102, reads the image data at a low resolution for the pixel of F (x, y) = 0, and the low resolution Image Pl (lx, l
y) in the RAM 1002 (high resolution image data Ph
It is formed in an area different from the area in which (x, y) is stored. Here, lx is 0 to (X / 2-1) and ly is 0.
To (Y / 2-1). Four flags F (l corresponding to one pixel Pl (lx, ly) of the low resolution image
x × 2, ly × 2), F (lx × 2 + 1, ly × 2),
F (lx × 2, ly × 2 + 1), F (lx × 2 + 1, l
y × 2 + 1) is provided. Since the coordinate values of the four corners of the high-resolution area are even, these four flags all have the same value, and therefore F (lx × 2, ly × 2) is used as an index for determining the necessity of reading. Resolution flag F (lx
Pl for lx and ly with x2, lyx2) = 1
When (lx, ly) = 0, the actual read operation is not performed.
【0037】低解像度画像入力部104における低解像
度画像入力と、離散ウェーブレット変換部105におけ
る高解像度画像のサブバンド分解が終了すると、係数合
成部106は高解像度スキャン領域決定部102の生成
する解像度フラグF(x,y)を参照して、離散ウェー
ブレット変換部105の生成する低周波サブバンドC
(LL,x,y)と低解像度画像Pl(lx,ly)と
の合成を行う。低周波サブバンドC(LL,x,y)は
低解像度画像Pl(lx,ly)と同じ大きさ(水平、
垂直方向のサイズがX/2,Y/2)であるので、サブ
バンド内の係数位置を表す変数をx,yからlx,ly
に置き変えて、係数合成部106での合成処理について
説明する。When the low-resolution image input in the low-resolution image input unit 104 and the sub-band decomposition of the high-resolution image in the discrete wavelet transform unit 105 are completed, the coefficient synthesizing unit 106 produces a resolution flag generated by the high-resolution scan area determining unit 102. The low-frequency subband C generated by the discrete wavelet transform unit 105 with reference to F (x, y)
(LL, x, y) and the low resolution image Pl (lx, ly) are combined. The low-frequency subband C (LL, x, y) has the same size (horizontal, horizontal) as the low-resolution image Pl (lx, ly).
Since the size in the vertical direction is X / 2, Y / 2), variables representing the coefficient position in the subband are changed from x, y to lx, ly.
Instead, the combining process in the coefficient combining unit 106 will be described.
【0038】係数合成部106はC(LL,lx,l
y)の全ての係数についてラスタースキャン順に解像度
フラグF(lx×2,ly×2)を調べ、F(lx×
2,ly×2)=0であればC(LL,lx,ly)を
Pl(lx,ly)に置き換える。このようにしてC
(LL,lx,ly)の全ての係数についてこの置き換
え処理を行うと、C(LL,lx,ly)内で、低解像
度画像の部分に相当する係数を低解像度画像Pl(x、
y)に置き換えることができる。The coefficient synthesizing unit 106 uses C (LL, lx, l
The resolution flag F (lx × 2, ly × 2) is checked for all the coefficients in y) in raster scan order, and F (lx ×
If 2, ly × 2) = 0, C (LL, lx, ly) is replaced with Pl (lx, ly). In this way C
When this replacement processing is performed for all the coefficients of (LL, lx, ly), the coefficient corresponding to the low-resolution image portion in C (LL, lx, ly) is converted into the low-resolution image Pl (x, ly).
y) can be replaced.
【0039】離散ウェーブレット変換部107は係数合
成部106によりC(LL,lx,ly)とPl(l
x,ly)を合成して得られた新しいC(LL,lx,
ly)を離散ウェーブレット変換部105と同様の処理
により4つのサブバンドに分解する。図5に離散ウェー
ブレット変換部107により合成後のLLサブバンドを
さらに4つのサブバンドに分解した様子を示す。同図に
おいて、離散ウェーブレット変換部105により生成さ
れたLH,HL,HHサブバンドについてはそれぞれL
H2,HL2,HH2として示し、離散ウェーブレット
変換部107で生成したLH,HL,HHサブバンドに
ついてはそれぞれLH1,HL1,HH1として区別し
て示した。なお、図5のLLは図4(c)のLLサブバ
ンドに低解像度画像を合成後、再分解したものであり、
同一のものではない。In the discrete wavelet transform unit 107, the coefficient synthesizing unit 106 causes C (LL, lx, ly) and Pl (l
x, ly) to obtain a new C (LL, lx,
ly) is decomposed into four subbands by the same processing as that of the discrete wavelet transform unit 105. FIG. 5 shows a state in which the LL subband after synthesis is further decomposed into four subbands by the discrete wavelet transform unit 107. In the figure, the LH, HL, and HH subbands generated by the discrete wavelet transform unit 105 are respectively L
It is shown as H2, HL2, and HH2, and the LH, HL, and HH subbands generated by the discrete wavelet transform unit 107 are separately shown as LH1, HL1, and HH1. Note that the LL in FIG. 5 is obtained by combining the LL subband in FIG. 4C with the low-resolution image and then re-decomposing it.
Not the same.
【0040】ビットプレーン符号化部108は、離散ウ
ェーブレット変換部105、係数合成部106、離散ウ
ェーブレット変換部107を経て生成されたLL,LH
1,HL1,HH1,LH2,HL2,HH2の7つの
サブバンドの係数値C(S,x,y)を符号化し、符号
列を生成する。各サブバンドの係数をブロック分割し、
別々に符号化することによりランダムアクセスを容易に
する方法などが知られているが、ここでは説明を簡単に
するためにサブバンド単位に符号化する。各サブバンド
の係数値C(S,x,y)の符号化は、サブバンド内の
係数値C(S,x,y)の絶対値を自然2進数で表現
し、上位の桁から下位の桁へとビットプレーン方向を優
先して2値算術符号化することにより行われる。各サブ
バンドの係数値C(S,x,y)を自然2進表記した場
合の下からn桁目のビットをCn(S,x,y)と表記
して説明する。なお、2進数の桁を表す変数nをビット
プレーン番号と呼ぶこととし、ビットプレーン番号nは
LSBを0桁目とする。The bit plane coding unit 108 has the LL and LH generated through the discrete wavelet transform unit 105, the coefficient synthesizing unit 106, and the discrete wavelet transform unit 107.
1, HL1, HH1, LH2, HL2, HH2 are coded for the coefficient values C (S, x, y) of the seven subbands to generate a code string. Divide the coefficient of each subband into blocks,
Although a method of facilitating random access by separately encoding is known, here, encoding is performed in subband units to simplify the description. Coding of the coefficient value C (S, x, y) of each subband expresses the absolute value of the coefficient value C (S, x, y) in the subband by a natural binary number, and the upper digit to the lower digit. It is performed by performing binary arithmetic coding on the digits in the bit plane direction. When the coefficient value C (S, x, y) of each subband is expressed in natural binary, the nth digit bit from the bottom is described as Cn (S, x, y). The variable n representing the binary digit is called a bit plane number, and the bit plane number n has the LSB as the 0th digit.
【0041】図6はビットプレーン符号化部108でサ
ブバンドSを符号化する処理の流れを示したフローチャ
ートである。FIG. 6 is a flowchart showing the flow of processing for encoding the subband S in the bit plane encoding unit 108.
【0042】ステップS601はサブバンドS内の係数
の絶対値の最大値Mabs(S)を求めるステップ、ス
テップS602はサブバンド内の係数の絶対値を表すの
に必要な有効桁数NBP(S)を求めるステップ、ステ
ップS603は変数nに有効桁数を代入するステップ、
ステップS604は(n−1)を求めてnに代入するス
テップ、ステップS605はn桁目のビットプレーンを
符号化するステップ、ステップS606はnが0である
か否かを判定するステップである。Step S601 is a step for obtaining the maximum value Mabs (S) of the absolute values of the coefficients in the subband S, and step S602 is the number of significant digits N BP (S) required to represent the absolute value of the coefficients in the subband. ), Step S603 is a step of substituting the number of significant digits for the variable n,
Step S604 is a step of obtaining (n-1) and substituting it into n, step S605 is a step of encoding the bit plane of the n-th digit, and step S606 is a step of determining whether or not n is 0.
【0043】図6を用いてビットプレーン符号化部10
8におけるサブバンドSの符号化処理の流れについて説
明する。The bit plane coding unit 10 will be described with reference to FIG.
The flow of the subband S encoding process in No. 8 will be described.
【0044】まず、ステップS601で符号化対象とな
るサブバンドS内の係数の絶対値を調べ、その最大値M
abs(S)を求める。次にステップS602ではMa
bs(S)を2進数で表現するのに必要となる桁数N
BP(S)を以下の式により求める。First, in step S601, the absolute value of the coefficient in the subband S to be coded is checked, and its maximum value M
Calculate abs (S). Next, in step S602, Ma
Number of digits N required to represent bs (S) in binary number
BP (S) is calculated by the following formula.
【0045】NBP(S)=ceil{log2(Ma
bs(S))}
ここで、ceil{R}は実数Rに等しいか、あるいは
それ以上の最小の整数値を表す。ステップS603では
ビットプレーン番号nに有効桁数NBP(S)を代入す
る。ステップS604ではビットプレーン番号nから1
を引く。ステップS605ではビットプレーンnを2値
算術符号を用いて符号化する。本実施形態においては算
術符号としてQM−Coderを用いることとする。こ
のQM−Coderを用いて、ある状態(コンテクス
ト)で発生した2値シンボルを符号化する手順、或い
は、算術符号化処理のための初期化手順、終端手順につ
いては、静止画像の国際標準ITU-T Recommendation T.
81 | ISO/IEC10918-1勧告等に詳細に説明されているの
でここでは説明を省略する。また、説明を簡単にするた
め、本実施形態では単一のコンテクストで各ビットを算
術符号化するものとする。各ビットプレーンの符号化の
開始時にはビットプレーン符号化部108内の算術符号
化器を初期化し、終了時に算術符号化器の終端処理を行
う。また、個々の係数について最初に符号化される’
1’の直後に、その係数の正負符号を0、1で表し、算
術符号化する。ここでは正ならば0、負ならば1とす
る。N BP (S) = ceil {log2 (Ma
bs (S))} where ceil {R} represents the smallest integer value equal to or greater than the real number R. In step S603, the number of significant digits N BP (S) is substituted for the bit plane number n. In step S604, the bit plane number n is 1
pull. In step S605, the bit plane n is encoded using the binary arithmetic code. In this embodiment, QM-Coder is used as the arithmetic code. Regarding the procedure of coding a binary symbol generated in a certain state (context) using this QM-Coder, or the initialization procedure and termination procedure for arithmetic coding processing, the international standard ITU- T Recommendation T.
81 | ISO / IEC 10918-1 Recommendation etc. have been explained in detail, so the explanation is omitted here. Further, in order to simplify the explanation, in the present embodiment, each bit is arithmetically encoded with a single context. At the start of encoding each bit plane, the arithmetic encoder in the bit plane encoding unit 108 is initialized, and at the end, the termination processing of the arithmetic encoder is performed. Also, each coefficient is first coded '
Immediately after 1 ', the positive / negative sign of the coefficient is represented by 0, 1 and arithmetically coded. Here, 0 is set for positive and 1 for negative.
【0046】例えば、係数が−5で、この係数の属する
サブバンドSの有効桁数NBP(S)が6であった場
合、係数の絶対値は2進数000101で表され、各ビ
ットプレーンの符号化により上位桁から下位桁へと符号
化される。2番目のビットプレーンの符号化時(この場
合、上から4桁目)に最初の’1’が符号化され、この
直後に正負符号’1’を算術符号化する。For example, when the coefficient is -5 and the number of significant digits N BP (S) of the sub-band S to which this coefficient belongs is 6, the absolute value of the coefficient is represented by the binary number 00001, and the absolute value of each bit plane is Encoding is performed from the upper digit to the lower digit. At the time of encoding the second bit plane (in this case, the fourth digit from the top), the first "1" is encoded, and immediately thereafter, the positive / negative code "1" is arithmetically encoded.
【0047】ステップS606では、ビットプレーン番
号nを0と比較し、n=0即ち、ステップS605でL
SBプレーンの符号化を行なった場合には、サブバンド
の符号化処理を終了し、それ以外の場合にはステップS
604に処理を移す。In step S606, the bit plane number n is compared with 0, and n = 0, that is, in step S605 L
If the SB plane has been encoded, the subband encoding process is terminated, and otherwise, step S
The processing is moved to 604.
【0048】上述の処理により、サブバンドsの全係数
を符号化し、各ビットプレーンnに対応する符号列CS
(S,n)を生成する。生成した符号列は符号列形成部
109に送られ、RAM1002内に一時的に格納され
る。By the above-mentioned processing, all the coefficients of the subband s are coded, and the code string CS corresponding to each bit plane n is coded.
Generate (S, n). The generated code string is sent to the code string forming unit 109 and temporarily stored in the RAM 1002.
【0049】ビットプレーン符号化部108により全サ
ブバンドの係数の符号化が終了し、全符号列がRAM1
002に格納されると、符号列形成部109は所定の順
序でRAM1002に格納される符号列を読み出し、必
要な付加情報を挿入して、本符号化装置の出力となる最
終的な符号列を形成し、符号出力部110に出力する。The bit plane coding unit 108 finishes coding the coefficients of all subbands, and all code strings are stored in the RAM1.
After being stored in 002, the code string forming unit 109 reads out the code string stored in the RAM 1002 in a predetermined order, inserts necessary additional information, and outputs a final code string to be the output of the present encoding apparatus. It is formed and output to the code output unit 110.
【0050】符号列形成部109で生成される最終的な
符号列はヘッダと、レベル0、レベル1、およびレベル
2の3つに階層化された符号化データにより構成され
る。レベル0の符号化データはLLサブバンドの係数を
符号化して得られるCS(LL,NBP(LL)−1)
からCS(LL,0)の符号列から構成される。レベル
1はLH1,HL1,HH1の各サブバンドの係数を符
号化して得られる符号列CS(LH1,NBP(LH
1)−1)〜CS(LH1,0)、CS(HL1,N
BP(HL1)−1)〜CS(HL1,0)、および、
CS(HH1,NBP(HH1)−1)〜CS(HH
1,0)から構成される。また、レベル2はLH2,H
L2,HH2の各サブバンドの係数を符号化して得られ
る符号列CS(LH2,NBP(LH2)−1)〜CS
(LH2,0)、CS(HL2,NBP(HL2)−
1)〜CS(HL2,0)、および、CS(HH2,N
BP(HH2)−1)〜CS(HH2,0)から構成さ
れる。図3に符号列形成部109により生成される符号
列の構造を示す。The final code string generated by the code string forming unit 109 is composed of a header and coded data hierarchically divided into three levels 0, 1, and 2. The coded data of level 0 is CS (LL, NBP (LL) -1) obtained by coding the coefficients of the LL subband.
To CS (LL, 0). Level 1 is a code sequence CS (LH1, N BP (LH) obtained by encoding the coefficients of each subband of LH1, HL1, and HH1.
1) -1) to CS (LH1,0), CS (HL1, N)
BP (HL1) -1) to CS (HL1,0), and
CS (HH1, N BP (HH1) -1) to CS (HH
1, 0). Level 2 is LH2, H
Code strings CS (LH2, N BP (LH2) -1) to CS obtained by coding the coefficients of the subbands of L2 and HH2
(LH2,0), CS (HL2, N BP (HL2) -
1) to CS (HL2,0) and CS (HH2, N
It is composed of BP (HH2) -1) to CS (HH2,0). FIG. 3 shows the structure of the code string generated by the code string forming unit 109.
【0051】符号出力部110は符号列形成部109で
生成された符号列を装置外部へと出力する。この符号出
力部110は、例えば、外部記憶装置1004やRAM
1002といった記憶装置や、新たにネットワーク回線
のインターフェースを画像符号化装置に設けた場合、こ
のインターフェース等である。The code output unit 110 outputs the code string generated by the code string forming unit 109 to the outside of the device. The code output unit 110 is, for example, an external storage device 1004 or a RAM.
When a storage device such as 1002 or an interface for a network line is newly provided in the image encoding device, this is the interface.
【0052】以上に述べたように、画像データを高解像
度と低解像度に分けて取り込み、高解像度画像をサブバ
ンド分解して得られた低周波サブバンドに、低解像度画
像を合成して符号化することにより、必要な部分のみを
高解像度で読み込んで符号化することが可能となる。As described above, the image data is divided into the high resolution and the low resolution, and the low resolution sub-band obtained by sub-band decomposition of the high resolution image is combined with the low resolution image and encoded. By doing so, it becomes possible to read and encode only a necessary portion with high resolution.
【0053】[第2の実施形態]図8に本実施形態にお
ける画像符号化装置の機能構成を示す。尚、第1の実施
形態で用いた図1のと共通する部分については同じ符号
で示し、それらの説明を省略する。また、本実施形態に
おける画像符号化装置の基本構成は図10に示した構成
とする。[Second Embodiment] FIG. 8 shows the functional arrangement of an image coding apparatus according to this embodiment. It should be noted that parts common to those of FIG. 1 used in the first embodiment are denoted by the same reference numerals, and description thereof will be omitted. The basic configuration of the image coding apparatus according to this embodiment is the configuration shown in FIG.
【0054】図8図に於いて、801は低解像度画像入
力部、802は像域判定部、803は高解像度画像入力
部、804は係数合成部である。In FIG. 8, reference numeral 801 is a low resolution image input section, 802 is an image area determination section, 803 is a high resolution image input section, and 804 is a coefficient synthesis section.
【0055】本実施形態では第1の実施形態と同様に、
白黒原稿を各画素の輝度値を8ビットで表現した画像デ
ータとして読み取り、符号化するものとして説明する。
しかしながらこれに限らず、4ビット、10ビット、1
2ビットなど8ビット以外のビット数で輝度値を表現す
る画像データとして読み取って符号化する場合にも適用
できる。また各画素をRGB、CMYKなどの複数の色
成分或いはYCrCb等の輝度と色度/色差成分で表現
するカラー画像データとして読み取る場合にも適用でき
る。この場合にはカラー画像データ中の各成分がモノク
ロ画像データであると見なせば良い。本実施形態では第
1の実施形態と同様に、符号化対象となる白黒原稿を所
定の解像度で読み取り、符号化するものであるが、その
一部分だけを水平・垂直方向ともに倍の解像度で読み取
るものである。以降、所定の解像度を低解像度、水平・
垂直方向ともにこれを倍にした解像度を高解像度と呼
ぶ。白黒原稿の大きさは固定であるものとし、原稿全体
を高解像度で読み取った場合の画像サイズをX,Yとし
て表す。X,Yともに4の倍数とする。In this embodiment, as in the first embodiment,
The description will be made assuming that a black-and-white original is read and encoded as image data in which the brightness value of each pixel is represented by 8 bits.
However, not limited to this, 4 bits, 10 bits, 1
It can also be applied to the case of reading and encoding as image data expressing a luminance value with a bit number other than 8 bits such as 2 bits. It can also be applied to the case where each pixel is read as color image data represented by a plurality of color components such as RGB and CMYK or luminance and chromaticity / color difference components such as YCrCb. In this case, each component in the color image data may be regarded as monochrome image data. In the present embodiment, as in the first embodiment, a black-and-white original to be encoded is read and encoded at a predetermined resolution, but only a part of it is read at double the resolution in both the horizontal and vertical directions. Is. After that, the specified resolution is changed to low resolution, horizontal
The resolution obtained by doubling this in both the vertical direction is called high resolution. It is assumed that the size of the black and white original is fixed, and the image size when the entire original is read at high resolution is represented as X and Y. Both X and Y are multiples of 4.
【0056】以下、図8を用いて、本実施形態に係る画
像符号化装置の各部の機能とその動作について説明す
る。The function and operation of each section of the image coding apparatus according to this embodiment will be described below with reference to FIG.
【0057】まず、低解像度画像入力部801により、
符号化対象の白黒原稿全体を半分の解像度(例えば水
平、垂直方向共に1画素おきに読み込む)で読み込み、
Pl(lx,ly)を生成する。ここでlxは0〜(X
/2−1)、lyは0〜(Y/2−1)である。First, the low resolution image input unit 801
Read the entire black-and-white document to be encoded at half the resolution (for example, read every other pixel in both horizontal and vertical directions),
Pl (lx, ly) is generated. Where lx is 0- (X
/ 2-1) and ly are 0 to (Y / 2-1).
【0058】像域判定部802は低解像度画像入力部8
01より入力される低解像度画像Pl(lx,ly)か
ら文字・線画領域を検出し、解像度フラグFl(lx,
ly)を生成する。解像度フラグFl(lx,ly)は
低解像度画像Pl(lx,ly)の各画素が、文字・線
画領域と判断された部分に含まれるか否かを示し、Pl
(lx,ly)が文字・線画領域に含まれる場合には1
を、Pl(lx,ly)が文字・線画領域に含まれない
場合には0を設定する。本実施形態では像域判定部80
2における文字、線画領域判別の具体的な方法について
は問わない。The image area determination unit 802 is a low resolution image input unit 8
The character / line drawing area is detected from the low resolution image Pl (lx, ly) input from 01, and the resolution flag Fl (lx, ly) is detected.
ly) is generated. The resolution flag Fl (lx, ly) indicates whether or not each pixel of the low resolution image Pl (lx, ly) is included in the portion determined to be the character / line drawing area, and Pl
1 if (lx, ly) is included in the character / line drawing area
Is set to 0 when Pl (lx, ly) is not included in the character / line drawing area. In the present embodiment, the image area determination unit 80
The specific method of character / line drawing area discrimination in 2 is not limited.
【0059】高解像度画像入力部803は、像域判定部
802により生成される解像度フラグFl(lx,l
y)を参照して元の画像の解像度で白黒原稿を読み込
み、高解像度の画像データPh(x,y)を形成する。
解像度フラグFl(floor{x/2},floor
{y/2})=0である位置x,yについては実際の読
み込み動作は行わず、Ph(x,y)=0と設定する。
ここでxは0〜(X−1),yは0〜(Y−1)であ
る。The high resolution image input section 803 has a resolution flag Fl (lx, l) generated by the image area determination section 802.
y), a black-and-white original is read at the resolution of the original image to form high-resolution image data Ph (x, y).
Resolution flag Fl (floor {x / 2}, floor
For the positions x and y where {y / 2}) = 0, the actual reading operation is not performed, and Ph (x, y) = 0 is set.
Here, x is 0 to (X-1) and y is 0 to (Y-1).
【0060】離散ウェーブレット変換部105は高解像
度画像入力部803により入力される高解像度画像デー
タの各画素データPh(x,y)を、第1の実施形態と
同様にしてサブバンド分解し、各サブバンドの係数C
(S,x,y)(SはLL,LH,HL,HHの何れ
か)を生成する。The discrete wavelet transform unit 105 subband decomposes each pixel data Ph (x, y) of the high resolution image data input by the high resolution image input unit 803 into subbands in the same manner as in the first embodiment. Subband coefficient C
(S, x, y) (S is any of LL, LH, HL, HH) is generated.
【0061】離散ウェーブレット変換部105における
高解像度画像のサブバンド分解が終了すると、係数合成
部804は像域判定部802の生成する解像度フラグF
l(lx,ly)を参照して、離散ウェーブレット変換
部105の生成する低周波サブバンドC(LL,x,
y)と低解像度画像Pl(lx,ly)の合成を行う。
低周波サブバンドC(LL,x,y)は低解像度画像P
l(lx,ly)と同じ大きさであるので、サブバンド
内の係数位置を表す変数をx,yからlx,lyに置き
変えて、係数合成部804の合成処理を説明する。係数
合成部804はC(LL,lx,ly)の全ての係数に
ついてラスタースキャン順に解像度フラグFl(lx,
ly)を調べ、F(lx,ly)=0であればC(L
L,lx,ly)をPl(lx,ly)に置き換える。When the subband decomposition of the high resolution image in the discrete wavelet transform unit 105 is completed, the coefficient synthesizing unit 804 generates the resolution flag F generated by the image area determining unit 802.
By referring to l (lx, ly), the low-frequency subband C (LL, x, generated by the discrete wavelet transform unit 105.
y) and the low resolution image Pl (lx, ly) are combined.
The low-frequency subband C (LL, x, y) is the low-resolution image P
Since it has the same size as l (lx, ly), the variable representing the coefficient position in the subband is changed from x, y to lx, ly, and the synthesizing process of the coefficient synthesizing unit 804 will be described. The coefficient synthesizing unit 804 sets the resolution flags Fl (lx,
ly) is checked, and if F (lx, ly) = 0, then C (L
Replace L, lx, ly) with Pl (lx, ly).
【0062】以降、離散ウェーブレット変換部107か
ら符号出力部110による符号化の過程は第1の実施形
態で述べた通りである。After that, the process of encoding from the discrete wavelet transform unit 107 to the code output unit 110 is as described in the first embodiment.
【0063】以上に述べたように、画像データを高解像
度と低解像度に分けて取り込み、高解像度画像をサブバ
ンド分解して得られた低周波サブバンドに低解像度画像
を合成して符号化することにより、必要な部分のみを高
解像度で読み込んで符号化することが可能となる。本実
施形態においては一旦、原稿を低解像度で読み込むこと
により、高解像度を必要とする領域を選定して読み込む
ことができる。As described above, image data is divided into a high resolution image and a low resolution image, and the low resolution image is combined with the low frequency image obtained by subband decomposition of the high resolution image and encoded. As a result, it is possible to read and encode only the necessary portion with high resolution. In the present embodiment, by once reading the original document at a low resolution, it is possible to select and read an area requiring a high resolution.
【0064】[第3の実施形態]図9に本実施形態にお
ける画像符号化装置の機能構成を示す。第1の実施形態
で用いた図1、および第2の実施形態で用いた図8と共
通する部分については同じ符号で示し、それらの説明を
省略する。また、本実施形態における画像符号化装置の
基本構成は図10に示した構成とする。[Third Embodiment] FIG. 9 shows the functional arrangement of an image coding apparatus according to this embodiment. Parts common to FIG. 1 used in the first embodiment and FIG. 8 used in the second embodiment are denoted by the same reference numerals, and description thereof will be omitted. The basic configuration of the image coding apparatus according to this embodiment is the configuration shown in FIG.
【0065】図9に於いて901はマスク生成部、90
2は係数シフト部である。In FIG. 9, reference numeral 901 denotes a mask generation unit, and 90
2 is a coefficient shift unit.
【0066】本実施形態では第1、第2の実施形態と同
様に、白黒原稿を各画素の輝度値を8ビットで表現した
画像データとして読み取り、符号化するものとして説明
する。しかしながらこれに限らず、4ビット、10ビッ
ト、12ビットなど8ビット以外のビット数で輝度値を
表現する画像データとして読み取って符号化する場合に
も適用できる。また各画素をRGB、CMYKなどの複
数の色成分或いはYCrCb等の輝度と色度/色差成分
で表現するカラー画像データとして読み取る場合にも適
用できる。この場合にはカラー画像データ中の各成分が
モノクロ画像データであると見なせば良い。本実施形態
では第1の実施形態と同様に、符号化対象となる白黒原
稿を所定の解像度で読み取り、符号化するものである
が、その一部分だけを水平・垂直方向ともに倍の解像度
で読み取るものである。以降、所定の解像度を低解像
度、水平・垂直方向ともにこれを倍にした解像度を高解
像度と呼ぶ。白黒原稿の大きさは固定であるものとし、
原稿全体を高解像度で読み取った場合の画像サイズを
X,Yとして表す。X,Yともに4の倍数とする。In the present embodiment, as in the first and second embodiments, a black-and-white document is read and encoded as image data in which the luminance value of each pixel is represented by 8 bits. However, the present invention is not limited to this, and can also be applied to the case of reading and encoding as image data expressing a luminance value with a bit number other than 8 bits such as 4 bits, 10 bits, and 12 bits. It can also be applied to the case where each pixel is read as color image data represented by a plurality of color components such as RGB and CMYK or luminance and chromaticity / color difference components such as YCrCb. In this case, each component in the color image data may be regarded as monochrome image data. In the present embodiment, as in the first embodiment, a black-and-white original to be encoded is read and encoded at a predetermined resolution, but only a part of it is read at double the resolution in both the horizontal and vertical directions. Is. Hereinafter, the predetermined resolution will be referred to as low resolution, and the resolution obtained by doubling the predetermined resolution will be referred to as high resolution. The size of the black and white manuscript shall be fixed,
The image size when the entire original is read in high resolution is represented as X and Y. Both X and Y are multiples of 4.
【0067】以下、図9を用いて、本実施形態に係る画
像符号化装置の各部の機能、及びその動作について説明
する。The function and operation of each section of the image coding apparatus according to this embodiment will be described below with reference to FIG.
【0068】本実施形態の画像符号化装置は第2の実施
形態の画像符号化装置にマスク生成部901、係数シフ
ト部902を付加したものであり、他の部分の機能、及
び動作は第2の実施形態と同じであるので、追加された
マスク生成部901、と係数シフト部902の動作につ
いてのみ説明する。The image coding apparatus of this embodiment is the image coding apparatus of the second embodiment to which a mask generation unit 901 and a coefficient shift unit 902 are added, and the functions and operations of other parts are the same as those of the second embodiment. Since it is the same as the embodiment described above, only the operations of the added mask generation unit 901 and coefficient shift unit 902 will be described.
【0069】マスク生成部901は像域判定部802の
生成する解像度フラグFl(lx,ly)から、係数合
成部804で得られたC(LL,x,y)を離散ウェー
ブレット変換部107によりサブバンド分解して得られ
る各サブバンドの各係数C(LL,x,y),C(LH
1,x,y),C(HL1,x,y),C(HH,x,
y)が高解像度画像Ph(x,y)に関連する部分であ
るか否かをしめしたマスク情報M(x,y)を生成して
出力する。マスク情報は解像度フラグの情報の半分の大
きさであり、Fl(2×x,2×y),Fl(2×x+
1,2×y),Fl(2×x,2×y+1),Fl(2
×x+1,2×y+1)のいずれかが1ならばM(x,
y)=1、全て0ならばM(x,y)=0である。The mask generation unit 901 uses the resolution flag Fl (lx, ly) generated by the image area determination unit 802 to calculate the C (LL, x, y) obtained by the coefficient synthesis unit 804 by the discrete wavelet transform unit 107. Each coefficient C (LL, x, y), C (LH) of each sub-band obtained by band decomposition
1, x, y), C (HL1, x, y), C (HH, x,
Mask information M (x, y) indicating whether or not y) is a portion related to the high resolution image Ph (x, y) is generated and output. The mask information is half the size of the information of the resolution flag, and is Fl (2 × x, 2 × y), Fl (2 × x +).
1, 2 × y), Fl (2 × x, 2 × y + 1), Fl (2
If either xx + 1, 2xy + 1) is 1, then M (x,
If y) = 1 and all 0, then M (x, y) = 0.
【0070】係数シフト部902は各サブバンドの有効
ビット数の最大値Nmaxを求め、離散ウェーブレット
変換部107から出力されるLL,LH1,HL1,H
H1サブバンドの係数値C(S,x,y)についてマス
ク生成部901で生成するマスク情報M(x,y)を参
照し、M(x,y)が1ならばサブバンドの係数C
(S,x,y)をNmaxビットシフトアップする。よ
って、全てのサブバンドの係数を参照した場合に、有効
ビット数がNmax以上である係数はM(x、y)=1
に対応する係数と見なすことができ、高解像度領域を早
期に特定することができる。The coefficient shift unit 902 obtains the maximum value Nmax of the number of effective bits of each subband, and outputs LL, LH1, HL1, H output from the discrete wavelet transform unit 107.
The mask information M (x, y) generated by the mask generation unit 901 is referred to for the coefficient value C (S, x, y) of the H1 subband, and if M (x, y) is 1, the coefficient C of the subband is calculated.
(S, x, y) is shifted up by Nmax bits. Therefore, when the coefficients of all subbands are referred to, the coefficient whose effective bit number is Nmax or more is M (x, y) = 1.
Can be regarded as a coefficient corresponding to, and a high-resolution area can be specified at an early stage.
【0071】以降、符号出力部110までの処理は第
1、第2の実施形態で説明した通りである。但し、本実
施形態においては符号列形成部109で符号化データに
付加情報を挿入する際に係数シフト部902でシフトア
ップしたビット数Nmaxをヘッダに挿入するものとす
る。After that, the processing up to the code output section 110 is as described in the first and second embodiments. However, in the present embodiment, when the code string forming unit 109 inserts the additional information into the encoded data, the number of bits Nmax shifted up by the coefficient shifting unit 902 is inserted into the header.
【0072】本実施形態の場合、第2の実施形態で述べ
た効果に加えて、符号列の受信側で、文字・線画情報を
早期に復号することが可能となる。In the case of this embodiment, in addition to the effect described in the second embodiment, it becomes possible to early decode the character / line drawing information on the receiving side of the code string.
【0073】<変形例>本発明は上述した実施形態に限
定されるものではない。例えば上述した第1〜3の実施
形態においては、式(1),(2)による離散ウェーブ
レット変換を用いた符号化の例を示したが、離散ウェー
ブレット変換については本実施形態で使用したものに限
定されるものではなく、フィルタの種類や適応方法を変
えても構わない。例えば9/7フィルタなどよりタップ
数の長いフィルタに変えても構わないし、低周波サブバ
ンド以外にも2次元離散ウェーブレット変換を繰り返し
適用しても構わない。但し、この場合係数合成の処理に
於いてフィルタの影響範囲を考慮する必要がある。<Modification> The present invention is not limited to the above embodiment. For example, in the above-described first to third embodiments, an example of encoding using the discrete wavelet transform according to Expressions (1) and (2) has been shown, but the discrete wavelet transform is not limited to that used in this embodiment. There is no limitation, and the type of filter and the adaptation method may be changed. For example, the filter may be changed to a filter having a larger number of taps than the 9/7 filter, or the two-dimensional discrete wavelet transform may be repeatedly applied in addition to the low frequency subband. However, in this case, it is necessary to consider the influence range of the filter in the process of coefficient synthesis.
【0074】また、係数の符号化方式としてQM−Co
derを用いたビットプレーン符号化方式を示したが、
上述の実施形態に限定されるものではなく、例えば、M
Q−Coder等、QM−Coder以外の算術符号化
方法を適用しても構わないし、MELCODEなどその
他の2値符号化方式を適用しても構わない。また、ビッ
トプレーンを着目係数の近傍係数の状態に応じて複数の
サブビットプレーンにカテゴリ分けし、複数回のパスで
符号化しても良い。さらにはGolomb符号などを適
用して、係数を2値に分解することなく、多値のままエ
ントロピ符号化しても構わない。QM-Co is used as a coefficient coding method.
Although the bit plane coding method using der is shown,
The present invention is not limited to the above-mentioned embodiment, and for example, M
An arithmetic coding method other than QM-Coder such as Q-Coder may be applied, or another binary coding method such as MELCODE may be applied. In addition, the bit plane may be categorized into a plurality of sub-bit planes according to the state of the coefficient near the coefficient of interest, and may be encoded by a plurality of passes. Furthermore, the Golomb code or the like may be applied to entropy-encode the multi-value as it is without dividing the coefficient into two values.
【0075】また、説明を簡単にするために、上記各実
施形態では、サブバンド単位のビットプレーン符号化に
ついて説明したが、ランダムアクセス性を高めるために
各サブバンドを更に小ブロックに分割してこの小ブロッ
ク単位にビットプレーン符号化を適用しても構わない。Further, in order to simplify the explanation, in each of the above-mentioned embodiments, bit-plane coding in sub-band units has been explained, but in order to improve random accessibility, each sub-band is further divided into small blocks. Bit plane coding may be applied in units of this small block.
【0076】また、符号列の形成にあたっては受信側で
徐々に解像度を上げて画像を復元できるように並べた
が、これに限らず、徐々に画質が向上するように値の大
きな係数から順に並べて符号列を形成しても構わない。Further, in forming the code string, the images are arranged so that the image can be restored by gradually increasing the resolution on the receiving side. However, the present invention is not limited to this, and the coefficients are arranged in order from the largest value so that the image quality is gradually improved. A code string may be formed.
【0077】なお、本発明は複数の機器(例えばホスト
コンピュータ、インターフェース機器、リーダ、プリン
タ等)から構成されるシステムの一部として適用して
も、単一の機器(例えば複写機、ファクシミリ装置、デ
ジタルカメラ等)からなる装置の一部に適用しても良
い。Even when the present invention is applied as a part of a system composed of a plurality of devices (for example, host computer, interface device, reader, printer, etc.), a single device (for example, copying machine, facsimile machine, It may be applied to a part of a device including a digital camera).
【0078】また、本発明は上記実施の形態を実現する
ための装置および方法のみに限定されるものではなく、
上記システムまたは装置内のコンピュータ(CPUあるいは
MPU)に、上記実施の形態を実現するためのソフトウェア
のプログラムを供給し、このプログラムに従って上記シ
ステムあるいは装置のコンピュータが上記各種デバイス
を動作させることにより上記実施の形態を実現する場合
も本発明の範疇に含まれる。The present invention is not limited to the apparatus and method for realizing the above-mentioned embodiment,
Computer (CPU or
MPU), a software program for realizing the above-described embodiment is supplied, and the computer of the system or the apparatus operates the above-mentioned various devices according to the program to realize the above-described embodiment. Included in the category.
【0079】またこの場合、前記ソフトウェアのプログ
ラム自体が上記実施の形態の機能を実現することにな
り、そのプログラム自体、及びそのプログラムをコンピ
ュータに供給するための手段、具体的には上記プログラ
ムを格納した記憶媒体は本発明の範疇に含まれる。Further, in this case, the software program itself realizes the functions of the above embodiments, and the program itself and a means for supplying the program to the computer, specifically, the program is stored. Such storage media are included in the scope of the present invention.
【0080】このようなプログラムを格納する記憶媒体
としては、例えばフロッピィーディスク、ハードディス
ク、光ディスク、光磁気ディスク、CD−ROM、磁気
テープ、不揮発性のメモリカード、ROM等を用いるこ
とができる。As a storage medium for storing such a program, for example, a floppy disk, a hard disk, an optical disk, a magneto-optical disk, a CD-ROM, a magnetic tape, a non-volatile memory card, a ROM or the like can be used.
【0081】また、上記コンピュータが、供給されたプ
ログラムのみにしたがって各種デバイスを制御すること
により、上記実施の形態の機能が実現される場合だけで
はなく、上記プログラムがコンピュータ上で稼動してい
るOS(オペレーティングシステム)、あるいは他のア
プリケーションソフト等と共同して上記実施の形態が実
現される場合にもかかるプログラムは本発明の範疇に含
まれる。Further, not only when the computer controls the various devices only according to the supplied program to realize the functions of the above-described embodiments, but also when the program runs on the computer. Such a program is also included in the scope of the present invention when the above embodiment is implemented in cooperation with (operating system) or other application software.
【0082】更に、この供給されたプログラムが、コン
ピュータの機能拡張ボードやコンピュータに接続された
機能拡張ユニットに備わるメモリに格納された後、その
プログラムの指示に基づいてその機能拡張ボードや機能
拡張ユニットに備わるCPU等が実際の処理の一部また
は全部を行い、その処理によって上記実施の形態が実現
される場合も本発明の範疇に含まれる。Further, after the supplied program is stored in the memory provided in the function expansion board of the computer or the function expansion unit connected to the computer, the function expansion board or function expansion unit is instructed based on the instruction of the program. It is also within the scope of the present invention that the CPU and the like included in the above perform a part or all of the actual processing and the above embodiment is realized by the processing.
【0083】[0083]
【発明の効果】以上の説明により、本発明によって、異
なる解像度レベルを必要とする領域を含む画像データを
符号化する場合に、効率の良い画像符号化を行うことが
できる。又、符号化を行った画像データを復号する際
に、注目解像度領域を早期に特定可能な符号列を生成す
る符号化を行うことができる。As described above, according to the present invention, efficient image encoding can be performed when encoding image data including areas requiring different resolution levels. Further, when decoding the coded image data, it is possible to perform coding for generating a code string that can identify the resolution region of interest at an early stage.
【図1】本発明の第1の実施形態における画像符号化装
置の機能構成を示す図である。FIG. 1 is a diagram showing a functional configuration of an image encoding device according to a first embodiment of the present invention.
【図2】原稿と高解像度領域情報の例を示す図である。FIG. 2 is a diagram showing an example of a document and high resolution area information.
【図3】符号列形成部109により生成される符号列の
構造を示す。FIG. 3 shows a structure of a code string generated by a code string forming unit 109.
【図4】2次元離散ウェーブレット変換処理を示す図で
ある。FIG. 4 is a diagram showing a two-dimensional discrete wavelet transform process.
【図5】離散ウェーブレット変換部107により合成後
のLLサブバンドを更に4つのサブバンドに分解した様
子を示す図である。FIG. 5 is a diagram showing how the LL subband after synthesis is further decomposed into four subbands by the discrete wavelet transform unit 107.
【図6】ビットプレーン符号化部108でサブバンドS
を符号化する処理の流れを示したフローチャートであ
る。FIG. 6 shows a subband S in the bit plane encoding unit 108.
3 is a flowchart showing a flow of a process of encoding the.
【図7】図2に示すように高解像度領域情報を指定した
場合の解像度フラグF(x、y)の例を示す。FIG. 7 shows an example of a resolution flag F (x, y) when high resolution area information is designated as shown in FIG.
【図8】本発明の第2の実施形態における画像符号化装
置の機能構成を示す図である。FIG. 8 is a diagram showing a functional configuration of an image encoding device according to a second embodiment of the present invention.
【図9】本発明の第3の実施形態における画像符号化装
置の機能構成を示す図である。FIG. 9 is a diagram showing a functional configuration of an image encoding device according to a third embodiment of the present invention.
【図10】本発明の第1乃至3の実施形態における画像
符号化装置の基本構成を示す図である。FIG. 10 is a diagram showing a basic configuration of an image encoding device according to the first to third embodiments of the present invention.
Claims (24)
て、 原画像の第1の領域を第1の解像度で読み込み、読み込
んだ領域を含む第1の画像を生成する第1の読み込み手
段と、 前記原画像において、前記第1の解像度よりも高い第2
の解像度で、前記第1の領域とは異なる第2の領域を読
み込み、読み込んだ領域を含む第2の画像を生成する第
2の読み込み手段と、 前記第2の画像に対して周波数変換を行い、サブバンド
毎の係数を得る第1の周波数変換手段と、 前記第1の周波数変換手段による複数のサブバンドのう
ち所定のサブバンドに前記第1の画像を合成し、合成サ
ブバンドを生成する合成手段と、 前記合成サブバンドに対して更に周波数変換を行い、サ
ブバンド毎の係数を得る第2の周波数変換手段と、 前記第1の周波数変換手段、及び第2の周波数変換手段
により得られたサブバンドの係数から、符号列を生成す
る符号列生成手段とを備えることを特徴とする画像符号
化装置。1. An image coding apparatus for coding an image, comprising: first reading means for reading a first area of an original image at a first resolution and generating a first image including the read area. And a second higher than the first resolution in the original image.
Second reading means for reading a second area different from the first area and generating a second image including the read area at a resolution of, and performing frequency conversion on the second image. , A first frequency conversion unit for obtaining a coefficient for each subband, and combining the first image with a predetermined subband of the plurality of subbands by the first frequency conversion unit to generate a combined subband. A combination means, a second frequency conversion means for further performing frequency conversion on the combined subband to obtain a coefficient for each subband, the first frequency conversion means, and the second frequency conversion means. An image coding apparatus, comprising: a code string generation unit that generates a code string from the coefficients of the subband.
む領域を指定するフラグを生成するフラグ生成手段を備
えることを特徴とする請求項1に記載の画像符号化装
置。2. The image coding apparatus according to claim 1, further comprising flag generation means for generating a flag designating an area to be read by the second reading means.
を参照して、前記第2の読み込み手段が読み込む領域以
外の領域を第1の解像度で読み込み、前記第1の画像を
生成することを特徴とする請求項2に記載の画像符号化
装置。3. The first reading means refers to the flag, reads an area other than the area read by the second reading means at a first resolution, and generates the first image. The image coding apparatus according to claim 2, wherein the image coding apparatus is a video coding apparatus.
ブバンドのサイズに等しいことを特徴とする請求項1乃
至3のいずれか1項に記載の画像符号化装置。4. The image coding apparatus according to claim 1, wherein the size of the first image is equal to the size of the predetermined subband.
半分であることを特徴とする請求項1乃至4のいずれか
1項に記載の画像符号化装置。5. The image coding apparatus according to claim 1, wherein the first resolution is half of the second resolution.
前記所定のサブバンドのうち、前記第1の領域に該当す
る領域に含まれる係数を特定し、特定した係数を前記第
1の画像で置き換えることを特徴とする請求項2に記載
の画像符号化装置。6. The synthesizing means, using the flag,
The image coding according to claim 2, wherein a coefficient included in a region corresponding to the first region in the predetermined subband is specified, and the specified coefficient is replaced with the first image. apparatus.
領域を示すフラグを生成するフラグ生成手段を備えるこ
とを特徴とする請求項1に記載の画像符号化装置。7. The image coding apparatus according to claim 1, further comprising flag generation means for generating a flag indicating a predetermined area in the first image.
ることを特徴とする請求項7に記載の画像符号化装置。8. The image coding apparatus according to claim 7, wherein the predetermined area is a character or line drawing area.
を参照して、前記原画像における前記所定の領域を第2
の解像度で読み込み、前記第2の画像を生成することを
特徴とする請求項7又は8に記載の画像符号化装置。9. The second reading unit refers to the flag to set a second region of the predetermined area in the original image.
9. The image coding apparatus according to claim 7, wherein the second image is generated by reading the image with the resolution of.
サブバンドのサイズに等しいことを特徴とする請求項7
乃至9のいずれか1項に記載の画像符号化装置。10. The size of the first image is equal to the size of the predetermined subband.
The image coding device according to any one of claims 1 to 9.
の半分であることを特徴とする請求項7乃至10のいず
れか1項に記載の画像符号化装置。11. The image coding apparatus according to claim 7, wherein the first resolution is half of the second resolution.
て、前記所定のサブバンドのうち、前記第1の領域に該
当する領域に含まれる係数を特定し、特定した係数を前
記第1の画像で置き換えることを特徴とする請求項7乃
至11のいずれか1項に記載の画像符号化装置。12. The synthesizing unit uses the flag to identify a coefficient included in a region corresponding to the first region in the predetermined subband, and the identified coefficient is used as the first image. 12. The image coding apparatus according to claim 7, wherein the image coding apparatus is replaced with.
ンドに対して周波数変換を行った際に生成されるサブバ
ンドを構成する係数のうち、前記第2の画像に関連する
係数を示すマスクを生成するマスク生成手段を更に備え
ることを特徴とする請求項7に記載の画像符号化装置。13. A mask showing a coefficient relating to the second image among coefficients constituting a subband generated when the code string generation means frequency-converts the combined subband. The image coding apparatus according to claim 7, further comprising a mask generation unit that generates the mask.
いて前記第2の画像に関連する係数を特定することを特
徴とする請求項13に記載の画像符号化装置。14. The image coding apparatus according to claim 13, wherein the mask generation means specifies a coefficient associated with the second image using the flag.
成手段により生成される各サブバンドに含まれる有効ビ
ット数の最大値を求め、前記第2の画像に関連する係数
を前記最大値分だけビットシフトアップすることを特徴
とする請求項1に記載の画像符号化装置。15. The code string generation means obtains a maximum value of the number of effective bits included in each subband generated by the code string generation means, and a coefficient related to the second image is divided by the maximum value. The image coding apparatus according to claim 1, wherein the bit shift is performed only by the bit shift.
特徴とする請求項15に記載の画像符号化装置。16. The image coding apparatus according to claim 15, wherein the code string includes the maximum value.
2の周波数変換手段は離散ウェーブレット変換を用いる
ことを特徴とする請求項1乃至16のいずれか1項に記
載の画像符号化装置。17. The image coding apparatus according to claim 1, wherein the first frequency transforming means and the second frequency transforming means use discrete wavelet transforms.
ドであることを特徴とする請求項1乃至17のいずれか
1項に記載の画像符号化装置。18. The image coding apparatus according to claim 1, wherein the predetermined subband is an LL subband.
って、 原画像の第1の領域を第1の解像度で読み込み、読み込
んだ領域を含む第1の画像を生成する第1の読み込み工
程と、 前記原画像において、前記第1の解像度よりも高い第2
の解像度で、前記第1の領域とは異なる第2の領域を読
み込み、読み込んだ領域を含む第2の画像を生成する第
2の読み込み工程と、 前記第2の画像に対して周波数変換を行い、サブバンド
毎の係数を得る第1の周波数変換工程と、 前記第1の周波数変換工程による複数のサブバンドのう
ち所定のサブバンドに、前記第1の画像を合成し、合成
サブバンドを生成する合成工程と、 前記合成サブバンドに対して更に周波数変換を行い、サ
ブバンド毎の係数を得る第2の周波数変換工程と、前記
第1の周波数変換工程、及び第2の周波数変換工程で得
られたサブバンドの係数から、符号列を生成する符号列
生成工程とを備えることを特徴とする画像符号化方法。19. An image encoding method for encoding an image, comprising a first reading step of reading a first region of an original image at a first resolution and generating a first image including the read region. And a second higher than the first resolution in the original image.
A second reading step of reading a second area different from the first area and generating a second image including the read area at a resolution of, and performing frequency conversion on the second image. , A first frequency conversion step of obtaining a coefficient for each subband, and combining the first image with a predetermined subband of the plurality of subbands by the first frequency conversion step to generate a combined subband And a second frequency conversion step of further performing frequency conversion on the composite subband to obtain a coefficient for each subband, and a first frequency conversion step and a second frequency conversion step. And a code string generating step of generating a code string from the coefficients of the obtained subbands.
込む領域を指定するフラグを生成するフラグ生成工程を
備えることを特徴とする請求項19に記載の画像符号化
方法。20. The image coding method according to claim 19, further comprising a flag generating step of generating a flag designating an area to be read in the second reading step.
の領域を示すフラグを生成するフラグ生成工程を備える
ことを特徴とする請求項19に記載の画像符号化方法。21. The image encoding method according to claim 19, further comprising a flag generating step of generating a flag indicating a predetermined area in the first image.
ンドに対して周波数変換を行った際に生成されるサブバ
ンドを構成する係数のうち、前記第2の画像に関連する
係数を示すマスクを生成するマスク生成工程を更に備え
ることを特徴とする請求項21に記載の画像符号化方
法。22. A mask showing a coefficient relating to the second image among coefficients forming a subband generated when frequency conversion is performed on the combined subband in the code string generating step. The image coding method according to claim 21, further comprising a mask generation step of generating.
記載の画像符号化方法をコンピュータ上で実行するプロ
グラム。23. A program for executing the image coding method according to any one of claims 19 to 22 on a computer.
し、コンピュータが読み取り可能な記憶媒体。24. A computer-readable storage medium that stores the program according to claim 23.
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2001232812A JP2003047005A (en) | 2001-07-31 | 2001-07-31 | Image encoding apparatus and method, program, and storage medium |
| US10/176,583 US7013050B2 (en) | 2001-06-26 | 2002-06-24 | Image encoding apparatus and method, program code, and storage medium |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2001232812A JP2003047005A (en) | 2001-07-31 | 2001-07-31 | Image encoding apparatus and method, program, and storage medium |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2003047005A true JP2003047005A (en) | 2003-02-14 |
Family
ID=19064669
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2001232812A Withdrawn JP2003047005A (en) | 2001-06-26 | 2001-07-31 | Image encoding apparatus and method, program, and storage medium |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2003047005A (en) |
-
2001
- 2001-07-31 JP JP2001232812A patent/JP2003047005A/en not_active Withdrawn
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4612782B2 (en) | Image processing apparatus, method thereof, program, and storage medium | |
| US7013050B2 (en) | Image encoding apparatus and method, program code, and storage medium | |
| JP4367880B2 (en) | Image processing apparatus and method, and storage medium | |
| JP3814456B2 (en) | Image processing apparatus and method | |
| JP4365957B2 (en) | Image processing method and apparatus and storage medium | |
| US7386175B2 (en) | Modifying wavelet division level before transmitting data stream | |
| JP4208378B2 (en) | Image processing apparatus and method, and recording medium | |
| JP2002034043A (en) | Encoding device, encoding method, and storage medium | |
| JP4089905B2 (en) | Image processing apparatus, image processing method, program, and information recording medium | |
| JP2006014086A (en) | Moving picture coding apparatus and moving picture coding method | |
| JP2007235679A (en) | Image output system, program, and information recording medium | |
| JP4412688B2 (en) | Image processing apparatus and method | |
| JP4097146B2 (en) | Image processing apparatus, image processing method, program, and information recording medium | |
| JP5078199B2 (en) | Image encoding apparatus and method, program code, and storage medium | |
| JP4678814B2 (en) | Image processing method and apparatus | |
| JP2003204439A (en) | Image encoding apparatus and image encoding method | |
| JP2002247375A (en) | Image encoding apparatus and method, program code, and storage medium | |
| JP3227181B2 (en) | Image processing device | |
| JP2003047005A (en) | Image encoding apparatus and method, program, and storage medium | |
| JP2001258033A (en) | Image data encoding apparatus and method, storage medium | |
| JP4194311B2 (en) | Moving picture encoding apparatus, moving picture decoding apparatus, and methods thereof | |
| JP3990949B2 (en) | Image coding apparatus and image coding method | |
| JP4926128B2 (en) | Image processing apparatus, image reading apparatus, image forming apparatus, computer program, recording medium, and image processing method | |
| JP2002152500A (en) | Image processing apparatus and method, and storage medium | |
| JP2001218208A (en) | Image decoder and its method |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20081007 |