JP2006295408A - Image encoding apparatus and image encoding program - Google Patents
Image encoding apparatus and image encoding program Download PDFInfo
- Publication number
- JP2006295408A JP2006295408A JP2005111310A JP2005111310A JP2006295408A JP 2006295408 A JP2006295408 A JP 2006295408A JP 2005111310 A JP2005111310 A JP 2005111310A JP 2005111310 A JP2005111310 A JP 2005111310A JP 2006295408 A JP2006295408 A JP 2006295408A
- Authority
- JP
- Japan
- Prior art keywords
- prediction mode
- cost function
- image
- prediction
- adjacent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【課題】 線状ノイズが発生するおそれがある予測モードを選択せず、復号画像に線状ノイズの発生を抑制することができる画像符号化装置を提供する。
【解決手段】 入力画像をブロック単位に分割し、イントラ予測を行って選択される予測モードに従って生成される予測画像との差分を符号化する画像符号化装置であって、符号化対象ブロックに隣接するブロックの予測モードを参照する隣接予測モード参照部401と、参照された隣接予測モードに応じて所定のコスト関数に切替える命令を出力するコスト関数切替え部402と、コスト関数切替え部402から出力されたコスト関数切替え命令に従って所定のコスト関数に切り替え、当該コスト関数を用いた計算処理の結果に基づいて選択した予測モードを用いて予測画像を生成するイントラ予測部101とを備える。
【選択図】 図1PROBLEM TO BE SOLVED: To provide an image encoding device capable of suppressing the occurrence of linear noise in a decoded image without selecting a prediction mode in which linear noise may occur.
An image encoding apparatus that divides an input image into blocks and encodes a difference from a prediction image generated according to a prediction mode selected by performing intra prediction, and is adjacent to an encoding target block Output from an adjacent prediction mode reference unit 401 that refers to a prediction mode of a block to be performed, a cost function switching unit 402 that outputs an instruction to switch to a predetermined cost function according to the referenced adjacent prediction mode, and a cost function switching unit 402 An intra prediction unit 101 that switches to a predetermined cost function according to the cost function switching command and generates a predicted image using a prediction mode selected based on a result of calculation processing using the cost function.
[Selection] Figure 1
Description
本発明は、H.264/AVCイントラ符号化を実現する画像符号化装置及び画像符号化プログラムに関する。 The present invention relates to H.264. The present invention relates to an image encoding device and an image encoding program for realizing H.264 / AVC intra encoding.
H.264/AVCは、ITU−TおよびISO/IECによって策定された動画像の符号化標準であり、従来の符号化標準であるMPEG−4やH.263に比べて最大で約2倍の圧縮効率を持つ。また、H.264/AVCは動画像の符号化方式であるが、静止画像の符号化方式、すなわち、イントラ符号化としての性能も優れていることが非特許文献1乃至3等で報告されている。イントラ符号化を行って生成するイントラフレームと呼ばれる画像は、1枚の画像単独で圧縮されているため、画像検索におけるランダムアクセス性や画像の編集性という点で優れている。以下、H.264/AVCイントラ符号化の概要を説明する。
H.264/AVCで規定されている複数の予測モードには、4×4ブロックの9モードと16×16ブロックの4モードとの13モードがあり、この中から最適となる予測モードを選択する。図4は4×4ブロック、図5は16×16ブロックの予測方向を示した概念図である。図4に示すように、4×4ブロックは有向予測の8モードと無向予測の1モードの合計9モードを有し、図5に示すように、16×16ブロックは有向予測の3モードと無向予測の1モードの合計4モードを有している。図に示すように、予測方向毎に付される番号がモード番号を示している。 H. The plurality of prediction modes defined by H.264 / AVC include 13 modes of 9 modes of 4 × 4 blocks and 4 modes of 16 × 16 blocks, and an optimal prediction mode is selected from these. 4 is a conceptual diagram showing the prediction direction of 4 × 4 blocks, and FIG. 5 is a prediction direction of 16 × 16 blocks. As shown in FIG. 4, the 4 × 4 block has a total of 9 modes including 8 modes of directed prediction and 1 mode of undirected prediction, and as shown in FIG. 5, the 16 × 16 block has 3 directed predictions. There are a total of four modes, one mode and one undirected prediction mode. As shown in the figure, the number assigned to each prediction direction indicates the mode number.
図6は、イントラ予測部101で行う処理を示すフロー図である。はじめにステップ21において、イントラ予測部101はマクロブロックを4×4ブロック毎に区分けしてイントラ予測を行う。上記の通り、4×4ブロックのイントラ予測は、4×4ブロックで規定されている9モードから選択する処理を行う。4×4ブロックの予測モードの決定に関する処理については後述する。
FIG. 6 is a flowchart showing processing performed by the
次に、ステップ22において、イントラ予測部101はマクロブロックを16×16ブロック毎に区分けしてイントラ予測を行う。上記の通り、16×16ブロックのイントラ予測は、16×16ブロックで規定されている4モードから選択する処理を行う。16×16ブロックの予測モードの決定に関する処理動作についても後述する。
Next, in step 22, the
最後に、ステップ23において、イントラ予測部101は4×4ブロックと16×16ブロックのイントラ予測でそれぞれ決定したモードを用い、どちらを用いるかを決定する。決定方法は規格で定められていないが、一般に、4×4ブロックと16×16ブロックの発生符号量を比較して小さい方の予測モードを選択することにしている。
Finally, in step 23, the
図7は、イントラ予測部101がステップ21で行う4×4ブロックのイントラ予測の処理を示すフロー図である。ステップ31において、イントラ予測部101は4×4ブロックで規定されている個々の予測モードを用いて予測画像を生成する。図8は予測画像の生成を説明するための図である。図において、Pは予測画像、XとYは予測画像の上または左に位置する隣接ブロックである。予測画像Pに属する画素a〜pは、予測モードが示す方向へ画素A〜Mを外挿補間することで決定される。具体的な決定例を図9と図10に示す。
FIG. 7 is a flowchart showing the 4 × 4 block intra prediction process performed by the
図9は、図4に示す予測モードの内、垂直方向への予測を示すモード0が選択された場合に生成される予測画像である。この場合、予測画像は隣接する画素A〜Dの画素値を垂直方向に外挿して生成する。また、図10は図4に示す予測モードの内、水平方向への予測を示すモード1が選択された場合に生成される予測画像である。この場合、予測画像は隣接する画素I〜Lの画素値を水平方向に外挿して生成する。
FIG. 9 is a prediction image generated when
次に、ステップ32において、イントラ予測部101は、ステップ31で生成された予測画像の符号化に要するコストを計算する。非特許文献4に示されるリファレンスソフトで規定されているコスト関数Jの定義式を示す。
図11は、H.264/AVCで規定されているヘッダのシンタックスである。prev_Intra4x4_pred_mode_flagは1ビットの情報であり、上または左に位置する隣接ブロックのモード番号が小さい方と同じモードを選択した場合には1の値を、異なるモードを選択した場合は0の値を取る。同じモードを選択した場合、復号化装置は隣接ブロックの予測モードから予測対象ブロックの予測モードを知ることができるので1ビットで十分である。一方、異なるモードを選択した場合、符号化装置は全9モードから隣接ブロックの予測モードを引いた8モードをrem_prev_Intra4x4_pred_mode_flagの3ビットで記述する。これは、隣接ブロック間の予測モードの高い相関を利用した情報圧縮である。具体例として、上と左に位置する隣接ブロックのモード番号がそれぞれ4と8の場合、予測対象ブロックでモード番号4を選択すると1ビット、それ以外を選択すると4ビットとなる。以上をまとめると、式1は入力画像と予測画像の類似度Dならびに予測モードの記述に要するヘッダ符号量Rの双方を考慮していることを示しており、イントラ予測部101では4×4ブロックで規定されている全9モードを用いてコスト計算を行い、その中で値が最小となる予測モードを選択する。
FIG. This is a header syntax defined by H.264 / AVC. prev_Intra4x4_pred_mode_flag is 1-bit information, and takes a value of 1 when the same mode as the one with the smaller mode number of the adjacent block located above or to the left is selected, and takes a value of 0 when a different mode is selected. When the same mode is selected, since the decoding apparatus can know the prediction mode of the prediction target block from the prediction mode of the adjacent block, one bit is sufficient. On the other hand, when a different mode is selected, the encoding apparatus describes 8 modes obtained by subtracting the prediction modes of adjacent blocks from all 9 modes by 3 bits of rem_prev_Intra4 × 4_pred_mode_flag. This is information compression using a high correlation of prediction modes between adjacent blocks. As a specific example, when the mode numbers of the adjacent blocks located on the upper and left sides are 4 and 8, respectively, if the mode number 4 is selected in the prediction target block, it becomes 1 bit, and if the other is selected, it becomes 4 bits. Summarizing the above,
すなわち、ステップ33において、イントラ予測部101は4×4ブロックで規定されている全9モードのコストを計算したかを確認する。計算の終了が確認された場合、ステップ34において、イントラ予測部101ではコストが最小となる予測モードを選択する。以上により、ステップ21で行う4×4ブロックのイントラ予測の処理は終了する。なお、16×16ブロックのイントラ予測の処理については、式1において、ヘッダ符号量Rを含まない歪み量Dのみ(J=D)で判断を行う。これは、16×16ブロックで規定されている予測モードは4モードあり、いずれの予測モードを選択しても2ビットで記述することができるからである。上記の点を除けば4×4ブロックと同様であり、イントラ予測部101は16×16ブロックで規定されている全4モードのコストを計算し、コストが最小となる予測モードを選択する。以上がH.264/AVCイントラ符号化の概要である。
That is, in step 33, the
しかしながら、低ビットレートの場合、式1を用いて予測モードを決定すると、入力画像(図12参照)には無い水平・垂直方向の線状ノイズが復号画像(図13参照)に発生することが非特許文献5で指摘されている。
図14にヘッダ符号量の小さい予測モードを選択した場合の例を示す。Oは入力画像、Pは予測画像、Dは差分画像、XとYは隣接ブロック、MXとMYは隣接ブロックXとYの予測モードをそれぞれ示している。図において、予測画像Pは隣接ブロックYの予測モードMYと同じ垂直予測モードを選択して生成されている。ところが、図に示すように、予測画像Pの左から2列目(R1)は周囲と離れた画素値80を持っている。周囲と著しく異なる画素値を持った予測画像を用いると、復号画像に線状ノイズが発生してしまうという問題がある。
FIG. 14 shows an example when a prediction mode with a small header code amount is selected. O is an input image, P is a predicted image, D is a difference image, X and Y are adjacent blocks, and MX and MY are prediction modes of adjacent blocks X and Y, respectively. In the figure, the predicted image P is generated by selecting the same vertical prediction mode as the prediction mode MY of the adjacent block Y. However, as shown in the figure, the second column (R1) from the left of the predicted image P has a
すなわち、イントラ予測部101では、ヘッダ符号量を加味した式1のコスト関数を用いると、ヘッダ符号量が小さくなる隣接ブロックのモード番号が小さい予測モードを用いることでコスト関数が最小となり、線状ノイズが発生するおそれがあるにもかかわらず、結果として当該予測モードを選択することになる。これが、線状ノイズ発生原因の1つとして考えられる。
That is, in the
もう1つは量子化処理に関係する。復号画像のモデル式は式5で表される。式5において、Oは入力画像、Pは予測画像、Wは直交変換/量子化、Rは復号画像である。式5において、O−Pに相当する差分画像は、量子化ステップが大きいと、テクスチャ情報が削られる。
The other is related to quantization processing. The model expression of the decoded image is expressed by
本発明は、こうした問題に着目し、線状ノイズが発生するおそれがある予測モードを選択せず、復号画像に線状ノイズの発生を抑制することができる画像符号化装置及び画像符号化プログラムを提供することを目的とする。 The present invention pays attention to such a problem, and provides an image encoding device and an image encoding program capable of suppressing the generation of linear noise in a decoded image without selecting a prediction mode in which linear noise may occur. The purpose is to provide.
本発明の請求項1に記載の発明は、入力画像をブロック単位に分割し、イントラ予測を行って選択される予測モードに従って生成される予測画像との差分を符号化する画像符号化装置であって、符号化対象ブロックに隣接するブロックの予測モードを参照する隣接予測モード参照部と、参照された隣接予測モードに応じて所定のコスト関数に切替える命令を出力するコスト関数切替え部と、前記コスト関数切替え部から出力されたコスト関数切替え命令に従って所定のコスト関数に切り替え、当該コスト関数を用いた計算処理の結果に基づいて選択した予測モードを用いて予測画像を生成するイントラ予測部とを備えることを特徴とする画像符号化装置である。これにより、イントラ予測を行う際に参照する隣接したブロックの予測モードに基づいて、所定のコスト関数に切替えられ、予測画像に線状ノイズが発生するおそれがある予測モードの選択を防止でき、復号画像に線状ノイズが発生するのを抑制できる。
The invention according to
本発明の請求項2に記載の発明は、請求項1に記載の画像符号化装置について、前記コスト関数切替え部は、前記参照された予測モードが符号化対象ブロックに隣接する画素の画素値を所定の方向に外挿補間して予測画像を生成するモードである場合、入力画像と予測画像の類似度を示す歪み量のみで構成されるコスト関数に切替える命令を出力し、それ以外の場合、予測モードをヘッダに記述する際に要するヘッダ符号量と前記類似度とを含むコスト関数に切替える命令を出力することを特徴とする。これにより、予測画像に線状ノイズが発生するおそれがある予測モードを選択した場合にはヘッダ符号量を考慮しないコスト関数を用い、また、それ以外の場合にはヘッダ符号量を考慮したコスト関数を用いることにより、線状ノイズの発生を抑制するとともに高い符号化効率を実現できる。 According to a second aspect of the present invention, in the image coding device according to the first aspect, the cost function switching unit is configured to calculate a pixel value of a pixel whose reference prediction mode is adjacent to the encoding target block. When it is a mode for generating a predicted image by extrapolating in a predetermined direction, it outputs a command to switch to a cost function consisting only of the distortion amount indicating the similarity between the input image and the predicted image, otherwise An instruction for switching to a cost function including a header code amount required for describing a prediction mode in a header and the similarity is output. As a result, a cost function that does not consider the header code amount is used when a prediction mode that may cause linear noise in the predicted image is selected, and a cost function that considers the header code amount otherwise. By using, it is possible to suppress the generation of linear noise and achieve high coding efficiency.
本発明の請求項3に記載の発明は、請求項2記載の画像符号化装置について、前記所定の方向は、水平または垂直方向であることを特徴とする。これにより、統計的に発生しやすい水平または垂直方向の線状ノイズを抑制できる。 According to a third aspect of the present invention, in the image encoding device according to the second aspect, the predetermined direction is a horizontal or vertical direction. Thereby, the linear noise of the horizontal or vertical direction which is easy to generate statistically can be suppressed.
本発明の請求項4に記載の発明は、請求項1記載の画像符号化装置について、前記隣接予測モード参照部は、前記符号化対象ブロックに隣接する、上または左に位置するブロックの予測モードを参照することを特徴とする。これにより、H.264/AVCの規格内で実現することができる。 According to a fourth aspect of the present invention, in the image coding device according to the first aspect, the adjacent prediction mode reference unit predicts a prediction mode of a block located adjacent to the encoding target block and located above or to the left. It is characterized by referring to. As a result, H.C. It can be realized within the H.264 / AVC standard.
本発明の請求項5に記載の発明は、請求項4記載の画像符号化装置について、前記隣接予測モード参照部は、前記上または左に位置するブロックのうちモード番号が小さい予測モードの方を参照することを特徴とする。これにより、H.264/AVCの規格内で実現することができる。 According to a fifth aspect of the present invention, in the image coding device according to the fourth aspect, the adjacent prediction mode reference unit selects a prediction mode having a smaller mode number from among the blocks located above or to the left. It is characterized by reference. As a result, H.C. It can be realized within the H.264 / AVC standard.
本発明の請求項6に記載の発明は、コンピュータが実行することにより、符号化対象ブロックに隣接するブロックの予測モードを参照する隣接予測モード参照部、参照された隣接予測モードに応じて所定のコスト関数に切替える命令を出力するコスト関数切替え部、前記コスト関数切替え部から出力されたコスト関数切替え命令に従って所定のコスト関数に切り替え、当該コスト関数を用いた計算処理の結果に基づいて選択した予測モードを用いて予測画像を生成するイントラ予測部、として機能することを特徴とする画像符号化プログラムである。このプログラムを画像符号化装置のコンピュータに実行させることにより、イントラ予測を行う際に参照する隣接したブロックの予測モードに基づいて、所定のコスト関数に切替えられ、予測画像に線状ノイズが発生するおそれがある予測モードの選択を防止でき、復号画像に線状ノイズが発生するのを抑制できる。
The invention according to
上記の通り、本発明の画像符号化装置及び画像符号化プログラムによれば、イントラ予測を行う際に参照する、隣接したブロックの予測モードに基づいて、所定のコスト関数に切替えられ、予測画像に線状ノイズが発生するおそれがある予測モードの選択を防止でき、復号画像に線状ノイズが発生するのを抑制できる。 As described above, according to the image encoding device and the image encoding program of the present invention, a prediction function is switched to a predetermined cost function based on a prediction mode of an adjacent block that is referred to when performing intra prediction. Selection of a prediction mode in which linear noise may occur can be prevented, and generation of linear noise in the decoded image can be suppressed.
以下、本発明を実施するための最良の形態について説明する。なお、本発明は以下の実施例で説明する範囲に限定されるものではなく、その要旨を逸脱しない範囲であれば、適宜に変更、実施できるものである。 Hereinafter, the best mode for carrying out the present invention will be described. In addition, this invention is not limited to the range demonstrated by the following Example, In the range which does not deviate from the summary, it can change and implement suitably.
以下、本発明の実施例について説明する。図1は、本発明の画像符号化プログラムを搭載したH.264/AVCイントラ符号化を実現する符号化装置のブロック図である。図1において、101はイントラ予測部、102は直交変換部、103は量子化部、104は可逆符号化部、105はバッファメモリ、106はレート制御部、107は逆量子化部、108は逆直交変換部、109はフレームメモリ、110は差分器、111は加算器、401は隣接予測モード参照部、402はコスト関数切替え部である。なお、本発明の主要となるブロックは、コスト関数切替え部401、隣接予測モード参照部402、及びイントラ予測部101であり、図3に示す従来の符号化装置と同一の構成には同一の符号を付している。
Examples of the present invention will be described below. FIG. 1 shows an H.264 image coding program according to the present invention. 1 is a block diagram of an encoding device that realizes H.264 / AVC intra coding. In FIG. 1, 101 is an intra prediction unit, 102 is an orthogonal transform unit, 103 is a quantization unit, 104 is a lossless encoding unit, 105 is a buffer memory, 106 is a rate control unit, 107 is an inverse quantization unit, and 108 is an inverse unit. An orthogonal transform unit, 109 is a frame memory, 110 is a differentiator, 111 is an adder, 401 is an adjacent prediction mode reference unit, and 402 is a cost function switching unit. The main blocks of the present invention are a cost
はじめに、H.264/AVCイントラ符号化を実現する画像符号化装置の各処理機能に関して順に説明する。上記した通り、イントラ予測部101では、フレームメモリ109に保存されている復号画像を入力してイントラ予測を行う。隣接画素間の高い相関を利用した処理を行い、入力される復号画像を用いて、H.264/AVCで規定されている複数の予測モードから1つのモードを選択し、予測画像と呼ばれる画像を生成する。生成された予測画像は、予測モードと共に差分器110と加算器111へ出力される。直交変換部102では、差分器110より出力される入力画像と予測画像の差分画像を入力し、当該差分画像に対して離散コサイン変換またはカーネル・レーベ変換等の直交変換を施す。直交変換された差分画像は、変換係数として量子化部103へ出力される。量子化部103では、直交変換部102より出力される直交変換後の変換係数とレート制御部106より出力される量子化パラメータを入力し、当該変換係数に対して量子化を施す。量子化された直交変換係数は、符号化変換係数として可逆符号化部104と逆量子化部107へ出力される。可逆符号化部104では、量子化部103より出力される符号化変換係数を入力し、当該変換係数に対して可変長符号化もしくは算術符号化に基づく可逆符号化を施し、符号語を生成する。生成された符号語は、バッファメモリ105へ出力される。バッファメモリ105では、可逆符号化部104より出力される符号語を入力し、当該符号語を保存する。保存された符号語は、レート制御部106で参照された後、符号化画像として出力される。レート制御部106では、バッファメモリ105のバッファ占有量を参考にして圧縮率を決定する。決定された圧縮率は、量子化パラメータに換算され、量子化部103へ出力される。逆量子化部107では、量子化部103より出力される符号化変換係数を入力し、当該変換係数に対して逆量子化を施す。逆量子化された符号化変換係数は、復号変換係数として逆直交変換部108へ出力される。逆直交変換部108では、逆量子部107より出力される復号変換係数を入力し、当該変換係数に対して逆直交変換を施す。逆直交変換された復号変換係数は、復号差分画像として加算器111へ出力される。フレームメモリ109では、イントラ予測部101より出力される予測画像と逆直交変換部108より出力される復号差分画像の加算画像を入力し、当該加算画像を復号画像として保存する。保存された復号画像は、イントラ予測部101でイントラ予測する際に参照される。
First, H.C. Each processing function of the image coding apparatus that implements H.264 / AVC intra coding will be described in order. As described above, the
隣接予測モード参照部401は、イントラ予測部101に保存されている復号画像の予測モードを入力し、符号化対象ブロックに隣接するブロックで既に選択された隣接するブロックの予測モードを参照する。符号化対象ブロックは予測モードを決定する参照対象となるブロックであり、符号化対象ブロックの上または左に位置する隣接ブロックのモード番号の内、小さい方の予測モードを参照する。参照された隣接予測モードは、コスト関数切替え部402へ出力される。
The adjacent prediction
コスト関数切替え部402は、隣接予測モード参照部401より出力される隣接予測モードを入力し、当該参照された隣接予測モードに応じて所定のコスト関数に切替える。具体的には、隣接予測モードが水平・垂直予測モードの場合、歪み量Dのみの式4のコスト関数に切替える。また、それ以外の場合、ヘッダ符号量を加味した式1のコスト関数に切替える。コスト関数の切替えは、コスト関数切替え命令としてイントラ予測部101に出力される。
<隣接予測モードが水平・垂直予測モードである場合>
The cost
<When adjacent prediction mode is horizontal / vertical prediction mode>
次に、ステップ52において、コスト関数切替え部402は、隣接予測モード参照部401より出力される隣接予測モードを入力し、当該参照された隣接予測モードが符号化対象ブロックに隣接する画素の画素値を所定の方向に外挿補間して予測画像を生成するモードであるか否かを判断する。本実施例では、統計的に発生しやすい水平または垂直予測モードであるかを判断する。
Next, in step 52, the cost
隣接予測モードが水平・垂直予測モードの場合、ステップ53において、コスト関数切替え部402は、歪み量Dのみで定義される上記式4のコスト関数に切替える。これは、低ビットレートの場合、隣接予測モードが水平・垂直予測モードであると、イントラ予測部101は、ヘッダ符号量が小さくなる水平・垂直予測モードを優先して選択し、結果として線状ノイズを生じさせることになるためである。例えば、従来技術の説明において示した、図14において隣接ブロックYの予測モードMYと同じ垂直予測モードを選択した場合、垂直予測モードであると判断し、式4を用いる。この場合、式4のように、コスト関数が歪み量Dのみで定義されていれば、入力画像Oと予測画像Pの類似度は低いと判断し、結果として、従来では選択されていた垂直予測モードを用いて予測画像を生成しない。これにより、従来では垂直予測モードを用いて生成した予測画像に線状ノイズが発生していたが、本実施例では、予測画像に線状ノイズが発生するおそれがある予測モードを選択した場合にはヘッダ符号量を考慮しないコスト関数を用い、当該予測モードの選択を防止でき、復号画像に線状ノイズが発生するのを抑制できる。
When the adjacent prediction mode is the horizontal / vertical prediction mode, in step 53, the cost
一方、隣接予測モード情報が水平・垂直予測モード以外の場合、ステップ54において、コスト関数切替え部402は、ヘッダ符号量を加味した上記式1のコスト関数に切替える。これにより、予測画像に線状ノイズが発生するおそれがない予測モードを選択した場合にはヘッダ符号量を考慮したコスト関数を用い、線状ノイズの発生を抑制するとともに高い符号化効率を実現できる。
On the other hand, when the adjacent prediction mode information is other than the horizontal / vertical prediction mode, in step 54, the cost
最後に、ステップ54において、イントラ予測部101は、切替え後のコスト関数に基づき、コストを計算する。そして、イントラ予測部101では4×4ブロックで規定されている全9モードを用いてコスト計算を行い、その中で値が最小となる予測モードを選択し、これを用いて予測画像を生成する。
Finally, in step 54, the
以上、本実施例によれば、イントラ予測を行う際に参照する、隣接したブロックの予測モードに基づいて、所定のコスト関数に切替えられ、予測画像に線状ノイズが発生するおそれがある予測モードの選択を防止でき、復号画像に線状ノイズが発生するのを抑制できる。 As described above, according to the present embodiment, a prediction mode that is switched to a predetermined cost function based on a prediction mode of an adjacent block that is referred to when performing intra prediction, and that linear noise may occur in the prediction image. Selection can be prevented, and the occurrence of linear noise in the decoded image can be suppressed.
本発明の画像符号化装置は、静止圧縮画像を高画質に実現可能であるため、ランダムアクセス性や編集性に優れている。それ故、画像検索機能を有する画像蓄積装置または画像編集装置等への適用が有用である。 The image coding apparatus of the present invention can realize a still compressed image with high image quality, and thus has excellent random accessibility and editability. Therefore, application to an image storage device or an image editing device having an image search function is useful.
101 イントラ予測部
401 隣接予測モード参照部
402 コスト関数切替え部
101
Claims (6)
符号化対象ブロックに隣接するブロックの予測モードを参照する隣接予測モード参照部と、
参照された隣接予測モードに応じて所定のコスト関数に切替える命令を出力するコスト関数切替え部と、
前記コスト関数切替え部から出力されたコスト関数切替え命令に従って所定のコスト関数に切り替え、当該コスト関数を用いた計算処理の結果に基づいて選択した予測モードを用いて予測画像を生成するイントラ予測部と、
を備えることを特徴とする画像符号化装置。 An image encoding device that divides an input image into blocks and encodes a difference from a prediction image generated according to a prediction mode selected by performing intra prediction,
An adjacent prediction mode reference unit that refers to a prediction mode of a block adjacent to the encoding target block;
A cost function switching unit that outputs a command to switch to a predetermined cost function according to the referenced adjacent prediction mode;
An intra prediction unit that switches to a predetermined cost function according to a cost function switching command output from the cost function switching unit and generates a prediction image using a prediction mode selected based on a result of a calculation process using the cost function; ,
An image encoding device comprising:
それ以外の場合、予測モードをヘッダに記述する際に要するヘッダ符号量と前記類似度とを含むコスト関数に切替える命令を出力することを特徴とする請求項1記載の画像符号化装置。 The cost function switching unit, when the referenced prediction mode is a mode for generating a predicted image by extrapolating pixel values of pixels adjacent to the encoding target block in a predetermined direction, an input image and a predicted image Outputs a command to switch to a cost function consisting only of the distortion amount indicating the similarity of
2. The image encoding apparatus according to claim 1, wherein in other cases, an instruction for switching to a cost function including a header code amount required for describing a prediction mode in a header and the similarity is output.
符号化対象ブロックに隣接するブロックの予測モードを参照する隣接予測モード参照部、
参照された隣接予測モードに応じて所定のコスト関数に切替える命令を出力するコスト関数切替え部、
及び前記コスト関数切替え部から出力されたコスト関数切替え命令に従って所定のコスト関数に切り替え、当該コスト関数を用いた計算処理の結果に基づいて選択した予測モードを用いて予測画像を生成するイントラ予測部
として機能することを特徴とする画像符号化プログラム。 By running the computer,
An adjacent prediction mode reference unit that refers to a prediction mode of a block adjacent to the encoding target block;
A cost function switching unit that outputs a command to switch to a predetermined cost function according to the referenced adjacent prediction mode;
And an intra prediction unit that switches to a predetermined cost function according to a cost function switching command output from the cost function switching unit and generates a predicted image using a prediction mode selected based on a result of calculation processing using the cost function An image encoding program that functions as:
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2005111310A JP2006295408A (en) | 2005-04-07 | 2005-04-07 | Image encoding apparatus and image encoding program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2005111310A JP2006295408A (en) | 2005-04-07 | 2005-04-07 | Image encoding apparatus and image encoding program |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2006295408A true JP2006295408A (en) | 2006-10-26 |
Family
ID=37415510
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2005111310A Pending JP2006295408A (en) | 2005-04-07 | 2005-04-07 | Image encoding apparatus and image encoding program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2006295408A (en) |
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2008072500A1 (en) * | 2006-12-13 | 2008-06-19 | Sharp Kabushiki Kaisha | Dynamic image encoding device and dynamic image decoding device |
| JP2010525677A (en) * | 2007-04-17 | 2010-07-22 | クゥアルコム・インコーポレイテッド | Mode uniformity signaling for intracoding |
| JP2012231278A (en) * | 2011-04-26 | 2012-11-22 | Jvc Kenwood Corp | Moving image encoding apparatus, moving image encoding method and moving image encoding program |
| US10306229B2 (en) | 2015-01-26 | 2019-05-28 | Qualcomm Incorporated | Enhanced multiple transforms for prediction residual |
| US10623774B2 (en) | 2016-03-22 | 2020-04-14 | Qualcomm Incorporated | Constrained block-level optimization and signaling for video coding tools |
| US11323748B2 (en) | 2018-12-19 | 2022-05-03 | Qualcomm Incorporated | Tree-based transform unit (TU) partition for video coding |
-
2005
- 2005-04-07 JP JP2005111310A patent/JP2006295408A/en active Pending
Cited By (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2008072500A1 (en) * | 2006-12-13 | 2008-06-19 | Sharp Kabushiki Kaisha | Dynamic image encoding device and dynamic image decoding device |
| US8306126B2 (en) | 2006-12-13 | 2012-11-06 | Sharp Kabushiki Kaisha | Moving picture encoding apparatus and moving picture decoding apparatus |
| JP2010525677A (en) * | 2007-04-17 | 2010-07-22 | クゥアルコム・インコーポレイテッド | Mode uniformity signaling for intracoding |
| US8238428B2 (en) | 2007-04-17 | 2012-08-07 | Qualcomm Incorporated | Pixel-by-pixel weighting for intra-frame coding |
| US8406299B2 (en) | 2007-04-17 | 2013-03-26 | Qualcomm Incorporated | Directional transforms for intra-coding |
| US8488672B2 (en) | 2007-04-17 | 2013-07-16 | Qualcomm Incorporated | Mode uniformity signaling for intra-coding |
| US8937998B2 (en) | 2007-04-17 | 2015-01-20 | Qualcomm Incorporated | Pixel-by-pixel weighting for intra-frame coding |
| TWI474721B (en) * | 2007-04-17 | 2015-02-21 | Qualcomm Inc | Methods for encoding a macroblock and predicting a macroblock, apparatuses for genertaing an encoded macroblock and predicting a macroblock, and computer program product for predicting a macroblock |
| JP2012231278A (en) * | 2011-04-26 | 2012-11-22 | Jvc Kenwood Corp | Moving image encoding apparatus, moving image encoding method and moving image encoding program |
| US10306229B2 (en) | 2015-01-26 | 2019-05-28 | Qualcomm Incorporated | Enhanced multiple transforms for prediction residual |
| US10623774B2 (en) | 2016-03-22 | 2020-04-14 | Qualcomm Incorporated | Constrained block-level optimization and signaling for video coding tools |
| US11323748B2 (en) | 2018-12-19 | 2022-05-03 | Qualcomm Incorporated | Tree-based transform unit (TU) partition for video coding |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US10477242B2 (en) | Video prediction encoding device, video prediction encoding method, video prediction decoding device and video prediction decoding method | |
| KR101684038B1 (en) | Video decoder, video encoder, video decoding method, and video encoding method | |
| JP4898467B2 (en) | Coding mode determination method and apparatus for variable block size motion prediction | |
| JP5197591B2 (en) | VIDEO ENCODING METHOD AND DECODING METHOD, DEVICE THEREOF, THEIR PROGRAM, AND RECORDING MEDIUM CONTAINING THE PROGRAM | |
| KR101614828B1 (en) | Method, device, and program for coding and decoding of images | |
| JP2010135864A (en) | Image encoding method, device, image decoding method, and device | |
| KR20140064972A (en) | Method, device, and program for encoding and decoding image | |
| US20090016443A1 (en) | Inter mode determination method for video encoding | |
| JP2008167449A (en) | Video encoding and decoding method and apparatus | |
| WO2010070818A1 (en) | Moving image encoding device, moving image encoding method, moving image decoding device and moving image decoding method | |
| JP2011029863A (en) | Decoding processing method | |
| JP2006211304A (en) | Video encoding device, video decoding device, video encoding method, video decoding method, video encoding program, and video decoding program | |
| JP5571542B2 (en) | Video encoding method and video decoding method | |
| US9491455B2 (en) | Picture encoding method, picture decoding method, picture encoding apparatus, picture decoding apparatus, picture encoding program, and picture decoding program | |
| JP2006295408A (en) | Image encoding apparatus and image encoding program | |
| KR101841352B1 (en) | Reference frame selection method and apparatus | |
| JP2009049969A (en) | Moving picture coding apparatus and method and moving picture decoding apparatus and method | |
| WO2022140905A1 (en) | Prediction methods, encoder, decoder, and storage medium | |
| WO2014084674A2 (en) | Intra prediction method and intra prediction apparatus using residual transform | |
| KR101802304B1 (en) | Methods of encoding using hadamard transform and apparatuses using the same | |
| JP4563981B2 (en) | VIDEO ENCODING METHOD, VIDEO ENCODING DEVICE, VIDEO ENCODING PROGRAM, AND COMPUTER-READABLE RECORDING MEDIUM CONTAINING THE PROGRAM | |
| JP2011166207A (en) | Motion vector prediction method, motion vector prediction device, and motion vector prediction program | |
| JP2006191287A (en) | Image coding apparatus, image coding method, and image coding program | |
| JP4406887B2 (en) | Moving picture coding apparatus and moving picture coding method | |
| JP2008092137A (en) | Image coding apparatus and image coding method |