JP2018014030A - 画像処理装置、画像処理方法およびプログラム - Google Patents
画像処理装置、画像処理方法およびプログラム Download PDFInfo
- Publication number
- JP2018014030A JP2018014030A JP2016144312A JP2016144312A JP2018014030A JP 2018014030 A JP2018014030 A JP 2018014030A JP 2016144312 A JP2016144312 A JP 2016144312A JP 2016144312 A JP2016144312 A JP 2016144312A JP 2018014030 A JP2018014030 A JP 2018014030A
- Authority
- JP
- Japan
- Prior art keywords
- image
- specific area
- specific
- area
- region
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/167—Position within a video image, e.g. region of interest [ROI]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/20—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
【解決手段】画像処理装置100は、画像内の特定領域を検出する検出手段と、画像に対して符号化処理を実行する符号化手段と、符号化処理の対象となる第一画像と、第一画像に対して符号化処理が実行される前に検出手段により特定領域が検出されている第二画像との間の遅延情報と、第二画像内の特定領域に関する情報とに基づいて、第二画像内の特定領域を補正する補正手段と、を備える。符号化手段は、第一画像に対して、補正手段により補正された特定領域に対応する領域とそれ以外の領域とを異なる画質とする符号化処理を実行する。
【選択図】 図1
Description
特許文献1には、画像を分割したブロック毎に主要部分であるか否かを判別し、主要部分の画質を精細にするように画像信号を符号化する点が開示されている。このようにすれば、例えば監視カメラの画像において人物の顔や動きを精細にとらえつつ、長時間録画のために全体を低ビットレートに記録することができる。
そこで、本発明は、符号化処理を遅延させることなく、画像内における意図した特定領域の画質を適切に制御することを目的としている。
なお、以下に説明する実施の形態は、本発明の実現手段としての一例であり、本発明が適用される装置の構成や各種条件によって適宜修正又は変更されるべきものであり、本発明は以下の実施の形態に限定されるものではない。
図1は、画像処理装置100の構成例を示すブロック図である。画像処理装置100は、動画像の伝送や蓄積再生を行うために、画像の圧縮・符号化処理(以下、単に「符号化処理」ともいう。)を行う装置である。本実施形態においては、撮像装置に接続されたパーソナルコンピュータ(PC)等の機器が画像処理装置100として動作してもよいし、撮像装置が画像処理装置100として動作してもよい。ここで、撮像装置は、時系列上連続して複数の画像(フレーム)を撮像する監視用ビデオカメラ等である。画像処理装置100は、画像(撮像画像)を符号化処理し、符号化ストリームを出力する。
検出部101は、撮像画像を解析し、画像内の特定領域を検出する検出処理を実施する。ここで、特定領域は、画像内における重要な領域であり、例えば、監視対象である物体(人物の顔など)を含む領域である。検出部101は、検出した特定領域に関する情報を特定領域情報として、遅延算出部102および判定部103に出力する。特定領域情報は、画像内における特定領域の位置、大きさ、および当該特定領域を検出した画像のフレーム情報(時間情報)の少なくとも1つを含む。また、特定領域情報は、画像内における特定領域の移動方向および移動速度の少なくとも一方を含んでもよい。
ただし、特定領域は、図2の特定領域220のような矩形形状に限定されるものではなく、任意の形状とすることができる。また、特定領域の画像中における位置は、特定領域の中心位置に限定されるものではなく、特定領域の重心位置など、特定領域の位置を特定可能な位置であればよい。さらに、特定領域の画像中において占める大きさは、特定領域の横方向の大きさXsと縦方向の大きさYsとの積に限定されるものではなく、特定領域に占めるマクロブロックの個数で示してもよい。
つまり、遅延情報は、符号化処理の対象となる画像である第一画像と、第一画像に対して符号化処理を実行する前に検出処理により特定領域が検出されている画像である第二画像との間のフレーム遅延量を示す情報である。遅延算出部102は、算出した遅延情報を判定部103へ出力する。
制御部104は、判定部103から出力された補正後領域情報に基づいて、画像における量子化値を生成し、符号化部105に出力する。符号化部105は、符号化処理の対象となる画像のフレーム情報を遅延算出部102に出力すると共に、制御部104から得た量子化値を用いて、画像に対して符号化処理を施し、符号化ストリームを出力する。
そこで、本実施形態における画像処理装置100は、追加のバッファメモリおよび出力の遅延をなくすために、判定部103において、符号化処理を行う時点で得られている特定領域を補正する。具体的には、判定部103は、図3(d)に示すように特定領域221を移動して、画像202内の人物を包含する特定領域222aを設定したり、図3(e)に示すように特定領域221を拡大して特定領域222bを設定したりする。
このように、判定部103は、符号化処理の対象となる画像よりも前に撮像された画像に対する検出処理により検出された特定領域を補正することで、符号化処理の対象となる画像における特定領域(人物を含む領域)を推定する。そして、判定部103により補正された特定領域を、符号化処理の対象となる画像に適用し、特定領域に対応する領域を高画質にする画質制御を行うようにする。
画像処理装置100は、CPU11と、ROM12と、RAM13と、外部メモリ14と、通信I/F15と、システムバス16とを備える。
CPU11は、画像処理装置100における動作を統括的に制御するものであり、システムバス16を介して、各構成部(12〜15)を制御する。ROM12は、CPU11が処理を実行するために必要なプログラムを記憶する不揮発性メモリである。なお、上記プログラムは、外部メモリ14や着脱可能な記憶媒体(不図示)に記憶されていてもよい。RAM13は、CPU11の主メモリ、ワークエリアとして機能する。すなわち、CPU11は、処理の実行に際してROM12から必要なプログラムをRAM13にロードし、ロードしたプログラムを実行することで各種の機能動作を実現する。
図1に示す画像処理装置100の各部の機能は、CPU11がプログラムを実行することで実現することができる。ただし、図1に示す画像処理装置100の各部のうち少なくとも一部が専用のハードウェアとして動作するようにしてもよい。この場合、専用のハードウェアは、CPU11の制御に基づいて動作する。
ただし、図1に示す画像処理装置100の各要素のうち少なくとも一部が専用のハードウェアとして動作することで図5の処理が実現されるようにしてもよい。この場合、専用のハードウェアは、CPU11の制御に基づいて動作する。以降、アルファベットSはフローチャートにおけるステップを意味するものとする。
S3では、判定部103は、S1において検出された画像中の全ての特定領域について補正処理が完了したか否かを判定する。そして、補正処理が完了していない特定領域が存在する場合には、未処理の特定領域を補正処理対象の特定領域として選択してS4に移行する。一方、S1において検出された特定領域の個数が0であるか、もしくは全ての特定領域について補正処理が完了している場合にはS7に移行する。
判定部103がS4〜S6の処理を特定領域の個数分繰り返し、画像中の全ての特定領域について補正処理が完了すると、S7において、制御部104は、補正後の特定領域に基づいたブロック単位の画質制御(量子化値の決定)を行う。そして、符号化部105は、制御部104による画質制御に従って画像を符号化する。このS7における画質制御処理の具体的な方法については後述する。
まず、遅延情報に基づいた補正について説明する。特定領域を得た画像とこれから符号化しようとしている画像の時間差が大きいほど、画像中の人物(特定領域)は、画像内で大きく移動していると考えられる。そこで、上記時間差が大きいほど、特定領域の補正量を大きくしてよい。特定領域の補正方法は、図3(d)および図3(e)に示す特定領域の移動および拡大の少なくとも一方を含む。つまり、上記時間差が大きいほど、特定領域の移動量を大きくしたり、特定領域の拡大量を大きくしたりすることができる。
図6(a)に示すように、実空間301において、被写体302および303をカメラ304によって撮像した場合、被写体302および303は、撮像画像311中では検出対象312および313としてとらえられる。このように、実空間301においてカメラ304に近い側に位置する被写体303に対応する検出対象313は、撮像画像311中においてより大きい領域を占めることになる。
また、被写体302および303が実空間301上で概ね同じ速度で移動している場合、撮像画像311中では、被写体302に対応する検出対象312よりも、よりカメラ304に近い被写体303に対応する検出対象313の方が大きく移動する。つまり、撮像画像311中で、より大きい領域を占めている検出対象は、より速く移動すると考えられる。
このような場合には、カメラ324が固定されており、被写体の出現位置が限定される(被写体は人物であり、通常歩いている限り、実空間321中の下側のみに存在し、上側には存在しない)ことに着目する。前述の限定を考慮すると、撮像画像331中の下側に位置する検出対象333に対応する被写体は、上側に位置する検出対象332に対応する被写体と比較して、よりカメラに近い位置に存在すると判断することができる。つまり、撮像画像331中のより下側に位置する検出対象は、より速く移動すると考えられる。
まずS71において、制御部104は、画像内の全てのマクロブロック(MB)の画質制御処理を完了したか否かを判定し、完了していない場合にはS72に移行し、完了している場合には処理を終了する。S72では、制御部104は、未処理のマクロブロックを処理対象のマクロブロックとして1つ選択し、S73〜S75における領域判定処理に移る。領域判定処理は、処理対象のマクロブロックが特定領域に含まれるか否かを判定する処理である。この領域判定処理は、画像内の特定領域ごとに行われる。
S77では、処理対象のマクロブロックの量子化値を、特定領域用の所定の値に設定し、S78に移行する。ここで、特定領域用の量子化値は、特定領域を高画質にするために重みづけされた値であり、画像(フレーム)ごとに予め指定されているものとする。
さらに、画像処理装置100は、特定領域の補正処理の指標として、検出処理により検出された特定領域の画像内における位置および大きさの少なくとも一方を用いることができる。カメラに近い位置に存在する被写体に対応する画像内の検出対象は、カメラから遠い位置に存在する同一速度で移動する被写体に対応する画像内の検出対象と比較して、画像内での動きが大きい。特定領域の画像内における位置および大きさの少なくとも一方に基づいて、対応する被写体のカメラとの位置関係を把握することができるため、適切に特定領域を補正することができる。
なお、画像処理装置100は、特定領域の補正処理の指標として、さらに特定領域の画像内における移動方向および移動速度の少なくとも一方を用いてもよい。この場合、より精度良く特定領域を補正することができる。
以上のように、本実施形態における画像処理装置100は、符号化処理を遅延させることなく、画像内における意図した特定領域の画質を適切に制御することができる。
次に、本発明の第二の実施形態について説明する。
第二の実施形態では、特定領域の位置および大きさに基づいて、特定領域の補正量を横方向(X方向)と縦方向(Y方向)とで個別に決定する場合について説明する。
本実施形態における画像処理装置100の全体構成は、図1に示す構成と同様である。また、本実施形態で使用する特定領域情報は、図2に示す情報と同様である。画像処理装置100は、上述した第一の実施形態と同様に、特定領域情報と遅延情報とに基づいて、補正処理における特定領域の補正量を決定する。ただし、画像処理装置100において、判定部103の処理は、上述した第一の実施形態とは異なる。
ここで、端部領域は、画像の端部位置を含む所定範囲の領域であり、画像の横方向(X方向)および縦方向(Y方向)の座標値の少なくとも一方が、所定の閾値以下、もしくは所定の閾値以上となる領域である。なお、本実施形態では、画像の端部位置を全て含む領域を端部領域として説明するが、画像の端部位置の少なくとも一部を含む領域を端部領域として設定してもよい。端部領域は、カメラの設置場所や撮像対象に応じて適宜設定することができる。
横位置判定部103aは、検出部101から得た特定領域情報の横方向の座標値をもとに、特定領域の横方向(X方向)位置が画像の端部領域に相当する位置に存在しているか否かを判定する。縦位置判定部103bは、検出部101から得た特定領域情報の縦方向の座標値をもとに、特定領域の縦方向(Y方向)位置が画像の端部領域に相当する位置に存在しているか否かを判定する。
具体的には、判定部103は、図9に示すように画像401に端部領域402を設定し、特定領域が端部領域402内に存在するか否かを判定する。端部領域402は、横方向には座標値X0およびX1(X0<X1<Xmax)、縦方向には座標値Y0およびY1(Y0<Y1<Ymax)によって定められる領域である。特定領域の位置を示す座標値(X,Y)がX≦X0、X≧X1、Y≦Y0、Y≧Y1の少なくとも1つを満たす場合、判定部103は、その特定領域が端部領域402内に存在すると判定する。
横座標補正部103eは、遅延情報と、横位置判定部103aおよび横サイズ判定部103cの判定結果とに基づいて、特定領域の横方向の補正量を決定し、特定領域を横方向に補正する。縦座標補正部103fは、遅延情報と、縦位置判定部103bおよび縦サイズ判定部103dの判定結果とに基づいて、特定領域の縦方向の補正量を決定し、特定領域を縦方向に補正する。
ただし、図1に示す画像処理装置100の各要素のうち少なくとも一部が専用のハードウェアとして動作することで図10の処理が実現されるようにしてもよい。この場合、専用のハードウェアは、CPU11の制御に基づいて動作する。
S13では、判定部103は、S11において検出された画像中の全ての特定領域について補正処理が完了したか否かを判定する。そして、S11において検出された特定領域の個数が0であるか、もしくは全ての特定領域について補正処理が完了している場合にはS14に移行する。S14の処理は、上述した図5のS7の処理(図7の画質制御処理)と同様である。一方、判定部103は、S13において、補正処理が完了していない特定領域が存在すると判定した場合には、未処理の特定領域を補正処理対象の特定領域として選択してS15に移行する。
そして、Y≦Y0またはY≧Y1である場合には、判定部103は、特定領域が端部領域に位置すると判定してS17に移行する。S17では、判定部103は、特定領域が大きく移動している可能性があるとして、補正量を基本補正量に対して増加させてから、S21以降の特定領域の大きさの判定処理に移る。一方、Y0<Y<Y1である場合には、S13において、判定部103は、S18以降の特定領域の横方向の位置判定処理に移る。
そして、X≦X0またはX≧X1である場合には、判定部103は、特定領域が端部領域に位置すると判定してS20に移行する。S20では、判定部103は、特定領域が大きく移動している可能性があるとして、補正量を基本補正量に対して増加させてから、S21以降の特定領域の大きさの判定処理に移る。一方、X0<X<X1である場合には、S19において、判定部103は、特定領域が端部領域に位置していないと判定し、S21以降の特定領域の大きさの判定処理に移る。
S27では、判定部103は、S17、S20、S23、S26において増加させた(あるいは増加させなかった)補正量を用いて、特定領域の位置および大きさを補正し、S13に戻る。
このように、カメラにより近い被写体であるほど、対応する検出対象が画像の端部位置により近い位置に存在し、画像内における大きさが大きいことを利用して、特定領域の補正量を決定することができる。したがって、過去の特定領域検出結果に基づいた現在の特定領域の推定に要する演算を簡略化することが可能となる。
次に、本発明の第三の実施形態について説明する。
第三の実施形態では、過去の検出結果をもとに補正された特定領域と、実際の検出結果とを比較し、特定領域の補正処理の度合いを調整する場合について説明する。
図11は、本実施形態における画像処理装置100´の全体構成を示す図である。図11に示す画像処理装置100´は、補正量調整部106が追加されていることを除いては、図1に示す画像処理装置100と同様の構成を有する。したがって、図11では、図1の画像処理装置100と同様の構成を有する部分には図1と同一符号を付し、以下、構成が異なる部分を中心に説明する。
入力画像撮像処理501では、一定時間ごとに画像が生成(撮像)される。特定領域検出処理502では、入力画像撮像処理501にて生成された画像に対して順次検出処理が行われ、画像中の特定領域が検出される。補正量調整処理503では、特定領域検出処理502にて過去に検出された特定領域に対する補正処理により得られた補正後の特定領域と、特定領域検出処理502にて実際に検出された特定領域とを比較し、補正処理における特定領域の補正量の調整を行う。領域補正画質制御処理504では、補正量調整処理503にて調整された補正量を用いて特定領域を補正し、画像の画質制御を行う。符号化処理505では、特定領域を高画質に符号化する。
時刻t1_1では、入力画像撮像処理501によりフレーム#1の画像601が生成され、時刻t1_2において、フレーム#1に対する特定領域検出処理502および符号化処理505が開始される。画像601には、検出対象となる被写体602が存在している。そのため、フレーム#1に対する特定領域検出処理502により、被写体602に対応する特定領域603が検出される。なお、フレーム#1に関しては、符号化処理の開始時点では特定領域の検出結果が存在しない。そのため、特定領域と非特定領域に関する画質制御処理は行われない。
そして、時刻t2_2では、フレーム#2に対する特定領域検出処理502および符号化処理505が開始される。フレーム#2の画像605には、検出対象となる被写体606が存在している。そのため、フレーム#2に対する特定領域検出処理502では、被写体606に対応する特定領域607が検出される。ここで、被写体606は、フレーム#1の画像601内に存在する被写体602が図13における右方向に移動したものである。
時刻t3_3では、補正量調整処理503が行われる。この補正量調整処理503では、フレーム#2の特定領域の検出結果を補正した特定領域608と、フレーム#3から検出された特定領域611との照合が行われる。図13の例では、特定領域608が特定領域611を包含するため、さらなる補正量の調整は必要ないと判断される。よって、時刻t4_1における領域補正画質制御処理504で用いる特定領域の補正の度合いは、時刻t3_1における前フレームのときと同一となる。時刻t4_1では、特定領域611を、特定領域607に対する補正処理と同等の補正量で補正した特定領域612が得られる。
以上述べたような処理を繰り返し、特定領域の補正度合いを都度更新していく。
まずS31では、補正量調整部106は、フレーム番号に対応するカウンタ値Mの初期化処理を行い、カウンタ値Mを初期値である1に設定する。次にS32では、補正量調整部106は、検出処理により検出された特定領域の個数Nを順次処理するためのカウンタ値iの初期化処理を行い、カウンタ値iを初期値である1に設定する。
そして、特定領域OE(i)が、特定領域OR(i)よりもK倍以上大きい場合には、補正後の特定領域OE(i)が実際の特定領域OR(i)を包含しているが、特定領域OE(i)が特定領域OR(i)に対して大きすぎると判定し、S39に移行する。一方、特定領域OR(i)に対する特定領域OE(i)の大きさの比が、所定値Kよりも小さい場合には、特定領域OE(i)は特定領域OR(i)に対して適切な大きさであると判定し、S40に移行する。S39では、特定領域OE(i)の大きさを、特定領域OR(i)を包含する範囲内で小さくなるように、具体的には、特定領域OE(i)と特定領域OR(i)との比が所定値Kを下回るように補正量を減少する方向に調整し、S40に移行する。具体的な調整方法に関しては後述する。
S42では、補正量調整部106は、フレーム番号のカウンタ値Mを1つ増やしてS43に移行し、最終フレームまで処理を終えたか否かを判定する。そして、最終フレームまで処理を終えている場合には図14の処理を終了し、最終フレームまで処理を終えていない場合にはS32に戻って次フレームの処理を行う。
図15(a)において、領域701は、検出処理により実際に検出された特定領域であり、上述した特定領域OR(i)に相当する。また、領域702は、前フレームにおける特定領域の検出結果703を補正して得られた特定領域であり、特定領域OE(i)に相当する。ここで、補正後の領域702は、検出結果703を所定の補正量により拡大したものである。領域702は、領域701を包含していないため、補正量調整部106は、補正量の調整処理において、領域702が領域701を包含するように補正量を調整する。具体的には、図15(a)の例では、領域704のように補正領域の横方向の幅が拡大するように、補正量を調整する。
領域721の大きさが15ブロック、補正後の領域722の大きさが50ブロック、所定値K=2であるとすると、領域722は、領域721に対してK倍(2倍)以上大きい。そのため、この場合には、補正量調整部106は、領域722が領域721を包含する範囲で(領域722と領域721との大きさの比が所定値を下回るように)補正量を減少する方向に調整する。具体的には、補正量調整部106は、領域724のように補正領域の横方向の幅が減少するように、補正量を調整する。
以上のように、本実施形態における画像処理装置100´は、検出処理により検出された符号化処理の対象となる画像内の特定領域に関する情報に基づいて、補正処理で用いる特定領域の補正量を調整する。
一方、特定領域OE(i)が特定領域OR(i)に包含されている場合には、特定領域OE(i)と特定領域OR(i)との比が所定値以上であるか否かを判定する。そして、特定領域OE(i)と特定領域OR(i)との比が所定値以上である場合、特定領域OE(i)と特定領域OR(i)との比が所定値を下回るように、特定領域の補正量を減少する方向に調整する。
このように、過去の特定領域検出結果を補正した特定領域と実際の特定領域検出結果とを照合し、補正量を都度調整するので、特定領域の補正処理の精度を高めることが可能となる。
次に、本発明の第四の実施形態について説明する。
上述した第二の実施形態では、特定領域の位置および大きさに関する情報に基づいて、閾値判定により補正処理を行う場合について説明した。このような補正処理は、カメラで撮像する場面や検出対象となる被写体の属性等に応じて、その都度、閾値と対応する補正量とを変える必要がある。第四の実施形態では、ルックアップテーブルを用いて状況に応じた特定領域の補正量を導出する場合について説明する。
このような状況下においては、人物802〜804の移動は橋805および川806によって制限されるため、撮像画像811中における検出対象812〜814についても、想定される移動位置は制限される。そのため、検出処理により検出された特定領域の位置および大きさを単純に補正処理に用いることはできない。つまり、より複雑な閾値および補正量の組み合わせを設定し保持しておく必要がある。
以下、本実施形態において使用する参照テーブルに関して、図17を用いて説明する。図17は横Xmax、縦Ymaxで構成される撮像画像に対し、横方向(X方向)のm個の閾値および縦方向(Y方向)のn個の閾値に対応する、m×n個の補正量Cの関係を示している。判定部103は、撮像画像から検出された特定領域の座標値(X,Y)に対応した補正量Cに基づいて、特定領域の補正処理を行う。
図19は、本実施形態の判定部103が実行する特定領域の補正処理を示すフローチャートである。画像処理装置100は、CPU11が必要なプログラムを読み出して実行することにより、図19に示す処理を実現することができる。
ただし、判定部103が専用のハードウェアとして動作することで図19の処理が実現されるようにしてもよい。この場合、専用のハードウェアは、CPU11の制御に基づいて動作する。
以上のように、本実施形態における画像処理装置100によれば、参照テーブル(ルックアップテーブル)を参照して特定領域の補正量を導出するので、演算コストを削減しつつ状況に応じた特定領域の補正が可能となる。
次に、本発明の第五の実施形態について説明する。
第五の実施形態では、特定領域の画質制御処理の粒度を変更する場合について説明する。HEVC符号化標準等の符号化形式では、符号化するブロック単位とは別に、画質制御パラメータを設定可能なブロック、すなわち画質を変えることの可能なブロックの粒度(画質制御粒度)を設定可能である。
符号化するブロック単位の細かい画質制御が必要ない場合には、画質制御粒度を粗くして、ブロック単位に必要となるヘッダ情報のうち不要なものを削減することで、圧縮後のデータ量を少なくすることが可能となる。HEVC符号化標準においては、diff_cu_qp_delta_depthパラメータが画質制御粒度に相当し、フレーム単位に変更することが可能である。
以上のように、本実施形態における画像処理装置100によれば、補正処理により補正された特定領域に関する情報に基づいて画質制御処理の粒度を変更し、適切な粒度で画質制御を行うことができる。したがって、不要なヘッダ情報を削減し、圧縮後のデータ量を少なくすることが可能となる。
上記各実施形態においては、画質制御処理として、画像内の特定領域を高画質にする処理を行う場合について説明したが、画像内の特定領域を低画質にする処理を行う場合にも適用可能である。
また、上記各実施形態においては、過去の特定領域検出結果のうち、最新の特定領域結果に基づいて特定領域の補正処理を行う場合について説明したが、補正処理に用いる特定領域結果は、最新の特定領域結果に限定されない。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
Claims (13)
- 画像内の特定領域を検出する検出手段と、
画像に対して符号化処理を実行する符号化手段と、
前記符号化処理の対象となる第一画像と、前記第一画像に対して前記符号化処理が実行される前に前記検出手段により特定領域が検出されている第二画像との間の遅延情報と、前記第二画像内の特定領域に関する情報とに基づいて、前記第二画像内の特定領域を補正する補正手段と、を備え、
前記符号化手段は、前記第一画像に対して、前記補正手段により補正された特定領域に対応する領域とそれ以外の領域とを異なる画質とする符号化処理を実行することを特徴とする画像処理装置。 - 前記特定領域に関する情報は、画像内における前記特定領域の位置、大きさ、移動方向および移動速度の少なくとも1つに関する情報を含むことを特徴とする請求項1に記載の画像処理装置。
- 前記補正手段は、前記特定領域の大きさおよび位置の少なくとも一方を補正することを特徴とする請求項1または2に記載の画像処理装置。
- 前記補正処理は、前記第一画像に対する前記第二画像の遅延が大きいほど、前記特定領域の補正量を大きくすることを特徴とする請求項1から3のいずれか1項に記載の画像処理装置。
- 前記補正処理は、画像内における前記特定領域の位置が前記画像の端部位置に近いほど、前記特定領域の補正量を大きくすることを特徴とする請求項1から4のいずれか1項に記載の画像処理装置。
- 前記補正処理は、画像内における前記特定領域の大きさが大きいほど、前記特定領域の補正量を大きくすることを特徴とする請求項1から5のいずれか1項に記載の画像処理装置。
- 前記検出手段により検出された前記第一画像内の特定領域に関する情報に基づいて、前記補正手段で用いる特定領域の補正量を調整する調整手段をさらに備えることを特徴とする請求項1から6のいずれか1項に記載の画像処理装置。
- 前記調整手段は、
前記補正手段により補正された特定領域である第一領域が、前記検出手段により検出された前記第一画像内の特定領域である第二領域に包含されていない場合、前記第一領域が前記第二領域に包含されるように、前記補正量を増加する方向に調整することを特徴とする請求項7に記載の画像処理装置。 - 前記調整手段は、
前記補正手段により補正された特定領域である第一領域が、前記検出手段により検出された前記第一画像内の特定領域である第二領域に包含されており、前記第一領域と前記第二領域との比が所定値以上である場合、前記第一領域と前記第二領域との比が前記所定値を下回るように、前記補正量を減少する方向に調整することを特徴とする請求項7または8に記載の画像処理装置。 - 前記補正手段は、ルックアップテーブルを参照して前記特定領域の補正量を導出することを特徴とする請求項1から9のいずれか1項に記載の画像処理装置。
- 前記符号化手段は、前記補正手段により補正された特定領域に関する情報に基づいて、画質制御処理の粒度を変更することを特徴とする請求項1から10のいずれか1項に記載の画像処理装置。
- 画像内の特定領域を検出する検出処理を実行するステップと、
符号化処理の対象となる第一画像と、前記第一画像に対して前記符号化処理が実行される前に前記検出処理により特定領域が検出されている第二画像との間の遅延情報と、前記第二画像内の特定領域に関する情報とに基づいて、前記第二画像内の特定領域を補正するステップと、
前記第一画像に対して、前記補正された特定領域に対応する領域とそれ以外の領域とを異なる画質とする符号化処理を実行するステップと、を含むことを特徴とする画像処理方法。 - コンピュータを、請求項1から11のいずれか1項に記載の画像処理装置の各手段として機能させるためのプログラム。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2016144312A JP6758977B2 (ja) | 2016-07-22 | 2016-07-22 | 画像処理装置、画像処理方法およびプログラム |
| US15/651,919 US10477221B2 (en) | 2016-07-22 | 2017-07-17 | Image processing apparatus for controlling image quality of a specific region in an image while minimizing delay of the encoding process |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2016144312A JP6758977B2 (ja) | 2016-07-22 | 2016-07-22 | 画像処理装置、画像処理方法およびプログラム |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JP2018014030A true JP2018014030A (ja) | 2018-01-25 |
| JP2018014030A5 JP2018014030A5 (ja) | 2019-08-15 |
| JP6758977B2 JP6758977B2 (ja) | 2020-09-23 |
Family
ID=60988996
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2016144312A Active JP6758977B2 (ja) | 2016-07-22 | 2016-07-22 | 画像処理装置、画像処理方法およびプログラム |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US10477221B2 (ja) |
| JP (1) | JP6758977B2 (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US12159438B2 (en) * | 2021-04-19 | 2024-12-03 | Tencent America LLC | Substitutional input optimization for adaptive neural image compression with smooth quality control |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2006101075A (ja) * | 2004-09-29 | 2006-04-13 | Sanyo Electric Co Ltd | 画像圧縮装置 |
| JP2007306305A (ja) * | 2006-05-11 | 2007-11-22 | Matsushita Electric Ind Co Ltd | 画像符号化装置及び画像符号化方法 |
| JP2008048243A (ja) * | 2006-08-18 | 2008-02-28 | Sony Corp | 画像処理装置、画像処理方法および監視カメラ |
| JP2013005062A (ja) * | 2011-06-13 | 2013-01-07 | Canon Inc | 画像処理装置、画像処理方法 |
Family Cites Families (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2578986B2 (ja) | 1989-07-18 | 1997-02-05 | シャープ株式会社 | カラー画像符号化伝送装置 |
| JP2012244437A (ja) * | 2011-05-19 | 2012-12-10 | Canon Inc | 画像処理装置、画像処理方法 |
| JP6226578B2 (ja) * | 2013-06-13 | 2017-11-08 | キヤノン株式会社 | 画像符号化装置、画像符号化方法及びプログラム |
| US10911779B2 (en) * | 2013-10-17 | 2021-02-02 | Nippon Telegraph And Telephone Corporation | Moving image encoding and decoding method, and non-transitory computer-readable media that code moving image for each of prediction regions that are obtained by dividing coding target region while performing prediction between different views |
-
2016
- 2016-07-22 JP JP2016144312A patent/JP6758977B2/ja active Active
-
2017
- 2017-07-17 US US15/651,919 patent/US10477221B2/en active Active
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2006101075A (ja) * | 2004-09-29 | 2006-04-13 | Sanyo Electric Co Ltd | 画像圧縮装置 |
| JP2007306305A (ja) * | 2006-05-11 | 2007-11-22 | Matsushita Electric Ind Co Ltd | 画像符号化装置及び画像符号化方法 |
| JP2008048243A (ja) * | 2006-08-18 | 2008-02-28 | Sony Corp | 画像処理装置、画像処理方法および監視カメラ |
| JP2013005062A (ja) * | 2011-06-13 | 2013-01-07 | Canon Inc | 画像処理装置、画像処理方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP6758977B2 (ja) | 2020-09-23 |
| US20180027242A1 (en) | 2018-01-25 |
| US10477221B2 (en) | 2019-11-12 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| TWI660626B (zh) | 用於編碼視訊串流的方法和系統 | |
| US8983217B2 (en) | Stereo image encoding apparatus, its method, and image pickup apparatus having stereo image encoding apparatus | |
| EP2727330B1 (en) | Encoder-supervised imaging for video cameras | |
| JP4252916B2 (ja) | 動きベクトルの探索範囲を決定する方法 | |
| CN108737837A (zh) | 形成视频流的方法及图像处理单元 | |
| US11089211B2 (en) | Image processing apparatus, image processing method, and program for switching between two types of composite images | |
| US11025906B2 (en) | Method for intra refresh encoding of a plurality of image frames | |
| KR20150084767A (ko) | 이미지들의 시퀀스에서의 조명 변동들을 보상하기 위한 방법 및 장치 | |
| US20170214915A1 (en) | Image encoding device and image encoding method | |
| KR101585022B1 (ko) | 영상 감시 시스템에 있어서 움직임 감지를 위한 스트리밍 정보 분석 시스템 및 움직임 감지를 위한 스트리밍 정보 분석 방법 | |
| US20140233645A1 (en) | Moving image encoding apparatus, method of controlling the same, and program | |
| US9008358B2 (en) | Encoding a specific area with higher quality than a non-specific area | |
| US20090161758A1 (en) | Code amount control method, code amount control device, and camera system | |
| US9210433B2 (en) | Image processing apparatus and image processing method | |
| JP2015050661A (ja) | 符号化装置、符号化装置の制御方法、及び、コンピュータプログラム | |
| JP4833309B2 (ja) | 動画像圧縮符号化装置 | |
| JP6758977B2 (ja) | 画像処理装置、画像処理方法およびプログラム | |
| JP5662896B2 (ja) | 映像静止判定方法、映像静止判定装置、及びプログラム | |
| US20200204805A1 (en) | Method of encoding a video sequence | |
| TWI493942B (zh) | 動畫像編碼方法、動畫像編碼裝置及動畫像編碼程式 | |
| JPS6146685A (ja) | 動画像信号の予測符号化装置 | |
| US11303903B2 (en) | Method and system for encoding an image of a video sequence involving calculation of a cost for encoding a coherent region | |
| US9948932B2 (en) | Image processing apparatus and control method of image processing apparatus | |
| CN116896636B (zh) | 一种自适应可变码率的码率控制方法及装置 | |
| JP4507896B2 (ja) | 動画像圧縮装置と動画像圧縮処理方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190705 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190705 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200519 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200625 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200804 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200902 |
|
| R151 | Written notification of patent or utility model registration |
Ref document number: 6758977 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
| RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D03 |