JP2011053951A - 画像処理装置 - Google Patents
画像処理装置 Download PDFInfo
- Publication number
- JP2011053951A JP2011053951A JP2009202799A JP2009202799A JP2011053951A JP 2011053951 A JP2011053951 A JP 2011053951A JP 2009202799 A JP2009202799 A JP 2009202799A JP 2009202799 A JP2009202799 A JP 2009202799A JP 2011053951 A JP2011053951 A JP 2011053951A
- Authority
- JP
- Japan
- Prior art keywords
- frame
- area
- face
- subject
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
【解決手段】
画像処理装置が、動画像に係る前フレーム(第1のフレーム)と前フレームに後続する後フレーム(第2のフレーム)との間で、画像情報が変化している領域を抽出し、前フレームでの被写体の検出に関する被写体領域と抽出した領域とに基づいて、後フレームの探索領域を設定し、設定した後フレームの探索領域内で被写体を判別することによって課題を解決する。
【選択図】図1
Description
記憶装置2は、磁気記憶装置、半導体メモリ等のストレージデバイスであり、CPU1の動作に基づき読み込まれたプログラム、長時間記憶しなくてはならないデータ等を記憶する。
本実施形態では、CPU1が、記憶装置2に格納されたプログラムの手順に従って処理を行うことによって、画像処理装置における機能及び後述するフローチャートに係る処理が実現される。
出力装置4は、液晶パネル、外部モニタ、スピーカ等であり、各種の情報を出力する。
撮像装置5は、カムコーダ等であり、CCD(Charge Coupled Devices)、CMOS(Complementary Metal Oxide Semiconductor)等の撮像素子を備える。なお、撮像装置5で撮像された動画像データは、記憶装置2等に記憶される。また、動画像は、一連の複数のフレームを含んで構成され、各フレームに対応する静止画像を有している。
画像メモリ部20は、記憶装置2に設けられる記憶領域である。画像メモリ部20は、画像入力部10から出力された画像データを一時的に記憶する。なお、画像メモリ部20が動画像データを一時的に記憶する構成を採用してもよい。
照合パターン抽出部40は、画像縮小部30で縮小された画像データから所定の部分領域を照合対象のパターン(いわゆる照合パターン)として抽出する。
輝度補正部50は、照合パターン抽出部40で抽出された照合パターンの輝度分布を補正する。
顔判別部60は、照合パターン抽出部40で抽出され、輝度補正部50で補正された照合パターンが顔パターンであるか非顔パターンであるかを判別するための顔確率を出力する。
顔領域出力部80は、顔確率分布統合部70による統合の結果に基づいて顔と判別される照合パターンに対応する部分領域を出力装置4等に出力する。
探索領域設定部100は、前フレームにおける顔確率分布統合部70の結果及び変化領域抽出部90で抽出されたフレーム間の変化領域から後フレームにおける探索領域を設定する。
ここで、入力される画像データは、例えば8ビットの画素により構成される2次元配列のデータであり、R、G、B、3つの面により構成される。このとき、画像データがJPEG(Joint Photographic Experts Group)等の方式により圧縮されている場合は、圧縮に対応する解凍方式に従って画像データを解凍し、RGB各画素により構成される画像データとする。
さらに、本実施形態では、画像入力部10は、RGB各画素により構成される画像データに含まれる輝度データより、輝度成分からなる輝度画像データ(例えば、色差成分を排した画像データ)を生成し、以後の処理に適用する。なお、輝度画像データは、画像メモリ部20に記憶される。また、画像データとしてYCrCbのデータを入力する場合は、Y成分をそのまま輝度データとして採用し、輝度画像データが生成されてもよい。
参考文献1:Rowley et al, "Neural network-based face detection", IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, VOL.20 , NO.1, JANUARY 1998
まず、顔の検出を対象とする画像データがメモリに読み込まれ、顔と照合する所定の領域が読み込まれた画像から切り出される。そして、切り出された領域の画素値の分布を入力としてニューラルネットワークによる演算で一つの出力が得られる。このとき、ニューラルネットワークの重み及び閾値が、膨大な顔画像パターンと非顔画像パターンとにより予め学習されている。例えば、ニューラルネットワークの出力が0以上なら顔、それ以外は非顔であると判別される。そして、ニューラルネットワークの入力である顔と照合する画像パターンの切り出し位置が、例えば、画像全域から縦横順次に走査されていくことにより、画像中から顔が検出される。また、様々な大きさの顔の検出に対応するため、読み込んだ画像が所定の割合で順次縮小され、それに対して前述した顔検出の走査が行われるようにしている。
ここで、図3を参照して、照合パターンについて説明する。
図3に示すAの列は、画像縮小部30で縮小された夫々の縮小輝度画像を示し、ステップS103では、夫々の縮小輝度画像に対して所定の大きさの部分領域(例えば、矩形領域)が切り出される。すなわち、各縮小輝度画像には、同じ大きさの矩形領域が設定され、矩形領域が照合パターンとして順次抽出される。
また、図3に示すBの列は、夫々の縮小輝度画像から縦横順次に走査を繰り返していく途中の切り出しの様子を示している。図示するように、縮小率の大きな画像から照合パターンを切り出して顔の判別を行う場合には、画像に対して大きな領域において顔の検出を行うことになる。
ここで、顔判別の方法は、公知の方法(例えば、参考文献1、2、3を参照のこと。)を用いてもよい。
参考文献2:Schneiderman and Kanade, "A statistical method for 3D object detection applied to faces and cars", Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR2000)
参考文献3:Viola and Jones, "Rapid Object Detection using Boosted Cascade of Simple Features", Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR'01)
また、参考文献3では、処理の高速化に着目し、AdaBoostを使って多くの弱判別器を有効に組合せて顔判別の精度を向上させる一方、夫々の弱判別器をHaarタイプの矩形特徴量で構成し、矩形特徴量の算出を、積分画像を利用して高速に行っている。また、AdaBoost学習によって得た判別器を直列に繋ぎ、カスケード型の顔検出器を構成するようにしている。このカスケード型の顔検出器は、まず前段の単純な判別器(すなわち計算量のより少ない判別器)を使って明らかに顔でないパターンの候補をその場で除去する。そして、それ以外の候補に対してのみ、より高い識別性能を持つ後段の複雑な判別器(すなわち計算量のより多い判別器)を使って顔であるか否かの判定を行なう。このように、すべての候補に対して複雑な判定を行う必要がないので処理が高速となる。
また、顔判別部として複数の判別器によって顔の判別を行う場合には、複数の判別器の出力値の加重平均等を算出して顔確率の値を出力するようにしてもよい。
例えば、縮小倍率s、切り出し位置x、yにおける顔判別部60で得た顔確率をP(s,x,y)とする。ここで、顔確率分布における、縮小倍率s、切り出し位置x、yに対応する値(この場合、初期値で所定の値が設定されている)をPOLD(s,x,y)とすると、統合後の顔確率分布における値PNEW(s,x,y)は、以下の式(1)により算出される。ただし、αは、所定の統合パラメータであり、0<α<1を満たす。
例えば、変化領域抽出部90は、各フレームの輝度画像の輝度値の差分演算を行い、輝度値の差が所定の閾値を超える画素が含まれる領域を変化領域とする。
より詳細には、変化領域抽出部90は、変化領域の画素と変化領域以外の領域の画素とを識別するために2値化処理を行う。さらに、画像ノイズの影響を低減するために、変化領域抽出部90は、2値化処理後の輝度画像データを所定の近傍領域の輝度画像データをもとに平滑化処理を繰り返し、所定面積以上の変化領域に統合していく。なお、変化領域抽出部90は、例えば、2値化処理後の輝度画像データに対してモルフォロジー的オープニング処理を行って変化領域を算出するようにしてもよい。
また、変化領域抽出部90は、各フレームの輝度画像の輝度値の差分をもとに変化領域を算出する構成に加えて又は代えて、各フレームのカラー画像から肌色確率の分布を抽出し、各フレームにおける肌色確率の差分をもとに変化領域を算出するようにしてもよい。なお、肌色確率は、肌色の確率分布を表した混合ガウスモデルにより行う方法(例えば、参考文献4を参照のこと。)等を適用して算出する。
参考文献4:Jones and Rehg, "Statistical color models with application to skin detection", International Journal of Computer Vision, VOL.46, NO.1, JANUARY 2002
なお、複数フレームの輝度画像データから動きベクトルを抽出して、カメラの運動パラメータを算出する方法については、公知の方法(例えば、参考文献5を参照のこと。)を用いることができる。
参考文献5:武川、宮島,「時系列画像からの3次元運動と形状解析」,コンピュータビジョン技術評論と将来展望,新技術コミュニケーションズ(1998)
より具体的に説明すると、まず、探索領域設定部100は、顔領域出力部80で出力された領域を第1の探索領域として抽出する。そして、探索領域設定部100は、変化領域抽出部90で抽出されたフレーム間の変化領域を第2の探索領域として抽出する。ここで、縮小処理が行われている場合には、探索領域設定部100は、縮小処理により得られた輝度画像における領域に同様の縮小処理により変化領域を縮小した領域を設定し、第2の探索領域として抽出する。そして、探索領域設定部100は、第1の探索領域と第2の探索領域との論理和を探索領域として設定する。
なお、第1の探索領域として用いる領域(例えば顔領域)は、顔確率分布統合部70の出力である顔確率分布における値が所定の値以上の領域を全て用いるようにしてもよい。また、第1の探索領域は、顔領域に対する所定の近傍領域を含めた領域を出力するようにしてもよい。例えば、近傍領域は、顔領域に接する部分領域である。
なお、ステップS201からステップS211までの処理は、動画像データにおける全フレームにて終了するまで順次繰り返される。
参考文献6:Mikolajczyk et al, "Face detection in a video sequence - a temporal approarch", Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR'01)
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
つまり、各実施形態の構成によれば、高速、高精度に動画像から所定の被写体を検出する装置を提供することができる。すなわち、被写体領域とフレーム間変化領域とに探索領域を絞ることにより高速化が実現できる。さらに、探索領域として被写体領域を含むため、フレーム間の時間的変化が小さい場合にも対応できる。また、探索領域としてフレーム間の変化領域も含むため、新しい被写体の出現にも対応できる。さらに、複数フレームでの検出結果を統合するので、フレームごとに被写体検出を行う場合に比べて安定して高精度の検出が行える。
Claims (4)
- 動画像に係る第1のフレームと該第1のフレームに後続する第2のフレームとの間で、画像情報が変化している領域を抽出する抽出手段と、
前記第1のフレームでの被写体の検出に関する被写体領域と前記抽出手段で抽出された領域とに基づいて、前記第2のフレームの探索領域を設定する設定手段と、
前記設定手段で設定された前記第2のフレームの探索領域内で被写体を判別する判別手段と、
を有する、画像処理装置。 - 前記判別手段により前記第2のフレームの探索領域内で被写体が判別された結果と、前記第2のフレームの探索領域に対応する前記第1のフレームの領域で被写体が判別された結果と、を統合する統合手段と、
前記統合手段で統合された結果に基づいて、前記第2のフレームでの被写体の検出に関する被写体領域を出力する出力手段と、
を更に有する、請求項1記載の画像処理装置。 - 動画像に係る第1のフレームと該第1のフレームに後続する第2のフレームとの間で、画像情報が変化している領域を抽出する抽出ステップと、
前記第1のフレームでの被写体の検出に関する被写体領域と前記抽出ステップで抽出された領域とに基づいて、前記第2のフレームの探索領域を設定する設定ステップと、
前記設定ステップで設定された前記第2のフレームの探索領域内で被写体を判別する判別ステップと、
を有する、画像処理方法。 - 動画像に係る第1のフレームと該第1のフレームに後続する第2のフレームとの間で、画像情報が変化している領域を抽出する抽出ステップと、
前記第1のフレームでの被写体の検出に関する被写体領域と前記抽出ステップで抽出された領域とに基づいて、前記第2のフレームの探索領域を設定する設定ステップと、
前記設定ステップで設定された前記第2のフレームの探索領域内で被写体を判別する判別ステップと、
をコンピュータに実行させることを特徴とするプログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2009202799A JP5578816B2 (ja) | 2009-09-02 | 2009-09-02 | 画像処理装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2009202799A JP5578816B2 (ja) | 2009-09-02 | 2009-09-02 | 画像処理装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2011053951A true JP2011053951A (ja) | 2011-03-17 |
| JP5578816B2 JP5578816B2 (ja) | 2014-08-27 |
Family
ID=43942881
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2009202799A Active JP5578816B2 (ja) | 2009-09-02 | 2009-09-02 | 画像処理装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP5578816B2 (ja) |
Cited By (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP5292505B1 (ja) * | 2012-11-20 | 2013-09-18 | 株式会社東芝 | 行動推定装置、閾値算出装置、行動推定方法、行動推定プログラム |
| JP2014137629A (ja) * | 2013-01-15 | 2014-07-28 | Mega Chips Corp | 画像検出装置及び制御プログラム並びに画像検出方法 |
| JP2014142760A (ja) * | 2013-01-23 | 2014-08-07 | Mega Chips Corp | 画像検出装置及び制御プログラム並びに画像検出方法 |
| JP2014191471A (ja) * | 2013-03-26 | 2014-10-06 | Mega Chips Corp | 物体検出装置 |
| US9536137B2 (en) | 2013-03-26 | 2017-01-03 | Megachips Corporation | Object detection apparatus |
| JP2018195190A (ja) * | 2017-05-19 | 2018-12-06 | キヤノン株式会社 | 画像処理装置、画像処理方法 |
| JP2020005111A (ja) * | 2018-06-27 | 2020-01-09 | キヤノン株式会社 | 情報処理装置、制御方法及びプログラム |
| JP2022087701A (ja) * | 2020-12-01 | 2022-06-13 | オムロン株式会社 | 情報処理装置および情報処理方法 |
| WO2024161616A1 (ja) * | 2023-02-02 | 2024-08-08 | 日本電信電話株式会社 | 推論装置、推論方法、及び推論プログラム |
Citations (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0312788A (ja) * | 1989-06-12 | 1991-01-21 | Oki Electric Ind Co Ltd | 移動体検出装置 |
| JPH0922466A (ja) * | 1995-07-05 | 1997-01-21 | Hitachi Ltd | 背景画像作成方法および画像処理装置 |
| JPH0991439A (ja) * | 1995-09-26 | 1997-04-04 | Fuji Electric Co Ltd | 物体監視装置 |
| JP2004157879A (ja) * | 2002-11-07 | 2004-06-03 | Matsushita Electric Works Ltd | 物体検出方法 |
| JP2004213648A (ja) * | 2002-12-19 | 2004-07-29 | Hitachi Kokusai Electric Inc | 物体追尾方法及び物体追尾装置 |
| JP2004295416A (ja) * | 2003-03-26 | 2004-10-21 | Matsushita Electric Works Ltd | 画像処理装置 |
| JP2005354578A (ja) * | 2004-06-14 | 2005-12-22 | Denso Corp | 対象物体検出・追跡装置 |
| JP2006113738A (ja) * | 2004-10-13 | 2006-04-27 | Matsushita Electric Ind Co Ltd | 物体検出装置および物体検出方法 |
| JP2007156771A (ja) * | 2005-12-05 | 2007-06-21 | Sony Corp | 画像検知追跡装置、画像検知追跡方法および画像検知追跡プログラム |
-
2009
- 2009-09-02 JP JP2009202799A patent/JP5578816B2/ja active Active
Patent Citations (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0312788A (ja) * | 1989-06-12 | 1991-01-21 | Oki Electric Ind Co Ltd | 移動体検出装置 |
| JPH0922466A (ja) * | 1995-07-05 | 1997-01-21 | Hitachi Ltd | 背景画像作成方法および画像処理装置 |
| JPH0991439A (ja) * | 1995-09-26 | 1997-04-04 | Fuji Electric Co Ltd | 物体監視装置 |
| JP2004157879A (ja) * | 2002-11-07 | 2004-06-03 | Matsushita Electric Works Ltd | 物体検出方法 |
| JP2004213648A (ja) * | 2002-12-19 | 2004-07-29 | Hitachi Kokusai Electric Inc | 物体追尾方法及び物体追尾装置 |
| JP2004295416A (ja) * | 2003-03-26 | 2004-10-21 | Matsushita Electric Works Ltd | 画像処理装置 |
| JP2005354578A (ja) * | 2004-06-14 | 2005-12-22 | Denso Corp | 対象物体検出・追跡装置 |
| JP2006113738A (ja) * | 2004-10-13 | 2006-04-27 | Matsushita Electric Ind Co Ltd | 物体検出装置および物体検出方法 |
| JP2007156771A (ja) * | 2005-12-05 | 2007-06-21 | Sony Corp | 画像検知追跡装置、画像検知追跡方法および画像検知追跡プログラム |
Cited By (13)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8924324B2 (en) | 2012-11-20 | 2014-12-30 | Kabushiki Kaisha Toshiba | Behavior estimation apparatus, threshold calculation apparatus, behavior estimation method and non-transitory computer readable medium thereof |
| JP5292505B1 (ja) * | 2012-11-20 | 2013-09-18 | 株式会社東芝 | 行動推定装置、閾値算出装置、行動推定方法、行動推定プログラム |
| JP2014137629A (ja) * | 2013-01-15 | 2014-07-28 | Mega Chips Corp | 画像検出装置及び制御プログラム並びに画像検出方法 |
| JP2014142760A (ja) * | 2013-01-23 | 2014-08-07 | Mega Chips Corp | 画像検出装置及び制御プログラム並びに画像検出方法 |
| US10223583B2 (en) | 2013-03-26 | 2019-03-05 | Megachips Corporation | Object detection apparatus |
| JP2014191471A (ja) * | 2013-03-26 | 2014-10-06 | Mega Chips Corp | 物体検出装置 |
| US9536137B2 (en) | 2013-03-26 | 2017-01-03 | Megachips Corporation | Object detection apparatus |
| JP2018195190A (ja) * | 2017-05-19 | 2018-12-06 | キヤノン株式会社 | 画像処理装置、画像処理方法 |
| JP7012457B2 (ja) | 2017-05-19 | 2022-01-28 | キヤノン株式会社 | 画像処理装置、画像処理方法 |
| JP2020005111A (ja) * | 2018-06-27 | 2020-01-09 | キヤノン株式会社 | 情報処理装置、制御方法及びプログラム |
| JP2022087701A (ja) * | 2020-12-01 | 2022-06-13 | オムロン株式会社 | 情報処理装置および情報処理方法 |
| JP7424280B2 (ja) | 2020-12-01 | 2024-01-30 | オムロン株式会社 | 情報処理装置および情報処理方法 |
| WO2024161616A1 (ja) * | 2023-02-02 | 2024-08-08 | 日本電信電話株式会社 | 推論装置、推論方法、及び推論プログラム |
Also Published As
| Publication number | Publication date |
|---|---|
| JP5578816B2 (ja) | 2014-08-27 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5578816B2 (ja) | 画像処理装置 | |
| US9020195B2 (en) | Object tracking device, object tracking method, and control program | |
| US8213690B2 (en) | Image processing apparatus including similarity calculating unit, image pickup apparatus, and processing method for the apparatuses | |
| US9036917B2 (en) | Image recognition based on patterns of local regions | |
| EP3910507B1 (en) | Method and apparatus for waking up screen | |
| US20110211233A1 (en) | Image processing device, image processing method and computer program | |
| CN111368666B (zh) | 一种基于新型池化及注意力机制双流网络的活体检测方法 | |
| US20050129276A1 (en) | Object detection | |
| JP2011090413A (ja) | 画像認識装置、その処理方法及びプログラム | |
| JP5489340B2 (ja) | 顔マスキング装置及び方法 | |
| US20050129275A1 (en) | Object detection | |
| CN118609061B (zh) | 基于ai识别的安检设备控制方法、装置、设备及存储介质 | |
| CN109711384A (zh) | 一种基于深度卷积神经网络的人脸识别方法 | |
| US20050128306A1 (en) | Object detection | |
| Amjad et al. | Multiple face detection algorithm using colour skin modelling | |
| CN113392820A (zh) | 动态手势识别方法、装置、电子设备及可读存储介质 | |
| KR20070016849A (ko) | 얼굴 검출과 피부 영역 검출을 적용하여 피부의 선호색변환을 수행하는 방법 및 장치 | |
| JP5523053B2 (ja) | 物体識別装置及び物体識別方法 | |
| CN111160240B (zh) | 图像对象的识别处理方法、装置及智能设备、存储介质 | |
| US20110182497A1 (en) | Cascade structure for classifying objects in an image | |
| Liu et al. | Scene background estimation based on temporal median filter with Gaussian filtering | |
| CN107423709A (zh) | 一种融合可见光与远红外线的目标检测方法 | |
| CN106651918B (zh) | 抖动背景下的前景提取方法 | |
| Chen et al. | Head-shoulder detection using joint HOG features for people counting and video surveillance in library | |
| CN111179301B (zh) | 一种基于计算机视频的运动趋势分析方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120903 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130426 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130514 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130716 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131001 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131202 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20131224 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140324 |
|
| A911 | Transfer of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20140513 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140610 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140708 |
|
| R151 | Written notification of patent or utility model registration |
Ref document number: 5578816 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |