[go: up one dir, main page]

JP5398341B2 - 物体認識装置及び物体認識方法 - Google Patents

物体認識装置及び物体認識方法 Download PDF

Info

Publication number
JP5398341B2
JP5398341B2 JP2009114898A JP2009114898A JP5398341B2 JP 5398341 B2 JP5398341 B2 JP 5398341B2 JP 2009114898 A JP2009114898 A JP 2009114898A JP 2009114898 A JP2009114898 A JP 2009114898A JP 5398341 B2 JP5398341 B2 JP 5398341B2
Authority
JP
Japan
Prior art keywords
recognition
imaging
video data
unit
control parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009114898A
Other languages
English (en)
Other versions
JP2010263581A (ja
Inventor
洋 東條
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2009114898A priority Critical patent/JP5398341B2/ja
Priority to US12/774,207 priority patent/US8861784B2/en
Publication of JP2010263581A publication Critical patent/JP2010263581A/ja
Application granted granted Critical
Publication of JP5398341B2 publication Critical patent/JP5398341B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/166Detection; Localisation; Normalisation using acquisition arrangements
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/167Detection; Localisation; Normalisation using comparisons between temporally consecutive images

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Studio Devices (AREA)

Description

本発明は物体認識装置、物体認識方法、プログラム及び記憶媒体に関し、特に、カメラ等から取得されるフレーム画像から物体を認識するために用いて好適な技術に関する。
従来、店舗等の入り口や通路を通行する人をカメラで撮影し、撮影した映像より人物の顔の位置を検出して、通過した人数を計測する技術が提案されている。このような所定領域における通行人をカメラ映像からカウントする技術として、例えば、特許文献1に開示されているものがある。この特許文献1に記載の技術によれば、通路の上方から真下に向けてカメラを設置し、カメラの上方から見た人物の頭の形状が円であることに着目し、カメラ映像から円形の物体を人物として抽出して、カウントするようにしている。
一方、近年、非特許文献1及び2で提案されているような技術を用いて、画像から顔を検出する技術の実用化が進んでいる。このような技術を利用すれば、例えば、通路の前方にカメラを設置し、カメラで撮影した映像から顔を検出することにより人物をカウントすることも可能である。
図8は、通路の前方にカメラを設置して人物を撮影している様子を示す図である。
図8において、101は、通路の天井であり、102は通路の床である。103は通路を通行している人物である。104は撮像部(カメラ)であり、人物103を斜め上から撮影できるように、天井101に設置されている。105はLANケーブルであり、カメラ104で撮像される映像を送信する。106は、映像を解析し、計数する装置となるパーソナルコンピュータ(PC)である。
図8に示すように、天井101に設置されたカメラ104で撮影した映像から人物103の顔を、前述の非特許文献1及び2に記載の技術を用いて検出することにより人物をカウントすることも可能である。
特開平4−199487号公報 特開2007−72606号公報
Rowley et al, "Neural network-based face detection", IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, VOL.20 , NO.1, JANUARY 1998 Viola and Jones, "Rapid Object Detection using Boosted Cascade of Simple Features", Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR'01)
しかしながら、人物を高精度に認識するためには、解像度が高く、かつフレームレートも高い映像が必要となる。その結果、カメラから映像データを受信する際にネットワークの負荷が大きくなってしまう。以下、図5及び図6に示す例を参照しながら説明する。
図5に示すように、通路の床502に立っている人物504が通路の天井501に設置されたカメラ503から遠い位置にいるとき、図6に示すように、フレーム画像601内では人物602が上の方に小さく写る。したがって、小さく写った人物を認識するためには、解像度が高い映像が必要である。
一方、人物がカメラから遠い位置にいるときは、人物に対するカメラの角度が浅いため、フレーム画像内において人物の位置が変化するためには長い時間が必要である。すなわち、フレーム画像内における人物の相対的な移動速度は遅くなる。したがって、フレームレートは低くても、認識結果は大きく変化しない。
これに対して、図5に示すように、通路の床502に立っている人物505がカメラ503に近い位置にいるときは、図6に示すように、フレーム画像601内では人物603が下の方に大きく写る。したがって、人物が大きく写っているため、比較的解像度が低い映像であっても、認識は可能である。ところが、人物がカメラから近い位置にいるときは、人物に対するカメラの角度が深いため、フレーム画像内における人物の位置は、短い時間の間に大きく変化する。したがって、フレームレートが高い映像が必要である。
以上のように、人物602の認識対象領域604を設定した場合は、解像度が高くてもフレームレートは低い映像で十分である。逆に、人物603の認識対象領域605を設定した場合は、解像度は低いがフレームレートは高い映像で十分である。しかしながら、フレーム画像内の位置に拠らず、人物を高精度に認識するためには、両方の条件を満たす必要がある。したがって、解像度及びフレームレートが高い映像が必要となってしまう。
この課題を解決するためには、認識対象領域に応じて解像度・フレームレートを容易に最適化する方法が必要である。このような方法としては、持ち運びが可能なカメラにおいて、認識対象の最小検出サイズをユーザに指定させ、これに応じて入力画像の解像度を決定する方法が、例えば特許文献2に開示されている。この技術は、撮影時にカメラと被写体との距離が変化しない場合においては有効である。
しかしながら、監視などを目的とした通路などに設置されたカメラの場合は、カメラと被写体との距離が常に変化し、前述のようにフレーム画像内の位置によって必要な解像度が変化する場合においては、何度もユーザが設定を行う必要が生じてしまう。また、フレーム画像全体を認識対象領域とし、カメラの角度や撮影倍率を変更して、認識対象領域がフレーム画像領域と一致するようにした場合でも、カメラの角度・撮影倍率を変更するごとにフレームレート及び解像度を設定し直す必要が生じてしまう。
本発明は前述の問題点に鑑み、ネットワークの負荷を軽減するとともに、認識に必要な入力映像のフレームレート及び解像度を容易に最適化できるようにすることを目的としている。
本発明の物体認識装置は、被写体を撮像して映像データを生成する撮像手段と、前記撮像手段によって生成された映像データから物体を認識する物体認識手段と、前記撮像手段によって利用可能な最高値の制御パラメータを用いて生成された所定時間分の映像データの複数フレームのそれぞれを前記物体認識手段によ認識した結果を分析する分析手段と、前記分析手段の分析結果に基づいて、前記物体認識手段が物体を認識可能な映像データを生成するための前記撮像手段の制御パラメータの限度値を決定する決定手段とを備えることを特徴とする。
本発明によれば、監視などを目的としたカメラ等において、カメラと被写体との距離が常に変化するような場合であっても、ネットワークの負荷を軽減するとともに、認識に必要な入力映像のフレームレート及び解像度を容易に最適化することができる。
本発明の第1の実施形態に係る画像処理装置の機能構成例を示すブロック図である。 本発明の第1の実施形態におけるパーソナルコンピュータ(PC)のハードウェア構成例を示すブロック図である。 被写体の移動に伴う被写体領域の移動例を示す概念図である。 本発明の第1の実施形態に係る画像処理装置による物体認識の処理手順の一例を示すフローチャートである。 人物が遠い場合と近い場合とにおけるカメラと位置関係を示す図である。 フレーム画像内における認識対象領域を説明する図である。 画像から顔パターンの探索を行う方法を説明する図である。 通路の前方にカメラを設置して人物を撮影している様子を示す図である。 前後のフレームにおいて顔の認識結果が重ならなくなる例を示す図である。 本発明の第2の実施形態に係る画像処理装置の機能構成例を示すブロック図である。
(第1の実施形態)
以下、添付図面を参照しながら、本発明の好適な実施形態について説明する。
図2は、本実施形態におけるパーソナルコンピュータ(PC)800のハードウェア構成例を示すブロック図である。
図2において、CPU801は、本実施形態の画像処理装置における各種制御を実行するためのものである。ROM802は、本実施形態の画像処理装置の立ち上げ時に実行されるブートプログラムや各種データを格納するためのものである。
RAM803は、CPU801が処理するための制御プログラムを格納するとともに、CPU801が各種制御を実行する際の作業領域を提供する。キーボード804及びマウス805は、ユーザによる各種入力操作環境を提供するためのものである。
外部記憶装置806は、例えば、ハードディスクやフレキシブルディスク、光ディスク、磁気ディスク、光磁気ディスク、磁気テープ等である。なお、外部記憶装置806は、制御プログラムや各種データを全てROM802に格納するようにする場合には、必ずしも必要な構成要素ではない。
表示器807は、ディスプレイなどで構成されており、処理結果等をユーザに対して表示する。ネットワークインターフェース808は、ネットワーク上の撮像部とLANケーブルを介した通信を可能とする。ビデオインターフェース809は、同軸ケーブルを介して撮像部からフレーム画像を取り込むためのものである。また、バス810は、上記の各構成を接続するためのものである。
図1は、本実施形態に係る画像処理装置(物体認識装置)100の機能構成例を示すブロック図である。
図1において、撮像部201は、撮像レンズ、および、CCD、CMOSなどの撮像センサから構成されている。映像送信部202は、撮像部201で撮像したフレーム画像を所定のフレームレート及び解像度の画像データ(映像データ)に変換し、LANケーブルを介してhttpプロトコルのパケットデータとしてPC210へ送る。
映像処理制御パラメータ設定部203は、後述する映像処理制御パラメータ決定部216により決定されたフレームレート及び解像度の情報を、LANケーブルを介して受信し、受信した値を映像送信部202に対して設定する。これにより、映像処理制御パラメータ決定部216において決定されたフレームレート及び解像度により、画像データが送信されるようになる。以上のように、本実施形態のカメラ200は、撮像部201、映像送信部202及び映像処理制御パラメータ設定部203を有しており、撮像部201及び映像送信部202が撮像手段として機能する。
映像受信部211は、PC210上のネットワークインターフェース808を介してカメラ200から送られたパケットデータを受信する。そして、受信したパケットデータよりフレーム画像データにし、物体認識部212へ出力する。
物体認識部212は、映像受信部211に入力された画像データに所望の物体が映っているかどうかを認識するためのものである。なお、後述する認識対象領域設定部215により領域が設定されているときは、フレーム画像の中の設定された領域に対してのみ認識を行う。認識結果分析部213は、物体認識部212で認識した結果を分析するためのものである。
出力部214は、認識結果分析部213の分析結果を、例えば、表示器807に出力して表示するように制御するためのものである。認識対象領域設定部215は指定手段として機能し、フレーム画像の中でユーザが所望する物体を認識する領域を、ユーザの操作によりキーボード804、マウス805などを介して、設定するものである。
映像処理制御パラメータ決定部216は、認識結果分析部213の分析結果に応じて、フレームレート及び解像度を決定する。そして、決定したフレームレート及び解像度の情報を、LANケーブルを介してカメラ200に送信する。以上のように、本実施形態のPC210は、映像受信部211から映像処理制御パラメータ決定部216までの機能を有している。
次に、本実施形態における処理の流れについて、図4のフローチャートを参照しながら説明する。なお、本実施形態は、通路を通行する人数をカウントするだけでなく、所定の領域の混雑率を計測したり、動線を分析したり、特定の人物に対してアラームを発生させたりするなど、様々な用途に適用可能である。以下では、人数をカウントする場合に適用した例について説明する。
図4は、本実施形態に係る画像処理装置100による物体認識の処理手順の一例を示すフローチャートである。本実施形態に係る画像処理装置100の処理は、映像処理制御パラメータを設定する時の処理と人数をカウントする時の処理とに大きく分けることができる。まず、カメラを設置した後や、認識対象領域の変更を行う場合など、人数のカウントを開始する前は、映像処理制御パラメータを設定するモードとする。そして、ステップS401からステップS407までの処理において、フレームレートと解像度とを最適化する処理を行う。その後、人数をカウントするモードに移行し、ステップS410からステップS413において人数をカウントする処理を行う。
まず、ステップS400において、映像処理制御パラメータ決定部216は、映像処理制御パラメータを設定するモードであるかどうかを判定する。この判定の結果、映像処理制御パラメータを設定するモードでない場合は、ステップS408に進む。ここで、映像処理制御パラメータを設定するモードは、一般的に人数をカウントするための初期設定を行うためのモードである。
一方、ステップS400の判定の結果、映像処理制御パラメータを設定するモードである場合は、次のステップS401において、認識対象領域設定部215は、フレーム画像内の認識対象領域を設定する。具体的には、ユーザによってキーボード804やマウス805が操作されることにより、図6に示すような矩形領域をフレーム画像内に指定する。なお、本実施形態では、矩形領域を一箇所にのみ指定するものとして説明する。そして、認識対象領域設定部215は、指定された矩形領域を認識対象領域として、物体認識部212に設定する。
次に、ステップS402において、映像処理制御パラメータ決定部216は、初期値として、フレームレート及び解像度について利用可能な最高の値に決定する。この値は、撮像部201のCCDのサイズや映像送信部202の送信能力や、ネットワークの帯域の広さによって決まる。
具体的な決定方法としては、まず、カメラ200に対してネットワークを介して問い合わせ、カメラ200で利用可能な解像度及びフレームレートの情報を得る。次に、ネットワークを介してその解像度及びフレームレートの情報を映像処理制御パラメータ設定部203へ送信する。そして、映像処理制御パラメータ設定部203は、映像送信部202に対して、フレームレート及び解像度が利用可能な最高の値となるように制御する。これにより、以降、フレームレート及び解像度が最高値のフレーム画像が生成される。
次に、ステップS403からステップS405においては、所定時間分、人物の認識を行うが、このとき、指定した認識対象領域内を予め決められたパターンで被写体である人物が歩行するものとする。例えば、人物がフレーム画像の認識対象領域の上端から下端まで移動するように、往復を繰り返すように歩行する。これは、認識の内容を決めておくことにより、後の認識結果の分析を容易にするためである。
次に、ステップS403において、映像受信部211は、カメラ200の撮像部201で撮影された画像データを映像送信部202から受信し、物体認識部212に送る。ここで、入力される画像データは、例えば8ビットの画素により構成される2次元配列のデータであり、R、G、Bの3つの面により構成される。
映像受信部211は、画像データがJPEG等の方式により圧縮されている場合は、画像データを所定の解凍方式に従って復号化し、RGB各画素により構成される画像データとする。さらに、本実施形態では、RGBデータを輝度データに変換し、輝度データを以後の処理に適用するものとして、不図示の画像メモリに格納する。画像データとしてYCrCbのデータを入力する場合は、Y成分をそのまま輝度データとしてもよい。
次に、ステップS404において、物体認識部212は、内部の画像メモリに転送された画像データを辞書データと照合し、認識対象領域設定部215で設定された領域に対して、所望の物体を認識する。
ここで、物体認識方法について説明する。前述したように、物体認識方法については、例えば非特許文献1や非特許文献2に開示されている。以下、説明を簡単にするために画像全域から物体を認識するように説明するが、認識対象領域のみから物体を認識する場合も基本的な処理は同様である。この場合、後述する走査を認識対象領域のみにするか、もしくはフレーム画像から認識対象領域を切り出して、切り出された画像全体について走査を行うようにすればよい。
例えば、非特許文献1に記載の方法によれば、ニューラル・ネットワークにより画像中の顔パターンを検出する。以下、その方法について簡単に説明する。まず、顔検出の対象とする画像データをメモリに書き込み、顔と照合する所定の領域をその画像から切り出す。そして、切り出した領域の画素値の分布を入力してニューラル・ネットワークによる演算を用いて1つのデータが出力される。このとき、ニューラル・ネットワークの重み、閾値が膨大な顔画像パターンと非顔画像パターンとによりあらかじめ学習されており、例えば、ニューラル・ネットワークの出力データが0以上なら顔、それ以外は非顔であると判別する。ここで、重みや閾値が前述の辞書データとなる。
そして、ニューラル・ネットワークにより顔と照合する画像パターンの切り出し位置を、例えば、図7に示すように画像全域から縦横順次に走査していくことにより、画像中から顔を検出する。また、様々な大きさの顔の検出に対応するため、図7のAの列に示すように、読み出した画像を所定の割合で順次縮小し、それに対して前述した顔検出の走査を行うようにしている。
また、処理の高速化に着目した例としては、例えば非特許文献2に開示されている。この非特許文献2に記載の方法では、AdaBoostを用いて多くの弱判別器を有効に組合せて顔判別の精度を向上させている。さらに、夫々の弱判別器はHaarタイプの矩形特徴量で構成し、しかも、矩形特徴量を算出する際には、積分画像を用いて高速に行っている。
さらに、AdaBoost学習によって得た判別器を直列に繋ぎ、カスケード型の顔検出器を構成するようにしている。このカスケード型の顔検出器では、まず、前段の計算量のより少ない単純な判別器を用いて明らかに顔でないパターンの候補をその場で除去する。そして、それ以外の候補に対してのみ、より高い識別性能を持つ後段の計算量のより多い複雑な判別器を用いて顔かどうかの判定を行う。このように、すべての候補に対して複雑な判定を行う必要がないので処理を高速化することができる。
次に、ステップS405において、認識結果分析部213は、所定時間が経過しているかどうかを判定する。この判定の結果、所定時間が経過していない場合は、ステップS403に戻る。一方、ステップS405の判定の結果、所定時間が経過している場合は、ステップS406へ進む。
次に、ステップS406において、認識結果分析部213は、所定時間分の認識結果を分析し、映像受信部211で受信したフレーム画像から物体認識部212で認識した映像中の顔の最小サイズと、移動速度とを求める。顔の最小サイズについては、所定時間内に認識された結果を、顔のサイズについてヒストグラムを取り、顔のサイズが小さい方から順に見て、所定数以上の頻度があるサイズを採用する。
一方、顔の移動速度については、2つのフレーム間の認識された顔の位置の間の差(距離(画素数))を求めればよい。なお、2つのフレーム間の時間はフレームレートから知ることができる。ここで、認識した顔の位置の精度のばらつきを除くため、所定時間分、前述の方法で移動速度を算出し、その平均値を顔の移動速度とする。
次に、ステップS407において、映像処理制御パラメータ決定部216は、ステップS406で求めた顔の最小サイズと移動速度とから、フレームレート及び解像度の下限値を決定する。
解像度の下限値については、認識可能な最小サイズにより決定される。図7に示したように、照合に使用する画像パターンは所定のサイズであり、走査を行う画像を縮小していくことにより、様々なサイズの顔を認識する。したがって、図7のA列の先頭のフレーム画像のサイズ(縮小を行う前のサイズ)に対する画像パターンのサイズが、認識可能な最小サイズになる。
例えば、照合に使用する画像パターンが20×20画素である場合について説明する。フレーム画像の解像度がVGA(640×480画素)であるときは、認識可能な顔の最小サイズは20×20画素である。ここで、ステップS406で得られた顔の最小サイズが40×40画素であったとする。照合に使用する画像パターンに比べて縦横が2倍であるため、フレームの解像度はVGAの縦横がそれぞれ1/2であれば十分である。したがって、必要なフレーム画像の解像度の下限値はQVGA(320×240画素)と決定することができる。
次に、フレームレートの下限値については、ステップS406で求めたフレーム画像内の顔の移動速度と、前後のフレームの認識結果の位置ずれの許容範囲とによって決まる。人数をカウントするためには、フレームごとの認識結果から、同一の人物ごとに軌跡を作成する必要がある。すなわち、前後のフレーム間の認識結果が同一人物の顔のものであるかどうかを判定する必要がある。例えば、前後のフレーム間で認識結果(被写体)が重ならなくなると同じ顔であったかどうかの判断は難しくなる。そこで、前後のフレームの認識結果が常に重なる範囲の位置ずれを、許容範囲とすることができる。
例えば、VGAのフレーム画像内で、ステップS406で得られた顔の最小サイズが40×40である場合について説明する。このとき、移動速度は30fps(フレーム毎秒)で10画素であったとする。前述の通り、解像度としてはQVGAで十分であるので、このときの移動速度は30fpsで5画素となる。このとき、認識可能な顔のサイズは20×20であるので、2つの認識結果が認識可能な顔サイズ1辺の20画素以上ずれると重ならなくなる。
例えば、図9に示すように、2つの認識結果901、902があり、距離903は2つの中心間の距離である。距離903は、1辺の半分の10画素の2倍に相当するので20画素になる。つまり、前後のフレーム間で20画素以上ずれると認識結果が重ならなくなる。したがって、許容する位置ずれの範囲を15画素以内とする。移動速度は30fpsで5画素であるから、10fpsとすれば15画素となる。この結果、必要なフレームレートの下限値は10fpsとなる。
そして、映像処理制御パラメータ決定部216は、ネットワークを介してカメラ200の映像処理制御パラメータ設定部203へ前記決定した解像度及びフレームレートの値(下限値)の情報を送信する。
次に、ステップS408において、映像処理制御パラメータ設定部203は、ステップS407で求めたフレームレート及び解像度の画像データを送信するように映像送信部202のパラメータを設定する。これにより、以降、撮像部201で撮像された画像データは映像処理制御パラメータ決定部216によって決定されたフレームレート及び解像度により、映像送信部202によって送信される。
次に、ステップS409において、は終了判定であり、ユーザにより電源OFFやキーボード804やマウス805を介して終了の指示があったか否かを判定する。この判定の結果、終了する指示があった場合は、そのまま終了する。一方、ステップS409の判定の結果、終了する指示がない場合は、次のステップS410に進む。
次に、ステップS410において、映像受信部211は、ステップS407で決定されたフレームレート及び解像度の画像データを受信し、物体認識部212へ送る。そして、ステップS411において、物体認識部212は、ステップS410において入力された画像データについて物体の認識を行う。物体認識の詳細についてはステップS404と同じであるので説明は省略する。
次に、ステップS412において、認識結果分析部213は、所定時間の間に検出された被写体領域を集計し、人物の軌跡を生成する。なお、所定時間の間に検出された被写体領域の情報は、RAM803に記憶されるものとする。この処理は、所定時間内に検出された複数の顔のうち、どれが同一の人物の動きに対応するかを求める処理である。
ステップS412の処理の詳細について、図3を参照しながら説明する。図3は、被写体の移動に伴う被写体領域の移動例を示す概念図である。
図3においては、撮像しているフレーム全体301に、所定の時間に検出された顔の領域を、矩形で重ねて表現している。図3に示す例では、3フレーム分が重なっており、領域303が最も古いフレームの被写体領域であり、領域304がその次のフレームの被写体領域である。そして、領域305は、最も新しい現在のフレームの被写体領域であるものとする。
これらの軌跡を求める方法としては、各領域の中心を求め、各領域の中心間の距離が最小となるもの同士を同一の被写体とみなし、線分で接続するようにすればよい。このようにして求めた軌跡が、例えば、図3の曲線309となる。
次に、ステップS413において、認識結果分析部213はステップS409で作成された軌跡が、所定の条件を満たすかどうかをチェックし、条件を満たす軌跡をカウントする。本実施形態において所定の条件とは、例えば、図3に示したように計測ライン302を横切っているかどうかについてである。計測ライン302は、ユーザによってフレーム画面内に設定されるものとする。図3に示す例では、曲線309が計測ライン302を横切っているので、1とカウントされる。もし、まだ、計測ライン302を横切っていない軌跡が存在する場合には、その時点では、カウントされない。
次に、ステップS414において、出力部214は、カウントされた結果の情報を表示器807に出力してユーザに対して表示する。そして、ステップS400へ戻る。以上のように、所定時間分の認識結果を分析し、最小サイズと移動速度とを求めることにより、ネットワークの負荷を軽減するとともに、認識に必要な映像のフレームレート及び解像度を容易に最適化することが可能となる。
本実施形態では、顔の位置を検出する例について説明したが、人体全体や上半身、頭部など人物の様々な部位や、自動車や自転車など、様々な物体においても適用可能である。また、本実施形態では、解像度及びフレームレートの最適化を、画像処理装置の初期設定時(カメラを設置した時や検出対象領域を変更した時)に行ったが、これに限ったものではない。
例えば、図4のステップS414において人数のカウント処理を行いながら解像度及びフレームレートを最適化するようにしてもよい。具体的には、人数のカウントを開始した際に最高のフレームレート及び解像度としておき、認識結果分析部213におけるカウント処理を行う際に、最小サイズや移動速度を求めるようにすればよい。これらが求まったタイミングで、映像処理制御パラメータ決定部216により、フレームレート及び解像度を決定し、映像処理制御パラメータ設定部203にその情報を送信するようにしてもよい。
さらに、本実施形態では、認識対象領域を1つだけ設定した例について説明したが、複数設定するようにしてもよい。この場合は、まず、それぞれの設定領域におけるフレームレート及び解像度を求める。次に、それぞれを別の映像ストリームとして送った場合のトータルの映像送信量と、1つの映像ストリームとして送った場合のトータルの映像送信量とを比べ、少ない方を選択するようにすればよい。なお、1つの映像ストリームとして送る場合は、設定領域ごとに存在するフレームレート及び解像度の中から、最も値の大きいフレームレート及び解像度を選択するようにする。
また、本実施形態では、ユーザの操作により認識対象領域を指定したが、物体認識部212の認識結果から設定するようにしてもよい。例えば、フレームレート及び解像度はそれぞれ最高の値に設定し、所定時間、物体認識を行う。その後、所定数以上の認識結果が存在する領域を求め、これを認識対象領域とすればよい。
(第2の実施形態)
第1の実施形態では、カメラ200とPC210とをネットワークで接続し、顔認識が可能な範囲でフレームレート及び解像度の下限値を決定してネットワーク上の映像送信量(ネットワーク負荷)を低減した。本実施形態では、カメラ内で物体認識や認識結果分析を行う例について説明する。
図10は、実施形態に係る画像処理装置1000の機能構成例を示すブロック図である。なお、図1と同じ構成については、図1と同じ番号を付与している。したがって、図1と同じ構成については説明を省略する。
図10において、映像読み出し部1002は、撮像部201で生成した画素信号を読み出す。映像読み出し部1002は、撮像部201の撮像素子から読み出す画素信号を画素毎に制御することにより、任意領域の画像信号を読み出して、必要に応じて変倍などの映像処理を行う。また、映像読み出し部1002は、読み出した複数の画素信号から画像データを形成し、所定時間の間隔で物体認識部212に出力する。
特に、撮像部201の撮像素子が高解像度である場合、一度に全ての画素を読み出すには、映像読み出し部1002の回路規模が膨大になってしまう。また、非常に高い解像度の画像データに対して認識処理を行うと、照合を行う回数が膨大となってしまうため、処理時間が非常に長くなってしまう。
そこで、撮像素子を複数の領域に分割し、分割された領域ごとに、図4のステップS402からステップS405と同様に所定時間、解像度及びフレームレートが高い画像データを入力し、物体認識部212にて物体認識を行う。そして、ステップS406と同様に、所定時間分の物体認識結果を分析し、認識した物体の最小サイズと移動速度とを求める。そして、求めた最小サイズ及び移動速度を基に、ステップS407と同様に、映像処理制御パラメータ決定部216においてフレームレート及び解像度を最適化するように決定すればよい。
決定されたフレームレート及び解像度は、映像処理制御パラメータ設定部203によって、映像読み出し部1002に設定される。以降、映像読み出し部1002は、最適化されたフレームレート及び解像度に変換して、物体認識部212に画像データを出力するようにする。これにより、読み出しに必要な回路規模の増大も、認識処理時間の増大も抑制することが可能となる。
(本発明に係る他の実施形態)
前述した実施形態の機能を実現するソフトウェアのプログラムコードを、システムあるいは装置のコンピュータ(またはCPUやMPU)が読み出して実行することによっても、本発明の目的が達成される。
また、コンピュータが読み出したプログラムコードの指示に基づき、オペレーティングシステム(OS)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれる。
本発明をコンピュータ読み取り可能な記憶媒体に適用する場合、その記憶媒体には、先に説明したフローチャートに対応するプログラムコードが格納されることになる。
100 画像処理装置、200 カメラ、210 パーソナルコンピュータ(PC)、212 物体認識部、216 映像処理制御パラメータ決定部

Claims (10)

  1. 被写体を撮像して映像データを生成する撮像手段と、
    前記撮像手段によって生成された映像データから物体を認識する物体認識手段と、
    前記撮像手段によって利用可能な最高値の制御パラメータを用いて生成された所定時間分の映像データの複数フレームのそれぞれを前記物体認識手段によ認識した結果を分析する分析手段と、
    前記分析手段の分析結果に基づいて、前記物体認識手段が物体を認識可能な映像データを生成するための前記撮像手段の制御パラメータの限度値を決定する決定手段とを備えることを特徴とする物体認識装置。
  2. 前記分析手段は、前記物体認識手段による認識結果から、映像中における物体の移動速度を算出
    前記決定手段は、前記分析手段によって算出された移動速度に基づいて、前記制御パラメータとして前記撮像手段によって生成される映像データのフレームレートを決定することを特徴とする請求項に記載の物体認識装置。
  3. 前記分析手段は、前記物体認識手段による認識結果から、映像中における物体の大きさを算出
    前記決定手段は、前記分析手段によって算出された物体の大きさに基づいて、前記制御パラメータとして前記撮像手段によって生成される映像データの解像度を決定することを特徴とする請求項に記載の物体認識装置。
  4. 前記映像データにおける認識対象領域を指定する指定手段をさらに備え、
    前記分析手段は、前記指定手段によって指定された認識対象領域における物体認識結果を分析することを特徴とする請求項1〜の何れか1項に記載の物体認識装置。
  5. 被写体を撮像して映像データを生成する撮像工程と、
    前記撮像工程において生成された映像データから物体を認識する物体認識工程と、
    前記撮像工程において利用可能な最高値の制御パラメータを用いて生成された所定時間分の映像データの複数フレームのそれぞれを前記物体認識工程において認識した結果を分析する分析工程と、
    前記分析工程における分析結果に基づいて、前記物体認識工程で物体を認識可能な映像データを生成するための前記撮像工程における制御パラメータの限度値を決定する決定工程とを備えることを特徴とする物体認識方法。
  6. 前記分析工程では、前記物体認識工程における認識結果から、映像中における物体の移動速度を算出
    前記決定工程においては、前記分析工程において算出された移動速度に基づいて、前記制御パラメータとして前記撮像工程において生成される映像データのフレームレートを決定することを特徴とする請求項に記載の物体認識方法。
  7. 前記分析工程では、前記物体認識工程における認識結果から、映像中における物体の大きさを算出
    前記決定工程においては、前記分析工程において算出された物体の大きさに基づいて、前記制御パラメータとして前記撮像工程において生成される映像データの解像度を決定することを特徴とする請求項に記載の物体認識方法。
  8. 前記映像データにおける認識対象領域を指定する指定工程をさらに備え、
    前記決定工程においては、前記指定工程において指定された認識対象領域における物体認識結果を分析することを特徴とする請求項の何れか1項に記載の物体認識方法。
  9. 被写体を撮像して映像データを生成する撮像工程と、
    前記撮像工程において生成された映像データから物体を認識する物体認識工程と、
    前記撮像工程において利用可能な最高値の制御パラメータを用いて生成された所定時間分の映像データの複数フレームのそれぞれを前記物体認識工程において認識した結果を分析する分析工程と、
    前記分析工程における分析結果に基づいて、前記物体認識工程で物体を認識可能な映像データを生成するための前記撮像工程における制御パラメータの限度値を決定する決定工程とをコンピュータに実行させることを特徴とするプログラム。
  10. 請求項に記載のプログラムを記憶したことを特徴とするコンピュータ読み取り可能な記憶媒体。
JP2009114898A 2009-05-11 2009-05-11 物体認識装置及び物体認識方法 Active JP5398341B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2009114898A JP5398341B2 (ja) 2009-05-11 2009-05-11 物体認識装置及び物体認識方法
US12/774,207 US8861784B2 (en) 2009-05-11 2010-05-05 Object recognition apparatus and object recognition method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009114898A JP5398341B2 (ja) 2009-05-11 2009-05-11 物体認識装置及び物体認識方法

Publications (2)

Publication Number Publication Date
JP2010263581A JP2010263581A (ja) 2010-11-18
JP5398341B2 true JP5398341B2 (ja) 2014-01-29

Family

ID=43062337

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009114898A Active JP5398341B2 (ja) 2009-05-11 2009-05-11 物体認識装置及び物体認識方法

Country Status (2)

Country Link
US (1) US8861784B2 (ja)
JP (1) JP5398341B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012048476A (ja) * 2010-08-26 2012-03-08 Canon Inc 画像処理装置
US9792710B2 (en) 2014-12-25 2017-10-17 Seiko Epson Corporation Display device, and method of controlling display device
US10129303B2 (en) 2014-10-17 2018-11-13 Ricoh Company, Ltd. Transmission system, transmission terminal, and transmission method

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4284370B2 (ja) * 2007-03-09 2009-06-24 株式会社東芝 ビデオサーバ及びビデオ編集システム
EP3582177A1 (en) * 2010-04-02 2019-12-18 Nokia Technologies Oy Methods and apparatuses for face detection
JP2012108785A (ja) * 2010-11-18 2012-06-07 Panasonic Corp 人数カウント装置、人数カウント方法及び人数カウントプログラム
JP5769468B2 (ja) * 2011-03-30 2015-08-26 キヤノン株式会社 物体検出システム及び物体検出方法
JP6058257B2 (ja) * 2011-07-06 2017-01-11 アイキューブド研究所株式会社 画像出力装置、画像出力方法、およびプログラム
JP6319545B2 (ja) * 2013-03-15 2018-05-09 パナソニックIpマネジメント株式会社 画像符号化装置、撮影システム、撮影記録システム、画質符号化方法、及び画像符号化制御プログラム
JP6136504B2 (ja) * 2013-04-15 2017-05-31 オムロン株式会社 対象画像検出デバイス、その制御方法および制御プログラム、記録媒体、並びにデジタルカメラ
US10321083B2 (en) * 2013-08-12 2019-06-11 Nikon Corporation Electronic apparatus, method for controlling electronic apparatus, and control program
WO2015177881A1 (ja) * 2014-05-21 2015-11-26 株式会社日立製作所 画像処理装置、及び位置決めシステム
US10306125B2 (en) 2014-10-09 2019-05-28 Belkin International, Inc. Video camera with privacy
US9179105B1 (en) * 2014-09-15 2015-11-03 Belkin International, Inc. Control of video camera with privacy feedback
JP6027070B2 (ja) * 2014-09-24 2016-11-16 富士フイルム株式会社 領域検出装置、領域検出方法、画像処理装置、画像処理方法、プログラムおよび記録媒体
CN107211089B (zh) 2015-02-02 2020-05-12 富士胶片株式会社 跟踪系统、终端装置、相机装置、跟踪摄影方法及程序
CN107211090B (zh) * 2015-02-02 2020-02-28 富士胶片株式会社 操作装置、跟踪系统、操作方法及介质
JP6531435B2 (ja) * 2015-03-11 2019-06-19 カシオ計算機株式会社 情報処理装置、情報処理方法、及びプログラム
JP6566831B2 (ja) * 2015-10-15 2019-08-28 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム
US11082660B2 (en) * 2016-08-01 2021-08-03 Sony Corporation Information processing device and information processing method
JP6658402B2 (ja) * 2016-08-26 2020-03-04 富士通株式会社 フレームレート判定装置、フレームレート判定方法及びフレームレート判定用コンピュータプログラム
US10419741B2 (en) * 2017-02-24 2019-09-17 Analog Devices Global Unlimited Company Systems and methods for compression of three dimensional depth sensing
US10963680B2 (en) * 2018-01-12 2021-03-30 Capillary Technologies International Pte Ltd Overhead people detection and tracking system and method
WO2019165956A1 (zh) 2018-02-27 2019-09-06 Oppo广东移动通信有限公司 控制方法、控制装置、终端、计算机设备和存储介质
US10796157B2 (en) * 2018-03-13 2020-10-06 Mediatek Inc. Hierarchical object detection and selection
WO2019188039A1 (ja) * 2018-03-26 2019-10-03 株式会社日立国際電気 画像処理システム
CN110324521B (zh) * 2018-04-28 2021-03-26 Oppo广东移动通信有限公司 控制摄像头的方法、装置、电子设备及存储介质
JP6705534B2 (ja) * 2018-10-19 2020-06-03 ソニー株式会社 センサ装置、信号処理方法
JP6705533B2 (ja) * 2018-10-19 2020-06-03 ソニー株式会社 センサ装置、パラメータ設定方法
JP2020201674A (ja) 2019-06-07 2020-12-17 キヤノン株式会社 映像解析装置及びその制御方法及びプログラム
KR102195460B1 (ko) * 2019-08-14 2020-12-28 한국과학기술원 엣지 컴퓨팅을 이용하는 모바일 증강 현실 장비 및 그의 에너지 효율적인 해상도 및 송신 파워 제어 방법
WO2021245935A1 (ja) * 2020-06-05 2021-12-09 株式会社ソシオネクスト 情報処理装置、情報処理方法、及びプログラム
US11954910B2 (en) 2020-12-26 2024-04-09 International Business Machines Corporation Dynamic multi-resolution processing for video classification
CN112887665B (zh) * 2020-12-30 2023-07-18 重庆邮电大学移通学院 视频图像处理方法及相关装置
US12374152B2 (en) * 2021-11-12 2025-07-29 Microsoft Technology Licensing, Llc Machine-vision person tracking in service environment
WO2023085124A1 (ja) * 2021-11-15 2023-05-19 株式会社Nttドコモ 情報処理装置
US20250200339A1 (en) * 2022-03-31 2025-06-19 Sony Group Corporation Sensor device

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0823882B2 (ja) 1990-11-29 1996-03-06 株式会社テレコスモ 通行者計数装置および売上処理装置
US5301239A (en) * 1991-02-18 1994-04-05 Matsushita Electric Industrial Co., Ltd. Apparatus for measuring the dynamic state of traffic
JP2003274390A (ja) * 2002-03-18 2003-09-26 Olympus Optical Co Ltd 映像配信サーバおよび映像受信クライアントシステム
JP3942606B2 (ja) * 2003-06-09 2007-07-11 株式会社日立国際電気 変化検出装置
GB2404247B (en) * 2003-07-22 2005-07-20 Hitachi Int Electric Inc Object tracing method and object tracking apparatus
JP2007072626A (ja) 2005-09-05 2007-03-22 Fuji Xerox Co Ltd プリントシステム
WO2007033286A2 (en) * 2005-09-13 2007-03-22 Verificon Corporation System and method for object tracking and activity analysis
GB2438660B (en) * 2006-06-02 2011-03-30 Tandberg Television Asa Recursive filter system for a video signal
JP4885690B2 (ja) * 2006-11-28 2012-02-29 株式会社エヌ・ティ・ティ・ドコモ 画像調整量決定装置、画像調整量決定方法、画像調整量決定プログラムおよび画像処理装置
JP4879717B2 (ja) * 2006-12-05 2012-02-22 富士フイルム株式会社 監視システム、監視方法、及びプログラム
JP4284370B2 (ja) * 2007-03-09 2009-06-24 株式会社東芝 ビデオサーバ及びビデオ編集システム
US8488901B2 (en) * 2007-09-28 2013-07-16 Sony Corporation Content based adjustment of an image
JP5121508B2 (ja) * 2008-03-03 2013-01-16 キヤノン株式会社 画像処理装置、画像処理方法、プログラム及び記憶媒体

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012048476A (ja) * 2010-08-26 2012-03-08 Canon Inc 画像処理装置
US10129303B2 (en) 2014-10-17 2018-11-13 Ricoh Company, Ltd. Transmission system, transmission terminal, and transmission method
US9792710B2 (en) 2014-12-25 2017-10-17 Seiko Epson Corporation Display device, and method of controlling display device

Also Published As

Publication number Publication date
US8861784B2 (en) 2014-10-14
JP2010263581A (ja) 2010-11-18
US20100284568A1 (en) 2010-11-11

Similar Documents

Publication Publication Date Title
JP5398341B2 (ja) 物体認識装置及び物体認識方法
JP5693094B2 (ja) 画像処理装置、画像処理方法及びコンピュータプログラム
JP5390322B2 (ja) 画像処理装置、及び画像処理方法
JP6555906B2 (ja) 情報処理装置、情報処理方法、およびプログラム
US9098920B2 (en) Image capturing apparatus and method for controlling the same
CN102542254B (zh) 图像处理装置及图像处理方法
JP5271227B2 (ja) 群衆監視装置および方法ならびにプログラム
JP5279517B2 (ja) 物体検知装置及び物体検知方法
JP2014022970A (ja) 画像送信装置、画像送信方法、画像送信プログラム、画像認識認証システム、及び画像受信装置
JP2009211311A (ja) 画像処理装置及び方法
JP2009211275A (ja) 画像処理装置、画像処理方法、プログラム及び記憶媒体
US20240104769A1 (en) Information processing apparatus, control method, and non-transitory storage medium
EP4195166B1 (en) Apparatus and method for transmitting images and apparatus and method for receiving images
JP5523053B2 (ja) 物体識別装置及び物体識別方法
JP7104523B2 (ja) 情報処理装置、システム、情報処理装置の制御方法、及び、プログラム
US9154682B2 (en) Method of detecting predetermined object from image and apparatus therefor
JP5247338B2 (ja) 画像処理装置及び画像処理方法
WO2018037479A1 (ja) 画像処理装置、ステレオカメラ装置及び画像処理方法
US20250119511A1 (en) Apparatus and method for transmitting images and apparatus and method for receiving images
JP5737909B2 (ja) 画像処理装置、画像処理方法及びプログラム
TW202001783A (zh) 影像分析方法、電子系統以及非暫態電腦可讀取記錄媒體
JP2008211534A (ja) 顔検知装置
JP2012100082A (ja) 画像処理装置、画像処理方法及びプログラム
JP2013179614A (ja) 撮像装置
KR101272631B1 (ko) 이동물체 감지장치 및 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120511

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130405

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130416

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130617

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130924

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131022

R151 Written notification of patent or utility model registration

Ref document number: 5398341

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151