JP2018185623A - Object detection device - Google Patents
Object detection device Download PDFInfo
- Publication number
- JP2018185623A JP2018185623A JP2017086322A JP2017086322A JP2018185623A JP 2018185623 A JP2018185623 A JP 2018185623A JP 2017086322 A JP2017086322 A JP 2017086322A JP 2017086322 A JP2017086322 A JP 2017086322A JP 2018185623 A JP2018185623 A JP 2018185623A
- Authority
- JP
- Japan
- Prior art keywords
- density
- partial
- image
- evaluation value
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Image Processing (AREA)
- Closed-Circuit Television Systems (AREA)
- Image Analysis (AREA)
Abstract
【課題】混雑が生じ得る空間が撮影された撮影画像から個々の物体を精度良く検出する。【解決手段】画像解析装置は、所定の密度ごとに当該密度にて物体が存在する空間を撮影した密度画像それぞれの画像特徴を学習した密度推定器を用いて、撮影画像に撮影された物体の密度の分布を推定する密度推定手段50と、撮影画像内に個々の物体が存在し得る候補位置を設定するとともに候補位置を基準として撮影画像内に物体を構成する複数の部分のそれぞれと対応する部分領域を設定して、部分領域ごとに当該部分領域と対応する部分の画像特徴が現れている度合いを表す部分評価値を算出し、候補位置を基準に設定した複数の部分領域の部分評価値を当該部分領域の密度が低いほど重視して統合した統合評価値が所定の判定基準を満たす候補位置を物体の位置と判定する物体位置判定手段51を備える。【選択図】図2PROBLEM TO BE SOLVED: To accurately detect an individual object from a photographed image in which a space where congestion may occur is photographed. An image analysis device uses a density estimator that learns the image characteristics of each density image obtained by photographing a space in which an object exists at a predetermined density at the density of the object. The density estimation means 50 for estimating the density distribution, the candidate positions where individual objects can exist in the captured image are set, and the candidate positions correspond to each of a plurality of parts constituting the object in the captured image. A partial area is set, a partial evaluation value indicating the degree to which the image feature of the part corresponding to the partial area appears is calculated for each partial area, and a partial evaluation value of a plurality of partial areas set based on the candidate position is obtained. The object position determination means 51 is provided, in which a candidate position whose integrated evaluation value satisfies a predetermined determination criterion is determined as an object position by emphasizing the lower the density of the partial region. [Selection diagram] Fig. 2
Description
本発明は、人等の所定の物体が存在し得る空間が撮影された撮影画像から個々の物体を検出する物体検出装置に関し、特に、混雑が生じ得る空間が撮影された撮影画像から個々の物体を検出する物体検出装置に関する。 The present invention relates to an object detection device that detects individual objects from a captured image in which a space in which a predetermined object such as a person can exist is captured, and in particular, an individual object from a captured image in which a space in which congestion can occur is captured. The present invention relates to an object detection device for detecting the above.
イベント会場等の混雑が発生し得る空間においては事故防止等のために、混雑が発生している区域に警備員を多く配置するなどの対応が求められる。そこで、会場の各所に監視カメラを配置して撮影画像から人の分布を推定し、推定した分布を表示することによって監視員による混雑状況の把握を容易化することができる。 In an event venue or other space where congestion can occur, countermeasures such as placing a large number of guards in the crowded area are required to prevent accidents. Therefore, monitoring cameras can be arranged at various locations in the venue to estimate the distribution of people from the captured images and display the estimated distribution, thereby facilitating the understanding of the congestion situation by the monitoring staff.
その際、個々の人の位置を検出して、検出した各位置に人の形状を模したモデルを表示し、または/および人の位置関係(例えば行列を為している、取り囲んでいる)を解析して解析結果を報知することによって、より一層の監視効率向上が期待できる。 At that time, the position of each person is detected, and a model imitating the person's shape is displayed at each detected position, or / and the positional relationship of the person (for example, forming a matrix or surrounding) Further analysis efficiency can be expected by analyzing and notifying the analysis result.
複数人が撮影された撮影画像から個々の人の位置を検出する方法に、人を模したモデルを複数個組み合わせて撮影画像に当てはめる方法や、単独の人が撮影された画像の特徴量を事前に学習した識別器を用いて撮影画像をスキャンする方法など、予め用意した単独の人の画像特徴を用いて撮影画像から単独の人の画像特徴が現れている位置を検出する方法がある。 The method of detecting the position of each person from a photographed image taken by multiple people, combining multiple models that imitate people, and applying it to the photographed image, as well as feature values of images taken by a single person in advance There is a method of detecting a position where an image feature of a single person appears from a captured image using a previously prepared image feature of a single person, such as a method of scanning a captured image using a discriminator that has been learned.
例えば、特許文献1に記載の移動物体追跡装置においては、監視画像と背景画像との比較によって変化画素が抽出された位置に、追跡中の移動物体の形状を模した移動物体モデルを追跡中の移動物体の数だけ組み合わせて当てはめることによって個々の移動物体の位置を検出している。この移動物体追跡装置においては、人の全身の形状を近似した移動物体モデルを用いることが例示されている。
For example, in the moving object tracking device described in
また、例えば、特許文献2に記載の物体検出装置は、多数の「人」の画像データ、「人以外」の画像データを用いて予め学習させた識別器を用いて入力画像から人を検出する。この物体検出装置が用いる識別器は、人の全身の画像データを用いて学習したものであることが示唆されている。
Further, for example, the object detection device described in
しかしながら、混雑が生じ得る空間が撮影された撮影画像においては、混雑状態に応じて人の隠蔽状態が変化する。そのため、単独の人の画像特徴として、混雑状態によらず常に物体の各部分の画像特徴を一様に評価していると個々の人を精度良く検出し続けることが困難となる問題があった。 However, in a captured image in which a space where congestion can occur is captured, the concealment state of a person changes according to the congestion state. Therefore, as an image feature of a single person, there is a problem that it is difficult to accurately detect an individual person if the image feature of each part of the object is always evaluated uniformly regardless of the congestion state. .
すなわち、混雑が生じておらず、全身が撮影されている人が多い撮影画像については、人を模したモデルを用いる方法においても、人の画像を学習した識別器を用いる方法においても、全身の画像特徴を用いた方が一部(例えば頭部近傍のみ)の画像特徴を用いるよりも高い精度で当該人を検出できる。 That is, for a captured image in which there are many people who are not crowded and the whole body has been photographed, both in the method using a model imitating a person and in the method using a discriminator that learns a human image, The person using the image feature can be detected with higher accuracy than using a part of the image feature (for example, only near the head).
一方、混雑が生じ、隠蔽状態が多発している撮影画像については、人を模したモデルを用いる方法においても、人の画像を学習した識別器を用いる方法においても、全身の画像特徴を用いるよりも隠蔽が生じている可能性が低い部分のみの画像特徴を用いた方が高い精度で当該人を検出できる。 On the other hand, for captured images that are congested and frequently concealed, both in the method using a model imitating a person and in the method using a discriminator that learns a human image, the image features of the whole body are used. However, it is possible to detect the person with higher accuracy by using only the image feature that is less likely to be concealed.
そのため、撮影画像において混雑している領域の左側に撮影されている人はその左側部分、右側に撮影されている人はその右側部分、上方に撮影されている人はその上部、下方に撮影されている人はその下部を他の部分よりも重視して評価した方が高い精度で検出できる。 Therefore, the person photographed on the left side of the crowded area in the photographed image is photographed on the left side, the person photographed on the right is the right part thereof, the person photographed on the upper part is photographed on the top, and below. The person who is deciding that the lower part is more important than the other parts can detect it with higher accuracy.
また、例えば、混雑時の検出精度を高めるために頭部近傍のみの画像特徴を常に用いていると混雑が生じていない時の検出精度が低下し、混雑が生じていない時の検出精度を高めるために全身の画像特徴を常に用いていると混雑時の検出精度が低下する。 In addition, for example, if image features only near the head are always used in order to increase detection accuracy during congestion, detection accuracy when congestion does not occur decreases, and detection accuracy when congestion does not occur increases. For this reason, if the image features of the whole body are always used, the detection accuracy at the time of congestion decreases.
このように、混雑が生じ得る空間が撮影された撮影画像においては検出対象の物体の個々の隠蔽状態が混雑状態に応じて変化するため、常に物体の各部分を一様に評価していると当該撮影画像から個々の物体を精度良く検出することが困難であった。 In this way, in the captured image in which a space where congestion can occur is captured, the individual concealment state of the object to be detected changes according to the congestion state, so that each part of the object is always evaluated uniformly. It has been difficult to accurately detect individual objects from the captured image.
本発明は上記問題に鑑みてなされたものであり、混雑が生じ得る空間が撮影された撮影画像であっても当該撮影画像中の個々の物体を精度良く検出することができる物体検出装置を提供することを目的とする。 The present invention has been made in view of the above problems, and provides an object detection device that can accurately detect individual objects in a captured image even in a captured image of a space in which congestion can occur. The purpose is to do.
かかる目的を達成するために本発明は、所定の物体による混雑が生じ得る空間が撮影された撮影画像から個々の物体を検出する物体検出装置であって、所定の密度ごとに当該密度にて物体が存在する空間を撮影した密度画像それぞれの画像特徴を学習した密度推定器を用いて、撮影画像に撮影された物体の密度の分布を推定する密度推定手段と、撮影画像内に個々の物体が存在し得る候補位置を設定するとともに候補位置を基準として撮影画像内に物体を構成する複数の部分のそれぞれと対応する部分領域を設定して、部分領域ごとに当該部分領域と対応する部分の画像特徴が現れている度合いを表す部分評価値を算出し、候補位置を基準に設定した複数の部分領域の部分評価値を当該部分領域の密度が低いほど重視して統合した統合評価値が所定の判定基準を満たす候補位置を物体の位置と判定する物体位置判定手段と、を備えたことを特徴とする物体検出装置を提供する。 In order to achieve such an object, the present invention is an object detection device for detecting individual objects from a captured image in which a space in which congestion due to a predetermined object may occur is captured, and the object is detected at each predetermined density. Density estimation means for estimating the density distribution of an object photographed in the photographed image using a density estimator that has learned the image characteristics of each density image photographed in the space where the object exists, and each object in the photographed image An image of a portion corresponding to each partial region is set for each partial region by setting a candidate region that can exist and setting a partial region corresponding to each of a plurality of portions constituting the object in the captured image with reference to the candidate position Integrated evaluation value that calculates the partial evaluation value that represents the degree of the appearance of features and integrates the partial evaluation values of multiple partial areas that are set based on the candidate position, focusing on the lower the density of the partial areas. To provide an object detecting apparatus comprising the, and object position determining means for determining the position of the object candidate positions satisfying a predetermined criterion.
また、物体位置判定手段は、部分領域ごとに当該部分領域における密度が低いほど高く当該部分領域における密度が高いほど低い重み係数を設定し、候補位置を基準に設定した複数の部分領域の部分評価値を当該部分領域の重み係数にて重み付けて総和して統合評価値を算出することが好適である。 In addition, the object position determination unit sets a weighting factor that is higher as the density in the partial area is lower for each partial area and is lower as the density in the partial area is higher, and performs partial evaluation of a plurality of partial areas that are set based on the candidate position. It is preferable to calculate the integrated evaluation value by weighting and summing the values with the weighting coefficients of the partial areas.
また、物体位置判定手段は、候補位置における密度が高いほど物体を構成する部分のうちの少ない部分に対応する部分領域を設定することが好適である。 In addition, it is preferable that the object position determination unit sets a partial region corresponding to a smaller portion of the portions constituting the object as the density at the candidate position is higher.
また、物体位置判定手段は、それぞれが1以上の候補位置を含む互いに異なる複数通りの配置を生成する配置生成手段と、複数通りの配置それぞれについて、各候補位置を基準とする複数の部分のそれぞれと対応する部分領域に、当該部分を模した部分モデルを描画してモデル画像を生成するモデル画像生成手段と、複数通りの配置のモデル画像それぞれについて、部分領域ごとに部分モデルの撮影画像に対する類似の度合いを表す部分評価値を算出し、複数の部分領域の部分評価値を統合して統合評価値を算出する評価値算出手段と、統合評価値が最大の配置における候補位置を物体の位置と決定する最適配置決定手段と、を含むことが好適である。 In addition, the object position determination means includes a position generation means for generating a plurality of different arrangements each including one or more candidate positions, and a plurality of portions based on each candidate position for each of the plurality of arrangements. The model image generation means for generating a model image by drawing a partial model imitating the part in the corresponding partial area, and the similarity of the captured image of the partial model for each partial area for each of the model images in a plurality of arrangements An evaluation value calculating means for calculating a partial evaluation value representing the degree of the evaluation, integrating partial evaluation values of a plurality of partial areas to calculate an integrated evaluation value, and a candidate position in an arrangement with the maximum integrated evaluation value as an object position And an optimum arrangement determining means for determining.
また、物体位置判定手段は、撮影画像内に複数の候補位置を設定する候補位置設定手段と、各候補位置を基準に設定した複数の部分のそれぞれと対応する部分領域の画像特徴を当該部分の画像特徴を学習した識別器に入力して当該部分領域の部分評価値を算出し、候補位置ごとに当該候補位置を基準に設定した複数の部分領域の部分評価値を統合して統合評価値を算出する評価値算出手段と、判定基準を満たす統合評価値が算出された候補位置を物体の位置と決定する位置決定手段と、を含むことが好適である。 In addition, the object position determination means includes candidate position setting means for setting a plurality of candidate positions in the photographed image, and image features of partial areas corresponding to each of the plurality of parts set on the basis of each candidate position. The partial evaluation value of the partial area is calculated by inputting the image feature into the learned classifier, and the partial evaluation values of the partial areas set based on the candidate position are integrated for each candidate position to obtain the integrated evaluation value. It is preferable to include evaluation value calculation means for calculating, and position determination means for determining a candidate position where an integrated evaluation value that satisfies the determination criterion is calculated as the position of the object.
本発明によれば、混雑が生じ得る空間が撮影された撮影画像から個々の物体を精度良く検出できる。 According to the present invention, it is possible to accurately detect individual objects from a captured image in which a space where congestion can occur is captured.
[第一の実施形態]
以下、本発明の実施形態として、イベント会場が撮影された撮影画像から個々の人を検出する物体検出装置の例を含み、検出結果を監視員に対して表示する画像監視装置1の例を説明する。この実施形態に係る画像監視装置1は、特に、物体検出装置が人を模した物体モデルを用いて個々の人を検出し、その際に物体検出装置が物体モデルを構成する複数の部分モデルを用いて個々の人を検出する例を含む。
[First embodiment]
Hereinafter, as an embodiment of the present invention, an example of an
<第一の実施形態に係る画像監視装置1の構成>
図1は画像監視装置1の概略の構成を示すブロック図である。画像監視装置1は、撮影部2、通信部3、記憶部4、画像処理部5、および表示部6からなる。
<Configuration of
FIG. 1 is a block diagram showing a schematic configuration of the
撮影部2は、監視カメラであり、通信部3を介して画像処理部5と接続され、監視空間を所定の時間間隔で撮影して撮影画像を生成し、撮影画像を順次画像処理部5に入力する撮影手段である。例えば、撮影部2は、イベント会場に設置されたポールに当該監視空間を俯瞰する視野を有して設置される。その視野は固定されていてもよいし、予めのスケジュール或いは通信部3を介した外部からの指示に従って変更されてもよい。また、例えば、撮影部2は監視空間をフレーム周期1秒で撮影してカラー画像を生成する。カラー画像の代わりにモノクロ画像を生成してもよい。
The photographing
通信部3は、通信回路であり、その一端が画像処理部5に接続され、他端が同軸ケーブルまたはLAN(Local Area Network)、インターネットなどの通信網を介して撮影部2および表示部6と接続される。通信部3は、撮影部2から撮影画像を取得して画像処理部5に入力し、画像処理部5から入力された検出結果を表示部6に出力する。
The
記憶部4は、ROM(Read Only Memory)、RAM(Random Access Memory)等のメモリ装置であり、各種プログラムや各種データを記憶する。記憶部4は、画像処理部5と接続されて画像処理部5との間でこれらの情報を入出力する。
The storage unit 4 is a memory device such as a ROM (Read Only Memory) or a RAM (Random Access Memory), and stores various programs and various data. The storage unit 4 is connected to the
画像処理部5は、CPU(Central Processing Unit)、DSP(Digital Signal Processor)、MCU(Micro Control Unit)等の演算装置で構成される。画像処理部5は、記憶部4と接続され、記憶部4からプログラムを読み出して実行することにより各種処理手段・制御手段として動作し、各種データを記憶部4に記憶させ、読み出す。また、画像処理部5は、通信部3を介して撮影部2および表示部6とも接続され、通信部3経由で撮影部2から取得した撮影画像を解析することにより個々の人を検出し、検出結果を通信部3経由で表示部6に表示させる。
The
表示部6は、液晶ディスプレイ又はCRT(Cathode Ray Tube)ディスプレイ等のディスプレイ装置であり、通信部3を介して画像処理部5と接続され、画像処理部5による検出結果を表示する表示手段である。監視員は表示された検出結果を視認して混雑の発生等を判断し、必要に応じて人員配置の変更等の対処を行う。
The display unit 6 is a display device such as a liquid crystal display or a CRT (Cathode Ray Tube) display, and is a display unit that is connected to the
なお、本実施形態においては、撮影部2と画像処理部5の個数が1対1である画像監視装置1を例示するが、別の実施形態においては、撮影部2と画像処理部5の個数を多対1或いは多対多とすることもできる。
In the present embodiment, the
<第一の実施形態に係る画像監視装置1の機能>
図2および図3は画像監視装置1の機能を示す機能ブロック図である。通信部3は画像取得手段30および物体位置出力手段31等として機能し、記憶部4は密度推定器記憶手段40および単体特徴記憶手段41等として機能する。画像処理部5は、密度推定手段50および物体位置判定手段51等として機能する。また、単体特徴記憶手段41は物体モデル記憶手段410aおよび重み記憶手段412aとしての機能を含み、物体位置判定手段51は配置生成手段510a、モデル画像生成手段512a、評価値算出手段514aおよび最適配置決定手段516aとしての機能を含む。
<Function of the
2 and 3 are functional block diagrams showing functions of the
画像取得手段30は、撮影手段である撮影部2から撮影画像を順次取得して、取得した撮影画像を密度推定手段50および物体位置判定手段51に順次出力する。
The
密度推定器記憶手段40は、所定の密度ごとに当該密度にて物体(人)が存在する空間を撮影した密度画像それぞれの画像特徴を学習した推定密度算出関数であって、画像の特徴量を入力されると当該画像に撮影されている物体の密度の推定値(推定密度)を算出し、算出した推定密度を出力する推定器(密度推定器)の情報を予め記憶している。つまり上記推定密度算出関数の係数等のパラメータを密度推定器の情報として予め記憶している。
The density
密度推定手段50は、画像取得手段30から入力された撮影画像の各所から密度推定用の特徴量(推定用特徴量)を抽出するとともに密度推定器記憶手段40から密度推定器を読み出して、抽出した推定用特徴量のそれぞれを密度推定器に入力することによって推定密度の分布(密度分布)を推定し、推定した密度分布を物体位置判定手段51に出力する。
The
密度推定の処理と密度推定器について具体的に説明する。 The density estimation process and the density estimator will be specifically described.
密度推定手段50は、撮影画像の各画素の位置に窓(推定用抽出窓)を設定し、各推定用抽出窓における撮影画像から推定用特徴量を抽出する。推定用特徴量はGLCM(Gray Level Co-occurrence Matrix)特徴である。 The density estimation means 50 sets a window (estimation extraction window) at the position of each pixel of the captured image, and extracts an estimation feature amount from the captured image in each estimation extraction window. The estimation feature amount is a GLCM (Gray Level Co-occurrence Matrix) feature.
各推定用抽出窓に撮影されている監視空間内の領域は同一サイズであることが望ましい。すなわち、好適には密度推定手段50は不図示のカメラパラメータ記憶手段から予め記憶されている撮影部2のカメラパラメータを読み出し、カメラパラメータを用いたホモグラフィ変換により撮影画像の任意の画素に撮影されている監視空間内の領域が同一サイズとなるように撮影画像を変形してから推定用特徴量を抽出する。
It is desirable that the area in the monitoring space photographed by each estimation extraction window is the same size. That is, preferably, the density estimation means 50 reads out the camera parameters of the photographing
密度推定器は多クラスの画像を識別する識別器で実現することができ、多クラスSVM(Support Vector Machine)法で学習した識別関数とすることができる。 The density estimator can be realized by a classifier that identifies multi-class images, and can be a discrimination function learned by a multi-class SVM (Support Vector Machine) method.
密度は、例えば、人が存在しない「背景」クラス、0人/m2より高く2人/m2以下である「低密度」クラス、2人/m2より高く4人/m2以下である「中密度」クラス、4人/m2より高い「高密度」クラスの4クラスと定義することができる。 Density, for example, there is no human "Background" class is 0 people / m higher than 2 is two / m 2 or less "low density" class, higher than two / m 2 4 persons / m 2 or less It can be defined as 4 classes of “medium density” class, “high density” class higher than 4 persons / m 2 .
推定密度は各クラスに予め付与された値であり、分布推定の結果として出力される値である。本実施形態では各クラスに対応する値を「背景」「低密度」「中密度」「高密度」と表記する。 The estimated density is a value given in advance to each class, and is a value output as a result of distribution estimation. In the present embodiment, values corresponding to each class are expressed as “background”, “low density”, “medium density”, and “high density”.
すなわち、密度推定器は「背景」クラス、「低密度」クラス、「中密度」クラス、「高密度」クラスのそれぞれに帰属する多数の画像(密度画像)の特徴量に多クラスSVM法を適用して学習した、各クラスの画像を他のクラスと識別するための識別関数である。この学習により導出された識別関数のパラメータが密度推定器として記憶されている。なお、密度画像の特徴量は、推定用特徴量と同種であり、GLCM特徴である。 That is, the density estimator applies the multi-class SVM method to the feature quantities of a large number of images (density images) belonging to the “background” class, “low density” class, “medium density” class, and “high density” class. This is an identification function for discriminating the images of each class from other classes. The parameters of the discriminant function derived by this learning are stored as a density estimator. The feature amount of the density image is the same type as the estimation feature amount and is a GLCM feature.
密度推定手段50は、各画素に対応して抽出した推定用特徴量のそれぞれを密度推定器に入力することによってその出力値である推定密度を取得する。なお、撮影画像を変形させて推定用特徴量を抽出した場合、密度推定手段50は、カメラパラメータを用いたホモグラフィ変換により密度分布を元の撮影画像の形状に変形させる。
The density estimation means 50 acquires the estimated density which is the output value by inputting each of the estimation feature quantities extracted corresponding to each pixel to the density estimator. In addition, when the estimated feature amount is extracted by deforming the captured image, the
こうして得られた、撮影画像の画素ごとの推定密度の集まりが密度分布である。 A collection of estimated densities for each pixel of the captured image thus obtained is a density distribution.
密度推定手段50が出力する密度分布から撮影画像の各所における人の粗密状況が分かるが、密度分布から個々の人の位置までは分からない。
これに対し、密度推定手段50の後段の物体位置判定手段51は、撮影画像に現れている個々の人の位置を判定する手段である。
From the density distribution output by the density estimation means 50, the density of people at various locations in the photographed image can be understood, but the position of each person cannot be determined from the density distribution.
On the other hand, the object position determination means 51 subsequent to the density estimation means 50 is a means for determining the position of each person appearing in the captured image.
物体位置判定手段51は、単独の人(物体)としての画像特徴が現れている箇所を撮影画像上で探索することにより個々の物体を検出して個々の物体の位置を判定する。すなわち、物体位置判定手段51は、撮影画像内に個々の物体が存在し得る候補位置を設定して当該候補位置の撮影画像に単独の物体の画像特徴(単体特徴)が現れている度合いを表す評価値(統合評価値)を算出し、統合評価値が所定値以上である候補位置を物体の位置と判定する。例えば、単体特徴は人の形状であり、単体特徴記憶手段41が予め単体特徴を記憶している。また例えば、統合評価値は撮影画像のエッジと人の形状を表すモデルとの類似度である。統合評価値は物体を構成する複数の部分それぞれに対する評価値(部分評価値)を統合した評価値である。
The object position determination means 51 detects an individual object by searching a place where an image feature as a single person (object) appears on the captured image, and determines the position of the individual object. That is, the object
ここで、混雑が生じ得る空間が撮影された撮影画像においては、密度が高い領域ほど隠蔽が生じやすくなるため評価値の信頼性は低いと考えられる。その逆に、密度が低い領域ほど隠蔽は生じにくく評価値の信頼性は高いと考えられる。また、混雑が生じ得る空間が撮影された撮影画像においては、密度の境目に存在している物体のようにその信頼性の高い部分と低い部分が混在する物体も多々含まれ得る。 Here, in a captured image in which a space in which congestion can occur is captured, the higher the density, the easier the concealment occurs, and thus the reliability of the evaluation value is considered to be low. On the contrary, it is considered that the lower the density is, the less concealment occurs and the reliability of the evaluation value is high. In addition, in a captured image in which a space where congestion can occur is captured, there can be many objects in which a highly reliable portion and a low portion are mixed, such as an object existing at the boundary of density.
そこで、物体位置判定手段51は、物体全体を一様に評価するのではなく、密度分布を参照して物体の部分ごとに密度に応じた重み付けを行うことによって物体の検出精度を向上させる。
すなわち、物体位置判定手段51は、撮影画像内に個々の物体が存在し得る候補位置を設定するとともに候補位置を基準として撮影画像内に物体を構成する複数の部分のそれぞれと対応する部分領域を設定して、部分領域ごとに当該部分領域と対応する部分の画像特徴が現れている度合いを表す部分評価値を算出し、候補位置を基準に設定した各部分領域の部分評価値を当該部分領域の密度が低いほど重視して統合した統合評価値が所定の判定基準を満たす候補位置を物体の位置と判定する。より具体的には、物体位置判定手段51は、前記部分領域ごとに当該部分領域における密度が低いほど高く当該部分領域における密度が高いほど低い重み係数を設定し、候補位置を基準に設定した複数の部分領域の部分評価値を当該部分領域の重み係数にて重み付けて総和して統合評価値を算出する。
Therefore, the object
That is, the object
また、密度が高い領域ほど重度の隠蔽が生じる可能性は高くなり、隠れている部分についても評価を行うと誤評価が生じる機会を増加させ、物体の検出精度を低下させることにつながる。例えば、撮影部2が俯瞰設置されている場合は、足元に近いほど隠蔽は発生しやすく、頭に近いほど隠蔽は発生しにくい。このことを考慮し、混雑に適応させるべく単体特徴を人の頭部だけにすると混雑時の検出し損ねは減少する。しかし、頭部だけの単体特徴は肩などに対しても比較的高い統合評価値が算出されてしまうため、混雑していないときの誤検出が増加する。
In addition, the higher the density, the higher the possibility that severe concealment will occur. If the hidden part is also evaluated, the chance of erroneous evaluation increases, leading to a decrease in object detection accuracy. For example, when the photographing
物体位置判定手段51は、密度分布を参照することによって、このような評価する部分の多寡と個々の物体の検出精度との間に存在するトレードオフを解消する。すなわち、物体位置判定手段51は、候補位置における密度が高いほど物体を構成する部分のうちの少ない部分に対応する部分領域を設定する。つまり、物体位置判定手段51は、候補位置における密度が高いほど、物体を構成する部分のうちの少ない部分の画像特徴を評価して統合評価値を算出する。例えば、物体位置判定手段51は、候補位置の推定密度が低密度であれば全身の画像特徴を評価して統合評価値を算出し、中密度であれば上半身の画像特徴を評価して統合評価値を算出し、高密度であれば頭部近傍の画像特徴を評価して統合評価値を算出する。
The object
以下、個々の物体の検出と単体特徴について説明する。 Hereinafter, detection of individual objects and single unit characteristics will be described.
単体特徴記憶手段41は、単独の人(物体)の形状を模した物体モデルの情報を予め記憶した物体モデル記憶手段410a、および評価値の算出において用いる重みの情報を予め記憶した重み記憶手段412aとして機能し、物体モデルの情報および重みの情報を単体特徴として記憶している。
The single
図4〜図6は単体特徴記憶手段41が記憶している単体特徴を模式的に表した図である。そのうちの図4はおよび図5は物体モデル記憶手段410aが記憶している物体モデルの情報の一例であり、図6は重み記憶手段412aが記憶している重み(重み係数の比率)の一例である。
4 to 6 are diagrams schematically showing the single features stored in the single feature storage means 41. FIG. 4 and 5 are examples of object model information stored in the object
物体モデル記憶手段410aが記憶している物体モデルは、具体的には立位の人の頭部、胴部、脚部に対応する3つの回転楕円体から構成される立体モデル700である。なお頭部重心を人の代表位置とする。さらに物体モデル記憶手段410aは、立体モデル700と併せて、密度ごとの評価範囲702を記憶し、また立体モデル700を撮影画像の座標系に投影するために撮影部2のカメラパラメータ701を記憶している。カメラパラメータ701は、実際の監視空間における撮影部2の設置位置及び撮像方向といった外部パラメータ、撮影部2の焦点距離、画角、レンズ歪みその他のレンズ特性や、撮像素子の画素数といった内部パラメータを含む情報である。
The object model stored in the object
評価範囲702は、複数の部分に分けて密度ごとに設定され、密度が高いほど単独の物体を構成する部分のうちの少ない部分となっている。
具体的には物体モデル記憶手段410aは、低密度クラスを表す値と対応付けて人の6つの部分「上1/3、左1/2」、「上1/3、右1/2」、「中1/3、左1/2」、「中1/3、右1/2」、「下1/3、左1/2」および「下1/3、右1/2」を表す評価範囲を記憶している。これら6つの部分を合わせると人の「全体」となる。
また物体モデル記憶手段410aは、中密度クラスを表す値と対応付けて人の4つの部分「上1/3、左1/2」、「上1/3、右1/2」、「中1/3、左1/2」および「中1/3、右1/2」を表す評価範囲を記憶している。これら4つの部分を合わせると人の「上部2/3」となる。
また物体モデル記憶手段410aは、高密度クラスを表す値と対応付けて人の4つの部分「上1/3、左1/2」および「上1/3、右1/2」を表す評価範囲を記憶している。これら2つの部分を合わせると人の「上部1/3」となる。
The evaluation range 702 is set for each density divided into a plurality of parts, and the higher the density, the smaller the part that constitutes a single object.
Specifically, the object model storage means 410a associates the values representing the low density class with the six parts “upper 1/3, left 1/2”, “up 1/3, right 1/2”, Evaluation representing "middle 1/3, left 1/2", "middle 1/3, right 1/2", "lower 1/3, left 1/2" and "lower 1/3, right 1/2" Remember the range. When these six parts are combined, it becomes the “whole” of the person.
In addition, the object
The object
以下、評価範囲「上1/3、左1/2」と立体モデル700とカメラパラメータ701との組み合わせによって表される物体モデル710を左上部モデル、評価範囲「上1/3、右1/2」と立体モデル700とカメラパラメータ701との組み合わせによって表される部分モデル711を右上部モデル、評価範囲「中1/3、左1/2」と立体モデル700とカメラパラメータ701との組み合わせによって表される部分モデル712を左中部モデル、評価範囲「中1/3、右1/2」と立体モデル700とカメラパラメータ701との組み合わせによって表される部分モデル713を右中部モデル、評価範囲「下1/3、左1/2」と立体モデル700とカメラパラメータ701との組み合わせによって表される部分モデル714を左下部モデル、評価範囲「下1/3、右1/2」と立体モデル700とカメラパラメータ701との組み合わせによって表される部分モデル715を右下部モデルと称する。また評価範囲「全体」と立体モデル700とカメラパラメータ701との組み合わせによって表される物体モデル720を全身モデル、評価範囲「上部2/3」と立体モデル700とカメラパラメータ701との組み合わせによって表される物体モデル721を上半身モデル、評価範囲「上部1/3」と立体モデル700とカメラパラメータ701との組み合わせによって表される物体モデル722を頭部近傍モデルと称する。
Hereinafter, the
このように、物体モデル記憶手段410aは、低密度クラスと対応付けて左上部モデル710、右上部モデル711、左中部モデル712、右中部モデル713、左下部モデル714および右下部モデル715からなる全身モデル720を、中密度クラスと対応付けて左上部モデル710、右上部モデル711、左中部モデル712および右中部モデル713からなる上半身モデル721を、高密度クラスと対応付けて左上部モデル710および右上部モデル711からなる頭部近傍モデル722を物体モデルの情報として記憶している。
なお、部分モデルとして描画されるのは、物体の形状を表す輪郭線(図5の実線部)である。
As described above, the object
Note that what is drawn as the partial model is a contour line (solid line portion in FIG. 5) representing the shape of the object.
重みは、物体の各部分と対応する部分領域の密度に応じて当該部分を重視する度合いであり、密度間の相対的な比率で表される。密度が低い部分ほど重視され密度が高い部分ほど軽視されるため、密度が低いほど高く密度が高いほど低い重みが設定されている。例えば、低密度、中密度および高密度の重みは比率10:7:5とすることができる。なお部分領域の密度の決定に際しては背景クラスは低密度クラスとみなすことができる。 The weight is a degree of emphasizing the part according to the density of the partial region corresponding to each part of the object, and is represented by a relative ratio between the densities. Since the lower density part is more important and the higher density part is disregarded, the lower the density, the higher the density and the lower the weight. For example, the weights for low density, medium density and high density can be 10: 7: 5. In determining the density of the partial region, the background class can be regarded as a low density class.
このように重み記憶手段412aは、密度が低いほど高く密度が高いほど低い、密度ごとの重みを記憶している。 As described above, the weight storage unit 412a stores the weight for each density, which is higher as the density is lower and lower as the density is higher.
配置生成手段510aは、それぞれが1以上の候補位置を含む互いに異なる複数通りの配置を生成し、生成した各配置をモデル画像生成手段512aに出力する。
The
そのために、配置生成手段510aは、乱数に基づき撮影画像の画素のうち推定密度が低密度、中密度または高密度である画素の中から1個以上上限個数以下の個数(配置数)の画素をランダムに決定し、決定した各画素の位置を候補位置とすることで配置を生成する。配置生成手段510aは、この生成を、配置数を順次増加させながら配置数ごとに予め定めた回数ずつ反復することによって、互いに異なる複数通りの配置を生成する。なお、配置数の上限個数は監視空間に存在し得る物体の数の上限とすることができ、例えば監視空間を模した仮想空間中に立位の人の立体モデルを重ならずに配置可能な数として算出できる。
For this purpose, the
モデル画像生成手段512aは、配置生成手段510aから入力された複数通りの配置それぞれについて、各候補位置を基準とする複数の部分のそれぞれと対応する部分領域に、当該部分を模した部分モデルを描画してモデル画像を生成する。またその際に、モデル画像生成手段512aは、各候補位置に、当該候補位置における密度が高いほど、単独の物体を構成する部分のうちの少ない部分を模した物体モデルを描画してモデル画像を生成し、生成した各モデル画像を評価値算出手段514aに出力する。
The model
そのために、モデル画像生成手段512aは、物体モデル記憶手段410aからカメラパラメータを読み出し、配置ごとに、カメラパラメータを用いて、各候補位置を立体モデルの頭部重心の高さ(例えば1.5m)の水平面に逆投影することで、当該候補位置に投影される立体モデルの、監視空間を模した仮想空間内における代表位置を算出する。
For this purpose, the model
また、モデル画像生成手段512aは、物体モデル記憶手段410aから頭部近傍モデルを読み出して各候補位置と対応する仮想空間内の代表位置に頭部近傍モデルを配置し、カメラパラメータを用いて頭部近傍モデルを撮影画像の座標系に投影する。そして、モデル画像生成手段512aは、密度推定手段50から入力された密度分布を参照して各候補位置に対応する頭部近傍モデルの投影領域内の推定密度を集計し、各候補位置における最多の推定密度(ただし背景クラスは除く)を当該候補位置の密度と決定する。
Further, the model
また、モデル画像生成手段512aは、候補位置ごとに当該候補位置の密度に応じた物体モデルを物体モデル記憶手段410aから読み出す。具体的には、モデル画像生成手段512aは、候補位置の密度が低密度であれば6つの部分モデルからなる全身モデルを読み出し、中密度であれば4つの部分モデルからなる上半身モデルを読み出し、高密度であれば2つの部分モデルからなる頭部近傍モデルを読み出す。そして、モデル画像生成手段512aは、各配置について、各候補位置に対応して読み出した物体モデルを当該候補位置と対応する仮想空間内の代表位置に配置し、カメラパラメータを用いて各物体モデルを為す部分モデルそれぞれを撮影画像の座標系に投影し、物体の形状(輪郭線)を描画することによって、配置ごとのモデル画像を生成する。
なお、モデル画像生成手段512aは、撮影部2からの距離が遠い代表位置に配置した物体モデルから順に投影し、投影領域を上書きすることによって、物体モデル間の隠蔽を表現したモデル画像を生成する。
In addition, the model
Note that the model
また、モデル画像生成手段512aは、配置ごとに、モデル画像における物体モデルどうしの重なり度合いを表す隠蔽度を次式に従って算出する。
隠蔽度=物体モデル間の重複領域の面積/物体モデルの投影領域の和領域の面積(1)
In addition, the model
Concealment degree = area of overlapping area between object models / area of sum area of projection area of object model (1)
また、モデル画像生成手段512aは、各モデル画像と対応して、当該モデル画像における各部分領域について当該部分領域の推定密度に応じた重み係数を算出する。
In addition, the model
そのために、モデル画像生成手段512aは、密度分布を参照して各部分領域内の推定密度を集計し、各部分領域における最多の推定密度を当該部分領域の密度と決定する。ただし背景クラスは低密度クラスとみなして集計する。
次にモデル画像生成手段512aは、重み記憶手段412aから各部分領域の密度に対応する重み(重み係数の比率)を読み出し、配置ごとに全部分領域の重みの和を求める。
続いてモデル画像生成手段512aは、配置ごとに、各部分領域の重みを重みの和で除して、当該部分領域の重み係数を算出する。すなわち各配置における重み係数の和は1となるように正規化される。
For this purpose, the model
Next, the model
Subsequently, for each arrangement, the model
モデル画像生成手段512aは、こうして求めた配置とモデル画像と隠蔽度と重み係数とを対応付けて評価値算出手段514aに出力する。
The model
図7は、第一の実施形態に係る密度推定手段50、配置生成手段510aおよびモデル画像生成手段512aによる処理例を模式的に示した図である。
画像740は、密度推定手段50が推定した密度分布を画像化したものである。当該密度分布においては、白抜き部は推定密度が背景である領域、横線部は推定密度が低密度である領域、斜線部は推定密度が中密度である領域、格子部は推定密度が高密度である領域をそれぞれ示している。
画像741は、配置生成手段510aが生成した配置に含まれる8個の候補位置を撮影画像の座標系に×印でプロットしたものである。
3次元モデル742は、モデル画像生成手段512aが画像741に示した8個の候補位置と対応する仮想空間内の代表位置に立体モデルを配置した様子を図示したものである。
画像743は、モデル画像生成手段512aが、画像740で示した密度分布に基づいて各候補位置の密度を特定し、当該密度に応じた評価範囲の立体モデルを各候補位置に投影して作成したモデル画像を示している。
FIG. 7 is a diagram schematically illustrating a processing example by the
The image 740 is an image of the density distribution estimated by the
The
The three-
The
モデル画像743が表す配置においては、1個の部分領域(集団中の中段右の人の左中部)が完全に隠蔽されており、33個の部分領域が描画されている。33個の部分領域の内訳は、密度が低密度または背景であるものが23個、密度が中密度であるものが6個、密度が高密度であるものが4個である。モデル画像743が表す配置の全部分領域についての重み係数比率の和は、10×23+7×6+5×4=292となる。33個の部分領域のうちの部分領域744の密度は低密度、部分領域745は中密度、部分領域746は高密度である。部分領域744の重み係数は10/292、部分領域745の重み係数は7/292、部分領域746の重み係数は5/292となる。他の部分領域についても同様にして重み係数が算出される。
In the arrangement represented by the
図8の画像750は、モデル画像743の各部分領域に対応してモデル画像生成手段512aが算出した重み係数を模式的に示した画像である。
An
評価値算出手段514aは、複数通りの配置それぞれについて、モデル画像生成手段512aから入力されたモデル画像の撮影画像に対する類似の度合いを表す統合評価値を算出し、配置ごとの統合評価値を最適配置決定手段516aに出力する。
The evaluation
具体的には、評価値算出手段514aは、各モデル画像と撮影画像の重み付け類似度を次式に従って算出する。
重み付け類似度 = 重み付け形状適合度 − WHa×隠蔽度 (2)
ただし、WHaは0より大きな重み係数であり、事前の実験に基づいて予め設定される。重み付け形状適合度から減じる隠蔽度は過剰な物体モデルの重なりを抑制するためのペナルティ値である。このように隠蔽度を含めた類似度に基づいて最適配置を決定することで、本来の物体数以上の物体モデルが当てはまることによる物体位置の誤検出を防止できる。
Specifically, the evaluation
Weighted similarity = Weighted shape conformity-W Ha x Concealment (2)
However, W Ha is a weighting coefficient larger than 0, and is preset based on a prior experiment. The degree of concealment subtracted from the weighted shape matching degree is a penalty value for suppressing an overlap of excessive object models. In this way, by determining the optimum arrangement based on the similarity including the concealment degree, it is possible to prevent erroneous detection of the object position due to the application of an object model equal to or more than the original number of objects.
評価値算出手段514aは、重み付け形状適合度を、モデル画像と撮影画像との部分領域ごとの形状適合度を当該部分領域の重み係数で重み付けて総和して算出する。部分領域ごとの形状適合度が部分評価値である。形状適合度はエッジの類似度とすることができる。評価値算出手段514aは、各モデル画像と撮影画像のそれぞれからエッジを抽出し、各モデル画像について、モデル画像から有効なエッジが抽出された画素と当該画素に対応する撮影画像の画素のエッジとの差の絶対値を算出して総和し、総和値を撮影画像から有効なエッジが抽出された画素数とモデル画像から有効なエッジが抽出された画素数の和で除して符号を反転した値を重み付け形状適合度として算出する。
The evaluation value calculation means 514a calculates the weighted shape suitability by summing the shape suitability for each partial area of the model image and the captured image with the weighting coefficient of the partial area. The shape suitability for each partial area is a partial evaluation value. The shape matching degree can be an edge similarity. The evaluation
或いは、評価値算出手段514aは、各モデル画像と撮影画像のそれぞれからエッジ画像を生成し、各モデル画像について、撮影画像から生成したエッジ画像と当該モデル画像から生成したエッジ画像とのチャンファーマッチング(Chamfer Matching)を行って得られる距離の符号を反転した値を、撮影画像から有効なエッジが抽出された画素数とモデル画像から有効なエッジが抽出された画素数の和で除して、当該モデル画像の重み付け形状適合度とすることもできる。
Alternatively, the evaluation
最適配置決定手段516aは、評価値算出手段514aから入力された配置ごとの統合評価値を参照し、統合評価値が最大の配置における候補位置を物体の位置と決定し、決定した物体位置の情報を物体位置出力手段31に出力する。すなわち、最適配置決定手段516aは、最大の類似度が算出された配置に含まれる各候補位置を撮影画像に撮影されている各人の位置と決定する。
例えば、最適配置決定手段516aは、監視員が視認し易いよう、各物体位置に物体モデルを当該物体位置の密度に応じて色分けして描画して物体位置の情報を生成し、出力する。または、物体位置の情報は物体位置の座標値そのものとすることもでき、物体位置の情報は、描画した各物体モデルの、他の物体モデルと重複していない領域とすることもできる。或いは、物体位置の情報は、上述したデータのうちの2以上を含んだデータとしてもよい。
The optimum
For example, the optimum
物体位置出力手段31は物体位置判定手段51から入力された物体位置の情報を表示部6に順次出力し、表示部6は物体位置出力手段31から入力された物体位置の情報を表示する。例えば、物体位置の情報は、インターネット経由で送受信され、表示部6に表示される。監視員は、表示された情報を視認することによって監視空間に混雑が発生している地点を把握し、当該地点に警備員を派遣し或いは増員するなどの対処を行う。
The object
<第一の実施形態に係る画像監視装置1の動作>
図9〜図11のフローチャートを参照して画像監視装置1の動作を説明する。
<Operation of the
The operation of the
画像監視装置1が動作を開始すると、イベント会場に設置されている撮影部2は所定時間おきに監視空間を撮影して撮影画像を画像処理部5が設置されている画像解析センター宛に順次送信する。そして、画像処理部5は撮影画像を受信するたびに図9のフローチャートに従った動作を繰り返す。
When the
まず、通信部3は画像取得手段30として動作し、撮影部2からの撮影画像の受信待ち状態となる。撮影画像を取得した画像取得手段30は当該撮影画像を画像処理部5に出力する(ステップS1)。
First, the
撮影画像を入力された画像処理部5は密度推定手段50として動作し、撮影画像から密度分布を推定する(ステップS2)。密度推定手段50は、撮影画像の各画素の位置にて推定用特徴量を抽出するとともに記憶部4の密度推定器記憶手段40から密度推定器を読み出し、各推定用特徴量を密度推定器に入力して撮影画像の各画素における推定密度を取得することにより密度分布を推定する。
The
密度分布を推定した画像処理部5は物体位置判定手段51としても動作し、物体位置判定手段51には画像取得手段30から撮影画像が入力されるとともに密度推定手段50から密度分布が入力される。これらを入力された物体位置判定手段51は、密度分布に背景クラス以外の推定密度が含まれているか否かを確認する(ステップS3)。
The
背景クラス以外の推定密度が含まれている場合は(ステップS3にてYES)、物体位置判定手段51は、少なくとも1人以上の人が撮影されているとして、撮影画像から個々の物体の位置を判定する処理を行う(ステップS4)。他方、背景クラスのみの場合は(ステップS3にてNO)、人が撮影されていないとして、ステップS4,S5の処理を省略する。
If the estimated density other than the background class is included (YES in step S3), the object
図10および図11のフローチャートを参照して、ステップS4の物体位置判定処理を説明する。単体特徴記憶手段41が物体モデル記憶手段410aおよび重み記憶手段412aとして動作し、物体位置判定手段51が配置生成手段510a、モデル画像生成手段512a、評価値算出手段514aおよび最適配置決定手段516aとして動作して、物体位置判定処理が実行される。
The object position determination process in step S4 will be described with reference to the flowcharts of FIGS. The single
配置生成手段510aは、1から上限個数以下の範囲で配置数を順次設定して(ステップS100)、ステップS100〜S117のループ処理を制御する。
The
また、配置生成手段510aは、反復回数をカウントするための変数Tを用意してTを0に初期化し(ステップS101)、ステップS102〜S116の反復処理を開始する。
The
次に、配置生成手段510aは、密度推定手段50から入力された密度分布において推定密度が低密度、中密度または高密度の領域内に、ステップS100にて設定した配置数と同数の候補位置をランダムに設定することによって、当該配置数におけるT通り目の配置を生成し、モデル画像生成手段512aに出力する(ステップS102)。
Next, the
モデル画像生成手段512aは、物体モデル記憶手段410aからカメラパラメータを読み出し、カメラパラメータを用いて、ステップS102で生成した配置に含まれる各候補位置を仮想空間の三次元座標に変換する(ステップS103)。
The model
次に、モデル画像生成手段512aは、撮影画像と同サイズのモデル画像を用意して初期化するとともに、各候補位置の三次元座標の撮影部2までの距離を算出し、距離が遠い候補位置から順に処理対象に設定して(ステップS104)、ステップS104〜S110のループ処理を実行する。
Next, the model
続いて、モデル画像生成手段512aは密度分布を参照して処理対象の候補位置の密度を特定する(ステップS105)。モデル画像生成手段512aは、物体モデル記憶手段410aから頭部近傍モデルを読み出して当該候補位置の三次元座標に配置し、カメラパラメータを用いて、頭部近傍モデルを撮影画像の座標系に投影し、投影領域内で最多の推定密度(ただし背景クラス以外)を候補位置の密度として特定する。
Subsequently, the model
続いて、モデル画像生成手段512aは、ステップS105で特定した密度に対応する物体モデルを物体モデル記憶手段410aから読み出して(ステップS106)、処理対象の候補位置の三次元座標に配置し、カメラパラメータを用いて、配置した物体モデルをモデル画像に上書き投影する(ステップS107)。また、このとき、モデル画像生成手段512aは物体モデルの投影面積を記録しておく。
物体モデルは複数の部分モデルから構成されており、これら複数の部分モデルにおける物体の輪郭がモデル画像中の候補位置を基準とする各位置に上書き投影される。各部分の部分モデルを投影した投影領域が当該部分の部分領域である。モデル画像生成手段512aは、候補位置と部分の組み合わせに識別番号を付与し、当該部分と対応する部分領域の画素値に、投影した部分の識別番号を部分モデルにおける物体の輪郭の強度値とともに設定する。
Subsequently, the model
The object model is composed of a plurality of partial models, and the contours of the objects in the plurality of partial models are overwritten and projected at each position based on the candidate position in the model image. A projection area obtained by projecting a partial model of each part is a partial area of the part. The model
続いて、モデル画像生成手段512aは密度分布を参照して各部分領域の密度を特定する(ステップS108)。モデル画像生成手段512aは、各部分領域内で最多の推定密度(ただし背景クラスは低密度クラスとみなす)を当該部分領域の密度として特定する。
Subsequently, the model
続いて、モデル画像生成手段512aは重み記憶手段412aを参照して各部分領域の密度に対応する重み(重み係数の比率)を設定する(ステップS109)。すなわちモデル画像生成手段512aは、各部分領域の重みを当該部分領域に対応する部分の識別番号とともに記録する。なお、この際に、ステップS107における上書き投影によりモデル画像上で完全に隠蔽された部分領域の重みは記録から削除する。
Subsequently, the model
そして、モデル画像生成手段512aは、現配置数におけるT通り目の配置に含まれる全ての候補位置を処理し終えたか否かを確認し(ステップS110)、未処理の候補位置がある場合は(ステップS110にてNO)、処理をステップS104に戻して次の候補位置を処理する。 Then, the model image generating means 512a checks whether or not all candidate positions included in the Tth arrangement in the current arrangement number have been processed (step S110), and if there is an unprocessed candidate position ( NO in step S110), the process returns to step S104 to process the next candidate position.
他方、全ての候補位置を処理し終えた場合は(ステップS110にてYES)、現配置数におけるT通り目の配置についてのモデル画像の完成となる。モデル画像を完成させたモデル画像生成手段512aは当該モデル画像における物体モデルの隠蔽度を算出する(ステップS111)。すなわち、モデル画像生成手段512aは、「モデルの投影領域の和領域の面積」であるモデル画像上の投影領域の面積を求めるとともに、ステップS107で記録していた物体モデルごとの投影面積を総和し、総和値からモデルの投影領域の和領域の面積を差し引いて「モデル間の重複領域の面積」を求め、これらを式(1)に代入して隠蔽度を算出する。
On the other hand, when all the candidate positions have been processed (YES in step S110), the model image for the Tth arrangement in the current arrangement number is completed. The model image generating means 512a that has completed the model image calculates the degree of concealment of the object model in the model image (step S111). That is, the model
また、モデル画像生成手段512aはステップS109で記録していた部分領域の重みを総和し、各部分領域の重みを総和値で除することによって各部分領域の重み係数を算出する(ステップS112)。 The model image generating means 512a calculates the weighting coefficient of each partial area by summing the weights of the partial areas recorded in step S109 and dividing the weight of each partial area by the total value (step S112).
重み係数を算出したモデル画像生成手段512aはモデル画像と隠蔽度と部分領域ごとの重み係数を評価値算出手段514aに出力する。
The model
モデル画像と隠蔽度と重み係数を入力された評価値算出手段514aは、当該モデル画像と撮影画像の部分領域ごとの形状適合度を当該部分領域の部分評価値として算出し(ステップS113)、さらに、部分領域ごとの形状適合度と当該部分領域の重み係数の積を総和した重み付け形状適合度と隠蔽度から、モデル画像と撮影画像の重み付け類似度を現配置数におけるT通り目の配置についての統合評価値として算出する(ステップS114)。すなわち、評価値算出手段514aは、モデル画像生成手段512aから入力されたモデル画像と撮影画像のそれぞれからエッジ画像を生成し、これらのエッジ画像の部分領域ごとの類似度と部分領域ごとの重み係数を積和して重み付け形状適合度を算出する。そして、重み付け形状適合度と隠蔽度を式(2)に代入して重み付け類似度を算出する。
The evaluation value calculation means 514a, to which the model image, the concealment degree, and the weighting coefficient are input, calculates the shape matching degree for each partial area of the model image and the captured image as a partial evaluation value of the partial area (step S113), and further From the weighted shape matching degree and the concealment degree obtained by summing up the products of the shape matching degree for each partial area and the weight coefficient of the partial area, the weighted similarity between the model image and the photographed image is calculated for the Tth arrangement in the current arrangement number. The integrated evaluation value is calculated (step S114). That is, the evaluation
現配置数におけるT通り目の配置についての重み付け類似度が算出されると、評価値算出手段514aは当該配置と重み付け類似度を対応付けて記録し、配置生成手段510aは反復回数Tを1だけ増加させて(ステップS115)、規定回数TMAXと比較し(ステップS116)、TがTMAX未満の場合は(ステップS116にてNO)、処理をステップS102に戻して現配置数における反復処理を継続させる。
When the weighted similarity for the Tth arrangement in the current arrangement number is calculated, the evaluation
反復回数Tが規定回数TMAXに達した場合(ステップS116にてYES)、配置生成手段510aは、現配置数における反復処理を終了させ、全ての配置数を設定し終えたか否かを確認する(ステップS117)。未設定の配置数がある場合は(ステップS117にてNO)、処理をステップS100に戻して次の配置数についての処理を行う。
When the number of iterations T has reached the specified number of times T MAX (YES in step S116), the
他方、全ての配置数を設定し終えた場合は(ステップS117にてYES)、評価値算出手段514aはステップS115で記録した配置と重み付け類似度を最適配置決定手段516aに入力し、最適配置決定手段516aは、それらの中で重み付け類似度が最大の配置を特定し(ステップS118)、当該配置を撮影画像に撮影されている個々の人の位置を表している情報と判定する。
On the other hand, when all the arrangement numbers have been set (YES in step S117), evaluation value calculation means 514a inputs the arrangement recorded in step S115 and the weighted similarity to optimum arrangement determination means 516a to determine the optimum arrangement. The
再び図9を参照して説明を続ける。物体位置判定手段51はステップS4にて判定した個々の人の位置(物体位置)の情報を通信部3に出力する(ステップS5)。物体位置の情報を入力された通信部3は物体位置出力手段31として動作し、物体位置の情報を表示部6に送信する。
The description will be continued with reference to FIG. 9 again. The object
以上の処理を終えると、処理はステップS1に戻され、次の撮影画像に対する処理が行われる。 When the above process is completed, the process returns to step S1, and the process for the next captured image is performed.
[第二の実施形態]
以下、第一の実施形態とは異なる本発明の好適な実施形態として、単独の人の画像特徴を学習した識別器を用いて個々の人を検出し、特に、単独の人を構成する複数の部分のそれぞれの画像特徴を学習した部分識別器を用いて個々の人を検出する物体検出装置の例を含んだ画像監視装置1の例を説明する。
[Second Embodiment]
Hereinafter, as a preferred embodiment of the present invention different from the first embodiment, an individual person is detected using a discriminator that has learned the image characteristics of a single person, and in particular, a plurality of persons constituting a single person are detected. An example of the
第二の実施形態に係る画像監視装置は、単体特徴記憶手段41が記憶している単体特徴の細部および物体位置判定手段51が行う処理の細部が第一の実施形態に係る画像監視装置と異なり、概略の構成、概略の機能および動作の一部は共通する。そのため、概略の構成、概略の機能および動作の一部については、それぞれ第一の実施形態で参照した図1のブロック図、図2の機能ブロック図および図9のフローチャートを再び参照して説明する。
The image monitoring apparatus according to the second embodiment differs from the image monitoring apparatus according to the first embodiment in the details of the single feature stored in the single
<第二の実施形態に係る画像監視装置1の構成>
図1のブロック図を参照して第二の実施形態に係る画像監視装置1の概略の構成を説明する。
画像監視装置1は、第一の実施形態と同様、監視空間を所定時間おきに撮影して撮影画像を出力する撮影部2と、物体位置の情報を入力されて当該情報を表示する表示部6と、撮影画像を取得して当該撮影画像から個々の人(物体)を検出し、検出した物体の位置(物体位置)の情報を生成して出力する画像処理部5とが、撮影画像および物体位置の情報等の入出力を介在する通信部3に接続されるとともに、プログラムおよび各種データ等を記憶してこれらを入出力する記憶部4が画像処理部5に接続されてなる。
<Configuration of
The schematic configuration of the
As in the first embodiment, the
<第二の実施形態に係る画像監視装置1の機能>
図2および図12の機能ブロック図を参照し、第二の実施形態に係る画像監視装置1の機能について説明する。
<Function of the
With reference to the functional block diagrams of FIGS. 2 and 12, functions of the
通信部3は、第一の実施形態と同様、撮影部2から撮影画像を取得して密度推定手段50と物体位置判定手段51に出力する画像取得手段30、および物体位置判定手段51から入力された物体位置の情報を表示部6に出力する物体位置出力手段31等としての機能を含む。
Similar to the first embodiment, the
また、記憶部4は、第一の実施形態と同様、所定の密度ごとに当該密度にて物体が存在する空間を撮影した密度画像それぞれの画像特徴を学習した密度推定器を記憶している密度推定器記憶手段40、および予めの学習により生成された単独の物体の画像特徴(単体特徴)を記憶している単体特徴記憶手段41等としての機能を含み、単体特徴記憶手段41が記憶している単体特徴は、物体を構成する部分ごとの画像特徴の情報および密度に対する重みの情報となっている。
In addition, as in the first embodiment, the storage unit 4 stores a density estimator that learns the image features of each density image obtained by photographing a space where an object exists at the predetermined density for each predetermined density. It includes a function as an
また、画像処理部5は、第一の実施形態と同様、撮影画像を密度推定器で走査することによって撮影画像に撮影された物体の密度の分布を推定し、推定した密度分布を物体位置判定手段51に出力する密度推定手段50、および撮影画像内に個々の物体が存在し得る候補位置を設定して当該候補位置の撮影画像に単独の物体の画像特徴が現れている度合いを表す評価値(統合評価値)を算出し、統合評価値が判定基準を満たす候補位置を物体の位置と判定して物体位置の情報を物体位置出力手段31に出力する物体位置判定手段51等としての機能を含み、物体位置判定手段51は、候補位置を基準として撮影画像内に物体を構成する複数の部分のそれぞれと対応する部分領域を設定して、部分領域ごとに当該部分領域と対応する部分の画像特徴が現れている度合いを表す部分評価値を算出し、候補位置を基準に設定した各部分領域の部分評価値を当該部分領域の密度が低いほど重視して統合することによって統合評価値を算出する。
Further, as in the first embodiment, the
ただし、上述したように、第二の実施形態に係る物体位置判定手段51が行う処理の細部および単体特徴記憶手段41が記憶している単体特徴の細部が第一の実施形態に係る画像監視装置1と異なる。これらの点について、図12の機能ブロック図を参照して説明する。
However, as described above, the details of the processing performed by the object
第二の実施形態に係る単体特徴記憶手段41は、単独の人(物体)を構成する複数の部分のそれぞれの画像特徴を学習した部分ごとの識別器(部分識別器)を予め記憶した部分識別器記憶手段411b、および評価値の算出において用いる重みの情報を予め記憶した重み記憶手段412bとして機能し、部分識別器の情報および重みの情報を単体特徴として記憶している。
The single
図13は、第二の実施形態に係る単体特徴記憶手段41が記憶している単体特徴、すなわち部分識別器記憶手段411bが記憶している部分識別器の情報および重み記憶手段412bが記憶している重みの情報を模式的に表した図である。
FIG. 13 shows the single feature stored in the single
物体の各部分についての部分識別器のそれぞれは、画像の特徴量を入力されると当該画像が当該部分の画像(部分画像)であることの尤もらしさを表す部分スコア(部分評価値)を算出して出力するスコア算出関数の係数等で表される。部分識別器記憶手段411bは、各部分識別器を表す係数等、各部分の基準位置からの相対位置および密度と使用する部分識別器の対応関係等のパラメータを記憶している。基準位置は例えば頭部重心である。
Each of the partial classifiers for each part of the object calculates a partial score (partial evaluation value) indicating the likelihood that the image is an image of the part (partial image) when the feature amount of the image is input. It is expressed by the coefficient of the score calculation function to be output. The partial
部分識別器は、例えば、多数の人についての部分画像と多数の無人画像からなる学習用画像の特徴量に線形SVM法を適用して学習した識別器とすることができる。学習アルゴリズムとして線形SVMを用いた場合、スコア算出関数の係数は重みベクトルである。この重みベクトルは、特徴量の各要素に対する重みであり、入力された画像の特徴量と重みベクトルとの内積の値が部分スコアを表す。学習において、当該重みベクトルと特徴量との内積が0以上である場合は人の部分画像、0未満である場合は人の部分画像ではないと識別されるように調整される。よって、統合スコアに適用して、入力された画像が単独の人の画像であるか否かを識別する閾値は原理上は0であり、通常、閾値は0に設定することができる。ただし、単独の人の画像を単独の人の画像ではないと識別する誤りを減じるために、閾値を0よりも小さな値に設定してもよい。
学習用画像の特徴量は例えばHOG(Histograms of Oriented Gradients)特徴量とすることができる。
The partial discriminator can be, for example, a discriminator that learns by applying the linear SVM method to the feature amount of a learning image including a partial image and a large number of unmanned images for a large number of people. When linear SVM is used as the learning algorithm, the coefficient of the score calculation function is a weight vector. This weight vector is a weight for each element of the feature quantity, and the value of the inner product of the feature quantity of the input image and the weight vector represents the partial score. In learning, when the inner product of the weight vector and the feature amount is 0 or more, adjustment is made so that it is identified as a partial image of a person, and when it is less than 0, it is not a partial image of a person. Therefore, the threshold value that is applied to the integrated score and identifies whether the input image is an image of a single person is 0 in principle, and the threshold value can usually be set to 0. However, the threshold value may be set to a value smaller than 0 in order to reduce the error of identifying a single person image as not being a single person image.
The feature amount of the learning image may be, for example, a HOG (Histograms of Oriented Gradients) feature amount.
部分識別器記憶手段411bは、具体的には、低密度クラスを表す値と対応付けて人の6つの部分「上1/3、左1/2」、「上1/3、右1/2」、「中1/3、左1/2」、「中1/3、右1/2」、「下1/3、左1/2」および「下1/3、右1/2」の画像特徴を学習した部分識別器800〜805を記憶している。これら6つの部分を合わせると人の「全体」となる。
以下、「上1/3、左1/2」を左上部、「上1/3、右1/2」を右上部、「中1/3、左1/2」を左中部、「中1/3、右1/2」を右中部、「下1/3、左1/2」を左下部、「下1/3、右1/2」を右下部と称する。また、左上部用の部分識別器800を左上部識別器、右上部用の部分識別器801を右上部識別器、左中部用の部分識別器802を左中部識別器、右中部用の部分識別器803を右中部識別器、左下部用の部分識別器804を左下部識別器、右下部用の部分識別器805を右下部識別器と称する。また、合わせると評価範囲が「全体」となる6つの部分識別器800〜805のセット810を全体識別器と称する。
また部分識別器記憶手段411bは、中密度クラスを表す値と対応付けて左上部識別器800、右上部識別器801、左中部識別器802および右中部識別器803を記憶している。これら4つの部分識別器の評価範囲を合わせると人の「上部2/3」となる。合わせると評価範囲が「上部2/3」となる4つの部分識別器800〜803のセット811を上半身識別器と称する。
また部分識別器記憶手段411bは、高密度クラスを表す値と対応付けて左上部識別器800および右上部識別器801を記憶している。これら2つの部分識別器の評価範囲を合わせると人の「上部1/3」となる。合わせると評価範囲が「上部1/3」となる2つの部分識別器800,801のセット812を頭部近傍識別器と称する。
Specifically, the partial
Hereinafter, “Up 1/3,
The partial
The partial
このように、部分識別器記憶手段411bは、低密度クラスと対応付けて左上部識別器800、右上部識別器801、左中部識別器802、右中部識別器803、左下部識別器804および右下部識別器805からなる全体識別器810を、中密度クラスと対応付けて左上部識別器800、右上部識別器801、左中部識別器802および右中部識別器803からなる上半身識別器811を、高密度クラスと対応付けて左上部識別器800および右上部識別器801からなる頭部近傍識別器812を、統合評価値に適用する閾値等とともに記憶している。
なお、ここでは密度間で同一部分の部分識別器を共用する例を示したが、密度ごとに部分の区分けを異ならせてもよい。
As described above, the partial
Here, an example in which partial identifiers of the same part are shared between the densities is shown, but the division of the parts may be different for each density.
重み820は、物体の各部分と対応する部分領域の密度に応じて当該部分を重視する度合いであり、密度間の相対的な比率で表される。密度が低い部分ほど重視され密度が高い部分ほど軽視されるため、密度が低いほど高く密度が高いほど低い重み820が設定されている。例えば、低密度、中密度および高密度の重み820は比率10:7:5とすることができる。なお部分領域の密度の決定に際しては背景クラスは低密度クラスとみなすことができる。
The
このように重み記憶手段412bは、密度が低いほど高く密度が高いほど低い、密度ごとの重みを記憶している。
As described above, the
候補位置設定手段511bは、撮影画像内に所定間隔にて複数の候補位置を設定し、設定した候補位置を評価値算出手段514bに出力する。具体的には、所定間隔は1画素であり、候補位置設定手段511bは撮影画像の各画素の位置を順次候補位置に設定する。なお候補位置は人の頭部重心を表すものとする。
The candidate
評価値算出手段514bは、候補位置設定手段511bから入力された各候補位置を基準として撮影画像内に単独の物体を構成する複数の部分のそれぞれと対応する部分領域を設定して、複数の部分のそれぞれと対応する部分領域の画像特徴を当該部分の画像特徴を学習した部分識別器に入力して当該部分領域の部分評価値を算出し、候補位置ごとに当該候補位置を基準に設定した部分領域の部分評価値を当該部分領域の密度が低いほど重視して統合することにより統合評価値を算出し、算出した統合評価値とそれに付随する情報を位置決定手段517bに出力する。
またその際に、評価値算出手段514bは、各候補位置に、当該候補位置における密度が高いほど、単独の物体を構成する部分のうちの少ない部分に対応する部分領域を設定する。
The evaluation
At that time, the evaluation
そのために、評価値算出手段514bは、各候補位置に上部1/3の窓を設定し、密度推定手段50から入力された密度分布を参照して当該窓内の推定密度を集計する。ただし背景クラスは除いて集計する。そして、評価値算出手段514bは各候補位置における最多の推定密度を当該候補位置の密度と決定する。
For this purpose, the evaluation
また、評価値算出手段514bは、部分識別器記憶手段411bから各候補位置の密度に応じた部分識別器の情報を読み出し、各候補位置に当該候補位置の密度に対応づけられた部分識別器と対応する窓(部分領域)を設定し、各部分領域内の撮影画像から識別用の特徴量(識別用特徴量)を抽出する。これらの部分領域は、各部分の部分識別器の学習に用いた部分画像の形状(図13に示した実線の矩形)を有し、予め定めた複数の倍率で拡大・縮小した大きさの窓である。低密度の候補位置に対しては合わせると人の「全体」となる6つの部分領域、中密度の候補位置に対しては合わせると人の「上部2/3」となる4つの部分領域、高密度の候補位置に対しては合わせると人の「上部1/3」となる2つの部分領域が設定される。識別用特徴量は、学習用画像の特徴量と同種であり、HOG特徴量である。
Further, the evaluation
また、評価値算出手段514bは、各部分の識別用特徴量を当該部分の部分識別器に入力してその出力値である部分スコアを部分評価値として取得する。 Further, the evaluation value calculation means 514b inputs the identification feature quantity of each part to the partial classifier of the part, and acquires the partial score that is the output value as the partial evaluation value.
また、評価値算出手段514bは、各部分領域について当該部分領域の推定密度に応じた重み係数を算出する。
Further, the evaluation
そのために、評価値算出手段514bは、密度分布を参照して各部分領域内の推定密度を集計し、各部分領域における最多の推定密度を当該部分領域の密度と決定する。ただし背景クラスは低密度クラスとみなして集計する。
次に評価値算出手段514bは、重み記憶手段412bから各部分領域の密度に対応する重み(重み係数の比率)を読み出し、候補位置ごとに当該候補位置を基準に設定した部分領域の重みの和を求める。
続いて評価値算出手段514bは、候補位置ごとに、各部分領域の重みを全部分領域の重みの和で除して、当該部分領域の重み係数を算出する。すなわち各候補位置における重み係数の和は1となるように正規化される。
このようにして評価値算出手段514bは、部分領域ごとに当該部分領域における密度が低いほど高く当該部分領域における密度が高いほど低い重み係数を設定する。
For this purpose, the evaluation value calculation means 514b refers to the density distribution and totals the estimated density in each partial area, and determines the highest estimated density in each partial area as the density of the partial area. However, the background class is counted as a low density class.
Next, the evaluation
Subsequently, for each candidate position, the evaluation value calculation means 514b divides the weight of each partial area by the sum of the weights of all partial areas and calculates the weight coefficient of the partial area. That is, the sum of the weighting coefficients at each candidate position is normalized so as to be 1.
In this way, the evaluation
また、評価値算出手段514bは、候補位置ごとに、候補位置を基準に設定した各部分領域の部分評価値を当該部分領域の重み係数にて重み付けて総和して統合評価値を算出する。
Further, for each candidate position, the evaluation
つまり、左上部識別器による部分スコアをSUL、右上部識別器による部分スコアをSUR、左中部識別器による部分スコアをSML、右中部識別器による部分スコアをSMR、左下部識別器による部分スコアをSLL、右下部識別器による部分スコアをSLRとし、左上部の重み係数をWUL、右上部の重み係数をWUR、左中部の重み係数をWML、右中部の重み係数をWMR、左下部の重み係数をWLL、右下部の重み係数をWLRとすると、評価値算出手段514bは、次のようにして統合スコアを算出する。 That is, the partial score by the upper left classifier is S UL , the partial score by the upper right classifier is S UR , the partial score by the left middle classifier is S ML , the partial score by the right middle classifier is S MR , and the lower left classifier S LL , the partial score by the lower right discriminator as S LR , the upper left weighting factor is W UL , the upper right weighting factor is W UR , the left middle weighting factor is W ML , and the right middle weight is Assuming that the coefficient is W MR , the lower left weight coefficient is W LL , and the lower right weight coefficient is W LR , the evaluation value calculation means 514 b calculates the integrated score as follows.
評価値算出手段514bは、注目している候補位置の密度が低密度であれば次式によって当該候補位置の統合スコアを算出する。
統合スコア=WULSUL+WURSUR+WMLSML+WMRSMR
+WLLSLL+WLRSLR (3)
また、評価値算出手段514bは、注目している候補位置の密度が中密度であれば次式によって当該候補位置の統合スコアを算出する。
統合スコア=WULSUL+WURSUR+WMLSML+WMRSMR (4)
また、評価値算出手段514bは、注目している候補位置の密度が高密度であれば次式によって当該候補位置の統合スコアを算出する。
統合スコア=WULSUL+WURSUR (5)
The evaluation
Integrated score = W UL S UL + W UR S UR + W ML S ML + W MR S MR
+ W LL S LL + W LR S LR (3)
Moreover, if the density of the candidate position of interest is medium density, the evaluation
Integrated score = W UL S UL + W UR S UR + W ML S ML + W MR S MR (4)
Further, if the density of the candidate position of interest is high, the evaluation
Integrated score = W UL S UL + W UR S UR (5)
図14は、図7で例示した密度分布が得られている場合に、図7で例示した各候補位置について評価値算出手段514bが統合スコアを算出する様子を模式的に示した図である。画像830は、これらの候補位置のうち密度が低密度である3つの候補位置について、各部分と重み係数の関係を示している。画像831は、密度が中密度である3つの候補位置について、各部分と重み係数の関係を示している。画像832は、密度が高密度である2つの候補位置について、各部分と重み係数の関係を示している。
FIG. 14 is a diagram schematically illustrating how the evaluation
例えば、候補位置840は、その密度が低密度であるため候補位置840を基準に6つの部分領域が設定され、6つの部分領域の密度がいずれも低密度であるため各部分領域の重み係数比率は10、その和は60となる。よって、重み係数はWUL=WUR=WML=WMR=WLL=WLR=10/60となり、これらの重み係数と各部分の部分スコアを式(3)に代入して統合スコアが算出される。
また例えば、候補位置841は、その密度が中密度であるため候補位置841を基準に4つの部分領域が設定され、4つの部分領域のうちの上2つは密度が中密度であるため重み係数比率は7、下2つは密度が低密度であるため重み係数比率は10、その和は34となる。よって、重み係数はWUL=WUR=7/34、WML=WMR=10/34となり、これらの重み係数と各部分の部分スコアを式(4)に代入して統合スコアが算出される。
また例えば、候補位置842は、その密度が高密度であるため候補位置842を基準に2つの部分領域が設定され、2つの部分領域の密度がいずれも高密度であるため各部分領域の重み係数比率は5、その和は10となる。よって、重み係数はWUL=WUR=5/10となり、これらの重み係数と各部分の部分スコアを式(5)に代入して統合スコアが算出される。
他の候補位置についても同様にして統合スコアが算出される。
For example, since the
Further, for example, the
Further, for example, since the
The integrated score is similarly calculated for other candidate positions.
そして、評価値算出手段514bは、候補位置ごとに、候補位置、候補位置の密度、統合スコアおよび使用した部分領域の和領域(統合窓)を対応付けた情報を位置決定手段517bに出力する。
Then, the evaluation
位置決定手段517bは、評価値算出手段514bから入力された情報を参照し、予め定めた判定基準を満たす統合評価値が算出された候補位置を物体の位置と決定する。
The
具体的には、位置決定手段517bは、統合スコアが予め定めた閾値(例えば0)以上である候補位置を抽出し、抽出した候補位置のうち対応する密度が同一であり且つ互いに近接する複数の候補位置(統合窓同士の重複が予め定めた割合より大きな候補位置)を一つにまとめ、まとめた候補位置を人が撮影されている位置と決定する。
Specifically, the
この候補位置をまとめる処理は、実際に人が撮影されている位置に加えてその近傍においても同一人物に対して高い統合スコアが算出されることに対処するために行う。具体的には、例えば、位置決定手段517bは、候補位置の密度ごとに、閾値以上の統合スコアが算出された候補位置を統合スコアが高い順に順次注目位置に設定するとともに注目位置より統合スコアが低い候補位置を比較位置に設定する。そして、位置決定手段517bは、比較位置のうち当該比較位置の統合窓と注目位置の統合窓との重なりが予め定めた割合より大きい比較位置の情報を削除することで複数の候補位置を一つにまとめる。
The process of grouping the candidate positions is performed in order to cope with the fact that a high integrated score is calculated for the same person in the vicinity in addition to the position where the person is actually photographed. Specifically, for example, for each density of candidate positions, the
そして、位置決定手段517bは、人が撮影されている位置と決定した候補位置を物体位置の情報として物体位置出力手段31に出力する。
Then, the
<第二の実施形態に係る画像監視装置1の動作>
以下、図9および図15を参照し、第二の実施形態に係る画像監視装置1の動作を説明する。
<Operation of
Hereinafter, the operation of the
画像監視装置1が動作を開始すると、第一の実施形態と同様に、撮影部2は順次撮影画像を送信し、画像処理部5は撮影画像を受信するたびに図9のフローチャートに従った動作を繰り返す。
When the
通信部3は画像取得手段30として動作し、撮影画像を受信して画像処理部5に出力する(ステップS1)。撮影画像を入力された画像処理部5は密度推定手段50として動作して記憶部4の密度推定器記憶手段40から密度推定器を読み出し、撮影画像を密度推定器にて走査することによって密度分布を推定する(ステップS2)。
The
次に、画像処理部5は物体位置判定手段51として動作し、物体位置判定手段51は、画像取得手段30から撮影画像および密度推定手段50から密度分布を入力されて、密度分布に背景クラス以外の推定密度が含まれているか否かを確認する(ステップS3)。
Next, the
物体位置判定手段51は、背景クラス以外の推定密度が含まれている場合は(ステップS3にてYES)、撮影画像から個々の物体の位置を判定する処理を行い(ステップS4)、背景クラスのみの場合は(ステップS3にてNO)、ステップS4,S5の処理を省略する。
When the estimated density other than the background class is included (YES in step S3), the object
図15のフローチャートを参照して、ステップS4の物体位置判定処理を説明する。単体特徴記憶手段41が部分識別器記憶手段411bおよび重み記憶手段412bとして動作し、物体位置判定手段51が候補位置設定手段511b、評価値算出手段514bおよび位置決定手段517bとして動作して、物体位置判定処理が実行される。
The object position determination process in step S4 will be described with reference to the flowchart in FIG. The single
候補位置設定手段511bは、撮影画像中の各画素の位置を順次候補位置に設定して評価値算出手段514bに入力し(ステップS200)、ステップS200〜S206のループ処理を制御する。
The candidate
候補位置を入力された評価値算出手段514bは密度分布を参照して候補位置の密度を特定する(ステップS201)。すなわち評価値算出手段514bは候補位置に単独の人の上部1/3の形状に定められた窓を設定して当該窓内で最多の推定密度(ただし背景クラスは除く)を候補位置の密度として特定する。
The evaluation
候補位置の密度を特定した評価値算出手段514bは、部分識別器記憶手段411bから当該密度に応じた複数の部分識別器を読み出し、各部分識別器に対応する部分領域を設定して部分領域内の撮影画像から識別用特徴量をそれぞれ抽出し(ステップS202)、抽出した識別用特徴量を該当する部分識別器に入力して、それぞれの部分スコア(部分評価値)を算出する(ステップS203)。
The evaluation
部分評価値を算出した評価値算出手段514bは密度分布を参照して各部分領域の密度を特定する(ステップ204)。すなわち、評価値算出手段514bは各部分領域内で最多の推定密度(ただし背景クラスは低密度クラスとみなす)を当該部分領域の密度として特定する。 The evaluation value calculation means 514b that has calculated the partial evaluation value refers to the density distribution and specifies the density of each partial region (step 204). That is, the evaluation value calculation means 514b specifies the highest estimated density in each partial area (however, the background class is regarded as the low density class) as the density of the partial area.
各部分領域の密度を特定した評価値算出手段514bは、重み記憶手段412bから各部分領域の密度に応じた重み係数の比率を読み出し、各部分領域の重み係数の比率を全部分領域の重み係数の比率の和で除して当該部分領域の重み係数を算出し、算出した重み係数とステップS203で算出した部分評価値を積和することにより候補位置の統合評価値を算出する(ステップS205)。候補領域の密度が低密度の場合は式(3)、中密度の場合は式(4)、高密度の場合は式(5)に従って、積和することになる。
The evaluation
そして、評価値算出手段514bは、候補位置と、部分領域の和領域の窓(統合窓)と、候補位置の密度と、統合評価値とを対応付けて記録するとともに、撮影画像の全ての画素の位置を候補位置に設定し終えたか否かを確認し(ステップS206)、未設定の画素がある場合は(ステップS206にてNO)、処理をステップS200に戻して次の画素の位置を処理する。
The evaluation
他方、全ての画素の位置を候補位置に設定し終えた場合(ステップS206にてYES)、位置決定手段517bは、ステップS206で記録された候補位置と統合窓と候補位置の密度と統合評価値の組の中から統合評価値が閾値未満の組を削除し(ステップS207)、さらに、削除されずに残った組について、候補位置の密度ごとに、互いの統合窓が予め定めた割合よりも大きく重複している組を同一人物のものとして一つの組にまとめる(ステップS208)。そして位置決定手段517bはまとめた後の各組の候補位置を撮影画像に撮影されている個々の人の位置(物体位置)と判定する。
On the other hand, when the positions of all the pixels have been set as the candidate positions (YES in step S206), position determination means 517b determines the candidate position, the integrated window, the density of candidate positions, and the integrated evaluation value recorded in step S206. The group whose integrated evaluation value is less than the threshold value is deleted from the group of () (step S207), and for each group that remains without being deleted, the integration window of each other is higher than a predetermined ratio for each density of candidate positions. Large overlapping sets are grouped into one set as those of the same person (step S208). Then, the
再び図9を参照して説明を続ける。物体位置判定手段51はステップS4にて判定した物体位置の情報を通信部3に出力し(ステップS5)、通信部3は物体位置出力手段31として動作して物体位置の情報を表示部6に送信する。
The description will be continued with reference to FIG. 9 again. The object
以上の処理を終えると、処理はステップS1に戻され、次の撮影画像に対する処理が行われる。 When the above process is completed, the process returns to step S1, and the process for the next captured image is performed.
<変形例>
(1)上記各実施形態およびその変形例においては、検出対象の物体を人とする例を示したが、これに限らず、検出対象の物体を車両、牛や羊等の動物等とすることもできる。
<Modification>
(1) In each of the above-described embodiments and modifications thereof, an example in which the object to be detected is a person has been shown. However, the present invention is not limited thereto, and the object to be detected is a vehicle, an animal such as a cow or a sheep, or the like. You can also.
(2)上記各実施形態およびその各変形例においては物体を高さ方向に3分割し幅方向に2分割した部分を単位として部分領域を設定する例を示したが、分け方はこれに限らない。検出対象や撮影する監視空間の特性、採用する特徴量や評価値の種類などの違いに応じ、それぞれに適した別の比率で分けた部分領域とすることができる。またオーバーラップさせて部分領域を設定してもよい。 (2) In each of the above-described embodiments and modifications thereof, an example is shown in which a partial region is set with a unit obtained by dividing the object into three parts in the height direction and two parts in the width direction. Absent. Depending on the difference in the characteristics of the detection target, the monitoring space to be photographed, the feature amount to be used, the type of the evaluation value, and the like, the partial areas can be divided at different ratios suitable for each. Moreover, you may overlap and set a partial area | region.
(3)上記各実施形態およびその各変形例において示した重みは一例であり、検出対象や撮影する監視空間の特性、採用する特徴量や評価値の種類などの違いに応じ、それぞれに適した別の値とすることができる。 (3) The weights shown in the above embodiments and the modifications thereof are examples, and are suitable for each according to the difference in the characteristics of the detection target, the monitoring space to be photographed, the feature amount to be used, the type of evaluation value, and the like. It can be another value.
(4)上記各実施形態およびその各変形例においては、多クラスSVM法にて学習した密度推定器を例示したが、多クラスSVM法に代えて、決定木型のランダムフォレスト法、多クラスのアダブースト(AdaBoost)法または多クラスロジスティック回帰法などにて学習した密度推定器など種々の密度推定器とすることができる。
或いは識別型のCNN(Convolutional Neural Network)を用いた密度推定器とすることもできる。
(4) In each of the above-described embodiments and modifications thereof, the density estimator learned by the multi-class SVM method has been exemplified, but instead of the multi-class SVM method, a decision tree type random forest method, a multi-class Various density estimators such as a density estimator learned by the AdaBoost method or the multi-class logistic regression method can be used.
Alternatively, a density estimator using a discriminating CNN (Convolutional Neural Network) may be used.
(5)上記各実施形態およびその各変形例においては、密度推定器が推定する背景以外の密度のクラスを3クラスとしたが、より細かくクラスを分けてもよい。
その場合、3段階の重みに代えて、クラス分けに対応したより細かい段階の重みとし、クラスと重みを対応付けて単体特徴記憶手段41に記憶させておくことができる。或いは、クラスと3段階の重みを多対一で対応付けて単体特徴記憶手段41に記憶させておくこともできる。
(5) In each of the above-described embodiments and modifications thereof, the class of density other than the background estimated by the density estimator is set to three classes, but the class may be divided more finely.
In this case, instead of the three-stage weights, finer-stage weights corresponding to the classification can be used, and the classes and the weights can be associated with each other and stored in the single
(6)上記各実施形態およびその各変形例においては、多クラスに分類する密度推定器を例示したがこれに代えて、特徴量から密度の値(推定密度)を回帰する回帰型の密度推定器とすることもできる。すなわち、リッジ回帰法、サポートベクターリグレッション法、回帰木型のランダムフォレスト法またはガウス過程回帰(Gaussian Process Regression)などによって、特徴量から推定密度を求めるための回帰関数のパラメータを学習した密度推定器とすることができる。
或いは回帰型のCNNを用いた密度推定器とすることもできる。
これらの場合、密度クラスの値の代わりに連続値で出力される推定密度の値域を、部分モデルおよび重み、または部分識別器および重みと対応付けて単体特徴記憶手段41に記憶させておく。またこれらの場合、部分領域の密度は部分領域内で最多の推定密度とする以外にも、部分領域内の推定密度の平均値または中央値などとすることもできる。
(6) In each of the above-described embodiments and modifications thereof, a density estimator that classifies into multiple classes is illustrated, but instead of this, a regression type density estimation that regresses a density value (estimated density) from a feature quantity It can also be a container. That is, a density estimator that has learned the parameters of the regression function for obtaining the estimated density from the features by ridge regression method, support vector regression method, regression tree-type random forest method or Gaussian Process Regression, etc. can do.
Alternatively, a density estimator using a regression type CNN may be used.
In these cases, the estimated density range output as a continuous value instead of the density class value is stored in the single
(7)上記各実施形態およびその各変形例においては、密度推定器が学習する特徴量および推定用特徴量としてGLCM特徴を例示したが、これらはGLCM特徴に代えて、局所二値パターン(Local Binary Pattern:LBP)特徴量、ハールライク(Haar-like)特徴量、HOG特徴量、輝度パターンなどの種々の特徴量とすることができ、またはGLCM特徴とこれらのうちの複数を組み合わせた特徴量とすることもできる。 (7) In each of the above-described embodiments and modifications thereof, the GLCM feature is exemplified as the feature amount learned by the density estimator and the estimation feature amount. However, instead of the GLCM feature, the local binary pattern (Local Binary Pattern (LBP) feature value, Haar-like feature value, HOG feature value, luminance pattern, and other various feature values, or a combination of GLCM features and a plurality of them You can also
(8)上記各実施形態およびその各変形例においては、密度推定手段50および物体位置判定手段51が1画素間隔で走査して処理を行う例を示したが、これらの走査を2画素以上の間隔を空けて行うことも可能である。
(8) In each of the above-described embodiments and modifications thereof, an example is shown in which the
(9)上記各実施形態およびその各変形例においては、候補位置を推定密度が低密度、中密度または高密度の領域内から選んで設定する例を示したが、配置生成手段510aおよび候補位置設定手段511bのそれぞれは、変化領域内に限定して候補位置を設定することもできる。その場合、記憶部4は監視空間の背景画像を記憶する背景画像記憶手段(不図示)を備え、画像処理部5は、撮影画像と背景画像との差分処理を行って差分値が所定の差分閾値以上である画素の集まりを変化領域として抽出する、または撮影画像と背景画像との相関処理を行って相関値が所定の相関閾値以下である画素の集まりを変化領域として抽出する変化領域抽出手段(不図示)を備え、配置生成手段510aおよび候補位置設定手段511bのそれぞれは、変化領域抽出手段が抽出した変化領域を参照して候補位置を設定する。
なお、候補位置を設定する領域を限定する場合、配置生成手段510aは限定した領域の大きさに応じて配置数の上限個数を変更することができる。
このような候補位置を設定する領域の限定によって、撮影画像とモデル画像の偶発的な類似または背景に対する高い識別スコアの偶発的な算出を防止でき、物体位置の誤検出を低減できる。
(9) In each of the above-described embodiments and the modifications thereof, an example is shown in which candidate positions are selected and set from an area with a low, medium, or high estimated density. Each of the setting means 511b can also set candidate positions limited to the change region. In that case, the storage unit 4 includes background image storage means (not shown) for storing the background image of the monitoring space, and the
Note that, when the area where the candidate position is set is limited, the
By limiting the region where the candidate positions are set, accidental similarity between the captured image and the model image or accidental calculation of a high identification score for the background can be prevented, and erroneous detection of the object position can be reduced.
(10)上記第一の実施形態とその各変形例においては、配置生成手段510aが反復の都度ランダムに配置を生成する例を示したが、反復の2回目以降に一回前の候補位置から微小にずらした候補位置に更新することで配置を生成してもよいし、反復の2回目以降に一回前の配置に対する類似度を参照してMCMC(Markov chain Monte Carlo)法により確率的に候補位置を探索する方法や山登り法により候補位置を逐次改善することで配置を生成してもよい。
(10) In the first embodiment and the modifications thereof, the example has been shown in which the
(11)上記各実施形態およびその各変形例においては、注目している候補位置に人の上部1/3の形状に定められたモデルの投影領域または該形状に定められた窓を設定して当該領域内の推定密度を集計することによって、当該候補位置における推定密度を決定する例を示したが、処理量を削減するために当該領域に代えて候補位置の画素、候補位置の8近傍領域または16近傍領域などの小さな領域とすることもできる。或いは、確度を上げるために当該領域に代えて候補位置を代表位置とする単独の人の上部2/3の形状に定められたモデルの投影領域または該形状に定められた窓、または候補位置を代表位置とする単独の人の全身の形状に定められたモデルの投影領域または該形状に定められた窓などの大きな領域とすることもできる。 (11) In each of the above-described embodiments and modifications thereof, a projection area of a model defined in the shape of the upper third of the person or a window defined in the shape is set at the candidate position of interest. The example in which the estimated density at the candidate position is determined by aggregating the estimated density in the area has been shown. However, in order to reduce the processing amount, the pixel at the candidate position and the 8 neighboring areas at the candidate position are replaced with the area. Alternatively, it may be a small area such as the 16 neighborhood area. Alternatively, in order to improve the accuracy, a projection area of a model defined in the shape of the upper 2/3 of a single person with the candidate position as a representative position instead of the area, a window defined in the shape, or a candidate position It can also be a projection area of a model defined in the shape of the whole body of a single person as a representative position or a large area such as a window defined in the shape.
(12)第二の実施形態およびその変形例においては、線形SVM法により学習された部分識別器を例示したが、線形SVM法に代えてアダブースト(AdaBoost)法など、従来知られた各種の学習法を用いて学習した部分識別器とすることもできる。また、識別器の代わりにパターンマッチング器を用いることもでき、その場合の部分スコアは人の学習用画像から抽出した特徴量の平均パターンと入力画像の特徴量との内積などとなり、評価値算出関数は当該スコアを出力値とし撮影画像の特徴量を入力値とする関数とすることができる。また部分識別器として識別型のCNNを用いても良い。 (12) In the second embodiment and its modification, the partial classifier learned by the linear SVM method is exemplified, but various types of conventionally known learning such as the AdaBoost method instead of the linear SVM method are exemplified. It can also be a partial classifier learned by using the method. In addition, a pattern matching device can be used instead of the discriminator, and the partial score in this case is the inner product of the average pattern of feature values extracted from the human learning image and the feature value of the input image, etc. The function can be a function having the score as an output value and a feature amount of the photographed image as an input value. Further, an identification type CNN may be used as the partial classifier.
(13)第二の実施形態およびその各変形例においては、部分識別器が学習および識別に用いる特徴量としてHOG特徴量を例示したが、これらはHOG特徴量に代えて、局所二値パターン特徴量、ハールライク特徴量、輝度パターンなどの種々の特徴量とすることができ、またはHOG特徴量とこれらのうちの複数を組み合わせた特徴量とすることもできる。 (13) In the second embodiment and the modifications thereof, the HOG feature amount is exemplified as the feature amount used by the partial classifier for learning and identification. However, these are local binary pattern features instead of the HOG feature amount. Various feature amounts such as an amount, a Haar-like feature amount, and a luminance pattern can be used, or a HOG feature amount and a feature amount obtained by combining a plurality of these can be used.
(14)第二の実施形態およびその各変形例においては、評価値算出手段514bが候補位置ごとに重みの和が1となるように正規化する例を示したが、さらに水平方向(左右方向)の重みの和が1となるように正規化してもよい。
(14) In the second embodiment and its modifications, the evaluation
(15)第二の実施形態およびその各変形例においては、物体の部分を重視する度合いを重みによって切り替える例を示したが、部分評価値に対する閾値(部分閾値)を切り替えることもできる。その場合、例えば、単体特徴記憶手段41は密度が低いほど低く密度が高いほど高く予め定められた部分閾値を各密度に対応づけて記憶し、評価値算出手段514bは部分評価値が部分閾値以上である部分領域の個数の割合を統合評価値として算出する。そして、位置決定手段517bは統合評価値が予め定めた閾値(例えば50%)以上である候補位置を物体位置と判定する。
(15) In the second embodiment and the modifications thereof, the example in which the degree of emphasis on the object portion is switched by the weight is shown, but the threshold value (partial threshold value) for the partial evaluation value can also be switched. In that case, for example, the single feature storage means 41 stores a predetermined partial threshold value that is higher as the density is lower and higher as the density is higher, in association with each density. The ratio of the number of partial areas is calculated as an integrated evaluation value. Then, the
以上の各実施形態およびその変形例によれば、物体検出装置は、候補位置および部分領域ごとの密度に応じ、当該密度により物体に生じ得る隠蔽状態に適した部分の特徴および重視する度合いを切り替えて個々の物体の位置を判定するので、混雑状態の変化に伴う物体の隠蔽状態の変化に適応した精度の高い物体検出が可能となる。 According to each of the above embodiments and the modifications thereof, the object detection device switches the feature of the part suitable for the concealment state that can occur in the object and the degree of emphasis according to the density for each candidate position and partial region. Therefore, it is possible to detect an object with high accuracy adapted to the change in the concealment state of the object accompanying the change in the congestion state.
またそのうちの第一の実施形態およびその変形例に係る物体検出装置は、物体の各部分の画像特徴を表す部分モデルおよび部分モデルの撮影画像に対する部分評価値を評価する際に重視する度合いを密度に応じて切り替えることによって混雑状態の変化に伴う物体の隠蔽状態の変化に適応した精度の高い物体検出を可能とする。 In addition, the object detection device according to the first embodiment and the modification thereof has a density that emphasizes a partial model representing an image feature of each part of the object and a partial evaluation value for a captured image of the partial model. By switching according to the above, it is possible to detect the object with high accuracy adapted to the change in the concealment state of the object accompanying the change in the congestion state.
またそのうちの第二の実施形態およびその変形例に係る物体検出装置は、物体の各部分の画像特徴を学習した部分識別器および部分識別器による部分ごとの部分評価値を総和する際に重視する度合いを密度に応じて切り替えることによって混雑状態の変化に伴う物体の隠蔽状態の変化に適応した精度の高い物体検出を可能とする。
In addition, the object detection device according to the second embodiment and the modified example of the second embodiment emphasizes the partial discriminator that learned the image feature of each part of the object and the sum of the partial evaluation values for each part by the partial discriminator. By switching the degree according to the density, it is possible to detect the object with high accuracy adapted to the change in the concealment state of the object accompanying the change in the congestion state.
1・・・画像監視装置
2・・・撮影部
3・・・通信部
30・・・画像取得手段
31・・・物体位置出力手段
4・・・記憶部
40・・・密度推定器記憶手段
41・・・単体特徴記憶手段
410a・・・物体モデル記憶手段
411b・・・部分識別器記憶手段
412a、412b・・・重み記憶手段
5・・・画像処理部
50・・・密度推定手段
51・・・物体位置判定手段
510a・・・配置生成手段
511b・・・候補位置設定手段
512a・・・モデル画像生成手段
514a、514b・・・評価値算出手段
516a・・・最適配置決定手段
517b・・・位置決定手段
6・・・表示部
DESCRIPTION OF
Claims (5)
所定の密度ごとに当該密度にて前記物体が存在する空間を撮影した密度画像それぞれの画像特徴を学習した密度推定器を用いて、前記撮影画像に撮影された前記物体の前記密度の分布を推定する密度推定手段と、
前記撮影画像内に個々の前記物体が存在し得る候補位置を設定するとともに前記候補位置を基準として前記撮影画像内に前記物体を構成する複数の部分のそれぞれと対応する部分領域を設定して、前記部分領域ごとに当該部分領域と対応する部分の画像特徴が現れている度合いを表す部分評価値を算出し、前記候補位置を基準に設定した複数の前記部分領域の前記部分評価値を当該部分領域の前記密度が低いほど重視して統合した統合評価値が所定の判定基準を満たす候補位置を前記物体の位置と判定する物体位置判定手段と、
を備えたことを特徴とする物体検出装置。 An object detection device for detecting individual objects from a captured image in which a space in which congestion due to a predetermined object may occur is captured,
Estimate the distribution of the density of the object imaged in the captured image using a density estimator that learns the image characteristics of each density image captured in the space where the object exists at the density for each predetermined density Density estimation means to perform,
A candidate position where each of the objects can exist in the captured image is set, and a partial region corresponding to each of a plurality of parts constituting the object is set in the captured image based on the candidate position, For each partial area, a partial evaluation value representing the degree of appearance of the image feature of the part corresponding to the partial area is calculated, and the partial evaluation values of the partial areas set on the basis of the candidate positions are used as the partial area. An object position determination means for determining, as the position of the object, a candidate position that satisfies a predetermined determination criterion by integrating and evaluating the integrated evaluation value as the density of the region is lower;
An object detection apparatus comprising:
それぞれが1以上の前記候補位置を含む互いに異なる複数通りの配置を生成する配置生成手段と、
前記複数通りの配置それぞれについて、前記各候補位置を基準とする前記複数の部分のそれぞれと対応する前記部分領域に、当該部分を模した部分モデルを描画してモデル画像を生成するモデル画像生成手段と、
前記複数通りの配置の前記モデル画像それぞれについて、前記部分領域ごとに前記部分モデルの前記撮影画像に対する類似の度合いを表す前記部分評価値を算出し、複数の前記部分領域の前記部分評価値を統合して前記統合評価値を算出する評価値算出手段と、
前記統合評価値が最大の配置における前記候補位置を前記物体の位置と決定する最適配置決定手段と、
を含む請求項1〜3のいずれかひとつに記載の物体検出装置。 The object position determination means includes
Arrangement generation means for generating a plurality of different arrangements each including one or more candidate positions;
For each of the plurality of arrangements, model image generation means for generating a model image by drawing a partial model imitating the part in the partial region corresponding to each of the plurality of parts with each candidate position as a reference When,
For each of the model images in the plurality of arrangements, the partial evaluation value representing the degree of similarity of the partial model to the captured image is calculated for each partial region, and the partial evaluation values of the partial regions are integrated. Evaluation value calculating means for calculating the integrated evaluation value;
An optimum arrangement determining means for determining the candidate position as the position of the object in the arrangement having the maximum integrated evaluation value;
The object detection device according to any one of claims 1 to 3.
前記撮影画像内に複数の前記候補位置を設定する候補位置設定手段と、
前記各候補位置を基準に設定した前記複数の部分のそれぞれと対応する前記部分領域の画像特徴を当該部分の画像特徴を学習した識別器に入力して当該部分領域の前記部分評価値を算出し、前記候補位置ごとに当該候補位置を基準に設定した複数の前記部分領域の前記部分評価値を統合して前記統合評価値を算出する評価値算出手段と、
前記判定基準を満たす前記統合評価値が算出された前記候補位置を前記物体の位置と決定する位置決定手段と、
を含む請求項1〜3のいずれかひとつに記載の物体検出装置。
The object position determination means includes
Candidate position setting means for setting a plurality of candidate positions in the captured image;
The partial evaluation value of the partial region is calculated by inputting the image feature of the partial region corresponding to each of the plurality of portions set based on the candidate positions to the classifier that has learned the image feature of the partial region. An evaluation value calculation means for calculating the integrated evaluation value by integrating the partial evaluation values of the plurality of partial areas set with reference to the candidate position for each candidate position;
Position determining means for determining, as the position of the object, the candidate position where the integrated evaluation value that satisfies the determination criterion is calculated;
The object detection device according to any one of claims 1 to 3.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017086322A JP6851246B2 (en) | 2017-04-25 | 2017-04-25 | Object detector |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017086322A JP6851246B2 (en) | 2017-04-25 | 2017-04-25 | Object detector |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2018185623A true JP2018185623A (en) | 2018-11-22 |
| JP6851246B2 JP6851246B2 (en) | 2021-03-31 |
Family
ID=64356743
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2017086322A Active JP6851246B2 (en) | 2017-04-25 | 2017-04-25 | Object detector |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP6851246B2 (en) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2020087463A (en) * | 2018-11-28 | 2020-06-04 | キヤノン株式会社 | Detection device and method, image processing device and system, and storage medium |
| JP2021149687A (en) * | 2020-03-19 | 2021-09-27 | セコム株式会社 | Device, method and program for object recognition |
Citations (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2011123742A (en) * | 2009-12-11 | 2011-06-23 | Secom Co Ltd | Intruding object detector |
| JP2012159957A (en) * | 2011-01-31 | 2012-08-23 | Secom Co Ltd | Moving object tracking device |
| JP2012159958A (en) * | 2011-01-31 | 2012-08-23 | Secom Co Ltd | Moving object tracking device |
| JP2013077202A (en) * | 2011-09-30 | 2013-04-25 | Secom Co Ltd | Moving object tracking device |
| JP2015121905A (en) * | 2013-12-20 | 2015-07-02 | セコム株式会社 | Object detection device |
| JP2016095808A (en) * | 2014-11-17 | 2016-05-26 | キヤノン株式会社 | Object detection device, object detection method, image recognition device and computer program |
| JP2016206795A (en) * | 2015-04-17 | 2016-12-08 | Kddi株式会社 | Device, program, and method for tracking object using discriminator that learns by real space information |
| JP2017049676A (en) * | 2015-08-31 | 2017-03-09 | セコム株式会社 | Posture discrimination device and object detection device |
| JP2017076181A (en) * | 2015-10-13 | 2017-04-20 | セコム株式会社 | Tracking device |
-
2017
- 2017-04-25 JP JP2017086322A patent/JP6851246B2/en active Active
Patent Citations (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2011123742A (en) * | 2009-12-11 | 2011-06-23 | Secom Co Ltd | Intruding object detector |
| JP2012159957A (en) * | 2011-01-31 | 2012-08-23 | Secom Co Ltd | Moving object tracking device |
| JP2012159958A (en) * | 2011-01-31 | 2012-08-23 | Secom Co Ltd | Moving object tracking device |
| JP2013077202A (en) * | 2011-09-30 | 2013-04-25 | Secom Co Ltd | Moving object tracking device |
| JP2015121905A (en) * | 2013-12-20 | 2015-07-02 | セコム株式会社 | Object detection device |
| JP2016095808A (en) * | 2014-11-17 | 2016-05-26 | キヤノン株式会社 | Object detection device, object detection method, image recognition device and computer program |
| JP2016206795A (en) * | 2015-04-17 | 2016-12-08 | Kddi株式会社 | Device, program, and method for tracking object using discriminator that learns by real space information |
| JP2017049676A (en) * | 2015-08-31 | 2017-03-09 | セコム株式会社 | Posture discrimination device and object detection device |
| JP2017076181A (en) * | 2015-10-13 | 2017-04-20 | セコム株式会社 | Tracking device |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2020087463A (en) * | 2018-11-28 | 2020-06-04 | キヤノン株式会社 | Detection device and method, image processing device and system, and storage medium |
| JP2021149687A (en) * | 2020-03-19 | 2021-09-27 | セコム株式会社 | Device, method and program for object recognition |
| JP7488674B2 (en) | 2020-03-19 | 2024-05-22 | セコム株式会社 | OBJECT RECOGNITION DEVICE, OBJECT RECOGNITION METHOD, AND OBJECT RECOGNITION PROGRAM |
Also Published As
| Publication number | Publication date |
|---|---|
| JP6851246B2 (en) | 2021-03-31 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN109076198B (en) | Video-based object tracking occlusion detection system, method and equipment | |
| KR100519782B1 (en) | Method and apparatus for detecting people using a stereo camera | |
| EP3029604B1 (en) | Area information estimating device, area information estimating method, and air conditioning apparatus | |
| KR100612858B1 (en) | Method and apparatus for tracking people using robots | |
| CN102214309B (en) | Special human body recognition method based on head and shoulder model | |
| CN101167086A (en) | Human detection and tracking for security applications | |
| US11544926B2 (en) | Image processing apparatus, method of processing image, and storage medium | |
| JP6624877B2 (en) | Information processing apparatus, information processing method and program | |
| CN107330371A (en) | Acquisition methods, device and the storage device of the countenance of 3D facial models | |
| KR20160136391A (en) | Information processing apparatus and information processing method | |
| JP7099809B2 (en) | Image monitoring system | |
| JP2017016593A (en) | Image processing apparatus, image processing method, and program | |
| CN106033601A (en) | Method and apparatus for detecting abnormal situation | |
| US20170053172A1 (en) | Image processing apparatus, and image processing method | |
| US20240104776A1 (en) | Camera calibration apparatus, camera calibration method, and non-transitory computer readable medium storing camera calibration program | |
| JP2018120283A (en) | Information processing apparatus, information processing method, and program | |
| JP2021118001A (en) | Method for distinguishing human being in crowd in image | |
| Loutas et al. | Probabilistic multiple face detection and tracking using entropy measures | |
| JP2018142173A (en) | Image monitoring device | |
| JP2021149687A (en) | Device, method and program for object recognition | |
| WO2012153868A1 (en) | Information processing device, information processing method and information processing program | |
| JP6851246B2 (en) | Object detector | |
| KR100543706B1 (en) | Vision-based Person Detection Method and Apparatus | |
| JP6920949B2 (en) | Object distribution estimator | |
| JP6893812B2 (en) | Object detector |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191216 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210209 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210309 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6851246 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |