[go: up one dir, main page]

JP2018185623A - Object detection device - Google Patents

Object detection device Download PDF

Info

Publication number
JP2018185623A
JP2018185623A JP2017086322A JP2017086322A JP2018185623A JP 2018185623 A JP2018185623 A JP 2018185623A JP 2017086322 A JP2017086322 A JP 2017086322A JP 2017086322 A JP2017086322 A JP 2017086322A JP 2018185623 A JP2018185623 A JP 2018185623A
Authority
JP
Japan
Prior art keywords
density
partial
image
evaluation value
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017086322A
Other languages
Japanese (ja)
Other versions
JP6851246B2 (en
Inventor
昌宏 前田
Masahiro Maeda
昌宏 前田
秀紀 氏家
Hidenori Ujiie
秀紀 氏家
黒川 高晴
Takaharu Kurokawa
高晴 黒川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Secom Co Ltd
Original Assignee
Secom Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Secom Co Ltd filed Critical Secom Co Ltd
Priority to JP2017086322A priority Critical patent/JP6851246B2/en
Publication of JP2018185623A publication Critical patent/JP2018185623A/en
Application granted granted Critical
Publication of JP6851246B2 publication Critical patent/JP6851246B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Processing (AREA)
  • Closed-Circuit Television Systems (AREA)
  • Image Analysis (AREA)

Abstract

【課題】混雑が生じ得る空間が撮影された撮影画像から個々の物体を精度良く検出する。【解決手段】画像解析装置は、所定の密度ごとに当該密度にて物体が存在する空間を撮影した密度画像それぞれの画像特徴を学習した密度推定器を用いて、撮影画像に撮影された物体の密度の分布を推定する密度推定手段50と、撮影画像内に個々の物体が存在し得る候補位置を設定するとともに候補位置を基準として撮影画像内に物体を構成する複数の部分のそれぞれと対応する部分領域を設定して、部分領域ごとに当該部分領域と対応する部分の画像特徴が現れている度合いを表す部分評価値を算出し、候補位置を基準に設定した複数の部分領域の部分評価値を当該部分領域の密度が低いほど重視して統合した統合評価値が所定の判定基準を満たす候補位置を物体の位置と判定する物体位置判定手段51を備える。【選択図】図2PROBLEM TO BE SOLVED: To accurately detect an individual object from a photographed image in which a space where congestion may occur is photographed. An image analysis device uses a density estimator that learns the image characteristics of each density image obtained by photographing a space in which an object exists at a predetermined density at the density of the object. The density estimation means 50 for estimating the density distribution, the candidate positions where individual objects can exist in the captured image are set, and the candidate positions correspond to each of a plurality of parts constituting the object in the captured image. A partial area is set, a partial evaluation value indicating the degree to which the image feature of the part corresponding to the partial area appears is calculated for each partial area, and a partial evaluation value of a plurality of partial areas set based on the candidate position is obtained. The object position determination means 51 is provided, in which a candidate position whose integrated evaluation value satisfies a predetermined determination criterion is determined as an object position by emphasizing the lower the density of the partial region. [Selection diagram] Fig. 2

Description

本発明は、人等の所定の物体が存在し得る空間が撮影された撮影画像から個々の物体を検出する物体検出装置に関し、特に、混雑が生じ得る空間が撮影された撮影画像から個々の物体を検出する物体検出装置に関する。   The present invention relates to an object detection device that detects individual objects from a captured image in which a space in which a predetermined object such as a person can exist is captured, and in particular, an individual object from a captured image in which a space in which congestion can occur is captured. The present invention relates to an object detection device for detecting the above.

イベント会場等の混雑が発生し得る空間においては事故防止等のために、混雑が発生している区域に警備員を多く配置するなどの対応が求められる。そこで、会場の各所に監視カメラを配置して撮影画像から人の分布を推定し、推定した分布を表示することによって監視員による混雑状況の把握を容易化することができる。   In an event venue or other space where congestion can occur, countermeasures such as placing a large number of guards in the crowded area are required to prevent accidents. Therefore, monitoring cameras can be arranged at various locations in the venue to estimate the distribution of people from the captured images and display the estimated distribution, thereby facilitating the understanding of the congestion situation by the monitoring staff.

その際、個々の人の位置を検出して、検出した各位置に人の形状を模したモデルを表示し、または/および人の位置関係(例えば行列を為している、取り囲んでいる)を解析して解析結果を報知することによって、より一層の監視効率向上が期待できる。   At that time, the position of each person is detected, and a model imitating the person's shape is displayed at each detected position, or / and the positional relationship of the person (for example, forming a matrix or surrounding) Further analysis efficiency can be expected by analyzing and notifying the analysis result.

複数人が撮影された撮影画像から個々の人の位置を検出する方法に、人を模したモデルを複数個組み合わせて撮影画像に当てはめる方法や、単独の人が撮影された画像の特徴量を事前に学習した識別器を用いて撮影画像をスキャンする方法など、予め用意した単独の人の画像特徴を用いて撮影画像から単独の人の画像特徴が現れている位置を検出する方法がある。   The method of detecting the position of each person from a photographed image taken by multiple people, combining multiple models that imitate people, and applying it to the photographed image, as well as feature values of images taken by a single person in advance There is a method of detecting a position where an image feature of a single person appears from a captured image using a previously prepared image feature of a single person, such as a method of scanning a captured image using a discriminator that has been learned.

例えば、特許文献1に記載の移動物体追跡装置においては、監視画像と背景画像との比較によって変化画素が抽出された位置に、追跡中の移動物体の形状を模した移動物体モデルを追跡中の移動物体の数だけ組み合わせて当てはめることによって個々の移動物体の位置を検出している。この移動物体追跡装置においては、人の全身の形状を近似した移動物体モデルを用いることが例示されている。   For example, in the moving object tracking device described in Patent Document 1, a moving object model imitating the shape of the moving object being tracked is extracted at the position where the changed pixel is extracted by comparing the monitoring image and the background image. The positions of individual moving objects are detected by combining and applying the number of moving objects. In this moving object tracking apparatus, the use of a moving object model that approximates the shape of a person's whole body is exemplified.

また、例えば、特許文献2に記載の物体検出装置は、多数の「人」の画像データ、「人以外」の画像データを用いて予め学習させた識別器を用いて入力画像から人を検出する。この物体検出装置が用いる識別器は、人の全身の画像データを用いて学習したものであることが示唆されている。   Further, for example, the object detection device described in Patent Document 2 detects a person from an input image using a classifier previously learned using a large number of “human” image data and “non-human” image data. . It has been suggested that the classifier used by this object detection apparatus is learned using image data of the whole body of a person.

特開2012−159958JP2012-159958 特開2011−186633JP2011-186633

しかしながら、混雑が生じ得る空間が撮影された撮影画像においては、混雑状態に応じて人の隠蔽状態が変化する。そのため、単独の人の画像特徴として、混雑状態によらず常に物体の各部分の画像特徴を一様に評価していると個々の人を精度良く検出し続けることが困難となる問題があった。   However, in a captured image in which a space where congestion can occur is captured, the concealment state of a person changes according to the congestion state. Therefore, as an image feature of a single person, there is a problem that it is difficult to accurately detect an individual person if the image feature of each part of the object is always evaluated uniformly regardless of the congestion state. .

すなわち、混雑が生じておらず、全身が撮影されている人が多い撮影画像については、人を模したモデルを用いる方法においても、人の画像を学習した識別器を用いる方法においても、全身の画像特徴を用いた方が一部(例えば頭部近傍のみ)の画像特徴を用いるよりも高い精度で当該人を検出できる。   That is, for a captured image in which there are many people who are not crowded and the whole body has been photographed, both in the method using a model imitating a person and in the method using a discriminator that learns a human image, The person using the image feature can be detected with higher accuracy than using a part of the image feature (for example, only near the head).

一方、混雑が生じ、隠蔽状態が多発している撮影画像については、人を模したモデルを用いる方法においても、人の画像を学習した識別器を用いる方法においても、全身の画像特徴を用いるよりも隠蔽が生じている可能性が低い部分のみの画像特徴を用いた方が高い精度で当該人を検出できる。   On the other hand, for captured images that are congested and frequently concealed, both in the method using a model imitating a person and in the method using a discriminator that learns a human image, the image features of the whole body are used. However, it is possible to detect the person with higher accuracy by using only the image feature that is less likely to be concealed.

そのため、撮影画像において混雑している領域の左側に撮影されている人はその左側部分、右側に撮影されている人はその右側部分、上方に撮影されている人はその上部、下方に撮影されている人はその下部を他の部分よりも重視して評価した方が高い精度で検出できる。   Therefore, the person photographed on the left side of the crowded area in the photographed image is photographed on the left side, the person photographed on the right is the right part thereof, the person photographed on the upper part is photographed on the top, and below. The person who is deciding that the lower part is more important than the other parts can detect it with higher accuracy.

また、例えば、混雑時の検出精度を高めるために頭部近傍のみの画像特徴を常に用いていると混雑が生じていない時の検出精度が低下し、混雑が生じていない時の検出精度を高めるために全身の画像特徴を常に用いていると混雑時の検出精度が低下する。   In addition, for example, if image features only near the head are always used in order to increase detection accuracy during congestion, detection accuracy when congestion does not occur decreases, and detection accuracy when congestion does not occur increases. For this reason, if the image features of the whole body are always used, the detection accuracy at the time of congestion decreases.

このように、混雑が生じ得る空間が撮影された撮影画像においては検出対象の物体の個々の隠蔽状態が混雑状態に応じて変化するため、常に物体の各部分を一様に評価していると当該撮影画像から個々の物体を精度良く検出することが困難であった。   In this way, in the captured image in which a space where congestion can occur is captured, the individual concealment state of the object to be detected changes according to the congestion state, so that each part of the object is always evaluated uniformly. It has been difficult to accurately detect individual objects from the captured image.

本発明は上記問題に鑑みてなされたものであり、混雑が生じ得る空間が撮影された撮影画像であっても当該撮影画像中の個々の物体を精度良く検出することができる物体検出装置を提供することを目的とする。   The present invention has been made in view of the above problems, and provides an object detection device that can accurately detect individual objects in a captured image even in a captured image of a space in which congestion can occur. The purpose is to do.

かかる目的を達成するために本発明は、所定の物体による混雑が生じ得る空間が撮影された撮影画像から個々の物体を検出する物体検出装置であって、所定の密度ごとに当該密度にて物体が存在する空間を撮影した密度画像それぞれの画像特徴を学習した密度推定器を用いて、撮影画像に撮影された物体の密度の分布を推定する密度推定手段と、撮影画像内に個々の物体が存在し得る候補位置を設定するとともに候補位置を基準として撮影画像内に物体を構成する複数の部分のそれぞれと対応する部分領域を設定して、部分領域ごとに当該部分領域と対応する部分の画像特徴が現れている度合いを表す部分評価値を算出し、候補位置を基準に設定した複数の部分領域の部分評価値を当該部分領域の密度が低いほど重視して統合した統合評価値が所定の判定基準を満たす候補位置を物体の位置と判定する物体位置判定手段と、を備えたことを特徴とする物体検出装置を提供する。   In order to achieve such an object, the present invention is an object detection device for detecting individual objects from a captured image in which a space in which congestion due to a predetermined object may occur is captured, and the object is detected at each predetermined density. Density estimation means for estimating the density distribution of an object photographed in the photographed image using a density estimator that has learned the image characteristics of each density image photographed in the space where the object exists, and each object in the photographed image An image of a portion corresponding to each partial region is set for each partial region by setting a candidate region that can exist and setting a partial region corresponding to each of a plurality of portions constituting the object in the captured image with reference to the candidate position Integrated evaluation value that calculates the partial evaluation value that represents the degree of the appearance of features and integrates the partial evaluation values of multiple partial areas that are set based on the candidate position, focusing on the lower the density of the partial areas. To provide an object detecting apparatus comprising the, and object position determining means for determining the position of the object candidate positions satisfying a predetermined criterion.

また、物体位置判定手段は、部分領域ごとに当該部分領域における密度が低いほど高く当該部分領域における密度が高いほど低い重み係数を設定し、候補位置を基準に設定した複数の部分領域の部分評価値を当該部分領域の重み係数にて重み付けて総和して統合評価値を算出することが好適である。   In addition, the object position determination unit sets a weighting factor that is higher as the density in the partial area is lower for each partial area and is lower as the density in the partial area is higher, and performs partial evaluation of a plurality of partial areas that are set based on the candidate position. It is preferable to calculate the integrated evaluation value by weighting and summing the values with the weighting coefficients of the partial areas.

また、物体位置判定手段は、候補位置における密度が高いほど物体を構成する部分のうちの少ない部分に対応する部分領域を設定することが好適である。   In addition, it is preferable that the object position determination unit sets a partial region corresponding to a smaller portion of the portions constituting the object as the density at the candidate position is higher.

また、物体位置判定手段は、それぞれが1以上の候補位置を含む互いに異なる複数通りの配置を生成する配置生成手段と、複数通りの配置それぞれについて、各候補位置を基準とする複数の部分のそれぞれと対応する部分領域に、当該部分を模した部分モデルを描画してモデル画像を生成するモデル画像生成手段と、複数通りの配置のモデル画像それぞれについて、部分領域ごとに部分モデルの撮影画像に対する類似の度合いを表す部分評価値を算出し、複数の部分領域の部分評価値を統合して統合評価値を算出する評価値算出手段と、統合評価値が最大の配置における候補位置を物体の位置と決定する最適配置決定手段と、を含むことが好適である。   In addition, the object position determination means includes a position generation means for generating a plurality of different arrangements each including one or more candidate positions, and a plurality of portions based on each candidate position for each of the plurality of arrangements. The model image generation means for generating a model image by drawing a partial model imitating the part in the corresponding partial area, and the similarity of the captured image of the partial model for each partial area for each of the model images in a plurality of arrangements An evaluation value calculating means for calculating a partial evaluation value representing the degree of the evaluation, integrating partial evaluation values of a plurality of partial areas to calculate an integrated evaluation value, and a candidate position in an arrangement with the maximum integrated evaluation value as an object position And an optimum arrangement determining means for determining.

また、物体位置判定手段は、撮影画像内に複数の候補位置を設定する候補位置設定手段と、各候補位置を基準に設定した複数の部分のそれぞれと対応する部分領域の画像特徴を当該部分の画像特徴を学習した識別器に入力して当該部分領域の部分評価値を算出し、候補位置ごとに当該候補位置を基準に設定した複数の部分領域の部分評価値を統合して統合評価値を算出する評価値算出手段と、判定基準を満たす統合評価値が算出された候補位置を物体の位置と決定する位置決定手段と、を含むことが好適である。   In addition, the object position determination means includes candidate position setting means for setting a plurality of candidate positions in the photographed image, and image features of partial areas corresponding to each of the plurality of parts set on the basis of each candidate position. The partial evaluation value of the partial area is calculated by inputting the image feature into the learned classifier, and the partial evaluation values of the partial areas set based on the candidate position are integrated for each candidate position to obtain the integrated evaluation value. It is preferable to include evaluation value calculation means for calculating, and position determination means for determining a candidate position where an integrated evaluation value that satisfies the determination criterion is calculated as the position of the object.

本発明によれば、混雑が生じ得る空間が撮影された撮影画像から個々の物体を精度良く検出できる。   According to the present invention, it is possible to accurately detect individual objects from a captured image in which a space where congestion can occur is captured.

第一および第二の実施形態に係る画像監視装置の概略の構成を示すブロック図である。It is a block diagram which shows the schematic structure of the image monitoring apparatus which concerns on 1st and 2nd embodiment. 第一および第二の実施形態に係る画像監視装置の機能を示す機能ブロック図である。It is a functional block diagram which shows the function of the image monitoring apparatus which concerns on 1st and 2nd embodiment. 第一の実施形態に係る画像監視装置の機能を示す機能ブロック図である。It is a functional block diagram which shows the function of the image monitoring apparatus which concerns on 1st embodiment. 第一の実施形態に係る物体モデル記憶手段が記憶している物体モデルの情報の一例を模式的に表した図である。It is the figure which represented typically an example of the information of the object model which the object model memory | storage means which concerns on 1st embodiment has memorize | stored. 第一の実施形態に係る物体モデル記憶手段が記憶している物体モデルの情報の一例を模式的に表した図である。It is the figure which represented typically an example of the information of the object model which the object model memory | storage means which concerns on 1st embodiment has memorize | stored. 第一の実施形態に係る重み記憶手段が記憶している重み(重み係数の比率)の一例を模式的に表した図である。It is the figure which represented typically an example of the weight (ratio of weighting coefficient) which the weight memory | storage means which concerns on 1st embodiment has memorize | stored. 第一の実施形態に係る密度推定手段、配置生成手段およびモデル画像生成手段による処理例を模式的に示した図である。It is the figure which showed typically the example of a process by the density estimation means, arrangement | positioning production | generation means, and model image generation means which concern on 1st embodiment. 第一の実施形態に係るモデル画像743の各部分領域に対応してモデル画像生成手段が算出した重み係数を模式的に示した画像である。It is the image which showed typically the weighting coefficient which the model image production | generation means calculated corresponding to each partial area | region of the model image 743 which concerns on 1st embodiment. 第一および第二の実施形態に係る画像監視装置の動作を示したフローチャートである。It is the flowchart which showed operation | movement of the image monitoring apparatus which concerns on 1st and 2nd embodiment. 第一の実施形態に係る画像監視装置による物体位置判定処理のフローチャートである。It is a flowchart of the object position determination process by the image monitoring apparatus which concerns on 1st embodiment. 第一の実施形態に係る画像監視装置による物体位置判定処理のフローチャートである。It is a flowchart of the object position determination process by the image monitoring apparatus which concerns on 1st embodiment. 第二の実施形態に係る画像監視装置の機能を示す機能ブロック図である。It is a functional block diagram which shows the function of the image monitoring apparatus which concerns on 2nd embodiment. 第二の実施形態に係る部分識別器記憶手段が記憶している部分識別器の情報および重み記憶手段が記憶している重みの情報を模式的に表した図である。It is the figure which represented typically the information of the partial identifier which the partial identifier memory | storage means based on 2nd Embodiment has memorize | stored, and the information of the weight which the weight memory | storage means has memorize | stored. 候補位置について第二の実施形態に係る評価値算出手段が統合スコアを算出する様子を模式的に示した図である。It is the figure which showed typically a mode that the evaluation value calculation means which concerns on 2nd embodiment calculates an integrated score about a candidate position. 第二の実施形態に係る画像監視装置による物体位置判定処理のフローチャートである。It is a flowchart of the object position determination process by the image monitoring apparatus which concerns on 2nd embodiment.

[第一の実施形態]
以下、本発明の実施形態として、イベント会場が撮影された撮影画像から個々の人を検出する物体検出装置の例を含み、検出結果を監視員に対して表示する画像監視装置1の例を説明する。この実施形態に係る画像監視装置1は、特に、物体検出装置が人を模した物体モデルを用いて個々の人を検出し、その際に物体検出装置が物体モデルを構成する複数の部分モデルを用いて個々の人を検出する例を含む。
[First embodiment]
Hereinafter, as an embodiment of the present invention, an example of an image monitoring device 1 that includes an example of an object detection device that detects an individual person from a captured image obtained by shooting an event venue, and that displays a detection result to a monitor will be described. To do. In the image monitoring apparatus 1 according to this embodiment, in particular, the object detection device detects an individual person using an object model that imitates a person, and the object detection apparatus at that time includes a plurality of partial models that constitute the object model. Includes examples of using to detect individual people.

<第一の実施形態に係る画像監視装置1の構成>
図1は画像監視装置1の概略の構成を示すブロック図である。画像監視装置1は、撮影部2、通信部3、記憶部4、画像処理部5、および表示部6からなる。
<Configuration of Image Monitoring Device 1 according to First Embodiment>
FIG. 1 is a block diagram showing a schematic configuration of the image monitoring apparatus 1. The image monitoring apparatus 1 includes a photographing unit 2, a communication unit 3, a storage unit 4, an image processing unit 5, and a display unit 6.

撮影部2は、監視カメラであり、通信部3を介して画像処理部5と接続され、監視空間を所定の時間間隔で撮影して撮影画像を生成し、撮影画像を順次画像処理部5に入力する撮影手段である。例えば、撮影部2は、イベント会場に設置されたポールに当該監視空間を俯瞰する視野を有して設置される。その視野は固定されていてもよいし、予めのスケジュール或いは通信部3を介した外部からの指示に従って変更されてもよい。また、例えば、撮影部2は監視空間をフレーム周期1秒で撮影してカラー画像を生成する。カラー画像の代わりにモノクロ画像を生成してもよい。   The photographing unit 2 is a surveillance camera and is connected to the image processing unit 5 via the communication unit 3. The photographing unit 2 shoots the monitoring space at a predetermined time interval to generate a photographed image, and sequentially captures the photographed image to the image processing unit 5. It is a photographing means to input. For example, the imaging unit 2 is installed on a pole installed at an event site with a view of the monitoring space. The visual field may be fixed, or may be changed according to a schedule in advance or an instruction from the outside via the communication unit 3. Further, for example, the imaging unit 2 captures the monitoring space with a frame period of 1 second and generates a color image. A monochrome image may be generated instead of the color image.

通信部3は、通信回路であり、その一端が画像処理部5に接続され、他端が同軸ケーブルまたはLAN(Local Area Network)、インターネットなどの通信網を介して撮影部2および表示部6と接続される。通信部3は、撮影部2から撮影画像を取得して画像処理部5に入力し、画像処理部5から入力された検出結果を表示部6に出力する。   The communication unit 3 is a communication circuit, one end of which is connected to the image processing unit 5 and the other end is connected to the photographing unit 2 and the display unit 6 via a communication network such as a coaxial cable, a LAN (Local Area Network), or the Internet. Connected. The communication unit 3 acquires a captured image from the imaging unit 2 and inputs the acquired image to the image processing unit 5, and outputs the detection result input from the image processing unit 5 to the display unit 6.

記憶部4は、ROM(Read Only Memory)、RAM(Random Access Memory)等のメモリ装置であり、各種プログラムや各種データを記憶する。記憶部4は、画像処理部5と接続されて画像処理部5との間でこれらの情報を入出力する。   The storage unit 4 is a memory device such as a ROM (Read Only Memory) or a RAM (Random Access Memory), and stores various programs and various data. The storage unit 4 is connected to the image processing unit 5 and inputs / outputs such information to / from the image processing unit 5.

画像処理部5は、CPU(Central Processing Unit)、DSP(Digital Signal Processor)、MCU(Micro Control Unit)等の演算装置で構成される。画像処理部5は、記憶部4と接続され、記憶部4からプログラムを読み出して実行することにより各種処理手段・制御手段として動作し、各種データを記憶部4に記憶させ、読み出す。また、画像処理部5は、通信部3を介して撮影部2および表示部6とも接続され、通信部3経由で撮影部2から取得した撮影画像を解析することにより個々の人を検出し、検出結果を通信部3経由で表示部6に表示させる。   The image processing unit 5 is configured by an arithmetic device such as a CPU (Central Processing Unit), a DSP (Digital Signal Processor), or an MCU (Micro Control Unit). The image processing unit 5 is connected to the storage unit 4, operates as various processing units / control units by reading out and executing a program from the storage unit 4, and stores and reads various data in the storage unit 4. The image processing unit 5 is also connected to the imaging unit 2 and the display unit 6 via the communication unit 3 and detects individual persons by analyzing the captured image acquired from the imaging unit 2 via the communication unit 3. The detection result is displayed on the display unit 6 via the communication unit 3.

表示部6は、液晶ディスプレイ又はCRT(Cathode Ray Tube)ディスプレイ等のディスプレイ装置であり、通信部3を介して画像処理部5と接続され、画像処理部5による検出結果を表示する表示手段である。監視員は表示された検出結果を視認して混雑の発生等を判断し、必要に応じて人員配置の変更等の対処を行う。   The display unit 6 is a display device such as a liquid crystal display or a CRT (Cathode Ray Tube) display, and is a display unit that is connected to the image processing unit 5 via the communication unit 3 and displays a detection result by the image processing unit 5. . The monitor visually checks the displayed detection result to determine the occurrence of congestion, and takes measures such as changing the personnel arrangement as necessary.

なお、本実施形態においては、撮影部2と画像処理部5の個数が1対1である画像監視装置1を例示するが、別の実施形態においては、撮影部2と画像処理部5の個数を多対1或いは多対多とすることもできる。   In the present embodiment, the image monitoring apparatus 1 in which the number of the photographing units 2 and the image processing units 5 is 1: 1 is illustrated, but in another embodiment, the number of the photographing units 2 and the image processing units 5 is illustrated. Can be many-to-one or many-to-many.

<第一の実施形態に係る画像監視装置1の機能>
図2および図3は画像監視装置1の機能を示す機能ブロック図である。通信部3は画像取得手段30および物体位置出力手段31等として機能し、記憶部4は密度推定器記憶手段40および単体特徴記憶手段41等として機能する。画像処理部5は、密度推定手段50および物体位置判定手段51等として機能する。また、単体特徴記憶手段41は物体モデル記憶手段410aおよび重み記憶手段412aとしての機能を含み、物体位置判定手段51は配置生成手段510a、モデル画像生成手段512a、評価値算出手段514aおよび最適配置決定手段516aとしての機能を含む。
<Function of the image monitoring apparatus 1 according to the first embodiment>
2 and 3 are functional block diagrams showing functions of the image monitoring apparatus 1. The communication unit 3 functions as the image acquisition unit 30, the object position output unit 31, and the like, and the storage unit 4 functions as the density estimator storage unit 40, the single feature storage unit 41, and the like. The image processing unit 5 functions as a density estimation unit 50, an object position determination unit 51, and the like. The single feature storage unit 41 includes functions as an object model storage unit 410a and a weight storage unit 412a. The object position determination unit 51 includes an arrangement generation unit 510a, a model image generation unit 512a, an evaluation value calculation unit 514a, and an optimum arrangement determination. The function as the means 516a is included.

画像取得手段30は、撮影手段である撮影部2から撮影画像を順次取得して、取得した撮影画像を密度推定手段50および物体位置判定手段51に順次出力する。   The image acquisition unit 30 sequentially acquires captured images from the imaging unit 2 that is an imaging unit, and sequentially outputs the acquired captured images to the density estimation unit 50 and the object position determination unit 51.

密度推定器記憶手段40は、所定の密度ごとに当該密度にて物体(人)が存在する空間を撮影した密度画像それぞれの画像特徴を学習した推定密度算出関数であって、画像の特徴量を入力されると当該画像に撮影されている物体の密度の推定値(推定密度)を算出し、算出した推定密度を出力する推定器(密度推定器)の情報を予め記憶している。つまり上記推定密度算出関数の係数等のパラメータを密度推定器の情報として予め記憶している。   The density estimator storage unit 40 is an estimated density calculation function that learns the image features of each density image obtained by photographing a space where an object (person) exists at a predetermined density for each predetermined density. When input, an estimated value (estimated density) of the density of an object photographed in the image is calculated, and information on an estimator (density estimator) that outputs the calculated estimated density is stored in advance. That is, parameters such as the coefficient of the estimated density calculation function are stored in advance as information on the density estimator.

密度推定手段50は、画像取得手段30から入力された撮影画像の各所から密度推定用の特徴量(推定用特徴量)を抽出するとともに密度推定器記憶手段40から密度推定器を読み出して、抽出した推定用特徴量のそれぞれを密度推定器に入力することによって推定密度の分布(密度分布)を推定し、推定した密度分布を物体位置判定手段51に出力する。   The density estimation unit 50 extracts a density estimation feature amount (estimation feature amount) from each part of the captured image input from the image acquisition unit 30 and reads the density estimator from the density estimator storage unit 40 to extract it. Each estimated feature amount is input to a density estimator to estimate an estimated density distribution (density distribution), and the estimated density distribution is output to the object position determination unit 51.

密度推定の処理と密度推定器について具体的に説明する。   The density estimation process and the density estimator will be specifically described.

密度推定手段50は、撮影画像の各画素の位置に窓(推定用抽出窓)を設定し、各推定用抽出窓における撮影画像から推定用特徴量を抽出する。推定用特徴量はGLCM(Gray Level Co-occurrence Matrix)特徴である。   The density estimation means 50 sets a window (estimation extraction window) at the position of each pixel of the captured image, and extracts an estimation feature amount from the captured image in each estimation extraction window. The estimation feature amount is a GLCM (Gray Level Co-occurrence Matrix) feature.

各推定用抽出窓に撮影されている監視空間内の領域は同一サイズであることが望ましい。すなわち、好適には密度推定手段50は不図示のカメラパラメータ記憶手段から予め記憶されている撮影部2のカメラパラメータを読み出し、カメラパラメータを用いたホモグラフィ変換により撮影画像の任意の画素に撮影されている監視空間内の領域が同一サイズとなるように撮影画像を変形してから推定用特徴量を抽出する。   It is desirable that the area in the monitoring space photographed by each estimation extraction window is the same size. That is, preferably, the density estimation means 50 reads out the camera parameters of the photographing unit 2 stored in advance from a camera parameter storage means (not shown), and is photographed at an arbitrary pixel of the photographed image by homography conversion using the camera parameters. The estimation feature amount is extracted after the captured image is deformed so that the areas in the monitoring space have the same size.

密度推定器は多クラスの画像を識別する識別器で実現することができ、多クラスSVM(Support Vector Machine)法で学習した識別関数とすることができる。   The density estimator can be realized by a classifier that identifies multi-class images, and can be a discrimination function learned by a multi-class SVM (Support Vector Machine) method.

密度は、例えば、人が存在しない「背景」クラス、0人/mより高く2人/m以下である「低密度」クラス、2人/mより高く4人/m以下である「中密度」クラス、4人/mより高い「高密度」クラスの4クラスと定義することができる。 Density, for example, there is no human "Background" class is 0 people / m higher than 2 is two / m 2 or less "low density" class, higher than two / m 2 4 persons / m 2 or less It can be defined as 4 classes of “medium density” class, “high density” class higher than 4 persons / m 2 .

推定密度は各クラスに予め付与された値であり、分布推定の結果として出力される値である。本実施形態では各クラスに対応する値を「背景」「低密度」「中密度」「高密度」と表記する。   The estimated density is a value given in advance to each class, and is a value output as a result of distribution estimation. In the present embodiment, values corresponding to each class are expressed as “background”, “low density”, “medium density”, and “high density”.

すなわち、密度推定器は「背景」クラス、「低密度」クラス、「中密度」クラス、「高密度」クラスのそれぞれに帰属する多数の画像(密度画像)の特徴量に多クラスSVM法を適用して学習した、各クラスの画像を他のクラスと識別するための識別関数である。この学習により導出された識別関数のパラメータが密度推定器として記憶されている。なお、密度画像の特徴量は、推定用特徴量と同種であり、GLCM特徴である。   That is, the density estimator applies the multi-class SVM method to the feature quantities of a large number of images (density images) belonging to the “background” class, “low density” class, “medium density” class, and “high density” class. This is an identification function for discriminating the images of each class from other classes. The parameters of the discriminant function derived by this learning are stored as a density estimator. The feature amount of the density image is the same type as the estimation feature amount and is a GLCM feature.

密度推定手段50は、各画素に対応して抽出した推定用特徴量のそれぞれを密度推定器に入力することによってその出力値である推定密度を取得する。なお、撮影画像を変形させて推定用特徴量を抽出した場合、密度推定手段50は、カメラパラメータを用いたホモグラフィ変換により密度分布を元の撮影画像の形状に変形させる。   The density estimation means 50 acquires the estimated density which is the output value by inputting each of the estimation feature quantities extracted corresponding to each pixel to the density estimator. In addition, when the estimated feature amount is extracted by deforming the captured image, the density estimating unit 50 deforms the density distribution into the original captured image shape by homography conversion using the camera parameter.

こうして得られた、撮影画像の画素ごとの推定密度の集まりが密度分布である。   A collection of estimated densities for each pixel of the captured image thus obtained is a density distribution.

密度推定手段50が出力する密度分布から撮影画像の各所における人の粗密状況が分かるが、密度分布から個々の人の位置までは分からない。
これに対し、密度推定手段50の後段の物体位置判定手段51は、撮影画像に現れている個々の人の位置を判定する手段である。
From the density distribution output by the density estimation means 50, the density of people at various locations in the photographed image can be understood, but the position of each person cannot be determined from the density distribution.
On the other hand, the object position determination means 51 subsequent to the density estimation means 50 is a means for determining the position of each person appearing in the captured image.

物体位置判定手段51は、単独の人(物体)としての画像特徴が現れている箇所を撮影画像上で探索することにより個々の物体を検出して個々の物体の位置を判定する。すなわち、物体位置判定手段51は、撮影画像内に個々の物体が存在し得る候補位置を設定して当該候補位置の撮影画像に単独の物体の画像特徴(単体特徴)が現れている度合いを表す評価値(統合評価値)を算出し、統合評価値が所定値以上である候補位置を物体の位置と判定する。例えば、単体特徴は人の形状であり、単体特徴記憶手段41が予め単体特徴を記憶している。また例えば、統合評価値は撮影画像のエッジと人の形状を表すモデルとの類似度である。統合評価値は物体を構成する複数の部分それぞれに対する評価値(部分評価値)を統合した評価値である。   The object position determination means 51 detects an individual object by searching a place where an image feature as a single person (object) appears on the captured image, and determines the position of the individual object. That is, the object position determination unit 51 sets a candidate position where an individual object can exist in the photographed image, and represents the degree to which the image feature (single feature) of a single object appears in the photographed image at the candidate position. An evaluation value (integrated evaluation value) is calculated, and a candidate position whose integrated evaluation value is greater than or equal to a predetermined value is determined as the position of the object. For example, the single feature is a human shape, and the single feature storage unit 41 stores the single feature in advance. Further, for example, the integrated evaluation value is a similarity between a captured image edge and a model representing a human shape. The integrated evaluation value is an evaluation value obtained by integrating evaluation values (partial evaluation values) for a plurality of parts constituting the object.

ここで、混雑が生じ得る空間が撮影された撮影画像においては、密度が高い領域ほど隠蔽が生じやすくなるため評価値の信頼性は低いと考えられる。その逆に、密度が低い領域ほど隠蔽は生じにくく評価値の信頼性は高いと考えられる。また、混雑が生じ得る空間が撮影された撮影画像においては、密度の境目に存在している物体のようにその信頼性の高い部分と低い部分が混在する物体も多々含まれ得る。   Here, in a captured image in which a space in which congestion can occur is captured, the higher the density, the easier the concealment occurs, and thus the reliability of the evaluation value is considered to be low. On the contrary, it is considered that the lower the density is, the less concealment occurs and the reliability of the evaluation value is high. In addition, in a captured image in which a space where congestion can occur is captured, there can be many objects in which a highly reliable portion and a low portion are mixed, such as an object existing at the boundary of density.

そこで、物体位置判定手段51は、物体全体を一様に評価するのではなく、密度分布を参照して物体の部分ごとに密度に応じた重み付けを行うことによって物体の検出精度を向上させる。
すなわち、物体位置判定手段51は、撮影画像内に個々の物体が存在し得る候補位置を設定するとともに候補位置を基準として撮影画像内に物体を構成する複数の部分のそれぞれと対応する部分領域を設定して、部分領域ごとに当該部分領域と対応する部分の画像特徴が現れている度合いを表す部分評価値を算出し、候補位置を基準に設定した各部分領域の部分評価値を当該部分領域の密度が低いほど重視して統合した統合評価値が所定の判定基準を満たす候補位置を物体の位置と判定する。より具体的には、物体位置判定手段51は、前記部分領域ごとに当該部分領域における密度が低いほど高く当該部分領域における密度が高いほど低い重み係数を設定し、候補位置を基準に設定した複数の部分領域の部分評価値を当該部分領域の重み係数にて重み付けて総和して統合評価値を算出する。
Therefore, the object position determination unit 51 improves the detection accuracy of the object by weighting according to the density for each part of the object with reference to the density distribution, instead of evaluating the entire object uniformly.
That is, the object position determination unit 51 sets candidate positions where individual objects can exist in the photographed image, and sets partial areas corresponding to each of a plurality of parts constituting the object in the photographed image with the candidate position as a reference. Set and calculate a partial evaluation value indicating the degree of appearance of the image feature of the part corresponding to the partial region for each partial region, and set the partial evaluation value of each partial region set based on the candidate position as the partial region The candidate position where the integrated evaluation value that is integrated with emphasis as the density of the image satisfies a predetermined determination criterion is determined as the position of the object. More specifically, the object position determination unit 51 sets a weighting factor that is higher as the density in the partial area is lower for each partial area and lower as the density in the partial area is higher. The integrated evaluation value is calculated by weighting and summing the partial evaluation values of the partial areas with the weighting coefficients of the partial areas.

また、密度が高い領域ほど重度の隠蔽が生じる可能性は高くなり、隠れている部分についても評価を行うと誤評価が生じる機会を増加させ、物体の検出精度を低下させることにつながる。例えば、撮影部2が俯瞰設置されている場合は、足元に近いほど隠蔽は発生しやすく、頭に近いほど隠蔽は発生しにくい。このことを考慮し、混雑に適応させるべく単体特徴を人の頭部だけにすると混雑時の検出し損ねは減少する。しかし、頭部だけの単体特徴は肩などに対しても比較的高い統合評価値が算出されてしまうため、混雑していないときの誤検出が増加する。   In addition, the higher the density, the higher the possibility that severe concealment will occur. If the hidden part is also evaluated, the chance of erroneous evaluation increases, leading to a decrease in object detection accuracy. For example, when the photographing unit 2 is installed in a bird's-eye view, concealment is more likely to occur as it is closer to the foot, and concealment is less likely to occur as it is closer to the head. Considering this, if the single feature is only the head of a person so as to adapt to the congestion, the detection loss at the time of congestion is reduced. However, since the single feature of the head only has a relatively high integrated evaluation value for the shoulder or the like, the number of false detections when there is no congestion increases.

物体位置判定手段51は、密度分布を参照することによって、このような評価する部分の多寡と個々の物体の検出精度との間に存在するトレードオフを解消する。すなわち、物体位置判定手段51は、候補位置における密度が高いほど物体を構成する部分のうちの少ない部分に対応する部分領域を設定する。つまり、物体位置判定手段51は、候補位置における密度が高いほど、物体を構成する部分のうちの少ない部分の画像特徴を評価して統合評価値を算出する。例えば、物体位置判定手段51は、候補位置の推定密度が低密度であれば全身の画像特徴を評価して統合評価値を算出し、中密度であれば上半身の画像特徴を評価して統合評価値を算出し、高密度であれば頭部近傍の画像特徴を評価して統合評価値を算出する。   The object position determination unit 51 refers to the density distribution to eliminate the trade-off between the number of parts to be evaluated and the detection accuracy of each object. That is, the object position determination unit 51 sets a partial area corresponding to a smaller part of the parts constituting the object as the density at the candidate position is higher. That is, the object position determination unit 51 calculates the integrated evaluation value by evaluating the image features of a smaller part of the parts constituting the object as the density at the candidate position is higher. For example, if the estimated density of the candidate positions is low density, the object position determination unit 51 evaluates the image characteristics of the whole body and calculates an integrated evaluation value, and if it is medium density, evaluates the image characteristics of the upper body and performs integrated evaluation. A value is calculated, and if it is high density, an image feature near the head is evaluated to calculate an integrated evaluation value.

以下、個々の物体の検出と単体特徴について説明する。   Hereinafter, detection of individual objects and single unit characteristics will be described.

単体特徴記憶手段41は、単独の人(物体)の形状を模した物体モデルの情報を予め記憶した物体モデル記憶手段410a、および評価値の算出において用いる重みの情報を予め記憶した重み記憶手段412aとして機能し、物体モデルの情報および重みの情報を単体特徴として記憶している。   The single feature storage unit 41 includes an object model storage unit 410a that stores in advance information on an object model that imitates the shape of a single person (object), and a weight storage unit 412a that stores information on weights used in calculation of evaluation values in advance. And stores object model information and weight information as single features.

図4〜図6は単体特徴記憶手段41が記憶している単体特徴を模式的に表した図である。そのうちの図4はおよび図5は物体モデル記憶手段410aが記憶している物体モデルの情報の一例であり、図6は重み記憶手段412aが記憶している重み(重み係数の比率)の一例である。   4 to 6 are diagrams schematically showing the single features stored in the single feature storage means 41. FIG. 4 and 5 are examples of object model information stored in the object model storage unit 410a, and FIG. 6 is an example of weights (weight coefficient ratios) stored in the weight storage unit 412a. is there.

物体モデル記憶手段410aが記憶している物体モデルは、具体的には立位の人の頭部、胴部、脚部に対応する3つの回転楕円体から構成される立体モデル700である。なお頭部重心を人の代表位置とする。さらに物体モデル記憶手段410aは、立体モデル700と併せて、密度ごとの評価範囲702を記憶し、また立体モデル700を撮影画像の座標系に投影するために撮影部2のカメラパラメータ701を記憶している。カメラパラメータ701は、実際の監視空間における撮影部2の設置位置及び撮像方向といった外部パラメータ、撮影部2の焦点距離、画角、レンズ歪みその他のレンズ特性や、撮像素子の画素数といった内部パラメータを含む情報である。   The object model stored in the object model storage unit 410a is specifically a three-dimensional model 700 including three spheroids corresponding to the head, torso, and legs of a standing person. Note that the center of gravity of the head is the representative position of the person. Further, the object model storage unit 410a stores an evaluation range 702 for each density together with the stereo model 700, and stores the camera parameters 701 of the imaging unit 2 in order to project the stereo model 700 onto the coordinate system of the captured image. ing. The camera parameters 701 include external parameters such as the installation position and imaging direction of the imaging unit 2 in the actual monitoring space, internal parameters such as the focal length, angle of view, lens distortion and other lens characteristics of the imaging unit 2 and the number of pixels of the imaging device. It is information to include.

評価範囲702は、複数の部分に分けて密度ごとに設定され、密度が高いほど単独の物体を構成する部分のうちの少ない部分となっている。
具体的には物体モデル記憶手段410aは、低密度クラスを表す値と対応付けて人の6つの部分「上1/3、左1/2」、「上1/3、右1/2」、「中1/3、左1/2」、「中1/3、右1/2」、「下1/3、左1/2」および「下1/3、右1/2」を表す評価範囲を記憶している。これら6つの部分を合わせると人の「全体」となる。
また物体モデル記憶手段410aは、中密度クラスを表す値と対応付けて人の4つの部分「上1/3、左1/2」、「上1/3、右1/2」、「中1/3、左1/2」および「中1/3、右1/2」を表す評価範囲を記憶している。これら4つの部分を合わせると人の「上部2/3」となる。
また物体モデル記憶手段410aは、高密度クラスを表す値と対応付けて人の4つの部分「上1/3、左1/2」および「上1/3、右1/2」を表す評価範囲を記憶している。これら2つの部分を合わせると人の「上部1/3」となる。
The evaluation range 702 is set for each density divided into a plurality of parts, and the higher the density, the smaller the part that constitutes a single object.
Specifically, the object model storage means 410a associates the values representing the low density class with the six parts “upper 1/3, left 1/2”, “up 1/3, right 1/2”, Evaluation representing "middle 1/3, left 1/2", "middle 1/3, right 1/2", "lower 1/3, left 1/2" and "lower 1/3, right 1/2" Remember the range. When these six parts are combined, it becomes the “whole” of the person.
In addition, the object model storage unit 410a associates the value representing the medium density class with the four parts "upper 1/3, left 1/2", "up 1/3, right 1/2", "middle 1". / 3, left 1/2 "and evaluation ranges representing" middle 1/3, right 1/2 "are stored. When these four parts are combined, it becomes the “upper 2/3” of a person.
The object model storage unit 410a also associates the values representing the high-density class with the evaluation ranges representing the four parts “upper 1/3, left 1/2” and “upper 1/3, right 1/2”. Is remembered. When these two parts are combined, it becomes the “upper third” of the person.

以下、評価範囲「上1/3、左1/2」と立体モデル700とカメラパラメータ701との組み合わせによって表される物体モデル710を左上部モデル、評価範囲「上1/3、右1/2」と立体モデル700とカメラパラメータ701との組み合わせによって表される部分モデル711を右上部モデル、評価範囲「中1/3、左1/2」と立体モデル700とカメラパラメータ701との組み合わせによって表される部分モデル712を左中部モデル、評価範囲「中1/3、右1/2」と立体モデル700とカメラパラメータ701との組み合わせによって表される部分モデル713を右中部モデル、評価範囲「下1/3、左1/2」と立体モデル700とカメラパラメータ701との組み合わせによって表される部分モデル714を左下部モデル、評価範囲「下1/3、右1/2」と立体モデル700とカメラパラメータ701との組み合わせによって表される部分モデル715を右下部モデルと称する。また評価範囲「全体」と立体モデル700とカメラパラメータ701との組み合わせによって表される物体モデル720を全身モデル、評価範囲「上部2/3」と立体モデル700とカメラパラメータ701との組み合わせによって表される物体モデル721を上半身モデル、評価範囲「上部1/3」と立体モデル700とカメラパラメータ701との組み合わせによって表される物体モデル722を頭部近傍モデルと称する。   Hereinafter, the object model 710 represented by a combination of the evaluation range “upper 3, left ½”, the solid model 700 and the camera parameter 701 is the upper left model, and the evaluation range “upper 3, right ½”. The partial model 711 represented by the combination of the stereo model 700 and the camera parameter 701 is represented by the upper right model, the evaluation range “middle 1/3, left 1/2”, and the combination of the stereo model 700 and the camera parameter 701. The partial model 712 represented by the combination of the left middle model, the evaluation range “middle 1/3, right 1/2”, the solid model 700 and the camera parameter 701 is the right middle model, and the evaluation range “lower”. The partial model 714 represented by the combination of the 1/3, the left 1/2 ", the solid model 700, and the camera parameter 701 is displayed on the lower left. Model, evaluation range "lower third, right 1/2" and referred to as the lower right model partial model 715 represented by a combination of a three-dimensional model 700 and the camera parameter 701. An object model 720 represented by a combination of the evaluation range “whole”, the stereoscopic model 700 and the camera parameter 701 is represented by a whole body model, and an evaluation range “upper 2/3”, a combination of the stereoscopic model 700 and the camera parameter 701. The object model 721 represented by the combination of the upper body model, the evaluation range “upper 1/3”, the three-dimensional model 700, and the camera parameter 701 is referred to as a head vicinity model.

このように、物体モデル記憶手段410aは、低密度クラスと対応付けて左上部モデル710、右上部モデル711、左中部モデル712、右中部モデル713、左下部モデル714および右下部モデル715からなる全身モデル720を、中密度クラスと対応付けて左上部モデル710、右上部モデル711、左中部モデル712および右中部モデル713からなる上半身モデル721を、高密度クラスと対応付けて左上部モデル710および右上部モデル711からなる頭部近傍モデル722を物体モデルの情報として記憶している。
なお、部分モデルとして描画されるのは、物体の形状を表す輪郭線(図5の実線部)である。
As described above, the object model storage unit 410a is associated with the low density class, and includes the upper left model 710, the upper right model 711, the left middle model 712, the right middle model 713, the lower left model 714, and the lower right model 715. The model 720 is associated with the middle density class, and the upper body model 721 including the upper left model 710, the upper right model 711, the left middle model 712, and the right middle model 713 is associated with the higher density class, and the upper left model 710 and the upper right model. A head vicinity model 722 comprising a part model 711 is stored as object model information.
Note that what is drawn as the partial model is a contour line (solid line portion in FIG. 5) representing the shape of the object.

重みは、物体の各部分と対応する部分領域の密度に応じて当該部分を重視する度合いであり、密度間の相対的な比率で表される。密度が低い部分ほど重視され密度が高い部分ほど軽視されるため、密度が低いほど高く密度が高いほど低い重みが設定されている。例えば、低密度、中密度および高密度の重みは比率10:7:5とすることができる。なお部分領域の密度の決定に際しては背景クラスは低密度クラスとみなすことができる。   The weight is a degree of emphasizing the part according to the density of the partial region corresponding to each part of the object, and is represented by a relative ratio between the densities. Since the lower density part is more important and the higher density part is disregarded, the lower the density, the higher the density and the lower the weight. For example, the weights for low density, medium density and high density can be 10: 7: 5. In determining the density of the partial region, the background class can be regarded as a low density class.

このように重み記憶手段412aは、密度が低いほど高く密度が高いほど低い、密度ごとの重みを記憶している。   As described above, the weight storage unit 412a stores the weight for each density, which is higher as the density is lower and lower as the density is higher.

配置生成手段510aは、それぞれが1以上の候補位置を含む互いに異なる複数通りの配置を生成し、生成した各配置をモデル画像生成手段512aに出力する。   The arrangement generation unit 510a generates a plurality of different arrangements each including one or more candidate positions, and outputs the generated arrangements to the model image generation unit 512a.

そのために、配置生成手段510aは、乱数に基づき撮影画像の画素のうち推定密度が低密度、中密度または高密度である画素の中から1個以上上限個数以下の個数(配置数)の画素をランダムに決定し、決定した各画素の位置を候補位置とすることで配置を生成する。配置生成手段510aは、この生成を、配置数を順次増加させながら配置数ごとに予め定めた回数ずつ反復することによって、互いに異なる複数通りの配置を生成する。なお、配置数の上限個数は監視空間に存在し得る物体の数の上限とすることができ、例えば監視空間を模した仮想空間中に立位の人の立体モデルを重ならずに配置可能な数として算出できる。   For this purpose, the arrangement generation unit 510a selects one or more pixels (arrangement number) of pixels that have an estimated density of low density, medium density, or high density from among the pixels of the captured image based on random numbers. Arrangement is generated by randomly determining the position of each determined pixel as a candidate position. The arrangement generation unit 510a generates a plurality of different arrangements by repeating this generation by a predetermined number of times for each arrangement number while sequentially increasing the number of arrangements. Note that the upper limit of the number of arrangements can be the upper limit of the number of objects that can exist in the monitoring space. For example, it is possible to arrange a standing person's three-dimensional model in a virtual space imitating the monitoring space without overlapping. It can be calculated as a number.

モデル画像生成手段512aは、配置生成手段510aから入力された複数通りの配置それぞれについて、各候補位置を基準とする複数の部分のそれぞれと対応する部分領域に、当該部分を模した部分モデルを描画してモデル画像を生成する。またその際に、モデル画像生成手段512aは、各候補位置に、当該候補位置における密度が高いほど、単独の物体を構成する部分のうちの少ない部分を模した物体モデルを描画してモデル画像を生成し、生成した各モデル画像を評価値算出手段514aに出力する。   The model image generation unit 512a draws a partial model imitating the part in a partial region corresponding to each of a plurality of parts with respect to each candidate position for each of the plurality of arrangements input from the arrangement generation unit 510a. To generate a model image. At that time, the model image generation unit 512a draws an object model that imitates a small part of the parts constituting a single object at each candidate position as the density at the candidate position is higher. The generated model images are output to the evaluation value calculation means 514a.

そのために、モデル画像生成手段512aは、物体モデル記憶手段410aからカメラパラメータを読み出し、配置ごとに、カメラパラメータを用いて、各候補位置を立体モデルの頭部重心の高さ(例えば1.5m)の水平面に逆投影することで、当該候補位置に投影される立体モデルの、監視空間を模した仮想空間内における代表位置を算出する。   For this purpose, the model image generation unit 512a reads the camera parameters from the object model storage unit 410a, and uses the camera parameters for each arrangement to set each candidate position to the height of the center of gravity of the head of the stereo model (for example, 1.5 m). The representative position in the virtual space imitating the monitoring space of the three-dimensional model projected at the candidate position is calculated by back-projecting to the horizontal plane.

また、モデル画像生成手段512aは、物体モデル記憶手段410aから頭部近傍モデルを読み出して各候補位置と対応する仮想空間内の代表位置に頭部近傍モデルを配置し、カメラパラメータを用いて頭部近傍モデルを撮影画像の座標系に投影する。そして、モデル画像生成手段512aは、密度推定手段50から入力された密度分布を参照して各候補位置に対応する頭部近傍モデルの投影領域内の推定密度を集計し、各候補位置における最多の推定密度(ただし背景クラスは除く)を当該候補位置の密度と決定する。   Further, the model image generation unit 512a reads out the head vicinity model from the object model storage unit 410a, arranges the head vicinity model at a representative position in the virtual space corresponding to each candidate position, and uses the camera parameters to The neighborhood model is projected onto the coordinate system of the captured image. Then, the model image generation unit 512a refers to the density distribution input from the density estimation unit 50 and totals the estimated density in the projection region of the head vicinity model corresponding to each candidate position, and the largest number at each candidate position. The estimated density (excluding the background class) is determined as the density of the candidate position.

また、モデル画像生成手段512aは、候補位置ごとに当該候補位置の密度に応じた物体モデルを物体モデル記憶手段410aから読み出す。具体的には、モデル画像生成手段512aは、候補位置の密度が低密度であれば6つの部分モデルからなる全身モデルを読み出し、中密度であれば4つの部分モデルからなる上半身モデルを読み出し、高密度であれば2つの部分モデルからなる頭部近傍モデルを読み出す。そして、モデル画像生成手段512aは、各配置について、各候補位置に対応して読み出した物体モデルを当該候補位置と対応する仮想空間内の代表位置に配置し、カメラパラメータを用いて各物体モデルを為す部分モデルそれぞれを撮影画像の座標系に投影し、物体の形状(輪郭線)を描画することによって、配置ごとのモデル画像を生成する。
なお、モデル画像生成手段512aは、撮影部2からの距離が遠い代表位置に配置した物体モデルから順に投影し、投影領域を上書きすることによって、物体モデル間の隠蔽を表現したモデル画像を生成する。
In addition, the model image generation unit 512a reads an object model corresponding to the density of the candidate positions from the object model storage unit 410a for each candidate position. Specifically, the model image generating unit 512a reads a whole body model including six partial models if the density of candidate positions is low, and reads an upper body model including four partial models if the density is high. If it is a density, a head vicinity model composed of two partial models is read out. Then, for each arrangement, the model image generating unit 512a arranges the object model read corresponding to each candidate position at a representative position in the virtual space corresponding to the candidate position, and uses the camera parameters to identify each object model. Each partial model to be performed is projected on the coordinate system of the captured image, and the shape (contour line) of the object is drawn to generate a model image for each arrangement.
Note that the model image generation unit 512a sequentially projects from the object model arranged at the representative position that is far from the photographing unit 2, and generates a model image expressing the concealment between the object models by overwriting the projection area. .

また、モデル画像生成手段512aは、配置ごとに、モデル画像における物体モデルどうしの重なり度合いを表す隠蔽度を次式に従って算出する。
隠蔽度=物体モデル間の重複領域の面積/物体モデルの投影領域の和領域の面積(1)
In addition, the model image generation unit 512a calculates a concealment degree that represents the degree of overlap between the object models in the model image for each arrangement according to the following equation.
Concealment degree = area of overlapping area between object models / area of sum area of projection area of object model (1)

また、モデル画像生成手段512aは、各モデル画像と対応して、当該モデル画像における各部分領域について当該部分領域の推定密度に応じた重み係数を算出する。   In addition, the model image generation unit 512a calculates a weighting coefficient corresponding to the estimated density of the partial area for each partial area in the model image, corresponding to each model image.

そのために、モデル画像生成手段512aは、密度分布を参照して各部分領域内の推定密度を集計し、各部分領域における最多の推定密度を当該部分領域の密度と決定する。ただし背景クラスは低密度クラスとみなして集計する。
次にモデル画像生成手段512aは、重み記憶手段412aから各部分領域の密度に対応する重み(重み係数の比率)を読み出し、配置ごとに全部分領域の重みの和を求める。
続いてモデル画像生成手段512aは、配置ごとに、各部分領域の重みを重みの和で除して、当該部分領域の重み係数を算出する。すなわち各配置における重み係数の和は1となるように正規化される。
For this purpose, the model image generation unit 512a aggregates the estimated densities in each partial region with reference to the density distribution, and determines the highest estimated density in each partial region as the density of the partial region. However, the background class is counted as a low density class.
Next, the model image generation unit 512a reads the weight (weight coefficient ratio) corresponding to the density of each partial region from the weight storage unit 412a, and obtains the sum of the weights of all the partial regions for each arrangement.
Subsequently, for each arrangement, the model image generation unit 512a divides the weight of each partial region by the sum of the weights, and calculates a weight coefficient for the partial region. That is, the sum of the weighting coefficients in each arrangement is normalized so as to be 1.

モデル画像生成手段512aは、こうして求めた配置とモデル画像と隠蔽度と重み係数とを対応付けて評価値算出手段514aに出力する。   The model image generation unit 512a associates the layout, the model image, the concealment degree, and the weighting coefficient thus obtained and outputs them to the evaluation value calculation unit 514a.

図7は、第一の実施形態に係る密度推定手段50、配置生成手段510aおよびモデル画像生成手段512aによる処理例を模式的に示した図である。
画像740は、密度推定手段50が推定した密度分布を画像化したものである。当該密度分布においては、白抜き部は推定密度が背景である領域、横線部は推定密度が低密度である領域、斜線部は推定密度が中密度である領域、格子部は推定密度が高密度である領域をそれぞれ示している。
画像741は、配置生成手段510aが生成した配置に含まれる8個の候補位置を撮影画像の座標系に×印でプロットしたものである。
3次元モデル742は、モデル画像生成手段512aが画像741に示した8個の候補位置と対応する仮想空間内の代表位置に立体モデルを配置した様子を図示したものである。
画像743は、モデル画像生成手段512aが、画像740で示した密度分布に基づいて各候補位置の密度を特定し、当該密度に応じた評価範囲の立体モデルを各候補位置に投影して作成したモデル画像を示している。
FIG. 7 is a diagram schematically illustrating a processing example by the density estimation unit 50, the arrangement generation unit 510a, and the model image generation unit 512a according to the first embodiment.
The image 740 is an image of the density distribution estimated by the density estimation unit 50. In the density distribution, the white area is the area where the estimated density is the background, the horizontal line area is the area where the estimated density is low density, the shaded area is the area where the estimated density is medium density, and the lattice area is the high density estimated area Each region is shown.
The image 741 is obtained by plotting the eight candidate positions included in the arrangement generated by the arrangement generation unit 510a in the coordinate system of the photographed image with x marks.
The three-dimensional model 742 illustrates a state in which the model image generating unit 512a arranges the three-dimensional model at the representative positions in the virtual space corresponding to the eight candidate positions shown in the image 741.
The image 743 is created by the model image generation unit 512a specifying the density of each candidate position based on the density distribution shown in the image 740, and projecting a three-dimensional model in the evaluation range corresponding to the density to each candidate position. A model image is shown.

モデル画像743が表す配置においては、1個の部分領域(集団中の中段右の人の左中部)が完全に隠蔽されており、33個の部分領域が描画されている。33個の部分領域の内訳は、密度が低密度または背景であるものが23個、密度が中密度であるものが6個、密度が高密度であるものが4個である。モデル画像743が表す配置の全部分領域についての重み係数比率の和は、10×23+7×6+5×4=292となる。33個の部分領域のうちの部分領域744の密度は低密度、部分領域745は中密度、部分領域746は高密度である。部分領域744の重み係数は10/292、部分領域745の重み係数は7/292、部分領域746の重み係数は5/292となる。他の部分領域についても同様にして重み係数が算出される。   In the arrangement represented by the model image 743, one partial area (the left middle part of the middle right person in the group) is completely hidden, and 33 partial areas are drawn. The breakdown of the 33 partial areas is 23 with low density or background, 6 with medium density, and 4 with high density. The sum of the weighting factor ratios for all partial regions in the arrangement represented by the model image 743 is 10 × 23 + 7 × 6 + 5 × 4 = 292. Of the 33 partial regions, the partial region 744 has a low density, the partial region 745 has a medium density, and the partial region 746 has a high density. The weighting factor of the partial region 744 is 10/292, the weighting factor of the partial region 745 is 7/292, and the weighting factor of the partial region 746 is 5/292. The weighting coefficient is calculated in the same manner for other partial areas.

図8の画像750は、モデル画像743の各部分領域に対応してモデル画像生成手段512aが算出した重み係数を模式的に示した画像である。   An image 750 in FIG. 8 is an image schematically showing the weighting coefficient calculated by the model image generating unit 512a corresponding to each partial region of the model image 743.

評価値算出手段514aは、複数通りの配置それぞれについて、モデル画像生成手段512aから入力されたモデル画像の撮影画像に対する類似の度合いを表す統合評価値を算出し、配置ごとの統合評価値を最適配置決定手段516aに出力する。   The evaluation value calculation unit 514a calculates an integrated evaluation value representing the degree of similarity of the model image input from the model image generation unit 512a to the captured image for each of the plurality of arrangements, and sets the integrated evaluation value for each arrangement to the optimal arrangement. It outputs to the determination means 516a.

具体的には、評価値算出手段514aは、各モデル画像と撮影画像の重み付け類似度を次式に従って算出する。
重み付け類似度 = 重み付け形状適合度 − WHa×隠蔽度 (2)
ただし、WHaは0より大きな重み係数であり、事前の実験に基づいて予め設定される。重み付け形状適合度から減じる隠蔽度は過剰な物体モデルの重なりを抑制するためのペナルティ値である。このように隠蔽度を含めた類似度に基づいて最適配置を決定することで、本来の物体数以上の物体モデルが当てはまることによる物体位置の誤検出を防止できる。
Specifically, the evaluation value calculation unit 514a calculates the weighted similarity between each model image and the captured image according to the following equation.
Weighted similarity = Weighted shape conformity-W Ha x Concealment (2)
However, W Ha is a weighting coefficient larger than 0, and is preset based on a prior experiment. The degree of concealment subtracted from the weighted shape matching degree is a penalty value for suppressing an overlap of excessive object models. In this way, by determining the optimum arrangement based on the similarity including the concealment degree, it is possible to prevent erroneous detection of the object position due to the application of an object model equal to or more than the original number of objects.

評価値算出手段514aは、重み付け形状適合度を、モデル画像と撮影画像との部分領域ごとの形状適合度を当該部分領域の重み係数で重み付けて総和して算出する。部分領域ごとの形状適合度が部分評価値である。形状適合度はエッジの類似度とすることができる。評価値算出手段514aは、各モデル画像と撮影画像のそれぞれからエッジを抽出し、各モデル画像について、モデル画像から有効なエッジが抽出された画素と当該画素に対応する撮影画像の画素のエッジとの差の絶対値を算出して総和し、総和値を撮影画像から有効なエッジが抽出された画素数とモデル画像から有効なエッジが抽出された画素数の和で除して符号を反転した値を重み付け形状適合度として算出する。   The evaluation value calculation means 514a calculates the weighted shape suitability by summing the shape suitability for each partial area of the model image and the captured image with the weighting coefficient of the partial area. The shape suitability for each partial area is a partial evaluation value. The shape matching degree can be an edge similarity. The evaluation value calculation unit 514a extracts an edge from each model image and the photographed image, and for each model image, a pixel from which a valid edge is extracted from the model image and an edge of the pixel of the photographed image corresponding to the pixel. The absolute value of the difference is calculated and summed, and the sum is divided by the sum of the number of pixels from which valid edges are extracted from the captured image and the number of pixels from which valid edges are extracted from the model image, and the sign is inverted. The value is calculated as a weighted shape suitability.

或いは、評価値算出手段514aは、各モデル画像と撮影画像のそれぞれからエッジ画像を生成し、各モデル画像について、撮影画像から生成したエッジ画像と当該モデル画像から生成したエッジ画像とのチャンファーマッチング(Chamfer Matching)を行って得られる距離の符号を反転した値を、撮影画像から有効なエッジが抽出された画素数とモデル画像から有効なエッジが抽出された画素数の和で除して、当該モデル画像の重み付け形状適合度とすることもできる。   Alternatively, the evaluation value calculation unit 514a generates an edge image from each model image and the captured image, and for each model image, chamfer matching between the edge image generated from the captured image and the edge image generated from the model image is performed. The value obtained by inverting the sign of the distance obtained by performing (Chamfer Matching) is divided by the sum of the number of pixels from which the valid edges are extracted from the captured image and the number of pixels from which the valid edges are extracted from the model image, The weighted shape conformity of the model image can also be used.

最適配置決定手段516aは、評価値算出手段514aから入力された配置ごとの統合評価値を参照し、統合評価値が最大の配置における候補位置を物体の位置と決定し、決定した物体位置の情報を物体位置出力手段31に出力する。すなわち、最適配置決定手段516aは、最大の類似度が算出された配置に含まれる各候補位置を撮影画像に撮影されている各人の位置と決定する。
例えば、最適配置決定手段516aは、監視員が視認し易いよう、各物体位置に物体モデルを当該物体位置の密度に応じて色分けして描画して物体位置の情報を生成し、出力する。または、物体位置の情報は物体位置の座標値そのものとすることもでき、物体位置の情報は、描画した各物体モデルの、他の物体モデルと重複していない領域とすることもできる。或いは、物体位置の情報は、上述したデータのうちの2以上を含んだデータとしてもよい。
The optimum arrangement determining unit 516a refers to the integrated evaluation value for each arrangement input from the evaluation value calculating unit 514a, determines the candidate position in the arrangement having the maximum integrated evaluation value as the object position, and information on the determined object position Is output to the object position output means 31. That is, the optimum arrangement determining unit 516a determines each candidate position included in the arrangement where the maximum similarity is calculated as the position of each person photographed in the photographed image.
For example, the optimum arrangement determining unit 516a generates and outputs information on the object position by drawing an object model in each object position in a color-coded manner according to the density of the object position so that the observer can easily recognize it. Alternatively, the object position information may be the coordinate value of the object position itself, and the object position information may be a region of each drawn object model that does not overlap with other object models. Alternatively, the object position information may be data including two or more of the above-described data.

物体位置出力手段31は物体位置判定手段51から入力された物体位置の情報を表示部6に順次出力し、表示部6は物体位置出力手段31から入力された物体位置の情報を表示する。例えば、物体位置の情報は、インターネット経由で送受信され、表示部6に表示される。監視員は、表示された情報を視認することによって監視空間に混雑が発生している地点を把握し、当該地点に警備員を派遣し或いは増員するなどの対処を行う。   The object position output unit 31 sequentially outputs the object position information input from the object position determination unit 51 to the display unit 6, and the display unit 6 displays the object position information input from the object position output unit 31. For example, the information on the object position is transmitted / received via the Internet and displayed on the display unit 6. The monitoring person grasps a point where the monitoring space is congested by viewing the displayed information, and takes measures such as dispatching or increasing the number of guards at the point.

<第一の実施形態に係る画像監視装置1の動作>
図9〜図11のフローチャートを参照して画像監視装置1の動作を説明する。
<Operation of the image monitoring apparatus 1 according to the first embodiment>
The operation of the image monitoring apparatus 1 will be described with reference to the flowcharts of FIGS.

画像監視装置1が動作を開始すると、イベント会場に設置されている撮影部2は所定時間おきに監視空間を撮影して撮影画像を画像処理部5が設置されている画像解析センター宛に順次送信する。そして、画像処理部5は撮影画像を受信するたびに図9のフローチャートに従った動作を繰り返す。   When the image monitoring apparatus 1 starts operation, the image capturing unit 2 installed in the event venue captures the monitoring space every predetermined time and sequentially transmits the captured images to the image analysis center in which the image processing unit 5 is installed. To do. The image processing unit 5 repeats the operation according to the flowchart of FIG. 9 every time a captured image is received.

まず、通信部3は画像取得手段30として動作し、撮影部2からの撮影画像の受信待ち状態となる。撮影画像を取得した画像取得手段30は当該撮影画像を画像処理部5に出力する(ステップS1)。   First, the communication unit 3 operates as the image acquisition unit 30 and waits to receive a captured image from the imaging unit 2. The image acquisition means 30 that acquired the captured image outputs the captured image to the image processing unit 5 (step S1).

撮影画像を入力された画像処理部5は密度推定手段50として動作し、撮影画像から密度分布を推定する(ステップS2)。密度推定手段50は、撮影画像の各画素の位置にて推定用特徴量を抽出するとともに記憶部4の密度推定器記憶手段40から密度推定器を読み出し、各推定用特徴量を密度推定器に入力して撮影画像の各画素における推定密度を取得することにより密度分布を推定する。   The image processing unit 5 to which the photographed image is input operates as the density estimating means 50, and estimates the density distribution from the photographed image (step S2). The density estimation unit 50 extracts the estimation feature quantity at the position of each pixel of the captured image, reads the density estimator from the density estimator storage unit 40 of the storage unit 4, and uses each estimation feature quantity as the density estimator. The density distribution is estimated by inputting and obtaining the estimated density at each pixel of the captured image.

密度分布を推定した画像処理部5は物体位置判定手段51としても動作し、物体位置判定手段51には画像取得手段30から撮影画像が入力されるとともに密度推定手段50から密度分布が入力される。これらを入力された物体位置判定手段51は、密度分布に背景クラス以外の推定密度が含まれているか否かを確認する(ステップS3)。   The image processing unit 5 that has estimated the density distribution also operates as the object position determination unit 51. The captured image is input from the image acquisition unit 30 and the density distribution is input from the density estimation unit 50 to the object position determination unit 51. . The object position determination means 51 that has received these confirms whether the density distribution includes an estimated density other than the background class (step S3).

背景クラス以外の推定密度が含まれている場合は(ステップS3にてYES)、物体位置判定手段51は、少なくとも1人以上の人が撮影されているとして、撮影画像から個々の物体の位置を判定する処理を行う(ステップS4)。他方、背景クラスのみの場合は(ステップS3にてNO)、人が撮影されていないとして、ステップS4,S5の処理を省略する。   If the estimated density other than the background class is included (YES in step S3), the object position determination unit 51 determines the position of each object from the captured image, assuming that at least one person is captured. A determination process is performed (step S4). On the other hand, in the case of only the background class (NO in step S3), the processes in steps S4 and S5 are omitted assuming that no person is photographed.

図10および図11のフローチャートを参照して、ステップS4の物体位置判定処理を説明する。単体特徴記憶手段41が物体モデル記憶手段410aおよび重み記憶手段412aとして動作し、物体位置判定手段51が配置生成手段510a、モデル画像生成手段512a、評価値算出手段514aおよび最適配置決定手段516aとして動作して、物体位置判定処理が実行される。   The object position determination process in step S4 will be described with reference to the flowcharts of FIGS. The single feature storage unit 41 operates as the object model storage unit 410a and the weight storage unit 412a, and the object position determination unit 51 operates as the arrangement generation unit 510a, the model image generation unit 512a, the evaluation value calculation unit 514a, and the optimum arrangement determination unit 516a. Then, the object position determination process is executed.

配置生成手段510aは、1から上限個数以下の範囲で配置数を順次設定して(ステップS100)、ステップS100〜S117のループ処理を制御する。   The arrangement generation unit 510a sequentially sets the number of arrangements within a range from 1 to the upper limit number (step S100), and controls the loop processing of steps S100 to S117.

また、配置生成手段510aは、反復回数をカウントするための変数Tを用意してTを0に初期化し(ステップS101)、ステップS102〜S116の反復処理を開始する。   The arrangement generation unit 510a prepares a variable T for counting the number of iterations, initializes T to 0 (step S101), and starts the iterative process of steps S102 to S116.

次に、配置生成手段510aは、密度推定手段50から入力された密度分布において推定密度が低密度、中密度または高密度の領域内に、ステップS100にて設定した配置数と同数の候補位置をランダムに設定することによって、当該配置数におけるT通り目の配置を生成し、モデル画像生成手段512aに出力する(ステップS102)。   Next, the arrangement generation unit 510a sets the same number of candidate positions as the number of arrangements set in step S100 in the low density, medium density, or high density region in the density distribution input from the density estimation unit 50. By setting at random, a T-th arrangement in the arrangement number is generated and output to the model image generation unit 512a (step S102).

モデル画像生成手段512aは、物体モデル記憶手段410aからカメラパラメータを読み出し、カメラパラメータを用いて、ステップS102で生成した配置に含まれる各候補位置を仮想空間の三次元座標に変換する(ステップS103)。   The model image generation unit 512a reads camera parameters from the object model storage unit 410a, and converts each candidate position included in the arrangement generated in step S102 into three-dimensional coordinates in the virtual space using the camera parameters (step S103). .

次に、モデル画像生成手段512aは、撮影画像と同サイズのモデル画像を用意して初期化するとともに、各候補位置の三次元座標の撮影部2までの距離を算出し、距離が遠い候補位置から順に処理対象に設定して(ステップS104)、ステップS104〜S110のループ処理を実行する。   Next, the model image generation unit 512a prepares and initializes a model image having the same size as the captured image, calculates the distance to the imaging unit 2 of the three-dimensional coordinates of each candidate position, and the candidate position with a long distance Are sequentially set as processing targets (step S104), and the loop processing of steps S104 to S110 is executed.

続いて、モデル画像生成手段512aは密度分布を参照して処理対象の候補位置の密度を特定する(ステップS105)。モデル画像生成手段512aは、物体モデル記憶手段410aから頭部近傍モデルを読み出して当該候補位置の三次元座標に配置し、カメラパラメータを用いて、頭部近傍モデルを撮影画像の座標系に投影し、投影領域内で最多の推定密度(ただし背景クラス以外)を候補位置の密度として特定する。   Subsequently, the model image generating unit 512a specifies the density of the candidate position to be processed with reference to the density distribution (step S105). The model image generation unit 512a reads out the head vicinity model from the object model storage unit 410a, arranges it in the three-dimensional coordinates of the candidate position, and projects the head vicinity model onto the coordinate system of the captured image using the camera parameters. The highest estimated density (except for the background class) in the projection area is specified as the density of candidate positions.

続いて、モデル画像生成手段512aは、ステップS105で特定した密度に対応する物体モデルを物体モデル記憶手段410aから読み出して(ステップS106)、処理対象の候補位置の三次元座標に配置し、カメラパラメータを用いて、配置した物体モデルをモデル画像に上書き投影する(ステップS107)。また、このとき、モデル画像生成手段512aは物体モデルの投影面積を記録しておく。
物体モデルは複数の部分モデルから構成されており、これら複数の部分モデルにおける物体の輪郭がモデル画像中の候補位置を基準とする各位置に上書き投影される。各部分の部分モデルを投影した投影領域が当該部分の部分領域である。モデル画像生成手段512aは、候補位置と部分の組み合わせに識別番号を付与し、当該部分と対応する部分領域の画素値に、投影した部分の識別番号を部分モデルにおける物体の輪郭の強度値とともに設定する。
Subsequently, the model image generation unit 512a reads the object model corresponding to the density specified in step S105 from the object model storage unit 410a (step S106), arranges it at the three-dimensional coordinates of the candidate position to be processed, and sets the camera parameter. Is used to over-project the placed object model onto the model image (step S107). At this time, the model image generation means 512a records the projected area of the object model.
The object model is composed of a plurality of partial models, and the contours of the objects in the plurality of partial models are overwritten and projected at each position based on the candidate position in the model image. A projection area obtained by projecting a partial model of each part is a partial area of the part. The model image generation unit 512a assigns an identification number to the combination of the candidate position and the part, and sets the identification number of the projected part together with the intensity value of the contour of the object in the partial model to the pixel value of the partial area corresponding to the part. To do.

続いて、モデル画像生成手段512aは密度分布を参照して各部分領域の密度を特定する(ステップS108)。モデル画像生成手段512aは、各部分領域内で最多の推定密度(ただし背景クラスは低密度クラスとみなす)を当該部分領域の密度として特定する。   Subsequently, the model image generating unit 512a specifies the density of each partial region with reference to the density distribution (step S108). The model image generation means 512a specifies the highest estimated density (however, the background class is regarded as a low density class) in each partial area as the density of the partial area.

続いて、モデル画像生成手段512aは重み記憶手段412aを参照して各部分領域の密度に対応する重み(重み係数の比率)を設定する(ステップS109)。すなわちモデル画像生成手段512aは、各部分領域の重みを当該部分領域に対応する部分の識別番号とともに記録する。なお、この際に、ステップS107における上書き投影によりモデル画像上で完全に隠蔽された部分領域の重みは記録から削除する。   Subsequently, the model image generation unit 512a refers to the weight storage unit 412a and sets the weight (weight coefficient ratio) corresponding to the density of each partial region (step S109). That is, the model image generating unit 512a records the weight of each partial area together with the identification number of the part corresponding to the partial area. At this time, the weight of the partial area completely hidden on the model image by the overwriting projection in step S107 is deleted from the recording.

そして、モデル画像生成手段512aは、現配置数におけるT通り目の配置に含まれる全ての候補位置を処理し終えたか否かを確認し(ステップS110)、未処理の候補位置がある場合は(ステップS110にてNO)、処理をステップS104に戻して次の候補位置を処理する。   Then, the model image generating means 512a checks whether or not all candidate positions included in the Tth arrangement in the current arrangement number have been processed (step S110), and if there is an unprocessed candidate position ( NO in step S110), the process returns to step S104 to process the next candidate position.

他方、全ての候補位置を処理し終えた場合は(ステップS110にてYES)、現配置数におけるT通り目の配置についてのモデル画像の完成となる。モデル画像を完成させたモデル画像生成手段512aは当該モデル画像における物体モデルの隠蔽度を算出する(ステップS111)。すなわち、モデル画像生成手段512aは、「モデルの投影領域の和領域の面積」であるモデル画像上の投影領域の面積を求めるとともに、ステップS107で記録していた物体モデルごとの投影面積を総和し、総和値からモデルの投影領域の和領域の面積を差し引いて「モデル間の重複領域の面積」を求め、これらを式(1)に代入して隠蔽度を算出する。   On the other hand, when all the candidate positions have been processed (YES in step S110), the model image for the Tth arrangement in the current arrangement number is completed. The model image generating means 512a that has completed the model image calculates the degree of concealment of the object model in the model image (step S111). That is, the model image generation unit 512a obtains the area of the projection area on the model image that is “the area of the sum area of the model projection areas” and sums up the projection areas for each object model recorded in step S107. Then, by subtracting the area of the sum area of the projected areas of the model from the total value, the “area of the overlapping area between the models” is obtained, and these are substituted into Equation (1) to calculate the degree of concealment.

また、モデル画像生成手段512aはステップS109で記録していた部分領域の重みを総和し、各部分領域の重みを総和値で除することによって各部分領域の重み係数を算出する(ステップS112)。   The model image generating means 512a calculates the weighting coefficient of each partial area by summing the weights of the partial areas recorded in step S109 and dividing the weight of each partial area by the total value (step S112).

重み係数を算出したモデル画像生成手段512aはモデル画像と隠蔽度と部分領域ごとの重み係数を評価値算出手段514aに出力する。   The model image generating unit 512a that has calculated the weighting coefficient outputs the model image, the degree of concealment, and the weighting factor for each partial area to the evaluation value calculating unit 514a.

モデル画像と隠蔽度と重み係数を入力された評価値算出手段514aは、当該モデル画像と撮影画像の部分領域ごとの形状適合度を当該部分領域の部分評価値として算出し(ステップS113)、さらに、部分領域ごとの形状適合度と当該部分領域の重み係数の積を総和した重み付け形状適合度と隠蔽度から、モデル画像と撮影画像の重み付け類似度を現配置数におけるT通り目の配置についての統合評価値として算出する(ステップS114)。すなわち、評価値算出手段514aは、モデル画像生成手段512aから入力されたモデル画像と撮影画像のそれぞれからエッジ画像を生成し、これらのエッジ画像の部分領域ごとの類似度と部分領域ごとの重み係数を積和して重み付け形状適合度を算出する。そして、重み付け形状適合度と隠蔽度を式(2)に代入して重み付け類似度を算出する。   The evaluation value calculation means 514a, to which the model image, the concealment degree, and the weighting coefficient are input, calculates the shape matching degree for each partial area of the model image and the captured image as a partial evaluation value of the partial area (step S113), and further From the weighted shape matching degree and the concealment degree obtained by summing up the products of the shape matching degree for each partial area and the weight coefficient of the partial area, the weighted similarity between the model image and the photographed image is calculated for the Tth arrangement in the current arrangement number. The integrated evaluation value is calculated (step S114). That is, the evaluation value calculation unit 514a generates an edge image from each of the model image and the photographed image input from the model image generation unit 512a, and the degree of similarity for each partial region of these edge images and the weighting coefficient for each partial region. To calculate the weighted shape suitability. Then, the weighted similarity is calculated by substituting the weighted shape matching degree and the concealment degree into Expression (2).

現配置数におけるT通り目の配置についての重み付け類似度が算出されると、評価値算出手段514aは当該配置と重み付け類似度を対応付けて記録し、配置生成手段510aは反復回数Tを1だけ増加させて(ステップS115)、規定回数TMAXと比較し(ステップS116)、TがTMAX未満の場合は(ステップS116にてNO)、処理をステップS102に戻して現配置数における反復処理を継続させる。 When the weighted similarity for the Tth arrangement in the current arrangement number is calculated, the evaluation value calculation unit 514a records the arrangement and the weighted similarity in association with each other, and the arrangement generation unit 510a sets the number of iterations T to one. Increment (step S115) and compare with the specified number of times T MAX (step S116). If T is less than T MAX (NO in step S116), the process returns to step S102 to repeat the current arrangement number. Let it continue.

反復回数Tが規定回数TMAXに達した場合(ステップS116にてYES)、配置生成手段510aは、現配置数における反復処理を終了させ、全ての配置数を設定し終えたか否かを確認する(ステップS117)。未設定の配置数がある場合は(ステップS117にてNO)、処理をステップS100に戻して次の配置数についての処理を行う。 When the number of iterations T has reached the specified number of times T MAX (YES in step S116), the arrangement generation unit 510a ends the iterative process for the current arrangement number, and confirms whether all the arrangement numbers have been set. (Step S117). If there is an unset number of arrangements (NO in step S117), the process returns to step S100 to perform processing for the next number of arrangements.

他方、全ての配置数を設定し終えた場合は(ステップS117にてYES)、評価値算出手段514aはステップS115で記録した配置と重み付け類似度を最適配置決定手段516aに入力し、最適配置決定手段516aは、それらの中で重み付け類似度が最大の配置を特定し(ステップS118)、当該配置を撮影画像に撮影されている個々の人の位置を表している情報と判定する。   On the other hand, when all the arrangement numbers have been set (YES in step S117), evaluation value calculation means 514a inputs the arrangement recorded in step S115 and the weighted similarity to optimum arrangement determination means 516a to determine the optimum arrangement. The means 516a identifies an arrangement having the maximum weighted similarity among them (step S118), and determines that the arrangement is information indicating the position of each person photographed in the photographed image.

再び図9を参照して説明を続ける。物体位置判定手段51はステップS4にて判定した個々の人の位置(物体位置)の情報を通信部3に出力する(ステップS5)。物体位置の情報を入力された通信部3は物体位置出力手段31として動作し、物体位置の情報を表示部6に送信する。   The description will be continued with reference to FIG. 9 again. The object position determination unit 51 outputs information on the position (object position) of each person determined in step S4 to the communication unit 3 (step S5). The communication unit 3 to which the object position information is input operates as the object position output unit 31 and transmits the object position information to the display unit 6.

以上の処理を終えると、処理はステップS1に戻され、次の撮影画像に対する処理が行われる。   When the above process is completed, the process returns to step S1, and the process for the next captured image is performed.

[第二の実施形態]
以下、第一の実施形態とは異なる本発明の好適な実施形態として、単独の人の画像特徴を学習した識別器を用いて個々の人を検出し、特に、単独の人を構成する複数の部分のそれぞれの画像特徴を学習した部分識別器を用いて個々の人を検出する物体検出装置の例を含んだ画像監視装置1の例を説明する。
[Second Embodiment]
Hereinafter, as a preferred embodiment of the present invention different from the first embodiment, an individual person is detected using a discriminator that has learned the image characteristics of a single person, and in particular, a plurality of persons constituting a single person are detected. An example of the image monitoring apparatus 1 including an example of an object detection apparatus that detects individual persons using a partial classifier that has learned the image characteristics of each part will be described.

第二の実施形態に係る画像監視装置は、単体特徴記憶手段41が記憶している単体特徴の細部および物体位置判定手段51が行う処理の細部が第一の実施形態に係る画像監視装置と異なり、概略の構成、概略の機能および動作の一部は共通する。そのため、概略の構成、概略の機能および動作の一部については、それぞれ第一の実施形態で参照した図1のブロック図、図2の機能ブロック図および図9のフローチャートを再び参照して説明する。   The image monitoring apparatus according to the second embodiment differs from the image monitoring apparatus according to the first embodiment in the details of the single feature stored in the single feature storage unit 41 and the details of the processing performed by the object position determination unit 51. A part of the general configuration, the general function, and the operation is common. Therefore, a part of the schematic configuration, the schematic function, and the operation will be described with reference again to the block diagram of FIG. 1, the functional block diagram of FIG. 2, and the flowchart of FIG. 9 respectively referred to in the first embodiment. .

<第二の実施形態に係る画像監視装置1の構成>
図1のブロック図を参照して第二の実施形態に係る画像監視装置1の概略の構成を説明する。
画像監視装置1は、第一の実施形態と同様、監視空間を所定時間おきに撮影して撮影画像を出力する撮影部2と、物体位置の情報を入力されて当該情報を表示する表示部6と、撮影画像を取得して当該撮影画像から個々の人(物体)を検出し、検出した物体の位置(物体位置)の情報を生成して出力する画像処理部5とが、撮影画像および物体位置の情報等の入出力を介在する通信部3に接続されるとともに、プログラムおよび各種データ等を記憶してこれらを入出力する記憶部4が画像処理部5に接続されてなる。
<Configuration of Image Monitoring Device 1 according to Second Embodiment>
The schematic configuration of the image monitoring apparatus 1 according to the second embodiment will be described with reference to the block diagram of FIG.
As in the first embodiment, the image monitoring apparatus 1 includes a photographing unit 2 that photographs a monitoring space at predetermined time intervals and outputs a photographed image, and a display unit 6 that receives information on an object position and displays the information. An image processing unit 5 that acquires a captured image, detects an individual person (object) from the captured image, and generates and outputs information on the position (object position) of the detected object. In addition to being connected to the communication unit 3 through which input and output of position information and the like are connected, a storage unit 4 that stores programs and various data and inputs and outputs them is connected to the image processing unit 5.

<第二の実施形態に係る画像監視装置1の機能>
図2および図12の機能ブロック図を参照し、第二の実施形態に係る画像監視装置1の機能について説明する。
<Function of the image monitoring apparatus 1 according to the second embodiment>
With reference to the functional block diagrams of FIGS. 2 and 12, functions of the image monitoring apparatus 1 according to the second embodiment will be described.

通信部3は、第一の実施形態と同様、撮影部2から撮影画像を取得して密度推定手段50と物体位置判定手段51に出力する画像取得手段30、および物体位置判定手段51から入力された物体位置の情報を表示部6に出力する物体位置出力手段31等としての機能を含む。   Similar to the first embodiment, the communication unit 3 receives a captured image from the image capturing unit 2 and outputs the captured image to the density estimation unit 50 and the object position determination unit 51 and the object position determination unit 51. A function as an object position output means 31 or the like for outputting information on the object position to the display unit 6.

また、記憶部4は、第一の実施形態と同様、所定の密度ごとに当該密度にて物体が存在する空間を撮影した密度画像それぞれの画像特徴を学習した密度推定器を記憶している密度推定器記憶手段40、および予めの学習により生成された単独の物体の画像特徴(単体特徴)を記憶している単体特徴記憶手段41等としての機能を含み、単体特徴記憶手段41が記憶している単体特徴は、物体を構成する部分ごとの画像特徴の情報および密度に対する重みの情報となっている。   In addition, as in the first embodiment, the storage unit 4 stores a density estimator that learns the image features of each density image obtained by photographing a space where an object exists at the predetermined density for each predetermined density. It includes a function as an estimator storage unit 40 and a unit feature storage unit 41 that stores an image feature (single unit feature) of a single object generated by pre-learning. The single feature is information on the image feature for each part constituting the object and information on the weight for the density.

また、画像処理部5は、第一の実施形態と同様、撮影画像を密度推定器で走査することによって撮影画像に撮影された物体の密度の分布を推定し、推定した密度分布を物体位置判定手段51に出力する密度推定手段50、および撮影画像内に個々の物体が存在し得る候補位置を設定して当該候補位置の撮影画像に単独の物体の画像特徴が現れている度合いを表す評価値(統合評価値)を算出し、統合評価値が判定基準を満たす候補位置を物体の位置と判定して物体位置の情報を物体位置出力手段31に出力する物体位置判定手段51等としての機能を含み、物体位置判定手段51は、候補位置を基準として撮影画像内に物体を構成する複数の部分のそれぞれと対応する部分領域を設定して、部分領域ごとに当該部分領域と対応する部分の画像特徴が現れている度合いを表す部分評価値を算出し、候補位置を基準に設定した各部分領域の部分評価値を当該部分領域の密度が低いほど重視して統合することによって統合評価値を算出する。   Further, as in the first embodiment, the image processing unit 5 estimates the density distribution of the object photographed in the photographed image by scanning the photographed image with the density estimator, and determines the estimated density distribution as the object position. The density estimation means 50 output to the means 51, and an evaluation value representing the degree to which the image feature of a single object appears in the photographed image at the candidate position by setting candidate positions where individual objects can exist in the photographed image (Integrated evaluation value) is calculated, and a function as an object position determination unit 51 or the like that determines the candidate position that satisfies the determination criterion as the position of the object and outputs information on the object position to the object position output unit 31. The object position determination means 51 sets a partial area corresponding to each of a plurality of parts constituting the object in the captured image with reference to the candidate position, and an image of a part corresponding to the partial area for each partial area Calculate the partial evaluation value that represents the degree that the sign appears, and calculate the integrated evaluation value by focusing on the partial evaluation value of each partial area set based on the candidate position as the density of the partial area is lower To do.

ただし、上述したように、第二の実施形態に係る物体位置判定手段51が行う処理の細部および単体特徴記憶手段41が記憶している単体特徴の細部が第一の実施形態に係る画像監視装置1と異なる。これらの点について、図12の機能ブロック図を参照して説明する。   However, as described above, the details of the processing performed by the object position determination unit 51 according to the second embodiment and the details of the single feature stored in the single feature storage unit 41 are the image monitoring apparatus according to the first embodiment. Different from 1. These points will be described with reference to the functional block diagram of FIG.

第二の実施形態に係る単体特徴記憶手段41は、単独の人(物体)を構成する複数の部分のそれぞれの画像特徴を学習した部分ごとの識別器(部分識別器)を予め記憶した部分識別器記憶手段411b、および評価値の算出において用いる重みの情報を予め記憶した重み記憶手段412bとして機能し、部分識別器の情報および重みの情報を単体特徴として記憶している。   The single feature storage unit 41 according to the second embodiment is a partial identification that stores in advance a classifier (partial classifier) for each part that has learned each image feature of a plurality of parts constituting a single person (object). It functions as a unit storage unit 411b and a weight storage unit 412b that stores in advance the weight information used in calculating the evaluation value, and stores the partial classifier information and the weight information as a single feature.

図13は、第二の実施形態に係る単体特徴記憶手段41が記憶している単体特徴、すなわち部分識別器記憶手段411bが記憶している部分識別器の情報および重み記憶手段412bが記憶している重みの情報を模式的に表した図である。   FIG. 13 shows the single feature stored in the single feature storage unit 41 according to the second embodiment, that is, the partial classifier information stored in the partial classifier storage unit 411b and the weight storage unit 412b. It is the figure which represented the information of the weight which has been shown typically.

物体の各部分についての部分識別器のそれぞれは、画像の特徴量を入力されると当該画像が当該部分の画像(部分画像)であることの尤もらしさを表す部分スコア(部分評価値)を算出して出力するスコア算出関数の係数等で表される。部分識別器記憶手段411bは、各部分識別器を表す係数等、各部分の基準位置からの相対位置および密度と使用する部分識別器の対応関係等のパラメータを記憶している。基準位置は例えば頭部重心である。   Each of the partial classifiers for each part of the object calculates a partial score (partial evaluation value) indicating the likelihood that the image is an image of the part (partial image) when the feature amount of the image is input. It is expressed by the coefficient of the score calculation function to be output. The partial discriminator storage unit 411b stores parameters such as the correspondence between the relative position and density of each part from the reference position and the partial discriminator to be used, such as a coefficient representing each partial discriminator. The reference position is, for example, the center of gravity of the head.

部分識別器は、例えば、多数の人についての部分画像と多数の無人画像からなる学習用画像の特徴量に線形SVM法を適用して学習した識別器とすることができる。学習アルゴリズムとして線形SVMを用いた場合、スコア算出関数の係数は重みベクトルである。この重みベクトルは、特徴量の各要素に対する重みであり、入力された画像の特徴量と重みベクトルとの内積の値が部分スコアを表す。学習において、当該重みベクトルと特徴量との内積が0以上である場合は人の部分画像、0未満である場合は人の部分画像ではないと識別されるように調整される。よって、統合スコアに適用して、入力された画像が単独の人の画像であるか否かを識別する閾値は原理上は0であり、通常、閾値は0に設定することができる。ただし、単独の人の画像を単独の人の画像ではないと識別する誤りを減じるために、閾値を0よりも小さな値に設定してもよい。
学習用画像の特徴量は例えばHOG(Histograms of Oriented Gradients)特徴量とすることができる。
The partial discriminator can be, for example, a discriminator that learns by applying the linear SVM method to the feature amount of a learning image including a partial image and a large number of unmanned images for a large number of people. When linear SVM is used as the learning algorithm, the coefficient of the score calculation function is a weight vector. This weight vector is a weight for each element of the feature quantity, and the value of the inner product of the feature quantity of the input image and the weight vector represents the partial score. In learning, when the inner product of the weight vector and the feature amount is 0 or more, adjustment is made so that it is identified as a partial image of a person, and when it is less than 0, it is not a partial image of a person. Therefore, the threshold value that is applied to the integrated score and identifies whether the input image is an image of a single person is 0 in principle, and the threshold value can usually be set to 0. However, the threshold value may be set to a value smaller than 0 in order to reduce the error of identifying a single person image as not being a single person image.
The feature amount of the learning image may be, for example, a HOG (Histograms of Oriented Gradients) feature amount.

部分識別器記憶手段411bは、具体的には、低密度クラスを表す値と対応付けて人の6つの部分「上1/3、左1/2」、「上1/3、右1/2」、「中1/3、左1/2」、「中1/3、右1/2」、「下1/3、左1/2」および「下1/3、右1/2」の画像特徴を学習した部分識別器800〜805を記憶している。これら6つの部分を合わせると人の「全体」となる。
以下、「上1/3、左1/2」を左上部、「上1/3、右1/2」を右上部、「中1/3、左1/2」を左中部、「中1/3、右1/2」を右中部、「下1/3、左1/2」を左下部、「下1/3、右1/2」を右下部と称する。また、左上部用の部分識別器800を左上部識別器、右上部用の部分識別器801を右上部識別器、左中部用の部分識別器802を左中部識別器、右中部用の部分識別器803を右中部識別器、左下部用の部分識別器804を左下部識別器、右下部用の部分識別器805を右下部識別器と称する。また、合わせると評価範囲が「全体」となる6つの部分識別器800〜805のセット810を全体識別器と称する。
また部分識別器記憶手段411bは、中密度クラスを表す値と対応付けて左上部識別器800、右上部識別器801、左中部識別器802および右中部識別器803を記憶している。これら4つの部分識別器の評価範囲を合わせると人の「上部2/3」となる。合わせると評価範囲が「上部2/3」となる4つの部分識別器800〜803のセット811を上半身識別器と称する。
また部分識別器記憶手段411bは、高密度クラスを表す値と対応付けて左上部識別器800および右上部識別器801を記憶している。これら2つの部分識別器の評価範囲を合わせると人の「上部1/3」となる。合わせると評価範囲が「上部1/3」となる2つの部分識別器800,801のセット812を頭部近傍識別器と称する。
Specifically, the partial discriminator storage unit 411b associates the values representing the low density class with the six parts "upper 1/3, left 1/2", "up 1/3, right 1/2". ”,“ Middle 1/3, Left 1/2 ”,“ Middle 1/3, Right 1/2 ”,“ Lower 1/3, Left 1/2 ”and“ Lower 1/3, Right 1/2 ” The partial discriminators 800 to 805 that have learned image features are stored. When these six parts are combined, it becomes the “whole” of the person.
Hereinafter, “Up 1/3, Left 1/2” is upper left, “Up 1/3, Right 1/2” is upper right, “Middle 1/3, Left 1/2” is left middle, “Middle 1 / 3, right 1/2 "is called the right middle part," lower 1/3, left 1/2 "is called the lower left part, and" lower 1/3, right 1/2 "is called the lower right part. Further, the upper left partial discriminator 800 is the upper left discriminator, the upper right partial discriminator 801 is the upper right discriminator, the left middle partial discriminator 802 is the left middle discriminator, and the right middle partial discriminator. The unit 803 is referred to as a right middle classifier, the lower left partial classifier 804 is referred to as a lower left classifier, and the lower right partial classifier 805 is referred to as a lower right classifier. In addition, a set 810 of six partial discriminators 800 to 805 whose evaluation range is “whole” is referred to as a total discriminator.
The partial discriminator storage unit 411b stores an upper left discriminator 800, an upper right discriminator 801, a left middle discriminator 802, and a right middle discriminator 803 in association with values representing the medium density class. When the evaluation ranges of these four partial classifiers are combined, it becomes the “upper 2/3” of the person. Together, a set 811 of four partial classifiers 800 to 803 having an evaluation range of “upper 2/3” is referred to as an upper body classifier.
The partial discriminator storage unit 411b stores an upper left discriminator 800 and an upper right discriminator 801 in association with values representing high density classes. When the evaluation ranges of these two partial classifiers are combined, it becomes “upper 1 /” of a person. Together, the set 812 of two partial discriminators 800 and 801 whose evaluation range is “upper 1/3” is referred to as a head vicinity discriminator.

このように、部分識別器記憶手段411bは、低密度クラスと対応付けて左上部識別器800、右上部識別器801、左中部識別器802、右中部識別器803、左下部識別器804および右下部識別器805からなる全体識別器810を、中密度クラスと対応付けて左上部識別器800、右上部識別器801、左中部識別器802および右中部識別器803からなる上半身識別器811を、高密度クラスと対応付けて左上部識別器800および右上部識別器801からなる頭部近傍識別器812を、統合評価値に適用する閾値等とともに記憶している。
なお、ここでは密度間で同一部分の部分識別器を共用する例を示したが、密度ごとに部分の区分けを異ならせてもよい。
As described above, the partial discriminator storage unit 411b is associated with the low density class, the upper left discriminator 800, the upper right discriminator 801, the left middle discriminator 802, the right middle discriminator 803, the lower left discriminator 804, and the right An overall classifier 810 comprising a lower classifier 805 is associated with a middle density class, and an upper body classifier 811 comprising an upper left classifier 800, an upper right classifier 801, a left middle classifier 802, and a right middle classifier 803, A head vicinity discriminator 812 including an upper left discriminator 800 and an upper right discriminator 801 is stored in association with the high density class together with a threshold value applied to the integrated evaluation value.
Here, an example in which partial identifiers of the same part are shared between the densities is shown, but the division of the parts may be different for each density.

重み820は、物体の各部分と対応する部分領域の密度に応じて当該部分を重視する度合いであり、密度間の相対的な比率で表される。密度が低い部分ほど重視され密度が高い部分ほど軽視されるため、密度が低いほど高く密度が高いほど低い重み820が設定されている。例えば、低密度、中密度および高密度の重み820は比率10:7:5とすることができる。なお部分領域の密度の決定に際しては背景クラスは低密度クラスとみなすことができる。   The weight 820 is a degree of emphasizing the part according to the density of the partial region corresponding to each part of the object, and is represented by a relative ratio between the densities. Since the lower density part is more important and the higher density part is disregarded, a lower weight 820 is set as the density is lower and the density is higher. For example, the low density, medium density, and high density weights 820 can have a ratio of 10: 7: 5. In determining the density of the partial region, the background class can be regarded as a low density class.

このように重み記憶手段412bは、密度が低いほど高く密度が高いほど低い、密度ごとの重みを記憶している。   As described above, the weight storage unit 412b stores the weight for each density, which is higher as the density is lower and lower as the density is higher.

候補位置設定手段511bは、撮影画像内に所定間隔にて複数の候補位置を設定し、設定した候補位置を評価値算出手段514bに出力する。具体的には、所定間隔は1画素であり、候補位置設定手段511bは撮影画像の各画素の位置を順次候補位置に設定する。なお候補位置は人の頭部重心を表すものとする。   The candidate position setting unit 511b sets a plurality of candidate positions in the captured image at predetermined intervals, and outputs the set candidate positions to the evaluation value calculation unit 514b. Specifically, the predetermined interval is one pixel, and the candidate position setting unit 511b sequentially sets the position of each pixel of the captured image as the candidate position. The candidate position represents the human head center of gravity.

評価値算出手段514bは、候補位置設定手段511bから入力された各候補位置を基準として撮影画像内に単独の物体を構成する複数の部分のそれぞれと対応する部分領域を設定して、複数の部分のそれぞれと対応する部分領域の画像特徴を当該部分の画像特徴を学習した部分識別器に入力して当該部分領域の部分評価値を算出し、候補位置ごとに当該候補位置を基準に設定した部分領域の部分評価値を当該部分領域の密度が低いほど重視して統合することにより統合評価値を算出し、算出した統合評価値とそれに付随する情報を位置決定手段517bに出力する。
またその際に、評価値算出手段514bは、各候補位置に、当該候補位置における密度が高いほど、単独の物体を構成する部分のうちの少ない部分に対応する部分領域を設定する。
The evaluation value calculation unit 514b sets a partial region corresponding to each of a plurality of portions constituting a single object in the photographed image with each candidate position input from the candidate position setting unit 511b as a reference. A partial evaluation value of the partial area is calculated by inputting the image characteristic of the partial area corresponding to each of the partial areas to the partial classifier that has learned the image characteristic of the part, and a part set based on the candidate position for each candidate position The integrated evaluation value is calculated by emphasizing and integrating the partial evaluation value of the region as the density of the partial region is lower, and the calculated integrated evaluation value and information associated therewith are output to the position determining unit 517b.
At that time, the evaluation value calculation unit 514b sets a partial area corresponding to a smaller part of the parts constituting the single object as the density at the candidate position is higher at each candidate position.

そのために、評価値算出手段514bは、各候補位置に上部1/3の窓を設定し、密度推定手段50から入力された密度分布を参照して当該窓内の推定密度を集計する。ただし背景クラスは除いて集計する。そして、評価値算出手段514bは各候補位置における最多の推定密度を当該候補位置の密度と決定する。   For this purpose, the evaluation value calculation unit 514b sets an upper 1/3 window at each candidate position, refers to the density distribution input from the density estimation unit 50, and totals the estimated density in the window. However, the background class is excluded. Then, the evaluation value calculation unit 514b determines the highest estimated density at each candidate position as the density of the candidate position.

また、評価値算出手段514bは、部分識別器記憶手段411bから各候補位置の密度に応じた部分識別器の情報を読み出し、各候補位置に当該候補位置の密度に対応づけられた部分識別器と対応する窓(部分領域)を設定し、各部分領域内の撮影画像から識別用の特徴量(識別用特徴量)を抽出する。これらの部分領域は、各部分の部分識別器の学習に用いた部分画像の形状(図13に示した実線の矩形)を有し、予め定めた複数の倍率で拡大・縮小した大きさの窓である。低密度の候補位置に対しては合わせると人の「全体」となる6つの部分領域、中密度の候補位置に対しては合わせると人の「上部2/3」となる4つの部分領域、高密度の候補位置に対しては合わせると人の「上部1/3」となる2つの部分領域が設定される。識別用特徴量は、学習用画像の特徴量と同種であり、HOG特徴量である。   Further, the evaluation value calculation unit 514b reads out information on the partial classifiers corresponding to the density of each candidate position from the partial classifier storage unit 411b, and a partial classifier associated with each candidate position corresponding to the density of the candidate position. Corresponding windows (partial areas) are set, and feature quantities for identification (identification feature quantities) are extracted from captured images in each partial area. These partial areas have the shape of the partial image (solid-line rectangle shown in FIG. 13) used for learning of the partial classifier of each part, and are windows that are enlarged or reduced at a plurality of predetermined magnifications. It is. 6 partial areas that are "overall" for a low density candidate position, 4 partial areas that are "upper 2/3" for a medium density candidate position, high When combined with the density candidate position, two partial regions that are “upper 1/3” of the person are set. The feature amount for identification is the same type as the feature amount of the learning image, and is a HOG feature amount.

また、評価値算出手段514bは、各部分の識別用特徴量を当該部分の部分識別器に入力してその出力値である部分スコアを部分評価値として取得する。   Further, the evaluation value calculation means 514b inputs the identification feature quantity of each part to the partial classifier of the part, and acquires the partial score that is the output value as the partial evaluation value.

また、評価値算出手段514bは、各部分領域について当該部分領域の推定密度に応じた重み係数を算出する。   Further, the evaluation value calculation unit 514b calculates a weighting coefficient corresponding to the estimated density of the partial area for each partial area.

そのために、評価値算出手段514bは、密度分布を参照して各部分領域内の推定密度を集計し、各部分領域における最多の推定密度を当該部分領域の密度と決定する。ただし背景クラスは低密度クラスとみなして集計する。
次に評価値算出手段514bは、重み記憶手段412bから各部分領域の密度に対応する重み(重み係数の比率)を読み出し、候補位置ごとに当該候補位置を基準に設定した部分領域の重みの和を求める。
続いて評価値算出手段514bは、候補位置ごとに、各部分領域の重みを全部分領域の重みの和で除して、当該部分領域の重み係数を算出する。すなわち各候補位置における重み係数の和は1となるように正規化される。
このようにして評価値算出手段514bは、部分領域ごとに当該部分領域における密度が低いほど高く当該部分領域における密度が高いほど低い重み係数を設定する。
For this purpose, the evaluation value calculation means 514b refers to the density distribution and totals the estimated density in each partial area, and determines the highest estimated density in each partial area as the density of the partial area. However, the background class is counted as a low density class.
Next, the evaluation value calculation unit 514b reads the weight (ratio of weighting factors) corresponding to the density of each partial region from the weight storage unit 412b, and sums the partial region weights set based on the candidate position for each candidate position. Ask for.
Subsequently, for each candidate position, the evaluation value calculation means 514b divides the weight of each partial area by the sum of the weights of all partial areas and calculates the weight coefficient of the partial area. That is, the sum of the weighting coefficients at each candidate position is normalized so as to be 1.
In this way, the evaluation value calculation unit 514b sets a weighting factor that is higher as the density in the partial area is lower for each partial area and lower as the density in the partial area is higher.

また、評価値算出手段514bは、候補位置ごとに、候補位置を基準に設定した各部分領域の部分評価値を当該部分領域の重み係数にて重み付けて総和して統合評価値を算出する。   Further, for each candidate position, the evaluation value calculation unit 514b calculates an integrated evaluation value by weighting and summing the partial evaluation values of each partial area set with reference to the candidate position with the weighting coefficient of the partial area.

つまり、左上部識別器による部分スコアをSUL、右上部識別器による部分スコアをSUR、左中部識別器による部分スコアをSML、右中部識別器による部分スコアをSMR、左下部識別器による部分スコアをSLL、右下部識別器による部分スコアをSLRとし、左上部の重み係数をWUL、右上部の重み係数をWUR、左中部の重み係数をWML、右中部の重み係数をWMR、左下部の重み係数をWLL、右下部の重み係数をWLRとすると、評価値算出手段514bは、次のようにして統合スコアを算出する。 That is, the partial score by the upper left classifier is S UL , the partial score by the upper right classifier is S UR , the partial score by the left middle classifier is S ML , the partial score by the right middle classifier is S MR , and the lower left classifier S LL , the partial score by the lower right discriminator as S LR , the upper left weighting factor is W UL , the upper right weighting factor is W UR , the left middle weighting factor is W ML , and the right middle weight is Assuming that the coefficient is W MR , the lower left weight coefficient is W LL , and the lower right weight coefficient is W LR , the evaluation value calculation means 514 b calculates the integrated score as follows.

評価値算出手段514bは、注目している候補位置の密度が低密度であれば次式によって当該候補位置の統合スコアを算出する。
統合スコア=WULUL+WURUR+WMLML+WMRMR
+WLLLL+WLRLR (3)
また、評価値算出手段514bは、注目している候補位置の密度が中密度であれば次式によって当該候補位置の統合スコアを算出する。
統合スコア=WULUL+WURUR+WMLML+WMRMR (4)
また、評価値算出手段514bは、注目している候補位置の密度が高密度であれば次式によって当該候補位置の統合スコアを算出する。
統合スコア=WULUL+WURUR (5)
The evaluation value calculation unit 514b calculates an integrated score of the candidate position according to the following equation if the density of the candidate position of interest is low.
Integrated score = W UL S UL + W UR S UR + W ML S ML + W MR S MR
+ W LL S LL + W LR S LR (3)
Moreover, if the density of the candidate position of interest is medium density, the evaluation value calculation unit 514b calculates the integrated score of the candidate position by the following formula.
Integrated score = W UL S UL + W UR S UR + W ML S ML + W MR S MR (4)
Further, if the density of the candidate position of interest is high, the evaluation value calculation unit 514b calculates an integrated score of the candidate position by the following formula.
Integrated score = W UL S UL + W UR S UR (5)

図14は、図7で例示した密度分布が得られている場合に、図7で例示した各候補位置について評価値算出手段514bが統合スコアを算出する様子を模式的に示した図である。画像830は、これらの候補位置のうち密度が低密度である3つの候補位置について、各部分と重み係数の関係を示している。画像831は、密度が中密度である3つの候補位置について、各部分と重み係数の関係を示している。画像832は、密度が高密度である2つの候補位置について、各部分と重み係数の関係を示している。   FIG. 14 is a diagram schematically illustrating how the evaluation value calculation unit 514b calculates an integrated score for each candidate position illustrated in FIG. 7 when the density distribution illustrated in FIG. 7 is obtained. The image 830 shows the relationship between each part and the weighting coefficient for three candidate positions having a low density among these candidate positions. The image 831 shows the relationship between each part and the weighting coefficient for three candidate positions having a medium density. The image 832 shows the relationship between each part and the weighting coefficient for two candidate positions having a high density.

例えば、候補位置840は、その密度が低密度であるため候補位置840を基準に6つの部分領域が設定され、6つの部分領域の密度がいずれも低密度であるため各部分領域の重み係数比率は10、その和は60となる。よって、重み係数はWUL=WUR=WML=WMR=WLL=WLR=10/60となり、これらの重み係数と各部分の部分スコアを式(3)に代入して統合スコアが算出される。
また例えば、候補位置841は、その密度が中密度であるため候補位置841を基準に4つの部分領域が設定され、4つの部分領域のうちの上2つは密度が中密度であるため重み係数比率は7、下2つは密度が低密度であるため重み係数比率は10、その和は34となる。よって、重み係数はWUL=WUR=7/34、WML=WMR=10/34となり、これらの重み係数と各部分の部分スコアを式(4)に代入して統合スコアが算出される。
また例えば、候補位置842は、その密度が高密度であるため候補位置842を基準に2つの部分領域が設定され、2つの部分領域の密度がいずれも高密度であるため各部分領域の重み係数比率は5、その和は10となる。よって、重み係数はWUL=WUR=5/10となり、これらの重み係数と各部分の部分スコアを式(5)に代入して統合スコアが算出される。
他の候補位置についても同様にして統合スコアが算出される。
For example, since the candidate position 840 has a low density, six partial areas are set on the basis of the candidate position 840, and the density of each of the six partial areas is low. Is 10 and the sum is 60. Therefore, the weighting coefficient becomes W UL = W UR = W ML = W MR = W LL = W LR = 10/60 , and these weighting coefficients and the partial scores of the respective parts are substituted into the expression (3) to obtain the integrated score. Calculated.
Further, for example, the candidate position 841 has a medium density, and therefore, four partial areas are set based on the candidate position 841. The upper two of the four partial areas have a medium density, and thus the weighting factor. The ratio is 7, and the lower two are low in density, so the weight coefficient ratio is 10, and the sum is 34. Therefore, the weighting factors are W UL = W UR = 7/34 , W ML = W MR = 10/34, and the integrated score is calculated by substituting these weighting factors and the partial scores of each part into the equation (4). The
Further, for example, since the candidate position 842 has a high density, two partial areas are set based on the candidate position 842, and the density of each of the two partial areas is high because the density of the two partial areas is high. The ratio is 5 and the sum is 10. Therefore, the weighting coefficient becomes W UL = W UR = 5/10, and the integrated score is calculated by substituting these weighting coefficients and the partial scores of the respective parts into the equation (5).
The integrated score is similarly calculated for other candidate positions.

そして、評価値算出手段514bは、候補位置ごとに、候補位置、候補位置の密度、統合スコアおよび使用した部分領域の和領域(統合窓)を対応付けた情報を位置決定手段517bに出力する。   Then, the evaluation value calculation unit 514b outputs, for each candidate position, information that associates the candidate position, the density of the candidate position, the integrated score, and the sum area (integrated window) of the used partial areas to the position determining unit 517b.

位置決定手段517bは、評価値算出手段514bから入力された情報を参照し、予め定めた判定基準を満たす統合評価値が算出された候補位置を物体の位置と決定する。   The position determining unit 517b refers to the information input from the evaluation value calculating unit 514b, and determines a candidate position where an integrated evaluation value that satisfies a predetermined criterion is calculated as the position of the object.

具体的には、位置決定手段517bは、統合スコアが予め定めた閾値(例えば0)以上である候補位置を抽出し、抽出した候補位置のうち対応する密度が同一であり且つ互いに近接する複数の候補位置(統合窓同士の重複が予め定めた割合より大きな候補位置)を一つにまとめ、まとめた候補位置を人が撮影されている位置と決定する。   Specifically, the position determination unit 517b extracts candidate positions whose integrated score is equal to or greater than a predetermined threshold (for example, 0), and a plurality of adjacent candidate positions having the same density and being close to each other. Candidate positions (candidate positions where the overlap between integrated windows is larger than a predetermined ratio) are combined into one, and the combined candidate positions are determined as positions where a person is photographed.

この候補位置をまとめる処理は、実際に人が撮影されている位置に加えてその近傍においても同一人物に対して高い統合スコアが算出されることに対処するために行う。具体的には、例えば、位置決定手段517bは、候補位置の密度ごとに、閾値以上の統合スコアが算出された候補位置を統合スコアが高い順に順次注目位置に設定するとともに注目位置より統合スコアが低い候補位置を比較位置に設定する。そして、位置決定手段517bは、比較位置のうち当該比較位置の統合窓と注目位置の統合窓との重なりが予め定めた割合より大きい比較位置の情報を削除することで複数の候補位置を一つにまとめる。   The process of grouping the candidate positions is performed in order to cope with the fact that a high integrated score is calculated for the same person in the vicinity in addition to the position where the person is actually photographed. Specifically, for example, for each density of candidate positions, the position determination unit 517b sequentially sets candidate positions for which an integrated score equal to or greater than the threshold is calculated as the attention position in descending order of the integrated score, and the integrated score is higher than the attention position. A low candidate position is set as a comparison position. Then, the position determination unit 517b deletes one of the plurality of candidate positions by deleting information on the comparison position in which the overlap between the integrated window of the comparison position and the integrated window of the target position is larger than a predetermined ratio. To summarize.

そして、位置決定手段517bは、人が撮影されている位置と決定した候補位置を物体位置の情報として物体位置出力手段31に出力する。   Then, the position determination unit 517b outputs the position where the person is photographed and the determined candidate position to the object position output unit 31 as object position information.

<第二の実施形態に係る画像監視装置1の動作>
以下、図9および図15を参照し、第二の実施形態に係る画像監視装置1の動作を説明する。
<Operation of Image Monitoring Device 1 according to Second Embodiment>
Hereinafter, the operation of the image monitoring apparatus 1 according to the second embodiment will be described with reference to FIGS. 9 and 15.

画像監視装置1が動作を開始すると、第一の実施形態と同様に、撮影部2は順次撮影画像を送信し、画像処理部5は撮影画像を受信するたびに図9のフローチャートに従った動作を繰り返す。   When the image monitoring apparatus 1 starts its operation, as in the first embodiment, the image capturing unit 2 sequentially transmits captured images, and the image processing unit 5 operates in accordance with the flowchart of FIG. 9 every time it receives a captured image. repeat.

通信部3は画像取得手段30として動作し、撮影画像を受信して画像処理部5に出力する(ステップS1)。撮影画像を入力された画像処理部5は密度推定手段50として動作して記憶部4の密度推定器記憶手段40から密度推定器を読み出し、撮影画像を密度推定器にて走査することによって密度分布を推定する(ステップS2)。   The communication unit 3 operates as the image acquisition unit 30, receives a captured image, and outputs it to the image processing unit 5 (step S1). The image processing unit 5 to which the photographed image is input operates as the density estimating unit 50, reads the density estimator from the density estimator storage unit 40 of the storage unit 4, and scans the photographed image with the density estimator, thereby density distribution. Is estimated (step S2).

次に、画像処理部5は物体位置判定手段51として動作し、物体位置判定手段51は、画像取得手段30から撮影画像および密度推定手段50から密度分布を入力されて、密度分布に背景クラス以外の推定密度が含まれているか否かを確認する(ステップS3)。   Next, the image processing unit 5 operates as the object position determination unit 51. The object position determination unit 51 receives the captured image from the image acquisition unit 30 and the density distribution from the density estimation unit 50, and the density distribution is not a background class. It is confirmed whether or not the estimated density is included (step S3).

物体位置判定手段51は、背景クラス以外の推定密度が含まれている場合は(ステップS3にてYES)、撮影画像から個々の物体の位置を判定する処理を行い(ステップS4)、背景クラスのみの場合は(ステップS3にてNO)、ステップS4,S5の処理を省略する。   When the estimated density other than the background class is included (YES in step S3), the object position determination unit 51 performs a process of determining the position of each object from the captured image (step S4), and only the background class In the case of (NO in step S3), the processes in steps S4 and S5 are omitted.

図15のフローチャートを参照して、ステップS4の物体位置判定処理を説明する。単体特徴記憶手段41が部分識別器記憶手段411bおよび重み記憶手段412bとして動作し、物体位置判定手段51が候補位置設定手段511b、評価値算出手段514bおよび位置決定手段517bとして動作して、物体位置判定処理が実行される。   The object position determination process in step S4 will be described with reference to the flowchart in FIG. The single feature storage unit 41 operates as the partial classifier storage unit 411b and the weight storage unit 412b, and the object position determination unit 51 operates as the candidate position setting unit 511b, the evaluation value calculation unit 514b, and the position determination unit 517b. Judgment processing is executed.

候補位置設定手段511bは、撮影画像中の各画素の位置を順次候補位置に設定して評価値算出手段514bに入力し(ステップS200)、ステップS200〜S206のループ処理を制御する。   The candidate position setting unit 511b sequentially sets the position of each pixel in the captured image as a candidate position and inputs it to the evaluation value calculation unit 514b (step S200), and controls the loop processing of steps S200 to S206.

候補位置を入力された評価値算出手段514bは密度分布を参照して候補位置の密度を特定する(ステップS201)。すなわち評価値算出手段514bは候補位置に単独の人の上部1/3の形状に定められた窓を設定して当該窓内で最多の推定密度(ただし背景クラスは除く)を候補位置の密度として特定する。   The evaluation value calculation unit 514b that has received the candidate position specifies the density of the candidate position with reference to the density distribution (step S201). That is, the evaluation value calculating means 514b sets a window defined in the shape of the upper third of a single person at the candidate position, and uses the highest estimated density (except for the background class) in the window as the density of the candidate position. Identify.

候補位置の密度を特定した評価値算出手段514bは、部分識別器記憶手段411bから当該密度に応じた複数の部分識別器を読み出し、各部分識別器に対応する部分領域を設定して部分領域内の撮影画像から識別用特徴量をそれぞれ抽出し(ステップS202)、抽出した識別用特徴量を該当する部分識別器に入力して、それぞれの部分スコア(部分評価値)を算出する(ステップS203)。   The evaluation value calculation unit 514b that identifies the density of the candidate positions reads out a plurality of partial classifiers corresponding to the density from the partial classifier storage unit 411b, sets a partial area corresponding to each partial classifier, and sets the partial area in the partial area Are extracted from the captured images (step S202), and the extracted identification features are input to the corresponding partial classifiers to calculate respective partial scores (partial evaluation values) (step S203). .

部分評価値を算出した評価値算出手段514bは密度分布を参照して各部分領域の密度を特定する(ステップ204)。すなわち、評価値算出手段514bは各部分領域内で最多の推定密度(ただし背景クラスは低密度クラスとみなす)を当該部分領域の密度として特定する。   The evaluation value calculation means 514b that has calculated the partial evaluation value refers to the density distribution and specifies the density of each partial region (step 204). That is, the evaluation value calculation means 514b specifies the highest estimated density in each partial area (however, the background class is regarded as the low density class) as the density of the partial area.

各部分領域の密度を特定した評価値算出手段514bは、重み記憶手段412bから各部分領域の密度に応じた重み係数の比率を読み出し、各部分領域の重み係数の比率を全部分領域の重み係数の比率の和で除して当該部分領域の重み係数を算出し、算出した重み係数とステップS203で算出した部分評価値を積和することにより候補位置の統合評価値を算出する(ステップS205)。候補領域の密度が低密度の場合は式(3)、中密度の場合は式(4)、高密度の場合は式(5)に従って、積和することになる。   The evaluation value calculation unit 514b that identifies the density of each partial region reads the weighting factor ratio according to the density of each partial region from the weight storage unit 412b, and calculates the weighting factor ratio of each partial region as the weighting factor of all partial regions. The weight coefficient of the partial area is calculated by dividing by the sum of the ratios, and the integrated evaluation value of the candidate position is calculated by multiplying the calculated weight coefficient by the partial evaluation value calculated in step S203 (step S205). . When the density of the candidate area is low, the product is summed according to Expression (3), when the density is medium, according to Expression (4), and when the density is high, according to Expression (5).

そして、評価値算出手段514bは、候補位置と、部分領域の和領域の窓(統合窓)と、候補位置の密度と、統合評価値とを対応付けて記録するとともに、撮影画像の全ての画素の位置を候補位置に設定し終えたか否かを確認し(ステップS206)、未設定の画素がある場合は(ステップS206にてNO)、処理をステップS200に戻して次の画素の位置を処理する。   The evaluation value calculating unit 514b records the candidate position, the sum area window (integrated window) of the partial areas, the density of the candidate position, and the integrated evaluation value in association with each other, and records all the pixels of the captured image. Is determined as a candidate position (step S206). If there is an unset pixel (NO in step S206), the process returns to step S200 to process the position of the next pixel. To do.

他方、全ての画素の位置を候補位置に設定し終えた場合(ステップS206にてYES)、位置決定手段517bは、ステップS206で記録された候補位置と統合窓と候補位置の密度と統合評価値の組の中から統合評価値が閾値未満の組を削除し(ステップS207)、さらに、削除されずに残った組について、候補位置の密度ごとに、互いの統合窓が予め定めた割合よりも大きく重複している組を同一人物のものとして一つの組にまとめる(ステップS208)。そして位置決定手段517bはまとめた後の各組の候補位置を撮影画像に撮影されている個々の人の位置(物体位置)と判定する。   On the other hand, when the positions of all the pixels have been set as the candidate positions (YES in step S206), position determination means 517b determines the candidate position, the integrated window, the density of candidate positions, and the integrated evaluation value recorded in step S206. The group whose integrated evaluation value is less than the threshold value is deleted from the group of () (step S207), and for each group that remains without being deleted, the integration window of each other is higher than a predetermined ratio for each density of candidate positions. Large overlapping sets are grouped into one set as those of the same person (step S208). Then, the position determination unit 517b determines each set of candidate positions after being collected as the position (object position) of each person photographed in the photographed image.

再び図9を参照して説明を続ける。物体位置判定手段51はステップS4にて判定した物体位置の情報を通信部3に出力し(ステップS5)、通信部3は物体位置出力手段31として動作して物体位置の情報を表示部6に送信する。   The description will be continued with reference to FIG. 9 again. The object position determination unit 51 outputs the information on the object position determined in step S4 to the communication unit 3 (step S5), and the communication unit 3 operates as the object position output unit 31 to display the object position information on the display unit 6. Send.

以上の処理を終えると、処理はステップS1に戻され、次の撮影画像に対する処理が行われる。   When the above process is completed, the process returns to step S1, and the process for the next captured image is performed.

<変形例>
(1)上記各実施形態およびその変形例においては、検出対象の物体を人とする例を示したが、これに限らず、検出対象の物体を車両、牛や羊等の動物等とすることもできる。
<Modification>
(1) In each of the above-described embodiments and modifications thereof, an example in which the object to be detected is a person has been shown. However, the present invention is not limited thereto, and the object to be detected is a vehicle, an animal such as a cow or a sheep, or the like. You can also.

(2)上記各実施形態およびその各変形例においては物体を高さ方向に3分割し幅方向に2分割した部分を単位として部分領域を設定する例を示したが、分け方はこれに限らない。検出対象や撮影する監視空間の特性、採用する特徴量や評価値の種類などの違いに応じ、それぞれに適した別の比率で分けた部分領域とすることができる。またオーバーラップさせて部分領域を設定してもよい。   (2) In each of the above-described embodiments and modifications thereof, an example is shown in which a partial region is set with a unit obtained by dividing the object into three parts in the height direction and two parts in the width direction. Absent. Depending on the difference in the characteristics of the detection target, the monitoring space to be photographed, the feature amount to be used, the type of the evaluation value, and the like, the partial areas can be divided at different ratios suitable for each. Moreover, you may overlap and set a partial area | region.

(3)上記各実施形態およびその各変形例において示した重みは一例であり、検出対象や撮影する監視空間の特性、採用する特徴量や評価値の種類などの違いに応じ、それぞれに適した別の値とすることができる。   (3) The weights shown in the above embodiments and the modifications thereof are examples, and are suitable for each according to the difference in the characteristics of the detection target, the monitoring space to be photographed, the feature amount to be used, the type of evaluation value, and the like. It can be another value.

(4)上記各実施形態およびその各変形例においては、多クラスSVM法にて学習した密度推定器を例示したが、多クラスSVM法に代えて、決定木型のランダムフォレスト法、多クラスのアダブースト(AdaBoost)法または多クラスロジスティック回帰法などにて学習した密度推定器など種々の密度推定器とすることができる。
或いは識別型のCNN(Convolutional Neural Network)を用いた密度推定器とすることもできる。
(4) In each of the above-described embodiments and modifications thereof, the density estimator learned by the multi-class SVM method has been exemplified, but instead of the multi-class SVM method, a decision tree type random forest method, a multi-class Various density estimators such as a density estimator learned by the AdaBoost method or the multi-class logistic regression method can be used.
Alternatively, a density estimator using a discriminating CNN (Convolutional Neural Network) may be used.

(5)上記各実施形態およびその各変形例においては、密度推定器が推定する背景以外の密度のクラスを3クラスとしたが、より細かくクラスを分けてもよい。
その場合、3段階の重みに代えて、クラス分けに対応したより細かい段階の重みとし、クラスと重みを対応付けて単体特徴記憶手段41に記憶させておくことができる。或いは、クラスと3段階の重みを多対一で対応付けて単体特徴記憶手段41に記憶させておくこともできる。
(5) In each of the above-described embodiments and modifications thereof, the class of density other than the background estimated by the density estimator is set to three classes, but the class may be divided more finely.
In this case, instead of the three-stage weights, finer-stage weights corresponding to the classification can be used, and the classes and the weights can be associated with each other and stored in the single feature storage unit 41. Alternatively, classes and three-stage weights can be stored in the single feature storage unit 41 in a many-to-one correspondence.

(6)上記各実施形態およびその各変形例においては、多クラスに分類する密度推定器を例示したがこれに代えて、特徴量から密度の値(推定密度)を回帰する回帰型の密度推定器とすることもできる。すなわち、リッジ回帰法、サポートベクターリグレッション法、回帰木型のランダムフォレスト法またはガウス過程回帰(Gaussian Process Regression)などによって、特徴量から推定密度を求めるための回帰関数のパラメータを学習した密度推定器とすることができる。
或いは回帰型のCNNを用いた密度推定器とすることもできる。
これらの場合、密度クラスの値の代わりに連続値で出力される推定密度の値域を、部分モデルおよび重み、または部分識別器および重みと対応付けて単体特徴記憶手段41に記憶させておく。またこれらの場合、部分領域の密度は部分領域内で最多の推定密度とする以外にも、部分領域内の推定密度の平均値または中央値などとすることもできる。
(6) In each of the above-described embodiments and modifications thereof, a density estimator that classifies into multiple classes is illustrated, but instead of this, a regression type density estimation that regresses a density value (estimated density) from a feature quantity It can also be a container. That is, a density estimator that has learned the parameters of the regression function for obtaining the estimated density from the features by ridge regression method, support vector regression method, regression tree-type random forest method or Gaussian Process Regression, etc. can do.
Alternatively, a density estimator using a regression type CNN may be used.
In these cases, the estimated density range output as a continuous value instead of the density class value is stored in the single feature storage unit 41 in association with the partial model and weight, or the partial classifier and weight. In these cases, the density of the partial area may be the average value or the median value of the estimated densities in the partial area, in addition to the highest estimated density in the partial area.

(7)上記各実施形態およびその各変形例においては、密度推定器が学習する特徴量および推定用特徴量としてGLCM特徴を例示したが、これらはGLCM特徴に代えて、局所二値パターン(Local Binary Pattern:LBP)特徴量、ハールライク(Haar-like)特徴量、HOG特徴量、輝度パターンなどの種々の特徴量とすることができ、またはGLCM特徴とこれらのうちの複数を組み合わせた特徴量とすることもできる。   (7) In each of the above-described embodiments and modifications thereof, the GLCM feature is exemplified as the feature amount learned by the density estimator and the estimation feature amount. However, instead of the GLCM feature, the local binary pattern (Local Binary Pattern (LBP) feature value, Haar-like feature value, HOG feature value, luminance pattern, and other various feature values, or a combination of GLCM features and a plurality of them You can also

(8)上記各実施形態およびその各変形例においては、密度推定手段50および物体位置判定手段51が1画素間隔で走査して処理を行う例を示したが、これらの走査を2画素以上の間隔を空けて行うことも可能である。   (8) In each of the above-described embodiments and modifications thereof, an example is shown in which the density estimation unit 50 and the object position determination unit 51 scan and process at intervals of one pixel. It is also possible to carry out at intervals.

(9)上記各実施形態およびその各変形例においては、候補位置を推定密度が低密度、中密度または高密度の領域内から選んで設定する例を示したが、配置生成手段510aおよび候補位置設定手段511bのそれぞれは、変化領域内に限定して候補位置を設定することもできる。その場合、記憶部4は監視空間の背景画像を記憶する背景画像記憶手段(不図示)を備え、画像処理部5は、撮影画像と背景画像との差分処理を行って差分値が所定の差分閾値以上である画素の集まりを変化領域として抽出する、または撮影画像と背景画像との相関処理を行って相関値が所定の相関閾値以下である画素の集まりを変化領域として抽出する変化領域抽出手段(不図示)を備え、配置生成手段510aおよび候補位置設定手段511bのそれぞれは、変化領域抽出手段が抽出した変化領域を参照して候補位置を設定する。
なお、候補位置を設定する領域を限定する場合、配置生成手段510aは限定した領域の大きさに応じて配置数の上限個数を変更することができる。
このような候補位置を設定する領域の限定によって、撮影画像とモデル画像の偶発的な類似または背景に対する高い識別スコアの偶発的な算出を防止でき、物体位置の誤検出を低減できる。
(9) In each of the above-described embodiments and the modifications thereof, an example is shown in which candidate positions are selected and set from an area with a low, medium, or high estimated density. Each of the setting means 511b can also set candidate positions limited to the change region. In that case, the storage unit 4 includes background image storage means (not shown) for storing the background image of the monitoring space, and the image processing unit 5 performs a difference process between the captured image and the background image, and the difference value is a predetermined difference. A change area extraction unit that extracts a group of pixels that are equal to or greater than a threshold value as a change area, or performs a correlation process between a captured image and a background image to extract a group of pixels that have a correlation value equal to or less than a predetermined correlation threshold as a change area (Not shown), each of the arrangement generation means 510a and the candidate position setting means 511b sets a candidate position with reference to the change area extracted by the change area extraction means.
Note that, when the area where the candidate position is set is limited, the arrangement generation unit 510a can change the upper limit of the arrangement number according to the size of the limited area.
By limiting the region where the candidate positions are set, accidental similarity between the captured image and the model image or accidental calculation of a high identification score for the background can be prevented, and erroneous detection of the object position can be reduced.

(10)上記第一の実施形態とその各変形例においては、配置生成手段510aが反復の都度ランダムに配置を生成する例を示したが、反復の2回目以降に一回前の候補位置から微小にずらした候補位置に更新することで配置を生成してもよいし、反復の2回目以降に一回前の配置に対する類似度を参照してMCMC(Markov chain Monte Carlo)法により確率的に候補位置を探索する方法や山登り法により候補位置を逐次改善することで配置を生成してもよい。   (10) In the first embodiment and the modifications thereof, the example has been shown in which the arrangement generation unit 510a randomly generates an arrangement for each iteration. However, from the candidate position one time before the second iteration, The arrangement may be generated by updating to a slightly shifted candidate position, or the MCMC (Markov chain Monte Carlo) method is used to determine the similarity to the previous arrangement after the second iteration. The arrangement may be generated by sequentially improving the candidate positions by a method for searching for candidate positions or a hill-climbing method.

(11)上記各実施形態およびその各変形例においては、注目している候補位置に人の上部1/3の形状に定められたモデルの投影領域または該形状に定められた窓を設定して当該領域内の推定密度を集計することによって、当該候補位置における推定密度を決定する例を示したが、処理量を削減するために当該領域に代えて候補位置の画素、候補位置の8近傍領域または16近傍領域などの小さな領域とすることもできる。或いは、確度を上げるために当該領域に代えて候補位置を代表位置とする単独の人の上部2/3の形状に定められたモデルの投影領域または該形状に定められた窓、または候補位置を代表位置とする単独の人の全身の形状に定められたモデルの投影領域または該形状に定められた窓などの大きな領域とすることもできる。   (11) In each of the above-described embodiments and modifications thereof, a projection area of a model defined in the shape of the upper third of the person or a window defined in the shape is set at the candidate position of interest. The example in which the estimated density at the candidate position is determined by aggregating the estimated density in the area has been shown. However, in order to reduce the processing amount, the pixel at the candidate position and the 8 neighboring areas at the candidate position are replaced with the area. Alternatively, it may be a small area such as the 16 neighborhood area. Alternatively, in order to improve the accuracy, a projection area of a model defined in the shape of the upper 2/3 of a single person with the candidate position as a representative position instead of the area, a window defined in the shape, or a candidate position It can also be a projection area of a model defined in the shape of the whole body of a single person as a representative position or a large area such as a window defined in the shape.

(12)第二の実施形態およびその変形例においては、線形SVM法により学習された部分識別器を例示したが、線形SVM法に代えてアダブースト(AdaBoost)法など、従来知られた各種の学習法を用いて学習した部分識別器とすることもできる。また、識別器の代わりにパターンマッチング器を用いることもでき、その場合の部分スコアは人の学習用画像から抽出した特徴量の平均パターンと入力画像の特徴量との内積などとなり、評価値算出関数は当該スコアを出力値とし撮影画像の特徴量を入力値とする関数とすることができる。また部分識別器として識別型のCNNを用いても良い。   (12) In the second embodiment and its modification, the partial classifier learned by the linear SVM method is exemplified, but various types of conventionally known learning such as the AdaBoost method instead of the linear SVM method are exemplified. It can also be a partial classifier learned by using the method. In addition, a pattern matching device can be used instead of the discriminator, and the partial score in this case is the inner product of the average pattern of feature values extracted from the human learning image and the feature value of the input image, etc. The function can be a function having the score as an output value and a feature amount of the photographed image as an input value. Further, an identification type CNN may be used as the partial classifier.

(13)第二の実施形態およびその各変形例においては、部分識別器が学習および識別に用いる特徴量としてHOG特徴量を例示したが、これらはHOG特徴量に代えて、局所二値パターン特徴量、ハールライク特徴量、輝度パターンなどの種々の特徴量とすることができ、またはHOG特徴量とこれらのうちの複数を組み合わせた特徴量とすることもできる。   (13) In the second embodiment and the modifications thereof, the HOG feature amount is exemplified as the feature amount used by the partial classifier for learning and identification. However, these are local binary pattern features instead of the HOG feature amount. Various feature amounts such as an amount, a Haar-like feature amount, and a luminance pattern can be used, or a HOG feature amount and a feature amount obtained by combining a plurality of these can be used.

(14)第二の実施形態およびその各変形例においては、評価値算出手段514bが候補位置ごとに重みの和が1となるように正規化する例を示したが、さらに水平方向(左右方向)の重みの和が1となるように正規化してもよい。   (14) In the second embodiment and its modifications, the evaluation value calculation unit 514b normalizes the candidate so that the sum of the weights is 1 for each candidate position. ) May be normalized so that the sum of the weights is 1.

(15)第二の実施形態およびその各変形例においては、物体の部分を重視する度合いを重みによって切り替える例を示したが、部分評価値に対する閾値(部分閾値)を切り替えることもできる。その場合、例えば、単体特徴記憶手段41は密度が低いほど低く密度が高いほど高く予め定められた部分閾値を各密度に対応づけて記憶し、評価値算出手段514bは部分評価値が部分閾値以上である部分領域の個数の割合を統合評価値として算出する。そして、位置決定手段517bは統合評価値が予め定めた閾値(例えば50%)以上である候補位置を物体位置と判定する。   (15) In the second embodiment and the modifications thereof, the example in which the degree of emphasis on the object portion is switched by the weight is shown, but the threshold value (partial threshold value) for the partial evaluation value can also be switched. In that case, for example, the single feature storage means 41 stores a predetermined partial threshold value that is higher as the density is lower and higher as the density is higher, in association with each density. The ratio of the number of partial areas is calculated as an integrated evaluation value. Then, the position determination unit 517b determines a candidate position whose integrated evaluation value is equal to or greater than a predetermined threshold (for example, 50%) as an object position.

以上の各実施形態およびその変形例によれば、物体検出装置は、候補位置および部分領域ごとの密度に応じ、当該密度により物体に生じ得る隠蔽状態に適した部分の特徴および重視する度合いを切り替えて個々の物体の位置を判定するので、混雑状態の変化に伴う物体の隠蔽状態の変化に適応した精度の高い物体検出が可能となる。   According to each of the above embodiments and the modifications thereof, the object detection device switches the feature of the part suitable for the concealment state that can occur in the object and the degree of emphasis according to the density for each candidate position and partial region. Therefore, it is possible to detect an object with high accuracy adapted to the change in the concealment state of the object accompanying the change in the congestion state.

またそのうちの第一の実施形態およびその変形例に係る物体検出装置は、物体の各部分の画像特徴を表す部分モデルおよび部分モデルの撮影画像に対する部分評価値を評価する際に重視する度合いを密度に応じて切り替えることによって混雑状態の変化に伴う物体の隠蔽状態の変化に適応した精度の高い物体検出を可能とする。   In addition, the object detection device according to the first embodiment and the modification thereof has a density that emphasizes a partial model representing an image feature of each part of the object and a partial evaluation value for a captured image of the partial model. By switching according to the above, it is possible to detect the object with high accuracy adapted to the change in the concealment state of the object accompanying the change in the congestion state.

またそのうちの第二の実施形態およびその変形例に係る物体検出装置は、物体の各部分の画像特徴を学習した部分識別器および部分識別器による部分ごとの部分評価値を総和する際に重視する度合いを密度に応じて切り替えることによって混雑状態の変化に伴う物体の隠蔽状態の変化に適応した精度の高い物体検出を可能とする。
In addition, the object detection device according to the second embodiment and the modified example of the second embodiment emphasizes the partial discriminator that learned the image feature of each part of the object and the sum of the partial evaluation values for each part by the partial discriminator. By switching the degree according to the density, it is possible to detect the object with high accuracy adapted to the change in the concealment state of the object accompanying the change in the congestion state.

1・・・画像監視装置
2・・・撮影部
3・・・通信部
30・・・画像取得手段
31・・・物体位置出力手段
4・・・記憶部
40・・・密度推定器記憶手段
41・・・単体特徴記憶手段
410a・・・物体モデル記憶手段
411b・・・部分識別器記憶手段
412a、412b・・・重み記憶手段
5・・・画像処理部
50・・・密度推定手段
51・・・物体位置判定手段
510a・・・配置生成手段
511b・・・候補位置設定手段
512a・・・モデル画像生成手段
514a、514b・・・評価値算出手段
516a・・・最適配置決定手段
517b・・・位置決定手段
6・・・表示部

DESCRIPTION OF SYMBOLS 1 ... Image monitoring apparatus 2 ... Imaging | photography part 3 ... Communication part 30 ... Image acquisition means 31 ... Object position output means 4 ... Memory | storage part 40 ... Density estimator memory | storage means 41 ... Single feature storage means 410a ... Object model storage means 411b ... Partial identifier storage means 412a, 412b ... Weight storage means 5 ... Image processing section 50 ... Density estimation means 51 ... Object position determination means 510a ... arrangement generation means 511b ... candidate position setting means 512a ... model image generation means 514a, 514b ... evaluation value calculation means 516a ... optimal arrangement determination means 517b ... Position determining means 6 ... display section

Claims (5)

所定の物体による混雑が生じ得る空間が撮影された撮影画像から個々の前記物体を検出する物体検出装置であって、
所定の密度ごとに当該密度にて前記物体が存在する空間を撮影した密度画像それぞれの画像特徴を学習した密度推定器を用いて、前記撮影画像に撮影された前記物体の前記密度の分布を推定する密度推定手段と、
前記撮影画像内に個々の前記物体が存在し得る候補位置を設定するとともに前記候補位置を基準として前記撮影画像内に前記物体を構成する複数の部分のそれぞれと対応する部分領域を設定して、前記部分領域ごとに当該部分領域と対応する部分の画像特徴が現れている度合いを表す部分評価値を算出し、前記候補位置を基準に設定した複数の前記部分領域の前記部分評価値を当該部分領域の前記密度が低いほど重視して統合した統合評価値が所定の判定基準を満たす候補位置を前記物体の位置と判定する物体位置判定手段と、
を備えたことを特徴とする物体検出装置。
An object detection device for detecting individual objects from a captured image in which a space in which congestion due to a predetermined object may occur is captured,
Estimate the distribution of the density of the object imaged in the captured image using a density estimator that learns the image characteristics of each density image captured in the space where the object exists at the density for each predetermined density Density estimation means to perform,
A candidate position where each of the objects can exist in the captured image is set, and a partial region corresponding to each of a plurality of parts constituting the object is set in the captured image based on the candidate position, For each partial area, a partial evaluation value representing the degree of appearance of the image feature of the part corresponding to the partial area is calculated, and the partial evaluation values of the partial areas set on the basis of the candidate positions are used as the partial area. An object position determination means for determining, as the position of the object, a candidate position that satisfies a predetermined determination criterion by integrating and evaluating the integrated evaluation value as the density of the region is lower;
An object detection apparatus comprising:
前記物体位置判定手段は、前記部分領域ごとに当該部分領域における前記密度が低いほど高く当該部分領域における前記密度が高いほど低い重み係数を設定し、前記候補位置を基準に設定した複数の前記部分領域の前記部分評価値を当該部分領域の前記重み係数にて重み付けて総和して前記統合評価値を算出する、請求項1に記載の物体検出装置。   The object position determination unit sets a weighting factor that is higher as the density in the partial area is lower for each partial area and lower as the density in the partial area is higher, and the plurality of the parts that are set based on the candidate position The object detection apparatus according to claim 1, wherein the integrated evaluation value is calculated by weighting and summing the partial evaluation values of a region with the weighting coefficient of the partial region. 前記物体位置判定手段は、前記候補位置における前記密度が高いほど前記物体を構成する前記部分のうちの少ない部分に対応する前記部分領域を設定する、請求項1または2に記載の物体検出装置。   The object detection apparatus according to claim 1, wherein the object position determination unit sets the partial region corresponding to a smaller part of the parts constituting the object as the density at the candidate position is higher. 前記物体位置判定手段は、
それぞれが1以上の前記候補位置を含む互いに異なる複数通りの配置を生成する配置生成手段と、
前記複数通りの配置それぞれについて、前記各候補位置を基準とする前記複数の部分のそれぞれと対応する前記部分領域に、当該部分を模した部分モデルを描画してモデル画像を生成するモデル画像生成手段と、
前記複数通りの配置の前記モデル画像それぞれについて、前記部分領域ごとに前記部分モデルの前記撮影画像に対する類似の度合いを表す前記部分評価値を算出し、複数の前記部分領域の前記部分評価値を統合して前記統合評価値を算出する評価値算出手段と、
前記統合評価値が最大の配置における前記候補位置を前記物体の位置と決定する最適配置決定手段と、
を含む請求項1〜3のいずれかひとつに記載の物体検出装置。
The object position determination means includes
Arrangement generation means for generating a plurality of different arrangements each including one or more candidate positions;
For each of the plurality of arrangements, model image generation means for generating a model image by drawing a partial model imitating the part in the partial region corresponding to each of the plurality of parts with each candidate position as a reference When,
For each of the model images in the plurality of arrangements, the partial evaluation value representing the degree of similarity of the partial model to the captured image is calculated for each partial region, and the partial evaluation values of the partial regions are integrated. Evaluation value calculating means for calculating the integrated evaluation value;
An optimum arrangement determining means for determining the candidate position as the position of the object in the arrangement having the maximum integrated evaluation value;
The object detection device according to any one of claims 1 to 3.
前記物体位置判定手段は、
前記撮影画像内に複数の前記候補位置を設定する候補位置設定手段と、
前記各候補位置を基準に設定した前記複数の部分のそれぞれと対応する前記部分領域の画像特徴を当該部分の画像特徴を学習した識別器に入力して当該部分領域の前記部分評価値を算出し、前記候補位置ごとに当該候補位置を基準に設定した複数の前記部分領域の前記部分評価値を統合して前記統合評価値を算出する評価値算出手段と、
前記判定基準を満たす前記統合評価値が算出された前記候補位置を前記物体の位置と決定する位置決定手段と、
を含む請求項1〜3のいずれかひとつに記載の物体検出装置。
The object position determination means includes
Candidate position setting means for setting a plurality of candidate positions in the captured image;
The partial evaluation value of the partial region is calculated by inputting the image feature of the partial region corresponding to each of the plurality of portions set based on the candidate positions to the classifier that has learned the image feature of the partial region. An evaluation value calculation means for calculating the integrated evaluation value by integrating the partial evaluation values of the plurality of partial areas set with reference to the candidate position for each candidate position;
Position determining means for determining, as the position of the object, the candidate position where the integrated evaluation value that satisfies the determination criterion is calculated;
The object detection device according to any one of claims 1 to 3.
JP2017086322A 2017-04-25 2017-04-25 Object detector Active JP6851246B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017086322A JP6851246B2 (en) 2017-04-25 2017-04-25 Object detector

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017086322A JP6851246B2 (en) 2017-04-25 2017-04-25 Object detector

Publications (2)

Publication Number Publication Date
JP2018185623A true JP2018185623A (en) 2018-11-22
JP6851246B2 JP6851246B2 (en) 2021-03-31

Family

ID=64356743

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017086322A Active JP6851246B2 (en) 2017-04-25 2017-04-25 Object detector

Country Status (1)

Country Link
JP (1) JP6851246B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020087463A (en) * 2018-11-28 2020-06-04 キヤノン株式会社 Detection device and method, image processing device and system, and storage medium
JP2021149687A (en) * 2020-03-19 2021-09-27 セコム株式会社 Device, method and program for object recognition

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011123742A (en) * 2009-12-11 2011-06-23 Secom Co Ltd Intruding object detector
JP2012159957A (en) * 2011-01-31 2012-08-23 Secom Co Ltd Moving object tracking device
JP2012159958A (en) * 2011-01-31 2012-08-23 Secom Co Ltd Moving object tracking device
JP2013077202A (en) * 2011-09-30 2013-04-25 Secom Co Ltd Moving object tracking device
JP2015121905A (en) * 2013-12-20 2015-07-02 セコム株式会社 Object detection device
JP2016095808A (en) * 2014-11-17 2016-05-26 キヤノン株式会社 Object detection device, object detection method, image recognition device and computer program
JP2016206795A (en) * 2015-04-17 2016-12-08 Kddi株式会社 Device, program, and method for tracking object using discriminator that learns by real space information
JP2017049676A (en) * 2015-08-31 2017-03-09 セコム株式会社 Posture discrimination device and object detection device
JP2017076181A (en) * 2015-10-13 2017-04-20 セコム株式会社 Tracking device

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011123742A (en) * 2009-12-11 2011-06-23 Secom Co Ltd Intruding object detector
JP2012159957A (en) * 2011-01-31 2012-08-23 Secom Co Ltd Moving object tracking device
JP2012159958A (en) * 2011-01-31 2012-08-23 Secom Co Ltd Moving object tracking device
JP2013077202A (en) * 2011-09-30 2013-04-25 Secom Co Ltd Moving object tracking device
JP2015121905A (en) * 2013-12-20 2015-07-02 セコム株式会社 Object detection device
JP2016095808A (en) * 2014-11-17 2016-05-26 キヤノン株式会社 Object detection device, object detection method, image recognition device and computer program
JP2016206795A (en) * 2015-04-17 2016-12-08 Kddi株式会社 Device, program, and method for tracking object using discriminator that learns by real space information
JP2017049676A (en) * 2015-08-31 2017-03-09 セコム株式会社 Posture discrimination device and object detection device
JP2017076181A (en) * 2015-10-13 2017-04-20 セコム株式会社 Tracking device

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020087463A (en) * 2018-11-28 2020-06-04 キヤノン株式会社 Detection device and method, image processing device and system, and storage medium
JP2021149687A (en) * 2020-03-19 2021-09-27 セコム株式会社 Device, method and program for object recognition
JP7488674B2 (en) 2020-03-19 2024-05-22 セコム株式会社 OBJECT RECOGNITION DEVICE, OBJECT RECOGNITION METHOD, AND OBJECT RECOGNITION PROGRAM

Also Published As

Publication number Publication date
JP6851246B2 (en) 2021-03-31

Similar Documents

Publication Publication Date Title
CN109076198B (en) Video-based object tracking occlusion detection system, method and equipment
KR100519782B1 (en) Method and apparatus for detecting people using a stereo camera
EP3029604B1 (en) Area information estimating device, area information estimating method, and air conditioning apparatus
KR100612858B1 (en) Method and apparatus for tracking people using robots
CN102214309B (en) Special human body recognition method based on head and shoulder model
CN101167086A (en) Human detection and tracking for security applications
US11544926B2 (en) Image processing apparatus, method of processing image, and storage medium
JP6624877B2 (en) Information processing apparatus, information processing method and program
CN107330371A (en) Acquisition methods, device and the storage device of the countenance of 3D facial models
KR20160136391A (en) Information processing apparatus and information processing method
JP7099809B2 (en) Image monitoring system
JP2017016593A (en) Image processing apparatus, image processing method, and program
CN106033601A (en) Method and apparatus for detecting abnormal situation
US20170053172A1 (en) Image processing apparatus, and image processing method
US20240104776A1 (en) Camera calibration apparatus, camera calibration method, and non-transitory computer readable medium storing camera calibration program
JP2018120283A (en) Information processing apparatus, information processing method, and program
JP2021118001A (en) Method for distinguishing human being in crowd in image
Loutas et al. Probabilistic multiple face detection and tracking using entropy measures
JP2018142173A (en) Image monitoring device
JP2021149687A (en) Device, method and program for object recognition
WO2012153868A1 (en) Information processing device, information processing method and information processing program
JP6851246B2 (en) Object detector
KR100543706B1 (en) Vision-based Person Detection Method and Apparatus
JP6920949B2 (en) Object distribution estimator
JP6893812B2 (en) Object detector

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191216

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210209

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210309

R150 Certificate of patent or registration of utility model

Ref document number: 6851246

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250