JP4061405B2 - 顔画像分類登録装置 - Google Patents
顔画像分類登録装置 Download PDFInfo
- Publication number
- JP4061405B2 JP4061405B2 JP2003166779A JP2003166779A JP4061405B2 JP 4061405 B2 JP4061405 B2 JP 4061405B2 JP 2003166779 A JP2003166779 A JP 2003166779A JP 2003166779 A JP2003166779 A JP 2003166779A JP 4061405 B2 JP4061405 B2 JP 4061405B2
- Authority
- JP
- Japan
- Prior art keywords
- face
- image data
- face image
- image
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Description
【発明の属する技術分野】
本発明は、室内空間など利用者がその位置を全く拘束されないような広い空間内において撮影された多数の画像データから、顔領域を抽出して顔画像認識のための顔画像データ辞書として登録にするに相応しい顔画像データを抽出して登録することのできる顔画像分類登録装置に関するものである。
【0002】
【従来の技術】
顔画像の認識技術は、ヒューマンインタフェースあるいはセキュリティシステムなど広い応用のために基礎的な要素技術であるため、従来から、様々な手法が開発されている。
【0003】
顔画像の認識処理は、顔領域の抽出、顔領域から特徴量を抽出した顔データ辞書の作成、顔データ辞書を用いる識別処理などの処理要素により行われる。顔画像識別の手法は、特徴から大きく分けると、顔の構造の特徴を利用する方法、顔のパターン(濃淡画像)をそのまま識別する方法、その両方を用いる方法に分類できる。
【0004】
顔の構造の特徴を利用する方法は、目、鼻、口などの特徴点の位置、形状、サイズをパラメータ化して特徴ベクトルを生成し、予め登録されている対象人物の特徴ベクトルとの類似度を計算して顔画像を認識する方法である。
【0005】
顔認識のためのパターンとして濃淡画像をそのまま識別する方法は、顔画像の濃淡画像から、顔画像部分を抽出した後、顔の位置や大きさの正規化を行い、予め登録されている顔画像データとのパターンの類似度に基づき顔画像を認識する方法である。
【0006】
その両方の特徴を用いた方法は、顔の構造的な特徴の関係を利用しながら、その顔の部分部分の画像をパターンとして利用する方法である。より多くの人の顔の識別を可能にするためには、この両方の特徴を利用する方法が用いられる。
【0007】
これらのどのような顔認識方法を用いる場合にも、顔認識の実際の適用に際しては、上記の顔認識処理に加えて使用者の登録、つまり、登録する使用者の顔画像認識のための顔データ辞書の生成が不可欠になってくる。顔認識は、特に、文字認識などと比較し、照明条件、顔向き、表情変化などの形状や輝度の変動が大きく、大量の学習サンプル画像が必要となる。また、顔は時間と共に変化する。このため、高い認識率を維持するためには顔データ辞書は一定時間ごとに更新される必要がある。
【0008】
高い認識率で顔認識を行うための顔画像の登録については、例えば、特許文献1に示されるように、入力された画像中から顔領域を抽出して自動的に顔データを辞書登録する顔画像登録装置が提案されている。また、後述するように、顔認識処理に関係するパターン認識技術、特徴データの自動分類に関する技術について、例えば、「高次局所自己相関特徴を用いた認識」の原理については、非特許文献1が参照できる。SOMを用いた自己組織化マップ作成の原理については、非特許文献2が参照できる。
【特許文献1】
特開平10−232934号公報
【非特許文献1】
大津展之、栗田多喜夫、関田巌著 「パターン認識 理論と応用」 朝倉書店 1996年7月10日初版発行
【非特許文献2】
T.コホネン著 「自己組織化マップ」 シュプリンガー・フェアラーク東京 1996年6月15日初版発行
【0009】
【発明が解決しようとする課題】
ところで、顔認識に関する従来の技術の多くは、例えば、パソコンを利用しているユーザの顔認識であったり、現金自動支払い機(ATM)を利用している人の顔認識であったり、インターホンの前に立っている人の顔認識であったり、あるいは玄関など一定の狭い空間を通過する人の顔認識であったり、など、何れも特定の場所の非常に狭い場所に座ったり、立ったり、通過することを前提としての顔認識であった。この場合には、その認識対象となる人は基本的に正面を向いていることを前提としており、よそ見をしていたり、明後日の方向を見ていたりすることを想定していない。
【0010】
したがって、そこでの顔画像の登録方法は、静止した正面向きの顔を登録する方法であったり、その正面向きの顔の中で認識に不向きな顔画像を取り除く方法であったりする。また、顔向きの角度別に辞書を作成する方法であっても、例えば、正面、左右15°、上下15°刻みの方向に登録者の顔を向けて撮影した画像から人手により顔の切り出し及び画像の選択を行っていた。
【0011】
さらに、これらを自動的に登録可能であるか否かを判定する手法も提案されているが、想定しているのは、前述のような狭い空間や、左右15度程度のずれのある顔画像であり、室内全体のようなより広い空間で撮影された顔画像から、顔認識するのに相応しい顔画像を選択することについては想定されていない。
【0012】
本発明は、このような問題点を解決するためになされたものであり、本発明の目的は、室内空間など利用者がその位置を全く拘束されないような広い空間内において撮影された多数の画像データから、正面に近い顔画像を選び出して登録することのできる顔画像分類登録装置を提供することにある。また、本発明の他の目的は、顔認識に利用する場合において利用者にあらゆる拘束をしないで顔認識のための顔画像データを登録することのできる顔画像分類登録装置を提供することにある。
【0013】
【課題を解決するための手段】
上記の目的を達成するため、本発明による顔画像分類登録装置は、第1の形態として、利用者がその位置を全く拘束されないような広い空間内において撮影された多数の画像データから、正面に近い顔画像の顔画像データを抽出して登録する顔画像分類登録装置であって、室内空間にいる人物をいろいろな方向から撮影して多数の画像データを取得する撮像手段と、前記撮像手段により撮影した画像データに対して基本的な画像処理を行いディジタル画像データとする画像処理手段と、前記ディジタル画像データから顔領域を抽出し、当該顔領域の画像データからエッジ特徴を抽出し、エッジ特徴の画像データから高次局所自己相関特徴を取得してベクトル化を行い、顔パターンの特徴として抽出する特徴抽出手段と、前記顔パターンの特徴の高次局所自己相関特徴のベクトル化されたデータを利用して、顔向き特徴による2次元マップを作成し、顔パターンを顔向きの特徴により分類する顔自動分類手段と、作成された顔向き特徴による2次元マップを登録する顔マップデータベースとを備えることを特徴とするものである。
【0014】
また、第2の態様として、本発明による顔画像分類登録装置においては、さらに、顔識別装置の顔画像データ辞書として利用する顔画像データを登録する顔画像データベースを備え、前記顔自動分類手段が、顔向き特徴による2次元マップの作成を、自己組織化マップの作成により行い、作成された自己組織化マップに基づいて、顔パターンの顔向き特徴による分類を、正面向きの顔画像、横向きの顔画像、それ以外の顔向きの顔画像に分類し、正面向きの顔画像に分類された顔パターンの顔画像データのみを前記顔画像データベースに登録することを特徴とするものである。
【0015】
また、これらの形態において、顔画像分類登録装置では、室内空間にいる人物の個人が特定される場合、正面向きの顔画像に分類された顔パターンの顔画像データを個人別の顔画像データ辞書の顔画像データとして顔画像データベースに登録するようにしてもよい。
【0016】
本発明の顔画像分類登録装置によれば、室内空間にいる人のいろいろな方向から得られた顔画像データから、顔領域を抽出し、顔領域の顔パターンの特徴を高次局所自己相関特徴のベクトルデータとして抽出し、得られた特徴から顔画像データを分類して、例えば、顔認識が可能な正面に近い顔画像群を抽出する。ここでは、顔画像データを自動的に分類するため、自己組織化マップを作成する。作成された自己組織化マップに基づき顔画像データが分類される。この場合の分類結果は、顔領域の顔パターンの特徴により自己組織化マップを作成しているので、顔領域の特徴から顔の向きに対応して分類されており、この分類結果を用いることで、顔向きごとの辞書、例えば、その正面に近い顔画像群から正面顔画像データ辞書を構成することが可能となる。この顔画像データ辞書を用いることにより、顔認識の識別性能を高めることができる。
【0017】
また、顔画像の分類結果から顔向きマップを作成すると、顔認識時には、その顔向きマップから、対象とする顔画像が認識するのに相応しい正面に近い顔画像であるかどうかを判断した後に、識別可能な顔画像の画像データを用いて識別することにより、その識別性能を高めるようにすることができる。
【0018】
【発明の実施の形態】
以下、本発明を実施する場合の一形態について、図面を参照して、具体的に説明する。図1は、本発明を実施する場合のシステム構成の第1の例を示す図であり、図2は、本発明を実施する場合のシステム構成の第2の例を示す図である。図3は顔自動分類装置の詳細な構成を説明するブロック図である。
【0019】
図1において、10a,10b,10c,…,10nはカメラ、11は画像処理装置、12は顔自動分類装置、13は顔識別装置、14は室内空間、15はユーザである。複数のカメラ10a,10b,10c,…,10nによって囲まれる広い室内空間14において、ユーザ15は室内空間14の中を自由に移動する。その際に、ユーザ15の顔画像は、複数のカメラ10a,10b,10c,…,10nによって、いろいろな方向から撮影される。複数のカメラ10a,10b,10c,…,10nにより、一定時間ごとに撮影されて得られた多数の顔画像データは、画像処理装置11に送出される。
【0020】
図1のシステム構成では、複数のカメラ10a,10b,10c,…,10nにより、ユーザ15の顔画像を様々な方向から撮影して、その顔画像データを画像処理装置11に送出するようにしているが、このカメラは複数台でも、単体であってもよく、カメラの視野に入って来たとき、そのユーザの顔を含む画像を、顔画像認識で必要とされる所定以上の解像度で撮影して得られた顔画像データを画像処理装置11に送出できるものであればよい。
【0021】
このため、カメラ10a,10b,10c,…,10nは、一般的な単体のカメラであったり、ステレオカメラであったりする。ステレオカメラ自体は既存のものを利用できる。例えば、ポイントグレイ社のデジクロップスやサーノフ研究所のアケーディアのようなものを用いることができる。
【0022】
画像処理装置11は各カメラ10a,10b,10c,…,10nからの顔画像データ(映像)を入力として、毎秒10枚〜30枚程度の画像処理を行い、そこから得られた顔画像を含む顔画像データを顔自動分類装置12に送出する。
【0023】
また、図1に示すシステム構成では、室内空間14を全て覆うように、複数のカメラ10a,10b,10c,…,10nが設けられたシステム構成を示しているが、例えば、図2に示すシステム構成例のように、顔画像を取得する対象となるユーザ15に対して、ディスプレイ、インターホン、パソコンなどの操作対象16の前に設置された1台のカメラ17を用いるようにしてもよい。
【0024】
この場合、1台のカメラ17のみをユーザ15の顔位置を撮影する向きに設置して、その1台のカメラ17から顔画像データを得るようにしてもよい。ユーザ15は、顔位置を固定することが要求されないので、操作対象16を自由に操作中のユーザ15は、顔がカメラ17によりその動きによって様々な方向から撮影されて顔画像データとして取得される。操作対象16の近傍に設置されたカメラ17から得られた顔画像データは、画像処理装置11に送出される。
【0025】
これは、例えば、現金自動支払い機(ATM)やインターホン、パソコン利用者など、1人のユーザのみを対象とする場合の実施例として好適である。この場合においても、ユーザ15がカメラ17の方を必ずしも見ていない場合を想定しており、ユーザ15の顔画像は、いろいろな方向から撮影された顔画像データとして画像処理装置11に送出される。基本的な仕組みは、図1におけるシステム構成例の場合と同様である。画像処理装置11は、得られた顔画像データに対して、シェーディング補正等の基本的な画像処理を行い、ディジタル画像データとして顔自動分類装置12に送出される。
【0026】
顔自動分類装置12は、図3に示すように、顔領域抽出部31、特徴抽出部32、顔自動分類部33、全体顔向き特徴データベース34、全顔マップデータベース35、個人顔マップデータベース36、個人正面付近顔データベース37から構成されている。
【0027】
顔領域抽出部31は、例えば、顔画像を含む顔画像データから顔領域(ユーザの顔部分のみ)を抽出する処理モジュールである。ここでは顔の色相などを用いた肌色領域を利用し、顔周辺部分のみを抽出する。この顔領域を抽出する手法に関しては、例えば、肌色領域だけでなく、目、鼻、口を利用する方法など数々の手法が、従来から提案されており、それらを利用するようにしても良い。
【0028】
特徴抽出部32は、その得られた顔部分のみの画像(顔領域の画像データ)から、顔の向きを判定するのに相応しい特徴を抽出する処理モジュールである。ここでは、例えば、エッジ特徴を抽出した後、そのエッジ画像から、高次局所自己相関特徴を取得してベクトル化を行い、顔パターンの特徴を抽出する。このベクトル化した特徴は、顔向きを判定できる特徴を有している。抽出した特徴の顔パターンは、全体顔向き特徴データベース34に保存される。
【0029】
顔自動分類部33は、特徴抽出部32で抽出した高次局所自己相関特徴のベクトルを利用して、顔の向き特徴による2次元マップを作成して自動分類する処理モジュールである。ここで作成された2次元マップは、全顔マップデータベース35、個人顔マップデータベース36に保存されて、後述する自動分類の処理が行われる。そして、最終的に分類された結果、各個人に対しては、個人顔マップデータベース36から判断して認識しやすい正面画像に近い顔データのみが個人正面付近顔画像データベース37に登録される。そして、顔認識を行う識別時には、入力された画像が認識可能な顔向きの顔画像であるかを全顔マップデータベース35から判断し、識別可能時のみ顔識別装置13にその顔特徴を送り、顔認識のための識別を行う。このとき個人正面付近顔画像データベース37に登録された正面顔画像に近い顔データが、顔画像データ辞書のデータとなる。この顔データは、取り出されて必要に応じて顔認識する場合に利用される。
【0030】
ここでの顔識別装置13は、顔自動分類部33における判断により識別可能となった顔画像データについてのみ識別を行う。顔識別装置13は、本発明の主要部ではないので、その説明を省略するが、構成については公知のものがそのまま利用できる。なお、その手法は、いろいろなものが既に提案されているので、それらを利用する。画像処理装置11から顔自動分類装置12を通過した顔画像データは、既に正面顔画像に近い顔パターンのみが出力され、顔識別装置13に入力されるので、顔画像データの顔パターンから必要とする特徴を抽出して利用すればよい。
【0031】
図4〜6は、この発明にかかる顔画像分類登録の処理の例を用途に対応してそれぞれに説明するフローチャートである。図4は、個人の顔を学習する場合の処理を説明するフローチャートである。図5は、全体の顔から顔分布マップを作成する場合の処理を説明するフローチャートである。また、図6は、実際に個人を識別する場合の処理を説明するフローチャートである。
【0032】
これらのフローチャートに係る処理は、主に図3により説明した顔自動分類装置12の処理モジュールにより行われるものであり、図3を部分的に詳細化したものとなっている。
【0033】
なお、図1のシステム構成および図2のシステム構成は、室内における実施例であるが、本発明はこの実施例に限定されるものではなく、例えば、室内空間を工場や公共の空間などに置き換えて、頭部領域を含む画像を利用するあらゆる場面にも適用できる。その場合においても、室内空間に出入りする全ての人は複数のカメラによって撮影され、この撮像出力は画像処理装置11に与えられる。画像処理装置11は、得られた頭部を含む画像を顔自動分類装置12に与える。
【0034】
図4を参照して、個人の顔を学習する場合について説明する。この場合、カメラにより撮影された顔画像データとして一定の画像群が与えられる。顔画像データとして登録する顔画像を撮影する場合、今まではカメラに対して静止し、カメラの方向を見たりすることが必須であったが、本発明による顔画像分類登録方法を利用する場合においては、頭部が撮影範囲に含まれていれば良い。そのかわりに一定枚数以上の画像群(例えば100枚以上)を撮影する。この画像群が画像処理装置11から与えられる(ステップ41)。
【0035】
与えられた画像群は、色情報などにより、顔領域のみを含む部分が取り出されて、それ以外の部分は黒色(R、G、Bの画素値が0)などの情報量をゼロにする処理が行われる(ステップ42)。この処理においては、あきらかに顔の領域が少ない画像(後ろ向きなど)は全体を黒色の画像にして完全に情報量をゼロとしておく。
【0036】
次に、この顔領域のみが表示された画像から、その部分のエッジ特徴を抽出する(ステップ43)。このエッジ特徴の画像から、高次局所自己相関特徴を使って35次元のベクトルを取得し、このベクトルを全体顔向き特徴データベース34に保存する処理を行う(ステップ44)。なお、ここでの高次局所自己相関特徴によるベクトル化の処理はついては、公知の処理方法を用いる。「高次局所自己相関特徴を用いた認識」の原理については、詳しくは、非特許文献1に記載されている。
【0037】
本発明においては、位置フリーである高次局所自己相関特徴を用いることにより、顔領域の厳密な正規化をする必要がなくなり、データ処理量を軽減できる。ただし、顔の構造(目、鼻、口など)に基づき顔領域の正規化を行えば、別途、その特徴を用いてベクトル化することもできる。
【0038】
また、本発明においては、撮影時に対象者を拘束しないため、いろいろな顔向き画像が得られており、これらの顔画像を処理対象としているが、ここでの顔画像そのものは、正面顔から横顔へと連続的に変化しており、顔から得られた特徴も連続的に変化している。したがって、その連続的に変化している画像群を2次元平面上に自動的に(教師なしで)配置するため、自己組織化マップによる顔マップを作成する(ステップ45)。
【0039】
ここでは、顔の自動分類を行うために自己組織化マップ(SOM)を用いる。SOMを用いた自己組織化マップ作成の原理の詳細については、非特許文献2に詳しく説明されているので、詳細な説明は省略するが、本発明の要部に関係して概略を説明すると、自己組織マップとは、Kohonenの学習則を用いた教師なし学習の一種であり、ある非線形な多次元の特徴量が与えられたとき、自己組織化マップはその特徴の分布を2次元のマップ上に連続的に表すことができる。したがって、本発明において、マップを利用して、顔画像データの分類を自動で行うようにしている。マップ上では、よく似た特徴が近くに集まるように表現されるので、この性質を利用して、顔画像データを顔向きごとに分類する。
【0040】
自己組織化マップは、出力ニューロンの集合によって構成される。それは次の式(数式1)により表される。
【数1】
ここで、各出力ニューロンは、n次元の重みベクトルm={m1,m2,…mn}として定義されている。学習ベクトルとして、Xがサンプルとして入力されたとき、全ての重みベクトルmに対してユークリッド距離の計算を行い、入力ベクトルに対して最も距離の近い出力ニューロンを勝者ニューロンmcとして決定する。
【0041】
自己組織化マップの学習は、周囲の出力ニューロン間の位置関係を考慮しながら行われていくという特徴がある。つまり、出力ニューロンへの学習は、勝者ニューロンmcだけに対して行われるのではなく、周囲の出力ニューロンに対しても同時に行われる。ある重みベクトルmiに対する自己組織化マップの学習則は次の式(数式2)により表される。
【数2】
このような式の自己組織化マップによる学習の様子は、模式的には図7に示されるようなものとなる。概略を説明すると、この式において、α(t)は、ある時間tにおける学習強度を示しており、hci(t)は、ある時間tにおける勝者ニューロンmcが近傍に対して影響を及ぼす範囲を示している。学習は、入力ベクトルを使って繰り返し行われ、学習の第一段階では、大きなα(t)、hci(t)を用いて大局的な学習が行われる。これらの値は学習を進めるにつれて減少していき、徐々に学習範囲を狭めながら局所的な微調整が行われる。
【0042】
このように、出力ニューロンの位置関係を維持しながら学習を行うことによって、入力データ空間における多次元特徴量は、その関係を保ったまま2次元平面に射影される。また、自己組織化マップ上において、隣接ニューロン間の類似度は、ニューロン間の距離によって表されている。したがって、この距離を用いてマップにおけるクラス分けを行うことにより、類似した特徴ごとに分類することができる。
【0043】
識別しようとする個人の全特徴を用いた自己組織化マップは、顔向きを2次元平面に配置した結果である。この結果を、個人顔マップデータベース36に保存する。
【0044】
このように、自己組織化マップを用いて行う分類処理を具体例で説明すると、図8は、2次元平面に分布された1人の配置結果を示しており、多くの点が集まっているB点には、特徴を取る際にゼロとされた点が集中している。さらに学習を続けると、図9に示すようになり、分類されていく様子がうかがえる。図9においては、マップ上には特徴の類似度がグレー階調によって表されている。色の黒い部分は隣接するニューロン間の距離が遠く、特徴が類似していないことを表している。
【0045】
このようにして得られたマップを構成するニューロン間の距離を用いてクラス分けを行い、顔画像データを自動分類するが、ここではk−meansクラスタリングによって得られたマップを、正面側、横向き、それ以外(後ろ向きや下向きなどで顔領域が少なく特徴量が少ない画像)を想定して、3つに自動分類を行う。後ろ向きなどの画像は顔領域が少ないので、それが集まる領域の反対側が、正面画像になり、中間が横向きの顔画像となる。この場合の分類結果は、図10に示すようになり、明確に3つの領域に分類されている様子が現れている。
【0046】
ここで多くの点が集まっているB点には、特徴を取る際にゼロとされた点が集中している。これを手がかりとし、B点から距離の最も遠い集合を選ぶことによって正面顔の集合を決定できる。その場合、エッジ特徴を基にしているので、3つに自動分類された黒色の部分には、後ろ向きの顔画像が、その後ろ向きから連続して変化している横向き顔画像が中央のグレーの部分に、反対側の白色の部分には正面向き付近の顔画像が集まっているものとなっている。
【0047】
このようにして自動分類を行い、正面付近の顔画像と判断された顔領域の顔画像データを各個人の顔データベースとして保存する。これにより、正面向き付近のみの顔画像を集めた顔データベースを作ることが可能になる。このとき横向きの領域のみを集めれば、横向きの画像群データを作ることが可能である。
【0048】
次に、図5を参照して、全体の顔から顔分布マップを作成する場合について、各個人に依存しない顔向きマップを作成する処理を説明する。この処理においては、各個人のデータを登録する際に保存しておいた個人の顔向きの特徴ベクトルを全て読み込む(ステップ51)。次に前述の場合と同様にして、自己組織化による顔マップの自動作成処理を行い、顔向きマップを作成し(ステップ52)、3つ分類に顔マップの自動クラスタリングを行い、その結果を全顔マップデータベース35に登録する(ステップ53,ステップ54)。このとき、マップ内の特徴点を均等に数十個程度抽出して、比較のためのベクトル群としておく。これら全体のデータベースはリアルタイムでの認識時に利用される。
【0049】
図6は、実際に個人を識別する場合の処理を説明するフローチャートである。図6に示すフローチャートを参照して、リアルタイムで顔認識する動作を説明する。顔認識時には、オンラインリアルタイムで、画像処理装置11から画像処理を行った画像が1枚単位で与えられる(ステップ61)。与えられた画像は、色情報などにより顔領域のみを含む部分を取り出し、それ以外の部分は黒色(R、G、Bの画素値が0)などの情報量をゼロにする処理を行う(ステップ62)。次に、この顔領域のみが表示された画像から、顔領域のみの特徴抽出およびエッジ特徴を抽出する(ステップ63)。このエッジ特徴の画像から、高次局所自己相関特徴によるベクトル化を行い、高次局所自己相関特徴を使った35次元のベクトルを取得する(ステップ64)。
【0050】
次に、全顔マップデータベース35を参照して、識別を行う全個人から作られた全顔マップデータベース35の分布マップのどこに(正面向き、横向き、それ以外)近いかを判定する(ステップ65)。この結果、対象とする正面顔でない場合は、識別処理を行わず次のフレームの画像の処理に戻る。
【0051】
正面向きと判断された場合は、その顔領域画像から、顔識別のための特徴を抽出して(ステップ66)、その特徴を個人正面付近顔データベースの特徴と比較して顔識別を行い、その結果を出力する(ステップ67)。識別の精度を上げるために複数枚の顔を識別する場合には、処理の継続をするかどうかの判断を行って(ステップ68)、処理を継続する場合には、この処理を繰り返す(ステップ61〜ステップ68)。
【0052】
【発明の効果】
以上、説明したように、本発明の顔画像分類登録装置によれば、顔画像データの登録時には、入力された画像群から顔向き別に分類を行うことができ、あらゆる顔向きの画像の中から正面顔などの顔認識に相応しい顔画像データのみを辞書に登録することができる。また、同時に、顔向きのマップを作成しておくことによって、顔認識時にはそのマップから正面向きであるかを自動に判断し、認識可能な顔画像のみを識別することで認識精度を上げることができる。
【図面の簡単な説明】
【図1】本発明を実施する場合のシステム構成の第1の例を示す図である。
【図2】本発明を実施する場合のシステム構成の第2の例を示す図である。
【図3】顔自動分類装置の詳細な構成を説明するブロック図である。
【図4】個人の顔を学習する場合の処理を説明するフローチャートである。
【図5】全体の顔から顔分布マップを作成する場合の処理を説明するフローチャートである。
【図6】実際に個人を識別する場合の処理を説明するフローチャートである。
【図7】自己組織化マップによる学習の様子を模式的に示す図である。
【図8】2次元平面に分布された1人の配置結果を示す図である。
【図9】2次元平面に分布された特徴点が分類されていく様子を説明する図である。
【図10】2次元平面に分布された特徴点が分類された分類結果を説明する図である。
【符号の説明】
10a,10b,10c,…,10n カメラ
11 画像処理装置
12 顔自動分類装置
13 顔識別装置
14 室内空間(識別対象空間)
15 ユーザ
16 操作対象(ディスプレイ、インターホン、パソコンなど)
31 顔領域抽出部
32 特徴抽出部
33 顔自動分類部
34 全体顔向き特徴データベース
35 全顔マップデータベース
36 個人顔マップデータベース
37 個人正面付近顔画像データベース
Claims (3)
- 利用者がその位置を全く拘束されないような広い空間内において撮影された多数の画像データから、正面に近い顔画像の顔画像データを抽出して登録する顔画像分類登録装置であって、
室内空間にいる人物をいろいろな方向から撮影して多数の画像データを取得する撮像手段と、
前記撮像手段により撮影した画像データに対して基本的な画像処理を行いディジタル画像データとする画像処理手段と、
前記ディジタル画像データから顔領域を抽出し、当該顔領域の画像データからエッジ特徴を抽出し、エッジ特徴の画像データから高次局所自己相関特徴を取得してベクトル化を行い、顔パターンの特徴として抽出する特徴抽出手段と、
前記顔パターンの特徴の高次局所自己相関特徴のベクトル化されたデータを利用して、顔向き特徴による2次元マップを作成し、顔パターンを顔向きの特徴により分類する顔自動分類手段と、
作成された顔向き特徴による2次元マップを登録する顔マップデータベースと、
を備えることを特徴とする顔画像分類登録装置。 - 請求項1に記載の顔画像分類登録装置において、さらに、
顔識別装置の顔画像データ辞書として利用する顔画像データを登録する顔画像データベースを備え、
前記顔自動分類手段が、顔向き特徴による2次元マップの作成を、自己組織化マップの作成により行い、作成された自己組織化マップに基づいて、顔パターンの顔向き特徴による分類を、正面向きの顔画像、横向きの顔画像、それ以外の顔向きの顔画像に分類し、正面向きの顔画像に分類された顔パターンの顔画像データのみを前記顔画像データベースに登録する
ことを特徴とする顔画像分類登録装置。 - 請求項2に記載の顔画像分類登録装置において、
前記室内空間にいる人物の個人が特定される場合、正面向きの顔画像に分類された顔パターンの顔画像データを個人別の顔画像データ辞書の顔画像データとして前記顔画像データベースに登録する
ことを特徴とする顔画像分類登録装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2003166779A JP4061405B2 (ja) | 2003-06-11 | 2003-06-11 | 顔画像分類登録装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2003166779A JP4061405B2 (ja) | 2003-06-11 | 2003-06-11 | 顔画像分類登録装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2005004454A JP2005004454A (ja) | 2005-01-06 |
| JP4061405B2 true JP4061405B2 (ja) | 2008-03-19 |
Family
ID=34092830
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2003166779A Expired - Lifetime JP4061405B2 (ja) | 2003-06-11 | 2003-06-11 | 顔画像分類登録装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4061405B2 (ja) |
Families Citing this family (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4719605B2 (ja) * | 2006-03-30 | 2011-07-06 | 株式会社豊田中央研究所 | 対象物検出用データ生成装置、方法及びプログラム並びに対象物検出装置、方法及びプログラム |
| JP2009064162A (ja) * | 2007-09-05 | 2009-03-26 | Fuji Heavy Ind Ltd | 画像認識システム |
| JP5434708B2 (ja) | 2010-03-15 | 2014-03-05 | オムロン株式会社 | 照合装置、デジタル画像処理システム、照合装置制御プログラム、コンピュータ読み取り可能な記録媒体、および照合装置の制御方法 |
| CN111079715B (zh) * | 2020-01-02 | 2023-04-25 | 华南理工大学 | 一种基于双字典学习的遮挡鲁棒性人脸对齐方法 |
| CN111414825B (zh) * | 2020-03-13 | 2023-09-08 | 玉林师范学院 | 一种安全帽佩戴检测方法 |
-
2003
- 2003-06-11 JP JP2003166779A patent/JP4061405B2/ja not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| JP2005004454A (ja) | 2005-01-06 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5517858B2 (ja) | 画像処理装置、撮像装置、画像処理方法 | |
| JP4505733B2 (ja) | テクストンを用いる対象物認識方法及び装置 | |
| JP4743823B2 (ja) | 画像処理装置、撮像装置、画像処理方法 | |
| KR101964397B1 (ko) | 정보처리장치 및 정보처리방법 | |
| CN1977286B (zh) | 对象识别方法及其设备 | |
| US6671391B1 (en) | Pose-adaptive face detection system and process | |
| Kamgar-Parsi et al. | Toward development of a face recognition system for watchlist surveillance | |
| JP5010905B2 (ja) | 顔認証装置 | |
| JP2000259814A (ja) | 画像処理装置及びその方法 | |
| JP2006293644A (ja) | 情報処理装置、情報処理方法 | |
| JP2008504606A (ja) | 単一画像に基づくマルチ生体認証システムおよび方法 | |
| JPH10320562A (ja) | 人間の顔の検出システムおよび検出方法 | |
| KR20120069922A (ko) | 얼굴 인식 장치 및 그 방법 | |
| WO2011121688A1 (ja) | 顔認識装置及び顔認識方法 | |
| JP5574033B2 (ja) | 画像認識システム及びその認識方法並びにプログラム | |
| CN105205480A (zh) | 一种复杂场景中人眼定位方法及系统 | |
| CN114519897B (zh) | 基于颜色空间融合及循环神经网络的人脸活体检测方法 | |
| KR20190093799A (ko) | Cctv를 통한 실시간 실종자 얼굴 인식 시스템 및 그 방법 | |
| JP4061405B2 (ja) | 顔画像分類登録装置 | |
| Gottumukkal et al. | Real time face detection from color video stream based on PCA method | |
| JP2002208011A (ja) | 画像照合処理システムおよび画像照合方法 | |
| Cui | A scheme of human face recognition in complex environments | |
| Rajalakshmi et al. | A review on classifiers used in face recognition methods under pose and illumination variation | |
| Park | Face Recognition: face in video, age invariance, and facial marks | |
| Mohamed et al. | Automated face recogntion system: Multi-input databases |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050315 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070904 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071105 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20071204 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 4061405 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| EXPY | Cancellation because of completion of term |