JP4968346B2 - 撮像装置、画像検出装置及びプログラム - Google Patents
撮像装置、画像検出装置及びプログラム Download PDFInfo
- Publication number
- JP4968346B2 JP4968346B2 JP2010009995A JP2010009995A JP4968346B2 JP 4968346 B2 JP4968346 B2 JP 4968346B2 JP 2010009995 A JP2010009995 A JP 2010009995A JP 2010009995 A JP2010009995 A JP 2010009995A JP 4968346 B2 JP4968346 B2 JP 4968346B2
- Authority
- JP
- Japan
- Prior art keywords
- person
- face
- sound
- image
- main subject
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Image Processing (AREA)
- Studio Devices (AREA)
- Image Analysis (AREA)
Description
被写体を撮像して人物の顔を含む被写体画像の画像情報を取得する撮像手段と、前記人物の顔から発せられた音を集音する集音手段と、前記撮像手段により取得された前記画像情報及び前記集音手段により集音された音に基づいて、前記被写体画像内の前記人物の顔を検出する主要被写体検出手段と、前記主要被写体検出手段により検出された前記人物の顔について人物の認識を行う顔認識手段と、を備え、前記主要被写体検出手段は、前記集音手段により集音された音に基づいて、前記人物に係る性別及び年齢のうち、少なくとも何れか一つを特定し、当該人物に係る性別及び年齢のうち、少なくとも何れか一つに基づいて、検出すべき前記人物に係る顔パーツの位置関係の基準を変更することを特徴としている。
前記集音手段により集音された音を認識して前記人物の性別及び年齢のうち、少なくとも何れか一つの認識用特徴情報を特定する特徴情報特定手段と、前記特徴情報特定手段により特定された前記認識用特徴情報の前記顔認識手段による顔認識に係る重要度を高くするように変更する特徴重要度変更手段と、を備えることを特徴としている。
前記顔認識手段により認識された前記人物の名前を表示する名前表示手段を備えることを特徴としている。
被写体を撮像して被写体画像の画像情報を取得する撮像手段と、前記被写体画像内の人物の顔から発せられた音を集音する集音手段と、を備える撮像装置に、前記撮像手段により取得された前記画像情報及び前記集音手段により集音された音に基づいて、前記被写体画像内の前記人物の顔を検出する主要被写体検出機能と、前記主要被写体検出機能により検出された前記人物の顔について人物の認識を行う顔認識機能、を実現させ、前記主要被写体検出機能は、前記集音手段により集音された音に基づいて、前記人物に係る性別及び年齢のうち、少なくとも何れか一つを特定し、当該人物に係る性別及び年齢のうち、少なくとも何れか一つに基づいて、検出すべき前記人物に係る顔パーツの位置関係の基準を変更することを特徴としている。
人物の顔を有する画像情報を取得する画像取得手段と、前記人物の顔から発せられた音を集音する集音手段と、前記画像取得手段により取得された前記画像情報及び前記集音手段により集音された音に基づいて、前記画像情報内の前記人物の顔を検出する主要被写体検出手段と、前記主要被写体検出手段により検出された前記人物の顔について人物の認識を行う顔認識手段と、を備え、前記主要被写体検出手段は、前記集音手段により集音された音に基づいて、前記人物に係る性別及び年齢のうち、少なくとも何れか一つを特定し、当該人物に係る性別及び年齢のうち、少なくとも何れか一つに基づいて、検出すべき前記人物に係る顔パーツの位置関係の基準を変更することを特徴としている。
図1は、本発明を適用した一実施形態の撮像装置100の概略構成を示すブロック図である。
具体的には、撮像装置100は、図1に示すように、撮像部1と、撮像補助部2と、表示部3、操作部4と、記録媒体5と、集音部6と、制御部7と、データ記憶部8等を備えて構成されている。
電子撮像部12は、撮像レンズ群11を通過した被写体像を二次元の画像信号に変換するCCD(Charge Coupled Device)やCMOS(Complementary Metal-oxide Semiconductor)等の撮像素子から構成されている。
映像信号処理部13は、電子撮像部12から出力される画像信号に対して所定の画像処理を施すものである。
画像メモリ14は、画像処理後の画像信号を一時的に記憶する。
撮影制御部15は、CPU71の制御下にて、電子撮像部12及び映像信号処理部13を制御する。具体的には、撮影制御部15は、電子撮像部12に所定の露出時間で被写体を撮像させ、当該電子撮像部12の撮像領域から画像信号を所定のフレームレートで読み出す処理の実行を制御する。
ズーム駆動部22は、撮像レンズ群11に接続されたズーム機構部(図示略)を駆動させる。
なお、フォーカス駆動部21及びズーム駆動部22は、撮影制御部15に接続され、撮影制御部15の制御下にて駆動する。
なお、図2(a)にあっては、主要被写体としての女子の各々から発せられた音声「撮ってね〜」及び「こっち〜」を模式的にふきだしで表している。
入力回路42は、操作入力部41から出力され入力された操作信号をCPU71に入力するためのものである。
マイクは、指向性を有し、人物(主要被写体)の発音方向、即ち、話者方向の特定のために複数設けられている。
なお、上記では顔画像データとしたが、当然顔画像データそのものではなく、顔画像の特徴部分を示すデータを記憶するようにしても良い。
また同様に、上記では音声データとしたが、当然音声データそのものではなく、音声の特徴部分を示すデータを記憶するようにしても良い。
なお、顔検出処理にて検出された顔に係る人物の名前は、例えば、操作入力部41の所定操作に基づいて事後的に入力されるようになっている。
これにより、その後に行われる顔検出処理及び顔認識処理にて、データ記憶部8に記憶されている顔画像データや音声データ等を用いて、主要被写体である人物の認識(特定)を好適に行うことができる。
具体的には、CPU71が顔検出プログラム72aを実行することで、複数の撮像画像データのうち、一の撮像画像データについて顔探索枠を所定方向に走査して、目、鼻、ロなどに相当する特徴部分(顔パーツ)を特定して、各顔パーツの位置関係から顔であるか否かを判定し、顔であると判定されると当該探索枠領域を顔領域として検出する。また、顔検出処理は、後述する重要度変更処理にて変更された音関連検出用情報の重要度を考慮して行われる。
なお、上記の顔検出処理の方法は、一例であって、これに限られるものではない。
具体的には、CPU71が検出用情報特定プログラム72bを実行することで、集音部6の複数のマイクにより集音されて生成された音声データを分析して、当該分析結果に基づいて主要被写体の話者方向を特定したり、検出用情報特定用データdを参照して、主要被写体の性別、年齢及び国籍を特定する。
なお、音声認識により、発話者の年齢、性別、国籍を推定する技術は、特開2003−330485号公報において公知である。
具体的には、CPU71が重要度変更プログラム72cを実行することで、顔検出処理において、顔検出を主要被写体の話者方向を中心として実行したり、各顔パーツの位置関係の基準を性別、年齢及び国籍に応じて変更したり、顔の主要部をなす肌色の濃淡の基準を国籍に応じて変更することにより、特定の人物を検出し易くすることができる。
なお、顔検出により、検出した顔の年齢、性別、国籍を推定する技術は、特開2007−80057号公報において公知である。この文献に記載されているのは、検出した顔から所定の特徴を見出すものであるが、これを逆利用することにより、所定の特徴から所定の顔の重要度を向上させて、検出し易くすることが可能になる。
なお、重要度変更処理における主要被写体の発音方向、性別、年齢及び国籍等の諸要素の重要度の変更の有無の設定は、例えば、操作入力部41の所定操作に基づいて事前に変更することができるようになっている。
ここで、図4は、撮像処理に係る動作の一例を示すフローチャートである。
ここで、音声が所定音量以上であると判定されると(ステップS3;YES)、CPU71は、プログラムメモリ72内の検出用情報特定プログラム72bを実行して、集音部6により生成された音声データを分析して、当該分析結果に基づいて主要被写体の話者方向を特定したり、検出用情報特定用データdを参照して、主要被写体の性別、年齢及び国籍を特定する(ステップS4)。
なお、ステップS2にて、主要被写体からの音声の認識率を向上させる上では、予め所定の言葉(例えば、「撮ってね〜」等)を登録しておき、当該言葉を主要被写体にしゃべって貰うようにしても良い。
続けて、CPU71は、プログラムメモリ72内の顔検出プログラム72aを実行して、撮像部1により生成された撮像画像データに基づいて、被写体画像内の人物の顔を検出する顔検出処理を実行する(ステップS6)。具体的には、CPU71は、重要度変更処理にて変更された音関連検出用情報の重要度を考慮して、主要被写体の話者方向を中心として顔検出を行ったり、性別、年齢及び国籍に応じて各顔パーツの位置関係の基準を変更したり、国籍に応じて顔の主要部をなす肌色の濃淡の基準を変更して、顔検出を行う。
そして、顔検出処理にて人物の顔が検出されると、CPU71は、当該顔に略矩形状の顔検出枠W(図2(b)参照)を画像表示部32にOSD表示させる(ステップS7)。
そして、ユーザによるシャッターボタン41aが半押し操作が解除されることなく(ステップS10;NO)、シャッターボタン41aが全押し操作されると(ステップS11;YES)、CPU71は、静止画像(本画像)を撮像記録する処理を実行する(ステップS12)。
従って、主要被写体である人物から発せられた音の情報を利用して主要被写体である人物の属性を特定し、当該属性に基づいて、検出すべき主要被写体である人物の検出基準を変更して当該人物の顔検出を行うことができ、この結果、主要被写体の検出精度の向上を図ることができる。さらに、顔検出処理の迅速化を図ることができる。
以下に、撮像装置の変形例について図5〜図8を参照して説明する。
変形例1の撮像装置200は、主要被写体としての人物から発せられた音を認識して当該人物の顔画像情報を特定して、特定された顔画像情報に基づいて顔検出処理を行う。
具体的には、図5に示すように、変形例1の撮像装置200のプログラムメモリ72は、顔検出プログラム72a、検出用情報特定プログラム72b、重要度変更プログラム72c、検出用情報特定用データdに加えて、顔画像情報特定プログラム72d、顔認識プログラム72eを記憶している。
具体的には、顔検出処理にて、CPU71が顔画像情報特定プログラム72dを実行することで、被写体の撮像の際に集音部6により集音された音の音声データ(例えば、「おいしい!」;図6(a)参照)を分析し、当該音声データの周波数特性に基づいて、データ記憶部8に音声データ(例えば、「楽しい」及び「おもしろい」等)と対応付けて記録されている顔画像データ(例えば、「かおり」の顔画像データ)を特定する(図7(a)参照)。
そして、CPU71がプログラムメモリ72内の顔検出プログラム72aを実行することで、顔画像情報特定処理にて特定された顔画像データを基準として被写体内から主要被写体である人物の顔の検出を行う。
具体的には、CPU71が顔認識プログラム72eを実行することで、データ記憶部8を参照して、顔検出処理にて検出された人物の顔を認識して、当該人物の名前を特定する。
そして、CPU71は、顔認識処理にて認識された人物の名前を顔画像と対応付けて画像表示部(名前表示手段)32に表示させる(図6(b)参照)。
また、顔認識処理にて人物の名前が特定されると、データ記憶部8は、図7(b)に示すように、人物の名前(例えば、「かおり」)と対応付けて、顔検出処理にて新たに検出された顔の顔画像データ(図7(b)における右側の顔画像)と、集音部6により新たに集音された音声データ(例えば、「おいしい」)を記録する。
そして、データ記憶部8は、主要被写体である人物の名前と対応付けて、顔検出処理にて新たに検出された顔の顔画像データと、集音部6により新たに集音された音声データを記録するので、その後に行われる顔検出処理及び顔認識処理にて、データ記憶部8に記憶されている顔画像データや音声データ等を用いて、主要被写体である人物の認識(特定)を好適に行うことができる。
変形例2の撮像装置300は、集音部6により集音された音を認識して顔認識処理における人物の性別、年齢及び国籍等の認識用特徴情報を特定し、当該認識用特徴情報の顔認識処理における優先順位を高くするように変更する。
具体的には、CPU71が特徴情報特定プログラム72fを実行することで、集音部6により集音された音声の周波数特性に基づいて、人物(主要被写体)の性別、年齢及び国籍等の認識用特徴情報を特定する。
そして、CPU71は、特定された人物の性別、年齢及び国籍等の認識用特徴情報を顔画像と対応付けて画像表示部(特徴情報表示手段)32に表示させる。
具体的には、CPU71が特徴重要度変更プログラム72gを実行することで、例えば、特定された主要被写体としての人物が男性(女性)である場合には、データ記憶部8に記憶されている男性(女性)のデータベースを優先的に参照し、また、人物の年齢や国籍に応じて、当該年齢や国籍のデータベースを優先的に参照して、顔認識処理を行う。
具体的には、顔認識処理の後、CPU71は、顔情報記録制御プログラム72hを実行することで、顔認識処理にて顔認識された人物の性別、年齢及び国籍等(認識用特徴情報)及び音声データを顔画像データと対応付けてデータ記憶部8に記録させる。
そして、データ記憶部8は、主要被写体である人物の名前と対応付けて、顔検出処理にて新たに検出された顔の顔画像データと、集音部6により新たに集音された音声データの他に、人物の性別、年齢及び国籍等を認識用特徴情報を記録するので、その後に行われる顔検出処理及び顔認識処理にて、データ記憶部8に記憶されている認識用特徴情報を用いて、主要被写体である人物の認識(特定)を好適に行うことができる。
加えて、認識用特徴情報として、主要被写体である人物の性別、年齢及び国籍を例示したが、これに限られるものではなく、人物の顔の特徴を表して当該顔の認識に係る情報であれば如何なるものであっても良い。
また、上記実施形態では、変形例1、変形例2共に別に構成したカメラであるとしたが、1つのカメラであって、3つの動作モードを切り替えて使用する構成としても良いことは勿論である。これにより、多くの動作モードを1つのカメラで実現できるので利便性を向上させることができる。
また、上記実施形態では、顔検出プログラムaで検出した顔に対して顔認識プログラムeで個人の特定を行うように構成したが、このようではなくとも構わず、1つのプログラムで、例えば顔検出プログラムで顔の検出と共に個人の特定を行っても構わない。
1 撮像部
3 表示部
32 画像表示部
6 集音部
71 CPU
8 データ記憶部
Claims (5)
- 被写体を撮像して人物の顔を含む被写体画像の画像情報を取得する撮像手段と、
前記人物の顔から発せられた音を集音する集音手段と、
前記撮像手段により取得された前記画像情報及び前記集音手段により集音された音に基づいて、前記被写体画像内の前記人物の顔を検出する主要被写体検出手段と、
前記主要被写体検出手段により検出された前記人物の顔について人物の認識を行う顔認識手段と、
を備え、
前記主要被写体検出手段は、
前記集音手段により集音された音に基づいて、前記人物に係る性別及び年齢のうち、少なくとも何れか一つを特定し、当該人物に係る性別及び年齢のうち、少なくとも何れか一つに基づいて、検出すべき前記人物に係る顔パーツの位置関係の基準を変更することを特徴とする撮像装置。 - 前記集音手段により集音された音を認識して前記人物の性別及び年齢のうち、少なくとも何れか一つの認識用特徴情報を特定する特徴情報特定手段と、
前記特徴情報特定手段により特定された前記認識用特徴情報の前記顔認識手段による顔認識に係る重要度を高くするように変更する特徴重要度変更手段と、を備えることを特徴とする請求項1に記載の撮像装置。 - 前記顔認識手段により認識された前記人物の名前を表示する名前表示手段を備えることを特徴とする請求項1又は2に記載の撮像装置。
- 被写体を撮像して被写体画像の画像情報を取得する撮像手段と、前記被写体画像内の人物の顔から発せられた音を集音する集音手段と、を備える撮像装置に、
前記撮像手段により取得された前記画像情報及び前記集音手段により集音された音に基づいて、前記被写体画像内の前記人物の顔を検出する主要被写体検出機能と、
前記主要被写体検出機能により検出された前記人物の顔について人物の認識を行う顔認識機能、
を実現させ、
前記主要被写体検出機能は、
前記集音手段により集音された音に基づいて、前記人物に係る性別及び年齢のうち、少なくとも何れか一つを特定し、当該人物に係る性別及び年齢のうち、少なくとも何れか一つに基づいて、検出すべき前記人物に係る顔パーツの位置関係の基準を変更することを特徴とするプログラム。 - 人物の顔を有する画像情報を取得する画像取得手段と、
前記人物の顔から発せられた音を集音する集音手段と、
前記画像取得手段により取得された前記画像情報及び前記集音手段により集音された音に基づいて、前記画像情報内の前記人物の顔を検出する主要被写体検出手段と、
前記主要被写体検出手段により検出された前記人物の顔について人物の認識を行う顔認識手段と、
を備え、
前記主要被写体検出手段は、
前記集音手段により集音された音に基づいて、前記人物に係る性別及び年齢のうち、少なくとも何れか一つを特定し、当該人物に係る性別及び年齢のうち、少なくとも何れか一つに基づいて、検出すべき前記人物に係る顔パーツの位置関係の基準を変更することを特徴とする画像検出装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2010009995A JP4968346B2 (ja) | 2010-01-20 | 2010-01-20 | 撮像装置、画像検出装置及びプログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2010009995A JP4968346B2 (ja) | 2010-01-20 | 2010-01-20 | 撮像装置、画像検出装置及びプログラム |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2007226151A Division JP4896838B2 (ja) | 2007-08-31 | 2007-08-31 | 撮像装置、画像検出装置及びプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2010148132A JP2010148132A (ja) | 2010-07-01 |
| JP4968346B2 true JP4968346B2 (ja) | 2012-07-04 |
Family
ID=42567991
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2010009995A Active JP4968346B2 (ja) | 2010-01-20 | 2010-01-20 | 撮像装置、画像検出装置及びプログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4968346B2 (ja) |
Families Citing this family (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8908976B2 (en) | 2010-05-26 | 2014-12-09 | Panasonic Intellectual Property Corporation Of America | Image information processing apparatus |
| JP2013007851A (ja) * | 2011-06-23 | 2013-01-10 | Nikon Corp | 撮像装置 |
| JP2013156958A (ja) * | 2012-01-31 | 2013-08-15 | Sony Mobile Communications Inc | 表示処理装置 |
| US9036069B2 (en) * | 2012-02-06 | 2015-05-19 | Qualcomm Incorporated | Method and apparatus for unattended image capture |
| US9495591B2 (en) * | 2012-04-13 | 2016-11-15 | Qualcomm Incorporated | Object recognition using multi-modal matching scheme |
| WO2018173139A1 (ja) | 2017-03-22 | 2018-09-27 | ヤマハ株式会社 | 撮影収音装置、収音制御システム、撮影収音装置の制御方法、及び収音制御システムの制御方法 |
| CN114359645B (zh) * | 2022-01-12 | 2024-05-21 | 中国平安人寿保险股份有限公司 | 基于特征区域的图像拓展方法、装置、设备及存储介质 |
Family Cites Families (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2001067098A (ja) * | 1999-08-25 | 2001-03-16 | Sanyo Electric Co Ltd | 人物検出方法と人物検出機能搭載装置 |
| JP2004056286A (ja) * | 2002-07-17 | 2004-02-19 | Fuji Photo Film Co Ltd | 画像表示方法 |
| JP4599244B2 (ja) * | 2005-07-13 | 2010-12-15 | キヤノン株式会社 | 動画データから字幕を作成する装置及び方法、プログラム、並びに記憶媒体 |
| JP3924581B2 (ja) * | 2005-07-25 | 2007-06-06 | 今橋不動産有限会社 | 電子手帳 |
-
2010
- 2010-01-20 JP JP2010009995A patent/JP4968346B2/ja active Active
Also Published As
| Publication number | Publication date |
|---|---|
| JP2010148132A (ja) | 2010-07-01 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4896838B2 (ja) | 撮像装置、画像検出装置及びプログラム | |
| JP4968346B2 (ja) | 撮像装置、画像検出装置及びプログラム | |
| TWI330747B (en) | Image capture apparatus and auto focus control method | |
| US8384794B2 (en) | Image sensing device and camera | |
| CN101453569A (zh) | 摄像装置、摄像方法及记录其程序的计算机可读存储介质 | |
| JP5713055B2 (ja) | 撮像装置、撮像方法及びプログラム | |
| JP2009141555A (ja) | 音声入力機能付き撮像装置及びその音声記録方法 | |
| TWI597980B (zh) | 影音管理方法及其系統 | |
| CN103535023A (zh) | 包括特定人的视频摘要 | |
| JP2007280291A (ja) | 電子カメラ | |
| KR20070102404A (ko) | 화상 표시 제어 장치, 그 제어 방법 및 그 제어 프로그램 | |
| JP2015092646A (ja) | 情報処理装置、制御方法、およびプログラム | |
| JP6081788B2 (ja) | 動画像処理装置及び動画像処理方法 | |
| JP2014187551A (ja) | 画像取得装置、画像取得方法及びプログラム | |
| JP2012151544A (ja) | 撮像装置及びプログラム | |
| JP6761230B2 (ja) | 画像処理装置、その制御方法、プログラム及び撮像装置 | |
| JP2009239349A (ja) | 撮影装置 | |
| JP2014122978A (ja) | 撮像装置、音声認識方法、及びプログラム | |
| JP5389594B2 (ja) | 画像ファイル生成方法、そのプログラム、その記録媒体および画像ファイル生成装置 | |
| JP2010200079A (ja) | 撮影制御装置 | |
| US20250365497A1 (en) | Imaging apparatus, method, and system | |
| JP5413621B2 (ja) | 撮像装置及びそのプログラム | |
| JP5408288B2 (ja) | 電子カメラ | |
| JP2010183216A (ja) | 撮影装置、画像再生装置、及び撮影結果報知方法 | |
| JP2024046308A (ja) | 撮像装置、制御方法、およびプログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110823 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110913 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111109 |
|
| RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20111109 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120306 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120319 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150413 Year of fee payment: 3 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |