[go: up one dir, main page]

JP2018010538A - 画像認識装置 - Google Patents

画像認識装置 Download PDF

Info

Publication number
JP2018010538A
JP2018010538A JP2016139819A JP2016139819A JP2018010538A JP 2018010538 A JP2018010538 A JP 2018010538A JP 2016139819 A JP2016139819 A JP 2016139819A JP 2016139819 A JP2016139819 A JP 2016139819A JP 2018010538 A JP2018010538 A JP 2018010538A
Authority
JP
Japan
Prior art keywords
image
imaging
frame
unit
image recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016139819A
Other languages
English (en)
Inventor
直樹 野畑
Naoki Nohata
直樹 野畑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tokai Rika Co Ltd
Original Assignee
Tokai Rika Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokai Rika Co Ltd filed Critical Tokai Rika Co Ltd
Priority to JP2016139819A priority Critical patent/JP2018010538A/ja
Publication of JP2018010538A publication Critical patent/JP2018010538A/ja
Pending legal-status Critical Current

Links

Landscapes

  • User Interface Of Digital Computer (AREA)
  • Image Analysis (AREA)

Abstract

【課題】簡易なシステムにより、ジェスチャー操作による回転動作を精度よく判定できる画像認識装置を提供する。【解決手段】所定の方向から撮像対象物である操作者の手80を撮像する撮像手段としてのカメラ10と、カメラ10により撮像された所定の方向と直交する面内の画像情報に基づいて、撮像対象物の基準点の動作軌跡の傾きを算出し、動作軌跡の傾きの正負反転の個数に基づいて、手80の所定の動作種別を検出する制御部と、を有する。【選択図】図1

Description

本発明は、画像認識装置に関し、特に、画像認識によりジェスチャー動作(回転動作)を判定する画像認識装置に関する。
従来の技術として、ジェスチャー認識を複合的に用いて、利用者に直感的で分かりやすいインターフェイスを提供するとともに、複雑な入力操作が可能な装置を提供する画像認識装置が提案されている(例えば、特許文献1参照。)。この画像認識装置は、撮像手段により撮影された映像に基づくジェスチャー認識とタッチパネル等の接触検知手段を複合的に用いて、機器の入力操作を行うものである。
この画像認識装置は、撮像手段により撮影した映像から手形状の認識をする処理を行う。認識された手形状からジェスチャー特徴量を抽出し保存する。ジェスチャー特徴量とは、ジェスチャーを特定するための情報であり、ジェスチャー特徴量データベースに制御命令と関連付けられて記憶されている。例えば、手形状の領域や操作している指の本数、および指先の位置情報等である。撮像手段により取得した映像から、ジェスチャー認識処理によって、親指の指先の位置を初期値として登録する。つぎに、操作者が連続的なパラメータを変化させるために親指を回転させた時、その回転量をジェスチャー認識で認識するとされている。
特開2009−42796号公報
しかし、特許文献1の画像認識装置が例えば車室内に設置された状況では、画像認識装置が振動する結果、動作軌跡が不安定になり易く、極端な移動軌跡になったり、移動方向と異なる方向に振幅する波形を含んだ動作となったりするために、動作を誤判定する可能性がある。また、車室内では、カメラ搭載可能なスペースは限られ、撮影位置や方向が制約されるため、カメラ設置位置と動作位置の関係から、歪んだ移動軌跡となる可能性がある。このような理由から、従来の画像認識装置では、精度のよい回転動作の判定が難しいという問題があった。
したがって、本発明の目的は、簡易なシステムにより、ジェスチャー操作による回転動作を精度よく判定できる画像認識装置を提供することにある。
[1]上記目的を達成するため、所定の方向から撮像対象物を撮像する撮像手段と、前記撮像手段により撮像された前記所定の方向と直交する面内の画像情報に基づいて、前記撮像対象物の基準点の動作軌跡の傾きを算出し、前記動作軌跡の傾きの正負反転の個数に基づいて、前記撮像対象物の所定の動作種別を検出する制御部と、を有することを特徴とする画像認識装置を提供する。
[2]前記撮像手段は単眼カメラであり、前記所定の方向は前記単眼カメラの光軸方向であることを特徴とする上記[1]に記載の画像認識装置であってもよい。
[3]また、前記制御部は、前記正負反転の個数が4以上の場合に、前記撮像対象物の所定の動作種別は回転動作であると判定することを特徴とする上記[1]又は[2]に記載の画像認識装置であってもよい。
本発明の画像認識装置によれば、簡易なシステムにより、ジェスチャー操作による回転動作を精度よく判定できる画像認識装置を提供することができる。
図1は、本発明の実施の形態に係る画像認識装置のカメラ配置の一例を示す概略斜視図である。 図2は、本発明の実施の形態に係る画像認識装置のブロック図の一例を示している。 図3(a)は、図1においてZ軸方向に見たXY座標上に撮像されたフレーム画像S(n)であり、図3(b)は、背景画像110のフレーム画像S(0)であり、図3(c)は、フレーム画像S(n)とフレーム画像S(0)の差分により背景画像を除去し2値化した画像である。 図4は、本発明の実施の形態に係る画像認識装置の動作を示すフローチャートである。 図5は、F1(n)の一例を示すグラフである。 図6は、一定フレーム間毎の軌跡傾き式、F1(n)=(Yn/Xn)とした場合、F1(n)×F1(n−1)<0の判定ポイントの例(回転動作の例)を示す判定図である。 図7(a)〜(f)は、判定される回転動作の軌跡を示す例示図である。 図8(a)〜(d)は、判定される払い動作の軌跡を示す例示図である。
(本発明の実施の形態)
本発明の実施の形態に係る画像認識装置1は、所定の方向から撮像対象物である操作者の手80を撮像する撮像手段としてのカメラ10と、カメラ10により撮像された所定の方向と直交する面内の画像情報に基づいて、前記撮像対象物の基準点の動作軌跡の傾きを算出し、前記動作軌跡の傾きの正負反転の個数に基づいて、手80の所定の動作種別を検出する制御部30と、を有して構成されている。
なお、上記の所定の方向はカメラ10の光軸方向(Z軸方向、上方向)に設定されている。
図1は、本発明の実施の形態に係る画像認識装置のカメラ配置の一例を示す概略斜視図である。図2は、本発明の実施の形態に係る画像認識装置のブロック図の一例を示している。また、図3(a)は、図1においてZ軸方向に見たXY座標上に撮像されたフレーム画像S(n)であり、図3(b)は、背景画像110のフレーム画像S(0)であり、図3(c)は、フレーム画像S(n)とフレーム画像S(0)の差分により背景画像を除去し2値化した画像である。
図1に示すように、画像認識装置1は、撮像手段としてのカメラ10が上方向に配置され、図示のA方向、すなわち、カメラ10の光軸方向(Y軸方向)を撮像する。本実施の形態では、カメラ10は1台である単眼システムである。カメラ10は、例えば、CCD(Charge Coupled Device)、CMOS(Complementary Metal-Oxide Semiconductor)などの半導体撮像素子を備えている。カメラ10の撮像範囲60と略同一となる範囲を赤外照明20が照明する。なお、撮像する光の波長は任意の周波数の光が使用可能であるが、赤外光、近赤外光を使用して照明、撮像する。これにより、操作者が撮像時に照明光を見ることがなく、撮像時の違和感を防止あるいは軽減することができる。
(カメラ10)
図1に示すように、カメラ10は、A方向に向けて操作者の手80を撮像し、カメラ10の光軸方向(Z軸方向)と直交するXY面内の画像情報である画像データをフレーム画像100として、所定のフレーム周期で制御部30へ出力する。このフレーム画像100は、例えば、後述する図3(a)に示すような背景110を含んだフレーム画像である。フレーム画像100は、図2に示すように、ある時刻におけるnフレーム目のフレーム画像S(n)を所定のタイミング(例えば、1/60秒)で順次、制御部30へ出力する。
なお、図3(b)に示した背景画像110のみを予め撮像し、この背景画像110をフレーム画像S(0)として後述する背景処理に使用する。
(照明20)
また、図1、2に示すように、制御部30には、照明20が接続されている。なお、照明は複数台が制御部30に接続されていてもよい。図1に示すように、照明20は、カメラ10の撮像範囲(画角)をカバーする範囲に赤外光を照射して撮像対象物を照明する。
(制御部30の構成)
図2に示すように、制御部30には、1台のカメラ10が接続されている。また、制御部30には、照明20が接続されている。
制御部30は、例えば、記憶されたプログラムに従って、取得したデータに演算、加工などを行うCPU(Central Processing Unit)、半導体メモリであるRAM(Random Access Memory)及びROM(Read Only Memory)などから構成されるマイクロコンピュータである。このROMには、例えば、制御部30が動作するためのプログラム等が格納されている。RAMは、例えば、複数の画像情報や一時的に演算結果などを格納する記憶領域として用いられる。また制御部30は、その内部にクロック信号を生成する手段を有し、このクロック信号に基づいて処理を実行する。
制御部30は、画像処理部31、重心検出部32、基準点検出部33、フレーム間演算部34、および動作識別部35を備えている。
(画像処理部31)
画像処理部31は、カメラ10から入力される各フレーム画像S(n)を後工程の重心検出、基準点検出等を行なうために、背景除去、2値化処理等の画像処理を予め実行するための前工程である。
図3(a)は、図1においてZ軸方向に見たXY座標上に撮像されたフレーム画像S(n)であり、図3(b)は、背景画像110のフレーム画像S(0)であり、図3(c)は、フレーム画像S(n)とフレーム画像S(0)の差分により背景画像を除去し2値化した画像である。この背景画像であるフレーム画像S(0)は、差分画像の算出処理の基準画像となるので、時間により変化しない画像であることが好ましい。
画像処理部31は、フレーム画像S(n)と背景画像110のフレーム画像S(0)の差分を抽出し、この差分をフレーム画像S(n)から除去して、手80のみのフレーム画像S(n)を作成する。また、これを2値化して、図3(c)に示す手80の2値化されたフレーム画像S(n)を作成する。以下の説明では、この2値化されたフレーム画像S(n)により各処理が実行されるものとして説明する。
(重心検出部32)
重心検出部32は、2値化されたフレーム画像S(n)に基づいて、重心Gの位置を算出することにより検出する。重心Gの位置のX座標は、図3(c)の中の数値の平均値である。平均値は、手80が存在する画素のX座標の値の合計を、手80が存在する画素の数で割ることにより計算できる。同様にして、重心Gの位置のY座標は、図3(c)の中の数値の平均値である。平均値は、手80が存在する画素のY座標の値の合計を、手80が存在する画素の数で割ることにより、重心G(X、Y)を算出する。
(基準点検出部33)
基準点検出部33は、図3(c)で示す算出された重心Gから、最も遠い点Pを基準点として検出する。なお、この基準点は、手80の特定の位置であれば、重心Gから最も遠い点には限られない。
基準点検出部33は、図3(c)のように求められた画像を、例えば、テンプレートマッチングにより、手首から指先部分を抽出する。この抽出された手のフレーム画像において、重心Gから最も遠いX座標、Z座標を求める。これにより、重心Gから最も遠い点Pを検出することができ、これを、動作軌跡の基準点(x、y)とする。なお、手において重心Gから最も遠い点Pは、例えば、図3(a)、(c)に示すように、指先である。
(フレーム間演算部34、動作識別部35)
フレーム間演算部34は、カメラ10から所定のタイミングで順次入力されるフレーム画像S(n)から、種々の演算を実行する。フレーム間演算部34は、フレーム画像S(n)に基づいて、基準点のx座標、y座標(x、y)を検出する。
ここで、数フレーム間とは、5以下のフレーム間であり、一定フレーム間とは、1桁程度のフレーム間であり、ウインドウフレーム間とは、ある一定数のフレーム間とする。ウインドウフレーム間は、一定フレーム間よりも大きい。認識精度や判定速度の条件から各フレーム数は変化する。本実施の形態では、数フレーム間を9フレーム、一定フレーム間を3フレーム、ウインドウフレーム間を500フレームとする。
フレーム間演算部34、動作識別部35は、以下の計算、判定等を実行する。
(1)フレーム間演算部34は、基準点検出部33で抽出された基準点の、ある時間tでの座標(x、y)を記憶する。
(2)単位移動距離D=√((x−xt−3+(y−yt−3))を計算する。
なお、√( )は、( )1/2と同意である。
(3)単位フレーム間の値T=a/Dを計算する。aは、定数とする。
(4)一定フレーム間でのX値の時間変化値GX(t)=x−xt−Tを計算する。同様に、Y値の時間変化値GY(t)=y−yt−Tを計算する。
(5)GX(t)×GX(t−1)、または、GY(t)×GY(t−1)を計算する。
(6)閾値内になったフレームから数フレーム後から開始して、一定フレーム毎(T=3)に、Yn=y−yt−3、Xn=x−xt−3を計算し、一定フレーム間毎の軌跡傾き式、F1(n)=(Yn/Xn)を計算する。なお、Xβ=0の場合は、F1(β)=F1maxとする。
(7)動作識別部35は、ウインドウフレーム間で、F1(n)の正負が反転するポイントが4点以上存在するか判断する。4点より少ない場合は払い動作と判定する。
(8)動作識別部35は、ウインドウフレーム間で、GX(t)×GX(t−1)及びGY(t)×GY(t−1)がゼロ以下になるかを判断する。最低でもどちらか一方が常にゼロよりも大きい場合は払い動作と判定する。
(画像認識装置1の動作)
図4は、本発明の実施の形態に係る画像認識装置の動作を示すフローチャートである。以下、このフローチャートに従って画像認識装置1の動作を説明する。
フレーム間演算部34は、まず、単位移動距離D=√((x−xt−3+(y−yt−3)を計算する(Step01)。
フレーム間演算部34は、単位移動距離Dがゼロかどうかを判断する(Step02)。単位移動距離Dがゼロの場合は、操作者の手80が動いてないと判断して、Step01へ戻り(Step02:Yes)、単位移動距離Dがゼロでない場合は、Step03へ進む(Step02:No)。
フレーム間演算部34は、単位フレーム間の値T=a/Dを計算する(Step03)。aは、定数とする。
フレーム間演算部34は、一定フレーム間でのX値の時間変化値GX(t)=x−xt−Tを計算する(Step04)。
フレーム間演算部34は、Step04と同様に、Y値の時間変化値GY(t)=y−yt−Tを計算する(Step05)。
フレーム間演算部34は、GX(t)×GX(t−1)、または、GY(t)×GY(t−1)がゼロ以下かどうかを判断する(Step06)。GX(t)×GX(t−1)、または、GY(t)×GY(t−1)がゼロ以下の場合は、Step07へ進み(Step06:Yes)、ゼロ以下でない場合は、Step01へ戻って移動距離計測を継続する(Step06:No)。
フレーム間演算部34は、n=n+1として、次のフレームへ進む(Step07)。
フレーム間演算部34は、x、y、X’、Y’を取得する(Step08)。
フレーム間演算部34は、n<3かどうかを判断する(Step09)。n<3の場合は、一定フレーム数(n=3)に達していないので、Step07へ戻り(Step09:Yes)、n<3でない場合は、一定フレーム数(n=3)に達したので、Step10へ進む(Step09:No)。
フレーム間演算部34は、Xn=x−xt−3、Yn=y−yt−3を計算する(Step10)。
フレーム間演算部34は、Xnがゼロかどうかを判断する(Step11)。Xnがゼロでない場合は、次の割算処理であるStep12へ進み(Step11:No)、Xnがゼロの場合は、Step13へ進む(Step11:Yes)。
フレーム間演算部34は、F1(n)=F1maxとしてStep14へ進む(Step13)。
フレーム間演算部34は、一定フレーム間(n=3)毎の軌跡傾き式、F1(n)=(Yn/Xn)を計算する(Step12)。図5は、反転ポイントを有するF1(n)の一例を示すグラフである。
フレーム間演算部34は、n<4かどうかを判断する(Step14)。n<4の場合は、Step07へ戻り(Step14:Yes)、n<4でない場合は、Step15へ進む(Step14:No)。
フレーム間演算部34は、F1(n)×F1(n―1)>0を判断する(Step15)。図6は、一定フレーム間毎の軌跡傾き式、F1(n)=(Yn/Xn)とした場合、F1(n)×F1(n−1)<0の判定ポイントの例(回転動作の例)を示す判定図である。F1(n)×F1(n―1)>0でない場合は、Step16へ進み(Step15:No)、F1(n)×F1(n―1)>0の場合は、Step17へ進む(Step15:Yes)。
フレーム間演算部34は、反転数Aを、A=A+1とする(Step16)。
フレーム間演算部34は、n<500かどうかを判断する(Step17)。n<500の場合は、ウインドウフレーム数に達してないとして、Step07へ戻り(Step17:Yes)、n<500でない場合は、Step18へ進む(Step17:No)。
動作識別部35は、A<4かどうかを判断する(Step18)。反転数Aが4<0の場合は、Step20へ進み(Step18:Yes)、反転数Aが4<0でない場合は、Step19へ進む(Step18:No)。
動作識別部35は、払い動作と判定する(Step20)。
動作識別部35は、GX(t)×GX(t−1)、または、GY(t)×GY(t−1)がゼロより大きいかどうかを判断する(Step19)。ゼロより小さい場合は、Step21へ進み(Step19:No)、ゼロより大きい場合は、Step22へ進む(Step19:Yes)。
動作識別部35は、回転動作(円動作)と判定する(Step21)。
動作識別部35は、払い動作と判定する(Step22)。
図7(a)〜(f)は、動作識別部35により判定される回転動作の軌跡を示す例示図である。この回転動作の軌跡には、従来技術では判定が難しい回転動作も含まれる。また、図8(a)〜(d)は、動作識別部35により判定される払い動作の軌跡を示す例示図である。
(実施の形態の効果)
本発明の実施の形態によれば、以下のような効果を有する。
(1)本発明の実施の形態に係る画像認識装置1は、所定の方向から撮像対象物である操作者の手80を撮像する撮像手段としてのカメラ10と、カメラ10により撮像された所定の方向と直交する面内の画像情報に基づいて、前記撮像対象物の基準点の動作軌跡の傾きを算出し、前記動作軌跡の傾きの正負反転の個数に基づいて、手80の所定の動作種別を検出する制御部30と、を有して構成されている。上記の所定の方向がカメラの光軸方向の場合は、動作種別(回転動作、払い動作)の識別が難しいが、本実施の形態によれば、手80の基準点の動作軌跡の傾きが正負反転する点を複数個有するかどうかで判定するので、簡易に回転動作を判定することが可能となる。
(2)これにより、簡易なシステムにより、ジェスチャー操作による回転動作を精度よく判定できる画像認識装置を実現することができる。
(3)単眼カメラシステムであるので、ステレオカメラやTOFカメラに比べて安価に画像認識装置を構成することが可能で、処理負荷が軽く処理時間がかからないという効果を有する。
(4)本実施の形態に係る画像認識装置1が車室内に設置されても、動作軌跡が不安定になったり、極端な移動軌跡になったり、移動方向と異なる方向に振幅する波形を含んだ動作とならずに、回転動作と払い動作を精度よく判定、識別することができる。
以上、本発明のいくつかの実施の形態を説明したが、これらの実施の形態は、一例に過ぎず、特許請求の範囲に係る発明を限定するものではない。また、これら新規な実施の形態は、その他の様々な形態で実施されることが可能であり、本発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更等を行うことができる。また、これら実施の形態の中で説明した特徴の組合せの全てが発明の課題を解決するための手段に必須であるとは限らない。さらに、これら実施の形態及び変形例は、発明の範囲及び要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
1…画像認識装置
10…カメラ
20…照明
30…制御部、31…画像処理部、32…重心検出部、33…基準点検出部、34…フレーム間演算部、35…動作識別部
60…撮像範囲
80…手
100…フレーム画像、110…背景

Claims (3)

  1. 所定の方向から撮像対象物を撮像する撮像手段と、
    前記撮像手段により撮像された前記所定の方向と直交する面内の画像情報に基づいて、前記撮像対象物の基準点の動作軌跡の傾きを算出し、前記動作軌跡の傾きの正負反転の個数に基づいて、前記撮像対象物の所定の動作種別を検出する制御部と、
    を有することを特徴とする画像認識装置。
  2. 前記撮像手段は単眼カメラであり、前記所定の方向は前記単眼カメラの光軸方向であることを特徴とする請求項1に記載の画像認識装置。
  3. 前記制御部は、前記正負反転の個数が4以上の場合に、前記撮像対象物の所定の動作種別は回転動作であると判定することを特徴とする請求項1又は2に記載の画像認識装置。
JP2016139819A 2016-07-14 2016-07-14 画像認識装置 Pending JP2018010538A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016139819A JP2018010538A (ja) 2016-07-14 2016-07-14 画像認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016139819A JP2018010538A (ja) 2016-07-14 2016-07-14 画像認識装置

Publications (1)

Publication Number Publication Date
JP2018010538A true JP2018010538A (ja) 2018-01-18

Family

ID=60993861

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016139819A Pending JP2018010538A (ja) 2016-07-14 2016-07-14 画像認識装置

Country Status (1)

Country Link
JP (1) JP2018010538A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112109069A (zh) * 2019-06-21 2020-12-22 发那科株式会社 机器人示教装置以及机器人系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112109069A (zh) * 2019-06-21 2020-12-22 发那科株式会社 机器人示教装置以及机器人系统
DE102020115670B4 (de) 2019-06-21 2025-05-22 Fanuc Corporation Roboter-lerngerät und robotersystem

Similar Documents

Publication Publication Date Title
CN106951871B (zh) 操作体的运动轨迹识别方法、装置和电子设备
US9696814B2 (en) Information processing device, gesture detection method, and gesture detection program
EP3411827B1 (en) System and method for detecting hand gestures in a 3d space
US8339359B2 (en) Method and system for operating electric apparatus
US20130279756A1 (en) Computer vision based hand identification
JP2015519624A5 (ja)
CN111095164A (zh) 用于依据姿态来检测用户输入的方法和设备
KR20120035604A (ko) 영상 기반의 손 검출 장치 및 그 방법
TWI496094B (zh) 手勢辨識模組及手勢辨識方法
TW201926141A (zh) 影像目標追蹤方法及裝置
JP6657024B2 (ja) ジェスチャ判定装置
JP2014137762A (ja) 物体検出装置
CN106056080B (zh) 一种可视化的生物计量信息采集装置和方法
JP2018195052A (ja) 画像処理装置、画像処理プログラム及びジェスチャ認識システム
CN104095639A (zh) 热释电红外传感器阵列的运动检测方法及运动检测系统
JP7163649B2 (ja) ジェスチャ検出装置、ジェスチャ検出方法、およびジェスチャ検出制御プログラム
US10474297B2 (en) Projecting a structured light pattern onto a surface and detecting and responding to interactions with the same
JP2018010538A (ja) 画像認識装置
JP2017191426A (ja) 入力装置、入力制御方法、コンピュータプログラム、及び記憶媒体
US12445714B2 (en) Information processing apparatus, image capturing system, method, and non-transitory computer-readable storage medium for selecting a trained model
JP2018010539A (ja) 画像認識装置
JP2018088183A (ja) 画像認識装置
KR102159996B1 (ko) 이벤트 필터링 장치 및 이를 이용한 동작 인식 장치
JP2018077744A (ja) ジェスチャ判定装置及びジェスチャ判定方法
JP2017227966A (ja) ジェスチャ判定装置