[go: up one dir, main page]

JP2018142074A - 特徴量算出装置、画像類似度判定装置、画像検索装置、特徴量算出方法及びプログラム - Google Patents

特徴量算出装置、画像類似度判定装置、画像検索装置、特徴量算出方法及びプログラム Download PDF

Info

Publication number
JP2018142074A
JP2018142074A JP2017034779A JP2017034779A JP2018142074A JP 2018142074 A JP2018142074 A JP 2018142074A JP 2017034779 A JP2017034779 A JP 2017034779A JP 2017034779 A JP2017034779 A JP 2017034779A JP 2018142074 A JP2018142074 A JP 2018142074A
Authority
JP
Japan
Prior art keywords
image data
similarity
feature
feature quantity
query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017034779A
Other languages
English (en)
Inventor
中島 章
Akira Nakajima
章 中島
藤原 直之
Naoyuki Fujiwara
直之 藤原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Heavy Industries Ltd
Original Assignee
Mitsubishi Heavy Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Heavy Industries Ltd filed Critical Mitsubishi Heavy Industries Ltd
Priority to JP2017034779A priority Critical patent/JP2018142074A/ja
Publication of JP2018142074A publication Critical patent/JP2018142074A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

【課題】回転やスケール以外の加工処理(例えば、トリム、ぼかし、ノイズ、色の変更、明るさの変更、コントラストの変更、文字や図形の重ね書きなど)が1種類または複数種類加えられた画像データについて、加えられた加工処理の種類やその数が不明な状態であっても高い精度で類似する画像データを検索できるような特徴量ベクトルを抽出する。【解決手段】入力された画像データから、前記データの特徴を示す特徴量ベクトルを算出する特徴量算出装置であって、画像データの入力を受け付ける画像受付手段と、画像データに対する複数の加工処理の種類ごとに予め定められた特徴量ベクトルの抽出方法を用いて、前記画像データから前記抽出方法ごとに特徴量ベクトルを抽出する特徴量抽出手段、を備える特徴量算出装置が提供される。【選択図】図1

Description

本発明は、画像データから、当該データの特徴を示す特徴量ベクトルを算出する特徴量算出装置、特徴量算出方法及びプログラムに関するものである。また、算出した特徴量ベクトルを用いた画像類似度判定装置、画像検索装置に関するものである。
大量の画像データの中から目的の画像を探す手段として、検索したい画像データを入力し、画像データから抽出される特徴量ベクトルに基づいて画像の類似度を評価し、類似している画像データを検索するやり方が知られている。この特徴量ベクトルの抽出については、SIFT(Scale Invariant Feature Transformation)、SURF(Speed Upped Robust Feature)、ORB(Oriented BRIEF)など、これまでにいくつかの方法が提案されている(例えば、非特許文献1)。また、検索したい画像データに回転やスケールの変更があった場合にも、高い検索精度で実行できる特徴量ベクトルの抽出方法が開示されている(例えば、特許文献1)。
特許第5819158号公報
D.G.Lowe,"Distinctive Image Features from Scale-Invariant Keypoints", International Journal of Computer Vision, Vol.60, No.2, 91−110 (204).
しかしながら、回転やスケール以外の変更、例えば、トリム、コントラストや明るさの変更、ぼかし、ノイズ、色の変更、文字や図形の重ね書きなどの加工処理が1種類または複数種類加えられた画像データについて、加えられた加工処理の種類やその数が不明な状態であっても高い精度で類似する画像データを検索できるような特徴量ベクトルを抽出する方法がなかった。
そこでこの発明は、上述の課題を解決することのできる特徴量算出装置、画像類似度判定装置、画像検索装置、特徴量算出方法及びプログラムの提供を目的としている。
本発明の第1の態様によれば、特徴量算出装置は、画像データの入力を受け付ける画像受付手段と、画像データに対する複数の加工処理の種類ごとに予め定められた特徴量ベクトルの抽出方法を用いて、前記画像受付手段が受け付けた画像データから前記抽出方法ごとに特徴量ベクトルを抽出する特徴量抽出手段、を備える。
このような構成により、複数の加工処理それぞれの観点から、ある画像データの特徴を表す特徴量ベクトルを抽出することができる。
本発明の第2の態様によれば、前記加工処理の種類ごとに予め定められた抽出方法は、当該加工処理によって変化しない特徴量ベクトルを画像データから抽出する抽出方法である。
本発明の第3の態様によれば、前記加工処理の種類が、画像データの回転、スケールの変更、縦横比の変更、部分切り出し、色調変化、モノクロ化、図形重ね書き、文字重ね書き、トリム、明るさの変更、コントラストの変更、ぼかし、ノイズのうちの少なくとも2つである。
第2の態様または第3の態様によれば、加工処理ごとにその加工処理の影響を受けにくい特徴量ベクトルを抽出することができる。
本発明の第4の態様によれば、画像類似度判定装置は、入力されたクエリ画像データと、参照画像データとの間の類似度を判定する画像類似度判定装置であって、上記の何れか1つに記載の特徴量算出装置を用いて、前記参照画像データから前記抽出方法ごとの特徴量ベクトルを抽出する参照用特徴量抽出手段と、上記の何れか1つに記載の特徴量算出装置を用いて、前記クエリ画像データから前記抽出方法ごとの特徴量ベクトルを抽出するクエリ用特徴量抽出手段と、前記クエリ画像データから得られる複数の特徴量ベクトルと前記参照画像データから得られる複数の特徴量ベクトルとに基づいて、前記クエリ画像データと前記参照画像データの類似度を算出する類似度算出手段と、算出された前記類似度に基づいて、前記クエリ画像データと前記参照画像データの類似度を判定する類似度判定手段と、を備える。
このような構成により、対象とする2つの画像データのうち一方が、他方の画像データに対して1つまたは複数種類の加工処理が施された画像データである場合であっても、2つの画像データ間の類似度を判定することができる。
本発明の第5の態様によれば、前記類似度算出手段は、前記クエリ画像データおよび前記参照画像データから前記抽出方法のうち同じ抽出方法を用いて抽出した特徴量ベクトル同士の類似度を算出し、当該算出した複数の抽出方法それぞれに対応する類似度に基づいて、前記クエリ画像データと前記参照画像データの類似度を算出する。
このように複数の加工処理ごとの特徴量ベクトル同士の類似度を組み合わせて、画像データ間の類似度を算出する構成とすることで、前記類似度算出手段は、複数の加工処理に対応した類似度を算出することができる。
本発明の第6の態様によれば、画像検索装置は、複数の参照画像データの中から、入力されたクエリ画像データに類似する参照画像データを検索する画像検索装置であって、前記複数の参照画像データの各々と前記クエリ画像データとの間の類似度を判定する上記の何れか1つに記載の画像類似度判定装置と、前記画像類似度判定装置が判定した類似度に基づいて、前記複数の参照画像データの中から前記クエリ画像データに類似する画像データの候補を抽出する類似画像抽出手段と、を備える。
このような構成により、複数の参照画像データの中から、クエリ画像データに類似する画像データを抽出することができる。
本発明の第7の態様によれば、特徴量算出方法は、画像データの入力を受け付ける画像受付工程と、画像データに対する複数の加工処理の種類ごとに予め定められた特徴量ベクトルの抽出方法を用いて、前記受け付けた画像データから前記抽出方法ごとに特徴量ベクトルを抽出する特徴量抽出工程と、を有する。
本発明の第8の態様によれば、特徴量処理プログラムは、コンピュータを、画像データの入力を受け付ける手段、画像データに対する複数の加工処理の種類ごとに予め定められた特徴量ベクトルの抽出方法を用いて、前記受け付けた画像データから前記抽出方法ごとに特徴量ベクトルを抽出する手段、として機能させる。
本発明の特徴量算出装置によれば、画像データに加えられた加工処理の種類やその数に依存せずに用いることができるその画像データの特徴量ベクトルを抽出することが可能となる。
本発明の実施形態に係る画像検索システムのシステム構成の一例を示す図である。 本発明の実施形態に係る画像検索システムのハードウエア構成の一例を示す図である。 本発明の実施形態に係る記憶装置が記憶する各種テーブルの一例を示す図である。 本発明の実施形態に係る特徴量算出装置の処理の流れの一例を示すフローチャートである。 本発明の実施形態に係る特徴量ベクトルの一例を示す図である。 本発明の実施形態に係る画像検索システムの処理の流れの一例を示すフローチャートである。 本発明の実施形態に係る記憶装置が記憶するテーブルの他の例を示す図である。
以下では、本発明の一実施形態について、図面を用いて詳細に説明する。
(システム構成)
図1は、本発明の実施形態に係る画像検索システムの構成を示すシステム構成の一例を示す図である。
画像検索システム100は、大量の参照画像データの中から、クエリ画像データに類似する画像データを検索する。この類似性の判断は、画像データの特徴量ベクトルを比較することにより行う。
図1によれば、画像検索システム100は、参照画像データやその参照画像データの特徴量ベクトル等をデータベース化して記憶する記憶装置300と、記憶装置300上のデータベースを管理するとともに、当該データベースの検索等を可能とする管理コンピュータ200とを含んで構成される。また、管理コンピュータ200には、記憶装置300が接続されている。さらに、この管理コンピュータ200には、例えばインターネット等のネットワークを介して端末400A、400B、400C、400Dと接続されている。端末400A等は、管理コンピュータ200へアクセスすることができる。例えば、端末400Aからユーザがクエリ画像データを入力すると、管理コンピュータ200は、複数の参照画像データの中からクエリ画像データに類似した画像データを抽出する。ユーザは、管理コンピュータ200によって抽出されたクエリ画像データに類似する参照画像データの候補を、端末400Aから確認することができる。
管理コンピュータ200は、特徴量ベクトル抽出部210、画像受付部220、類似度算出部230、および類似度判定部240と、結果出力部250と、を備える。
画像受付部220は、例えばイメージスキャナーやデジタルカメラなどの画像入力手段を用いた参照画像データの入力、あるいは外部記憶装置内に保管されている参照画像データのネットワーク等の通信を介した通信入力手段を用いた入力、を受け付ける。あるいは、画像受付部220は、例えば、マウス、キーボード、タッチパネル等の各種入力手段を用いた参照画像データの入力を受け付けてもよい。画像受付部220は、受け付けた参照画像データを記憶装置300の参照データ記憶部310に格納する。
特徴量ベクトル抽出部210は、記憶装置300の参照データ記憶部310に格納されている参照画像データから、予め登録された複数の特徴量ベクトル抽出方法を用いて、参照画像データに関する特徴量ベクトルを複数抽出する。複数の特徴量ベクトルの各々は、複数の特徴量ベクトル抽出方法のうち、各々の特徴量ベクトルに対応する特徴量ベクトル抽出方法によって抽出されたものである。特徴量ベクトル抽出部210は、抽出したそれら複数の特徴量ベクトルを記憶装置300の参照データ記憶部310に格納する。
また、画像受付部220は、各種入力手段を用いたクエリ画像データの入力を受け付ける。画像受付部220は、受け付けたクエリ画像データを記憶装置300のクエリデータ記憶部320に格納する。
特徴量ベクトル抽出部210は、記憶装置300のクエリデータ記憶部320に格納されているクエリ画像データから、予め登録された複数の特徴量ベクトル抽出方法を用いて、前記クエリ画像データに関する特徴量ベクトルを複数抽出する。複数の特徴量ベクトルの各々は、複数の特徴量ベクトル抽出方法のうち、各々の特徴量ベクトルに対応する特徴量ベクトル抽出方法よって抽出されたものである。特徴量ベクトル抽出部210は、抽出したそれら複数の特徴量ベクトルを記憶装置300のクエリデータ記憶部320に格納する。
類似度算出部230は、記憶装置300のクエリデータ記憶部320に格納されているクエリ画像データの複数の特徴量ベクトルと、記憶装置300の参照データ記憶部310に格納されている参照画像データの複数の特徴量ベクトルとに基づいて、クエリ画像データに対する参照画像データの類似度を算出する。類似度算出部230は、算出した参照画像データごとの類似度を参照画像データの識別子と対応付けて記憶装置300の類似度データ記憶部330に格納する。
類似度判定部240は、記憶装置300の類似度データ記憶部330に格納されているクエリ画像データに対する参照画像データの類似度に基づいて、全ての参照画像データとクエリ画像データの類似度を判定する。また、類似度判定部240は、判定の結果に基づいて、全ての参照画像データの中からクエリ画像データに類似する画像データの候補を抽出し、結果出力部250に出力する。結果出力部250は抽出された画像データの候補を出力する。
(ハードウエア構成)
一実施形態に係る管理コンピュータ200は、例えば一般的なコンピュータ500を用いて実現することができる。図2にコンピュータ500の構成の一例を示す。
図2は、本発明の実施形態に係る画像検索システムのハードウエア構成の一例を示す図である。
コンピュータ500は、CPU(Central Processing Unit)501、RAM(Random Access Memory)502、ROM(Read Only Memory)503、ストレージ装置504、外部I/F(Interface)505、入力装置506、出力装置507、通信I/F508等を有する。これらの装置はバスBを介して相互に信号の送受信を行う。
CPU501は、ROM503やストレージ装置504等に格納されたプログラムやデータをRAM502上に読み出し、処理を実行することで、コンピュータ500の各機能を実現する演算装置である。RAM502は、CPU501のワークエリア等として用いられる揮発性のメモリである。ROM503は、電源を切ってもプログラムやデータを保持する不揮発性のメモリである。ストレージ装置504は、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)等により実現され、OS(Operation System)、アプリケーションプログラム、及び各種データ等を記憶する。外部I/F505は、外部装置とのインタフェースである。外部装置には、例えば、記録媒体509等がある。コンピュータ500は、外部I/F505を介して、記録媒体509の読取り、書き込みを行うことができる。記録媒体509には、例えば、光学ディスク、磁気ディスク、メモリカード、USB(Universal Serial Bus)メモリ等が含まれる。
入力装置506は、例えば、マウス、及びキーボード等で構成され、操作者の指示を受けてコンピュータ500に各種操作等を入力する。出力装置507は、例えば、液晶ディスプレイにより実現され、CPU501による処理結果を表示する。通信I/F508は、有線通信又は無線通信により、コンピュータ500をインターネット等のネットワークに接続するインタフェースである。バスBは、上記各構成装置に接続され、制御装置間で各種制御信号等を送受信する。
次に図3を用いて、記憶装置300が記憶する各テーブルについて説明する。
図3は、本発明の実施形態に係る記憶装置が記憶する各種テーブルの一例を示す図である。
図3(a)に示す記憶装置300の参照データ記憶部310が記憶する参照データ管理テーブル600は、各参照画像データを、当該参照画像データに割り当てられている画像識別子、および当該参照画像データの特徴量ベクトルと対応付けて記憶するテーブルである。
例えば図3(a)の1行目のデータは、参照画像データ「P0001」の画像識別子は「#00001」であり、参照画像データ「P0001」に関する特徴量ベクトル「VA00001」は特徴量ベクトル抽出部210が「抽出方法a」によって抽出した特徴量ベクトルであることを示す。同様に図3(a)の1行目のデータのうち「VB00001」、「VC00001」は、それぞれ特徴量ベクトル抽出部210が「抽出方法b」、「抽出方法c」によって抽出した特徴量ベクトルであることを示す。
ここで、抽出方法aとは、例えば、画像データに対する加工処理「トリム」に対応する抽出方法である。加工処理「トリム」に対応する抽出方法aとは、加工処理「トリム」により変化しない特徴量ベクトルを抽出できることが分かっている処理である。抽出方法aは、例えば、SIFT、CNN(Convolutional Neural Network)等の公知の方法であってもよい。また、ユーザがある画像データαに対してトリムを行う場合、その画像データαの重要な部分だけを残して、残りをトリムすることが多いと考えられる。画像データαの重要な部分が画像データαの中央部分に存在すると仮定すると、抽出方法aは、例えば、SIFT等の方法により算出された画像データαの特徴量ベクトルについて、画像データαの中央部分から抽出した特徴量ベクトルに対してはより大きな重みを付け、周縁部から抽出した特徴量ベクトルに対しては小さな重みを付して抽出方法aによる特徴量ベクトルとする抽出方法であってもよい。なお、ある加工処理により変化しない(影響を受けない)特徴量ベクトルとは、加工処理の前後で完全に一致することを要する特徴量ベクトルの意味に限定されず、加工処理の前後で抽出される2つの特徴量ベクトルの差が、所定の所要範囲内に含まれることを意味する。
また、例えば、抽出方法bとは、抽出方法bが画像データαに対する加工処理「図形追加」に対応する抽出方法であるとした場合、加工処理「図形追加」を行っても変化しない特徴量ベクトルを抽出する処理である。例えば、画像データの一部の領域の特徴量ベクトルだけが変化し、残りの領域については変化がないことが加工処理「図形追加」の特徴であるとすると、抽出方法bは、特徴量ベクトルの変化がない領域に比べ、特徴量ベクトルの変化が大きい一部の領域の特徴量ベクトルには小さな重みを付けて抽出方法bによる特徴量ベクトルとする抽出方法であってもよい。
同様に抽出方法cが画像データαに対する加工処理「明るさの変更」に対応する抽出方法であるとした場合、抽出方法cは、明るさの変更によって変化しない特徴量ベクトルを抽出する処理である。このように本実施形態では、特徴量ベクトル抽出部210が加工処理ごとにその加工処理によって影響されない特徴量ベクトル、換言すればその加工処理に強い特徴量ベクトルを抽出する処理方法を有している。
特徴量ベクトル抽出部210は、ユーザが端末400A等に入力した参照画像データ「P00001」について、加工処理aに対応する抽出方法aを用いて、加工処理aに強い特徴量ベクトル「VA00001」を抽出する。特徴量ベクトル抽出部210は、「VA00001」を、記憶装置300の参照データ記憶部310に格納する。抽出方法b、cについても同様である。
このように参照データ記憶部310の参照データ管理テーブル600には、ユーザが入力した参照画像データについての複数の加工処理ごとの特徴量ベクトルが格納される。
図3(b)に示す記憶装置300のクエリデータ記憶部320が記憶するクエリデータ管理テーブル610は、クエリ画像データを、当該クエリ画像データに割り当てられている画像識別子、および当該クエリ画像データの特徴量ベクトルと対応付けて記憶するテーブルである。例えば、このテーブルは、クエリ画像毎に算出されるテーブルである。
例えば図3(b)のデータは、クエリ画像データ「QP0001」の画像識別子は「Q#00001」であり、クエリ画像データ「QP0001」に関する特徴量ベクトル「QVA00001」は特徴量ベクトル抽出部210が「抽出方法a」によって抽出した特徴量ベクトルであることを示す。同様に図3(b)のデータのうち「QVB00001」、「QVC00001」はそれぞれ、特徴量ベクトル抽出部210が「抽出方法b」、「抽出方法c」によって抽出した特徴量ベクトルであることを示す。
特徴量ベクトル抽出部210は、ユーザが端末400A等に入力した参照画像データ「QP00001」について、加工処理aに対応する抽出方法aを用いて、加工処理aに強い特徴量ベクトル「QVA00001」を抽出する。この抽出方法aは、図3(a)で説明した抽出方法aと同じ抽出処理である。特徴量ベクトル抽出部210は、「QVA00001」を、記憶装置300のクエリデータ記憶部320に格納する。抽出方法b、cについても同様である。
このようにクエリデータ記憶部320のクエリデータ管理テーブル610には、ユーザが入力したクエリ画像データについて、複数の加工処理ごとの特徴量ベクトル(各々は参照画像データと同様の抽出処理によって抽出される)が格納される。
図3(c)に示す記憶装置300の類似度データ記憶部330が記憶する類似度データ管理テーブル620は、各参照画像データに割り当てられている画像識別子と、クエリ画像データに対する前記参照画像データの類似度とを対応付けて記憶するテーブルである。例えば、このテーブルは、クエリ画像毎に算出されるテーブルである。
図3(c)のデータは、図3(a)に例示する参照画像データ「P00001」〜「P00003」と図3(b)に例示するクエリ画像データ「QP00001」との類似度を示す。例えば、図3(c)の1行目データは、クエリ画像データ「QP00001」と参照画像データ「P00001」(画像識別子:#00001)の類似度は「X00001」であることを示す。
類似度算出部230は、参照データ管理テーブル600が記憶する参照画像データ「P00001」の抽出方法ごとの特徴量ベクトル「VA00001」、「VB00001」、「VC00001」とクエリデータ管理テーブル610が記憶する抽出方法ごとの特徴量ベクトル「QVA00001」、「QVB00001」、「QVC00001」とを用いて類似度「X00001」を算出する。具体的には、まず、類似度算出部230は、同じ種類の抽出方法によって抽出された特徴量ベクトル同士を比較して、類似度を算出する。例えば、類似度算出部230は、抽出方法aによる参照画像データの特徴量ベクトル「VA00001」と抽出方法aによるクエリ画像データの特徴量ベクトル「QVA00001」の類似度を、例えば、それら2つのベクトルのコサイン類似度により算出する。コサイン類似度によって算出された類似度は、0から1の間の値を取り、その値が1に近い程、2つのベクトルが類似していることを示す。なお、類似度の算出方法はコサイン類似度に限定されず他の方法であってよい。例えば、ベクトル間のユークリッド距離を求めて、距離が近い程、類似度が高いとしてもよい。また、類似度算出部230は、抽出方法bによる参照画像データの特徴量ベクトル「VB00001」と抽出方法bによるクエリ画像データの特徴量ベクトル「QVB00001」との類似度を算出し、抽出方法cによる参照画像データの特徴量ベクトル「VC00001」と抽出方法cによるクエリ画像データの特徴量ベクトル「QVC00001」との類似度を算出する。次に、類似度算出部230は、これら抽出方法a〜cごとに算出した類似度に基づいて、参照画像データ「P00001」とクエリ画像データ「QP00001」との類似度「X00001」を算出する。類似度の算出方法については、後に図5を用いて説明する。参照画像データ「P00002」、「P00003」についても同様である。
(処理の流れ)
次に図1の構成および図3の各種データを例に、図4を用いて参照画像データの特徴量ベクトル算出処理について説明する。
図4は、本発明の実施形態に係る特徴量算出装置の処理の流れの一例を示すフローチャートである。
前提として、ユーザが、参照画像データ「P00001」、「P00002」、「P00003」を端末400Aに入力したとする。すると、端末400Aは、それら3つの画像データを管理コンピュータ200に送信する。管理コンピュータ200では、画像受付部220が、これら3つの画像データを受信し、記憶装置300に格納する。より具体的には、画像受付部220は、参照画像データ「P00001」をその画像識別子と対応付けて、参照データ管理テーブル600に格納する。画像受付部220は、参照画像データ「P00002」、「P00003」についても同様に各々の画像識別子と対応付けて参照データ管理テーブル600に格納する。なお、参照画像データの画像識別子については、画像受付部220が算出してもよいし、記憶装置300で稼働するデータベースシステム等が算出してもよい。このように記憶装置300に参照画像データが格納されると、例えばユーザによる指示によって、管理コンピュータ200は、参照画像データの特徴量ベクトル抽出処理を開始する。
まず、特徴量ベクトル抽出部210は、参照画像データを記憶装置300から取り込む(ステップS101)。より具体的には、特徴量ベクトル抽出部210は、記憶装置300の参照データ記憶部310(参照データ管理テーブル600)に格納されている3つの参照画像データ「P00001」〜「P00003」を読み出して取り込む。
次に特徴量ベクトル抽出部210は、取り込んだ参照画像データから、予め登録された複数の特徴量ベクトル抽出方法を用いて、前記参照画像データに関する複数の特徴量ベクトルを抽出する(ステップS102)。より具体的には、まず、参照画像データ「P00001」〜「P00003」について、特徴量ベクトル抽出部210は、抽出方法aを用いて「VA00001」〜「VA00003」を抽出する。また、特徴量ベクトル抽出部210は、抽出方法bを用いて「VB00001」〜「VB00003」を抽出する。また、特徴量ベクトル抽出部210は、抽出方法cを用いて「VC00001」〜「VC00003」を抽出する。特徴量ベクトル抽出部210は、「VA00001」〜「VC00001」を参照画像データ「P00001」と対応付けて参照データ管理テーブル600に格納する。参照画像データ「P00002」、「P00003」についても同様である。画像検索システム100は、図4の処理により、大量の参照画像データを受け付け、それらの特徴量ベクトルを抽出し、その結果を記憶装置300に格納する。
次に、図5を用いて、画像データ間の類似度の算出方法について説明する。
図5は、本発明の実施形態に係る特徴量ベクトルの一例を示す図である。
特徴量ベクトル抽出部210が、参照画像データについて抽出した特徴量ベクトルをx、xおよびxとする。また、特徴量ベクトル抽出部210が、参照画像データについて抽出した特徴量ベクトルをy、yおよびyとする。
類似度算出部230は、所定の類似度算出方法(コサイン類似度等)によって、xとyの類似度zを算出する。また、類似度算出部230は、所定の類似度算出方法によって、xとyの類似度zを算出し、同様にxとyの類似度zを算出する。このとき、類似度z、z、zを算出する類似度算出方法は、全て同じ算出方法でもよいし、加工処理ごとに全てが異なる算出方法であってもよい。
次いで、類似度算出部230は、これらの類似度z、z、zを用いて画像データ間の類似度Zを算出する。例えば、類似度算出部230は、抽出処理別(加工処理別)に算出した類似度z、z、zの合計値を算出し、これを類似度Zとしてもよい。あるいは、類似度算出部230は、加工処理ごとに適切な重みを付した類似度z、z、zの加重平均を算出してこれを類似度Zとしてもよい。また、類似度算出部230は、類似度z、z、zのうちの最大値を選択して、選択した値を類似度Zとして決定してもよい。あるいは、類似度算出部230は、類似度z、z、zの合計値と加重平均と最大値とを算出し、これらの合計を類似度Zとしてもよい。
このように類似度Zは、複数の特徴量ベクトル間の類似度を組み合わせて算出される。具体的には、類似度Zは、明るさ、色、コントラストなどの変更、トリム、回転、キャプション追加、図形追加などの人為的な加工のうち、一つまたは複数の加工処理が加わった画像データに対し、各加工処理によって変化することがない特徴量ベクトル同士の類似度を組み合わせた値である。このようにして得られた類似度Zは、例えば、複数の加工処理が施された画像データと、加工処理が施されていない元の画像データとの間の類似度の指標として用いることができる。この性質を利用すると、ある画像データβについて、多量の画像データの中から、画像データβに対して一つまたは複数の加工処理が行われた画像データを検索することができる。
次に図1の構成および図3の各種データを例に、画像データの検索処理について図6を用いて説明する。
図6は、本発明の実施形態に係る画像検索システムの処理の流れの一例を示すフローチャートである。
前提として、記憶装置300の参照データ記憶部310には、図4で説明した処理によって複数の参照画像データ「P00001」〜「P00003」等が格納されている。ユーザは、検索対象となるクエリ画像データ「QP00001」と検索指示情報を端末400Aに入力する。ここで、「QP00001」は参照画像データ「QP00001」に対して複数の加工処理を施した画像であるとする。端末400Aは、クエリ画像データ「QP00001」を管理コンピュータ200に送信する。管理コンピュータ200では、画像受付部220が、クエリ画像データ「QP00001」を受信し、記憶装置300に格納する。より具体的には、画像受付部220は、クエリ画像データ「QP00001」をその画像識別子と対応付けて、クエリデータ管理テーブル610に格納する。
すると、特徴量ベクトル抽出部210は、クエリ画像データ「QP00001」の特徴量ベクトルを抽出する(ステップS201)。この処理の流れは、図4で説明したステップS101〜ステップS102と同じなので説明を省略する。特徴量ベクトル抽出部210は、抽出した複数の特徴量ベクトルを類似度算出部230へ出力する。
次に類似度算出部230は、クエリ画像データの複数の特徴量ベクトルと、記憶装置300の参照データ記憶部310に格納されている参照画像データの特徴量ベクトルとに基づいて、クエリ画像データに対する参照画像データの類似度を抽出処理ごとに算出する。次に類似度算出部230は、クエリ画像データと参照画像データとの間の類似度Zを算出する。類似度Zは、クエリ画像データや参照画像データに施された一種類または複数種類の加工処理に影響されない特徴量ベクトル同士の類似度を考慮して得られる類似度である。類似度算出部230は、算出した類似度Zを、参照画像データの画像識別子に対応付けて記憶装置300の類似度データ記憶部330に格納する(ステップS202)。
次に類似度判定部240は、記憶装置300の類似度データ記憶部330に格納されているクエリ画像データに対する参照画像データの類似度Zに基づいて、クエリ画像データ「QP00001」に類似する参照画像データの候補を抽出する(ステップS203)。候補の抽出方法としては、例えば、算出した類似度Zが所定の閾値以上ならばその参照画像データはクエリ画像データに類似していると判定する。あるいは、類似度判定部240は、例えば、類似度Zが高いものから順に上位10件、あるいは類似度Zが高い上位5%を類似している画像と判定してもよい。あるいは、類似度判定部240は、2つの画像データの類似度Zを「高」、「中」、「低」などのランクに分けて判定してもよいし、80%等の割合で判定してもよい。類似度判定部240は、判定結果を結果出力部250に出力する。結果出力部250は、類似している画像データの候補を端末400Aに送信する。ユーザは、記憶装置300に格納されている参照画像データのうち、クエリ画像データに類似する画像データの候補を参照することができる。この例の場合、ユーザは、クエリ画像データ「QP00001」の類似する画像データとして、加工処理前の画像データ「P00001」を確認することができる。加工処理前の「P00001」を確認すると、ユーザは、その「P00001」を入手して、「P00001」に対して新たな加工を施す等の処理を行うことができ、ユーザの利便性が向上する。
この他にも図6で説明した画像データ検索処理を利用すると様々な応用が可能である。
図7は、本発明の実施形態に係る記憶装置が記憶するテーブルの他の例を示す図である。
図7に例示するのは、参照データ管理テーブル600の応用例である。図7に示す参照データ管理テーブル600は、図3(a)で示した項目に加え「利用制限」、「ファイルパス」の各項目を有している。図4のフローチャートで説明した処理において、参照画像データを登録する際に、その参照画像データに対する利用制限に関する情報や、その参照画像データを含むドキュメントファイルのパスの情報を参照画像データと対応付けて登録する。また、図6に示す画像データの検索処理にて、結果出力部250は、類似度判定部240によって類似すると判定された参照画像データと対応付けて記憶された利用制限の情報を、類似画像の候補と共に出力する。すると、ユーザは、自分が探しているクエリ画像データに利用制限があるかどうかを把握することができる。例えば、「利用制限」の値が「無し」であればユーザは、そのクエリ画像データ、あるいは候補として提示された類似する参照画像データを自由に利用することができる。また、「利用制限」の値が「社内のみ」であれば、ユーザは、クエリ画像データ等を社内用のドキュメントにのみ利用することができる。また、「利用制限」の値が「禁止」であれば、ユーザは、そのクエリ画像データは利用禁止であることを把握することができる。このように、本実施形態の画像検索処理は、画像データの不正利用防止の目的で応用することができる。
また、図6に示す画像データの検索処理にて、結果出力部250は、類似画像の候補と共にその類似画像データと対応付けて記憶されたファイルパス情報を出力する。すると、ユーザは、自分が探しているクエリ画像データに類似する画像データを含むファイルが何処に存在するかを知り、入手することができる。このように、本実施形態の画像検索処理は、クエリ画像データをキーとしたファイル検索の目的で応用することができる。
なお、画像データの不正利用防止、ファイル検索の何れの場合も、ユーザがクエリ画像データを含んだファイルを端末400Aに入力すると、管理コンピュータ200の画像データ抽出手段(図示せず)が、当該ファイルからファイルに含まれる画像データを抽出し、抽出した各画像データに対して、図6のステップS201〜ステップS203の処理を実行するように構成してもよい。
従来、人為的な加工を加えた画像データと、加工が加わる前の画像データとの一致・不一致を評価する場合、人手により行うことが多い。その場合、対象とする画像データの数が多いと、確認作業に多くの時間や費用が費やされたり、確認作業を行う人の熟練度により精度に差が生じたりする可能性がある。また、対象の画像データから特徴量ベクトルを抽出し、特徴量ベクトル同士の類似度によって画像データ同士の一致・不一致を評価することも行われている。しかし、対象画像が加工された画像データの場合、加工処理が加わったことにより特徴量ベクトルが変動してしまうため、加工処理前の元の画像データとの類似度の判定が正しくできないことが多い。また、画像データに対する加工処理の種類は複数存在するが、どの画像加工に対しても特徴量ベクトルが変動しない特徴量抽出処理は存在しない。これに対し、本実施形態によれば、以上説明したように、例えば、トリム、ぼかし、ノイズ、色調変化、コントラストや明るさの変更、モノクロ化、縦横比の変更、部分切り出し、文字や図形の重ね書き、回転、スケール変更などの加工処理が加えられた画像であっても、加工処理の種類を問わずに高い精度で類似度を評価するための複数の特徴量ベクトルを抽出することが可能となる。また、上で例示したような加工処理が1種類または複数種類施された加工後の画像データが存在したとして、その画像データにどのような加工処理が施されたのかは実際に加工処理を行ったユーザ以外知ることができない。本実施形態によれば、複数種類の加工処理に対応する特徴量ベクトルの抽出方法が予め用意されているので、加えられた加工処理の種類や数が不明な画像データが多数存在する状況であっても、その中から高い精度で類似する画像データを検索できるような複数の特徴量ベクトルを抽出することができる。
なお、上述した管理コンピュータ200における各処理の過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムを管理コンピュータ200のコンピュータが読み出して実行することによって、上記処理が行われる。ここでコンピュータ読み取り可能な記録媒体とは、磁気ディスク、光磁気ディスク、CD−ROM、DVD−ROM、半導体メモリ等をいう。また、このコンピュータプログラムを通信回線によってコンピュータに配信し、この配信を受けたコンピュータが当該プログラムを実行するようにしてもよい。
また、上記プログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
また、管理コンピュータ200は、1台のコンピュータで構成されていても良いし、通信可能に接続された複数のコンピュータで構成されていてもよい。
また実施形態の説明では、画像検索システム100を例示したが、例えば、1台のコンピュータに特徴量ベクトル抽出部210、画像受付部220の各機能部を実装して特徴量算出装置として構成することも可能である。この特徴量算出装置によれば、画像データを入力すると、その画像データに対して行う加工処理の有無に関係なく、その画像データから抽出できる複数の特徴量ベクトルを抽出することができる。インターネットの発展等により加工された画像データが広く流通する社会で、流通する画像データの監視や不正な利用を防止する目的で、元の画像データについての各種の加工処理に強い特徴量ベクトルを抽出しておくことは有効である。
また、例えば、1台のコンピュータに上記の特徴量算出装置の各機能部と、類似度算出部230、類似度判定部240の各機能部を実装して画像類似度判定装置として構成することも可能である。ユーザは、クエリ画像データと、参照画像データとを画像類似度判定装置に入力する。すると、画像類似度判定装置に含まれる上記の特徴量算出装置(クエリ用特徴量抽出手段)の各機能部は連動して、クエリ画像データについての複数の特徴量ベクトルを抽出する。また、画像類似度判定装置に含まれる上記の特徴量算出装置(参照用特徴量抽出手段)の各機能部は連動して、参照画像データについての複数の特徴量ベクトルを抽出する。そして、類似度算出部230は、複数の特徴量ベクトルごとにクエリ画像データと前記参照画像データの類似度を算出し、さらに複数の類似度を組み合わせて2つの画像データ間の類似度Zを算出する。次に類似度判定部240は、算出された類似度Zに基づいて、前記クエリ画像データと前記参照画像データの類似度を判定する。この画像類似度判定装置によれば、例えば、一見しただけでは元の画像データと加工後の画像データの関係にあるかどうかが分からない2つの画像データの類似度を確認する場面などで利用することができる。
その他、本発明の趣旨を逸脱しない範囲で、上記した実施の形態における構成要素を周知の構成要素に置き換えることは適宜可能である。また、この発明の技術範囲は上記の実施形態に限られるものではなく、本発明の趣旨を逸脱しない範囲において種々の変更を加えることが可能である。
なお、特徴量ベクトル抽出部210は特徴量抽出手段の一例、画像受付部220は画像受付手段の一例、類似度算出部230は類似度算出手段の一例、類似度判定部240は類似度判定手段の一例、類似度判定部240は、類似画像抽出手段の一例である。画像検索システム100は画像検索装置の一例である。
100・・・画像検索システム
200・・・管理コンピュータ
210・・・特徴量ベクトル抽出部
220・・・画像受付部
230・・・類似度算出部
240・・・類似度判定部
250・・・結果出力部
300・・・記憶装置
310・・・参照データ記憶部
320・・・クエリデータ記憶部
330・・・類似度データ記憶部
400・・・端末
500・・・一般的なコンピュータ
600・・・参照データ管理テーブル
610・・・クエリデータ管理テーブル
620・・・類似度データ管理テーブル

Claims (8)

  1. 画像データの入力を受け付ける画像受付手段と、
    画像データに対する複数の加工処理の種類ごとに予め定められた特徴量ベクトルの抽出方法を用いて、前記画像受付手段が受け付けた画像データから前記抽出方法ごとに特徴量ベクトルを抽出する特徴量抽出手段、
    を備える特徴量算出装置。
  2. 前記加工処理の種類ごとに定められた抽出方法は、当該加工処理によって変化しない特徴量ベクトルを画像データから抽出する抽出方法である、
    請求項1に記載の特徴量算出装置。
  3. 前記加工処理の種類が、画像データの回転、スケールの変更、縦横比の変更、部分切り出し、色調変化、モノクロ化、図形重ね書き、文字重ね書き、トリム、明るさの変更、コントラストの変更、ぼかし、ノイズのうちの少なくとも2つであることを特徴とする、
    請求項2に記載の特徴量算出装置。
  4. 入力されたクエリ画像データと、参照画像データとの間の類似度を判定する画像類似度判定装置であって、
    請求項1から請求項3の何れか1項に記載の特徴量算出装置を用いて、前記参照画像データから前記抽出方法ごとの特徴量ベクトルを抽出する参照用特徴量抽出手段と、
    前記特徴量算出装置を用いて、前記クエリ画像データから前記抽出方法ごとの特徴量ベクトルを抽出するクエリ用特徴量抽出手段と、
    前記クエリ画像データから得られる複数の特徴量ベクトルと前記参照画像データから得られる複数の特徴量ベクトルとに基づいて、前記クエリ画像データと前記参照画像データの類似度を算出する類似度算出手段と、
    算出された前記類似度に基づいて、前記クエリ画像データと前記参照画像データの類似度を判定する類似度判定手段と、
    を備える画像類似度判定装置。
  5. 前記類似度算出手段は、前記クエリ画像データおよび前記参照画像データから前記抽出方法のうち同じ抽出方法を用いて抽出した特徴量ベクトル同士の類似度を算出し、当該算出した複数の抽出方法それぞれに対応する類似度に基づいて、前記クエリ画像データと前記参照画像データの類似度を算出する、
    請求項4に記載の画像類似度判定装置。
  6. 複数の参照画像データの中から、入力されたクエリ画像データに類似する参照画像データを検索する画像検索装置であって、
    前記複数の参照画像データの各々と前記クエリ画像データとの間の類似度を判定する請求項4または請求項5に記載の画像類似度判定装置と、
    前記画像類似度判定装置が判定した類似度に基づいて、前記複数の参照画像データの中から前記クエリ画像データに類似する画像データの候補を抽出する類似画像抽出手段と、
    を備える画像検索装置。
  7. 画像データの入力を受け付ける画像受付工程と、
    画像データに対する複数の加工処理の種類ごとに予め定められた特徴量ベクトルの抽出方法を用いて、前記受け付けた画像データから前記抽出方法ごとに特徴量ベクトルを抽出する特徴量抽出工程と、
    を有する特徴量算出方法。
  8. コンピュータを、
    画像データの入力を受け付ける手段、
    画像データに対する複数の加工処理の種類ごとに予め定められた特徴量ベクトルの抽出方法を用いて、前記受け付けた画像データから前記抽出方法ごとに特徴量ベクトルを抽出する手段、
    として機能させるためのプログラム。
JP2017034779A 2017-02-27 2017-02-27 特徴量算出装置、画像類似度判定装置、画像検索装置、特徴量算出方法及びプログラム Pending JP2018142074A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017034779A JP2018142074A (ja) 2017-02-27 2017-02-27 特徴量算出装置、画像類似度判定装置、画像検索装置、特徴量算出方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017034779A JP2018142074A (ja) 2017-02-27 2017-02-27 特徴量算出装置、画像類似度判定装置、画像検索装置、特徴量算出方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2018142074A true JP2018142074A (ja) 2018-09-13

Family

ID=63528032

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017034779A Pending JP2018142074A (ja) 2017-02-27 2017-02-27 特徴量算出装置、画像類似度判定装置、画像検索装置、特徴量算出方法及びプログラム

Country Status (1)

Country Link
JP (1) JP2018142074A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200137161A (ko) * 2019-05-29 2020-12-09 주식회사 허그케어앤테라퓨틱스 인공지능기반 개인맞춤형 인지 중재 방법
WO2025105780A1 (ko) * 2023-11-13 2025-05-22 주식회사 픽스트리 유사 이미지 검출 방법 및 장치

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007004477A1 (ja) * 2005-06-30 2007-01-11 Nec Corporation 画像識別システム及び方法
JP2012234500A (ja) * 2011-05-09 2012-11-29 Canon Inc パターン識別装置、パターン識別方法およびプログラム
WO2013099038A1 (ja) * 2011-12-29 2013-07-04 楽天株式会社 画像検索システム、画像検索方法、画像検索装置、プログラム、及び情報記憶媒体
JP2016018444A (ja) * 2014-07-09 2016-02-01 日本電信電話株式会社 画像検索装置、方法、及びプログラム
JP2016040731A (ja) * 2015-11-04 2016-03-24 キヤノン株式会社 画像検索装置、画像検索方法及びプログラム
JP2017033372A (ja) * 2015-08-04 2017-02-09 日本放送協会 人物認識装置及びそのプログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007004477A1 (ja) * 2005-06-30 2007-01-11 Nec Corporation 画像識別システム及び方法
JP2012234500A (ja) * 2011-05-09 2012-11-29 Canon Inc パターン識別装置、パターン識別方法およびプログラム
WO2013099038A1 (ja) * 2011-12-29 2013-07-04 楽天株式会社 画像検索システム、画像検索方法、画像検索装置、プログラム、及び情報記憶媒体
JP2016018444A (ja) * 2014-07-09 2016-02-01 日本電信電話株式会社 画像検索装置、方法、及びプログラム
JP2017033372A (ja) * 2015-08-04 2017-02-09 日本放送協会 人物認識装置及びそのプログラム
JP2016040731A (ja) * 2015-11-04 2016-03-24 キヤノン株式会社 画像検索装置、画像検索方法及びプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200137161A (ko) * 2019-05-29 2020-12-09 주식회사 허그케어앤테라퓨틱스 인공지능기반 개인맞춤형 인지 중재 방법
KR102273149B1 (ko) 2019-05-29 2021-07-07 주식회사 허그케어앤테라퓨틱스 인공지능기반 개인맞춤형 인지 중재 방법
WO2025105780A1 (ko) * 2023-11-13 2025-05-22 주식회사 픽스트리 유사 이미지 검출 방법 및 장치

Similar Documents

Publication Publication Date Title
US9201879B2 (en) Method, apparatus and system for generating a feature vector
US20040243601A1 (en) Document retrieving method and apparatus
US20100074530A1 (en) Image processing apparatus, image processing method and program
CN111783805B (zh) 图像检索方法及装置、电子设备、可读存储介质
US20150063686A1 (en) Image recognition device, image recognition method, and recording medium
CN112818162A (zh) 图像检索方法、装置、存储介质和电子设备
US9436891B2 (en) Discriminating synonymous expressions using images
JP6017277B2 (ja) 特徴ベクトルの集合で表されるコンテンツ間の類似度を算出するプログラム、装置及び方法
CN115935344A (zh) 一种异常设备的识别方法、装置及电子设备
US10509986B2 (en) Image similarity determination apparatus and image similarity determination method
US9424484B2 (en) Feature interpolation
CN119478971A (zh) 一种图像数据要素价值评估方法、装置、终端及介质
CN113065025A (zh) 视频查重方法、装置、设备及存储介质
JP2018142074A (ja) 特徴量算出装置、画像類似度判定装置、画像検索装置、特徴量算出方法及びプログラム
CN112396048B (zh) 图片信息提取方法、装置、计算机设备及存储介质
US10853972B2 (en) Apparatus for processing image and method thereof
CN107909054A (zh) 图片文本的相似度评价方法及装置
JP6485072B2 (ja) 画像探索装置、画像探索方法および画像探索プログラム
CN113821689B (zh) 基于视频序列的行人检索方法、装置和电子设备
CN117690117A (zh) 服务于数据采集的结合语义分析的图像识别方法及装置
JP6485084B2 (ja) 画像探索装置、画像探索方法および画像探索プログラム
CN113536272A (zh) 基于用户肌肉记忆的用户身份验证方法及装置
CN109165488B (zh) 身份鉴别方法及装置
CN113157960A (zh) 相似数据获取的方法及装置、电子设备和计算机可读存储介质
JP2017207838A (ja) 画像検索装置、画像検索方法、画像検索プログラム、索引データ生成装置、索引データ生成方法および索引データ生成プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20170228

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20181109

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200214

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200214

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201211

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210112

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210315

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210427

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210623

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20210713