JP2013246790A - Recognition dictionary creation device and program - Google Patents
Recognition dictionary creation device and program Download PDFInfo
- Publication number
- JP2013246790A JP2013246790A JP2012122243A JP2012122243A JP2013246790A JP 2013246790 A JP2013246790 A JP 2013246790A JP 2012122243 A JP2012122243 A JP 2012122243A JP 2012122243 A JP2012122243 A JP 2012122243A JP 2013246790 A JP2013246790 A JP 2013246790A
- Authority
- JP
- Japan
- Prior art keywords
- image
- recognition dictionary
- data
- product
- cpu
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
【課題】認識辞書の作成に要する手間と時間を削減する。
【解決手段】認識辞書作成装置は、撮像手段で撮像された物品の画像を記憶部で記憶する。また認識辞書作成装置は、記憶部で記憶された画像を、当該画像に含まれる物品を撮像手段で異なる方向から撮像した画像に加工する。さらに認識辞書作成装置は、加工された画像から、当該画像に含まれる物品の特徴量データを抽出する。そして認識辞書作成装置は、抽出された特徴量データを認識辞書ファイルに登録する。
【選択図】 図4To reduce labor and time required for creating a recognition dictionary.
A recognition dictionary creation device stores an image of an article captured by an imaging unit in a storage unit. In addition, the recognition dictionary creation apparatus processes the image stored in the storage unit into an image obtained by capturing the articles included in the image from different directions with the imaging unit. Furthermore, the recognition dictionary creation device extracts feature amount data of articles included in the image from the processed image. The recognition dictionary creation device registers the extracted feature data in the recognition dictionary file.
[Selection] Figure 4
Description
本発明の実施形態は、画像からこの画像に含まれる物品を認識するシステムに用いられる認識辞書の作成装置及びコンピュータを当該認識辞書作成装置として機能させるためのプログラムに関する。 Embodiments described herein relate generally to a recognition dictionary creation device used in a system for recognizing an article included in an image from an image, and a program for causing a computer to function as the recognition dictionary creation device.
対象となる物品(オブジェクト)を撮像部で撮像した画像データから当該物品の特徴量を抽出し、認識辞書に登録された特徴量データと照合して類似度を算出し、この類似度に応じて当該物品の種別等を認識する技術がある。このような画像中に含まれる物品を認識する技術は、一般物体認識(generic object recognition)と呼ばれる。この一般物体認識の技術については、下記の文献において各種認識技術が解説されている。 The feature quantity of the article is extracted from the image data obtained by imaging the target article (object) with the imaging unit, and the similarity is calculated by comparing with the feature quantity data registered in the recognition dictionary. There is a technique for recognizing the type of the article. Such a technique for recognizing an article included in an image is called generic object recognition. Regarding this general object recognition technique, various recognition techniques are described in the following documents.
柳井 啓司,“一般物体認識の現状と今後”,情報処理学会論文誌,Vol.48,No.SIG16[平成22年8月10日検索],インターネット< URL: http://mm.cs.uec.ac.jp/IPSJ-TCVIM-Yanai.pdf >
また、画像をオブジェクト毎に領域分割することによって、一般物体認識を行う技術が、下記の文献において解説されている。
Jamie Shottonら,“Semantic Texton Forests for Image Categorization and Segmentation”,[平成22年8月10日検索],インターネット< URL: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.145.3036&rep=repl&type=pdf >
近年、例えば小売店の会計システム(POSシステム)において、顧客が買い上げる商品を認識する装置に、一般物体認識の技術を適用することが提案されている。
Keiji Yanai, “Current Status and Future of General Object Recognition”, IPSJ Journal, Vol. 48, no. SIG16 [Search August 10, 2010], Internet <URL: http://mm.cs.uec.ac.jp/IPSJ-TCVIM-Yanai.pdf>
Further, a technique for performing general object recognition by dividing an image into regions for each object is described in the following document.
Jamie Shotton et al., “Semantic Texton Forests for Image Categorization and Segmentation”, [Search August 10, 2010], Internet <URL: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1. 1.145.3036 & rep = repl & type = pdf>
In recent years, for example, in an accounting system (POS system) of a retail store, it has been proposed to apply a general object recognition technique to a device that recognizes a product purchased by a customer.
一般物体認識の技術において、認識精度を高めるには認識辞書を充実させることが重要である。認識辞書には、対象となる物品の外観形状、色合い、模様、凹凸具合等の表面情報をパラメータで表わす特徴量データが保存される。ただし同じ物品でも、表面情報はその物品の向きによって異なる。しかも、ユーザが物品をどの向きで撮像部に向けるかは定かでない。そこで、予め物品を様々な角度から撮影した画像データから表面情報の特徴量を抽出し、これらの特徴量を当該物品の特徴量データとして認識辞書に登録する必要がある。このため、認識辞書の作成に多大な手間と時間を要する。 In general object recognition technology, it is important to enhance the recognition dictionary in order to improve recognition accuracy. In the recognition dictionary, feature amount data that represents surface information such as the external shape, color, pattern, and unevenness of the target article as parameters is stored. However, even for the same product, the surface information varies depending on the orientation of the product. In addition, it is not certain in which direction the user points the article toward the imaging unit. Therefore, it is necessary to extract feature amounts of surface information from image data obtained by photographing an article in advance from various angles, and register these feature quantities in the recognition dictionary as feature quantity data of the article. For this reason, it takes a lot of labor and time to create a recognition dictionary.
本発明が解決しようとする課題は、認識辞書の作成に要する手間と時間を削減できる認識辞書作成装置を提供しようとするものである。 The problem to be solved by the present invention is to provide a recognition dictionary creation device that can reduce the labor and time required to create a recognition dictionary.
一実施形態において、認識辞書作成装置は、ファイルアクセス手段と、記憶手段と、加工手段と、抽出手段と、データ登録手段とを備える。ファイルアクセス手段は、認識対象である物品毎にその物品の表面情報を表わす特徴量データが保存される認識辞書ファイルにアクセスする。記憶手段は、撮像手段で撮像された物品の画像を記憶する。加工手段は、記憶手段で記憶された画像を、当該画像に含まれる物品を撮像手段で異なる方向から撮像した画像に加工する。抽出手段は、加工手段で加工された画像から、当該画像に含まれる物品の特徴量データを抽出する。データ登録手段は、抽出手段で抽出された特徴量データを、ファイルアクセス手段を介して認識辞書ファイルに登録する。 In one embodiment, the recognition dictionary creation device includes a file access unit, a storage unit, a processing unit, an extraction unit, and a data registration unit. The file access means accesses a recognition dictionary file in which feature amount data representing the surface information of each article is stored for each article to be recognized. The storage means stores an image of the article imaged by the imaging means. The processing means processes the image stored in the storage means into an image obtained by imaging the article included in the image from different directions by the imaging means. The extraction unit extracts feature amount data of an article included in the image from the image processed by the processing unit. The data registration unit registers the feature amount data extracted by the extraction unit in the recognition dictionary file via the file access unit.
以下、認識辞書作成装置に係る実施形態を、図面を用いて説明する。なお、本実施形態は、店舗会計システム(POSシステム)で利用される商品読取装置1に、認識辞書作成装置の機能を持たせた場合である。
Hereinafter, an embodiment according to a recognition dictionary creation device will be described with reference to the drawings. In the present embodiment, the
(第1の実施形態)
始めに,第1の実施形態について、図1〜図9を用いて説明する。
図1は、店舗会計システムの外観図である。このシステムは、顧客が買い上げる商品を登録する登録部としての商品読取装置1と、顧客の代金支払いを処理する決済部としてのPOS(Point Of Sales)端末2とを含む。商品読取装置1は、会計カウンタ3の上に取り付けられる。POS端末2は、レジ台4の上にドロワ5を介して設置される。商品読取装置1とPOS端末2とは、図示しない通信ケーブルによって電気的に接続される。
(First embodiment)
First, a first embodiment will be described with reference to FIGS.
FIG. 1 is an external view of a store accounting system. This system includes a
商品読取装置1は、キーボード11、タッチパネル12及び客用ディスプレイ13を備える。これらの表示・操作デバイス(キーボード11、タッチパネル12、客用ディスプレイ13)は、商品読取装置1の本体を構成する薄型矩形形状のハウジング1Aに取り付けられる。
The
ハウジング1Aには、撮像手段としての撮像部14が内蔵される。また、矩形状の読取窓1Bが、ハウジング1Aの正面に形成される。撮像部14は、エリアイメージセンサであるCCD(Charge Coupled Device)撮像素子及びその駆動回路と、撮像領域の画像をCCD撮像素子に結像させるための撮像レンズとを備える。撮像領域とは、読取窓1Bから撮像レンズを通してCCD撮像素子のエリアに結像するフレーム画像の領域を指す。撮像部14は、撮像レンズを通ってCCD撮像素子に結像した撮像領域の画像を出力する。
The
POS端末2は、決済に必要なデバイスとしてキーボード21、オペレータ用ディスプレイ22、客用ディスプレイ23及びレシートプリンタ24を備える。
The
会計カウンタ3は、その奥側の顧客通路に沿って細長い形状である。レジ台4は、会計カウンタ3に沿って移動する顧客の移動方向に対して下流側の会計カウンタ3の端部手前側に、会計カウンタ3に対して略垂直に置かれる。そして、この会計カウンタ3の手前側とレジ台4の手前側が、会計担当の店員いわゆるキャッシャのスペースとなる。
The checkout counter 3 has an elongated shape along the customer passage on the back side. The
会計カウンタ3の略中央には、商品読取装置1のハウジング1Aが、キーボード11、タッチパネル12及び読取窓1Bをそれぞれ手前側のキャッシャ側に向けて立設される。商品読取装置1の客用ディスプレイ13は、顧客通路側を向いてハウジング1Aに取り付けられる。
In the approximate center of the accounting counter 3, the
会計カウンタ3の商品読取装置1を挟んで顧客移動方向上流側の荷受面は、買物客が購入する未登録の商品Mが入れられた買物カゴ6を置くためのスペースとなる。また、下流側の荷受面は、商品読取装置1により登録された商品Mを入れるための買物カゴ7を置くためのスペースとなる。
The receiving surface on the upstream side of the customer movement direction across the
図2は、商品読取装置1とPOS端末2とのハードウェア構成を示すブロック図である。商品読取装置1は、制御部本体としてCPU(Central Processing Unit)101を搭載する。そしてこのCPU101に、アドレスバス,データバス等のバスライン102を介して、ROM103とRAM104とが接続される。ROM103には、CPU101によって実行されるプログラムが記憶される。
FIG. 2 is a block diagram illustrating a hardware configuration of the
この他、バスライン102には、入出力回路(不図示)を介して前記撮像部14が接続される。また、接続インターフェース105及び接続インターフェース106を介して、表示・操作デバイスであるキーボード11、タッチパネル12及び客用ディスプレイ13が、バスライン102に接続される。タッチパネル12は、例えば液晶ディスプレイを用いたパネル表示部121と、この表示部の画面上に重ねて配置されたタッチパネルセンサ122とを備える。
In addition, the
POS端末2も、制御部本体としてCPU201を搭載する。そしてこのCPU201に、バスライン202を介して、ROM203、RAM204、HDD(Hard Disk Drive)装置205、通信インターフェース206及び接続インターフェース207が接続される。また、バスライン202には、前記キーボード21、オペレータ用ディスプレイ22、客用ディスプレイ23、プリンタ24及びドロワ5の各部も、それぞれ入出力回路(不図示)を介して接続される。
The
通信インターフェース206は、LAN(Local Area Network)等のネットワークを介して、店舗の中枢を担うストアコンピュータSCと接続される。この接続により、POS端末2は、ストアコンピュータSCとデータの送受信が可能となる。例えばPOS端末2は、ストアコンピュータSCから商品データファイル(不図示)や認識辞書ファイル8を受信する。受信した商品データファイル及び認識辞書ファイル8は、HDD装置205に保存される。
The
接続インターフェース207は、通信ケーブルを介して、商品読取装置1の両接続インターフェース105,106と接続される。この接続により、POS端末2は、商品読取装置1で読み取られた商品情報を受信する。また、商品読取装置1は、HDD装置205に保存された商品データファイルや認識辞書ファイル8へのアクセスが可能となる。
The
図3は、認識辞書ファイル8に保存される辞書データの構造を示す模式図である。図3に示すように、認識辞書ファイル8には、認識対象である商品毎に、その商品を識別する商品ID及び商品名と関連付けて、N(Nは複数)個の特徴量データが保存される。特徴量データは、対応する商品IDで識別される商品の表面情報の特徴量をパラメータで表わしたものである。
FIG. 3 is a schematic diagram showing the structure of dictionary data stored in the
店舗で販売される各商品には、固有の商品IDが割当てられている。商品データファイルには、各商品の商品IDと関連付けて、商品名、単価、分類コード等の商品情報がプリセットされている。 A unique product ID is assigned to each product sold in the store. In the product data file, product information such as product name, unit price, and classification code is preset in association with the product ID of each product.
商品読取装置1は、業務モードとして少なくとも商品認識モードと認識辞書作成モードとを有する。商品認識モードは、顧客が買い上げる商品を認識し、その認識結果をPOS端末2に出力するモードである。認識辞書作成モードは、認識辞書ファイル8に未登録の新規商品の特徴量データを追加したり、認識辞書ファイル8に登録済の既存商品の特徴量データを更新したりすることで、認識辞書ファイル8を作成(編集)するモードである。これらの業務モードは、例えばタッチパネル12に表示されるメニュー画面から選択可能である。なお、認識辞書作成モードについては、パスワード入力等の認証手段を設けることによって、選択できるオペレータを制限することが好ましい。
The
商品認識モードが選択された場合、CPU101は、撮像部14に撮像オン信号を出力して撮像領域を撮像させる。そしてCPU101は、この撮像領域の画像データから商品の画像を取り込み、取り込んだ商品画像から当該商品の表面情報に関わる特徴量を抽出する。さらにCPU101は、抽出された特徴量を、認識辞書ファイル8に登録されている特徴量データと照合して類似度を算出する。そして、類似度が所定の閾値を超える特徴量データが認識辞書ファイル8に登録されていたならば、CPU101は、その特徴量データに関連付けられた商品IDを顧客の買上商品として認識して、POS端末2に出力する。
When the product recognition mode is selected, the
一方、認識辞書作成モードが選択された場合には、CPU101は、図4のブロック図で示される各機能、すなわち角度受付手段41、記憶手段42、加工手段43、抽出手段44及びデータ登録手段45を実現する。これらの機能は皆、プログラム記憶部であるROM103に格納された認識辞書作成プログラム(不図示)に従って実現される。
On the other hand, when the recognition dictionary creation mode is selected, the
角度受付手段41は、キーボード11やタッチパネル12等の入力部31を介して回転角度の入力を受け付ける。記憶手段42は、撮像部14で撮像された商品の画像を記憶部32に記憶させる。加工手段43は、記憶部32で記憶された商品の画像を、当該画像に含まれる商品を撮像部14で異なる方向から撮像した画像に加工する。抽出手段44は、加工手段43により加工された画像から、当該画像に含まれる商品の表面情報に関わる特徴量データを抽出する。データ登録手段45は、抽出手段44で抽出された特徴量データを、ファイルアクセス手段46を介して認識辞書ファイル8に登録する。ファイルアクセス手段46は、POS端末2のHDD装置205に保存される認識辞書ファイル8にアクセスする手段であり、本実施形態では接続インターフェース105が該当する。
The
記憶部32は、RAM104に形成される。記憶部32には、図5に示すように、基準画像メモリ321、加工画像メモリ322及び特徴量データのバッファメモリ323が設けられる。
The
基準画像メモリ321には、加工処理の基準となるフレーム画像が格納される。本実施形態では、撮像部14で撮像された画像を基準画像とする。
The
加工画像メモリ322には、上記基準画像から加工された画像が格納される。本実施形態では、図6に示すように、基準画像(フレーム画像)50の中心Oを回転中心として、当該基準画像51を右方向rに所定角度で回転させた画像が加工画像メモリ322に格納される。なお、画像の回転方向は右方向rに限定されるものではなく、その反対の左方向であってもよい。
The processed
バッファメモリ323には、基準画像及び複数の加工画像からそれぞれ抽出される同一商品の特徴量データが蓄積される。
The
図7は、認識辞書作成モードが選択されたときのCPU101の主要な情報処理手順を示す流れ図である。認識辞書作成モードが選択されると、認識辞書作成プログラムが起動する。このプログラムの起動により、CPU101は、商品ID、回転角度θ及びサンプル数nの受付画面をタッチパネル12に表示させる(ST101)。そしてCPU101は、上記受付画面から商品ID、回転角度θ及びサンプル数nがそれぞれ入力されるのを待機する(ST102:角度受付手段41)。
FIG. 7 is a flowchart showing the main information processing procedure of the
回転角度θとは、前記加工手段43が基準画像を右方向rに回転させた画像を加工する際の1加工当たりの回転角度である。本実施形態では、前記加工手段43が、基準画像を右方向rに回転角度θずつ回転させた画像をサンプル数nの数だけ加工し、その都度、前記抽出手段44が、加工した画像から商品の特徴量データを抽出してバッファメモリ323に保存する。
The rotation angle θ is a rotation angle per process when the
上記受付画面を確認したオペレータは、タッチパネル12またはキーボード11を操作して、辞書作成対象商品の商品IDと所望の回転角度θとサンプル数nとを入力する。なお、商品IDの代わりに商品名を入力してもよい。また、サンプル数nの入力は必須ではない。予め、回転角度θとサンプル数nとを対応付けた設定テーブルを用意しておき、回転角度θが選択されたならば、一義的にサンプル数nが決まるようにしてもよい。また、回転角度θについても、デフォルトの角度を予め設定しておき、回転角度θが入力されないときにはデフォルトの角度を回転角度θとしてもよい。
The operator who has confirmed the reception screen operates the
タッチパネル12のタッチ入力またはキーボード11のキー入力によって商品ID、回転角度θ及びサンプル数nがそれぞれ入力されたならば(ST102にてYES)、CPU101は、入力された商品ID、回転角度θ及びサンプル数nを、RAM104のワークエリアに格納する(ST103)。次いで、CPU101は、撮影キーが入力されるのを待機する(ST104)。
If product ID, rotation angle θ, and sample number n are input by touch input on
辞書作成対象商品の商品IDと回転角度θとサンプル数nとを入力したオペレータは、当該商品の面を読取窓1Bにかざす。そしてオペレータは、キーボード11またはタッチパネル12に設けられた撮影キーを入力する。
The operator who has input the product ID, the rotation angle θ, and the number of samples n of the dictionary creation target product holds the product surface over the reading
撮影キーが入力されると(ST104にてYES)、CPU101は、撮像部14に対して撮像オン信号を出力する(ST105)。撮像部14は、撮像オン信号に応じて撮像領域を撮像する。これにより、オペレータが読取窓1Bにかざしている商品の面が撮像部14によって撮像される。CPU101は、撮像部14で撮像されたフレーム画像を取り込む。そしてCPU101は、上記基準画像メモリ321に、上記フレーム画像を格納する(ST106:記憶手段42)。
When the photographing key is input (YES in ST104),
しかる後、CPU101は、図8に具体的に示す基準画像処理を実行する(ST107)。先ずCPU101は、第1カウンタiを“0”にリセットする(ST201)。次いでCPU101は、基準画像メモリ321のフレーム画像から当該画像に含まれる商品の特徴量データを抽出する(ST202)。
Thereafter, the
具体的には、CPU101は先ず、フレーム画像から、肌色領域の有無を検出する。肌色領域が検出された場合、すなわちオペレータの手の映り込みが検出された場合、CPU101は、フレーム画像を二値化した画像から輪郭線などを抽出する。これにより、CPU101は、オペレータの手が把持していると想定される商品Mの輪郭抽出を試みる。商品Mの輪郭が抽出されると、CPU101は、その輪郭内の画像を格子状のパッチに分け、そのパッチ毎に商品の形状、表面の色合い、模様、凹凸状況等の特徴量を読み取る。
Specifically, the
こうして、基準画像メモリ321のフレーム画像から商品のパッチ毎の特徴量データを抽出したならば、CPU101は、この抽出した特徴量データをバッファメモリ323の特徴量データi(iは第1カウンタiの値)に対応するエリアに格納する(ST203)。以上で、基準画像処理は終了する。したがって、バッファメモリ323の特徴量データ0に対応するエリアには、辞書作成対象商品を撮像部14で撮像したフレーム画像から抽出される商品のパッチ毎の特徴量データが格納される。
When the feature amount data for each patch of the product is extracted from the frame image of the
基準画像処理が終了すると、CPU101は、図9に具体的に示す加工画像処理を実行する(ST108)。
When the reference image processing ends, the
先ずCPU101は、第2カウンタjを“0”にリセットする(ST301)。次いでCPU101は、第2カウンタjを“1”だけカウントアップする(ST302)。そしてCPU101は、第2カウンタjがサンプル数nを超えたか否かを確認する(ST303)。
First, the
第2カウンタjがサンプル数nを超えていない場合(ST303にてNO)、CPU101は、第1カウンタiを“1”だけカウントアップする(ST304)。またCPU101は、基準画像メモリ321内の画像を、右方向rに角度jθ(jは第2カウンタjの値、θは回転角度)だけ回転させた画像に加工する(ST305:加工手段43)。
If second counter j does not exceed sample number n (NO in ST303),
CPU101は、加工された画像を加工画像メモリ322に格納する。そしてCPU101は、前記ステップST202の処理と同様にして、加工画像メモリ322に格納された画像から、当該画像に含まれる商品の特徴量データを抽出する(ST306:抽出手段44)。そしてCPU101は、この抽出した特徴量データをバッファメモリ323の特徴量データi(iは第1カウンタiの値)に対応するエリアに格納する(ST307)。
The
ステップST307の処理を終了すると、CPU101は、ステップST302の処理に戻る。すなわちCPU101は、第2カウンタjをさらに“1”だけカウントアップする。そしてCPU101は、第2カウンタjがサンプル数nを超えたか否かを確認する(ST303)。
When the process of step ST307 ends, the
第2カウンタjがサンプル数nを超えるまで、CPU101は、ステップST304〜ST307の処理を繰り返し実行する。第2カウンタjがサンプル数nを超えたならば(ST303にてYES)、加工画像処理は終了する。
Until the second counter j exceeds the number of samples n, the
加工画像処理が終了すると、CPU101は、辞書更新処理を実行する(ST109)。すなわちCPU101は、ワークメモリに記憶された商品IDとバッファメモリ323に記憶された特徴量データ0〜N(N=n+1)とを関連付ける。そしてCPU101は、この商品IDと特徴量データ0〜Nとを、接続インターフェース106を介して、POS端末205のHDD装置205に保存されている認識辞書ファイル8に追加登録する(データ登録手段45)。
When the processed image processing is completed, the
この際、認識辞書ファイル8に同一商品IDのデータが既に登録されていた場合には、CPU101は、この既存のデータを削除した後、今回の商品IDと特徴量データ0〜Nとを認識辞書ファイル8に追加登録してもよい。あるいはCPU101は、既存のデータに今回の特徴量データ0〜Nを上書きしてもよい。
At this time, if data of the same product ID has already been registered in the
なお、ストアコンピュータSCは、定期的にPOS端末2にアクセスして、当該POS端末2に保存される認識辞書ファイル8が更新されているか否かを確認する。そして更新されている場合には、ストアコンピュータSCは、更新後の認識辞書ファイル8を取り込んで、自らの認識辞書ファイル8を作成し直す。このとき、商品名の付されていないデータが存在する場合には、ストアコンピュータSCは、商品データファイルを参照して、商品IDに関連付けられた商品名を当該データに追加する。そしてストアコンピュータSCは、作成し直した認識辞書ファイル8をPOS端末2にダウンロードする。
The store computer SC periodically accesses the
このように本実施形態によれば、商品読取装置1を利用して、認識辞書ファイル8に未登録の新規商品の特徴量データを追加したり、認識辞書ファイル8に登録済の既存商品の特徴量データを更新したりすることができる。
As described above, according to the present embodiment, the
この場合において、オペレータに要求される作業は、辞書作成対象商品を読取窓1Bにかざすだけである。あらゆる角度から商品が撮影されるように、かざした商品の向きを少しずつずらしていくような面倒な作業をオペレータが要求されることはない。したがって、予め物品を様々な角度から撮影した画像データが必要であった従来と比較して、認識辞書の作成に要する手間と時間が大幅に削減される。しかもオペレータは、単に辞書作成対象商品を読取窓1Bにかざせばよいので、オペレータの習熟度に依存しない辞書作成が可能となる。
In this case, all the work required for the operator is to hold the dictionary creation target product over the reading
また、本実施形態では、辞書作成対象商品の商品IDとともに、回転角度θとサンプル数nとを入力するようにしている。例えば形状が単純な矩形や単純な模様等で構成されている商品(例えば商品券等)については、物品の外観から得られる表面情報(形状、模様、色彩等)に関する特徴量が少ないため、商品読取装置の読取窓1Bに翳す商品の僅かな角度の違いによって別の商品に誤認識される可能性がある。そこで、回転角度θを小さくしかつサンプル数nを多くすることで、一商品について様々な角度の画像が得られ、より多くの特徴量を含んだ特徴量データを認識辞書ファイル8に登録することができるので、誤認識を低減することができる。一方、物品の表面情報(形状、模様、色彩等)が複雑な商品については、1画像からより多くの特徴量を含んだ特徴量データを得ることができるので、サンプル数nが少なくすることで認識辞書ファイル8に登録される特徴量データの数を節約するといった運用ができる。
In this embodiment, the rotation angle θ and the sample number n are input together with the product ID of the dictionary creation target product. For example, for products (such as gift certificates) that are composed of simple rectangles or simple patterns, there are few features related to surface information (shape, pattern, color, etc.) obtained from the appearance of the product. There is a possibility that another product may be erroneously recognized due to a slight difference in the angle of the product facing the reading
(第2の実施形態)
次に、第2の実施形態について、図10〜図16を用いて説明する。この第2の実施形態において、店舗会計システムの外観図、商品読取装置とPOS端末とのハードウェア構成を示すブロック図、認識辞書ファイルのデータ構造を示す模式図、商品読取装置で認識辞書作成モードが選択された際に、同商品読取装置のCPUが実現する機能構成を示すブロック図は、第1の実施形態と同様なので、図1〜図4をそのまま用いるものとし、第1の実施形態と共通する部分には同一符号を付して、その詳しい説明は省略する。
(Second Embodiment)
Next, a second embodiment will be described with reference to FIGS. In this second embodiment, an external view of a store accounting system, a block diagram showing a hardware configuration of a product reading device and a POS terminal, a schematic diagram showing a data structure of a recognition dictionary file, and a recognition dictionary creation mode in the product reading device The block diagram showing the functional configuration realized by the CPU of the commodity reading apparatus when the item is selected is the same as that of the first embodiment, so FIGS. 1 to 4 are used as they are. Common parts are denoted by the same reference numerals, and detailed description thereof is omitted.
第1の実施形態では、加工手段43が、基準画像51の中心Oを回転中心として、当該基準画像51を二次元方向に回転させた画像を加工する場合を例示した。第2の実施形態では、加工手段43が、基準画像51を三次元方向に回転させた画像を加工する場合を例示する。すなわち加工手段43は、図10の(a)に示すように、基準画像51の画像中心を通る垂線52を回転軸として、当該基準画像51を一方向r1(以下では右方向r1と定義する)またはその逆方向r2(以下では左方向r2と定義する)に所定角度で回転させた画像を加工する。あるいは、図10の(b)に示すように、基準画像(フレーム画像)51の画像中心を通る水平線53を回転軸として、当該基準画像51を一方向r3(以下では前方向r3と定義する)またはその逆方向r4(以下では後方向r4と定義する)に所定角度で回転させた画像を加工する。
In the first embodiment, the case where the
第2の実施形態において、記憶部32には、図11に示すように、基準画像メモリ321、加工画像メモリ322及び特徴量データのバッファメモリ323の他、正面画像メモリ324、裏面画像メモリ325、左側面画像メモリ326、右側面画像メモリ327、上面画像メモリ328、底面画像メモリ329が設けられる。
In the second embodiment, as shown in FIG. 11, the
正面画像メモリ324には、辞書作成対象商品の正面を撮像部14で撮像したときのフレーム画像が格納される。同様に、裏面画像メモリ325、左側面画像メモリ326、右側面画像メモリ327、上面画像メモリ328及び底面画像メモリ329には、辞書作成対象商品の裏面、左側面、右側面、上面及び底面をそれぞれ撮像部14で撮像したときのフレーム画像が格納される。
The
基準画像メモリ321には、上記正面、裏面、左側面、右側面、上面及び底面の各フレーム画像のうち、加工処理の基準となるフレーム画像が格納される。本実施形態では、正面または裏面のフレーム画像を基準画像とする。
The
加工画像メモリ322には、上記基準画像から右方向r1、左方向r2、前方向r3または後方向r4に所定角度で回転させた画像が格納される。バッファメモリ323には、基準画像及び複数の加工画像からそれぞれ抽出される同一商品の特徴量データが蓄積される。
The processed
図12は、認識辞書作成モードが選択されたときのCPU101の主要な情報処理手順を示す流れ図である。認識辞書作成モードが選択されると、認識辞書作成プログラムが起動する。このプログラムの起動により、CPU101は、商品ID、回転角度θ及びサンプル数nの受付画面をタッチパネル12に表示させる(ST1)。そしてCPU101は、上記受付画面から商品ID、回転角度θ及びサンプル数nがそれぞれ入力されるのを待機する(ST2:角度受付手段41)。
FIG. 12 is a flowchart showing the main information processing procedure of the
回転角度θとは、前記加工手段43が基準画像を左、右、前、後の各方向にそれぞれ回転させた画像を加工する際の1加工当たりの回転角度である。本実施形態では、前記加工手段43が、基準画像を一方向とその逆方向にそれぞれ回転角度θずつ回転させた画像をサンプル数nの数だけ加工し、その都度、前記抽出手段44が、加工した画像から商品の特徴量データを抽出してバッファメモリ323に保存する。
The rotation angle θ is a rotation angle per process when the
上記受付画面を確認したオペレータは、タッチパネル12またはキーボード11を操作して、辞書作成対象商品の商品IDと所望の回転角度θとサンプル数nとを入力する。なお、商品IDの代わりに商品名を入力してもよい。また、サンプル数nの入力は必須ではない。予め、回転角度θとサンプル数nとを対応付けた設定テーブルを用意しておき、回転角度θが選択されたならば、一義的にサンプル数nが決まるようにしてもよい。また、回転角度θについても、デフォルトの角度を予め設定しておき、回転角度θが入力されないときにはデフォルトの角度を回転角度θとしてもよい。
The operator who has confirmed the reception screen operates the
タッチパネル12のタッチ入力またはキーボード11のキー入力によって商品ID、回転角度θ及びサンプル数nがそれぞれ入力されたならば(ST2にてYES)、CPU101は、入力された商品ID、回転角度θ及びサンプル数nを、RAM104のワークエリアに格納する(ST3)。次いで、CPU101は、図13に具体的に示す撮影処理を実行する(ST4)。
If product ID, rotation angle θ, and number of samples n are input by touch input on
先ずCPU101は、第3カウンタkを“0”にリセットする(ST21)。次いでCPU101は、撮影方向指示画面をタッチパネル12に表示させる(ST22)。撮影方向指示画面には、オペレータに対して辞書作成対象商品の撮影方向を指示する画像が表示される。撮影方向は、第3カウンタkの値によって決まる。本実施形態では、第3カウンタkが“0”のときには正面、“1”のときには裏面、“2”のときには左側面、“3”のときには右側面、“4”のときには上面、“5”のときには底面とする。
First, the
撮影方向指示画面を確認したオペレータは、撮影方向として指示された商品の面を読取窓1Bにかざす。そしてオペレータは、キーボード11またはタッチパネル12に設けられた撮影キーを入力する。
The operator who has confirmed the photographing direction instruction screen holds the surface of the commodity designated as the photographing direction over the reading
CPU101は、撮影キーが入力されるのを待機する(ST23)。撮影キーが入力されたならば(ST23にてYES)、CPU101は、撮像部14に対して撮像オン信号を出力する(ST24)。撮像部14は、撮像オン信号に応じて撮像領域を撮像する。これにより、オペレータが読取窓1Bにかざしている商品の面が撮像部14によって撮像される。CPU101は、撮像部14で撮像されたフレーム画像を取り込む。そしてCPU101は、上記撮影方向指示画面で指示した方向に該当する画像メモリ321,322,323,324,325または326に、上記フレーム画像を格納する(ST25:記憶手段42)。
しかる後、CPU101は、第3カウンタkを“1”だけカウントアップする(ST26)。そしてCPU101は、第3カウンタkが最大値“5”を超えたか否かを確認する(ST27)。第3カウンタkが最大値“5”を超えていない場合(ST27にてNO)、CPU101は、ステップST22の処理に戻る。すなわちCPU101は、第3カウンタkの値によって決まる撮影方向の指示画面をタッチパネル12に表示させる。そしてCPU101は、ステップST23〜ST27の処理を再度実行する。
Thereafter, the
こうして、第3カウンタkがカウントアップされる毎に、CPU101は、ステップST22〜ST27の処理を繰り返し実行する。そして、第3カウンタkが最大値“5”を超えたならば(ST27にてYES)、撮影処理が終了する。
Thus, every time the third counter k is incremented, the
かくして、辞書作成対象商品の正面を撮像したフレーム画像は正面画像メモリ324に格納され、裏面を撮像したフレーム画像は裏面画像メモリ325に格納され、左側面を撮像したフレーム画像は左側面画像メモリ326に格納され、右側面を撮像したフレーム画像は右側面画像メモリ327に格納され、上面を撮像したフレーム画像は上面画像メモリ328に格納され、底面を撮像したフレーム画像は底面画像メモリ329に格納される。
Thus, the frame image obtained by imaging the front of the dictionary creation target product is stored in the
撮影処理が終了すると、CPU101は、第4カウンタrを“0”にリセットする(ST5)。そしてCPU101は、図14に具体的に示す正面画像処理を実行する(ST6)。
When the photographing process is completed, the
先ずCPU101は、第1カウンタiを“0”にリセットする(ST31)。次いでCPU101は、正面画像メモリ324に格納されているフレーム画像のデータを基準画像メモリ321に複写する(ST32)。しかる後、CPU101は、基準画像メモリ321のフレーム画像から当該画像に含まれる商品の特徴量データを抽出する(ST33)。この場合も、前記ステップST202の処理で説明したように、パッチ毎の特徴量データを抽出する。
First, the
基準画像メモリ321のフレーム画像から商品の特徴量データを抽出したならば、CPU101は、この抽出した特徴量データをバッファメモリ323の特徴量データi(iは第1カウンタiの値)に対応するエリアに格納する(ST34)。以上で、正面画像処理は終了する。したがって、バッファメモリ323の特徴量データ0に対応するエリアには、辞書作成対象商品の正面を撮像したフレーム画像から抽出される商品の特徴量データが格納される。
If the feature amount data of the product is extracted from the frame image of the
正面画像処理が終了すると、CPU101は、第4カウンタrを“1”だけカウントアップする(ST7)。そしてCPU101は、第4カウンタrが最大値“4”を超えたか否かを確認する(ST8)。第4カウンタrが最大値“4”を超えていない場合(ST8にてNO)、CPU101は、図15に具体的に示す加工画像処理を実行する(ST9)。
When the front image processing is completed, the
先ずCPU101は、第2カウンタjを“0”にリセットする(ST41)。次いでCPU101は、第2カウンタjを“1”だけカウントアップする(ST42)。そしてCPU101は、第2カウンタjがサンプル数nの1/2の値n/2を超えたか否かを確認する(ST43)。
First, the
第2カウンタjが値n/2を超えていない場合(ST43にてNO)、CPU101は、第1カウンタiを“1”だけカウントアップする(ST44)。またCPU101は、基準画像メモリ321内の画像を、r方向に角度jθ(jは第2カウンタjの値、θは回転角度)だけ回転させた画像に加工する(ST45:加工手段43)。
If second counter j does not exceed value n / 2 (NO in ST43),
ここで、回転方向を示す“r”は、第4カウンタrの値であり、本実施形態では、第4カウンタrが“1”のときには右方向r1、“2”のときには左方向r2、“3”のときには前方向r3、“4”のときには後方向r4をそれぞれ回転方向とする。 Here, “r” indicating the rotation direction is a value of the fourth counter r. In the present embodiment, when the fourth counter r is “1”, the right direction r1; when “4”, the left direction r2, “ When 3 ", the forward direction r3, and when" 4 ", the backward direction r4 is the rotational direction.
具体的には、回転方向が右方向r1または左方向r2のときには、基準画像メモリ321と左側面画像メモリ326と右側面画像メモリ327とにそれぞれ格納されている辞書作成対象商品の正面、右側面及び左側面の各画像から、当該商品が正面から右方向r1または左方向r2に角度jθだけ回転した画像を、CPU101は作成する。回転方向が前方向r3または後方向r4のときには、基準画像メモリ321と上面画像メモリ328と下面画像メモリ326とにそれぞれ格納されている辞書作成対象商品の正面、上面及び底面の各画像とから、当該商品が正面から前方向r3または後方向r4に角度jθだけ回転した画像を、CPU101は作成する。
Specifically, when the rotation direction is the right direction r1 or the left direction r2, the front and right sides of the dictionary creation target products stored in the
CPU101は、加工された画像を加工画像メモリ322に格納する。そしてCPU101は、加工画像メモリ322に格納された画像から、当該画像に含まれる商品の特徴量データを抽出する(ST46:抽出手段44)。そしてCPU101は、この抽出した特徴量データをバッファメモリ323の特徴量データi(iは第1カウンタiの値)に対応するエリアに格納する(ST47)。
The
ステップST47の処理を終了すると、CPU101は、ステップST42の処理に戻る。すなわちCPU101は、第2カウンタjをさらに“1”だけカウントアップする。そしてCPU101は、第2カウンタjが値n/2を超えたか否かを確認する(ST43)。
When the process of step ST47 ends, the
第2カウンタjが値n/2を超えるまで、CPU101は、ステップST44〜ST47の処理を繰り返し実行する。第2カウンタjが値n/2を超えたならば(ST43にてYES)、加工画像処理は終了する。
Until the second counter j exceeds the value n / 2, the
加工画像処理が終了すると、CPU101は、ステップST7の処理に戻る。すなわちCPU101は、第4カウンタrをさらに“1”だけカウントアップする。そしてCPU101は、第4カウンタrが最大値“4”を超えたか否かを確認する(ST8)。第4カウンタrが最大値“4”を超えるまで、CPU101は、ステップST9の加工画像処理を繰り返し実行する。
When the processed image process ends, the
したがって、第4カウンタrが“1”のときには、正面画像から右方向r1に角度θ、2θ、3θ、…、(n/2)θずつ回転させた画像からそれぞれ抽出された商品の特徴量データが、バッファメモリ323の特徴量データ1〜n/2にそれぞれ対応するエリアに格納される。第4カウンタrが“2”のときには、正面画像から左方向r2に角度θ、2θ、3θ、…、(n/2)θずつ回転させた画像からそれぞれ抽出された商品の特徴量データが、バッファメモリ323の特徴量データ{(n/2)+1}〜nにそれぞれ対応するエリアに格納される。第4カウンタrが“3”のときには、正面画像から前方向r3に角度θ、2θ、3θ、…、(n/2)θずつ回転させた画像からそれぞれ抽出された商品の特徴量データが、バッファメモリ323の特徴量データ(n+1)〜(3/2)nにそれぞれ対応するエリアに格納される。第4カウンタrが“4”のときには、正面画像から後方向r4に角度θ、2θ、3θ、…、(n/2)θずつ回転させた画像からそれぞれ抽出された商品の特徴量データが、バッファメモリ323の特徴量データ{(3/2)n+1}〜2nにそれぞれ対応するエリアに格納される。
Therefore, when the fourth counter r is “1”, the feature amount data of the product extracted from the images rotated by the angles θ2, 2θ, 3θ,..., (N / 2) θ in the right direction r1 from the front image. Are stored in areas corresponding to the
第4カウンタrが最大値“4”を超えたならば(ST8にてYES)、CPU101は、第4カウンタrを“0”にリセットする(ST10)。そしてCPU101は、図16に具体的に示す裏面画像処理を実行する(ST11)。
If fourth counter r exceeds maximum value “4” (YES in ST8),
先ずCPU101は、第1カウンタiを“1”だけカウントアップする(ST51)。次いでCPU101は、裏面画像メモリ325に保存されているフレーム画像のデータを基準画像メモリ321に複写する(ST52)。しかる後、CPU101は、前記ステップST33の処理と同様にして、基準画像メモリ321のフレーム画像から当該画像に含まれる商品の特徴量データを抽出する(ST53)。そしてCPU101は、この抽出した特徴量データをバッファメモリ323の特徴量データi(iは第1カウンタiの値)に対応するエリアに格納する(ST54)。以上で、裏面画像処理は終了する。したがって、バッファメモリ323の特徴量データ(2n+1)に対応するエリアには、辞書作成対象商品の正面を撮像したフレーム画像から抽出される商品の特徴量データが格納される。
First, the
裏面画像処理が終了すると、CPU101は、第4カウンタrを“1”だけカウントアップする(ST12)。そしてCPU101は、第4カウンタrが最大値“4”を超えたか否かを確認する(ST13)。第4カウンタrが最大値“4”を超えていない場合(ST13にてNO)、CPU101は、加工画像処理を実行する(ST14)。このステップST14における加工画像処理は、図15を用いて説明したステップST10における画像加工処理と同一手順なので、ここでの説明は省略する。
When the back surface image processing is completed, the
加工画像処理が終了すると、CPU101は、ステップST12の処理に戻る。すなわちCPU101は、第4カウンタrをさらに“1”だけカウントアップする。そしてCPU101は、第4カウンタrが最大値“4”を超えたか否かを確認する(ST13)。第4カウンタrが最大値“4”を超えるまで、CPU101は、ステップST14の加工画像処理を繰り返し実行する。
When the processed image process ends, the
したがって、第4カウンタrが“1”のときには、裏面画像から右方向r1に角度θ、2θ、3θ、…、(n/2)θずつ回転させた画像からそれぞれ抽出された商品の特徴量データが、バッファメモリ323の特徴量データ(2n+2)〜{(5/2)n+1}にそれぞれ対応するエリアに格納される。第4カウンタrが“2”のときには、裏面画像から左方向r2に角度θ、2θ、3θ、…、(n/2)θずつ回転させた画像からそれぞれ抽出された商品の特徴量データが、バッファメモリ323の特徴量データ{(5/2)n+2}〜(3n+1)にそれぞれ対応するエリアに格納される。第4カウンタrが“3”のときには、裏面画像から前方向r3に角度θ、2θ、3θ、…、(n/2)θずつ回転させた画像からそれぞれ抽出された商品の特徴量データが、バッファメモリ323の特徴量データ(3n+2)〜{(7/2)n+1}にそれぞれ対応するエリアに格納される。第4カウンタrが“4”のときには、裏面画像から後方向r4に角度θ、2θ、3θ、…、(n/2)θずつ回転させた画像からそれぞれ抽出された商品の特徴量データが、バッファメモリ323の特徴量データ{(7/2)n+2}〜(4n+1)にそれぞれ対応するエリアに格納される。
Therefore, when the fourth counter r is “1”, the feature amount data of the product extracted from the images rotated by the angles θ2, 2θ, 3θ,..., (N / 2) θ in the right direction r1 from the back image. Are stored in areas corresponding to the feature amount data (2n + 2) to {(5/2) n + 1} of the
第4カウンタrが最大値“4”を超えたならば(ST13にてYES)、CPU101は、辞書更新処理を実行する(ST15)。すなわちCPU101は、ワークメモリに記憶された商品IDとバッファメモリ323に記憶された特徴量データ0〜N(N=4n+1)とを関連付ける。そしてCPU101は、この商品IDと特徴量データ0〜Nとを、接続インターフェース106を介して、POS端末205のHDD装置205に保存されている認識辞書ファイル8に追加登録する(データ登録手段45)。
If fourth counter r exceeds maximum value “4” (YES in ST13),
この際、認識辞書ファイル8に同一商品IDのデータが既に登録されていた場合には、CPU101は、この既存のデータを削除した後、今回の商品IDと特徴量データ0〜Nとを認識辞書ファイル8に追加登録してもよい。あるいはCPU101は、既存のデータに今回の特徴量データ0〜Nを上書きしてもよい。
At this time, if data of the same product ID has already been registered in the
このように本実施形態においても、第1の実施形態と同様に、商品読取装置1を利用して、認識辞書ファイル8に未登録の新規商品の特徴量データを追加したり、認識辞書ファイル8に登録済の既存商品の特徴量データを更新したりすることができる。
As described above, in the present embodiment as well, in the same way as in the first embodiment, by using the
この場合において、オペレータに要求される作業は、撮影方向指示画面の指示に従って辞書作成対象商品の各面を読取窓1Bにかざすだけである。あらゆる角度から商品が撮影されるように、かざした商品の向きを少しずつずらしていくような面倒な作業をオペレータが要求されることはない。したがって、予め物品を様々な角度から撮影した画像データが必要であった従来と比較して、認識辞書の作成に要する手間と時間が大幅に削減される。しかもオペレータは、単に辞書作成対象商品の各面を読取窓1Bにかざせばよいので、オペレータの習熟度に依存しない辞書作成が可能となる。
In this case, all the work required for the operator is to hold each surface of the dictionary creation target product over the reading
(第3の実施形態)
前記第1または第2の実施形態では、基準画像を回転角度θずつ回転させた全ての画像から商品の特徴量データを抽出して認識辞書ファイル8に反映させている。しかし、商品によっては、回転角度θだけずらしただけでは特徴量データが殆ど変わらないという場合もある。一般物体認識の技術において、認識辞書ファイル8に類似した特徴量データが複数存在することは、データ量の肥大化を招くだけでなく、認識率にばらつきを生じる懸念もある。
(Third embodiment)
In the first or second embodiment, product feature data is extracted from all images obtained by rotating the reference image by the rotation angle θ and reflected in the
そこで第3の実施形態として、認識辞書の作成に要する手間と時間を削減できるだけでなく上記課題をも解決できる認識辞書作成装置を、図17及び図18を用いて説明する。なお、第3の実施形態は、第1の実施形態をさらに発展させたものであり、第1の実施形態と共通する部分には同一符号を付して、詳しい説明を省略する。 Therefore, as a third embodiment, a recognition dictionary creation apparatus that can not only reduce the labor and time required to create a recognition dictionary but also solve the above problems will be described with reference to FIGS. 17 and 18. Note that the third embodiment is a further development of the first embodiment, and the same reference numerals are given to portions common to the first embodiment, and detailed description thereof is omitted.
図17は、第3の実施形態において、商品読取装置1で認識辞書作成モードが選択された際に、同商品読取装置1のCPU101が実現する機能構成を示すブロック図である。第1の実施形態の同ブロック図である図4と比較すれば明らかなように、第3の実施形態では、CPU101は、前記角度受付手段41、記憶手段42、加工手段43、抽出手段44及びデータ登録手段45に加えて、判定手段47を実現する。
FIG. 17 is a block diagram illustrating a functional configuration realized by the
判定手段47は、抽出手段44で抽出された特徴量データが、他の特徴量データと類似しているか否かを判定する機能である。この機能は、認識辞書作成モードが選択されたときにCPU101が実行する情報処理手順(図7を参照)のなかのステップST108である加工画像処理において作用する。
The
第3の実施形態における加工画像処理の手順を、図18の流れ図で示す。図18において、ステップST301からステップST306までの手順は第1の実施形態と同一である。すなわちCPU101は、基準画像メモリ321内の画像を右方向に角度jθだけ回転させた画像を加工し(ST305:加工手段43)、この加工された画像から当該画像に含まれる商品の特徴量データを抽出する(ST306:抽出手段44)。
The process image processing procedure in the third embodiment is shown in the flowchart of FIG. In FIG. 18, the procedure from step ST301 to step ST306 is the same as that of the first embodiment. That is, the
しかる後、CPU101は、抽出された特徴量データを、バッファメモリ323に既に格納されている特徴量データと個々に比較することで、特徴量データの類似度Sを算出する(ST401)。例えばCPU101は、特徴量データを構成するパラメータどうしを照合し、一致しているか若しくは近似しているパラメータの数の多少から類似度Sを算出する。そしてCPU101は、類似度が70%を超える特徴量データがバッファメモリ323に既に格納されている否かを判定する(ST402:判定手段47)。
Thereafter, the
類似度が70%を超える特徴量データがバッファメモリ323に1つも格納されていない場合(ST402にてNO)、CPU101は、抽出した特徴量データをバッファメモリ323の特徴量データi(iは第1カウンタiの値)に対応するエリアに格納する(ST307)。
When no feature quantity data with a similarity degree exceeding 70% is stored in buffer memory 323 (NO in ST402),
これに対し、類似度が70%を超える特徴量データがバッファメモリ323に1つでも格納されていた場合には(ST402にてYES)、CPU101は、抽出した特徴量データをバッファメモリ323に格納せずに破棄する。
On the other hand, when at least one feature amount data having a similarity degree exceeding 70% is stored in buffer memory 323 (YES in ST402),
このように、判定手段47を備えた第3の実施形態によれば、同一商品の特徴量データとして、類似度が70%を超える2以上の特徴量データが認識辞書ファイル8に登録されることはない。したがって、認識辞書ファイル8に類似した特徴量データが複数存在することでデータ量の肥大化を招くのを未然に防ぐことができる。また、認識率のばらつきを低減できる効果も奏する。
As described above, according to the third embodiment including the
なお、この第3の実施形態において、特徴量データを保存するか破棄するかのしきい値となる認識度を70%としたが、この値は特に限定されるものではない。おおよそ60%〜80%の範囲内であれば、上述したような効果は得られる。 In the third embodiment, the recognition level which is a threshold value for storing or discarding the feature data is 70%, but this value is not particularly limited. If it is in the range of approximately 60% to 80%, the above-described effects can be obtained.
また、第2の実施形態に判定手段47を設けることによって、同様な作用効果を奏することは言うまでもないことである。 In addition, it goes without saying that the same effect can be obtained by providing the determination means 47 in the second embodiment.
(第4の実施形態)
前記第2の実施形態では、基準画像51をその画像中心を通る垂線52を回転軸として右方向r1と左方向r2とに所定角度で回転させた画像をそれぞれ加工し、さらに基準画像51をその画像中心を通る水平線53を回転軸として前方向r3と後方向r4とに所定角度で回転させた画像を加工して、加工された画像毎に、当該画像に含まれる商品の特徴量データを抽出している。しかし、例えば既に認識辞書ファイル8に特徴量データが登録されている商品の場合には、全ての回転方向のデータが必要であるとは限らない。また、商品によっては、正面を基準画像とし、この基準画像から加工される画像から得られる特徴量データは必要だが、裏面を基準画像とし、この基準画像から加工される画像から得られる特徴量データは必要ない場合も考えられる。
(Fourth embodiment)
In the second embodiment, the
そこで第4の実施形態として、認識辞書の作成に要する手間と時間を削減できるだけでなく上記課題をも解決できる認識辞書作成装置を、図19乃至図22を用いて説明する。 Therefore, as a fourth embodiment, a recognition dictionary creation device that can not only reduce the time and effort required to create a recognition dictionary but also solve the above problems will be described with reference to FIGS. 19 to 22.
なお、第2の実施形態と共通する部分には同一符号を付して、詳しい説明を省略する。 In addition, the same code | symbol is attached | subjected to the part which is common in 2nd Embodiment, and detailed description is abbreviate | omitted.
図19は、第4の実施形態において、商品読取装置1で認識辞書作成モードが選択された際に、同商品読取装置1のCPU101が実現する機能構成を示すブロック図である。第4の実施形態では、CPU101は、前記角度受付手段41、記憶手段42、加工手段43、抽出手段44及びデータ登録手段45に加えて、方向受付手段48を実現する。
FIG. 19 is a block diagram illustrating a functional configuration realized by the
また、第4の実施形態では、図20に示すデータ構造のフラグテーブル70を記憶部32に形成する。フラグテーブル70は、右方向r1、左方向r2、前方向r3及び後方向r4の回転方向別に、実行フラグf1〜f4を記憶する。実行フラグf1〜f4は、対応する回転方向の処理を実行するか否かを識別するもので、本実施形態では、“1”のとき実行、“0”のとき非実行とする。 In the fourth embodiment, the flag table 70 having the data structure shown in FIG. The flag table 70 stores execution flags f1 to f4 for each rotation direction of the right direction r1, the left direction r2, the front direction r3, and the rear direction r4. The execution flags f1 to f4 identify whether or not the processing in the corresponding rotation direction is to be executed. In this embodiment, the execution flags f1 to f4 are executed when “1” and not executed when “0”.
方向受付手段48は、回転方向の選択を受け付ける機能である。この機能は、認識辞書作成プログラムの起動時に作用する。すなわち、認識辞書作成プログラムが起動すると、CPU101は、図21に示すように、方向受付画面をタッチパネル12に表示させる(ST71)。
The direction receiving means 48 is a function that receives selection of the rotation direction. This function works when the recognition dictionary creation program is started. That is, when the recognition dictionary creation program is activated, the
方向受付画面には、右方向r1、左方向r2、前方向r3及び後方向r4のそれぞれに対してチェックボックスが表示されており、デフォルトとして実行状態を表わすチェックマークが入っている。オペレータは、全ての方向の特徴量データが必要な場合には、チェックボックスからチェックマークを外すことなく、実行キーを入力する。特徴量データが不要な方向が存在する場合には、その方向に対応したチェックボックスからチェックマークを外した後、実行キーを入力する。実行キーは、キーボード11またはタッチパネル12に設けられている。
On the direction acceptance screen, check boxes are displayed for each of the right direction r1, the left direction r2, the front direction r3, and the rear direction r4, and a check mark indicating an execution state is entered as a default. When the feature amount data in all directions is necessary, the operator inputs an execution key without removing the check mark from the check box. If there is a direction that does not require feature data, the execution key is input after removing the check mark from the check box corresponding to the direction. The execution key is provided on the
CPU101は、実行キーの入力を待機する(ST72)。実行キーが入力されたならば、CPU101は、方向受付画面のチェックボックスを調べる。そしてCPU101は、チェックマークが入っている方向に対応した実行フラグf1〜f4を“1”とし、チェックマークが入っていない方向に対応した実行フラグf1〜f4を“0”とする。しかる後、CPU101は、図12のステップST1の処理に進む。
実行フラグf1〜f4は、加工画像処理において参照される。図22に示すように、加工画像処理に入ると、CPU101は先ず、実行フラグfr(rは第4カウンタrの値)をチェックする。そして、実行フラグfrが“1”にセットされていた場合には、CPU101は、図15のステップST41の処理に進む。
The execution flags f1 to f4 are referred to in the processed image processing. As shown in FIG. 22, when processing image processing is started, the
しかし、実行フラグfrが“0”にリセットされていた場合には、加工画像処理が終了する。すなわち、実行フラグfrが“0”にリセットされている方向については、加工画像処理が実行されない。 However, if the execution flag fr has been reset to “0”, the processed image processing ends. That is, the processed image processing is not executed in the direction in which the execution flag fr is reset to “0”.
このように、方向受付手段48を備えた第4の実施形態によれば、認識辞書作成モードが選択されたときのCPU101の情報処理手順において、オペレータが不要と判断した方向の加工画像処理については省略することができる。したがって、情報処理時間の短縮を図ることができる。また、不要な特徴量データが認識辞書ファイル8に登録されることもないので、データ量の肥大化を防ぐ効果も奏し得る。
As described above, according to the fourth embodiment including the
なお、この第4の実施形態において、方向受付画面は、上記の構成に限定されるものではない。要は、オペレータが所望の方向を選択できる画面構成であればよい。 In the fourth embodiment, the direction reception screen is not limited to the above configuration. In short, any screen configuration that allows the operator to select a desired direction may be used.
また、第4の実施形態では、第2の実施形態の商品読取装置1に方向受付手段48を追加したが、第1または第3の実施形態の商品読取装置1に方向受付手段48を追加しても同様の効果を奏するのは言うまでもないことである。
In the fourth embodiment, the
なお、本発明は、前述した各実施形態に限定されるものではない。
例えば前記各実施形態は、POS端末2とは別体の商品読取装置1に認識辞書作成装置の機能を持たせたが、商品読取装置1がPOS端末2に組み込まれて一体となった装置に、認識辞書作成装置の機能を持たせてもよい。あるいは、デジタルカメラ等の撮像手段を接続してなるコンピュータ機器に、前記認識辞書作成プログラムをインストールすることによって、認識辞書作成装置の機能を持たせることも可能である。この場合、認識辞書ファイル8は、当該コンピュータ機器の内部記憶装置に保存されていてもよいし、当該コンピュータ機器にオンライン接続された外部機器の記憶装置に保存されていてもよい。
In addition, this invention is not limited to each embodiment mentioned above.
For example, in each of the above embodiments, the
また前記各実施形態は、加工手段43において、画像を左、右、前、後の各方向に回転させたが、回転方向はこれに限定されるものではない。例えば斜め方向に回転した画像を加工してもよい。また、単に回転する画像を加工するだけでなく、色の補正を行うようにしてもよい。
In the above embodiments, the
また前記各実施形態は、装置内部のプログラム記憶部であるROM103に発明の機能を実現させる認識辞書作成プログラムが予め記録されているものとした。しかしこれに限らず、同様のプログラムがネットワークから装置にダウンロードされてもよい。あるいは、記録媒体に記録された同様のプログラムが、装置にインストールされてもよい。記録媒体は、CD−ROM,メモリカード等のようにプログラムを記憶でき、かつ装置が読み取り可能であれば、その形態は問わない。また、プログラムのインストールやダウンロードにより得る機能は、装置内部のOS(オペレーティング・システム)等と協働してその機能を実現させるものであってもよい。
In each of the above embodiments, a recognition dictionary creating program for realizing the functions of the invention is recorded in advance in the
この他、本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。 In addition, although several embodiments of the present invention have been described, these embodiments are presented as examples and are not intended to limit the scope of the invention. These novel embodiments can be implemented in various other forms, and various omissions, replacements, and changes can be made without departing from the scope of the invention. These embodiments and modifications thereof are included in the scope and gist of the invention, and are included in the invention described in the claims and the equivalents thereof.
1…商品読取装置、2…POS端末、8…認識辞書ファイル、14…撮像部、32…記憶部、41…角度受付手段、42…記憶手段、43…加工手段、44…抽出手段、45…データ登録手段、46…ファイルアクセス手段、47…判定手段、48…方向受付手段。
DESCRIPTION OF
Claims (6)
撮像手段で撮像された物品の画像を記憶する記憶手段と、
この記憶手段で記憶された前記画像を、当該画像に含まれる物品を前記撮像手段で異なる方向から撮像した画像に加工する加工手段と、
この加工手段で加工された画像から、当該画像に含まれる物品の前記特徴量データを抽出する抽出手段と、
この抽出手段で抽出された特徴量データを、前記ファイルアクセス手段を介して前記認識辞書ファイルに登録するデータ登録手段と、
を具備したことを特徴とする認識辞書作成装置。 File access means for accessing a recognition dictionary file in which feature quantity data representing surface information of the article is stored for each article to be recognized;
Storage means for storing an image of the article imaged by the imaging means;
Processing means for processing the image stored in the storage means into an image obtained by imaging an article included in the image from a different direction by the imaging means;
Extraction means for extracting the feature amount data of the article included in the image from the image processed by the processing means;
Data registration means for registering the feature data extracted by the extraction means in the recognition dictionary file via the file access means;
A recognition dictionary creation device characterized by comprising:
前記データ登録手段は、前記抽出手段で抽出された特徴量データのうち前記判定手段で類似していないと判定された特徴量データを前記認識辞書ファイルに登録することを特徴とする請求項1記載の認識辞書作成装置。 Determination means for determining whether or not the feature quantity data extracted by the extraction means is similar to other feature quantity data;
2. The data registration unit registers, in the recognition dictionary file, feature amount data determined not to be similar by the determination unit among the feature amount data extracted by the extraction unit. Recognition dictionary creation device.
前記加工手段は、前記記憶手段で記憶された前記画像から、この画像に含まれる物品を所定の方向に前記角度受付手段で受け付けた入力角度ずつ回転させた画像に加工することを特徴とする請求項1または2記載の認識辞書作成装置。 Angle receiving means for receiving an input of the rotation angle,
The processing unit processes the image stored in the storage unit into an image obtained by rotating an article included in the image in a predetermined direction by an input angle received by the angle receiving unit. Item 3. The recognition dictionary creation device according to item 1 or 2.
前記加工手段は、前記記憶手段で記憶された前記画像から、この画像に含まれる物品を前記回転受付手段で受け付けた選択方向に前記角度受付手段で受け付けた入力角度だけ回転させた画像に加工することを特徴とする請求項3記載の認識辞書作成装置。 Direction receiving means for receiving a selection of the rotation direction,
The processing means processes the article contained in the image from the image stored in the storage means into an image rotated by the input angle received by the angle receiving means in the selection direction received by the rotation receiving means. The recognition dictionary creation device according to claim 3.
撮像手段で撮像された物品の画像を記憶部に記憶させる記憶手段、
前記記憶部で記憶された前記画像を、当該画像に含まれる物品を前記撮像手段で異なる方向から撮像した画像に加工する加工手段、
前記加工された画像から、当該画像に含まれる物品の前記特徴量データを抽出する抽出手段、及び
前記抽出された特徴量データを前記認識辞書ファイルに登録するデータ登録手段、
として機能させるための認識辞書作成プログラム。 A computer capable of accessing a recognition dictionary file in which feature amount data representing surface information of an article is stored for each article to be recognized.
Storage means for storing an image of the article imaged by the imaging means in a storage unit;
Processing means for processing the image stored in the storage unit into an image obtained by imaging an article included in the image from different directions by the imaging means;
Extraction means for extracting the feature quantity data of the article included in the processed image from the processed image; and data registration means for registering the extracted feature quantity data in the recognition dictionary file;
Recognition dictionary creation program to function as.
前記抽出された特徴量データが、前記認識辞書ファイルに既に保存されているいずれかの特徴量データと類似しているか否かを判定する判定手段、としてさらに機能させ、
前記データ登録手段は、前記抽出された特徴量データのうち前記類似していないと判定された特徴量データを前記ファイルアクセス機能を介して前記認識辞書ファイルに登録する手段である請求項5記載の認識辞書作成プログラム。 The computer,
A function for determining whether the extracted feature data is similar to any feature data already stored in the recognition dictionary file;
The said data registration means is a means to register the feature-value data determined not to be similar in the said extracted feature-value data to the said recognition dictionary file via the said file access function. Recognition dictionary creation program.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2012122243A JP2013246790A (en) | 2012-05-29 | 2012-05-29 | Recognition dictionary creation device and program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2012122243A JP2013246790A (en) | 2012-05-29 | 2012-05-29 | Recognition dictionary creation device and program |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2013246790A true JP2013246790A (en) | 2013-12-09 |
Family
ID=49846468
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2012122243A Pending JP2013246790A (en) | 2012-05-29 | 2012-05-29 | Recognition dictionary creation device and program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2013246790A (en) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2016110457A (en) * | 2014-12-08 | 2016-06-20 | 東芝テック株式会社 | Information processing device and program |
| JP2018101292A (en) * | 2016-12-20 | 2018-06-28 | 東芝テック株式会社 | Information processing apparatus and program |
| US11450119B2 (en) | 2018-09-20 | 2022-09-20 | Nec Corporation | Information acquisition system, control apparatus, information acquisition method, and storage medium |
Citations (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2001307101A (en) * | 2000-04-26 | 2001-11-02 | Ricoh Co Ltd | Specific image detection method |
| JP2002074511A (en) * | 2001-06-21 | 2002-03-15 | Toshiba Tec Corp | Product sales registration data processing device |
| JP2004206357A (en) * | 2002-12-25 | 2004-07-22 | Nec Infrontia Corp | Output device of sale commodity data and output method of sale commodity data |
| JP2007304899A (en) * | 2006-05-12 | 2007-11-22 | Nippon Telegr & Teleph Corp <Ntt> | Identification dictionary generation apparatus and identification dictionary generation method |
| JP2008205650A (en) * | 2007-02-16 | 2008-09-04 | Sony Corp | Image processing apparatus, image processing method, imaging apparatus, and computer program |
| WO2011096010A1 (en) * | 2010-02-02 | 2011-08-11 | 株式会社 東芝 | Pattern recognition device |
| JP2011198269A (en) * | 2010-03-23 | 2011-10-06 | Seibu Electric & Mach Co Ltd | Method and device for detecting position of package product |
| JP2011242873A (en) * | 2010-05-14 | 2011-12-01 | Honda Motor Co Ltd | Registration device, registration method and computer program |
-
2012
- 2012-05-29 JP JP2012122243A patent/JP2013246790A/en active Pending
Patent Citations (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2001307101A (en) * | 2000-04-26 | 2001-11-02 | Ricoh Co Ltd | Specific image detection method |
| JP2002074511A (en) * | 2001-06-21 | 2002-03-15 | Toshiba Tec Corp | Product sales registration data processing device |
| JP2004206357A (en) * | 2002-12-25 | 2004-07-22 | Nec Infrontia Corp | Output device of sale commodity data and output method of sale commodity data |
| JP2007304899A (en) * | 2006-05-12 | 2007-11-22 | Nippon Telegr & Teleph Corp <Ntt> | Identification dictionary generation apparatus and identification dictionary generation method |
| JP2008205650A (en) * | 2007-02-16 | 2008-09-04 | Sony Corp | Image processing apparatus, image processing method, imaging apparatus, and computer program |
| WO2011096010A1 (en) * | 2010-02-02 | 2011-08-11 | 株式会社 東芝 | Pattern recognition device |
| JP2011198269A (en) * | 2010-03-23 | 2011-10-06 | Seibu Electric & Mach Co Ltd | Method and device for detecting position of package product |
| JP2011242873A (en) * | 2010-05-14 | 2011-12-01 | Honda Motor Co Ltd | Registration device, registration method and computer program |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2016110457A (en) * | 2014-12-08 | 2016-06-20 | 東芝テック株式会社 | Information processing device and program |
| JP2018101292A (en) * | 2016-12-20 | 2018-06-28 | 東芝テック株式会社 | Information processing apparatus and program |
| US11450119B2 (en) | 2018-09-20 | 2022-09-20 | Nec Corporation | Information acquisition system, control apparatus, information acquisition method, and storage medium |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5619095B2 (en) | Product recognition apparatus and product recognition program | |
| JP5744824B2 (en) | Product recognition apparatus and product recognition program | |
| JP5553866B2 (en) | Product recognition device and recognition dictionary addition program | |
| US9292748B2 (en) | Information processing apparatus and information processing method | |
| JP5936993B2 (en) | Product recognition apparatus and product recognition program | |
| JP5707375B2 (en) | Product recognition apparatus and product recognition program | |
| JP5826152B2 (en) | Product recognition apparatus and product recognition program | |
| JP5502821B2 (en) | Code reading device, sales data processing device, and program | |
| US9679282B2 (en) | Reading apparatus | |
| JP5747014B2 (en) | Product recognition apparatus and product recognition program | |
| JP6745646B2 (en) | Recognition system, information processing device, and program | |
| JP2013250768A (en) | Article recognition device, and article recognition program | |
| JP6258761B2 (en) | Information processing apparatus and program | |
| JP5511864B2 (en) | Store accounting system and store accounting program | |
| JP5622756B2 (en) | Product reading apparatus and product reading program | |
| JP2018055716A (en) | Information processing apparatus and program | |
| US20170344851A1 (en) | Information processing apparatus and method for ensuring selection operation | |
| JP2013246790A (en) | Recognition dictionary creation device and program | |
| JP6392406B2 (en) | Product recognition apparatus and product recognition program | |
| JP5903516B2 (en) | Product recognition apparatus and product recognition program | |
| JP2015099550A (en) | Product recognition apparatus and product recognition program | |
| JP5753929B2 (en) | Product recognition apparatus, method, and recognition dictionary addition program | |
| JP2015125479A (en) | Product sales data processing device and program | |
| JP2013045361A (en) | Data processor and program | |
| JP2025009498A (en) | Product registration device and program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20131219 |
|
| RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20131226 |
|
| RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20140109 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140218 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140410 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140819 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141014 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20150120 |