[go: up one dir, main page]

JP2000090271A - Partial dictionary reduction method, dictionary reduction method and evaluation method - Google Patents

Partial dictionary reduction method, dictionary reduction method and evaluation method

Info

Publication number
JP2000090271A
JP2000090271A JP10260128A JP26012898A JP2000090271A JP 2000090271 A JP2000090271 A JP 2000090271A JP 10260128 A JP10260128 A JP 10260128A JP 26012898 A JP26012898 A JP 26012898A JP 2000090271 A JP2000090271 A JP 2000090271A
Authority
JP
Japan
Prior art keywords
dictionary
partial
dictionaries
local feature
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10260128A
Other languages
Japanese (ja)
Inventor
Kentarou Yokoi
謙太朗 横井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP10260128A priority Critical patent/JP2000090271A/en
Publication of JP2000090271A publication Critical patent/JP2000090271A/en
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a method for reducing a partial dictionary or dictionary without dropping recognition performance while keeping dictionary capacity suitable by defining the degree of similarity with the other partial dictionary and information quantity provided for a dictionary set as a selection reference. SOLUTION: A dictionary set X is composed of dictionaries X1-Xn, and each dictionary is further composed of several partial dictionaries. For example, the information quantity provided in a partial dictionary (s), which is included in a dictionary Xsk, can be defined by how much the entropy of dictionary input Xs is decreased before and after the provision of output (s). Therefore, the (s) to maximize the mutual information quantity provided for the dictionary set X by the partial dictionary (s) has the maximum mutual information quantity, namely, the information quantity corresponding to the determination of dictionary. Thus, the partial dictionary of a little mutual information, which has just a little information quantity corresponding to the dictionary determination, is reduced and the partial dictionary of much mutual information quantity having much information quantity corresponding to the dictionary determination is remained so that the number of partial dictionaries can be reduced without dropping the ability of dictionary determination.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】この発明は、画像の中の対象
物を特徴パターンとして位置や姿勢を認識するマッチン
グ用辞書を削減する部分辞書削減方法と辞書削減方法と
その評価方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a partial dictionary reduction method, a dictionary reduction method, and an evaluation method thereof for reducing a matching dictionary for recognizing a position or orientation of an object in an image as a feature pattern.

【0002】[0002]

【従来の技術】(1)画像の中の対象物全体を特徴パタ
ーンとして、位置や姿勢を認識する手法がある。 (2)部分的な隠れに強くするため、対象物の局所的な
特徴をもとに位置や姿勢を認識する手法がある。
2. Description of the Related Art (1) There is a method of recognizing a position and a posture using an entire object in an image as a feature pattern. (2) There is a method of recognizing a position or a posture based on local features of an object in order to strengthen partial occlusion.

【0003】(3)局所的な特徴量の数を、個々の特徴
量間の類似度をもとに削減する手法がある。 しかしながら、上記(1)の手法は、対象物全体をパタ
ーンとして扱うので、部分的な隠れやノイズに弱い。ま
た、(2)の手法は、学習用の辞書画像を増やすと、そ
れにともなって辞書が増大していくという問題がある。
さらに、(3)の手法は、他の局所特徴量で類似度の高
いものがあるかどうかで削減候補を選択するので、他に
似ている局所特徴量が1つでもあると削減の対象となっ
てしまうという問題がある。
(3) There is a method of reducing the number of local features based on the similarity between individual features. However, the method (1) is vulnerable to partial occlusion and noise because the entire object is treated as a pattern. In addition, the method (2) has a problem that the dictionary increases as the number of learning dictionary images increases.
Furthermore, in the method (3), a reduction candidate is selected based on whether or not there is another local feature having a high degree of similarity. Therefore, if there is at least one local feature that is similar to another, a reduction target is determined. There is a problem that it becomes.

【0004】[0004]

【発明が解決しようとする課題】上記したように、従来
の手法では、、対象物全体をパターンとして位置や姿勢
を認識するのでは部分的な隠れやノイズに弱く、これに
対して対象物の局所的(部分的)な特徴をもとに位置や
姿勢を認識すると学習用の辞書画像を増やすとそれにと
もなって辞書が増大してしまい、さらに局所的な特徴量
の数を個々の特徴量間の類似度をもとに削減すると他の
局所特徴量で類似度の高いものがあるかどうかで削減候
補を選択するので他に似ている局所特徴量が1つでもあ
ると削減の対象となってしまうというように、辞書容量
が不適切となったり認識性能を落としてしまうという問
題があった。
As described above, in the conventional method, it is weak to partial occlusion and noise if the position and orientation are recognized by using the entire object as a pattern. Recognizing the position and orientation based on local (partial) features increases the number of dictionary images for learning, and the dictionary increases accordingly. If the local feature is similar to the other, the candidate to be reduced is selected depending on whether or not there is another local feature having a high similarity. As a result, there is a problem that the dictionary capacity becomes inappropriate or the recognition performance drops.

【0005】そこで、この発明は、辞書容量を適切にし
て認識性能を落とすことなく部分辞書または辞書を削減
する部分辞書削減方法と辞書削減方法を提供することを
目的とする。また、この発明は、削減した部分辞書また
は辞書における認識性能を評価する評価方法を提供する
ことを目的とする。
SUMMARY OF THE INVENTION It is an object of the present invention to provide a partial dictionary reduction method and a dictionary reduction method for reducing a partial dictionary or a dictionary without reducing the recognition performance by appropriately setting the dictionary capacity. Another object of the present invention is to provide an evaluation method for evaluating the recognition performance of a reduced partial dictionary or dictionary.

【0006】[0006]

【課題を解決するための手段】この発明の部分辞書削減
方法は、対象物の物理量パターン中の局所特徴量のマッ
チングを行うための局所特徴量の部分辞書の集合からな
る辞書を複数有する辞書集合における部分辞書削減方法
であって、上記辞書における部分辞書が該辞書に含まれ
る他の部分辞書との類似度と、該部分辞書が上記辞書集
合に対して有する情報量とを選択基準として部分辞書を
削減するようにしたことを特徴とする。
A partial dictionary reduction method according to the present invention provides a dictionary set having a plurality of dictionaries comprising a set of local feature quantity partial dictionaries for matching local feature quantities in a physical quantity pattern of an object. Wherein the partial dictionary in the dictionary is similar to other partial dictionaries included in the dictionary, and the amount of information the partial dictionary has with respect to the dictionary set is selected as a selection criterion. Is reduced.

【0007】この発明の辞書削減方法は、対象物の物理
量パターン中の局所特徴量のマッチングを行うための局
所特徴量の部分辞書の集合からなる辞書を複数有する辞
書集合における辞書削減方法であって、部分辞書間の類
似度に基づいて、第1の辞書からの第2の辞書の類似度
と、該第2の辞書からの該第1の辞書の類似度との大小
関係により第1の辞書または第2の辞書を削減するよう
にしたことを特徴とする。
A dictionary reduction method according to the present invention is a dictionary reduction method for a dictionary set having a plurality of dictionaries comprising a set of partial dictionaries of local feature values for matching local feature values in a physical quantity pattern of an object. The first dictionary based on the magnitude relation between the similarity of the second dictionary from the first dictionary and the similarity of the first dictionary from the second dictionary based on the similarity between the partial dictionaries. Alternatively, the second dictionary is reduced.

【0008】この発明の評価方法は、入力データ内から
対象物の位置を検出するシステムにおける検出性能を評
価する評価方法であって、出力された検出位置が実際の
位置とどれだけずれているかの値と、該検出位置に対す
る確信度の値とから検出性能を評価するようにしたこと
を特徴とする。
An evaluation method according to the present invention is an evaluation method for evaluating detection performance in a system for detecting a position of an object from input data, and is for determining how much an output detection position deviates from an actual position. The detection performance is evaluated from the value and the value of the certainty factor for the detection position.

【0009】この発明の評価方法は、対象物の物理量パ
ターン中の局所特徴量のマッチングを行うための局所特
徴量の部分辞書の集合からなる辞書を複数有する辞書集
合における部分辞書削減の評価方法であって、部分辞書
が削減された辞書集合から出力された検出位置が実際の
位置とどれだけずれているかの値と、該検出位置に対す
る確信度の値とから辞書の認識性能を算出して部分辞書
削減の収束の度合を評価するようにしたことを特徴とす
る。
An evaluation method according to the present invention is an evaluation method for reducing partial dictionaries in a dictionary set having a plurality of dictionaries comprising a set of partial dictionaries of local feature amounts for matching local feature amounts in a physical quantity pattern of an object. The dictionary recognition performance is calculated from a value indicating how much the detected position output from the dictionary set in which the partial dictionary has been reduced is shifted from the actual position and a value of the certainty factor for the detected position. It is characterized in that the degree of convergence of dictionary reduction is evaluated.

【0010】この発明の評価方法は、対象物の物理量パ
ターン中の局所特徴量のマッチングを行うための局所特
徴量の部分辞書の集合からなる辞書を複数有する辞書集
合における辞書削減の評価方法であって、第1の辞書に
類似度が高いとして削減された第2の辞書に含まれる部
分辞書が、最も類似度の高い部分辞書として正しく該第
1の辞書の部分辞書を選択したかの正解率を、削除され
なかった辞書数に基づく正解率の期待値と比較して削減
の収束の度合を判定するようにしたことを特徴とする。
The evaluation method according to the present invention is an evaluation method for dictionary reduction in a dictionary set having a plurality of dictionaries comprising a set of partial dictionaries of local feature values for matching local feature values in a physical quantity pattern of an object. The correct answer rate as to whether the partial dictionary included in the second dictionary reduced as having a high similarity to the first dictionary correctly selected the partial dictionary of the first dictionary as the partial dictionary having the highest similarity Is compared with the expected value of the correct answer rate based on the number of dictionaries that have not been deleted, and the degree of convergence of the reduction is determined.

【0011】この発明の評価方法は、対象物の物理量パ
ターン中の局所特徴量のマッチングを行うための局所特
徴量の部分辞書の集合からなる辞書を複数有する辞書集
合における辞書削減の評価方法であって、辞書が削減さ
れた辞書集合から出力された検出位置が実際の位置とど
れだけずれているかの値と、該検出位置に対する確信度
の値とから辞書の認識性能を算出して辞書削減の収束の
度合を評価するようにしたことを特徴とする。
The evaluation method according to the present invention is an evaluation method for dictionary reduction in a dictionary set having a plurality of dictionaries comprising a set of partial dictionaries of local feature values for matching local feature values in a physical quantity pattern of an object. The dictionary recognition performance is calculated by calculating a dictionary recognition performance from a value indicating how much the detected position output from the dictionary reduced dictionary set deviates from the actual position and a value of the certainty factor for the detected position. It is characterized in that the degree of convergence is evaluated.

【0012】[0012]

【発明の実施の形態】以下、この発明の一実施の形態に
ついて図面を参照して説明する。図1は、局所特徴量に
よる対象物認識を示すものである。図に示すように、対
象物の局所的なパターンを特徴量(局所特徴量)とし、
これらのマッチング結果を統合することにより、人物や
顔の検出・切り出し、姿勢認識、帳票の種類・位置・角
度認識などを行なうことができる。
An embodiment of the present invention will be described below with reference to the drawings. FIG. 1 shows target recognition based on local feature values. As shown in the figure, a local pattern of an object is defined as a feature amount (local feature amount).
By integrating these matching results, it is possible to detect and cut out a person or a face, recognize a posture, and recognize the type, position, and angle of a form.

【0013】以下、局所特徴量の個々のパターン辞書を
“部分辞書”と呼び、それらの部分辞書を含む個々の辞
書(学習画像1枚に対応)を単に“辞書”と呼ぶ。第1
実施例では、部分辞書からなる辞書セットに含まれる部
分辞書数または辞書数を削減する方法を示し、第2実施
例では、対象物の位置検出システムにおける検出性能の
評価方法を示す。
Hereinafter, individual pattern dictionaries of local feature values are called "partial dictionaries", and individual dictionaries (corresponding to one learning image) including those partial dictionaries are simply called "dictionaries". First
The second embodiment shows a method for reducing the number of partial dictionaries or the number of dictionaries included in a dictionary set composed of partial dictionaries, and the second embodiment shows a method for evaluating the detection performance of a target object position detection system.

【0014】まず、第1実施例について説明する。第1
実施例では、上述したように部分辞書からなる辞書セッ
トに含まれる部分辞書数または辞書数を削減する方法を
示す。
First, a first embodiment will be described. First
In the embodiment, as described above, a method of reducing the number of partial dictionaries or the number of dictionaries included in the dictionary set including the partial dictionaries will be described.

【0015】図2の(a)に示すように辞書セットXを
構成する辞書X1,X2,...,Xnがあるとする。
各辞書X1...はさらにいくつかの部分辞書から構成
されている。個々の部分辞書はa×bピクセルのパター
ンだとする。
As shown in FIG. 2A, dictionaries X1, X2,. . . , Xn.
Each dictionary X1. . . Is further composed of several partial dictionaries. It is assumed that each partial dictionary is a pattern of a × b pixels.

【0016】すると部分辞書sとtの類似度Sim
(s,t)は、例えば、下記式のように表すことができ
る。 Sim( s,t) =Σ (s_ i- t_ i) i={a×b} s_ iは、部分辞書sのiピクセルの画素値。
Then, the similarity Sim between the partial dictionaries s and t is Sim
(S, t) can be represented, for example, by the following equation. Sim (s, t) = Σ (s_it_i) i = {a × b} s_i is the pixel value of the i pixel of the partial dictionary s.

【0017】iは、a×bのパターン中の1点を示す。
ここで Sim(s,t) > Th (Thはあるしき
い値) の場合にs,tを削除してしまうのが従来の手法であ
る。 (1−1)部分辞書数を削減する方法 ここでは、図2に示すプロセスのうち、図2の(a)か
ら(b)に示すように部分辞書数を削減するプロセスに
ついて説明する。
I indicates one point in the a × b pattern.
Here, according to the conventional method, s and t are deleted when Sim (s, t)> Th (Th is a certain threshold value). (1-1) Method for Reducing the Number of Partial Dictionaries Here, among the processes shown in FIG. 2, a process for reducing the number of partial dictionaries as shown in FIGS. 2A to 2B will be described.

【0018】まず、辞書Xsに含まれる部分辞書sが、
辞書Xsに対して持つ情報量を考える。部分辞書sと十
分に類似度の高い部分辞書t(Sim(s,t) >
Th)の総数をNtとする(一般にNtは部分辞書の総
数に比例する)。
First, the partial dictionary s included in the dictionary Xs is
Consider the amount of information held for the dictionary Xs. A partial dictionary t (Sim (s, t)> having sufficiently high similarity to the partial dictionary s
Th) is assumed to be Nt (Nt is generally proportional to the total number of partial dictionaries).

【0019】いま、部分辞書sに最も近いと判断される
べきある入力部分パターンがあったとすると、その入力
部分パターンに対して最も類似度の高い部分辞書として
正しくsが選ばれる確率は、 P(s)=1/Nt である。なぜなら、部分辞書tとsは、類似度が十分高
いため両者は同一視され、そのようなNt個の部分辞書
のどれかが等確率で入力パターンに最も近いと評価され
ることになるためである。
If there is an input partial pattern that should be determined to be closest to the partial dictionary s, the probability that s is correctly selected as the partial dictionary having the highest similarity to the input partial pattern is P ( s) = 1 / Nt. This is because the partial dictionaries t and s have a sufficiently high degree of similarity, so that they are identified with each other, and any of such Nt partial dictionaries is evaluated as being closest to the input pattern with equal probability. is there.

【0020】また、辞書Xsに含まれる部分辞書数がN
sだとすると、 P(Xs/s)=1/Ns と表すことができる。ここでは事後確率を、部分辞書s
の出現により辞書Xsであると決定付けることのできる
確信度としてとらえている。
If the number of partial dictionaries included in the dictionary Xs is N
If it is s, it can be expressed as P (Xs / s) = 1 / Ns. Here, the posterior probability is calculated using the partial dictionary s
Is regarded as a certainty factor that can be determined to be the dictionary Xs.

【0021】ここで、部分辞書sが辞書Xsに対しても
つ情報量(相互情報量I(Xs;s))というのは、辞
書入力Xsに対して部分辞書出力を得る系において、入
力Xsのエントロピーが、出力sを得る前と後とでどれ
だけ減少したかによって定義できる。
Here, the information amount (mutual information amount I (Xs; s)) that the partial dictionary s has for the dictionary Xs is defined as a system that obtains a partial dictionary output for the dictionary input Xs. It can be defined by how much the entropy decreases before and after obtaining the output s.

【0022】 I(Xs;s)=H(Xs)−H(Xs/s) なお、H(Xs)は出力sを得る前のXsのエントロピ
ーで、H(Xs/s)は出力sを得た後のXsのエント
ロピーである。
I (Xs; s) = H (Xs) -H (Xs / s) where H (Xs) is the entropy of Xs before obtaining the output s, and H (Xs / s) is the entropy of the output s. Xs after entropy.

【0023】また、部分辞書sは辞書Xs以外には含ま
れないので、 I(Xs以外の辞書;s)=0 である。
Further, since the partial dictionary s is not included except for the dictionary Xs, I (dictionary other than Xs; s) = 0.

【0024】よって、部分辞書sにより辞書セットXに
対して得られる相互情報量I(X;s)は、 I(X;s)=I(Xs;s)+ΣI(Xs以外の辞書;s) =I(Xs;s) =H(Xs)−H(Xs/s) =P(Xs)log(1/P(Xs))−P(Xs,s)log (1/P(Xs/s)) =P(Xs)log(1/P(Xs))−P(s)P(Xs/s )log(1/P(Xs/s)) =P(Xs)log(1/P(Xs))+P(s)P(Xs/s )logP(Xs/s) と書ける。
Therefore, the mutual information I (X; s) obtained for the dictionary set X by the partial dictionary s is: I (X; s) = I (Xs; s) +) I (Dictionaries other than Xs; s) = I (Xs; s) = H (Xs) -H (Xs / s) = P (Xs) log (1 / P (Xs))-P (Xs, s) log (1 / P (Xs / s) ) = P (Xs) log (1 / P (Xs))-P (s) P (Xs / s) log (1 / P (Xs / s)) = P (Xs) log (1 / P (Xs) ) + P (s) P (Xs / s) logP (Xs / s).

【0025】Xsは辞書X1,X2,...,Xnのど
れかであるが、対応する正解辞書に対して入力パターン
に偏りがないとすれば(つまり、ある特定の辞書に近い
パターンばかりが入力されるのでなければ)、P(X
1)=...=P(Xn)であり、上式の第一項は定数
として無視できる。
Xs is a dictionary X1, X2,. . . , Xn, but if there is no bias in the input pattern with respect to the corresponding correct dictionary (that is, unless only patterns close to a particular dictionary are input), P (X
1) =. . . = P (Xn), and the first term of the above equation can be ignored as a constant.

【0026】よって最終的に第二項の P(s)P(Xs/s)logP(Xs/s)=(1/
Nt)*(1/Ns)*log(1/Ns) を最大にするsが最も相互情報量が大きい、つまり辞書
の決定に対して情報量を持っていることになる。似てい
る部分辞書の数が少ない(Ntが小)ほど、また辞書X
sに含まれる部分辞書の数が少ない(Nsが小)ほど、
この値は大きくなる。
Therefore, finally, the second term P (s) P (Xs / s) logP (Xs / s) = (1 /
S that maximizes Nt) * (1 / Ns) * log (1 / Ns) has the largest mutual information amount, that is, it has an information amount for determining a dictionary. As the number of similar partial dictionaries is smaller (Nt is smaller), the dictionary X
As the number of partial dictionaries included in s is smaller (Ns is smaller),
This value increases.

【0027】このようにして、辞書決定に対してあまり
情報量をもっていない相互情報の小さい部分辞書を削減
し、辞書決定に対して情報量を多くもつ相互情報量の大
きい部分辞書を残すことで、辞書決定の能力をできるだ
け落さずに部分辞書数の削減を行なうことができる。 (1−2)部分辞書数削減の収束判定方法 部分辞書数を削減していくと、辞書全体のもつ情報量が
減少していくため、一般に認識性能は落ちる。後述する
第2実施例で説明する位置検出ずれに基づく認識性能評
価により認識性能Accを求め、これに対しあるしきい
値Th_accを設定すると、 Acc ≧ Th_acc である場合は十分な認識性能を保持しているとして削除
処理を続け、 Acc < Th_acc となったら十分な認識性能を保持できなくなったとして
削除が収束したと判断する。 (2−1)辞書数を削減する方法 上記説明では部分辞書sを単位として削減したのに対
し、ここでは部分辞書ではなく、その集合である辞書X
sを単位として辞書数を削減する。
In this manner, the partial dictionaries having a small amount of mutual information having little information amount for the dictionary determination are reduced, and the partial dictionaries having a large mutual information amount having a large information amount for the dictionary determination are left. The number of partial dictionaries can be reduced without reducing the ability to determine a dictionary as much as possible. (1-2) Convergence Judgment Method for Reducing the Number of Partial Dictionaries As the number of partial dictionaries is reduced, the amount of information in the entire dictionary decreases, so that recognition performance generally decreases. The recognition performance Acc is obtained by the recognition performance evaluation based on the position detection deviation described later in the second embodiment, and a certain threshold value Th_acc is set. If Acc ≧ Th_acc, sufficient recognition performance is maintained. If Acc <Th_acc, it is determined that sufficient recognition performance cannot be maintained and that the deletion has converged. (2-1) Method of reducing the number of dictionaries In the above description, the number of dictionaries was reduced in units of the partial dictionaries.
The number of dictionaries is reduced in units of s.

【0028】図2に示すプロセスのうち、図2の(a)
から(c)に示すような辞書数を削減するプロセスに相
当する。辞書Xsから見た辞書Xtの類似度は、辞書X
sに含まれる部分辞書sと辞書Xtに含まれる部分辞書
tとの類似度をもとにして と定義できる。同様にSim(Xs←Xt)も定義でき
る。
In the process shown in FIG. 2, (a) of FIG.
(C) corresponds to a process for reducing the number of dictionaries. The similarity of the dictionary Xt viewed from the dictionary Xs
Based on the similarity between the partial dictionary s included in s and the partial dictionary t included in the dictionary Xt, Can be defined as Similarly, Sim (Xs ← Xt) can be defined.

【0029】ここで、Sim(Xt←Xs)が大きいと
いうことは、Xsから見てXtが類似度の高い辞書であ
る(類似度の高い部分辞書を多く持っている)というこ
とを意味する。
Here, that Sim (Xt ← Xs) is large means that Xt is a dictionary having a high similarity when viewed from Xs (it has many partial dictionaries having a high similarity).

【0030】さらにSim(Xt←Xs) >> Si
m(Xs←Xt)の場合、これはXsはXtにだけ近
い。XtはXsに近いかもしれないが、Xs以外にも近
いものがある。ということを意味する。そのような状況
を2次元的に表現したものが図3である。
Further, Sim (Xt ← Xs) >> Si
For m (Xs ← Xt), this is where Xs is only close to Xt. Xt may be close to Xs, but there are others other than Xs. Means that FIG. 3 shows such a situation two-dimensionally.

【0031】ここで、簡単のために類似度Simを距離
Distを用いて Sim(Xt←Xs)=1/Dist(Xt←Xs) と考えると、XsとXtが十分に近い場合、 Sim(Xt←Xs) >> Sim(Xt以外←Xs) つまり Dist(Xt←Xs) << Dist(Xt以外←Xs) であるから、ある辞書Xyに対する距離Distは、 Dist(Xy←Xs)≒Dist(Xy←Xt) + Dist(Xt←Xs) ≒Dist(Xy←Xt) となり、 Sim(Xy←Xs)≒Sim(Xy←Xt) であるから、他の辞書Xyに対して、XsはXtと同一
視することができる。
Here, for the sake of simplicity, if the similarity Sim is considered as Sim (Xt ← Xs) = 1 / Dist (Xt ← Xs) using the distance Dist, if Xs and Xt are sufficiently close, Sim (Xt ← Xs) >> Sim (except Xt ← Xs) That is, Dist (Xt ← Xs) << Dist (except Xt ← Xs), the distance Dist to a dictionary Xy is Dist (Xy ← Xs) ≒ Dist (Xy ← Xt) + Dist (Xt ← Xs) ≒ Dist (Xy ← Xt), and Sim (Xy ← Xs) ≒ Sim (Xy ← Xt), so that Xs is the same as Xt with respect to other dictionaries Xy. can do.

【0032】よって、Sim(Xt←Xs)が十分大き
く、かつSim(Xt←Xs)がSim(Xs←Xt)
に比べて十分大きい場合は、XsをXtにマージし同一
視することができ、辞書Xsを削除することが可能にな
る。 (2−2)辞書数削減の収束判定方法 辞書X0が辞書X1にマージされ削除されたとする。こ
のとき、削除された辞書X0に含まれる部分辞書それぞ
れについて、それまでにマージされずに残っている辞書
(N個あるとする)に含まれる部分辞書のうちで最も類
似度の高い部分辞書を選択することを考える。辞書X0
は辞書X1に類似度が高いとしてマージされたので、理
想的にはX0の部分辞書はすべて、最も類似度の高い部
分辞書としてX1の部分辞書を選択するはずである。し
かし実際はX0の部分辞書の一部はX1の部分辞書を選
択するが、その他はX1以外の部分辞書を選択してしま
う。この正しくX1の部分辞書を選択した割合を正解率
R_correctとする。
Therefore, Sim (Xt ← Xs) is sufficiently large, and Sim (Xt ← Xs) is equal to Sim (Xs ← Xt).
If Xs is large enough, Xs can be merged with Xt and identified, and the dictionary Xs can be deleted. (2-2) Convergence determination method for reducing the number of dictionaries It is assumed that the dictionary X0 is merged with the dictionary X1 and deleted. At this time, for each of the partial dictionaries included in the deleted dictionary X0, the partial dictionary having the highest similarity among the partial dictionaries included in the remaining unmerged dictionaries (assuming N) is determined. Think about choosing. Dictionary X0
Has been merged with the dictionary X1 as having a high degree of similarity, so ideally all of the partial dictionaries of X0 should select the partial dictionary of X1 as the partial dictionary having the highest similarity. However, in practice, a part of the partial dictionary of X0 selects the partial dictionary of X1, but others select a partial dictionary other than X1. The rate at which the partial dictionary of X1 is correctly selected is set as the correct answer rate R_correct.

【0033】一方マージされずに残っている辞書数がN
であるので、各辞書内の部分辞書数に偏りがないとすれ
ば、正解率の期待値は1/Nになる。X0とX1が十分
に類似度が高く適切なマージであった場合は、R_co
rrectは十分高い値を保ち、その値は1/Nよりも
十分大きくなる。しかし図4に示すように、X0とX1
の類似度の高さが他の辞書との類似度の高さよりも十分
に大きくない場合は、残ったN個の辞書それぞれに選択
が分散してしまい、正解率は1/Nに近付く。
On the other hand, the number of dictionaries remaining without being merged is N
Therefore, if there is no bias in the number of partial dictionaries in each dictionary, the expected value of the correct answer rate is 1 / N. If X0 and X1 are sufficiently similar and have an appropriate merge, R_co
rrect keeps a sufficiently high value, and the value is much larger than 1 / N. However, as shown in FIG.
If the degree of similarity is not sufficiently higher than the degree of similarity with other dictionaries, the selection is dispersed among the remaining N dictionaries, and the correct answer rate approaches 1 / N.

【0034】そこで、 R_correct ≧ k/N (kは適当な係
数) を保つマージは適切なマージとし、 R_correct < k/N (kは適当な係
数) となった場合は、X0、X1のマージが他の辞書とのマ
ージに比べて十分に類似度が高くなかったとして、マー
ジが収束したと判定することができる。ここで係数kは
収束判定の基準の厳しさで、kが大きくなるほど高い正
解率(あまりマージが進んでいない)段階で収束したと
判定するので残る辞書数が多くなり、kが小さいとある
程度正解率が低くなってもマージを続けるので残る辞書
数は少なくなる。
Therefore, the merge that maintains R_correct ≧ k / N (k is an appropriate coefficient) is an appropriate merge. If R_correct <k / N (k is an appropriate coefficient), the merge of X0 and X1 is performed. Assuming that the similarity is not sufficiently high as compared with merging with another dictionary, it can be determined that the merging has converged. Here, the coefficient k is the strictness of the criterion for convergence determination. The larger the value of k, the higher the accuracy rate (the merging has not progressed so much). Even if the rate decreases, the number of dictionaries remaining decreases because merging is continued.

【0035】一方、正解率の代わりに、第2実施例で説
明する位置検出ずれに基づく認識性能評価を用いる手法
では、検出性能Accに対してあるしきい値Th_ac
cを設定し、 Acc ≧ Th_acc である場合は十分な認識性能を保持しているとして削除
処理を続け、 Acc < Th_acc となったら十分な認識性能を保持できなくなったとして
削除が収束したと判断する。
On the other hand, in the method of using the recognition performance evaluation based on the position detection deviation described in the second embodiment instead of the correct answer rate, a certain threshold Th_ac is applied to the detection performance Acc.
c is set, and if Acc ≧ Th_acc, it is determined that sufficient recognition performance is maintained and the deletion process is continued. If Acc <Th_acc, sufficient recognition performance is no longer maintained and it is determined that the deletion has converged. .

【0036】次に、第2実施例について説明する。第2
実施例では、対象物の位置検出システムにおける検出性
能の評価方法を示す。
Next, a second embodiment will be described. Second
In the embodiment, an evaluation method of the detection performance in the target position detection system will be described.

【0037】位置検出システムから出力される物体の検
出位置を(x,y)、その確信度をRとし、真の物体の
位置を(X,Y)とする。すると、物体の検出位置と真
の物体の位置とのずれの2乗であるDは、 D=(X−x)*(X−x)+(Y−y)*(Y−y) と表される。また、ずれの2乗DがTh以下の時を検出
成功、Thを超える時を検出失敗とする。このとき、検
出性能Accを Acc=a*sqrt(Th−D)*R…検出成功(D
<=Th)の時 または −b*sqrt(D−Th)*R…検出失敗(D>t
h)の時 (a,bは非負の係数 ) (sqrt()は平方根を示す) とする。
The detection position of the object output from the position detection system is (x, y), its certainty is R, and the position of the true object is (X, Y). Then, D, which is the square of the difference between the detected position of the object and the position of the true object, is given by D = (X−x) * (X−x) + (Y−y) * (Y−y). Is done. When the squared deviation D is equal to or smaller than Th, the detection is successful, and when it exceeds Th, the detection is failed. At this time, the detection performance Acc is calculated as follows: Acc = a * sqrt (Th−D) * R...
<= Th) or -b * sqrt (D-Th) * R ... Detection failed (D> t)
h) (a and b are non-negative coefficients) (sqrt () indicates a square root)

【0038】これは、確信度Rに対し、ずれの2乗Dの
大きさに基づいて図5に示すような重み付けをしたもの
である。検出成功の時は確信度Rが高いほど検出性能A
ccは高い値をとり、逆に不成功の場合は確信度Rが高
いほど検出性能Accは低い値をとるようになる。「高
い確信度をもって出力した結果が大きく間違っていたと
いう、検出システムにとって最も好ましくない結果に対
して大きなペナルティを与える」ということを特徴とし
ている。
In this example, the certainty factor R is weighted as shown in FIG. 5 based on the magnitude of the square D of the deviation. When the detection is successful, the higher the confidence R, the higher the detection performance A
cc takes a high value. Conversely, in the case of unsuccessfulness, the higher the certainty factor R, the lower the detection performance Acc. The feature is that "a large penalty is given to the result that is most unfavorable for the detection system that the result output with high certainty is large wrong".

【0039】以上説明したように上記発明の実施の形態
によれば、局所特徴量は環境変化に対してロバストであ
り、その辞書容量を適切に削減することで、人物検知、
人物姿勢認識、宅配便ラベル認識、帳票認識、製品(外
箱)の種類認識などの応用を、より高速に、かつ低コス
トで実現することができる。
As described above, according to the embodiment of the present invention, the local feature is robust against environmental changes, and by appropriately reducing the dictionary capacity, it is possible to detect a person.
Applications such as person posture recognition, courier label recognition, form recognition, and product (outer box) type recognition can be realized at higher speed and at lower cost.

【0040】また、部分辞書(局所特徴量)間の単純な
類似度だけでなく、その部分辞書がもつ辞書としての情
報量を加味することにより、認識に役立つ情報量の多い
辞書をできるだけ削除せず残すようにすることができ
る。これにより、認識性能を落とすことなく辞書数を削
減することができる。
In addition to a simple similarity between partial dictionaries (local feature amounts), a dictionary having a large amount of information useful for recognition is deleted as much as possible by taking into account the information amount of the dictionary included in the partial dictionary. Can be left behind. Thereby, the number of dictionaries can be reduced without lowering the recognition performance.

【0041】[0041]

【発明の効果】以上詳述したようにこの発明によれば、
辞書容量を適切にして認識性能を落とすことなく部分辞
書または辞書を削減する部分辞書削減方法と辞書削減方
法を提供することができる。また、削減した部分辞書ま
たは辞書における認識性能を評価する評価方法を提供す
ることができる。
As described in detail above, according to the present invention,
It is possible to provide a partial dictionary reduction method and a dictionary reduction method for reducing a partial dictionary or a dictionary without reducing the recognition performance by appropriately setting the dictionary capacity. Further, it is possible to provide an evaluation method for evaluating the recognition performance of the reduced partial dictionary or dictionary.

【図面の簡単な説明】[Brief description of the drawings]

【図1】局所特徴量による対象物認識を説明するための
図。
FIG. 1 is a diagram for explaining target object recognition based on local feature values.

【図2】辞書削減プロセスを示す図。FIG. 2 is a diagram showing a dictionary reduction process.

【図3】辞書のパターン的距離を2次元的に表現した
図。
FIG. 3 is a diagram expressing a pattern distance of a dictionary two-dimensionally.

【図4】辞書マージ状況の模式図。FIG. 4 is a schematic diagram of a dictionary merge situation.

【図5】ずれの大きさに基づく評価値の重み付け係数の
例を示す図。
FIG. 5 is a diagram showing an example of a weighting coefficient for an evaluation value based on the size of a shift.

【符号の説明】[Explanation of symbols]

X…辞書セット X1,X2,…Xn…辞書 X: Dictionary set X1, X2, ... Xn: Dictionary

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】 対象物の物理量パターン中の局所特徴量
のマッチングを行うための局所特徴量の部分辞書の集合
からなる辞書を複数有する辞書集合における部分辞書削
減方法であって、 上記辞書における部分辞書が該辞書に含まれる他の部分
辞書との類似度と、該部分辞書が上記辞書集合に対して
有する情報量とを選択基準として部分辞書を削減するよ
うにしたことを特徴とする部分辞書削減方法。
1. A method for reducing a partial dictionary in a dictionary set having a plurality of dictionaries comprising a set of partial dictionaries of local feature values for matching local feature values in a physical quantity pattern of an object, comprising: A partial dictionary, wherein the number of partial dictionaries is reduced based on a similarity between the dictionary and other partial dictionaries included in the dictionary and an information amount of the partial dictionary with respect to the dictionary set as a selection criterion. How to reduce.
【請求項2】 対象物の物理量パターン中の局所特徴量
のマッチングを行うための局所特徴量の部分辞書の集合
からなる辞書を複数有する辞書集合における辞書削減方
法であって、 部分辞書間の類似度に基づいて、第1の辞書からの第2
の辞書の類似度と、該第2の辞書からの該第1の辞書の
類似度との大小関係により第1の辞書または第2の辞書
を削減するようにしたことを特徴とする辞書削減方法。
2. A dictionary reduction method for a dictionary set having a plurality of dictionaries comprising a set of partial dictionaries of local feature amounts for matching local feature amounts in a physical quantity pattern of an object, comprising: Based on the degree, the second from the first dictionary
The first dictionary or the second dictionary is reduced according to the magnitude relation between the similarity of the first dictionary and the similarity of the first dictionary from the second dictionary. .
【請求項3】 入力データ内から対象物の位置を検出す
るシステムにおける検出性能を評価する評価方法であっ
て、 出力された検出位置が実際の位置とどれだけずれている
かの値と、該検出位置に対する確信度の値とから検出性
能を評価するようにしたことを特徴とする評価方法。
3. An evaluation method for evaluating a detection performance in a system for detecting a position of an object from input data, wherein a value indicating how much the output detection position is deviated from an actual position, An evaluation method characterized in that detection performance is evaluated from a value of certainty factor for a position.
【請求項4】 対象物の物理量パターン中の局所特徴量
のマッチングを行うための局所特徴量の部分辞書の集合
からなる辞書を複数有する辞書集合における部分辞書削
減の評価方法であって、 部分辞書が削減された辞書集合から出力された検出位置
が実際の位置とどれだけずれているかの値と、該検出位
置に対する確信度の値とから辞書の認識性能を算出して
部分辞書削減の収束の度合を評価するようにしたことを
特徴とする評価方法。
4. An evaluation method for reducing partial dictionaries in a dictionary set having a plurality of dictionaries including a set of partial dictionaries of local feature amounts for matching local feature amounts in a physical quantity pattern of an object, comprising: Is calculated from the value of how much the detected position output from the reduced dictionary set is shifted from the actual position and the value of the certainty factor for the detected position, and the convergence of the partial dictionary reduction is calculated. An evaluation method characterized in that the degree is evaluated.
【請求項5】 対象物の物理量パターン中の局所特徴量
のマッチングを行うための局所特徴量の部分辞書の集合
からなる辞書を複数有する辞書集合における辞書削減の
評価方法であって、 第1の辞書に類似度が高いとして削減された第2の辞書
に含まれる部分辞書が、最も類似度の高い部分辞書とし
て正しく該第1の辞書の部分辞書を選択したかの正解率
を、削除されなかった辞書数に基づく正解率の期待値と
比較して削減の収束の度合を判定するようにしたことを
特徴とする評価方法。
5. A method for evaluating dictionary reduction in a dictionary set having a plurality of dictionaries comprising a set of partial dictionaries of local feature values for matching local feature values in a physical quantity pattern of an object, comprising: The partial dictionary included in the second dictionary, which has been reduced as having a high similarity to the dictionary, does not delete the correct answer rate as to whether the partial dictionary of the first dictionary was correctly selected as the partial dictionary having the highest similarity. An evaluation method characterized in that the degree of convergence of reduction is determined by comparing the expected value of the correct answer rate based on the number of dictionaries.
【請求項6】 対象物の物理量パターン中の局所特徴量
のマッチングを行うための局所特徴量の部分辞書の集合
からなる辞書を複数有する辞書集合における辞書削減の
評価方法であって、 辞書が削減された辞書集合から出力された検出位置が実
際の位置とどれだけずれているかの値と、該検出位置に
対する確信度の値とから辞書の認識性能を算出して辞書
削減の収束の度合を評価するようにしたことを特徴とす
る評価方法。
6. A method for evaluating dictionary reduction in a dictionary set having a plurality of dictionaries comprising a set of partial dictionaries of local feature amounts for matching local feature amounts in a physical quantity pattern of an object, wherein the dictionary is reduced. The recognition performance of the dictionary is calculated from the value of how much the detection position output from the set of dictionary that has been deviated from the actual position and the value of the certainty factor for the detection position, and the degree of convergence of dictionary reduction is evaluated. An evaluation method characterized in that:
JP10260128A 1998-09-14 1998-09-14 Partial dictionary reduction method, dictionary reduction method and evaluation method Pending JP2000090271A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10260128A JP2000090271A (en) 1998-09-14 1998-09-14 Partial dictionary reduction method, dictionary reduction method and evaluation method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10260128A JP2000090271A (en) 1998-09-14 1998-09-14 Partial dictionary reduction method, dictionary reduction method and evaluation method

Publications (1)

Publication Number Publication Date
JP2000090271A true JP2000090271A (en) 2000-03-31

Family

ID=17343695

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10260128A Pending JP2000090271A (en) 1998-09-14 1998-09-14 Partial dictionary reduction method, dictionary reduction method and evaluation method

Country Status (1)

Country Link
JP (1) JP2000090271A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012048400A (en) * 2010-08-25 2012-03-08 Canon Inc Object recognition device and its recognition method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012048400A (en) * 2010-08-25 2012-03-08 Canon Inc Object recognition device and its recognition method

Similar Documents

Publication Publication Date Title
US11393103B2 (en) Target tracking method, device, system and non-transitory computer readable medium
US8885943B2 (en) Face detection method and apparatus
US7783106B2 (en) Video segmentation combining similarity analysis and classification
US6804391B1 (en) Pattern detection methods and systems, and face detection methods and systems
US8477998B1 (en) Object tracking in video with visual constraints
US7769228B2 (en) Method for combining boosted classifiers for efficient multi-class object detection
EP0884603B1 (en) Dynamic fuzzy logic process for indentifying objects in three-dimensional data
US20030123732A1 (en) Optical character reading method and system for a document with ruled lines and its application
US9715639B2 (en) Method and apparatus for detecting targets
CN110826558B (en) Image classification method, computer device, and storage medium
US20090202145A1 (en) Learning appartus, learning method, recognition apparatus, recognition method, and program
Medina-Carnicer et al. Unimodal thresholding for edge detection
US11972610B2 (en) Multi-pass object tracking system utilizing single object tracking in a multi object tracking use case for higher accuracy
US7590267B2 (en) Accelerated face detection based on prior probability of a view
CN112651996A (en) Target detection tracking method and device, electronic equipment and storage medium
CN110363165A (en) Multi-target tracking method, device and storage medium based on TSK fuzzy system
US6850627B2 (en) Dynamic process for identifying objects in multi-dimensional data
US20240203160A1 (en) Apparatus for identifying a face and method thereof
US6754390B2 (en) Fusing outputs from multiple detection/classification schemes
US7519567B2 (en) Enhanced classification of marginal instances
US6560360B1 (en) Feed forward feed back multiple neural network with context driven recognition
JP2000090271A (en) Partial dictionary reduction method, dictionary reduction method and evaluation method
JP4665764B2 (en) Pattern identification system, pattern identification method, and pattern identification program
Wang et al. Extraction of main urban roads from high resolution satellite images by machine learning
US20250200952A1 (en) Learning apparatus, learning method, person verification apparatus, person verification method, and recording medium